Metodologia na obtenção do esboço de perfil
Diana Santos
Linguateca
Pretendo aqui esclarecer a forma como cheguei às listas de doutorados e de bolseiros relacionados com a área do processamento computacional do português.
Em primeiro lugar, gostava de indicar claramente qual a informação a que eu tive acesso para criar essas listas.
Para os doutorados, a informação constante das bases de dados a que tive acesso resumia-se aos campos:
- Nome do doutorado
- Universidade, e no caso de o doutoramento ter sido realizado no estrangeiro, qual a universidade portuguesa que concedeu a equivalência
- Orientador (na maioria dos casos)
- Ano em que o grau foi concedido (ou a equivalência obtida)
- Área (um código numérico que foi traduzido por um dos três identificadores "Linguística", "Engenharia Electrotécnica e Informática" e "Ciências da Comunicação")
Para as bolsas, a informação que me foi facultada foi a seguinte:
- Nome do bolseiro
- Tipo de bolsa (Pós-doutoramento ou doutoramento)
- Instituição a que pertence o bolseiro
- Instituição que concede o grau
- Data de início da bolsa
- Duração da bolsa
- Orientador(es)
- Área científica (nos mesmos moldes que para a lista dos doutorados)
O meu trabalho consistiu, pois, em seleccionar aquelas bolsas e/ou doutorados que pudessem estar relacionados, de uma forma ou de outra, com o processamento computacional da nossa língua. As listas de todas as bolsas e de todos os doutorados encontram-se à disposição dos interessados.
Conforme indicado no cabeçalho das próprias listas, pretende-se que os interessados as revejam e, no caso de não concordarem com a classificação proposta, solicitem a sua inclusão ou exclusão.
Presumo, aliás, que mais de metade dos elementos presentes na lista não considerem que o seu trabalho de facto seja associável ao processamento computacional do português. Foi apenas a dificuldade de escolher, baseada em informação tão ínfima, que me levou a tentar não excluir ninguém, sabendo embora que muitos trabalhos poderiam estar fora do âmbito desejado.
Critérios de selecção
Os critérios seguidos para "estar relacionado com" foram múltiplos:
- desde o processamento de linguagem natural "puro", que se espera ter aplicação para o português
- até à descrição pura da língua portuguesa, que se presume relevante para o seu processamento computacional
- desde o estudo da comunicação homem-máquina e através da máquina
- até ao estudo de aplicações que terão de envolver, em maior ou menor grau, a língua, como o ensino assistido por computador ou as bibliotecas digitais
Sem tentar descrever todas as maneiras como uma dada tese ou trabalho pode estar "relacionado com" o processamento computacional do português, veja-se algumas relações possíveis a nível abstracto:
- como meio: pode-se processar o português com o objectivo de descobrir factos sobre a língua; ou para criar um sistema informático para desenvolver uma dada tarefa
- como fim: pode-se estudar um dado fenómeno linguístico para depois o incorporar no processamento de linguagem natural (PLN); pode-se estudar uma dada tecnologia informática para depois a utilizar no PLN
- como sub-produto: para um determinado objectivo alheio ao PLN é possível que seja preciso processar a língua portuguesa, ainda que esse não seja o objectivo final ou principal do investigador
Por todas estas razões, pensei que valia a pena tentar identificar um conjunto alargado de trabalhos de investigação que possam estar relacionados com esta área.
É importante salientar que é fundamental que todos os interessados tenham acesso à informação, de forma a poderem avaliar esta escolha subjectiva, e propor alternativas. Ao tornar acessíveis a todos as listas originais, estamos a convidar todos quantos quiserem colaborar na feitura de outras listas baseadas em critérios diferentes.
Última actualização: 24 de Julho de 2003.
Voltar a Contributos para um perfil
Voltar a Processamento computacional da língua portuguesa: documento de trabalho