Diana Santos
English home page
A minha vocação é o tratamento computacional da minha língua, a portuguesa.
Desde 1987 que trabalho em processamento de linguagem natural, tendo-me formado no Técnico, e dado os primeiros passos de investigação no INESC e na IBM.
Em 1998 tive a oportunidade, através do projecto Processamento computacional do português (1998-2000) de lançar as bases da Linguateca (2000-), um centro de recursos (distribuído) para o processamento computacional da língua portuguesa, cuja razão de ser é armar o português dos recursos e ferramentas necessários para que o seu processamento não seja discriminado. Em suma, para que a investigação sobre a nossa língua seja tão (ou mais!) sedutora como a sobre o inglês.
Os meus principais interesses de investigação presentes são:
avaliação (ver curso na ESSLLI em Dublin, Agosto de 2007), semântica (ver curso na ESSLLI em Copenhaga, Agosto de 2010), e tradução.
Também trabalho ou trabalhei nas seguintes áreas: tradução automática, análise sintáctica, processamento de corpos, análise morfológica, estudos contrastivos, tempo e aspecto, serviços na Web, ensino de português a estrangeiros, resposta automática a perguntas, recolha de informação, estudo de "pegadas" informáticas (usabilidade sem estorvar o utilizador), extracção de informação e lexicografia bilingue.
Em 1998, fiz uma página mais completa, embora agora desactualizada, sobre os meus interesses nessa data. Para mais informações, consultar as mais de 400 publicações respetivas.
Questões gerais às quais tento responder, são, além disso:
- Como é possível disponibilizar trabalho na área do processamento de linguagem natural (PLN) protegendo tanto utilizadores como criadores?
- Como evitar reinventar a roda de cada vez que um léxico ou uma gramática são desenvolvidos?
- Como minimizar o tempo gasto em apoio ao utilizador, maximizando por outro lado o uso que o utilizador faz de uma ferramenta?
- Como conciliar as duas verdades "qualquer coisa é melhor do que nada" e
"um sistema de linguagem natural nunca está completo"?
Algumas opiniões, que infelizmente são controversas:
- Em 2006 lancei uma campanha contra as recensões anónimas, A Favor de Assinar as Recensões/Pareceres (por enquanto apenas em inglês), e a partir daí apenas faço recensões assinadas.
- Considero que, pelo menos para o processamento da nossa língua, todos os falantes de português (angolanos, brasileiros, cabo-verdianos, guineenses, macaenses, moçambicanos, portugueses, são-tomenses e timorenses) se devem unir, em vez de estabelecer alianças geográficas, tais como ibéricas, latino-americanas ou europeias.
- Embora pareça da mais elementar lógica, considero que para reforçar o processamento computacional do português, é preciso também escrever em português. E que em geral é muito importante ensinar e aprender na sua língua materna.
- Discordo da forma como as publicações estão a ser quantificadas, e aliás tenho discutido várias questões associadas à publicação em O mundo da publicação: alguns comentários.
Aqui encontra-se um conjunto de preceitos éticos seguidos na minha vida académica ou de investigação: Ética profissional. Embora sejam perfeitamente naturais, temo que sejam exceção, e não regra, na comunidade a que pertenço e mesmo na comunidade académica em geral.
ORCID:
http://orcid.org/0000-0002-3108-7706
CIÊNCIA ID: 821C-6246-F2E9
Última actualização: 6 de fevereiro de 2021.