Pólo de Oslo da Linguateca
As tarefas correntes (ano de 2006) do pólo de Oslo são as seguintes:
- Organização da Linguateca (contacto entre os pólos, ligação entre estes, questões administrativas e relatórios ao POSC)
- Responsabilidade principal pelo sítio da Linguateca e seus catálogos, fórum, repositório e estatísticas, assim como pelo contacto com os utilizadores e as facilidades de procura no sítio, Busca e de gestão de publicações (SUPeRB)
- Projecto AC/DC: manutenção e desenvolvimento do primeiro projecto da Linguateca, destinado a disponibilizar corpora em português na rede. www.linguateca.pt/ACDC/ Usa o PALAVRAS (analisador sintáctico de Eckhard Bick, projecto VISL) para anotar os corpora. A principal actividade no âmbito deste projecto é aumentar o número dos corpora servidos, assim como dar apoio aos muitos utilizadores que nos contactam.
- Projecto COMPARA/DISPARA: o COMPARA, em colaboração com Ana Frankenberg-Garcia, é talvez o maior corpus paralelo editado do mundo, e encontrando-se em constante evolução: www.linguateca.pt/COMPARA/, o DISPARA é um sistema de disponibilização de corpora paralelos na Web, desenvolvido no âmbito do COMPARA mas com utilização mais geral. Uma actividade de momento em progresso é a anotação sintáctica do COMPARA e a sua revisão humana.
- Projecto Floresta Sintá(c)tica: criação de um "treebank" para o português, em colaboração com o projecto VISL de Eckhard Bick. www.linguateca.pt/Floresta/ As árvores analisadas pelo PALAVRAS são depois cuidadosamente revistas. No âmbito deste projecto também foi desenvolvido um sistema de acesso a florestas, o Águia.
- Esfinge: desenvolvimento de um sistema de resposta automática a perguntas em português, usando a redundância na rede
- Livro sobre o Avalon: organização de uma obra que documenta o paradigma da avaliação conjunta em português, em edição pela IST Press.
- Organização da participação do português na avaliação conjunta internacional CLEF, cross-language evaluation forum, nas áreas de RI, perguntas e respostas, Web e outras
- HAREM: Organização da primeira avaliação conjunta em reconhecimento de entidades mencionadas
- Co-orientação científica aos outros elementos da Linguateca, particularmente aos bolseiros, nas áreas:
- extracção automática de relações geográficas na Web no contexto da RI geográfica (Marcirio Chaves)
- criação de uma ontologia lexical para o português (Nuno Seco)
- análise semântica computacional (Luís Sarmento)
Equipa associada ao pólo de Oslo: Diana Santos, Luís Costa, Luís Miguel Cabral, Paulo Rocha, Susana Inácio.
Última actualização: 26 de Setembro de 2006.
Comentários e sugestões