Melhoria do Busca usando o Corpógrafo

Bolsa de investigação em linguística ou terminologia, no âmbito da Linguateca, concedida pela FCCN - Fundação para a Computação Científica Nacional

O Busca é o sistema de procura no sítio da Linguateca, que pretende dar uma panorâmica séria e alargada sobre todas as actividades em processamento computacional do português. Cobrindo mais de 1500 páginas, e em permanente expansão, falta-lhe contudo um tesauro e/ou termos de indexação que tornem a pesquisa mais simples e intuitiva.

Pretende-se que o bolseiro utilize, além do seu conhecimento das áreas cobertas pelo portal, o sistema Corpógrafo para obter termos de indexação adequados. Também se pretende oferecer vistas diferentes sobre a informação contida no portal, de preferência com uma componente semiautomática.

O Corpógrafo é um ambiente de trabalho com corpora especializados desenvolvido pelo pólo do Porto da Linguateca, que oferece possibilidades de relizar pesquisa terminológica não trivial e que se deseja apropriado para trabalhar com corpora comparáveis (português-inglês). Veja-se Sarmento, Maia & Santos (2004).

O local de trabalho é no pólo FLUP da Linguateca, no Porto, e o bolseiro será orientado directamente por Luís Sarmento e Diana Santos.

Os candidatos, licenciados, com formação em linguística (preferencialmente nos ramos da terminologia e da linguística com corpora) ou engenharia da linguagem, deverão ter conhecimentos sólidos de processamento de linguagem natural, de terminologia e/ou de ciência das bibliotecas. Conhecimento da área de recuperação de informação ("information retrieval") é um factor de preferência.

O prazo de recepção de candidaturas, enviadas por correio electrónico (Assunto: Bolsa Busca) para Luís Sarmento com cópia para Diana Santos e incluindo necessariamente o currículo, termina a 31 de Maio de 2004.


Este texto encontra-se disponível em /bolsaBusca.html
Data de publicação na rede: 29 de Abril de 2004.