O Busca é o sistema de procura no sítio da Linguateca, que pretende dar uma panorâmica séria e alargada sobre todas as actividades em processamento computacional do português. Cobrindo mais de 1500 páginas, e em permanente expansão, falta-lhe contudo um tesauro e/ou termos de indexação que tornem a pesquisa mais simples e intuitiva.
Pretende-se que o bolseiro utilize, além do seu conhecimento das áreas cobertas pelo portal, o sistema Corpógrafo para obter termos de indexação adequados. Também se pretende oferecer vistas diferentes sobre a informação contida no portal, de preferência com uma componente semiautomática.
O Corpógrafo é um ambiente de trabalho com corpora especializados desenvolvido pelo pólo do Porto da Linguateca, que oferece possibilidades de relizar pesquisa terminológica não trivial e que se deseja apropriado para trabalhar com corpora comparáveis (português-inglês). Veja-se Sarmento, Maia & Santos (2004).
O local de trabalho é no pólo FLUP da Linguateca, no Porto, e o bolseiro será orientado directamente por Luís Sarmento e Diana Santos.
Os candidatos, licenciados, com formação em linguística (preferencialmente nos ramos da terminologia e da linguística com corpora) ou engenharia da linguagem, deverão ter conhecimentos sólidos de processamento de linguagem natural, de terminologia e/ou de ciência das bibliotecas. Conhecimento da área de recuperação de informação ("information retrieval") é um factor de preferência.
O prazo de recepção de candidaturas, enviadas por correio electrónico (Assunto: Bolsa Busca) para Luís Sarmento com cópia para Diana Santos e incluindo necessariamente o currículo, termina a 31 de Maio de 2004.