Categorização de textos na rede

Bolsa de doutoramento ou pós-doutoramento em informática, no âmbito da Linguateca, concedida pela FCCN - Fundação para a Computação Científica Nacional

O tumba! é um motor de busca sobre a rede portuguesa e/ou em português, cujos objectivos são fornecer um serviço para a nossa língua com base na comunidade da rede existente. Através do pólo da Linguateca no XLDB, pretende-se entrosar o processamento do português e a procura em colecções de grandes dimensões, fazendo uma síntese entre a recolha de informação tradicional e o processamento de linguagem natural.

Uma das áreas em que isto se poderá efectuar é na categorização automática de páginas em português, sob muitos aspectos

Bolsa de doutoramento

O local de trabalho é em Lisboa, onde o bolseiro será integrado no programa de doutoramento do Departamento de Informática da Universidade de Lisboa, e será orientado por Pedro Veiga e Diana Santos.

Os candidatos deverão ter mestrado em informática ou engenharia, e devem ter conhecimentos sólidos pelo menos numa das três áreas:

  1. processamento de linguagem natural,
  2. recolha de informação ("information retrieval")
  3. aprendizagem automática ("machine learning").

O prazo de recepção de candidaturas, enviadas por correio electrónico (Assunto: Bolsa Categorização) para Diana Santos e incluindo necessariamente o currículo, termina a 31 de Maio de 2004.

Atenção: A bolsa só é válida (e só poderá ser iniciada) após a aprovação pela Universidade do candidato como aluno do doutoramento.

Bolsa de pós-doutoramento

É possível também atribuir uma bolsa de pós-doutoramento a doutorados em processamento de linguagem natural que queiram trabalhar na área da categorização automática.

O prazo de recepção de candidaturas, enviadas por correio electrónico (Assunto: Bolsa Categorização) para Diana Santos e incluindo necessariamente o currículo, termina a 31 de Maio de 2004.


Este texto encontra-se disponível em /bolsaCategorizacao.html
Data de publicação na rede: 29 de Abril de 2004.