GeoCLEF: Recolha de informação geográfica cruzada em português

Página em português, mantida pela Linguateca, sobre a pista GeoCLEF do projecto internacional CLEF.

O que é o GeoCLEF?

É a pista de recolha de informação geográfica do CLEF, seguindo o modelo de avaliação conjunta, em que basicamente existe um grupo de tarefas por cujo desempenho os sistemas são então comparados e classificados.

Também tem associados os seguintes pilotos:

Quem organiza o GeoCLEF?

Em 2008, o GeoCLEF tem os seguintes organizadores: Universidade de Hildesheim (Alemanha); Linguateca; Universidade da Califórnia (Berkeley, EUA); e Microsoft Research Asia (Pequim, China).

Para o português, a Linguateca conta ou contou com a seguinte equipa: Diana Santos e Paula Carvalho (CLEF 2008); Diana Santos (CLEF 2007); e Diana Santos e Paulo Rocha (CLEF 2006), para a definição da tarefa e criação dos tópicos. Para a avaliação dos resultados ("topic assessment"), contamos com praticamente toda a equipa da Linguateca.

O que é preciso para participar no GeoCLEF?

Para informações sobre o registo e condições de participação no CLEF, consulte a página relativa à edição do corrente ano do CLEF.

Que colecção de textos é usada para o português?

A colecção está descrita e é disponibilizada na página da colecção CHAVE, cuja versão anotada pelo PALAVRAS (Bick, 2000) está também disponível desde Abril de 2007.

No entanto, para participar oficialmente no CLEF, deve requisitá-las à organização do CLEF durante a realização do mesmo.

Quais são os resultados da participação da Linguateca no GeoCLEF?

Há três tipos de resultados a realçar:
  1. a inclusão do português como uma das línguas em que o progresso, a nível internacional, da área da recolha de informação geográfica, RIG, se está a jogar
  2. o desenvolvimento de recursos públicos para esta tarefa em português
  3. o "aquecimento" da área com o desafio e incentivo a novos participantes que uma exposição internacional sempre dá

Como posso obter os recursos de avaliação disponíveis para RIG em português?

Até agora, temos disponibilizado todos os recursos produzidos pelo CLEF de um único ponto, a colecção CHAVE, ou seja, tanto os documentos como o material de avaliação de todas as pistas (RAP, RI e RIG).

Mas para uma fácil familiarização com o tipo de procuras, colocamos aqui as listas dos tópicos em português relativos a cada ano.


Última actualização: 13 de Junho de 2008.
Perguntas, comentários e sugestões