HAREM - Avaliação de Reconhecimento de Entidades Mencionadas

Linguateca - 2006.
  Versão para impressão
IMPORTANTE: Este sítio diz respeito ao Primeiro HAREM, que terminou em 2006, e encontra-se encerrado. O sítio actual do HAREM encontra-se em /HAREM.


Caros participantes no HAREM e interessados geralmente em avaliação conjunta,

Conforme prometido, disponibilizaremos hoje (um pouco mais tarde) a primeira proposta de directivas de anotação a ser usada para a colecção dourada, assim com um resumo da constituição da própria colecção. (E, aos participantes, o seu quinhão desta.)

Mas pareceu-me importante, antes disso, discutir uma questão logicamente anterior a essa, ou seja, duas hipóteses de objectivos de sistemas de REM, para clarificar ideias. (Isto porque me pareceu haver diferenças a esse respeito entre os participantes).

Em princípio, pode-se classificar as EMs por:
- as entidades (do mundo real) que mencionam, Hipótese 1
- as propriedades linguísticas dos itens que as mencionam, Hipótese 2

Isto corresponde a resultados muito diferentes na prática, senão vejamos (os exemplos de categorias são meramente exemplificativos):

1) Os Lusíadas cairam-me em cima do pé
Quem escreveu os Lusíadas?

Segundo a hipótese 1, "Os Lusíadas" será classificado como OBJECTO na primeira frase, e OBRA na segunda.
Segudo a hipótese 2, "Os Lusíadas" será classificado em ambas como TÍTULO (de livro)

2) Portugal tem muitos rios LUGAR
Portugal entrou para a comunidade Europeia em 1980 ORGANIZAÇÃO

Segundo a hipótese 1, "Portugal" será classificado como LUGAR na primeira frase, e ORGANIZAÇÃO na segunda.
Segudo a hipótese 2, "Portugal" será classificado em ambas como NOME_PAÍS

3) A Visão sai às quintas.
Esta notícia saiu na Visão.
A Visão despediu metade dos trabalhadores.

Segundo a hipótese 1, a "Visão" será considerada PRODUTO na primeira frase, LUGAR (de publicaçõa) na segunda e ORGANIZAÇÂO (empresa) na terceira.
Segundo a hipótese 2, a "Visão" será considerada TÍTULO (imprensa) nas três

[Para quem não sabe o que é a visão, é um semanário português do estilo "Time"/"Nouvel Observateur".]

4) Bebi uma coca-cola ao pequenos almoço.
A Coca Cola patrocina o rali Paris-Dakkar.

Segundo a hipótese 1, "Coca Cola" seria considerada PRODUTO na primeira frase e ORGANIZAÇÃO (empresa) na segunda.
Segundo a hipótese 2, "Coca Cola" seria considerada MARCA em ambas.

5) A Benetton ficou em primeiro lugar no 24 horas de Le Mans PESSOA (grupo)
A Benetton é uma das marcas mais populares entre os jovens canadianos MARCA

Segundo a hipótese 1, "Benetton" seria considerada PESSOA (grupo) na primeira frase e MARCA na segunda.
Segundo a hipótese 2, "Benetton" seria considerada MARCA em ambas.

6) A China ganhou o campeonato mundial de atletismo PESSOA (grupo)
Na China há cinco religiões principais LUGAR (admin)

Segundo a hipótese 1, "China" seria considerada PESSOA (grupo) na primeira frase e LUGAR (administrativo) na segunda.
Segundo a hipótese 2, "China" seria considerada NOME_PAÍS

E os exemplos podem continuar até ao infinito...

Na proposta que vamos apresentar a seguir, proposta de anotar a colecção dourada, estaremos a pressupor a hipótese 1. Mas parece-nos muito importante tornar isso claro, até para ver como será depois possível avaliar sistemas que funcionem segundo a Hipótese 2, ou para que estes digam de sua justiça... e se mude para a hipótese 2.

Saudações organizadas,
Diana

Esta página e a sua informação não se encontra actualizada. Clique aqui para visitar o síio actual do HAREM.