HAREM - Avaliação de Reconhecimento de Entidades Mencionadas

Linguateca - 2006.
  Versão para impressão
IMPORTANTE: Este sítio diz respeito ao Primeiro HAREM, que terminou em 2006, e encontra-se encerrado. O sítio actual do HAREM encontra-se em /HAREM.


Caros participantes,

O objectivo do HAREM é a avaliação de sistemas que façam a identificação e classificação de entidades mencionadas.
Como tal, as tarefas e as métricas de avaliação devem ter em conta estes dois passos distintos no reconhecimento das entidades.
Assim, vamos considerar três tarefas distintas, podendo as duas últimas ser pontuáveis independentemente.

  • Identificação das entidades
  • Classificação semântica (a etiquetação tradicional: organizações, localizações, etc.)
  • Clasificação morfológica (feminino, masculino, singular e plural)
Esta última tarefa surgiu devido ao facto de isso ser relevante para a análise do português, e porque muitos dos participantes têm analisadores sintácticos (parsers) que fazem isso.
A concordância destas 'tarefas' terá consequências óbvias na discussão das directivas de etiquetagem e nos formatos das etiquetas.
A divisão de tarefas também terá implicações na discussão dos métodos de avaliação, mas a prioridade por enquanto é a definição dos textos a usar por todos os participantes, até ao dia 15.

A identificação das entidades é uma tarefa comum e obrigatória para todos os sistemas; quanto à classificação, os sistemas deverão escolher pelo menos uma das tarefas de classificação sugeridas.

A organização do HAREM pretende saber se:
  • Há outras tarefas que acham também ser relevantes / interessantes a incluir no HAREM?
    (Ex: procura de definições e/ou de relação entre siglas e a versão por extenso?)
    (ex: tarefa de co-referência do MUC.)

  • Pela organização do HAREM,

    Nuno Cardoso
Esta página e a sua informação não se encontra actualizada. Clique aqui para visitar o síio actual do HAREM.