Versão para impressão |
 | IMPORTANTE: Este sítio diz respeito ao Primeiro HAREM, que terminou em 2006, e encontra-se encerrado. O sítio actual do HAREM encontra-se em /HAREM.
|
|
Caros participantes,
O objectivo do HAREM é a avaliação de sistemas que façam a
identificação
e classificação de entidades mencionadas.
Como tal, as tarefas e as métricas de avaliação devem ter em conta estes
dois passos distintos no reconhecimento das entidades.
Assim, vamos considerar três tarefas distintas, podendo as duas últimas
ser pontuáveis independentemente.
- Identificação das entidades
- Classificação semântica (a etiquetação tradicional: organizações,
localizações, etc.)
- Clasificação morfológica (feminino, masculino, singular e plural)
Esta última tarefa surgiu devido ao facto de isso ser relevante para a
análise do português, e porque muitos dos participantes
têm analisadores sintácticos (parsers) que fazem isso.
A concordância destas 'tarefas' terá consequências óbvias na discussão
das directivas de etiquetagem e nos formatos das etiquetas.
A divisão de tarefas também terá implicações na discussão dos métodos de
avaliação, mas a prioridade por enquanto é a definição dos textos a usar
por todos os participantes,
até ao dia 15.
A identificação das entidades é uma tarefa comum e obrigatória para
todos os sistemas; quanto à classificação, os sistemas deverão escolher
pelo menos uma das tarefas de classificação sugeridas.
A organização do HAREM pretende saber se:
- Há outras tarefas que acham também ser relevantes / interessantes a
incluir no HAREM?
(Ex: procura de definições e/ou de relação entre siglas e a versão por
extenso?)
(ex: tarefa de co-referência do MUC.)
Pela organização do HAREM,
Nuno Cardoso