HAREM - Avaliação de Reconhecimento de Entidades Mencionadas

Linguateca - 2006.
  Versão para impressão
IMPORTANTE: Este sítio diz respeito ao Primeiro HAREM, que terminou em 2006, e encontra-se encerrado. O sítio actual do HAREM encontra-se em /HAREM.


Resumo das alterações e clarificações mais importantes realizadas às directivas do HAREM (de 18 de Janeiro de 2005), para as directivas actuais do Mini-HAREM (de 28 de Março de 2006)

ALTERAÇÕES

Dado que a distinção entre coisas tipo classe e obras de tipo produto era pouco clara, reformulámos a categoria COISA e retirámos o tipo PRODUTO da categoria OBRA. Ou seja,

- Novo tipo na categoria COISA - <COISA TIPO="MEMBROCLASSE"> - A categoria COISA foi re-estruturada. Mantém-se o tipo OBJECTO, que se refere a objectos concretos que tenham um nome individual (um navio como o "Titanic", por exemplo), e o tipo CLASSE, que mantém o seu sentido original. A nova categoria, MEMBROCLASSE, abrange as referências metonímicas a classes, referindo um ou vários objectos.

Exemplo: 'Estacionei mal o meu Ferrari'
Ferrari é <COISA TIPO="MEMBROCLASSE">.

- Os URLs e os Emails NÃO SÃO para identificar e classificar! - Uma vez que os URLs e endereços de emails, na sua grande maioria não apresentam letras em maiúsculas nem algarismos, estes deixam de ser considerados EMs. No caso de haver URLs e endereços de Email com letras maiúsculas e/ou algarismos, como não há nenhum interesse em identificar apenas parte dos URLs e emails, estes também NÃO devem ser etiquetados.

- Eliminação do tipo <OBRA TIPO="PRODUTO"> - Não é nada fácil, a partir das directivas anteriores, definir a categoria semântica em EMs referentes a certos produtos comerciais. Para simplificar, reformulou-se a categoria COISA, onde o tipo MEMBROCLASSE abrange grupos de objectos que são referenciados metonimicamente pela sua classe. Assim sendo, o tipo PRODUTO da categoria OBRA deixa de ser suportado -- os casos que antes seriam marcados PRODUTO passam a COISA tipo MEMBROCLASSE

Embora não seja novo, refira-se que a <ABSTRACCAO TIPO="MARCA"> - abrange apenas as ideias abstractas em relação a marcas.

Referências anafóricas - Nas novas directivas, a indicação é para etiquetar de acordo com o seu sentido real.
Ou seja, a referência à segunda data é para ser resolvida.

A <ACONTECIMENTO TIPO="EFEMERIDE">Revolução de 1930</ACONTECIMENTO> (...) e a de <ACONTECIMENTO TIPO="EFEMERIDE">1932</ACONTECIMENTO>

Nas directivas anteriores, tínhamos feito a seguinte excepção, considerando que a segunda referência podia ser considerada DATA. Cf:

A <ACONTECIMENTO TIPO="EFEMERIDE">Revolução de 1930</ACONTECIMENTO> (...) e a de <TEMPO TIPO="DATA">1932</TEMPO>

Referências a uma pessoa a partir da organização que representa - Estes casos são para serem etiquetados na categoria <PESSOA TIPO="MEMBRO">, em particular, referências a entrevistadores ou a repórteres pelo nome do meio de comunicação social que representa.

Certo. <PESSOA TIPO="MEMBRO">Lusa</PESSOA>: E como se sentiu depois das eleições?

Nas directivas anteriores tínhamos arbitrariamente sugerido que fosse marcada como <PESSOA TIPO="INDIVIDUAL">

Clarificações

Referências a ministérios - há casos em que não é possível decidir se o que está em causa é uma organização ou uma disciplina/área. Como tal, aceitamos qualquer das categorias assinaladas.

O <ORGANIZACAO TIPO="ADMINISTRACAO">Ministério do Ambiente</ORGANIZACAO> gere a política ambiental.
O ministro do <ABSTRACCAO TIPO="DISCIPLINA">Ambiente</ABSTRACCAO> gere a política ambiental.
O <ORGANIZACAO|ABSTRACCAO TIPO="ADMINISTRACAO|DISCIPLINA">Ambiente</ORGANIZACAO|ABSTRACCAO> gere a política ambiental.

Dúvidas quanto a acontecimentos e períodos - Por vezes, um determinado acontecimento é referido como um período de tempo. Adoptou-se a seguinte regra:

Quando a referência à EM é usada como referência temporal, a EM é TEMPO.

Exemplo: Durante a <TEMPO TIPO="PERIODO">2ª Guerra Mundial</TEMPO>, surgiram os primeiros aviões a jacto.

Quando a EM não envolve referências temporais, assume-se que a EM representa o acontecimento em si, e não a época em que decorreu.

Exemplo: A <ACONTECIMENTO TIPO="EFEMERIDE">2ª Guerra Mundial</ACONTECIMENTO> envolveu meio mundo.

Período implícito - A categoria <TEMPO TIPO="PERIODO"> abrange também outras referências implícitas.

Exemplo: um trabalhador que refere a época em que trabalhou num navio, chamado D. Luís. O contexto da referência é a época, e não o navio.

Certo: Depois do <TEMPO TIPO="PERIODO">D. Luís</TEMPO>, fiquei desempregado.

Acontecimentos periódicos - Para acontecimentos periódicos, geralmente referenciados pelo ano em que decorreu (ex: Jogos Olímpicos de 1998, Campeonato do Mundo de Futebol do México 86), a EM de ACONTECIMENTO deve abranger todos os termos que são indispensáveis para a determinação do evento. Nos exemplos de cima, as referências ao ano e ao local do acontecimento são para serem incluídos na etiqueta ACONTECIMENTO, e não devem ser etiquetados à parte.

Graus académicos - Diversos graus académicos são desnecessariamente colocados com maiúsculas no texto. Como tal, não devem ser etiquetados, mesmo que apresentem uma maiúscula. Licenciatura, Pós-Graduação, 4ª classe, 2.o grau, etc.

Esta página e a sua informação não se encontra actualizada. Clique aqui para visitar o síio actual do HAREM.