HAREM - Avaliação de Reconhecimento de Entidades Mencionadas

Linguateca - 2006.
  Versão para impressão
IMPORTANTE: Este sítio diz respeito ao Primeiro HAREM, que terminou em 2006, e encontra-se encerrado. O sítio actual do HAREM encontra-se em /HAREM.


Caros participantes no HAREM e restantes membros da lista avalia,

Depois desta primeira fase de anotação em conjunto dos vários pedaços da colecção dourada, segundo as directivas preliminares, deparámo-nos com várias outras situações que precisam de ser especificadas e, nalguns casos, de debatidas!

Em primeiro lugar, as mais pacíficas (esperemos :-):

A) alguns exemplos, por estarem em minúsculas, lançaram a confusão...
No entanto, a regra de identificação de EM diz que candidatos a EMs sem letras maiúsculas não são para etiquetar.
Como tal, candidatos tipo quarta-feira *NÃO* são para anotar...

b) O tipo PERIODO, da categoria ABSTRACCAO é confuso. Será doravante 'fundido' com o tipo PERÍODO da categoria TEMPO.
Como tal, o exemplo 'pós-25 de Abril' vai ser considerado uma EM de TEMPO.
- A categoria ABSTRACCAO passará a ter um novo tipo, ESCOLA (ex: Barroco, Renascimento, Budismo)

c) Vamos aprofundar mais a subtipificação de ACONTECIMENTO:
- ORGANIZADO passa a ser um acontecimento grandioso. que possa ocupar vários dias. E até poderá incluir vários EVENTOS...
- EVENTO - apenas um acontecimento esporádico, que não demore mais de umas horas, mas que pode ser organizado ou não: Vi ontem o Benfica-Sporting na televisão (organizado); participei no Buzinão na Ponte (não orgazinado).

Um outro exemplo elucidativo poderá ser, por exemplo, um EURO2004 (Acontecimento organizado) que teve vários eventos (Jogos, Conferências de Imprensa, Festas, etc).

d) Surgiu a dúvida se os decretos-lei iriam para <OBRA TIPO="PUBLICACAO"> ou para categoria <ABSTRACCAO> com novo tipo.
Decidiu-se que:
<OBRA> compreende produtos intelectuais (em qualquer formato).
Consideramos então que uma lei é um tipo de PUBLICAÇÃO, incluindo coisas como artigos, livros, decretos, directivas, etc. citados, e não referidos pelo nome.
Ou seja
"Os Lusíadas" descreve a odisseia dos portugueses. OBRA REPRODUZIDA
Camões (1554) diz... OBRA PUBLICACAO

e) Datas sem ano são na maior parte das vezes datas em que o ano está implícito
As datas que referem um determinado dia, mesmo que o ano esteja oculto, devem ser do tipo DATA.
Datas que já não referem explicitamente um dia, serão CICLICO.

ex: 'No dia 6 de Novembro comemora-se'... - Como acontece todos os anos, é CICLICO
ex: 'No dia 6 de Novembro vai haver uma greve'... Se, no contexto, se subentender que se sabe o ano deste evento único, deve ser DATA

Como tal ter atenção, pois a mesma expressão pode ser CICLICO e DATA.

f) horas com modificação de onde são medidas são ainda horas, uma vez que é parte essencial para perceber o tempo da ocorrência.
ex: 'O atentado ocoreu às <TEMPO>13h, hora de Lisboa</TEMPO>, e fez...'

g) quando um cargo e a pessoa que o ocupa são mencionados no mesmo sintagma nominal, estamos em presença de apenas uma EM, pessoa,

O <PESSOA TIPO=INDIVIDUAL>Presidente da República Jorge Sampaio</PESSOA> chegou hoje.
O <PESSOA TIPO=INDIVIDUAL>Papa Leão XIII</PESSOA> publicou as encíclicas em latim.

h) a mesma expressão pode ser uma DATA ou um PERIODO

Em Agosto de 2000 foi publicada a 2.a edição de "livro QQ". TEMPO TIPO="DATA"
Em Agosto de 2000 houve 34 tentativas de suicídio registadas pela polícia portuguesa. TEMPO TIPO=PERIODO

Aplica-se a mesma regra de f): quando implicitamente se tenta definir uma data concreta, é um TIPO=DATA

i) valores de tempo são quantidades, não períodos.
Também se pode dizer que todos os valores serão quantidades, e são para ser etiquetados.

15 dias VALOR TIPO=QUANTIDADE
exemplo: ela faz um casaco de alta moda em 15 dias
exemplo 2: Estive 4 horas à espera do metro.

um exemplo mais elucidativo:
'Há 3 horas que espero pelo Metro' - VALOR TIPO="QUANTIDADE"
'Às 3 horas há um debate..." - TEMPO TIPO="DATA"

Define-se VALOR TIPO=QUANTIDADE como as quantias com uma unidade de medida no final.
ex: 4 pessoas estiveram... - como pessoas não é medida, não é para ser incluído, mas o '4' é para ser etiquetado.
ex: Uma pilha de 200 Volts - Volts é uma medida, e deve ser incluída na etiqueta.

j) Para descrever melhor a separação emtre TEMPO TIPO=CICLICO e TEMPO TIPO=PERIODO,
PERIODO - intervalos de tempo não salteados e contínuos (um principo e fim apenas)
CICLICO - intervalos de tempo salteados (com vários princípios e finais)

k) Não se esqueçam que, se tudo falhar :), ainda se pode etiquetar!

- Se a categoria em questão não se conseguir subtipificar, sempre se poder omitir ou usar TIPO="OUTRO", em todas as categorias!
ex: 'O ISR foi fundado em...' (Empresa? Instituição? É melhor TIPO="OUTRO"

- No caso de ambiguidade 'crónica', há que usar os operadores |
(<A|B TIPO="C|D">Entidade</A|B>)

Em segundo lugar, aquelas em que não temos uma resposta mas que pomos à discussão geral:

- O que fazer com a morfologia de pares/grupos? E de datas?
ex: <PESSOA TIPO="GRUPO">Carlos e Diana</PESSOA> - Como é a morfologia?
ex: 6 de Fevereiro - Qual a Morfologia?

- E/ou com o género de nomes próprios de que não conhecemos o género, como é o caso de Chaves, Sá da Bandeira, Petrópolis?
A nossa proposta é marcá-los todos com "?".

No caso de ter havido casos em que as regras que seguiram não concordaram com o que expomos aqui, pedimos para que nos indiquem isso em mail directo, para revermos essa parte.

De qq maneira, convirá salientar que vamos estudar e observar com muito cuidado todos os pedaços já anotados e confirmar que são coerentes quer com as nossas directivas quer entre si, de forma a ter a colecção dourada o mais dourada possível. Ao longo desse processo, ainda muitas outras coisas surgirão para discutir e documentar, de que daremos conhecimento a todos.

Um abraço a todos e mais uma vez muito obrigado àqueles que participaram na construção da colecção dourada

Nuno e Diana
Esta página e a sua informação não se encontra actualizada. Clique aqui para visitar o síio actual do HAREM.