Como o objectivo do ReRelEM é avaliar a identificação de relações, e não de EM, as relações que contêm pelo menos um elemento espúrio são ignoradas, isto é, nao recebem qualquer tipo de pontuação. Do mesmo modo, também sao ignoradas relações entre EM classificadas diferentemente na CD e na saída de um sistema. A seguir, detalhamos o processo de avaliação de relações.
Em termos gerais, a avaliação é feita da seguinte maneira:
CD: Portugal LOCAL | ORGANIZACAO
Saída do sistema 1: Portugal LOCAL
Saída do sistema 2: Portugal PESSOA
Se a interseção for vazia (saída do sistema 2), o alinhamento é ignorado.
Se a interseção não for vazia (saída do sistema 1), as categorias das EM na CD e na participação ficam iguais ao resultado da interseção. Desse modo, temos que as saídas acima passam a:
CD: Portugal LOCAL
saída do sistema 1: Portugal LOCAL
saída do sistema 2: o alinhamento que contém Portugal PESSOA é ignorado.
Com esse procedimento, eliminamos também eventuais diferenças entre as saídas dos sistemas e a CD no que diz respeito às segmentações alternativas (ALT). Isto é, se o sistema participante acertou alguma das segmentações alternativas, são eliminadas todas as outras (as erradas) de acordo com o item "b", e se o sistema não acertou nenhuma das alternativas, o alinhamento já foi removido como descrito no item "a", pois a EM foi considerada EM em falta.
Após a normalização, acontece a explicitação (e expansão) das relações – nomeadamente, das relações de identidade, das relações inversas e das relações decorrentes da aplicação das regras de transitividade. Abaixo ilustramos explicamos brevemente cada uma dessas “explicitações”.
De acordo com as directivas do ReRelEM, a ausência do atributo TIPOREL é entendida como TIPOREL="ident". Por isso, esta normalização trata de transformar:
<EM ID="FG51">João Steiner</EM>, astrofísico da USP (...), explicou <EM ID="FG560" COREL="FG51">Steiner</EM>
Em:
<EM ID="FG51">João Steiner</EM>, astrofísico da USP (...), explicou <EM ID="FG560" COREL="FG51" TIPOREL="ident">Steiner</EM>
De acordo com as directivas do ReRelEM, a marcação de uma relação implica a sua inversa, o que acontece nas relações "inclusao" e "ocorre_em".
Ou seja:Partindo do seguinte excerto de texto já com as relações inversas anotadas:
Em <EM ID="ex1">Tomar</EM>, bem no centro de <EM ID="ex2" COREL="ex1" TIPOREL="inclui">Portugal</EM>, podemos encontrar o <EM ID="ex3" COREL="ex1" TIPOREL="incluido">Convento de Cristo</EM>.
Passaremos a ter, após a explicitação das relações inversas:
Em <EM ID="ex1" COREL="ex2 ex3" TIPOREL="incluido_em inclui">Tomar</EM>, bem no centro de <EM ID="ex2" COREL="ex1" TIPOREL="inclui">Portugal</EM>, podemos encontrar o <EM ID="ex3" COREL="ex1" TIPOREL="incluido">Convento de Cristo</EM>.
Nesta fase, são explicitadas as relações decorrentes de transitividade (por exemplo referentes a identidade e inclui / incluido), asim como outras relações que se podem inferir da combinação de mais do que uma relação.
Exemplo de expansão de relações por transitividade:
Se A é igual a B e B é igual a C então A é igual a C.
Exemplo de combinação de duas relações
Se A está localizado em B e C é igual a A, então C está localizado em B.
Aqui encontra a lista exaustiva das regras que aplicamos no Segundo HAREM, e que denominamos regras de transitividade.
NOTA: Não consideramos a relação "outra" uma relação transitiva justamente por sua abrangência, uma vez que pode, por exemplo, incluir uma relação como "pai_de", que não é transitiva (João é pai de Pedro, Pedro é pai de Antônio, mas João não é pai de Antônio). E ainda pior, se tivermos Pedro é pai de Antônio e Antônio é dono do Bobi ou Antônio é patrão de Alexandra não é lícito avançar uma relação "outra" entre Pedro e Bobi ou entre Pedro e Alexandra.
No exemplo abaixo, já com as relações anotadas e com as relações inversas explícitas
Em <EM ID="ex1" COREL="ex2 ex3" TIPOREL="incluido_em inclui">Tomar</EM>, bem no centro de <EM ID="ex2" COREL="ex1" TIPOREL="inclui">Portugal</EM>, podemos encontrar o <EM ID="ex3" COREL="ex1" TIPOREL="incluido">Convento de Cristo</EM>.
Após a expansão das relações passaremos a ter:
Em <EM ID="ex1" COREL="ex2 ex3" TIPOREL="incluido_em inclui">Tomar</EM>, bem no centro de <EM ID="ex2" COREL="ex1 ex3" TIPOREL="inclui inclui">Portugal</EM>, podemos encontrar o <EM ID="ex3" COREL="ex1 ex2" TIPOREL="incluido incluido">Convento de Cristo</EM>.
No Segundo HAREM, houve um grupo que tentou todas as relações menos a outra, e outro que se limitou ao par inclui/incluido.
Uma relação é uma tripla (argumento1; tipo de relação; argumento2), em que os argumentos correspondem ao ID + a faceta (ou categoria) da EM.
α. corel_certo + β. tiporel_certo – γ. corel_espuriorelação certa → α + β
corel certo → α
corel espúrio → - γEm que
α = 0.5
β = 0.5
γ = 0.2