2. O formato ad (árvores deitadas)

Página anterior   Próxima página

O formato que presentemente se documenta é o formato de árvores deitadas. O formato usado é o seguinte:

informação textual
nº frase: texto
A1
NÓ RAIZ<
=NÓ 1
==NÓ 1.1.
===NÓ 1.1.1
====NÓ 1.1.1....n
==NÓ 1.2.
===NÓ 1.2.1.
====NÓ 1.2.1....

A cada frase está associada informação textual, isto é, informação relativa ao extracto a que a frase pertence, o número da frase no Bosque e o texto (frase per se ). Cada frase é iniciada por A1 (análise 1 da frase). A mesma árvore pode ter mais do que uma análise distinta que são indicadas por A2, A3, etc. (ver secção 7. para a representação de ambiguidades).

NÓ RAIZ é o nó mais alto da árvore correspondente à sua raiz, por isso é único, isto é, não existem mais nós ao mesmo nível. Assim, o nó raiz não exibe descontinuidade nem pode estar coordenado.

Todos os outros nós constituintes da árvore (nó 1 e nós dependentes e os dependentes dos nós dependentes (nó 1.1. ou nó 1.2. a nó 1.1.1....n ou nó 1.2.1....n) estão por isso abaixo da raiz da árvore.

2.1. Nível de constituintes

Os sinais de igual ( = ) antepostos aos nós (indentação) indicam a profundidade da árvore relativamente à raiz. Um sinal de igual extra indica um nível abaixo, o que pressupõe dependência face a um nó constituinte a um nível acima.

2.2. Nós constituintes

2.2.1. Tipologia dos nós

Os nós constituintes podem ser terminais (i.e. sem dependentes) ou não terminais (i.e. com dependentes). Não existem nós com constituintes vazios (ø). O quadro em baixo representa, no formato ad, os casos acima e a sua representação adoptada na Floresta:

Nós terminais:
um constituinte
Nós não terminais:
mais do que um constituinte
CP216-2: Butros-Ghali deixou promessas CP23-1: Religiosos haitianos dizem basta

A1
nó raiz
=nó1 Butros-Ghali
=nó2 deixou
=nó3 promessas
A1
nó raiz
=nó1
==nó 1.1 Religiosos
== nó 1.2. haitianos
=nó
2 dizem
=nó
3 basta
Constituinte ausente (sujeito) Constituinte presente (sujeito)
CP429-9 Bebeu água. CP631-1 ... ela atende a Academia Sueca..
A1
nó raiz
=nó
1 Bebeu
=nó2 água
.
A1
nó raiz
..
=nó
1 ela
=nó
2 atende
=nó 3
==nó 3.1. a
==nó 3.2. Academia_Sueca
..

Todos os nós (incluindo a raiz) são pares de função e forma (F:f). A função corresponde à função sintáctica (sujeito, predicador, etc.) que cada constituinte possui em cada oração ou sintagma que compõe a frase. A forma corresponde à estrutura interna dos constituintes, isto é, sintagmas e orações para os nós não terminais, e, para os nós terminais, é usada uma classificação muito próxima das classes de PoS (advérbio, adjectivo, etc.). Abaixo, ”os promotores” em

CP887-6 Os promotores do concerto recomendam aos espectadores: levem guarda-chuva não vá S. Pedro pregar uma partida.

É representado da seguinte maneira:

=>N:art('o' <artd> M P) Os
=H:n('promotor' M P) promotores

A funçao de ”os” é de dependente de um núcleo nominal (N) que está a sua direita (>), por isso a marcação >N; a forma de ”os” é artigo. Tem-se entao o par de função e forma >N:art. ”promotores”, por sua vez, é o núcleo (H) do sintagma, e sua forma é substantivo/nome (n). O par função e forma é portanto H:n.

2.2.2. Informação morfossintáctica associada

Os nós terminais incluem ainda informação relativa à morfologia associada à sua forma que, consoante os casos, abrange classificações de género, número, caso, pessoa, tempo, modo (ver lista em Anexo 1). Os nós terminais incluem também informação quanto ao seu lema.

Todos os nós poderão (ou não) incluir informações secundárias (ver secção 16.), isto é, informações que não dizem respeito directamente à classificação morfossintáctica mas que são de ordem semântica ou outras (como sinalização de contracção, por exemplo).

 A ordem da informação associada aos nós é a seguinte:

Relativamente às informações secundárias, uma parte de revisão extremamente fina, algum trabalho de revisão necessita de ser feito, principalmente em termos de desambiguação de etiquetas secundárias.

Na Floresta tem-se sempre em conta o contexto quando se lida com classes morfológicas de análise ou com etiquetas secundárias. Ou seja, a um item que seja ambíguo morfologicamente é associada uma única análise quando o contexto o permite. Por exemplo, os adjectivos uniformes como inteligente, dialogante, eficaz, morfologicamente ambíguos entre género masculino e feminino, têm uma única análise que é dependente do contexto onde a palavra ocorre; serão de género feminino em contextos semelhantes ao seguinte exemplo:

CP228-2 Fazer uma gestão urbanística inteligente, dialogante, eficaz, informada e com bons resultados práticos, exige uma tenacidade e um talento que não estão ao alcance de técnicos cinzentos e submissos que o sistema inevitavelmente prefere, produz e atrai.

Por outro lado, os adjectivos uniformes inteligente e veloz serão do género masculino em contextos semelhantes a :

CF496-1 Teremos, então, um meio-campo ainda mais sólido na proteção à zaga e mais inteligente, veloz e agressivo, na combinação com o ataque.


Página anterior   Próxima página