| Página anterior Próxima página |
As unidades são obtidas pelo parser. A atomização é identificada pelo PALAVRAS e pode ser dividida em: o que tradicionalmente se refere como palavras, pontuação, numerais, palavras com hífen (por justaposição e prefixação) exceptuando clíticos, e também várias unidades complexas, desdobramento de contracções e de verbos com clíticos.
Unidades ou palavras têm forma atómica e não admitem constituintes. São, por isso, sempre nós terminais (ao contrário das orações e sintagmas que podem ser nós não terminais bem como terminais). Como tal não admitem descontinuidade (ver secção 9.) mas podem estar coordenadas (ver secção 11.).
Pelo facto de as unidades terem forma atómica não se exclui da classificação de unidades/palavras, no entanto, formas que possuem uma estrutura interna complexa, isto é, expressões com mais do que uma palavra que representam uma única unidade semântica. São, neste caso, unidades complexas.
Os clíticos, bem como as palavras compostas por justaposição (com uso de hífen), são considerados também unidades atómicas simples.
Por outro lado, exclui-se da classificação de unidades/palavras as contracções, que na Floresta se encontram na sua forma não contraída, ou seja, cada um dos elementos que se contraem são considerados unidades, mas não a sua forma contraída.
Finalmente, a pontuação é também uma unidade. Nas árvores, possui indentação. Funciona, em termos de representação, como um nó terminal, apesar de não o ser na realidade, uma vez que não lhes está associada qualquer outro tipo de informação.
Em baixo encontram-se exemplos de unidades atómicas simples e complexas:
As unidades complexas são palavras cuja estrutura interna é complexa (mais do que uma palavra), mas que constituem uma unidade semântica. A diferença entre este tipo de unidades e as palavras compostas por justaposição hifenizadas relaciona-se com a cristalização das formas na língua. Assim, enquanto as palavras compostas por justaposição estão cristalizadas, as palavras com estrutura interna complexa não o estão, isto é, o seu grau de convencionalidade é inferior, mas no entanto, uma única unidade semântica é-lhes reconhecida. Aqui incluem-se, entre outros, topónimos, expressões onomásticas, e também locuções adverbiais. Como exemplos de unidades complexas, refira-se: Museu do Ar, João Silvestre, Praça da Ribeira, face a, apesar de, etc..
Como a definição do que seja uma expressão polilexical (ou expressão multi-palavra) é ainda controversa, cabendo diferentes análises conforme a perspectiva adotada (decomposiçao sintática, opacidade semântica, freqüência na língua), adotamos no Bosque uma visão que considera principalmente (mas não exclusivamente) expressões multi-palavra aquelas de natureza gramatical, deixando as combinações nome-adjetivo, por exemplo, decompostas, sempre que possível.
As unidades complexas representam-se através da união por "_" dos elementos que compõem a unidade: Museu _do_Ar, João_Silvestre, Praça _da_Ribeira, face _a, apesar _de . Note-se que as contracções presentes em Museu_do_Ar e Praça_da_Ribeira encontram-se na sua forma contraída (ver secção 5.2.1.2 a propósito de Reconhecimento de Entidades Mencionadas (REM)).
No Glossário há uma lista de todas as expressões multi-palavras presentes no Bosque, tanto lexicais quanto gramaticais.
No Bosque, as EMs podem estar representadas por expressões multi-palavras. Por exemplo, Lisboa e Ministério_do_Planeamento_e_Administração_do_Território são ambos casos de EM.
As unidades atómicas simples e as unidades complexas que exibem hífenes não são separáveis (por exemplo, sexta-feira). Os prefixos são analisados separadamente, como descrito na secção 5.2.2.
Os clíticos, unidades atómicas simples, porém ligados a um verbo por hífen quando em posição pós-verbal, são separados do verbo.
A representação dos clíticos no formato de árvores não inclui o hífen, estando este junto ao verbo, como a seguir se ilustra:
CP222-6 «Não podemos permitir que a contratação colectiva continue bloqueada, que o desemprego continue a aumentar, que a segurança social, a saúde e a educação continuem a degradar-se».
…
===P:vp
====AUX:v-fin('continuar' PR 3P SUBJ) continuem
====PRT-AUX:prp('a') a
====MV:v-inf('degradar') degradar-
===ACC:pron-pers('se' M 3P ACC) se
=»
=.
As contracções não formam uma unidade atómica. As contracções apresentam-se no formato de árvores na sua forma não contraída. No entanto, a indicação de contracção está presente através da indicação de <sam-> <-sam>. Cada uma das partes envolvidas na contracção inclui esta informação; a primeira parte da contracção inclui a informação <sam-> e a segunda parte inclui a informação <-sam>:
CF236-3 Não no âmbito da empresa, mas de um país inteiro.
A1
STA:pp
=>P:adv('não') Não
=H:prp('em' <sam->) em
=P<:np
==>N:art('o' <-sam> <artd> M S) o
==H:n('âmbito' M S) âmbito
…
CP848-11 Para perceber uma nova situação e, depois de alguém lha explicar, dizer imediatamente: 'Que tal assim?' .
...
===ADVL:advp
====H:adv('depois') depois
====A<:pp
=====H:prp('de') de
=====P<:icl
======SUBJ:pron-indp('alguém' M S) alguém
======DAT:pron-pers('ele/ela' <sam-> M/F 3S DAT) lhe
======ACC:pron-pers('ela' <-sam> F 3S ACC) a
======P:v-inf('explicar' 3S) explicar
…
O facto de as contracções serem representadas na sua forma não contraída tem uma razão sintáctica. Se estivessem na sua forma contraída não seria possível a divisão em sintagmas distintos (no caso de contracções de preposição e artigo) nem a representação de funções distintas (no caso da contracção de dois pronomes).
Nos exemplos acima, as duas partes envolvidas na contracção são, no primeiro caso, constituintes de sintagmas distintos (em núcleo do sintagma preposicional (pp) e o constituinte do sintagma nominal (np)) e no segundo caso, possuem funções sintácticas distintas (lhe, objecto indirecto; a, objecto directo).
Um outro caso presentemente considerado nas árvores do CETEMPúblico no Bosque como contracção é ao enquanto contracção de a com o artigo o, nos casos que o exemplo ilustra:
CP21-3 Ao chegar, às 9 horas (TMG) de hoje, ao aeroporto de Cracóvia, João Paulo II será recebido com um mínimo de formalidades.
A1
STA:fcl
=ADVL:pp
==H:prp('a' <sam->) A
==P<:icl
===>N:art('o' <-sam> <artd> M S) o
===H:icl
====P:v-inf('chegar') chegar
…
Nas árvores do CETENFolha, no entanto, ao surge como uma preposição e não como uma contracção:
CF122-5 Ao justificar sua necessidade, o presidente da República abriu uma fresta para a realidade na propaganda sobre as virtudes da URV.
A1
STA:fcl
=ADVL:pp
==H:prp('ao') Ao
==P<:icl
===P:v-inf('justificar') justificar
===ACC:np
====>N:pron-det('seu' <poss 3S> <si> F S) sua
====H:n('necessidade' F S) necessidade
…
A pontuação não tem qualquer informação morfossintáctica associada, embora possa ser um indicador de estatuto sintáctico (veja-se secção 5.1.4.3 abaixo), estando tão só indentada:
CP223-1 «Somos obrigados a tornar os nossos programas o mais interessantes possível, num ambiente onde existem múltiplas escolhas», refere Victor Neufeld, o produtor executivo do programa 20/20, da ABC, citado pela Associated Press.
...
=SUBJ:np
==H:prop('Victor_Neufeld' M S) Victor_Neufeld
==,
==APP:np
===>N:art('o' M S) o
===H:n('produtor' M S) produtor
===N<:adj('executivo' M S) executivo
...
Cada sinal de pontuação tem o seu nó na árvore, mesmo em casos de combinação de pontuação como nos seguintes exemplos:
CP623-5 mamem a pastilha elástica caladinhos ... senão rua !!!
A1
CMD:fcl
=P:v-fin('mamar' PR 3P SUBJ) mamem
=ACC:np
==>N:art('o' <artd> F S) a
==H:n('pastilha_elástica' F S) pastilha_elástica
==N<:n('caladinho' <DERS> M P) caladinhos
=..
=ADVL:adv('senão' <kc>) senão
=ADVL:in('rua' F S) rua
=!
=!
=!
CF451-16 Simbólico?!
A1
UTT:adjp
=H:adj('simbólico' M S) Simbólico
=?
=!
Existem algumas regularidades de representação da pontuação nas árvores, nomeadamente a sua posição relativa aos nós não terminais.
Há a considerar três casos diferentes: pontuação em início de frase, fim de frase e pontuação dentro da frase. A pontuação em fim de frase inclui todo o tipo de pontuação excepto a vírgula. Em início de frase, a pontuação inclui parênteses, aspas, travessão. No último caso, pontuação dentro da frase, inclui-se todo o tipo de pontuação, excepto o ponto final.
Assim, as regularidades são as seguintes:
CF22-3 «Escuto Stones desde os 13 anos de idade.
A1
STA:fcl
=«
=P:v-fin('escutar' PR 1S IND) Escuto
=ACC:prop('Stones' M P) Stones
=ADVL:pp
==H:prp('desde') desde
==P<:np
===>N:art('o' <artd> M P) os
===>N:num('13' <card> M P) 13
===H:n('ano' M P) anos
===N<:pp
====H:prp('de') de
====P<:n('idade' F S) idade
=.
CP228-1 A falta de consciência do sentido de ridículo ainda recentemente foi dada, em declarações ao PÚBLICO, por um douto professor universitário que classificou liminarmente de «mau plano» um PDM elaborado dentro de uma câmara municipal com uma equipa técnica de qualidade e fortemente assessoriada por urbanistas experientes.
A1
STA:fcl
...
=P:vp
==AUX:v-fin('ser' PS 3S IND) foi
==MV:v-pcp('dar' F S) dada
=,
...
=,
=PASS:pp
==H:prp('por') por
==P<:np
===>N:art('um' <arti> M S) um
===>N:adj('douto' M S) douto
===H:n('professor' M S) professor
===N<:adj('universitário' M S) universitário
===N<:fcl
====SUBJ:pron-indp('que' <rel> M S) que
====P:v-fin('classificar' PS 3S IND) classificou
====ADVL:adv('liminarmente') liminarmente
====OC:pp
=====H:prp('de') de
=====«
=====P<:np
======>N:adj('mau' M S) mau
======H:n('plano' M S) plano
=====»
====ACC:np
=====>N:art('um' <arti> M S) um
=====H:prop('PDM' M S) PDM
...
CP24-4 Registe-se que a terça-feira de Carnaval não é um feriado legal, mas tão-só «tradicional» : ou seja, todos os anos o primeiro-ministro tem que produzir um despacho, publicado em «Diário da República», em que decreta a tolerância de ponto.
A1
STA:fcl
=P:v-fin('registar' PR 3S SUBJ) Registe-
=VOC:pron-pers('se' M/F 3S/P ACC) se
=ACC:fcl
==SUB:conj-s('que') que
==SUBJ:np
===>N:art('o' F S) a
===H:n('terça-feira' F S) terça-feira
===N<:pp
====H:prp('de') de
====P<:prop('Carnaval' M S) Carnaval
==ADVL:adv('não') não
==P:v-fin('ser' PR 3S IND) é
==SC:np
===>N:art('um' <arti> M S) um
===H:n('feriado' M S) feriado
===N<:cu
====CJT:adj('legal' M S) legal
====,
====CO:conj-c('mas' <co-sc>) mas
====CJT:adjp
=====>A:adv('tão-só') tão-só
=====«
=====H:adj('tradicional' F S) tradicional
=====»
…
-pontuação que separa trechos, colocada ao mesmo nível do trecho que se inicia a partir da pontuação que o separa do trecho anterior. Incluem-se neste caso a vírgula, ponto e vírgula, dois pontos, travessão[1]. Os seguintes exemplos ilustram este caso:
CF21-2 Outra maneira de um partido forçar a substituição seria expulsar o candidato, com base em seu estatuto.
A1
STA:fcl
=SUBJ:np
==>N:pron-det('outro' <diff> <KOMP> F S) Outra
==H:n('maneira' F S) maneira
==N<:pp
===H:prp('de') de
===P<:icl
====SUBJ:np
=====>N:art('um' <arti> M S) um
=====H:n('partido' M S) partido
====P:v-inf('forçar' 3S) forçar
====ACC:np
=====>N:art('o' <artd> F S) a
=====H:n('substituição' F S) substituição
=P:v-fin('ser' COND 3S) seria
=SC:icl
==P:v-inf('expulsar') expulsar
==ACC:np
===>N:art('o' <artd> M S) o
===H:n('candidato' M S) candidato
==,
==ADVL:pp
===H:prp('com_base_em') com_base_em
===P<:np
====>N:pron-det('seu' <poss 3S> <si> M S) seu
====H:n('estatuto' M S) estatuto
=.
CP34-6 Este sistema de recolha adequa-se a edifícios baixos, com poucos pisos.
A1
STA:fcl
=SUBJ:np
==>N:pron-det('este' <dem> M S) Este
==H:n('sistema' M S) sistema
==N<:pp
===H:prp('de') de
===P<:n('recolha' F S) recolha
=P:v-fin('adequar' PR 3S IND) adequa-
=ACC:pron-pers('se' F 3S ACC) se
=PIV:pp
==H:prp('a') a
==P<:np
===H:n('edifício' M P) edifícios
===N<:adj('baixo' M P) baixos
===,
===N<PRED:pp
====H:prp('com') com
====P<:np
=====>N:pron-det('pouco' <quant> M P) poucos
=====H:n('piso' M P) pisos
=.
Note-se que, no exemplo CP34-6, a posição da vírgula não permite identificar se se trata de pontuação de tipo separador ou delimitador.
Relativamente ao caso de dependentes num sintagma que estão delimitados por vírgulas e que se posicionam antes do núcleo que modificam, a pontuação delimitadora está abaixo do nó a que o trecho pertence. No exemplo abaixo, a pontuação delimitadora está abaixo do nó correspondente à segunda CJT:np. O seguinte exemplo ilustra este caso:
CP458-6 Uma verdade subjectiva incorporada através de normas sociais e, inversa e complementarmente, práticas sociais que avaliam do grau de integração de cada um.
A1
UTT:np
=>N:art('um' <arti> F S) Uma
=H:n('verdade' F S) verdade
=N<:adj('subjectivo' F S) subjectiva
=N<:icl(<pcp>)
==P:v-pcp('incorporar' F S) incorporada
==ADVL:advp
===H:adv('através') através
===A<:pp
====H:prp('de') de
====P<:cu
=====CJT:np
======H:n('norma' F P) normas
======N<:adj('social' F P) sociais
=====CO:conj-c('e' <co-prparg>) e
=====CJT:np
======,
======>N:cu
=======CJT:adj('inverso' F S <Em>) inversa
=======CO:conj-c('e' <co-premod>) e
=======CJT:adv('complementarmente') complementarmente
======,
======H:n('prática' F P) práticas
======N<:adj('social' F P) sociais
...
Existem casos difíceis nomeadamente na determinação da função da pontuação, isto é, por vezes a determinação de um tipo de pontuação, especialmente a vírgula, como separador ou delimitador de trechos torna-se de difícil avaliação, como o seguinte exemplo:
CP366-3 São notícias de penhoras, pelos tribunais, execuções fiscais, montes de dívidas à banca e à Segurança Social, esbanjamento de vários milhões em negócios pouco claros com a Real Companhia Velha, etc. etc.
| Delimitadores de trecho | Separadores entre trechos |
|---|---|
A1
STA:fcl
=P:v-fin('ser' PR 3P IND) São
=SC:cu
==CJT:np
===H:n('notícia' F P) notícias
===N<:pp
====H:prp('de') de
====P<:np
=====H:n('penhora' F P) penhoras
=====,
=====N<:pp
======H:prp('por' <sam->) por
======P<:np
=======>N:art('o' <-sam> <artd> M P) os
=======H:n('tribunal' M P) tribunais
=====,
==CJT:np
===H:n('execução' F P) execuções
===N<:adj('fiscal' F P) fiscais
==,
==CJT:np
===H:n('monte' M P) montes
===N<:pp
====H:prp('de') de
====P<:n('dívida' F P) dívidas
…
|
A1
STA:fcl
=P:v-fin('ser' PR 3P IND) São
=SC:cu
==CJT:np
===H:n('notícia' F P) notícias
===N<:pp
====H:prp('de') de
====P<:np
=====H:n('penhora' F P) penhoras
=====,
=====N<:pp
======H:prp('por' <sam->) por
======P<:np
=======>N:art('o' <-sam> <artd> M P) os
=======H:n('tribunal' M P) tribunais
==,
==CJT:np
===H:n('execução' F P) execuções
===N<:adj('fiscal' F P) fiscais
==,
==CJT:np
===H:n('monte' M P) montes
===N<:pp
====H:prp('de') de
====P<:n('dívida' F P) dívidas
…
|
O problema está em determinar se a segunda vírgula (a negrito, antes do nó execuções fiscais) é delimitadora do trecho anterior (pelos tribunais) ou se é um separador entre os elementos coordenados (à semelhança da terceira vírgula antes do nó montes de dívidas). Nestes casos, prefere-se a análise de delimitador de trecho, estando, por isso, os dois sinais de pontuação delimitadores ao mesmo nível.
Há uma excepção a considerar: delimitadores de trecho que não podem estar ao mesmo nível, por exigência da própria sintaxe da frase.
Este caso refere-se à situação de a pontuação delimitadora não cobrir apenas um nó (terminal ou não) mas vários nós. Desta forma, não é possível seguir a regra dos delimitadores estarem os dois ao mesmo nível. Veja-se um exemplo:
CP306-1 «Quem estraga velho paga novo», disse Vítor Melícias, afirmando pretender que sejam repensadas as situações onde «já houve entregas apressadas» de antigos edifícios das Misericórdias, ocupados até há bem pouco tempo por unidades hospitalares do Estado.
A1
STA:fcl
…
=ADVL:icl
==P:v-ger('afirmar') afirmando
==ACC:icl
===P:v-inf('pretender') pretender
===ACC:fcl
====SUB:conj-s('que') que
====P:vp
=====AUX:v-fin('ser' PR 3P SUBJ) sejam
=====MV:v-pcp('repensar' F P) repensadas
====SUBJ:np
=====>N:art('o' <artd> F P) as
=====H:n('situação' F P) situações
=====N<:fcl
======ADVL:adv('onde' <rel> <ks>) onde
======«
======ADVL:adv('já') já
======P:v-fin('haver' PS 3S IND) houve
======ACC:np
=======H:n('entrega' F P) entregas
=======N<:v-pcp('apressar' F P) apressadas
=======»
=======N<:pp
========H:prp('de') de
========P<:np
=========>N:adj('antigo' M P) antigos
=========H:n('edifício' M P) edifícios
A pontuação final permite identificar a frase como constituindo um elemento comunicativo (ver ponto 6.3, funções ao nível da raiz), e por isso é considerada parte integrante da frase. Por vezes, uma "frase analisada" corresponde a uma
sequência de "frases" como funções principais (STA, QUE, EXC, e UTT).
Como pontuação final consideramos o seguinte conjunto: ! ? : -- e .
Um exemplo do uso dessa pontuação para marcar uma sequência de actos de fala (STA, QUE, EXC, e UTT) é:
CP513-10 P. -- Porquê?
A1
UTT:sq
=UTT:n('P.' F S) P.
=--
=QUE:advp
==H:adv('porquê' <interr>) Porquê
==?
Neste exemplo, atente-se para o facto do ponto de interrogação ser parte integrante do do sintagma composto pela palavra porquê seguida de um "?". Só com o "?" é que é evidentemente possível atribuir-lhe a função QUE.
O exemplo além disso ilustra uma sequência de funções discursivas (UTT seguido de QUE) que é separado / sinalizado pela pontuação "final" --. "P." foi neste caso analisado como abreviatura de Pergunta. Nestes casos, a sequência é encabeçada pelo nó raiz UTT:sq (ver secção 4.2.7.).
Mais exemplos:
CF8-1 Telê -- Claro.
A1
UTT:sq
=UTT:prop('Telê' F S) Telê
=--
=EXC:advp
==H:adv('claro') Claro
==.
CF451-16 Simbólico?!
A1
UTT:adjp
=H:adj('simbólico' M S) Simbólico
=?
=!
Esta secção não pretende dar conta de todas as categorias gramaticais ou P(art)o(f)S(peech) que podem ser encontradas na Floresta (ver Anexo 1) mas tem o intuito de descrever quatro categorias gramaticais que colocam algumas dificuldades de análise, nomeadamente a distinção entre nomes comuns e nomes próprios e a sua articulação com Entidades Mencionadas (EM), e o tratamento de prefixos.
Tradicionalmente, os nomes estão divididos em subclasses: próprio, comum, colectivo. Na Floresta, apenas se distinquem os nomes próprios dos nomes comuns, através das etiquetas de forma prop e n, respectivamente, sendo que os nomes colectivos estão classificados como nome comum.
A questão que aqui se coloca é a determinação do que pode ser analisado como nome próprio e como nome comum, dependendo de vários factores. Em princípio, na Floresta, um nome próprio é iniciado por letra maiúscula (início de frase tem obviamente um tratamento diferente) e os nomes comuns por minúscula. No entanto, estamos a falar de convenções que nem sempre são respeitadas e por vezes surgem disparidades dentro do mesmo corpus, isto é, o mesmo item lexical com ortografia maiúscula e minúscula. Além disso, há ainda a ter em conta a variante do português; por exemplo, os meses em português europeu (PE) e em português do Brasil (PB) divergem quanto à sua ortografia: maiúscula em PE e minúscula em PB.
Esta questão não foi ainda completamente acordada entre os membros da equipa da Floresta Sintá(c)tica, e dada a dificuldade em alguns casos para os quais não temos ainda uma resposta, o Bosque não possui um elevado nível de consistência nesta matéria. Deixamos aqui algumas regularidades e alguns casos difíceis de resolução.
Quanto a algumas regularidades, no Bosque estão analisados como nome próprio os seguintes itens com letra maiúscula inicial:
Em termos de variante do português, há a salientar o caso dos nomes de meses, em maiúscula inicial em PE e minúscula em PB. Tomando como critério maiúscula ou minúscula inicial para diferenciar nomes próprios de comuns, considerar-se-ia uma diferença fundamental em termos de análise para um mesmo item, já que os meses seriam nomes próprios, quando grafados em maiúscula inicial e nomes comuns quando em minúscula. De forma a conciliar as análises de PoS para as duas variantes, optou-se por considerar que os meses são nomes comuns (n), no entanto no corpus do CETEMPúblico existe ainda a etiqueta secundária <prop> indicando que o item em questão possui características de nome próprio, como se pode observar nos seguintes exemplos:
Árvores do CETEMPúblico :
CP392-3 O repórter foi accionado por, em crónicas emitidas em Julho de 1992, ter criticado o comandante do posto da PSP, subchefe Amadeu Eiras e o guarda António Soares, críticas que o Ministério Público considerou difamatórias.
...
=====N<:icl(<pcp>)
======P:v-pcp('emitir' F P) emitidas
======ADVL:pp
=======H:prp('em') em
=======P<:np
========H:n('julho' <prop> M S) Julho
========N<:pp
=========H:prp('de') de
=========P<:num('1992' <card> M S) 1992
…
Árvores do CETENFolha :
CF324-7 O reajuste é de 6,08% , equivalente ao IPC-r de julho.
A1
STA:fcl
=SUBJ:np
==>N:art('o' <artd> M S) O
==H:n('reajuste' M S) reajuste
=P:v-fin('ser' PR 3S IND) é
=SC:pp
==H:prp('de') de
==P<:np
===>N:num('6,08' <card> M P) 6,08
===H:n('%' M P) %
===,
===N<PRED:adjp
====H:adj('equivalente' M S) equivalente
====A<:pp
=====H:prp('a' <sam->) a
=====P<:np
======>N:art('o' <-sam> <artd> M S) o
======H:prop('IPC-r' M S) IPC-r
======N<:pp
=======H:prp('de') de
=======P<:n('julho' M S) julho
=.
Relativamente aos casos mais difíceis, para os quais a discussão está ainda aberta, os problemas que se levantam relacionam-se essencialmente com a inconsistência no uso de grafia maiúscula/minúscula no corpus. Ocorrem essencialmente quatro situações:
Muitos dos casos que se incluem no ponto 3. são casos de co-referência, isto é, correspondem a uma parte do nome cuja forma completa ocorreu anteriormente no texto (ver também a este propósito Mota et al. (2004)). Veja-se os seguintes exemplos:
CP721-3 A propósito da exposição «Dinossáurios da China», em curso no Museu Nacional de História Natural, começaria por insistir no convite a Sua Excelência a visitá-la.
CP721-4 Aproveitaria para lhe mostrar o estado lamentável de um enorme casarão, esventrado e em tosco, na sequência do incêndio da Faculdade de Ciências (há 18 anos!), de reinstalação sempre adiada e pomposamente referido como Museu Nacional, que pouco deve à tutela, mas ao qual se reconhece uma obra científica, cultural e pedagógica notável.
CP721-5 Dir-lhe-ia que reunir aqui esta magnífica colecção de verdadeiros fósseis, alguns gigantescos, dos terrenos mesozóicos da velha China foi mérito exclusivo deste Museu, que não contou com quaisquer apoios diplomáticos, numa realização que vai fazer mais pelo estreitamento das relações entre os dois países do que quaisquer outras já realizadas.
Em CP721-5, Museu com grafia maiúscula em letra inicial refere-se a Museu Nacional ou Museu Nacional de História Natural que ocorrem em CP721-3 e CP721-4, sendo, por isso, o primeiro uma anáfora dos outros dois e daí a manutenção da grafia maiúscula. Nestes casos, onde é possível a recuperação da informação, a etiqueta prop é atribuída:
=====H:prop('Museu' M S) Museu
Caso a recuperação não seja possível, entende-se que possivelmente a ocorrência seria um destes casos e a entrada é etiquetada n e <prop>. Vejamos a seguinte sequência:
CP239-1 de novo a polémica à ribalta.
CP239-2 Um investimento de 27 milhões de contos (mais seis milhões para aquisição de uma colecção própria) suportado pelas arcas bascas apesar da existência de 47 «partenaires» comerciais, é sinónimo do interesse que o governo de Euskadi, do Partido Nacionalista Basco (PNV), atribui ao evento.
CP239-3 Implantado em terrenos antes ocupados por indústrias desarticuladas pela reconversão industrial dos anos 80 e cujo «ferro velho» permanecia como legado da crise económica da outrora laboriosa cidade de Bilbau, o Museu pretende ser um símbolo da regeneração basca: de uma sociedade que quer vencer as dificuldades presentes e, em vésperas do século XXI, dar novos argumentos -- os da esperança e da paz -- aos seus cidadãos.
CP239-4 Por isso, atentos ao perder da sua influência, os etarras, através do até agora desconhecido «comando Katu», tentaram destruir o símbolo de um novo tempo, menos rural -- é nessas zonas e entre os deserdados das cidades que a Eta faz o seu recrutamento --, mais dinâmico e, sobretudo, aberto à influência exterior, algo que o nacionalismo admite com dificuldade.
Uma vez que em todo o extracto apenas está presente apenas uma das entidades (Museu em CP239-3) possivelmente anafórica, esta é analisada da seguinte forma:
CP239-3 Implantado em terrenos antes ocupados por indústrias desarticuladas pela reconversão industrial dos anos 80 e cujo «ferro velho» permanecia como legado da crise económica da outrora laboriosa cidade de Bilbau, o Museu pretende ser um símbolo da regeneração basca: de uma sociedade que quer vencer as dificuldades presentes e, em vésperas do século XXI, dar novos argumentos -- os da esperança e da paz -- aos seus cidadãos.
...
=SUBJ:np
==>N:art('o' <artd> M S) o
==H:n('museu' <prop> M S) Museu
=P:v-fin('pretender' PR 3S IND) pretende
=ACC:icl
==P:v-inf('ser') ser
==SC:np
===>N:art('um' <arti> M S) um
===H:n('símbolo' M S) símbolo
…
Entidades Mencionadas (EM) são tipicamente nomes próprios e outras entidades afins: conjuntos de nomes próprios (patronímicos, toponímicos, designação de entidades colectivas) e outras palavras que formam na generalidade dos casos uma entidade (Mota et al., 2007).
No Bosque, as EMs podem estar representadas por expressões multi-palavras. Por exemplo, Lisboa e Ministério_do_Planeamento_e_Administração_do_Território são ambos casos de EM.
No entanto, a identificação de EMs coloca alguns problemas também identificados em Mota et al. (2007): 1) quais os elementos que devem constar de uma EM; 2) problemas de classificação da categoria gramatical (PoS) da EM; 3) como lidar com EM que não podem estar representadas numa expressão multi-palavra.
Em 1) coloca-se o problema de identificar o que constitui uma EM. Tomando como exemplo secretário de Estado do Desenvolvimento Regional, quantas EMs podem ser identificadas? Nestes casos, optamos por uma abordagem que considera EM apenas as expressões compostas por nomes próprios. Além disso, consideramos normalmente a possibilidade de análise sintácticas das expressões. Desta maneira, os cargos são decomponíveis (ministro dos Negócios Estrangeiros e Ministro dos Negócios Estrangeiros contêm ambos dois itens lexicais: [Mm]inistro e Negócios Estrangeiros). Já as instituições são consideradas polilexicais:
director Do Oceanário da Expo 98
Em 2) o problema está directamente relacionado com o problema do uso por vezes não regular da ortografia maiúscula e minúscula. Os seguintes exemplos ilustram estes casos: praia_da_Amália, estado_do_Punjab, Estado_da_Califórnia, etc.
Outras entidades mencionadas são as datas. Presentemente, as datas de forma semelhante a <numeral> de <mês> de <ano>, <numeral> de <mês> ou <mês> de <ano> não estão representadas como expressões multi palavras na Floresta. A análise é feita individualmente por cada um dos constituintes, e o nó não terminal que contém a expressão recebe a etiqueta secundária <data>, como ilustram os seguintes exemplos:
CF472-4 Foi assassinado em agosto de 1909, um mês antes do acordo entre os dois países.
A1
STA:fcl
=P:vp
==AUX:v-fin('ser' PS 3S IND) Foi
==MV:v-pcp('assassinar' M S) assassinado
=ADVL:pp
==H:prp('em') em
==P<:np(<data>)
===H:n('agosto' M S) agosto
===N<:pp
====H:prp('de') de
====P<:num('1909' <card> M P) 1909
===,
...
CP198-7 Foi em 22 de Setembro de 1914.
A1
STA:fcl
=P:v-fin('ser' PS 3S IND) Foi
=ADVS:pp
==H:prp('em') em
==P<:np(<data>)
===H:num('22' <card> M P) 22
===A<:pp
====H:prp('de') de
====P<:np
=====H:n('setembro' <prop> M S) Setembro
=====N<:pp
======H:prp('de') de
======P<:num('1914' <card> M S) 1914
.=
Existem formas semelhantes às descritas em cima e que indicariam data, mas que na verdade se referem a eventos ou topónimos, como 25 de Abril (data da revolução portuguesa), 24 de Julho (avenida em Lisboa), etc. Estes casos estão representados como expressões multi palavra (25_de_Abril) e, em termos de categoria gramatical, são nomes próprios (prop).
A representação abreviada das datas, como 17-07-1972 ou 17/07/1972, é considerada um único token, e recebe a etiqueta n.
CP546-2 Jorge Coelho, do Secretariado do PS, sobre os candidatos à sucessão no PSD, «Diário de Notícias», 7-2-95
...
=,
=N<PRED:np
==«
==H:prop('Diário_de_Notícias' M S) Diário_de_Notícias
==»
==,
==N<PRED:num('7-2-95' <card> M S) 7-2-95
Nos casos de datas que envolvem numerais coordenados, como no exemplo abaixo, assume-se a elipse de um dos elementos dos numerais, igualando-se portanto, a análise de datas coordenadas à análise de numerais coordenados (ver secção 5.2.4.)[2], como no seguinte exemplo:
CP132-6 A fotografia foi publicada na imprensa de todo o mundo há cerca de um ano, quando de o massacre de Bentalha, na Argélia, onde morreram cerca de duas centenas de pessoas, na noite de 22 para 23 de Setembro.
===ADVL:pp
====H:prp('em' <sam->) em
====P<:np
=====>N:art('o' <-sam> >artd> S) a
=====H:n('noite' F S) noite
=====N<:cu
======PCJT:pp
=======H:prp('de') de
=======P<:np(<Eg>)(<data>)
========H:num('22' <card> M S) 22
======PCJT:pp
=======H:prp('para') para
=======P<:adjp(<data>)
========H:num('23' <card> M S) 23
========A<:pp
=========H:prp('de') dec
=========P<:np
==========H:n('setembro' <prop> M S) Setembro
Como se referiu em 5.1.2., os prefixos separados por hífen são analisados em isolamento e recebem a etiqueta de forma ec (elemento composto). Em casos de coordenação de prefixos, a representação é a seguinte:
CP743-3 Os Encontros Acarte propunham-se responder a esse duplo anseio: informar o público e estimular os autores portugueses, na perspectiva de os despertar para as estéticas do pós e neo-modernismo .
==>N::cu(<Eg>)
===CJT:ec('pós' <eg> M S) pós
===CO:conj-c('e' <prparg>) e
===CJT:ec('neo-’ M S) neo-
==H:n(‘modernismo' M S) modernismo
O prefixo e a palavra podem encontrar-se separados por elementos textuais como as aspas:
CP746-2 «... Os laboratórios do Departamento de Estado e do Pentágono ainda não conseguiram dar uma resposta precisa quanto à imprevisibilidade da reacção do seu «ex» aliado ...
=======N<:pp
========H:prp('de' <sam->) de
========P<:np
=========>N:art('o' <-sam> <artd> M S) o
=========>N:pron-det('seu' <poss 3S> M S) seu
=========«
=========>N:ec('ex') ex
=========»
=========H:n('aliado' M S) aliado
=========(
Quando os prefixos estão relacionados a adjetivos ("idéias anti-americanas"), passam a integrar um sintagma adjetival:
=========>N:adj('perigoso' F P) perigosas
=========H:n('ideia' F P) ideias
=========N<:adjp
==========A>:ec('anti-’) anti-
==========H: adj(‘americano' F P) americanas
Consequência do tratamento em separado dos prefixos nos casos de nomes e adjetivos é que, frequentemente, palavras que poderiam ser consideradas um único token, como auto-estrada ou mal-estar, são desmembradas. Porém, como o critério para se considerar a existência de um ou mais tokens não é unânime, preferimos, em nome de uma maior uniformidade e consistência, manter sempre a separação.
Os prefixos podem, ainda, estar relaciondos a verbos - participiais ou não. Nesses casos, excepcionalmente, decidimos por uma análise que não considera os prefixos elementos à parte, isto é, o prefixo é incorporado ao item lexical:
===N<:icl() ====P:vp =====MV:v-pcp('recém-nomear' M S) recém-nomeado ====SC:np =====H:n('chefe' M S) chefe =====N<:pp ======H:prp('de' ) de ======P<:np =======>N:art('o' <-sam> F S) a =======H:n('casa' F S) casa =======N<:adj('civil' F S) civil
Embora essa nao seja a análise ideal, visto levar a criação de lemas como recém-nomear, auto-elogiar e contra-argumentar, por exemplo, é a mais simples, pois não acarreta em alterações na estrutura interna do vp.
Os adjectivos, de forma adj, são tipicamente modificadores de um núcleo de natureza nominal:
CF81-2 Há uma esquerda reformista no PSDB.
A1
STA:fcl
=P:v-fin('haver' PR 3S IND) Há
=ACC:np
==>N:art('um' <arti> F S) uma
==H:n('esquerda' F S) esquerda
==N<:adj('reformista' F S) reformista
...
No entanto, determinados adjectivos podem ser usados em contextos que implicam uma análise nominal, ou seja, são adjectivos que podem ocorrer sem a presença do núcleo que modificam, e que porém possuem características de referencialidade:
CP574-1 Portugal, com 6,7 por cento dos pobres da CEE.
Nestes casos, mantém-se a etiqueta de forma adj e adiciona-se uma etiqueta secundária <n>, indicando a propriedade de referencialidade do adjectivo. Os dependentes serão, no entanto, de natureza nominal e o sintagma será também, por isso, nominal:
CP574-1 Portugal, com 6,7 por cento dos pobres da CEE.
A1
UTT:np
=H:prop('Portugal' M S) Portugal
=,
=N<PRED:pp
==H:prp('com') com
==P<:np
===>N:num('6,7' <card> M P) 6,7
===H:n('por_cento' M P) por_cento
===N<:pp
====H:prp('de' <sam->) de
====P<:np
=====>N:art('o' <-sam> <artd> M P) os
=====H:adj('pobre' <n> M P) pobres
=====N<:pp
======H:prp('de' <sam->) de
======P<:np
=======>N:art('o' <-sam> <artd> F S) a
=======H:prop('CEE' F S) CEE
=.
No entanto, nem sempre é fácil determinar quais os adjectivos que são usados com propriedades de referencialidade, especialmente quando estes co-ocorrem com outros adjectivos, como se pode observar pelos exemplos a seguir:
CF108-6 Nós, motoristas, pais e jovens brasileiros, somos os piores inimigos de nós mesmos.
CP491-1 O Concurso de Dança de Salão para a Terceira Idade é outro projecto destinado aos idosos sintrenses, que … levará a diversas colectividades locais todos os que queiram concorrer ou simplesmente trocar uns passos de dança.
Ainda não existe um sistema que permita determinar sistematicamente o núcleo e os dependentes, mas parece existir uma preferência, em termos de ordem de palavras em português, por considerar como núcleos as palavras que ocorrem primeiro num sintagma (excluindo as classes como determinantes) e como dependentes os que seguem essa palavra, essencialmente quando pertencem à classe do adjectivo.
Um caso semelhante é o uso de adjectivos como advérbios como no seguinte exemplo:
CP778-9 Lojas só de queijos são comuns em Paris e uma experiência turística interessante e barata é entrar numa delas e respirar fundo .
Nestes casos, mantém-se a classe de adjectivo adj e associa-se a etiqueta secundária <adv>.
Incluem-se também na classe de adjectivos os numerais ordinais.Nestes casos associa-se a etiqueta secundária <num-ORD> e mantém-se a forma adj:
CF14-1 Para o terceiro réu, Alexandre Cardoso, 21, o «Topeira», o juiz determinou uma pena de 20 anos.
A1
STA:fcl
=ADVL:pp
==H:prp('para') Para
==P<:np
===>N:art('o' <artd> M S) o
===>N:adj('terceiro' <NUM-ord> M S) terceiro
===H:n('réu' M S) réu
…
Os numerais são a categoria gramatical correspondente aos números cardinais e fraccionáveis (ver 5.2.3. para descrição dos numerais ordinais). A etiqueta de forma é num, que vem acompanhada da etiqueta secundária <card> ou <numfract>. Os numerais podem apresentar funções sintácticas de núcleo (H) ou de dependente de outros sintagmas. O sintagma cujo núcleo é um numeral é um adjp:
CF30-2 Veículos de resgate estavam a apenas 500 metros do Aibus 300
A1
STA:fcl
=SUBJ:np
==H:n('veículo' M P) Veículos
==N<:pp
===H:prp('de') de
===P<:n('resgate' M S) resgate
=P:v-fin('estar' IMPF 3P IND) estavam
=SC:pp
==H:prp('a') a
==P<:np
===>N:adjp
====>A:adv('apenas') apenas
====H:num('500' <card> M P) 500
===H:n('metro' M P) metros
…
Os numerais podem estar presentes enquanto número ou por extenso (53 ou cinquenta e três).
CP947-2 Com cinquenta e três anos, dizia ele de si para si, portava-se como um garoto.
A1
STA:fcl
=ACC:fcl-
==PRED:pp
===H:prp('com') Com
===P<:np
====>N:num('cinquenta_e_três' <card> M P) cinquenta_e_três
Palavras como mil, milhões, bilhões, etc são analisadas como n e recebem a etiqueta secundária <num>, e as expressões numéricas que as contêm são analisadas separadamente:
CF79-3 A conta, paga pelo embaixador, ultrapassou US 1,4 mil (CR$ 1,8 milhão).
...
P:vp
MV:v-fin('ultrapassar' PS 3S IND) ultrapassou
ACC:np
=H:n('US$' <prop> M P) US$
=N<:np
==>N:num('1,4' <card> M P) 1,4
==H:n('mil' <card> <num> M P) mil
=(
=N<PRED:np
==H:n('CR$' M P) CR$
==N<:np
===>N:num('1,8' <card> M S) 1,8
===H:n('milhão' <card> <num> M S) milhão
=)
.
CP301-4 Em Rosmalen (500 mil dólares), na Holanda e também em relva, o vencedor foi o norte-americano Richey Reneberg, que bateu na final o francês Stéphane Simian por 6-4, 6-0.
A1
STA:fcl
ADVL:pp
=H:prp('em') Em
=P<:np
==H:prop('Rosmalen' M S) Rosmalen
==(
==N<PRED:np
===>N:np
====>A:num('500' <card> M P) 500
====H:n('mil' <card> <num> M P) mil
===H:n('dólar' M P) dólares
==)
Quando houver coordenação de numerais, como em "entre 300(mil) e 500 mil euros", consideramos a elipse do n mil no primeiro sintagma.
Locuções adverbiais e expressões numéricas: quando locuções adverbiais como mais_de/menos_de/cerca_de são empregadas com expressões numéricas que contêm palavras como mil, milhões, bilhões (que são etiquetados como n), a análise é feita como ilustra a frase abaixo, em que a locução mais de modifica o numeral 10, formando o adjp mais_de 10, que por sua vez modifica o n mil, formando o np [mais de 10] mil - e que, por fim, modifica o n km, formando mais_de 10 mil km.
ACC:np
=>N:np
==>N:adjp
===>A:adv('mais_de' <quant>) mais_de
===H:num('10' <card> M P) 10
==H:n('mil' <card> <num> M P) mil
=H:n('km' M P) km
Palavras como dobro, triplo, etc são analisadas como n, e recebem a etiqueta secundária <numfract>. Já meio, em expressões como "meio bolo", é analisado como um adj. Numerais ordinais como sétimo são etiquetados como adj e recebem a etiqueta secundária <NUM-ord>.
Inserem-se também na categoria de numerais os números de telefone e parciais/resultados desportivos, como se pode observar nos seguintes exemplos:
CF751-5 Informações pelo tel. 212-2051.
A1
UTT:np
=H:n('informação' F P) Informações
=N<:pp
==H:prp('por' <sam->) por
==P<:np
===>N:art('o' <-sam> <artd> M S) o
===H:n('tel.' M S) tel.
===N<:num('212-2051' M P) 212-2051
=.
CP74-1 ... na segunda metade da mesma década- excepção feita aos fabulosos 7-1 com que o Sporting venceu o Benfica na tarde de 14 de Dezembro de 1986, em Alvalade- os «encarnados» foram ganhando vantagem neste muito especial «campeonato» entre as equipas da Luz e de Alvalade.
…
=-
=ADVL:icl(<pcp>)
==SUBJ:n('excepção' F S) excepção
==P:v-pcp('fazer' F S) feita
==PIV:pp
===H:prp('a' <sam->) a
===P<:np
====>N:art('o' <-sam> <artd> M P) os
====>N:adj('fabuloso' M P) fabulosos
====H:num('7-1' <card> M P) 7-1
...
As datas são consideradas n, como referido na secção 5.2.1.2. sobre Entidades Mencionadas.
Há dois tipos de conjunções na Floresta: conjunção coordenativa (conj-c) e conjunção subordinativa (conj-s) (ver secção 11. para tratamento da coordenação em geral). As funções que apresentam são CO (coordenador) e SUB (subordinador). Os seguintes exemplos ilustram respectivamente conjunções coordenativas e subordinativas:
CP28-3 Os termos concretos da transacção não foram tornados públicos mas os analistas coincidem na interpretação deste negócio como mais um passo da Netscape para transformar a Internet num meio privilegiado de comunicação e informação à escala mundial.
A1
STA:cu
=CJT:fcl
==SUBJ:np
===>N:art('o' <artd> M P) Os
===H:n('termo' M P) termos
===N<:adj('concreto' M P) concretos
===N<:pp
====H:prp('de' <sam->) de
====P<:np
=====>N:art('o' <-sam> <artd> S) a
=====H:n('transacção' F S) transacção
==ADVL:adv('não') não
==P:vp
===AUX:v-fin('ser' PS 3P IND) foram
===MV:v-pcp('tornar' M P) tornados
==SC:adj('público' M P) públicos
=CO:conj-c('mas' <co-vfin> <co-fmc>) mas
=CJT:fcl
==SUBJ:np
===>N:art('o' <artd> M P) os
===H:n('analista' M P) analistas
==P:v-fin('coincidir' PR 3P IND) coincidem
==ADVL:pp
===H:prp('em' <sam->) em
===P<:np
====>N:art('o' <-sam> <artd> S) a
====H:n('interpretação' F S) interpretação
====N<:pp
=====H:prp('de' <sam->) de
=====P<:np
======>N:pron-det('este' <-sam> <dem> M S) este
======H:n('negócio' M S) negócio
======N<:acl
=======PRD:adv('como' <rel> <prp>) como
=======SUBJ:np
========>N:adjp
=========>A:adv('mais' <kc>) mais
=========H:num('um' <card> M S) um
========H:n('passo' M S) passo
...
========N<:pp
=========H:prp('para') para
=========P<:icl
==========P:v-inf('transformar') transformar
==========ACC:np
===========>N:art('o' <artd> F S) a
===========H:prop('Internet' F S) Internet
==========PIV:pp
===========H:prp('em' <sam->) em
===========P<:np
============>N:art('um' <-sam> <arti> M S) um
============H:n('meio' M S) meio
============N<:v-pcp('privilegiar' M S) privilegiado
============N<:pp
=============H:prp('de') de
=============P<:np
==============H:cu
===============CJT:n('comunicação' F S) comunicação
============= ==CO:conj-c('e' <co-prparg>) e
===============CJT:n('informação' F S) informação
...
CF8-3 Ninguém força sua escalação porque há quem escale o time no São Paulo.
A1
STA:fcl
=SUBJ:pron-indp('ninguém' M S) Ninguém
=P:v-fin('forçar' PR 3S IND) força
=ACC:np
==>N:pron-det('seu' <poss 3S> <si> F S) sua
==H:n('escalação' F S) escalação
=ADVL:fcl
==SUB:conj-s('porque') porque
==P:v-fin('haver' PR 3S IND) há
==ACC:fcl
===SUBJ:pron-indp('quem' <rel> M/F S) quem
===P:v-fin('escalar' PR 3S SUBJ) escale
===ACC:np
====>N:art('o' <artd> M S) o
====H:n('time' M S) time
===ADVL:pp
====H:prp('em' <sam->) em
====P<:np
=====>N:art('o' <-sam> <artd> M S) o
=====H:prop('São_Paulo' M S) São_Paulo
=.
As locuções coordenativas, frequentemente expressões multi palavras, têm a mesma função que as conjunções coordenativas (CO) mas são consideradas advérbios (adv). O seguinte exemplo ilustra uma locução coordenativa:
CP90-2 Os responsáveis desta junta, bem como os da autarquia, garantem que «este número está muito aquém da realidade».
A1
STA:fcl
=SUBJ:cu
==CJT:np
===>N:art('o' <artd> M P) Os
===H:adj('responsável' <n> M P) responsáveis
===N<:pp
====H:prp('de' <sam->) de
====P<:np
=====>N:pron-det('este' <-sam> <dem> F S) esta
=====H:n('junta' F S) junta
==,
==CO:adv('bem_como' ) bem_como
==CJT:np
===H:pron-det('o' <dem> M P) os
===N<:pp
====H:prp('de' <sam->) de
====P<:np
=====>N:art('o' <-sam> <artd> S) a
=====H:n('autarquia' F S) autarquia
=,
...
A presença e ausência de etiquetas secundárias (<kc>) coexistem presentemente no Bosque bem como a formação de expressões multi-palavra de locuções coordenativas:
CP572-4 «Não só desconhecemos os critérios para os convites à imprensa, como ignoramos quem vai e de que partidos, pois o PRD desapareceu da actual AR [ tinha um deputado na Comissão ] e o PCP e o CDS diminuíram a representação.
A1
STA:cu
=«
=CJT:fcl
==ADVL:advp
===>A:adv('não') Não
===H:adv('só') só
==P:v-fin('desconhecer' PR 1P IND) desconhecemos
==ACC:np
===>N:art('o' <artd> M P) os
===H:n('critério' M P) critérios
===N<:pp
====H:prp('para') para
====P<:np
=====>N:art('o' <artd> M P) os
=====H:n('convite' M P) convites
=====N<:pp
======H:prp('a' <sam->) a
======P<:np
=======>N:art('o' <-sam> <artd> F S) a
=======H:n('imprensa' F S) imprensa
=,
...
CP754-4 Não só as «memórias descritivas» dos seus projectos são, só por si, criativos textos sugerindo, com especial eficácia, uma multiplicidade de imagens a partir dos desenhos que apresenta, como a sua produção para a imprensa revela idêntica qualidade.
A1
STA:cu
=CO:adv('não_só' <kc>) Não_só
=CJT:fcl
==SUBJ:np
===>N:art('o' <artd> F P) as
===«
===H:n('memória' F P) memórias
===N<:adj('descritivo' F P) descritivas
===»
===N<:pp
====H:prp('de' <sam->) de
====P<:np
=====>N:art('o' <-sam> <artd> M P) os
=====>N:pron-det('seu' <poss 3S> M P) seus
=====H:n('projecto' M P) projectos
==P:v-fin('ser' PR 3P IND) são
==,
==ADVL:pp
===>A:adv('só') só
===H:pp('por_si') por_si
==,
==SC:np
===>N:adj('criativo' M P) criativos
===H:n('texto' M P) textos
...
Existem outras palavras que não sendo conjunções em forma, são-no em função. Normalmente estes casos correspondem a advérbios (adv), a que são associados a etiqueta secundária <kc> ou <ks>. Veja-se os seguintes exemplos:
CP239-2 Um investimento de 27 milhões de contos (mais seis milhões para aquisição de uma colecção própria) suportado por as arcas bascas apesar de a existência de 47 «partenaires» comerciais, é sinónimo do interesse que o governo de Euskadi, do Partido Nacionalista Basco (PNV), atribui ao evento.
A1
STA:fcl
=SUBJ:np
==>N:art('um' <arti> M S) Um
==H:n('investimento' M S) investimento
==N<:cu
===CJT:pp
====H:prp('de') de
====P<:np
=====>N:num('27' <card> M P) 27
=====H:n('milhão' M P) milhões
=====N<:pp
======H:prp('de') de
======P<:n('conto' M P) contos
===(
= ==CO:adv('mais' <kc>) mais
===CJT:np
====>N:num('seis' <card> M P) seis
====H:n('milhão' M P) milhões
====N<:pp
=====H:prp('para') para
=====P<:np
======H:n('aquisição' F S) aquisição
======N<:pp
=======H:prp('de') de
=======P<:np
========>N:art('um' <arti> F S) uma
========H:n('colecção' F S) colecção
========N<:adj('próprio' F S) própria
===)
...
CF174-1 A IRLF só aprova o aborto quando a gravidez coloca em risco a vida da mãe.
A1
STA:fcl
=SUBJ:np
==>N:art('o' <artd> F S) A
==H:prop('IRLF' F S) IRLF
=ADVL:adv('só') só
=P:v-fin('aprovar' PR 3S IND) aprova
=ACC:np
==>N:art('o' <artd> M S) o
==H:n('aborto' M S) aborto
=ADVL:fcl
==ADVL:adv('quando' <ks>) quando
==SUBJ:np
===>N:art('o' <artd> F S) a
===H:n('gravidez' F S) gravidez
==P:v-fin('colocar' PR 3S IND) coloca
==ADVL:pp
===H:prp('em') em
===P<:n('risco' M S) risco
==ACC:np
===>N:art('o' <artd> F S) a
===H:n('vida' F S) vida
===N<:pp
====H:prp('de' <sam->) de
====P<:np
=====>N:art('o' <-sam> <artd> F S) a
=====H:n('mãe' F S) mãe
=.
[1] A não ser a vírgula, a outra pontuação mencionada pode também separar frases. Ver Afonso e Marchi (2001a).
[2] Um caso semelhante é o que foi acima descrito: ministros da Defesa e das Relações Exteriores
| Página anterior Próxima página |