Acesso a corpos de português: Projecto AC/DC: corpo PANTERA, lado português

PANTERA, lado português : AC/DC : Linguateca
O corpo PANTERA (Portuguese And Norwegian Texts for Education, Research and Acquisition of relevant knowledge) é um corpo paralelo português-norueguês, ver PANTERA.

Mais informação sobre o corpo pode ser obtida em Santos (2019)

Estrutura do corpo

O corpus está dividido em textos, e tem informação de data, data da tradução, variante e variante da tradução. Além disso está também dividido em s [frases].

Versão do corpo

Corpo pantera-port, criado a 5 de janeiro de 2026

Excerto do corpo


<ua id=JorAma51-1 tipo=1-1> portugues<p par=1> Saveiro </s> </ua>
<ua id=JorAma51-2 tipo=1-1> </p> <p par=2> O "Viajante sem Pôrto" corta a água que reflete as estrêlas . </s> </ua>
<ua id=JorAma51-3 tipo=1-1> Êle é todo pintado de vermelho e traz uma lanterna que espalha em tôrno uma luz amarela como a luz da Lua que apareceu nesse momento, saindo de uma nuvem . </s> </ua>
<ua id=JorAma51-4 tipo=1-1> Gritam de outro saveiro que atravessa a baía: </s> </ua>
...

Dados quantitativos

pantera-port Número de formasNúmero de tipos
Unidades 95092647304
Total de palavras 64272847288
Palavras em minúscula 50424533350
Palavras com inicial maiúscula615207376
Palavras todas em maiúsculas 7159336
Números 704236
Palavras com números10295
Palavras mistas236126
Pontuação588948

Número de unidades estruturais

Atributo Número
ua 45547
p 15630
s 46028
mwe 14413
texto 123
data 123
datatrad 123
variante 123
variantetrad 123
act-s 0
marca 67
fala 2190
indic 931
instr 0
star 0
foreign 1

Contabilização de multipalavras

Número de entidades Número de unidades
Nomes próprios 22182 22170
Locuções 14413 31081
Palavras gráficas 642728 642728
Palavras simples 589477 589477
Palavras 626072 642728

Distribuição por categoria gramatical

Categoria gramaticalExpressão de procura Número de palavrasPercentagem do corpo
Substantivos N|N[^U].* 116100 19,70%
Verbos V.* 118619 20,12%
Adjectivos ADJ.* 32819 5,57%
Pronomes pessoais .*PERS.* 31292 5,31%
Preposições PRP.* 91469 15,52%
Conjunções K.* 34734 5,89%
Advérbios ADV.* 52727 8,94%
Determinantes .*DET.* 105765 17,94%
Especificadores .*SPEC.* 17923 3,04%
Numerais NUM.* 5314 0,90%

Para informação sobre como foram obtidos este valores, consulte esta página

[ Exemplos | Atomização | Anotação | Corpos | Agradecimentos ]


Última atualização: 05 de Janeiro de 2026
Perguntas, comentários e sugestões