Acesso a corpos de português: Projecto AC/DC: corpo CorTrad, lado português

CorTrad, lado português : AC/DC : Linguateca
O corpo CorTrad (parte portuguesa) é um corpo paralelo multiversão português-inglês desenvolvido numa parceria COMET-Linguateca, ver CorTrad.

Mais informação sobre o corpo pode ser obtida em Tagnin et al. (2009), Teixeira et al. (2012), e Santos et al. (2012).

Estrutura do corpo

O corpus tem informação de obra, autor, data, se é tradução ou original, nome dos tradutores, e classe [género: lit - literário, culin - culinária, culib - culinária brasileira, jorn - jornalístico]. Além disso está também dividido em s [frases].

Versão do corpo

Corpo CorTrad-port, criado a 20 de junho de 2025, v. 2.1

Excerto do corpo


<ua id=CULI_O1-2 tipo=1-1> <p par=1> A minha vida é cozinhar -- acho emocionante, intrigante, lindo, delicioso, divertido, relaxante e muito mais . </s> </ua>
<ua id=CULI_O1-3 tipo=1-1> Quando estou triste, eu faço um bolo e, quando estou feliz, eu faço vários . </s> </ua>
<ua id=CULI_O1-4 tipo=1-1> A paixão é tamanha que já contagiei muita gente que nem sonhava em pisar numa cozinha e que hoje ali se diverte . </s> </ua>
...

Dados quantitativos

Corpo CORTRAD-PORT Número de formasNúmero de tipos
Unidades 195245669885
Total de palavras 144896669794
Palavras em minúscula 110840144050
Palavras com inicial maiúscula13954515778
Palavras todas em maiúsculas 108351335
Números 219201107
Palavras com números342132
Palavras mistas1581272
Pontuação919138

Número de unidades estruturais

Atributo Número
ua 76177
p 18253
s 76163
mwe 24215
texto 1163
receita 312
ModoDeFazer 778
ingred 7701
ListaIngred 883
Coment 250
Class 340
parte 3
t 3090
tempo 312
Foto 43
titulo 369
obra 6

Contabilização de multipalavras

Número de entidades Número de unidades
Nomes próprios 85044 84813
Locuções 24215 51812
Palavras gráficas 1448966 1448966
Palavras simples 1312341 1312341
Palavras 1421600 1448966

Distribuição por categoria gramatical

Categoria gramaticalExpressão de procura Número de palavrasPercentagem do corpo
Substantivos N|N[^U].* 321816 24,52%
Verbos V.* 207637 15,82%
Adjectivos ADJ.* 87328 6,65%
Pronomes pessoais .*PERS.* 31350 2,39%
Preposições PRP.* 238700 18,19%
Conjunções K.* 66232 5,05%
Advérbios ADV.* 69838 5,32%
Determinantes .*DET.* 230132 17,54%
Especificadores .*SPEC.* 25337 1,93%
Numerais NUM.* 34062 2,60%

Para informação sobre como foram obtidos este valores, consulte esta página

[ Exemplos | Atomização | Anotação | Corpos | Agradecimentos ]


Última atualização: 20 de Junho de 2025
Perguntas, comentários e sugestões