Acesso a corpos de português: Projecto AC/DC: corpo CHAVE

CHAVE : AC/DC : Linguateca
O corpus CHAVE contém textos jornalísticos dos jornais Público e Folha de São Paulo dos anos de 1994 e 1995. Este corpus foi criado no âmbito da participação da língua portuguesa no CLEF. Para citar a colecção CHAVE, use Santos & Rocha (2005) ou uma descrição geral do CLEF em Rocha & Santos (2007). Pode obter o corpus completo em formato texto requerendo-o nesta página.

Estrutura do corpo

Marcadores estruturais: DOC [documento], s [frase], CATEGORY (secção do jornal), AUTHOR (autor do texto), NE (lista de nomes próprios contidos no documento, usando a anotação do PALAVRAS).

Versão do corpo

Corpus CHAVE, criado a 11 de outubro de 2025, v. 11.4

Excerto do corpo


<DOC>
<DOCNO valor=FSP941101-001>
<DOCID valor=FSP941101-001>
<DATE valor=941101>
<TEXT>
<s> O país que o presidente eleito Fernando Henrique Cardoso encontrou na volta de sua viagem à Europa Oriental apresenta algumas diferenças
substanciais com relação àquele que havia deixado cerca de duas semanas antes . </s>
<s> E não são diferenças muito animadoras . </s>
<s> A inflação subiu <96>passou de 1,99% na segunda quadrissemana de outubro para 2,68% na terceira e está em ascensão, segundo a Fipe . </s>
<s> O compulsório sobre empréstimos causou espanto e decepção ao dificultar um aumento da produção, em vez de estimulá-lo . </s>
...

Dados quantitativos

Corpo CHAVE Número de formasNúmero de tipos
Unidades 127436563738517
Total de palavras 101444276737712
Palavras em minúscula 73920857231148
Palavras com inicial maiúscula12748110232601
Palavras todas em maiúsculas 86756927557
Números 126635530957
Palavras com números1041049357
Palavras mistas15825820098
Pontuação62609578

Número de unidades estruturais

Atributo Número
s 4761904
t 579101
p 2272725
mwe 1683156
data 210731
DOC 210731
CATEGORY 210731
EM 210731

Contabilização de multipalavras

Número de entidades Número de unidades
Nomes próprios 5486408 9581481
Locuções 1683156 3582911
Palavras gráficas 101444276 101444276
Palavras simples 88279884 88279884
Palavras 95449448 101444276

Distribuição por categoria gramatical

Categoria gramaticalExpressão de procura Número de palavrasPercentagem do corpo
Substantivos N|N[^U].* 20987358 23,77%
Verbos V.* 12975408 14,70%
Adjectivos ADJ.* 5918821 6,70%
Pronomes pessoais .*PERS.* 1485389 1,68%
Preposições PRP.* 17415803 19,73%
Conjunções K.* 3969413 4,50%
Advérbios ADV.* 4563588 5,17%
Determinantes .*DET.* 17736622 20,09%
Especificadores .*SPEC.* 1688367 1,91%
Numerais NUM.* 2306139 2,61%

Para informação sobre como foram obtidos este valores, consulte esta página

[ Exemplos | Atomização | Anotação | Corpos | Agradecimentos ]


Última atualização: 11 de Outubro de 2025
Perguntas, comentários e sugestões