Estrutura do corpo
O corpo está apenas dividido em frases (s).
Além disso, o Corpus Brasileiro contém os seguintes valores do atributo genero, em que o prefixo e indica português escrito e f português falado:
| genero | Gênero | Fonte |
| ei | Acadêmico | Artigos |
| ej | Acadêmico | Teses e dissertações |
| eq | Acadêmico | Anais de congresso |
| en | Cinema e TV | Roteiros |
| ee/ef | Educação | Diversos |
| ee/ef | Educação | Diversos |
| et | Enciclopédia | Wikipédia |
| fa | Esporte | Narração de jogos de futebol |
| ek | Informática | Manuais |
| ed | Jornalismo | Revistas |
| eg | Jornalismo | Jornais |
| eo | Jornalismo | Horóscopo |
| fe | Jornalismo | Entrevistas |
| em/ex | Legislação | Diversos |
| em/ex | Legislação | Diversos |
| eb | Literatura | Contos |
| ec | Literatura | Crônicas |
| eh/ew | Literatura | Variados |
| eh/ew | Literatura | Variados |
| eu | Literatura | Biografias |
| ea | Medicina | Bulas de remédio |
| ep | Política | Atas de assembléia legislativa |
| fb | Política | Debates de TV |
| fc | Política | Pronunciamentos do presidente |
| fd | Política | Sessões do congresso |
| el | Religião | Diversos |
| ev | Religião | Bíblia |
| er/es | Técnico | Relatórios e manuais diversos |
| er/es | Técnico | Relatórios e manuais diversos |
Como todos os corpos do AC/DC, o Corpus Brasileiro está também anotado sintacticamente pelo PALAVRAS, e contém alguma anotação semântica nos atributos sema e grupo.
| Género | Unidades |
| ea | 113.111 |
| eb | 61.168 |
| ec | 166.529 |
| ed | 497.106 |
| ee | 77.538.811 |
| ef | 2.267.630 |
| eg | 255.976.444 |
| eh | 1.375.882 |
| ei | 184.060.342 |
| ej | 270.776.515 |
| ek | 717.373 |
| el | 926.147 |
| em | 227.156 |
| en | 319.419 |
| eo | 4.308 |
| ep | 4.053.183 |
| eq | 6.965.045 |
| er | 5.722.902 |
| es | 6.655.524 |
| et | 53.690.513 |
| eu | 1.735.800 |
| ev | 2.659.377 |
| ew | 21.849.612 |
| ex | 26.872.755 |
| fa | 258.840 |
| fb | 65.844 |
| fc | 5.424.990 |
| fd | 86.907.734 |
| fe | 4.015.274 |
Versão do corpo
Corpus Brasileiro anotado, versão de 13 de junho de 2025, v. 9.0
Excerto do corpo
79051727 ea conseqüente conseqüente A 79051728 ea vazamento vazamento J 79051729 ea de de N 79051730 ea constituinte constituintes J 79051731 ea essencial essenciais A 79051732 ea de da S 79051733 ea célula célula J 79051734 ea de do S 79051735 ea fungo fungo J 79051736 ea . . 1
Dados quantitativos
| Corpo CBRAS
| Número de formas | Número de tipos |
| Unidades | 1134414006 | 5353468 |
| Total de palavras | 959172637 | 4864314 |
| Palavras em minúscula | 641537010 | 1243719 |
| Palavras com inicial maiúscula | 128133164 | 1055996 |
| Palavras todas em maiúsculas | 31919585 | 358094 |
| Números | 21027771 | 96554 |
| Palavras com números | 2324770 | 384830 |
| Palavras mistas | 4002933 | 363260 |
| Pontuação | 62977515 | 473143 |
Número de unidades estruturais
| Atributo | Número |
| p | 87 |
| s | 40986065 |
| mwe | 12934813 |
Contabilização de multipalavras
| Número de entidades | Número de unidades |
| Nomes próprios | 46355017 | 108606713 |
| Locuções | 12934813 | 27386268 |
| Palavras gráficas | 958936451 | 958936451 |
| Palavras simples | 822943470 | 822943470 |
| Palavras | 882233300 | 958936451 |
Distribuição por categoria gramatical
| Categoria gramatical | Expressão de procura | Número de palavras | Percentagem do corpo |
| Substantivos | N|N[^U].* | 219131354 | 26,63% |
| Verbos | V.* | 106700934 | 12,97% |
| Adjectivos | ADJ.* | 61361229 | 7,46% |
| Pronomes pessoais | .*PERS.* | 12094110 | 1,47% |
| Preposições | PRP.* | 155797306 | 18,93% |
| Conjunções | K.* | 37490570 | 4,56% |
| Advérbios | ADV.* | 32853240 | 3,99% |
| Determinantes | .*DET.* | 147778959 | 17,96% |
| Especificadores | .*SPEC.* | 11536306 | 1,40% |
| Numerais | NUM.* | 33522347 | 4,07% |
Para informação sobre como foram obtidos este valores, consulte esta página
|