Desde 2000, a anotação dos corpos tem sido feita automaticamente pelo PALAVRAS de Eckhard Bick, e convertida para o "formato AC/DC", descrito pormenorizadamente na página de Anotação.
Uma descrição quantitativa inicial dos corpos servidos presentemente pelo AC/DC encontra-se na tabela abaixo. Clique num dos corpos para o interrogar. Para cada corpo, pode pedir concordâncias, distribuição e frequências simples e complexas, veja alguns exemplos. (Ao longo do tempo, fomos desenvolvendo uma série de serviços especializados para consultar os corpos de forma mais complexa.) Se é a primeira vez que visita o AC/DC e quer apenas experimentar, procure no corpo Vercial. Veja também a nossa PJR: lista de perguntas já respondidas.
| Corpo | Tamanho (unidades) | Tamanho (palavras) | Tamanho (frases) | Variante(s) | Breve descrição |
|---|---|---|---|---|---|
| AmostRA-NILC | 128.517 | 99.267 | 4.965 | BR | AmostRA-NILC |
| ANCIB | 1.698.148 | 1.257.785 | 83.504 | BR | Correio electrónico correspondente ao tráfego na lista ANCIB |
| Avante! | 7.782.139 | 6.615.426 | 193.107 | PT | Semanário político Avante!, 1997-2002 |
| Corpus Brasileiro | 1.134.414.006 | 959.172.637 | 43.044.013 | BR | Corpus Brasileiro, um bilhão (mil milhões) de palavras de português do Brasil de vários géneros |
| CD HAREM | 290.001 | 225.766 | 12.558 | PT BR | Colecção dourada do HAREM |
| CETEMPúblico | 239.113.359 | 195.231.421 | 7.017.260 | PT | Jornal PÚBLICO, dividido em extractos, 1991-1998 |
| CHAVE | 127.436.563 | 101.444.276 | 4.762.289 | PT BR | Jornais PÚBLICO e Folha de São Paulo, 1994-1995 |
| Ciência Viva | 805.307 | 663.487 | 27.270 | PT | Textos escritos sobre ciência em Portugal |
| Colonia | 6.969.041 | 5.200.777 | 299.171 | PT BR | Obras dos séculos XVI a XX |
| CONDIVport | 7.200.795 | 5.627.261 | 301.077 | PT BR | Jornais desportivos e revistas de moda e saúde |
| CONDIVport2 | 212.075 | 175.277 | 6.533 | PT BR | Jornais diários |
| CoNE | 921.366 | 681.377 | 31.563 | PT BR | Mensagens de correio electrónico não-endereçadas |
| C-Oral-Brasil | 439.519 | 267.102 | 30.634 | BR | C-Oral-Brasil, português brasileiro oral informal |
| CORDIAL-SIN | 1.494.736 | 857.066 | 98.010 | PT | Textos orais transcritos correspondendo a entrevistas em Portugal |
| CorpiRef | 0 | 0 | PT BR | Obras marcadas com personagens | |
| CorTrad, lado português | 1.952.456 | 1.448.966 | 76.246 | BR | Obras traduzidas de ou para o inglês |
| DHBB | 16.096.075 | 14.177.792 | 461.808 | BR | Textos escritos sobre políticos brasileiros |
| DiaCLAV | 7.849.857 | 6.710.948 | 210.373 | PT | Diário de Coimbra, Diário de Leiria, Diário de Aveiro, Viseu Diário |
| Diáspora TL-PT | 27.409 | 21.908 | 1.035 | TL | Diáspora TL-PT, entrevistas a timorenses em Portugal |
| DisPR | 330.043 | 275.592 | 10.647 | PT BR | Discursos presidenciais |
| ECI-EBR | 924.904 | 728.951 | 44.381 | BR | Texto do corpo Borba-Ramsey, compilado pelo ECI |
| ECI-EE | 30.277 | 25.779 | 789 | PT | Texto de chamada do programa europeu ESPRIT |
| ENPCPUB (parte em português) | 92.679 | 72.798 | 4.371 | PT BR | Literatura traduzida do inglês proveniente do ENPC |
| Floresta | 5.815.359 | 4.779.248 | 257.017 | PT BR | Floresta Sintá(c)tica |
| FrasesPB | 23.259 | 19.185 | 652 | BR | Frases em português do Brasil |
| FrasesPP | 20.030 | 16.266 | 594 | PT | Frases em português de Portugal |
| Mariano Gago | 693.884 | 569.843 | 22.931 | PT | Textos sobre e de José Mariano Gago |
| LeMe | 3.496.795 | 2.581.509 | 178.686 | PT | Bulas de medicamentos |
| Literateca | 52.029.118 | 37.334.190 | 2.309.543 | PT BR | Textos literários lusófonos |
| Marielle, presente! | 506.032 | 409.831 | 20.444 | BR | Textos de e sobre Marielle Franco |
| Moçambula | 69.469 | 59.038 | 2.285 | MO | Textos de leitores de jornais moçambicanos |
| Museu da Pessoa | 1.846.889 | 1.431.615 | 93.466 | PT BR | Entrevistas realizadas pelo Museu da Pessoa |
| Natura/Minho | 2.255.442 | 1.800.223 | 70.277 | PT | Jornal regional Diário do Minho, antes da revisão |
| NOBRE | 12.002.061 | 8.763.738 | 497.653 | PT | Obras portuguesas |
| OBras | 14.588.670 | 10.338.593 | 640.571 | BR | Obras brasileiras |
| PANTERA, lado português | 939.091 | 636.189 | 43.240 | todas | Obras traduzidas de ou para o norueguês |
| P'lo Norte | 52.751 | 41.226 | 2.381 | PT | Blogues escritos por portugueses sobre a Noruega |
| Português Falado - Documentos Autênticos | 148.582 | 107.215 | 7.569 | todas | Textos orais transcritos (1995-1997) |
| ReLi | 157.560 | 128.784 | 7.231 | BR | ReLi, corpo de resenhas de livros |
| NILC/São Carlos | 43.249.538 | 32.886.779 | 2.054.104 | BR | Texto do corpo NILC, contendo maioritariamente texto jornalístico, mas também cartas comerciais e textos didácticos |
| todos juntos | 1.518.927.964 | 1.261.058.299 | 56.970.430 | todas | Todos os corpos juntos |
| Tycho Brahe | 4.226.459 | 3.343.966 | 135.623 | PT BR | Texto do corpo Tycho Brahe |
| Vercial | 20.875.505 | 14.776.427 | 987.669 | PT | Clássicos da literatura portuguesa, séculos XVI a XX |
| Total (incluindo repetições) | 3.238.133.730 | 2.682.063.823 | 121.023.970 | todas | todos os corpos |
Para uma contabilização mais detalhada de todos os corpos, veja a página dos Corpos.
[ Anotação | Atomização | Corpos | Exemplos | Agradecimentos ]