Desde 2000, a anotação dos corpos tem sido feita automaticamente pelo PALAVRAS de Eckhard Bick, e convertida para o "formato AC/DC", descrito pormenorizadamente na página de Anotação.
Uma descrição quantitativa inicial dos corpos servidos presentemente pelo AC/DC encontra-se na tabela abaixo. Clique num dos corpos para o interrogar. Para cada corpo, pode pedir concordâncias, distribuição e frequências simples e complexas, veja alguns exemplos. (Ao longo do tempo, fomos desenvolvendo uma série de serviços especializados para consultar os corpos de forma mais complexa.) Se é a primeira vez que visita o AC/DC e quer apenas experimentar, procure no corpo Vercial. Veja também a nossa PJR: lista de perguntas já respondidas.
Corpo | Tamanho (unidades) | Tamanho (palavras) | Tamanho (frases) | Variante(s) | Breve descrição |
---|---|---|---|---|---|
AmostRA-NILC | 128.517 | 99.267 | 4.965 | BR | AmostRA-NILC |
ANCIB | 1.698.148 | 1.257.785 | 83.504 | BR | Correio electrónico correspondente ao tráfego na lista ANCIB |
Avante! | 7.790.515 | 6.611.270 | 193.107 | PT | Semanário político Avante!, 1997-2002 |
Corpus Brasileiro | 1.074.930.997 | 908.625.706 | 41.252.530 | BR | Corpus Brasileiro, um bilhão (mil milhões) de palavras de português do Brasil de vários géneros |
CD HAREM | 290.001 | 225.766 | 12.558 | PT BR | Colecção dourada do HAREM |
CETEMPúblico | 239.113.359 | 195.231.421 | 7.017.260 | PT | Jornal PÚBLICO, dividido em extractos, 1991-1998 |
CHAVE | 127.881.425 | 101.324.906 | 4.762.290 | PT BR | Jornais PÚBLICO e Folha de São Paulo, 1994-1995 |
Ciência Viva | 805.307 | 663.487 | 27.270 | PT | Textos escritos sobre ciência em Portugal |
Colonia | 6.965.290 | 5.196.107 | 299.171 | PT BR | Obras dos séculos XVI a XX |
CONDIVport | 7.200.795 | 5.627.261 | 301.077 | PT BR | Jornais desportivos e revistas de moda e saúde |
CONDIVport2 | 212.075 | 175.277 | 6.533 | PT BR | Jornais diários |
CoNE | 921.366 | 681.377 | 31.563 | PT BR | Mensagens de correio electrónico não-endereçadas |
C-Oral-Brasil | 439.519 | 267.102 | 30.634 | BR | C-Oral-Brasil, português brasileiro oral informal |
CORDIAL-SIN | 1.494.736 | 857.066 | 98.010 | PT | Textos orais transcritos correspondendo a entrevistas em Portugal |
CorTrad, lado português | 1.739.029 | 1.307.745 | 65.370 | BR | Obras traduzidas de ou para o inglês |
DHBB | 16.096.075 | 14.177.792 | 461.808 | BR | Textos escritos sobre políticos brasileiros |
DiaCLAV | 7.854.974 | 6.701.348 | 210.373 | PT | Diário de Coimbra, Diário de Leiria, Diário de Aveiro, Viseu Diário |
Diáspora TL-PT | 27.409 | 21.908 | 1.035 | TL | Diáspora TL-PT, entrevistas a timorenses em Portugal |
DisPR | 223.610 | 187.497 | 7.137 | PT | Discursos presidenciais |
ECI-EBR | 924.904 | 728.951 | 44.381 | BR | Texto do corpo Borba-Ramsey, compilado pelo ECI |
ECI-EE | 30.277 | 25.779 | 789 | PT | Texto de chamada do programa europeu ESPRIT |
ENPCPUB (parte em português) | 92.679 | 72.798 | 4.371 | PT BR | Literatura traduzida do inglês proveniente do ENPC |
Floresta | 5.815.359 | 4.779.248 | 257.017 | PT BR | Floresta Sintá(c)tica |
FrasesPB | 23.259 | 19.185 | 652 | BR | Frases em português do Brasil |
FrasesPP | 20.030 | 16.266 | 594 | PT | Frases em português de Portugal |
Mariano Gago | 693.884 | 569.843 | 22.931 | PT | Textos sobre e de José Mariano Gago |
LeMe | 3.496.795 | 2.581.509 | 178.686 | PT | Bulas de medicamentos |
Literateca | 52.236.915 | 37.469.052 | 2.317.725 | PT BR | Textos literários lusófonos |
Marielle, presente! | 506.032 | 409.831 | 20.444 | BR | Textos de e sobre Marielle Franco |
Moçambula | 69.469 | 59.038 | 2.285 | MO | Textos de leitores de jornais moçambicanos |
Museu da Pessoa | 1.847.292 | 1.431.277 | 93.466 | PT BR | Entrevistas realizadas pelo Museu da Pessoa |
Natura/Minho | 2.255.442 | 1.800.223 | 70.277 | PT | Jornal regional Diário do Minho, antes da revisão |
NOBRE | 12.290.964 | 8.960.605 | 511.308 | PT | Obras portuguesas |
OBras | 14.626.228 | 10.369.863 | 639.986 | BR | Obras brasileiras |
PANTERA, lado português | 939.091 | 636.189 | 43.240 | todas | Obras traduzidas de ou para o norueguês |
P'lo Norte | 52.751 | 41.226 | 2.381 | PT | Blogues escritos por portugueses sobre a Noruega |
Português Falado - Documentos Autênticos | 148.582 | 107.215 | 7.569 | todas | Textos orais transcritos (1995-1997) |
ReLi | 157.560 | 128.784 | 7.231 | BR | ReLi, corpo de resenhas de livros |
NILC/São Carlos | 46.194.786 | 35.145.895 | 2.148.320 | BR | Texto do corpo NILC, contendo maioritariamente texto jornalístico, mas também cartas comerciais e textos didácticos |
todos juntos | 1.518.927.964 | 1.261.058.299 | 56.970.430 | todas | Todos os corpos juntos |
Tycho Brahe | 4.220.057 | 3.341.892 | 135.842 | PT BR | Texto do corpo Tycho Brahe |
Vercial | 21.025.649 | 14.872.077 | 995.834 | PT | Clássicos da literatura portuguesa, séculos XVI a XX |
Total (incluindo repetições) | 3.182.409.116 | 2.633.865.133 | 119.341.954 | todas | todos os corpos |
Para uma contabilização mais detalhada de todos os corpos, veja a página dos Corpos.
[ Anotação | Atomização | Corpos | Exemplos | Agradecimentos ]