Desde 2000, a anotação dos corpos tem sido feita automaticamente pelo PALAVRAS de Eckhard Bick, e convertida para o "formato AC/DC", descrito pormenorizadamente na página de Anotação.
Uma descrição quantitativa inicial dos corpos servidos presentemente pelo AC/DC encontra-se na tabela abaixo. Clique num dos corpos para o interrogar. Para cada corpo, pode pedir concordâncias, distribuição e frequências simples e complexas, veja alguns exemplos. (Ao longo do tempo, fomos desenvolvendo uma série de serviços especializados para consultar os corpos de forma mais complexa.) Se é a primeira vez que visita o AC/DC e quer apenas experimentar, procure no corpo Vercial. Veja também a nossa PJR: lista de perguntas já respondidas.
Corpo | Tamanho (unidades) | Tamanho (palavras) | Tamanho (frases) | Variante(s) | Breve descrição |
---|---|---|---|---|---|
AmostRA-NILC | 134.104 | 105.449 | 4.966 | BR | AmostRA-NILC |
ANCIB | 1.672.505 | 1.243.068 | 80.775 | BR | Correio electrónico correspondente ao tráfego na lista ANCIB |
Avante! | 7.760.345 | 6.504.283 | 222.852 | PT | Semanário político Avante!, 1997-2002 |
Corpus Brasileiro | 1.163.931.824 | 984.063.064 | 44.735.853 | BR | Corpus Brasileiro, um bilhão (mil milhões) de palavras de português do Brasil de vários géneros |
CD HAREM | 290.001 | 225.766 | 12.558 | PT BR | Colecção dourada do HAREM |
CETEMPúblico | 234.483.623 | 190.603.605 | 7.025.563 | PT | Jornal PÚBLICO, dividido em extractos, 1991-1998 |
CHAVE | 125.685.041 | 99.205.599 | 4.762.534 | PT BR | Jornais PÚBLICO e Folha de São Paulo, 1994-1995 |
Ciência Viva | 799.312 | 656.791 | 27.271 | PT | Textos escritos sobre ciência em Portugal |
Colonia | 6.710.600 | 5.034.438 | 284.823 | PT BR | Obras dos séculos XVI a XX |
CONDIVport | 7.038.154 | 5.485.346 | 297.837 | PT BR | Jornais desportivos e revistas de moda e saúde |
CONDIVport2 | 209.041 | 172.497 | 6.534 | PT BR | Jornais diários |
CoNE | 918.350 | 673.456 | 31.563 | PT BR | Mensagens de correio electrónico não-endereçadas |
C-Oral-Brasil | 435.234 | 263.632 | 30.634 | BR | C-Oral-Brasil, português brasileiro oral informal |
DHBB | 15.812.224 | 13.912.121 | 457.101 | BR | Textos escritos sobre políticos brasileiros |
DiaCLAV | 7.722.373 | 6.550.993 | 210.373 | PT | Diário de Coimbra, Diário de Leiria, Diário de Aveiro, Viseu Diário |
Diáspora TL-PT | 29.365 | 21.855 | 1.038 | TL | Diáspora TL-PT, entrevistas a timorenses em Portugal |
ECI-EBR | 917.787 | 723.533 | 44.384 | BR | Texto do corpo Borba-Ramsey, compilado pelo ECI |
ECI-EE | 32.133 | 27.130 | 839 | PT | Texto de chamada do programa europeu ESPRIT |
ENPCPUB (parte em português) | 93.164 | 72.374 | 4.371 | PT BR | Literatura traduzida do inglês proveniente do ENPC |
Floresta | 7.252.306 | 6.046.541 | 327.050 | PT BR | Floresta Sintá(c)tica |
FrasesPB | 23.178 | 19.141 | 652 | BR | Frases em português do Brasil |
FrasesPP | 20.222 | 16.236 | 676 | PT | Frases em português de Portugal |
Mariano Gago | 696.839 | 571.318 | 23.303 | PT | Textos sobre e de José Mariano Gago |
Literateca | 45.762.749 | 32.766.372 | 2.058.245 | PT BR | Textos literários lusófonos |
Marielle, presente! | 501.932 | 405.851 | 20.444 | BR | Textos de e sobre Marielle Franco |
Moçambula | 71.399 | 58.267 | 2.321 | MO | Textos de leitores de jornais moçambicanos |
Museu da Pessoa | 2.004.282 | 1.422.434 | 93.554 | PT BR | Entrevistas realizadas pelo Museu da Pessoa |
Natura/Minho | 2.208.211 | 1.748.644 | 69.099 | PT | Jornal regional Diário do Minho, antes da revisão |
NOBRE | 10.619.956 | 7.741.990 | 444.339 | PT | Obras portuguesas |
OBras | 9.787.108 | 6.868.239 | 444.441 | BR | Obras brasileiras |
PANTERA, lado português | 939.091 | 636.189 | 43.240 | todas | Obras traduzidas de ou para o norueguês |
P'lo Norte | 53.703 | 40.909 | 2.384 | PT | Blogues escritos por portugueses sobre a Noruega |
Português Falado - Documentos Autênticos | 102.222 | 63.352 | 4.735 | todas | Textos orais transcritos (1995-1997) |
ReLi | 188.882 | 153.002 | 8.392 | BR | ReLi, corpo de resenhas de livros |
NILC/São Carlos | 44.717.319 | 34.039.043 | 2.054.099 | BR | Texto do corpo NILC, contendo maioritariamente texto jornalístico, mas também cartas comerciais e textos didácticos |
todos juntos | 1.562.455.502 | 1.301.503.352 | 58.661.295 | todas | Todos os corpos juntos |
Tycho Brahe | 4.211.734 | 3.333.948 | 133.136 | PT BR | Texto do corpo Tycho Brahe |
Vercial | 20.983.941 | 14.813.346 | 999.455 | PT | Clássicos da literatura portuguesa, séculos XVI a XX |
Total (incluindo repetições) | 3.287.275.756 | 2.727.793.174 | 123.632.729 | todas | todos os corpos |
Para uma contabilização mais detalhada de todos os corpos, veja a página dos Corpos.
[ Anotação | Atomização | Corpos | Exemplos | Agradecimentos ]