O corpus foi criado usando mensagens em português não endereçadas, recebidas por elementos da equipa da Linguateca entre 10 de Agosto de 2001 e 24 de Janeiro de 2006.
Estrutura do corpoO corpus está dividido em mensagens, marcadas pelo atributo mens, com informação da dataVersão do corpoVersão do corpus de 15 de janeiro de 2006, anotado a 6 de julho de 2024, v. 8.1Excerto do corpo<mens dt=2001-08-10 sexta-feira 16:56> <assunto> FENET - FEIRAS NA INTERNET. </assunto> <autor> Aline [aline@fenet.com.br] </autor> <titulo> Caro Senhores, </titulo> <p> <s> Conforme poderão visualizar em nosso site: http://www.fenet.com.br , a FENET é um site de FEIRAS VIRTUAIS Comerciais e de Serviços . </s> <s> Dentre as FEIRAS DE SERVIÇOS ( entretenimento puro e simples ), já contamos com as: BADALAÇÃO, CARTÕES VIRTUAIS, CHAT, CINEMA, GIFS, HUMOR, JOGOS, SHOWS e TEATROS . </s> ... Dados quantitativos
Número de unidades estruturais
Contabilização de multipalavras
Distribuição por categoria gramatical
Para informação sobre como foram obtidos este valores, consulte esta página |
[ Exemplos | Atomização | Anotação | Corpos | Agradecimentos ]