Este subcorpus contém por agora 66150 unidades do Jornal do Brasil (brasileiro) e 57542 do Diário de Notícias (português), perfazendo 344 textos.
Estrutura do corpoO corpo está dividido em textos, assinalados pelo atributo texto; cada texto está dividido em parágrafos (atributo p) e frases (atributo s). Além disso, o CONDIVport2 contém os atributos posicionais variante (valores: PT, BR), id (valores: 1 a tN), tema, e fonte.
Versão do corpoCorpus CONDIV2, versão texto de 15 de maio de 2017, anotado a 6 de julho de 2024, v. 4.1Excerto do corpo<texto num=1 tema=ciencia-e-tecnologia data=13/02/2017 fonte=JB> <p> <s> Matéria publicada nesta segunda-feira (13) pelo The Guardian conta que cientistas descobriram níveis "extraordinários" de poluição tóxica no lugar mais remoto e inacessível do planeta - a fossa das Marianas*, localizadas a 10 quilômetros de profundidade no oceano Pacífico . </s> </p> ... Dados quantitativos
Número de unidades estruturais
Contabilização de multipalavras
Distribuição por categoria gramatical
Para informação sobre como foram obtidos este valores, consulte esta página |
[ Exemplos | Atomização | Anotação | Corpos | Agradecimentos ]