Sobretudo em relação às notícias sobre a sua morte, pode haver muito material repetido.
Este corpo está ainda em construção.
Estrutura do corpoO corpus contém as etiquetas texto (documento), t (titulo), p (parágrafo) e s (frase).O atributo posicional fonte indica a que texto cada palavra pertence (ver lista das fontes). Prevemos para breve uma classificação mais fina dos textos, assim como alguma limpeza do material. Distribuição por tipo de textoVersão do corpoCorpus MARIELLE, criado a 6 de julho de 2024, v. 5.1Excerto do corpo<texto id=1 genero=noticia> <t> Nações Unidas condenam assassinato de vereadora Marielle Franco </t> <s frag> ONU/Violaine Martin </s> <a> Porta-voz do Escritório dos Direitos Humanos, Liz Throssel. </a> <data> 15 março 2018 </data> <t> Direitos humanos </t> <p> <s> Integrante da Câmara Municipal do Rio de Janeiro, 38 anos, foi assassinada na noite de quarta-feira num ataque que também matou o motorista dela, Anderson Pedro Gomes, e deixou uma assessora ferida. </s> ... Dados quantitativos
Número de unidades estruturais
Contabilização de multipalavras
Distribuição por categoria gramatical
Para informação sobre como foram obtidos este valores, consulte esta página |
[ Exemplos | Atomização | Anotação | Corpos | Agradecimentos ]