Acesso a corpos de português: Projecto AC/DC: corpo Marielle, presente!

Marielle, presente! : AC/DC : Linguateca
O corpus Marielle, presente! contém textos escritos por Marielle Franco, e textos escritos sobre ela. Veja-se esta página para uma defesa deste projeto.

Sobretudo em relação às notícias sobre a sua morte, pode haver muito material repetido.

Este corpo está ainda em construção.

Estrutura do corpo

O corpus contém as etiquetas texto (documento), t (titulo), p (parágrafo) e s (frase).

O atributo posicional fonte indica a que texto cada palavra pertence (ver lista das fontes).

Prevemos para breve uma classificação mais fina dos textos, assim como alguma limpeza do material.

Distribuição por tipo de texto

Versão do corpo

Corpus MARIELLE, criado a 6 de julho de 2024, v. 5.1

Excerto do corpo


<texto id=1 genero=noticia>
<t> Nações Unidas condenam assassinato de vereadora Marielle Franco </t>

<s frag> ONU/Violaine Martin </s>

<a> Porta-voz do Escritório dos Direitos Humanos, Liz Throssel. </a>

<data> 15 março 2018 </data>

<t> Direitos humanos </t>
<p>
<s> Integrante da Câmara Municipal do Rio de Janeiro, 38 anos, foi assassinada na noite de quarta-feira num ataque que também matou o motorista dela, Anderson Pedro Gomes, e deixou uma assessora ferida. </s>
...

Dados quantitativos

Corpo MARIELLE Número de formasNúmero de tipos
Unidades 50603226464
Total de palavras 40983126063
Palavras em minúscula 27477916212
Palavras com inicial maiúscula733845831
Palavras todas em maiúsculas 72891680
Números 5705407
Palavras com números402168
Palavras mistas1057153
Pontuação23844379

Número de unidades estruturais

Atributo Número
p 10286
s 20440
texto 624
t 0
mwe 4797

Contabilização de multipalavras

Número de entidades Número de unidades
Nomes próprios 29291 63229
Locuções 4797 10095
Palavras gráficas 409831 409831
Palavras simples 336507 336507
Palavras 370595 409831

Distribuição por categoria gramatical

Categoria gramaticalExpressão de procura Número de palavrasPercentagem do corpo
Substantivos N|N[^U].* 84834 25,21%
Verbos V.* 46366 13,78%
Adjectivos ADJ.* 23547 7,00%
Pronomes pessoais .*PERS.* 5084 1,51%
Preposições PRP.* 69500 20,65%
Conjunções K.* 16124 4,79%
Advérbios ADV.* 12403 3,69%
Determinantes .*DET.* 66917 19,89%
Especificadores .*SPEC.* 6000 1,78%
Numerais NUM.* 8664 2,57%

Para informação sobre como foram obtidos este valores, consulte esta página

[ Exemplos | Atomização | Anotação | Corpos | Agradecimentos ]


Última atualização: 13 de Julho de 2024
Perguntas, comentários e sugestões