Acesso a corpos de português: Projecto AC/DC: corpo Marielle, presente!

Marielle, presente! : AC/DC : Linguateca
O corpus Marielle, presente! contém textos escritos por Marielle Franco, e textos escritos sobre ela. Veja-se esta página para uma defesa deste projeto.

Sobretudo em relação às notícias sobre a sua morte, pode haver muito material repetido.

Este corpo está ainda em construção.

Estrutura do corpo

O corpus contém as etiquetas texto (documento), t (titulo), p (parágrafo) e s (frase).

O atributo posicional fonte indica a que texto cada palavra pertence (ver lista das fontes).

Prevemos para breve uma classificação mais fina dos textos, assim como alguma limpeza do material.

Distribuição por tipo de texto

Versão do corpo

Corpus MARIELLE, criado a 13 de abril de 2020, v. 3.2

Excerto do corpo


<texto id=1 genero=noticia>
<t> Nações Unidas condenam assassinato de vereadora Marielle Franco </t>

<s frag> ONU/Violaine Martin </s>

<a> Porta-voz do Escritório dos Direitos Humanos, Liz Throssel. </a>

<data> 15 março 2018 </data>

<t> Direitos humanos </t>
<p>
<s> Integrante da Câmara Municipal do Rio de Janeiro, 38 anos, foi assassinada na noite de quarta-feira num ataque que também matou o motorista dela, Anderson Pedro Gomes, e deixou uma assessora ferida. </s>
...

Dados quantitativos

Corpo MARIELLE Número de formasNúmero de tipos
Unidades 50193226540
Total de palavras 40585126105
Palavras em minúscula 27481916214
Palavras com inicial maiúscula731165800
Palavras todas em maiúsculas 72491735
Números 5682401
Palavras com números425181
Palavras mistas1454168
Pontuação23554381

Número de unidades estruturais

Atributo Número
p 10285
s 20438
texto 624
t 0
mwe 4854

Contabilização de multipalavras

Número de entidades Número de unidades
Nomes próprios 30355 63490
Locuções 4854 10225
Palavras gráficas 405851 405851
Palavras simples 332136 332136
Palavras 367345 405851

Distribuição por categoria gramatical

Categoria gramaticalExpressão de procura Número de palavrasPercentagem do corpo
Substantivos N|N[^U].* 83708 25,20%
Verbos V.* 46022 13,86%
Adjectivos ADJ.* 23725 7,14%
Pronomes pessoais .*PERS.* 5092 1,53%
Preposições PRP.* 69465 20,91%
Conjunções K.* 16449 4,95%
Advérbios ADV.* 12563 3,78%
Determinantes .*DET.* 67150 20,22%
Especificadores .*SPEC.* 5934 1,79%
Numerais NUM.* 9354 2,82%

Para informação sobre como foram obtidos este valores, consulte esta página

[ Exemplos | Atomização | Anotação | Corpos | Agradecimentos ]


Última atualização: 13 de Abril de 2020
Perguntas, comentários e sugestões