Acesso a corpos de português: Projecto AC/DC: corpo Moçambula

Moçambula : AC/DC : Linguateca
O corpus Moçambula foi criado no âmbito da tese de mestrado de Torun Reite na Universidade de Oslo, Reite (2013), e contém cartas de leitores publicadas em 2012 em vários jornais moçambicanos.

Os jornais incluídos, e marcados no atributo posicional fonte são: Diário de Moçambique, Jornal A verdade, Notícias, O País e Savana.

TipoDescriçãoTamanho
DdM Diário de Moçambique 24.331
VerdJornal A verdade 11.253
Not Notícias 15.640
PaísO País 7.250
Sav Savana 2.719

Estrutura do corpo

Os textos foram transcritos manualmente ou obtidos através do sítio do jornal.

O corpo está dividido em mensagens/textos separados, marcadas pelo atributo texto, com informação do identificador do mesmo.

Os textos têm também os marcadores estruturais adicionais p [parágrafo] e s [frase].

Como atributos posicionais adicionais temos o fonte que indica em que jornal o texto foi publicado.

Versão do corpo

Corpo MOÇAMBULA, versão texto de novembro de 2012, anotado em 30 de julho de 2022, v. 4.4

Excerto do corpo


<texto notcl1405>
<p> <s> <t>Não matem o xitique</t> </s>
<p> <a> Óscar Fumo </a>
<p> <s> Sr. Director! </s>
<p> <s>Antes de tudo devo confessar que me apraz ver este texto publicado neste «nosso» jornal e do qual V. Excia é digno dirigente.</s>
<p> <s>Quando aos sábados, previamente programados, a minha mãe se enrola em pompa de traje, prepara-se ao pormenor e diz, despedindo-se dos filhos, «vou ao xitique», ela não vai fazer negócio. </s>
<s> Quando, invariavelmente, uma ou duas vezes ao ano, as mamanas amigas da minha mãe se reúnem na nossa casa, não as vejo a fazer negócio ou a operar crédito. </s>
<s> Para elas o micro-crédito é um som bárbaro que os filhos levaram a casa transportado em compêndios de economia usados na faculdade que elas, as mamanas sustentam com o seu suor - padrão dos recalques de gente humilde. </s>
<p> (...)
</texto>

Dados quantitativos

Corpo MOCAMBULA Número de formasNúmero de tipos
Unidades 6892210762
Total de palavras 5849810718
Palavras em minúscula 477148426
Palavras com inicial maiúscula45331421
Palavras todas em maiúsculas 267160
Números 400109
Palavras com números2014
Palavras mistas5928
Pontuação313044

Número de unidades estruturais

Atributo Número
p 133
s 2285
texto 94
mwe 1134

Contabilização de multipalavras

Número de entidades Número de unidades
Nomes próprios 1540 2657
Locuções 1134 2471
Palavras gráficas 58498 58498
Palavras simples 53370 53370
Palavras 56044 58498

Distribuição por categoria gramatical

Categoria gramaticalExpressão de procura Número de palavrasPercentagem do corpo
Substantivos N|N[^U].* 12604 23,62%
Verbos V.* 9041 16,94%
Adjectivos ADJ.* 3434 6,43%
Pronomes pessoais .*PERS.* 1408 2,64%
Preposições PRP.* 9764 18,29%
Conjunções K.* 3167 5,93%
Advérbios ADV.* 3352 6,28%
Determinantes .*DET.* 10648 19,95%
Especificadores .*SPEC.* 1530 2,87%
Numerais NUM.* 720 1,35%

Para informação sobre como foram obtidos este valores, consulte esta página

[ Exemplos | Atomização | Anotação | Corpos | Agradecimentos ]


Última atualização: 06 de Agosto de 2022
Perguntas, comentários e sugestões