Acesso a corpos de português: Projecto AC/DC: corpo ReLi

ReLi : AC/DC : Linguateca
O corpus ReLi é um corpo de 1601 resenhas de treze livros (de sete autores diferentes), compiladas de um sítio brasileiro de resenhas de livros, pela PUC-Rio, e acessível daqui. Essas resenhas foram anotadas em relação à opinião, ao objeto da opinião, e à sua polaridade, veja-se Freitas et al. (2012).

O corpus ReLi é composto de 7 arquivos, com as resenhas das obras de cada autor. Foram manualmente marcadas as seguintes informações:

object - indica segmento alvo de opinião. É designado por OBJXX, onde XX é o identificador do objeto no escopo da resenha, sendo 00 o objeto implícito livro

opinion - indica segmento que expressa opinião sobre um OBJXX. Tem a forma opXXS, onde S={-,+} para indicar a polaridade da opinião e XX é o ponteiro para o objeto

polarity - indica frase com opinião. Pode assumir os valores + e -.

Como citar o corpus ReLi: Freitas, C.; Motta, E.; Milidiú, R.; Cesar, J. Vampiro que brilha... rá! Desafios na anotação de opinião em um corpus de resenhas de livros. In: XI Encontro de Linguística de Corpus (ELC 2012), São Paulo, Brasil, 2012.

Estrutura do corpo

Marcadores posicionais: objeto, opiniao, polaridade Marcadores estruturais: livro [nome do livro resenhado], resenha, p [parágrafo], s [frase].

Distribuição por livro e autor

Versão do corpo

Corpus ReLi, versão do texto de Maio de 2013, anotado a 6 de julho de 2024, v. 8.1

Excerto do corpo


<resenha id="1" nota="5.0">
<s>Quem tem pavor só de ouvir o nome Capitães da Areia , por causa da Fuvest , ficaria admirado com quão bom é esse livro .</s>
<s>Jorge Amado escreve de forma envolvente , e nos faz sentir vontade de ajudar cada um dos personagens .</s>
<s>Li , reli , e vou ler mais uma vez , porque vale a pena !</s>
</resenha>
...

Dados quantitativos

Corpo RELI Número de formasNúmero de tipos
Unidades 15756014274
Total de palavras 12878413086
Palavras em minúscula 9233010697
Palavras com inicial maiúscula99631797
Palavras todas em maiúsculas 392264
Números 40574
Palavras com números44
Palavras mistas792420
Pontuação760861

Número de unidades estruturais

Atributo Número
mwe 2230
p 0
t 0
s 7230
livro 0
rev 0

Contabilização de multipalavras

Número de entidades Número de unidades
Nomes próprios 6540 4609
Locuções 2230 4840
Palavras gráficas 128784 128784
Palavras simples 119335 119335
Palavras 128105 128784

Distribuição por categoria gramatical

Categoria gramaticalExpressão de procura Número de palavrasPercentagem do corpo
Substantivos N|N[^U].* 24112 20,21%
Verbos V.* 21954 18,40%
Adjectivos ADJ.* 8606 7,21%
Pronomes pessoais .*PERS.* 4337 3,63%
Preposições PRP.* 17667 14,80%
Conjunções K.* 7031 5,89%
Advérbios ADV.* 9308 7,80%
Determinantes .*DET.* 21984 18,42%
Especificadores .*SPEC.* 3848 3,22%
Numerais NUM.* 1160 0,97%

Para informação sobre como foram obtidos este valores, consulte esta página

[ Exemplos | Atomização | Anotação | Corpos | Agradecimentos ]


Última atualização: 13 de Julho de 2024
Perguntas, comentários e sugestões