Projeto AC/DC: corpo CorpiRef

AC/DC : Linguateca
O CorpiRef é um corpo experimental para procurar personagens e as suas ações, usando -- por enquanto -- um processo manual de coreferência e anotação de sujeitos nulos. É um subconjunto do OBras, com as seguintes obras: Canaã, O Cortiço e Úrsula.

Procurar:     

Resultado:
Concordância
Distribuição das formas (word)
Distribuição dos lemas (lema)
Distribuição da categoria gramatical (PoS) (pos)
Distribuição do tempo verbal e/ou do caso pronominal (temcagr)
Distribuição de pessoa e/ou número (pessnum)
Distribuição do género morfológico (gen)
Distribuição da função sintáctica (func)
Distribuição por fonte (fonte)
Distribuição por campo semântico (sema)
Distribuição por grupo (de cor, roupa, etc.) (grupo)
Distribuição de papéis temáticos (papel)
Distribuição das dependências (dependente_de)
Distribuição de molduras (frames) (moldura)
Opções
Resultados por ordem alfabética (só distribuições)
Resultados em formato separado por ponto e vírgula
Ignorar maiúsculas/minúsculas (não admite parâmetros)
Fazer nuvem com limite de
Amostra aleatória de linhas.

Tipo Literário
Variante(s) PT BR
Tamanho (unidades) 0 mil
Tamanho (palavras) 0 mil

Carateres úteis: | { } [ ]
Página principal
Procure noutros corpos:
AmostRA-NILC ANCIB Avante! Corpus Brasileiro CD HAREM CETEMPúblico CHAVE Ciência Viva Colonia CONDIVport CONDIVport2 CoNE C-Oral-Brasil CORDIAL-SIN CorpiRef CorTrad, lado português DHBB DiaCLAV Diáspora TL-PT DisPR ECI-EBR ECI-EE ENPCPUB (parte em português) Floresta FrasesPB FrasesPP Mariano Gago LeMe Literateca Marielle, presente! Moçambula Museu da Pessoa Natura/Minho NOBRE OBras PANTERA, lado português P'lo Norte Português Falado - Documentos Autênticos ReLi NILC/São Carlos todos juntos Tycho Brahe Vercial

Estrutura do corpo

Utilizámos como marcadores estruturais para todas as obras obra (que contém o nome da obra, o tipo de obra e o código do autor), tituloobra, (o nome da obra), autor (o autor da obra), capituloy, u (uma unidade de texto: frase, verso, título ou indicação de cena, consoante o tipo de obra). As obras em prosa têm os marcadores estruturais adicionais p [parágrafo], t [título], s [frase], e poesia [partes em poesia].

Além disso, para todas as obras existem os atributos posicionais autor (valores e chave em lista de autores), obra (contendo o seu título), e data (que quando é desconhecida tem o valor "desc").

Veja um excerto do corpo e informação adicional.

Exemplo de pesquisas

Procurar: Resultado:
a personagem João Romão[sema="Pessoa:Personagem:JoaoRomao\-Cor"]concordância
palavras terminando em eiro ou eira ".*eir[oa]" concordância
adjectivos antecedidos por uma preposição [pos="PRP"] @[pos="ADJ"] distribuição dos lemas
formas do verbo pôr[lema="pôr"] concordância
substantivos modificados por muito[lema="muito" & func=">N"] @[pos="N.*"] distribuição dos lemas
palavras iniciando uma saudação<saudacao> [] concordância

Dados quantitativos

Para informação sobre como foram obtidos este valores, consulte a página dos Corpos

Agradecimentos

Este projeto foi originado por uma tese de mestrado na Universidade Estadual do Maranhão (UEMA).

[ Exemplos | Atomização | Anotação | Corpos | Agradecimentos ]


Última atualização: 27 de Julho de 2024
Perguntas, comentários e sugestões