Projeto AC/DC: corpo DisPR

AC/DC : Linguateca
O corpo DisPR é um corpo de discursos de Presidentes da República (portugueses e brasileiros) que contém o corpo PRAbril, o corpo PRPosse, e os discursos inaugurais do BrPoliCorpus. O PRAbril, criado por um grupo de investigadores do Centro de Estudos Humanísticos da Universidade do Minho (CEHUM) e do Centro de Linguística da Universidade do Porto (CLUP), reúne os discursos dos presidentes da República (portuguesa) nas comemorações do 25 de Abril desde 1977 até 2024. O corpo PRPosse, criado pela investigadora do CEHUM Micaela Aguiar, no âmbito da sua dissertação de doutoramento (SFRH/BD/117408/2016), reúne os discursos de tomada de posse dos presidentes nos cem anos da República Portuguesa (1911-2011), e vem sendo atualizado até à data presente. O BrPoliCorpus, criado por Rodrigo Esteves de Lima-Lopes, contém os discursos inaugurais de todos os presidentes brasileiros, de Deodoro da Fonseca em 1889 a Lula em 2023.

Procurar:     

Resultado:
Concordância
Distribuição das formas (word)
Distribuição dos lemas (lema)
Distribuição da categoria gramatical (PoS) (pos)
Distribuição do tempo verbal e/ou do caso pronominal (temcagr)
Distribuição de pessoa e/ou número (pessnum)
Distribuição do género morfológico (gen)
Distribuição da função sintáctica (func)
Distribuição por campo semântico (sema)
Distribuição por grupo (de cor, roupa, etc.) (grupo)
Distribuição de papéis temáticos (papel)
Distribuição de molduras (frames) (moldura)
Distribuição das dependências (dependente_de)
Distribuição por identificador do texto (id)
Distribuição pelo autor do texto (autores)
Distribuição por data (data)
Distribuição por corpo (corpo)
Opções
Resultados por ordem alfabética (só distribuições)
Resultados em formato separado por ponto e vírgula
Ignorar maiúsculas/minúsculas (não admite parâmetros)
Fazer nuvem com limite de
Amostra aleatória de linhas.

Tipo Fala planeada
Variante(s) PT BR
Tamanho (unidades) 330 mil
Tamanho (palavras) 275 mil

Carateres úteis: | { } [ ]
Página principal
Procure noutros corpos:
AmostRA-NILC ANCIB Avante! Corpus Brasileiro CD HAREM CETEMPúblico CHAVE Ciência Viva Colonia CONDIVport CONDIVport2 CoNE C-Oral-Brasil CORDIAL-SIN CorTrad, lado português DHBB DiaCLAV Diáspora TL-PT DisPR ECI-EBR ECI-EE ENPCPUB (parte em português) Floresta FrasesPB FrasesPP Mariano Gago LeMe Literateca Marielle, presente! Moçambula Museu da Pessoa Natura/Minho NOBRE OBras PANTERA, lado português P'lo Norte Português Falado - Documentos Autênticos ReLi NILC/São Carlos todos juntos Tycho Brahe Vercial

Estrutura do corpo

O corpus está dividido em discursos, marcados pelo atributo estrutural texto. Cada texto está dividido em parágrafos p e frases s. O atributo posicional corpo indica se o discurso vem do corpo PRAbril ou PRPosse. O atributo autor contém o nome do presidente, e o atributo ano o ano em que o discurso foi proferido (e redigido). Finalmente, o atributo id marca o identificador do discurso, um número inteiro (de 1 a 47 para o PRAbril, de 48 a 76 para o PRPosse, de 77 a 111 para o BrPoliCorpus).

Veja um excerto do corpo e informação adicional.

Exemplo de pesquisas

Se quiser consultar apenas um dos corpos, terá de indicar isso adicionando & corpo="NOME DO CORPO" às restantes características da procura (como no segundo exemplo na tabela seguinte, em que selecionamos dois dos corpos).
Procurar: Resultado:
a palavra "eleição"[lema="eleição"]Concordância
a palavra "povo" em discursos de posse [word="povo" & corpo="PRPosse|BrPoli"]Distribuição pelo autor do texto
os substantivos marcados com o pronome "nosso"[lema="nosso"] @[pos="N.*"]Distribuição pelos lemas
formas de palavras marcadas como denotando laços de família [sema=".*familia:lacos.*"]Distribuição das formas

Dados quantitativos

Para informação sobre como foram obtidos este valores, consulte a página dos Corpos

Agradecimentos

A equipa que criou o PRAbril agradece a Maria Aldina Marques a coordenação do projeto, assim como agradece à Linguateca a colaboração e disponibilidade para acolher e tratar o corpo.

O criador do BrPoliCorpus expressa seus agradecimentos a Fundação Alexandre von Humboldt, Capes e CNPq, que financiaram a iniciativa por meio de projetos de pesquisa individuais. The author of BrPoliCorpus expresses his gratitude to the Alexander von Humboldt Foundation, Capes, and CNPq, which funded the initiative through individual research projects.

A Linguateca agradece aos membros das três equipas a autorização para disponibilizar os três corpos.

[ Exemplos | Atomização | Anotação | Corpos | Agradecimentos ]


Última atualização: 27 de Julho de 2024
Perguntas, comentários e sugestões