Projeto AC/DC: corpo DisPR

AC/DC : Linguateca
O corpo DisPR é um corpo de discursos de Presidentes da República (portugueses) que contém o corpo PRAbril, e o corpo PRPosse. O PRAbril, criado por um grupo de investigadores do Centro de Estudos Humanísticos da Universidade do Minho (CEHUM) e do Centro de Linguística da Universidade do Porto (CLUP), reúne os discursos dos presidentes da República (portuguesa) nas comemorações do 25 de Abril desde 1977 até 2024. O corpo PRPosse, criado pela investigadora do CEHUM Micaela Aguiar, no âmbito da sua dissertação de doutoramento (SFRH/BD/117408/2016), reúne os discursos de tomada de posse dos presidentes nos cem anos da República Portuguesa (1911-2011), incluindo discursos recolhidos de publicações históricas antigas, como o de Sidónio Pais, em 1919, e o de Óscar Carmona, em 1926 e 1928.

Procurar:     

Resultado:
Concordância
Distribuição das formas (word)
Distribuição dos lemas (lema)
Distribuição da categoria gramatical (PoS) (pos)
Distribuição do tempo verbal e/ou do caso pronominal (temcagr)
Distribuição de pessoa e/ou número (pessnum)
Distribuição do género morfológico (gen)
Distribuição da função sintáctica (func)
Distribuição por campo semântico (sema)
Distribuição por grupo (de cor, roupa, etc.) (grupo)
Distribuição das dependências (dependente_de)
Distribuição por identificador do texto (id)
Distribuição pelo autor do texto (autores)
Distribuição por data (data)
Distribuição por corpo (corpo)
Opções
Resultados por ordem alfabética (só distribuições)
Resultados em formato separado por ponto e vírgula
Ignorar maiúsculas/minúsculas (não admite parâmetros)
Fazer nuvem com limite de
Amostra aleatória de linhas.

Tipo Fala planeada
Variante(s) PT
Tamanho (unidades) 223 mil
Tamanho (palavras) 187 mil

Carateres úteis: | { } [ ]
Página principal
Procure noutros corpos:
AmostRA-NILC ANCIB Avante! Corpus Brasileiro CD HAREM CETEMPúblico CHAVE Ciência Viva Colonia CONDIVport CONDIVport2 CoNE C-Oral-Brasil CORDIAL-SIN CorTrad, lado português DHBB DiaCLAV Diáspora TL-PT DisPR ECI-EBR ECI-EE ENPCPUB (parte em português) Floresta FrasesPB FrasesPP Mariano Gago LeMe Literateca Marielle, presente! Moçambula Museu da Pessoa Natura/Minho NOBRE OBras PANTERA, lado português P'lo Norte Português Falado - Documentos Autênticos ReLi NILC/São Carlos todos juntos Tycho Brahe Vercial

Estrutura do corpo

O corpus está dividido em discuros, marcados pelo atributo estrutural texto. Cada texto está dividido em parágrafos p e frases s. O atributo posicional corpo indica se o discurso vem do corpo PRAbril ou PRPosse. O atributo autor contém o nome do presidente, e o atributo ano o ano em que o discurso foi proferido (e redigido). Finalmente, o atributo id marca o identificador do discurso, um número inteiro (de 1 a 47 para o PRAbril).

Veja um excerto do corpo e informação adicional.

Exemplo de pesquisas

Procurar: Resultado:
a palavra "eleição"[lema="eleição"]Concordância
a palavra "povo" [word="povo"]Distribuição pelo autor do texto
os substantivos marcados com o pronome "nosso"[lema="nosso"] @[pos="N.*"]Distribuição pelos lemas
formas de palavras marcadas como denotando laços de família [sema=".*familia:lacos.*"]Distribuição das formas

Dados quantitativos

Para informação sobre como foram obtidos este valores, consulte a página dos Corpos

Agradecimentos

A equipa que criou o PRAbril agradece a Maria Aldina Marques a coordenação do projeto, assim como agradece à Linguateca a colaboração e disponibilidade para acolher e tratar o corpo.

A Linguateca agradece aos membros das duas equipas a autorização para disponibilizar os dois corpos.

[ Exemplos | Atomização | Anotação | Corpos | Agradecimentos ]


Última atualização: 27 de Julho de 2024
Perguntas, comentários e sugestões