Projecto AC/DC: corpo CETEMPúblico

AC/DC : Linguateca
O CETEMPúblico contém cerca de 190 milhões de palavras extraídas do diário PÚBLICO. Veja-se a página oficial do CETEMPúblico para mais informação.

Procurar:     

Resultado:
Concordância
Distribuição das formas
Distribuição dos lemas
Distribuição da categoria gramatical (PoS)
Distribuição do tempo verbal e/ou do caso pronominal
Distribuição de pessoa e/ou número
Distribuição do género morfológico
Distribuição da função sintáctica
Distribuição por secção
Distribuição por semestre
Distribuição por campo semântico
Distribuição por grupo (de cor, roupa, etc.)
Opções
Resultados por ordem alfabética (só distribuições)

Tipo Jornalístico
Variante(s) PT
Tamanho (unidades) 232.5 milhões
Tamanho (palavras) 189.6 milhões

Página principal
Procure noutros corpos:
AmostRA-NILC ANCIB Avante! CD HAREM CETEMPúblico CETEMPúblico (primeiro milhão) CHAVE Clássicos LP/Porto Editora CONDIVport CoNE DiaCLAV ECI-EBR ECI-EE ENPCPUB (parte portuguesa) FrasesPB FrasesPP Museu da Pessoa Natura/Minho Natura/Público NILC/São Carlos Vercial

Estrutura do corpo

Marcadores estruturais: ext [identificador do extracto, com informação sobre secção e semestre], s [frase], t [título ou subtítulo], a [identificação do autor], li [elemento de lista], marca.

Além da palavra, o corpus tem mais dois atributos posicionais, sem [semestre em que o texto foi escrito ou enviado para o jornal]: e sec [classificação da secção a que o texto pertencia]. Veja-se a discussão em Rocha & Santos (2000) sobre a forma da atribuição deste último.

Veja um excerto do corpo e informação adicional.

Exemplo de pesquisas

Procurar: Resultado:
a palavra inteirointeiroconcordância
palavras terminando em ístico ".*ístico" concordância
adjectivos antecedidos por uma preposição [pos="PRP"] [pos="ADJ"] concordância
formas do verbo reunir[lema="reunir"] concordância
substantivos modificados por muito[lema="muito"& pos="DET" & func=">N"] @[pos="N.*"] distribuição de lema

Dados quantitativos

Para informação sobre como foram obtidos este valores, consulte a página dos Corpos

Agradecimentos

Estamos gratos ao Público pela gentil disponibilização dos textos.
Estamos especialmente gratos a José Vitor Malheiros, director da versão electrónica, sem o qual este corpo não existiria, e a Paulo Almeida pelo apoio técnico com os ficheiros electrónicos.

[ Exemplos | Atomização | Anotação | Corpos | Agradecimentos ]


Última actualização: 26 de Março de 2010
Perguntas, comentários e sugestões