Projecto AC/DC: corpo CETEMPúblico (primeiro milhão)

AC/DC : Linguateca
Este corpus consiste no primeiro milhão de palavras (aproximadamente) do corpus CETEMPúblico.

Procurar:     

Resultado:
Concordância
Distribuição das formas
Distribuição dos lemas
Distribuição da categoria gramatical (PoS)
Distribuição do tempo verbal e/ou do caso pronominal
Distribuição de pessoa e/ou número
Distribuição do género morfológico
Distribuição da função sintáctica
Opções
Resultados por ordem alfabética (só distribuições)

Tipo Jornalístico
Variante(s) PT
Tamanho (unidades) 1.2 milhões
Tamanho (palavras) 912 mil

Página principal
Procure noutros corpos:
AmostRA-NILC ANCIB Avante! CD HAREM CETEMPúblico CETEMPúblico (primeiro milhão) CHAVE Clássicos LP/Porto Editora CONDIVport CoNE DiaCLAV ECI-EBR ECI-EE ENPCPUB (parte portuguesa) FrasesPB FrasesPP Museu da Pessoa Natura/Minho Natura/Público NILC/São Carlos Vercial

Estrutura do corpo

Marcadores estruturais: ext [identificador do extracto, com informação sobre secção e semestre], s [frase] t [título ou subtítulo] a [identificação do autor] li [elemento de lista] marca e sic [elemento a não analisar].

Veja um excerto do corpo e informação adicional.

Exemplo de pesquisas

Procurar: Resultado:
a palavra inteirointeiroconcordância
palavras terminando em ístico ".*ístico" concordância
adjectivos antecedidos por uma preposição [pos="PRP"] [pos="ADJ"] concordância
formas do verbo reunir[lema="reunir"] concordância
substantivos modificados por muito[lema="muito"& pos="DET" & func=">N"] @[pos="N.*"] distribuição de lema

Dados quantitativos

Para informação sobre como foram obtidos este valores, consulte a página dos Corpos

Agradecimentos

Estamos gratos ao Público pela gentil disponibilização dos textos.
Estamos especialmente gratos a José Vitor Malheiros, director da versão electrónica, sem o qual este corpus não existiria, e a Paulo Almeida pelo apoio técnico com os ficheiro electrónicos.

[ Exemplos | Atomização | Anotação | Corpos | Agradecimentos ]


Última actualização: 26 de Março de 2010
Perguntas, comentários e sugestões