Projecto AC/DC: corpo CHAVE

AC/DC : Linguateca
O corpus CHAVE contém textos jornalísticos dos jornais Público e Folha de São Paulo dos anos de 1994 e 1995. Este corpus foi criado no âmbito da participação da língua portuguesa no CLEF.

Procurar:     

Resultado:
Concordância
Distribuição das formas (word)
Distribuição dos lemas (lema)
Distribuição da categoria gramatical (PoS) (pos)
Distribuição do tempo verbal e/ou do caso pronominal (temcagr)
Distribuição de pessoa e/ou número (pessnum)
Distribuição do género morfológico (gen)
Distribuição da função sintáctica (func)
Distribuição por variante do português (variante)
Distribuição por secção (sec)
Distribuição por documento (docid)
Distribuição por campo semântico (sema)
Distribuição por grupo (de cor, roupa, etc.) (grupo)
Opções
Resultados por ordem alfabética (só distribuições)
Ignorar maiúsculas/minúsculas (não admite parâmetros)
Amostra aleatória de linhas.

Tipo Jornalístico
Variante(s) PT BR
Tamanho (unidades) 123.9 milhões
Tamanho (palavras) 99.4 milhões

Página principal
Procure noutros corpos:
AmostRA-NILC ANCIB Avante! CD HAREM CETEMPúblico CHAVE CONDIVport CoNE DiaCLAV ECI-EBR ECI-EE ENPCPUB (parte em português) Floresta FrasesPB FrasesPP Museu da Pessoa Natura/Minho NILC/São Carlos todos juntos Vercial

Estrutura do corpo

Marcadores estruturais: DOC [documento], s [frase], CATEGORY (secção do jornal), AUTHOR (autor do texto), NE (lista de nomes próprios contidos no documento, usando a anotação do PALAVRAS).

Veja um excerto do corpo e informação adicional.

Exemplo de pesquisas

Procurar: Resultado:
a palavra inteirointeiroconcordância
palavras terminando em ístico ".*ístico" concordância
adjectivos antecedidos por uma preposição [pos="PRP"] [pos="ADJ"] concordância
formas do verbo reunir[lema="reunir"] concordância
substantivos modificados por muito[lema="muito"& pos="DET" & func=">N"] @[pos="N.*"] distribuição de lema

Dados quantitativos

Para informação sobre como foram obtidos este valores, consulte a página dos Corpos

Agradecimentos

Agradecemos ao PÚBLICO e à Folha de São Paulo a gentil autorização de disponibilização dos textos.

[ Exemplos | Atomização | Anotação | Corpos | Agradecimentos ]


Última actualização: 15 de Maio de 2012
Perguntas, comentários e sugestões