Sobre o CorTrad jornalístico divulgação científica

O CorTrad é um corpus aberto, sujeito a alterações. Clique em atualizações para saber mais.

A parte jornalística do CorTrad conta atualmente com textos da edições de 2001, 2002 e 2003 da Revista Pesquisa FAPESP, totalizando 20 números. As seções incluídas foram: Humanidades, Ciência, Tecnologia, Estratégias, Laboratório, Linha de Produção e Política de C & T. Veja uma tabela pormenorizada por assunto e gênero. A disponibilização do CorTrad na rede é um projeto conjunto entre o COMET e a Linguateca, usando o sistema DISPARA.

O CorTrad jornalístico contém 815.500 palavras em português e 890.281 em inglês.


Dados quantitativos

INFO*
Original
Tradução
publicada
Frequência das formas
txt
txt
Frequência dos lemas
txt
txt
Dados sobre palavras gráficas
html
html
Dados sobre a estrutura
html
html
Multipalavras
html
html
Distribuição por categoria gramatical
html
html
Frequência das formas com categoria N
txt
txt
Frequência das formas com categoria ADJ
txt
txt
Frequência das formas com categoria ADV
txt
txt
Frequência das formas com categoria V
txt
txt
Frequência das formas com categoria NUM
txt
txt
Frequência das formas com categoria GRAM
txt
txt
Frequência dos lemas com categoria N
txt
txt
Frequência dos lemas com categoria ADJ
txt
txt
Frequência dos lemas com categoria ADV
txt
txt
Frequência dos lemas com categoria V
txt
txt
Frequência dos lemas com categoria NUM
txt
txt
Frequência dos lemas com categoria GRAM
txt
txt

Sobre a forma de obtenção dos valores acima, consulte por ora a página do AC/DC com informação pormenorizada sobre os corpora.

Excerto do corpus

Original Tradução publicada
txt
txt

Comentários ou questões para a equipe do CorTrad
e-mail

Última atualização da página: 10 de junho de 2024
Última atualização do corpus ( CorTrad jornalístico, versão 5.0 ) : 12 de janeiro de 2025