Utilizações de corpora

Este texto tem como objectivo sugerir algumas consultas, assim como alguns usos não triviais dos corpora do projecto AC/DC. Por outro lado, pretende indicar o leque de perguntas interessantes, que poderão dar mais ou menos trabalho a responder, para as quais os corpora podem contribuir.

Como tal, é uma página que virá a crescer sempre que algumas perguntas interessantes nos sejam feitas e nos pareça útil documentar outras vias.

Aprofundamento da aprendizagem da língua

A primeira e mais óbvia utilização de corpora é para aprender uma língua. Um falante nativo de outra língua que queira redigir correctamente em português, ou mesmo apenas compreender exactamente algo que leu (ou ouviu), pode usar um corpus para se inteirar dos usos, dos significados, e das formas de expressão do português.

Alguns exemplos:

Não apenas características de itens lexicais mas também da sua disposição num texto, ou seja, propriedades das combinações de palavras.

Outras perguntas podem ter a ver com a comparação com um sistema diferente (feitas por um falante nativo do outro sistema, para confirmar)

É interessante notar que, embora um falante do português não se pergunte primariamente este tipo de questões, pode ter necessidade de se interrogar (e aos corpora) quando confrontado com perguntas desta índole dos seus alunos ou colegas estrangeiros, ou com a necessidade de corrigir textos produzidos por estes.

Lexicografia

Da mesma forma, um lexicógrafo pode (e deveria, na minha opinião) recorrer a corpora para escolher e documentar as palavras sobre as quais escreve, sob pena de fazer apenas justiça à forma como ele próprio fala e às palavras que popularam os dicionários das gerações anteriores (e que têm tendência para se imortalizar, não na língua, mas nas entradas dos mesmos).

Senão, como seria possível actualizar os dicionários com os novos sentidos e usos, não presentes no Dicionário da Língua Portuguesa, 6.a edição, da Porto Editora (DLP6) tais como

Ou de palavras e expressões que entraram na língua mas não se encontram dicionarizadas (outra vez na mesma fonte)? E não é garantido que palavras como sejam de facto conhecidas ou utilizadas por algum falante actual da língua (atestadas pelo DLP6). Seria interessante associar-lhes a etiqueta "caído em desuso"...

Gramática

Os corpora são ainda mais úteis para observar mudanças gramaticais, assim como propriedades ainda não identificadas.

Semântica lexical

É possível distinguir, através das suas colocações, os sentidos de:

Pragmática

Sociologia/sociopolítica

Tradução

O uso de corpora paralelos (e de comparáveis), é de uma utilidade extrema para um tradutor.
Diana Santos
Última actualização: 7 de Outubro de 2003.
Perguntas, comentários e sugestões