Utilizações de corpora
Este texto tem como objectivo sugerir algumas consultas, assim como alguns usos não triviais dos corpora do projecto AC/DC. Por outro lado, pretende indicar o leque de perguntas interessantes, que poderão dar mais ou menos trabalho a responder, para as quais os corpora podem contribuir.
Como tal, é uma página que virá a crescer sempre que algumas perguntas interessantes nos sejam feitas e nos pareça útil documentar outras vias.
Aprofundamento da aprendizagem da língua
A primeira e mais óbvia utilização de corpora é para aprender uma língua. Um falante nativo de outra língua que queira redigir
correctamente em português, ou mesmo apenas compreender exactamente
algo que leu (ou ouviu), pode usar um corpus para se inteirar dos
usos, dos significados, e das formas de expressão do português.
Alguns exemplos:
Não apenas características de itens lexicais mas também da sua disposição num texto, ou seja,
propriedades das combinações de palavras.
Outras perguntas podem ter a ver com a comparação com um sistema diferente (feitas por um falante nativo do outro sistema, para confirmar)
- Será que debate e debater são usados nos mesmos contextos que as
traduções padronizadas (Nr.) krangel e krangle?
- Será que depositar e (Nr.) deponere são sósias enganadores ("false friends")?
- Em que ocasiões é que (Ing.) report não se traduz por relatório?
É interessante notar que, embora um falante do português não se pergunte primariamente este tipo de questões, pode ter necessidade de se interrogar (e aos corpora) quando confrontado com perguntas desta índole dos seus alunos ou colegas estrangeiros, ou com a necessidade de corrigir textos produzidos por estes.
Lexicografia
Da mesma forma, um lexicógrafo pode (e deveria, na minha
opinião) recorrer a corpora para escolher e documentar as
palavras sobre as quais escreve, sob pena de fazer apenas
justiça à forma como ele próprio fala e às
palavras que popularam os dicionários das
gerações anteriores (e que têm tendência
para se imortalizar, não na língua, mas nas entradas dos
mesmos).
Senão, como seria possível actualizar os
dicionários com os novos sentidos e usos, não presentes no
Dicionário da Língua Portuguesa, 6.a edição, da Porto Editora (DLP6)
tais como
- aceder a informação
- partilharam a assunção
- aspirar o chão
- estúdio de televisão
- cartão de crédito
- seminário
- casa inteligente
- telemóvel
- servidor
- comércio electrónico
- invocar um programa
- submissão de propostas
Ou de palavras e expressões que entraram na língua mas não se encontram dicionarizadas (outra vez na mesma fonte)?
E não é garantido que palavras como
- susquir-se (prov.)
- palheirão
- palatina
- paisista
- entrança
- dedecorar
- espirar
- apanhia
sejam de facto conhecidas ou utilizadas por algum falante actual da língua (atestadas pelo DLP6). Seria interessante associar-lhes a etiqueta "caído em desuso"...
Gramática
Os corpora são ainda mais úteis para observar mudanças gramaticais, assim como propriedades ainda não identificadas.
- A expressão NP ser suposto + infinitivo entrou definitivamente na língua? (distribuição de ser suposto/a/os/as)
- Passou a dizer-se ir de encontro a em vez de ao encontro de? (distribuição de ir X encontro)
- Os portugueses estão a perder a distinção reflexo / não reflexo, utilizando consigo em vez de com ele?
- Ainda é utilizado o auxiliar haver nos tempos compostos? Ou havia feito passou definitivamente a tinha feito?
- Quais são as diferenças entre chamar -lhe / chamá-lo / chamá-lo de?
- Em que casos se utiliza ver cujo objecto são orações infinitivas pessoais?
- Há diferenças sintácticas entre queimar-se com o sentido de bronzear e o mesmo verbo significando sofrer queimaduras?
- Em que casos se usa rir reflexivamente?
Semântica lexical
É possível distinguir, através das suas colocações, os sentidos
de:
- passador
- vírus
- sede
- heroína
Pragmática
- A palavra prometedor é um indicador de que o futuro se encarregou de desmentir / quebrar a promessa? (concordância no CETEMPúblico)
- Em que contextos se usa esposa por oposição a mulher? (distribuição no CETEMPúblico)
- Os seus passou a vossos; lhe(s) passou a vos; o pronome de segunda pessoa do plural voltou e é correntemente empregue com vocês?
Sociologia/sociopolítica
Tradução
O uso de corpora paralelos (e de comparáveis), é de uma utilidade extrema para um tradutor.
- Como se traduz (Ing.) merchantibility?
- Mãos na massa (distribuição no CETEMPúblico) é uma boa tradução de (Ing.) hands on?
- Como se traduz uma "pilha" de nomes de inglês para português?
(ex. CD track maintenance manual organization)
- Como se traduz uma "pilha" de aspectualizadores de português para inglês?
(ex. andar a deixar de pôr-se a gritar )
- Como se traduz uma palavra composta de norueguês para português?
(ex. kulturminnesti cultura-memória-caminho/atalho)
- Como é que se traduz (ing.) brought up, climb down para português?
- Como é que se traduz poisar, passar o tempo a para inglês?
- Como se traduz o PPC português, ou o aspectualizador andar a para inglês?
Diana Santos
Última actualização: 7 de Outubro de 2003.
Perguntas, comentários e sugestões