Professora Maria Helena Mira Mateus – Faculdade de Letras da Universidade de Lisboa/ILTEC
Bom dia. Agradeço muito o convite para fazer uma intervenção. Felizmente não houve problemas de comunicação e portanto aqui estou para, em nome do ILTEC, dizer algumas coisas que se nos ofereceram a partir da discussão que hoje aqui nos trás. Gostaria de começar a minha intervenção exprimindo o desejo de que este processo de discussão não termine hoje aqui. Há erros a corrigir e opiniões a considerar, pelo que não seria aceitável que a primeira manifestação pública deste debate coincidisse com o seu encerramento. Tenho a certeza que não vai suceder. Na floresta de textos que nasceu em torno do documento hoje em discussão está incluído um problema que diz respeito a conceitos de língua e sua variação e que originou a primeira parte desta intervenção. A língua portuguesa não é uma abstracção. Mas é constituída por tantos dialectos quantas as formas de falar que de região para região apresentam alguma variação entre si. Certos grupos de dialectos, que pertencem ao português falado em diferentes países, e por isso estão afastados espacialmente apresentando em conjunto diferenças mais evidentes em relação a outros grupos; esses certos grupos de dialectos constituem o que denominamos variedades. A variação das línguas verifica-se também entre grupos de falantes pertencentes a diversas classes sociais que têm os seus próprios sociolectos. Todos os dialectos e sociolectos pertencem à mesma língua, uma única, o português. Como sucede com qualquer língua, na formação e evolução do português, intervém o contacto com outras línguas em consequência de migrações, expansão imperial, colonização, relações com línguas mais expandidas em certos meios culturais, e presentemente, com línguas que servem o desenvolvimento tecnológico, nomeadamente o inglês. Trata-se de um fenómeno universal inerente à deriva das línguas. E que só não se verifica naquelas que são faladas por comunidades que vivem em inteiro isolamento. Uma língua natural possui diversos níveis de estruturação: fonético, morfológico, sintáctico, semântico, lexical. Níveis como o morfológico e o sintáctico mantêm a estabilidade do tecido linguístico. Outros níveis como o fonético e o lexical são mais permeáveis a influências estranhas. As importações resultantes do contacto de línguas verificam-se geralmente no nível do léxico e são normalmente integradas no funcionamento regular da fonologia e da sintaxe. Assim sucedeu com palavras como chapéu, guardar, constatar, cachecol, futebol, etc, etc, que se mantiveram na língua enquanto outras desapareceram. É assim que sucede com todos os organismos vivos. Nos campos sintáctico e morfológico, a utilização destas novas palavras não demonstra mais desvios do que os que se verificam em falantes do português, que como sabemos, escrevem e falam muitas vezes com desconhecimento das especificidades da língua. Não temos portanto que temer a entrada de palavras estrangeiras ligadas a novas realidades da vida actual. Sobretudo, não devemos imaginar que esse facto contribui para a morte da língua. Uma vez que a sua manutenção está ligada a muitos outros factores – a manutenção da língua, o principal dos quais é o de existirem comunidades que a utilizam na sua vida quotidiana, e através dela se relacionam com o mundo, o categorizam e dele se apropriam. Assim, o facto de em certas circunstâncias os falantes usarem um jargão particular -- reparem na palavra jargão, mas já integrada na morfologia -- ligado a um domínio específico, não constitui um perigo para a manutenção da língua na medida em que os mesmos falantes o não usam na sua vida diária. Apesar dessas influências, e da evolução própria de qualquer língua, existe sempre uma arquitectura regular conhecida pelo nome de gramática, que subjaz ao funcionamento de todos os dialectos e que é possível explicitar e formalizar. A par deste aspecto natural da língua, é possível levar a efeito uma política de língua, criando uma multiplicidade de instrumentos que facilitem a sua utilização pelos falantes e a sua difusão entre os não falantes -- dessa língua, é evidente. Uma consequência desta política é o prestígio acrescido da língua junto daqueles que a desconhecem e não possuem outros meios de a ela ter acesso. Mas uma política de língua do português, como do inglês ou de qualquer outra língua, implica evidentemente que se saiba que variedade se vai difundir, seja nos meios de comunicação, no ensino ou na construção de instrumentos tecnológicos. É necessário, portanto, restringir e seleccionar dentro da variação. É isto que se conhece normalmente por norma ou português padrão, no caso do português ou de qualquer outra língua padrão, e que respeita aos vários níveis linguísticos referidos, decorrendo essa selecção do estatuto social que é atribuído a um ou uns, determinado ou determinados dialectos ou sociolectos. Todos os falantes escolarizados têm consciência desse facto, que não oferece dúvidas nem exige grande discussão. O que nos traz aqui é precisamente a construção de instrumentos tecnológicos que sirvam a política da língua portuguesa. Essa construção de instrumentos insere-se no que se denomina, para todas as línguas, processamento da linguagem natural ou da língua natural. É uma área interdisciplinar, onde convergem muitas das ciências da cognição, com especial destaque, especial destaque o que não quer dizer que muitas outras aportações não sejam necessárias, com especial destaque para a linguística, a informática e a inteligência artificial. Sem um trabalho de base nestes três domínios não se pode construir uma aplicação a nenhuma língua. Os investigadores portugueses têm necessidade de desenvolver pesquisa nestas questões básicas, chame-se-lhe ou não investigação fundamental, e podem, como quaisquer outros, concorrer para o progresso da ciência nesses domínios, para o que necessitam indubitavelmente do apoio do Estado. Neste domínio se pode incluir, por exemplo, a construção de plataformas para a criação de gramáticas ou a construção de gramáticas informatizadas. A aplicação ao português insere-se na política da língua e compete, naturalmente, aos investigadores que se preocupam com a difusão e o conhecimento do português. Essa aplicação situa-se em diferentes níveis de sofisticação correspondendo, portanto, a diversos graus de dificuldade. Partindo dos mais simples, refira-se a chamada localização que facilita a utilização de programas, sobretudo de processamento de texto e outros, por falantes de diversas línguas, e portanto aumenta o mercado dos produtos. Esse tipo de "tradução", e eu ponho aqui uma aspa, deve ser financiada pela indústria que recebe directamente os benefícios. Neste particular, não se considera necessário nem vantajoso para os utilizadores criar uma linguagem de programação em português em substituição da habitualmente usada. Na construção de ferramentas que vão desde os correctores sintácticos à construção de gramáticas de síntese e geração, desde dicionários electrónicos de vários tipos, aos sistemas de tradução automática e aos sistemas de síntese e reconhecimento de fala, portanto na construção de ferramentas, situa-se o que deve ser desenvolvido por investigadores portugueses e que necessita de um apoio efectivo das instâncias governamentais, em percentagem diferente, conforme essas ferramentas sejam directamente incorporadas pelos programas comercializados ou exijam maior trabalho de pesquisa e uma integração mais complexa, evidentemente estamos a falar para... em Portugal, para os portugueses o que não quer dizer que para o tratamento da língua portuguesa outros falantes de português situados noutros ambientes e noutros países não tenham também que fazer o mesmo tipo de trabalho, mas estamos aqui, agora. No estado actual do conhecimento em Portugal, é absolutamente indispensável criar e manter equipas interdisciplinares que incluam, pelo menos, linguistas, informáticos e especialistas de inteligência artificial, evidentemente também especialistas de estatística, etc, à semelhança do que acontece nos grandes centros de referência da Europa, da América do Norte, do Japão. Talvez no futuro tenhamos investigadores que reunam diversas competências, e o curso de Engenharia da Linguagem e do Conhecimento da Universidade de Lisboa tem parcialmente esse objectivo. Mas o trabalho de equipa será sempre necessário. Aqui ocorre dizer que a formação de especialistas da área é uma necessidade urgente, para o que contribuiria de modo inegável o programa de doutoramento em processamento de língua natural, que em tempos foi esboçado mas não teve até agora concretização e, como muitas pessoas sabem , tem já uma proposta concreta feita a partir do ILTEC, por conversação com outras entidades, que nunca, realmente, se viu concretizado. Em todos estes domínios há ainda muito a fazer para preparar o terreno, embora já se possa iniciar um trabalho que aliás só se justifica se for de qualidade. Tendo presente a indispensabilidade da informação linguística, é absolutamente necessário realizar muito mais descrições linguísticas rigorosas e formalizadas em todos os níveis. Trabalho que pela sua amplitude se distingue da investigação exigida em linguística teórica, cujos objectivos são diferentes. Essas descrições permitirão construir dicionários legíveis por computador, e aqui ocorre dizer que não são simples digitalizações de dicionários em suporte papel nem necessitam da tradicional informação do significado. Os dicionários de sinónimos, terminologias anotadas, etiquetadores e desambiguadores de categorias morfológicas e sintácticas, gramáticas de síntese e de geração. Trata-se de ferramentas indispensáveis para qualquer sistema de correcção ortográfica e sintáctica, de tradução inteiramente automática ou apoiada por computador, de ensino por computador, de sistemas de extracção de resumos, enfim. A investigação linguística nestes domínios necessita de forte apoio das instâncias governamentais. Para o que se deve exigir que concretamente se proponham, para que esse apoio existe, exista, ou as instâncias governamentais, naturalmente, devem exigir que concretamente se proponham estes projectos com uma integração em ferramentas ou sistemas de processamento do português, isto é, que sejam preparados para posterior reutilização. O mesmo se poderá dizer dos instrumentos necessários à síntese da fala. E aqui existem, realmente, muitos instrumentos que é necessário ainda desenvolver, como conversores de símbolos, e alguns já estão... parcialmente desenvolvidos, como conversores de símbolos ortográficos, ou por exemplo, investigação experimental de parâmetros da entoação. Se obedecerem às condições que se indicaram, os produtos que se vierem a obter têm que possuir inegável qualidade, para tal é indispensável que sejam sujeitos a avaliação por entidades competentes; só deste modo faremos jus à conservação digna da língua como património de identificação cultural, repositório de memórias do passado e factor de projecção no futuro.