Política de formação na área do processamento computacional da nossa língua

Um dos maiores problemas da área é a sua falta de reconhecimento e mesmo de identidade própria. Tanto as escolas de engenharia como as faculdades de letras não a reconhecem como uma área prioritária, e em nenhum dos casos conseguem neste momento ministrar educação apropriada em Portugal (embora já haja alguns sinais positivos: uma licenciatura em engenharia da linguagem e um curso de pós-graduação em linguística computacional, assim como várias cadeiras de especialização ministradas em mestrados de âmbito mais geral, veja-se http://www.linguateca.pt/ensino.html).

Contudo, ainda existem lacunas evidentes que é preciso colmatar a nível nacional (note-se que, não tendo acesso aos planos curriculares de todas as universidades do país, a minha visão aqui depende apenas da informação que os possíveis interessados me facultaram, e que pode portanto não ser exacta):

  1. Parece não existir formação apropriada a nível universitário de fonética aplicada ao processamento de fala.
  2. Apesar de grande parte do trabalho em processamento de linguagem natural ser baseado em métodos estatísticos, parece não existir qualquer cadeira (ou formação) nessa área em Portugal (cadeiras de introdução à estatística são obviamente insuficientes, embora necessárias). Contraste-se isso com a relativa abundância de ensino de métodos formais e lógicos...
  3. Existem muito poucas cadeiras de processamento digital de fala.

Um outro problema que nos parece importante é o da perspectiva que os investigadores têm do trabalho na área ser muito diferente, senão antagónica. Enquanto os engenheiros a vêem como uma área específica da informática (em que a matéria prima é a língua), os filólogos vêem-na como uma aplicação da linguística (cujo meio são os computadores). As diferentes linguagens e culturas dos dois ambientes tornam particularmente difícil uma verdadeira comunicação.

O ideal seria que existisse uma cadeira básica de PLN em todos os cursos de informática (com eventual seguimento de cadeiras mais avançadas, de opção) ou mesmo em todos os cursos de engenharia. Essencial seria também que na estrutura de todos os cursos de letras existisse uma ou mais cadeiras de informática, não só para familiarizar o aluno com os métodos e recursos existentes na sua área de humanidades, mas também para permitir a compreensão de como foram desenvolvidos.

Cada vez mais se observa uma base tecnológica comum, uma infraestrutura tecnológica e de comunicações que favorece a comunicação entre os vários ramos do saber. Seria por isso extremamente vantajoso que os vários departamentos (os de PLN nas escolas de engenharia e os de informática nas escolas de letras) colaborassem entre si de forma a partilhar currículos, professores e projectos. Alguns investigadores sugerem mesmo uma reorganização dos grupos de investigação de forma a levar a essa fertilização cruzada.

Além disso, parece-nos que deveria ser montado um curso (ou mesmo um laboratório) de processamento computacional de português na rede, visto que precisamente uma das áreas em que o processamento de linguagem natural tem aplicação evidente é na educação através da WWW. Para tal seria preciso um esforço por parte de todos os presentes intervenientes na área (esforço esse suportado financeiramente pelas entidades públicas), para criar os materiais e o conteúdo, disponibilizando dessa forma um pouco do seu saber e dos seus sistemas para que outros possam aprender com eles.


Voltar a Processamento computacional da língua portuguesa: documento de trabalho