Professora Teresa Lino - Faculdade de Ciências Sociais e Humanas da Universidade Nova de Lisboa
(…) da língua portuguesa. Não quero falar, ou não posso falar ou melhor, não devo falar só em meu nome próprio. Penso que, eu faço parte do Centro de Linguística da Universidade Nova de Lisboa. Neste momento há outras colegas que trabalham também em projectos em que a componente informática é muito importante, colegas que trabalham em corpora de várias épocas, corpora medieval, que se ocupam de etiquetagens automáticas de corpora. Outros colegas que trabalham noutros programas, em colaboração com outras instituições, mas penso que vou-me centrar sobretudo na minha própria experiência. Há vários colegas que estão na sala e podem eventualmente também intervir.
Penso que neste momento não é demais reforçar a importância da formação e da renovação dos nossos programas dos currícula das várias licenciaturas. Há as licenciaturas em linguística, há as licenciaturas em línguas e literaturas modernas, há outras licenciaturas na área das ciências sociais e humanas e penso que a investigação em processamento computacional da língua portuguesa passa em grande parte pela formação e pela sensibilização que nós podemos fazer logo no primeiro ano dos nossos alunos, uma vez que eles já chegam com uma pequena formação em informática, mas penso que é possível sensibilizarmos muito cedo … relativamente a critérios de constituição de corpora, relativamente às várias etiquetagens possíveis. É evidente que num primeiro ano não podemos ensinar tudo, mas podemos sensibilizar para alguns princípios teóricos e metodológicos que seria muito bom que esses princípios teóricos e metodológicos pudessem ser desenvolvidos noutras disciplinas no segundo, terceiro e ao nível dos cursos de doutoramento. Neste momento, este ano concretamente, estou a fazer essa experiência no primeiro ano da licenciatura em linguística, penso que tenho alguma experiência a nível de mestrado e concretamente também comecei este ano com mais regularidade o curso de doutoramento que intitulei Léxico e Informática.
Penso que para além da formação, precisamos com urgência também de apoios não apenas financeiros, mas também de alguns investigadores constantes que nos possam ajudar nestas tarefas importantíssimas relativamente à língua portuguesa. Não chegam os bolseiros que temos associados frequentemente a projectos, bolseiros de mestrado, bolseiros de doutoramento. Eles estão muitas vezes ocupados com as suas próprias investigações e portanto não é possível rentabilizar o seu trabalho relativamente aos projectos que temos entre mãos. Portanto, o ideal seria termos mais investigadores constantes. Por outro lado, penso que a linguística tem que estar mais aberta aos colegas da informática, da inteligência artificial, uma vez que frequentemente temos estado de costas voltadas uns para os outros.
Em 1995, no âmbito do Centro de Estudos Comparados que neste momento se reestruturou, criámos um serviço que queremos disponibilizar ao público, um serviço que é uma experiência em lexicografia telemática, lexicografia de especialidade e que compreende dicionários especializados, dicionários terminológicos associados a bases textuais específicas, bases textuais científicas e técnicas que estão associadas a esses mesmos dicionários especializados. Esse mesmo serviço contém também simultaneamente uma base de dados documental e portanto o utilizador ou os utilizadores, que podem ser não apenas linguistas, mas o público em geral, podem ser os tradutores, os industriais, os empresários e o grande público, podem oscilar entre um dicionário terminológico, uma base textual específica e uma base documental. Portanto, podem iniciar a sua pesquisa por uma ou outra base. Esse serviço está já registado e espero podermos abrir em breve, é o serviço NEOPORTERM e portanto, espero que muito em breve possamos abrir. Esses dicionários terminológicos registam também as variantes neológicas ou terminológicas relativas a fenómenos socio-terminológicos do português de Portugal ou relativas a variantes dos diferentes países de língua portuguesa. Portanto, variantes do Brasil, variantes do português de Moçambique, variantes do português da Guiné ou variantes de Angola. E portanto, temos que agradecer aos colaboradores, alguns dos quais velhos colegas, ou também outros que são alunos ou doutorandos neste momento e que já trabalham sobretudo em Moçambique. Esta experiência foi apresentada nas Jornadas Pan-latinas de Terminologia e essa mesma experiência permite-nos preparar já neste momento uma nova experiência que culminará com a constituição de uma estação de trabalho. A criação de uma estação de trabalho em que serão apresentados e disponibilizados ao público arquivos electrónicos de terminologias e corpora. O conceito de arquivo não é necessariamente idêntico ou igual ao conceito de corpora, mas, portanto, intitulámos Arquivos Electrónicos de Terminologias e Corpora. O conceito de estação de trabalho também pode ser entendido de várias maneiras, o conceito de estação de trabalho e a sua concretização implicam a implementação de um conjunto de pressupostos teóricos e metodológicos de carácter linguístico e informático, de infraestruturas tecnológicas de modo a tornar possível a consulta à distância via Internet. A estação de trabalho terá também a função de laboratório, disponível a investigadores e alunos portugueses e estrangeiros em níveis de formação avançada. A investigação tem uma dupla preocupação: teórica e empírica. A primeira é relativa à noção de dicionário nas suas especificidades lexicográficas, semânticas e lógicas. A segunda reconsidera o dicionário enquanto sistema hipertextual aberto a múltiplos usos segundo diferentes tipos de leituras. A redefinição dos conceitos de língua, sistema e de discursos permite-nos delimitar um conjunto de processos linguísticos aplicados à navegação na componente lexical e semântica da língua. Das constantes lexicais empiricamente descobertas é possível inferir diversos tipos de aprendizagem cognitiva que partem do dicionário considerado como o protótipo de hipertexto. Uma vez delimitados e balizados todos os objectos textuais e metatextuais, assim como as suas funções, o interface hipertextual constitui uma rede que possibilita o acesso às informações lexicográficas, semânticas, morfológicas, morfosintácticas, textuais ou outras, ao mesmo tempo que fornece ferramentas para organizar os percursos de leitura e descodificação. Pretendemos assim conceber um macrossistema hipertextual constituído por várias componentes que contêm cada uma delas um protótipo diferenciado de um dicionário com uma estrutura hipertextual específica. Neste macrossistema hipertextual, o dicionário electrónico, na medida em que implica formas de gestão de informação, constitui-se como um novo objecto textual, introduzindo uma problemática renovada sobre organização lexicográfica, os modelos semânticos de fenómenos linguísticos e sobre os usos cognitivos e programáticos que eles podem gerar. Os aspectos teóricos de carácter linguístico têm incidido sobre o conceito científico, sobre a sua génese, os traços conceptuais, a delimitação de uma área conceptual, entre outros. Por outro lado, a relação entre conceito e denominação tem estado sempre presente nas várias etapas desta investigação. Associados a estes aspectos, os domínios científicos em que trabalhamos têm-nos levado a reflectir sobre processos de neologia científica, de morfogénese do termo, sobre matrizes terminogénicas. Temos alguns CD-ROMs em preparação que incluem equivalentes noutras línguas, assim como as variantes da língua portuguesa. Tal facto implica uma delimitação no âmbito de vários sistemas conceptuais, assim como no seio de vários sistemas linguísticos. A definição de uma área conceptual implica frequentemente fenómenos de polissemia, de homonímia, de sinonímia, de fraseologia e de processos de equivalência semântica total ou parcial. A definição lexicográfica de especialidade é condição necessária mas não suficiente para que um termo seja um termo. Estas unidades lexicais estão directamente associadas a conceitos para cuja delimitação contribui a definição. No entanto, a definição não é uma representação fiel de um conceito, o sistema linguístico, através da definição, não tem meios para exprimir todos os traços conceptuais de um conceito. O conceito existe apenas na comunidade científica. A definição situa o conceito numa organização conceptual, delimitando as relações que estabelece com os outros conceitos do domínio. Neste momento, privilegiamos alguns domínios científicos que são de certo modo complementares. Alguns são complementares. Privilegiamos – penso que alguns colegas têm visto o atarefamento no gabinete – privilegiamos a medicina, a farmacologia clínica, a cartografia e a teledetecção, a poluição industrial. Privilegiamos também noutro projecto o ensino da língua e da terminologia médicas, que constitui um projecto piloto Sócrates. Privilegiamos também a terminologia bilingue das tecnologias e indústrias farmacêuticas no âmbito de um projecto da Fundação para a Ciência e a Tecnologia e Embaixada de França. Paralelamente, estamos a trabalhar, já desde há algum tempo, na selecção automática de termos e de neologismos. Assim, a estação de trabalho deverá ter várias funções: disponibilização de dicionários terminológicos, associados a bases textuais, textos científicos, a bases documentais e de imagens; a estação de trabalho será também um laboratório para análise de especificidades linguísticas, por exemplo de carácter de morfologia lexical; será também um laboratório em que se abordará a criação de neologismos científicos e técnicos ou funcionará como um serviço de consultadoria; a estação de trabalho será também um pólo dinamizador de trabalho terminológico e de colaboração com outras instituições que trabalham também em terminologia. Penso que somos poucos para tanta tarefa. E é esta a minha apresentação.