Estas mensagens, incluindo como um dos destinatários a lista da APPIA, foram mandadas directamente para Diana Santos ou para projecto@informatics.sintef.no. As mensagens que as precederam poderão ser (provavelmente apenas parcialmente) consultadas no endereço a que será feita referência mais abaixo.
Esta página foi criada para reflectir a perspectiva do nosso projecto no sentido de ilustrar a ordem com que as várias informações nos foram chegando, e que é muito distinta da ordem cronológica da criação e divulgação parcial das mensagens.
Reiteramos aqui a nossa disponibilidade de publicar tudo o que for escrito sobre o assunto e a que os seus autores nos queiram dar acesso, com a data em que nos chegar.
Boa gente,
penso que esta discussao descambou.
No minimo acho que era eticamente correcto mandar estes mails `a Diana
(que nao pertence a APPIA)
Nao me parece ofensivo o ter um documento na rede chamado
"PLN da lingua portuguesa : UM DOCUMENTO DE TRABALHO"
em que se diz:
"Pretende-se que este documento seja o ponto de partida para uma
discussão alargada sobre o futuro do processamento computacional da língua
portuguesa"
e se pede para:
"Por favor envie comentários, contribuições e críticas para ..."
e nao ter consultado pessoalmente os 10 milhoes de portugueses
Penso que a existência e melhoramento deste tipo de documentos É UMA BOA
CAUSA. Estou certo que ainda se ira' a tempo de se contribuir (eu mandei duas
observações e nao fui preso)
Um abraco
J.Joao
--
--------------------------------------------------+------------------------+
_/_/ _/_/ _/_/ _/ _/_/ | |
_/ _/ _/ _/ _/_/ _/ _/ | J.Joao Dias de Almeida |
_/ _/ _/ _/ _/ _/ _/ _/ | Dept. de Informatica |
_/ _/ _/ _/ _/ _/ _/_/_/_/ _/ _/ | Univ. do Minho |
_/_/ _/ _/_/ _/_/ _/ _/ _/_/ | Campus de Gualtar |
--------------------------------------------------| 4700 Braga Portugal |
jj@di.uminho.pt http://www.di.uminho.pt/~jj | Fax=351 (0)53 604471 |
--------------------------------------------------+------------------------+
Data: 18 de Março de 1999jj@di.uminho.pt said: > No minimo acho que era eticamente correcto mandar estes mails `a > Diana (que nao pertence a APPIA) Meu caro, Agradeço a tua tentativa de me educar (mesmo que tardiamente), mas eu enviei a minha mensagem inicial a pessoas e à rede da APPIA de modo a incluir o mais possível quem estivesse próximo da área de PLN. Não fazia ideia de que a Diana Santos não estivesse na APPIAr, mas de qualquer modo isso não me preocupa, dado que eu também não soube directamente da mensagem dela sobre a existência do seu documento. A minha mensagem inicial era dirigida a quem pudesse estar interessado pelo assunto mas sem querer atingir os "10 milhões de portugueses" de que tu falas. > Nao me parece ofensivo o ter um documento na rede chamado > "PLN da lingua portuguesa : UM DOCUMENTO DE TRABALHO" em que se > diz: > "Pretende-se que este documento seja o ponto de partida para uma > > discussão alargada sobre o futuro do processamento computacional da > língua > portuguesa" e se pede para: > "Por favor envie comentários, contribuições e críticas para ..." > e nao ter consultado pessoalmente os 10 milhoes de portugueses Não se trata de ser ou não ofensivo: por mim, quem quiser que ponha o que quiser na rede (desde que não seja difamatório). O que está em causa é a aceitação que esse documento aparentemente está a ter por parte do Governo e as bases em que assenta. E, obviamente, não se trata de consultar "pessoalmente os 10 milhoes de portugueses": trata-se de consultar minimamente a comunidade interessada na área. Tive a surpresa de ver que a maior parte das pessoas que conheço com trabalho em PLN em Portugal não sabiam, ou estavam por fora, de todo este imbroglio. Claro que se reduzirmos a área a um nicho, reduziremos os interessados... no limite, ficam só os proponentes! > Penso que a existência e melhoramento deste tipo de documentos É UMA > BOA CAUSA. Estou certo que ainda se ira' a tempo de se contribuir (eu > mandei duas observações e nao fui preso) A existência desses documentos seria uma boa causa se a comunidade interessada na área tivesse tido oportunidade de colaborar na sua elaboração e se os pressupostos de base fossem aceitáveis. Ninguém que interveio nesta discussão está com medo de ser preso; quando muito o medo é de se ser tomado por parvo. Um abraço, Miguel PS: já agora teria sido interessante teres mandado a tua mensagem para TODOS os endereços das mensagens anteriores.
Miguel, Soube pelo mail do José João e pelo teu que está a haver uma discussão na lista da APPIA sobre o documento que escrevi e o projecto em que estou envolvida. Gostava muito que me mandassem o conteúdo dessa discussão, assim como autorização para o publicar na rede de forma a todos os possíveis interessados que não sejam membros da APPIA também possam dela aproveitar. Sobre o tom que me parece magoado por não teres sido contactado directamente, só me resta pedir desculpa porque de facto a minha intenção era não excluir ninguém. Pelo contrário, gostaria de obter o maior possível feedback sobre aquilo que escrevi. Às vezes é mais difícil do que pensas conseguir difundir uma mensagem quando não se está pessoalmente no país. Precisamente de forma a não privilegiar -- e daí excluir -- ninguém, fiquei-me pelo envio às listas internacionais e à lista do Forum-LP (que esperava que congregasse todas, ou pelo menos a grande maioria, das pessoas interessadas no processamento do português). Mais tarde quando o Forum-LP desapareceu servi-me dos endereços das pessoas que me tinham contactado directamente sobre o assunto, pedindo-lhes especificamente para redirigirem o pedido de feedback e contribuições ao maior número possível de pessoas. Visto que a reunião para discutir o que fazer em relação ao processamento computacional do português será no dia 17 de Abril, acho que ainda vamos a tempo. Um mês não é tarde demais para melhorar significativamente o documento, ou, como outros fizeram, para apresentar documentos alternativos. Quanto mais opiniões da comunidade científica de interessados na área, melhor. O único objectivo do documento que eu escrevi, aliás, é suscitar a discussão sobre alguns assuntos que me parecem importantes. As conclusões sobre como prosseguir, se bem percebi, é para sairem da discussão da comunidade, e não estão fixadas pelo que lá se encontra. O meu documento de trabalho não é mais do que uma achega para uma discussão. Gostava pois de afirmar publicamente que tenho a certeza que essa discussão será muito enriquecida com o teu contributo, e que a minha intenção era, ao pedir contribuições, não excluir ninguém. Diana ************************************************************************** Diana Santos Processamento computacional do português SINTEF Telecom and Informatics Tel. (directo) +47 22 06 73 12 Forskningsveien 1 Tel. +47 22 06 73 00 Box 124 Blindern Fax. +47 22 06 73 50 N-0314 Oslo Email: Diana.Santos@informatics.sintef.no Noruega http://www.portugues.mct.pt/ ************************************************************************** (...) > >PS: já agora teria sido interessante teres mandado a tua mensagem >para TODOS os endereços das mensagens anteriores. > > > Já agora agradecia que me facultassem a lista destes enderecos, também.
Serve esta para responder a várias mensagens anteriores. Três delas não foram distribuídas para todos os endereços acima: uma do José João Almeida sobre o facto da Diana Santos não estar na lista da APPIA e não estar a par da discussão, a minha resposta a essa, e uma da Diana Santos com o título "Pedido de acesso à discussão [...]". Para começar, continuo a considerar que os dois problemas que levantei são de facto pertinentes, e não são uma mera questão de intenções ou de processos. Os interessados terão que dizer se acham que 1) o dito "Processamento Computacional do Português" merece um tratamento a par dos grandes domínios; 2) o dito "Processamento Computacional do Português" merece um tratamento preferencial ao da área de PLN/Linguística Computacional/Engenharia da Linguagem; isto é, da área do processamento computacional das línguas. Quanto à primeira, a resposta "oficial" parece ser a de que se trata de um programa específico para uma área carenciada. Se é isso, então a minha opinião é a de que o título oficial deve ser esse mesmo: "Programa específico para ...". Como em qualquer programa desse tipo, que obviamente é a custa de outros domínios e áreas, espero que haja a coragem de se fazerem avaliações (realmente) independentes e que não sejam financiadas as acções que não garantam uma qualidade aceitável em termos internacionais. Infelizmente histórias passadas não confirmam esse tipo de actuação. Quanto à segunda, os argumentos a favor têm sido do tipo: "trata-se apenas de um nome para fins políticos e não terá efeitos de marginalização relativamente aos ``generalistas''". Gostaria de ver isso por escrito em papeis oficiais, para depois poder esperar que tal seja cumprido nas decisões de financiamento. Finalmente, é claro que as tais questões de intenções e processos apareceram quando se constatou que muitos interessados estavam a leste das iniciativas oficiais. Sobre isso apenas referirei a velha frase de que "à mulher de César não basta ser séria, tem também que parecê-lo". Neste caso as parecenças foram más, mas como neste momento a maioria dos interessados já foi posta ao corrente do assunto, passe-se à frente. Miguel
Miguel,
Concordo plenamente que além de o ser, é preciso parecer, honesto, e daí
acho que vale a pena mandar uma relação pormenorizada das iniciativas que o
nosso projecto tomou para se dar a conhecer ao mundo e sobretudo, claro,
aos portugueses:
- participámos no Workshop sobre Linguística Computacional da APL em Lisboa
em Maio de 1998, na semana em que o projecto começou
- logo que tivemos uma versão do nosso catálogo de recursos, publicitámo-la
nas seguintes listas: Forum LP, Linguist, Ancib, TermiLat, corpora list
- inscrevemo-nos em todos os motores de procura que encontrámos
- participámos no PROPOR (3.o encontro sobre o processamento do português)
em Porto Alegre (Brasil) em Novembro de 1998 e temos lá um artigo convidado
nas actas (acessível das nossas páginas)
- saiu uma notícia em Dezembro/Janeiro sobre o nosso projecto no LEJournal
- quando (Janeiro/Fevereiro) tivemos a primeira versão da MINHA
contribuição do livro branco -- explicitamente a pedir a colaboração de
todos, note-se --, mandámos para as listas, com excepção do Forum-LP que
tinha misteriosamente acabado. Daí que enviei directamente a mensagem ao
Gabriel Lopes (responsável pelo forum-LP) para a distribuir pelo máximo
número de pessoas. [ É claro que por qualquer razão que me escapa ele não
te achou merecedor desse favor, nem a lista da APPIA ]
- na reunião sobre tecnologias da linguagem promovida pelo EUROMAP em
Fevereiro deste ano em Lisboa, foi apresentado o nosso projecto pelo Dias
Coelho e feita menção ao documento para discussão
- saiu informação sobre o nosso projecto no ELSNews de Fevereiro
- ponteiros para o nosso projecto encontram-se vários, em sítios Web no
Brasil e em Portugal. Tenho pena que não sejam mais, mas claramente a nossa
estratégia de comunicação não resultou :(
Lamento muito que nada disto te tenha chegado - nem aos membros da APPIA.
Gostava no entanto de afirmar e protestar a nossa honestidade através desta
mensagem.
Sobre as contribuições, o calendário para serem distribuídas em papel
(organizado pelo Observatório) durante a reunião de 17 de Abril é esta 6.a
feira (mandar directamente para TCarvalho@oct.mct.pt); para serem motivo de
discussão pública é evidentemente até à reunião e certamente depois (não
fui eu que propus nem o calendário nem a localização, como poderás
calcular). Como afirmo no documento e em todo o lado, comprometo-me a
publicá-las no nosso site logo que mas mandem. Sobre isto gostava de
referir que *ainda não recebi qualquer resposta ou cópia autorizada da
discussão que se passou na APPIAR, e que como disse gostava de tornar
pública aqui*.
Considero que o assunto de privilegiar o português ou o processamento de
linguagem natural é pertinente e não deve ser discutido APENAS num fórum
fechado como a APPIAR com alguns convidados (no qual eu não fui além disso
incluída).
Gostava apenas de afirmar que não foi por acaso, e que me vou esforçar por
explicar esmiuçadamente as razões que me levam a preferir o investimento no
processamento do português em vez de na linguagem natural em geral.
Colocarei um documento sobre essa questão nos próximos dias aqui no nosso
servidor, e informarei a vossa lista sobre isso. Claro está que seria muito
interessante se alguém quisesse em paralelo escrever um documento
defendendo a opinião contrária, e que seria publicado ao lado.
Sobre a questão das garantias institucionais, penso que isso era certamente
dirigido a outros que não a mim, visto que sou eu a única responsável sobre
o documento que escrevi, e não suponho que reflicta a opinião do governo.
Pensava que era suficiente assinar com o próprio nome, e escrever na
introdução que se pretendia estimular a discussão, para não se ser acusada
de falta de transparência. Fico a saber que não é, mas já agora gostava que
me dissessem o que fazer então para o evitar.
Saudações,
Diana
P.S.Desde já peço desculpa ao Miguel se a "mulher de César" não se referia
ao nosso projecto e ao nosso documento mas a qualquer outra coisa que me
tenha escapado da discussão a que não tive acesso.
**************************************************************************
Diana Santos Processamento computacional do português
SINTEF Telecom and Informatics Tel. (directo) +47 22 06 73 12
Forskningsveien 1 Tel. +47 22 06 73 00
Box 124 Blindern Fax. +47 22 06 73 50
N-0314 Oslo Email: Diana.Santos@informatics.sintef.no
Noruega http://www.portugues.mct.pt/
**************************************************************************
Diana.Santos@informatics.sintef.no said: > P.S.Desde já peço desculpa ao Miguel se a "mulher de César" não se > referia ao nosso projecto e ao nosso documento mas a qualquer outra > coisa que me tenha escapado da discussão a que não tive acesso. Diana, Em parte (na menor parte) referia: sendo tu (ao que parece ex-) membro da APPIA e sabendo tu que existem membros da APPIA interessados nestes assuntos seria de esperar que mandasses a informação para a lista da APPIA. É simples, basta usar o endereço APPIAr@ncc.up.pt (para quem não o saiba: o facto de a distribuição ser feita pelas máquinas da Universidade do Porto tem apenas um significado histórico e não representa qualquer relação entre a APPIA ou a sua lista e esta Universidade!). Em parte (na maior) não me referia: acho que para a elaboração do Livro Branco deveriam ter sido contactadas as comunidades científicas interessadas nos aspectos a debater. Alguém inventou o "Processamento Computacional do Português", alguém aceitou que ele entrasse como "capítulo" do dito Livro, e alguém te encomendou um estudo sobre o mesmo. Eu não faço ideia de quem são os "alguéns" referidos atrás, nem porque actuaram dessa forma e não de outra (o Luís Moniz Pereira falava há uns dias em "segredo dos deuses"). Eu só soube do assunto por duas razões: alguém (neste caso, conhecido!) me fez o favor de passar a tua mensagem, e o OCT mandou-me uma circular sobre os "Perfis científicos...". Para debate que se quer público e participado parece pouco... > [...] gostava de referir que *ainda não recebi qualquer resposta ou cópia > autorizada da discussão que se passou na APPIAR, e que como disse > gostava de tornar pública aqui*. A Palmira Marrafa perguntou-me há dias se eu via inconveniente em que ela juntasse as mensagens e as tornasse públicas através de uma página da WWW. Achei que era uma boa ideia e estava à espera que ela o fizesse. Mas se há urgência, ou a Palmira desistir da ideia, posso fazer "forward" das mensagens sobre este assunto enviadas com cópia para a APPIAr (supondo que os respectivos autores se não opõem). > Considero que o assunto de privilegiar o português ou o processamento > de linguagem natural é pertinente e não deve ser discutido APENAS num > fórum fechado como a APPIAR com alguns convidados (no qual eu não fui > além disso incluída). Parece que o dito "fórum fechado como a APPIAR com alguns convidados" incluiu muito mais interessados que todas as listas que usaste para difundir a informação. É natural que haja muitos outros interessados que ficam de fora (por exemplo, pessoas da área do processamento da fala), mas também nunca foi minha intenção atingir todos os interessados. Quanto à tua inclusão ou não, já disse o que tinha a dizer na minha mensagem (não para todos os endereços acima) de resposta ao José João Almeida. > Sobre a questão das garantias institucionais, penso que isso era > certamente dirigido a outros que não a mim, visto que sou eu a única > responsável sobre o documento que escrevi, e não suponho que reflicta > a opinião do governo. Evidentemente. Aliás agradeço que me façam a justiça de considerar que a atitude que tomei ao escrever aos Presidentes da FCT e do OCT com cópia ao Ministro da CT e à comunidade científica (que consegui atingir) não tem qualquer aspecto pessoal relativamente a ti. As questões que me interessam são as que resumi na minha última mensagem, e obviamente não espero que sejas tu a dar-lhes resposta. Miguel
Miguel Filgueiras wrote: > > > [...] gostava de referir que *ainda não recebi qualquer resposta ou cópia > > autorizada da discussão que se passou na APPIAR, e que como disse > > gostava de tornar pública aqui*. > > A Palmira Marrafa perguntou-me há dias se eu via inconveniente em > que ela juntasse as mensagens e as tornasse públicas através de uma > página da WWW. Achei que era uma boa ideia e estava à espera que ela > o fizesse. Mas se há urgência, ou a Palmira desistir da ideia, posso > fazer "forward" das mensagens sobre este assunto enviadas com cópia > para a APPIAr (supondo que os respectivos autores se não opõem). > Diana, Está terminada a construção da página. Falta agora pedir aos autores das mensagens que verifiquem se está tudo OK. Prevemos que amanhã de manhã (logo que tivermos o Ok de cada um dos autores) a página seja anunciada e disponibilizada. A Palmira está com problemas na ligação ao servidor de email. Logo que o serviço estiver reestabelecido, ela dará este esclarecimento a todas as pessoas. Um abraço, António
Caros colegas, Na sequência do pedido que dirigi aos participantes nesta discussão, no sentido de divulgar as suas mensagens num site criado para o efeito pelos estudandes do curso de Engenharia da Linguagem e do Conhecimento, gostaria, antes de mais, de agradecer o terem acedido ao pedido. Quero também informar que a página está pronta. Falta apenas pedir aos autores que vejam o que vai estar disponibilizado e nos digam se estão de acordo. Fá-lo-emos amanhã de manhã, pelo que à tarde a página poderá já estar acessível. Cumprimentos Palmira Marrafa
Caros colegas Na sequência da minha mensagem de ontem sobre a página que disponibilizará as mensagens dos intervenientes nesta discussão, venho confirmar que a mesma está a ser ultimada. Uma vez que eu vou estar indisponível durante todo o dia, pedi ao António Branco (que é quem tem estado a dar todo o apoio aos estudantes) que, logo que esteja pronta, a envie aos autores para aprovação. Agradecia que as respostas fossem enviadas para o António, o mais brevemente possível, para que a página possa ser disponibilizada ainda hoje. Muito obrigada pela colaboração. Palmira Marrafa
Caros membros da APPIAR, Desde já agradeço ao Miguel Filgueiras o esclarecimento e a maneira simpática com que me tratou, separando o meu papel (que penso eu, já foi agora devidamente esclarecido) do papel das autoridades que me contrataram e com quem, penso eu, estará agora a dialogar. Esta nota deve pois ser lida como uma nota estritamente pessoal e não a representar o projecto em que estou a trabalhar, e é escrita para esclarecer, como cidadã de um mundo parcialmente digital, algumas coisas que não me parecem muito claras. Em primeiro lugar, quero reconhecer publicamente que foi um erro meu não ter dirigido um mail à APPIAR; confesso que pensei que todos os interessados em LN da APPIA também estivessem no Forum-LP. Acho, contudo, que fui a principal prejudicada por esse esquecimento, e espero pois que os membros da APPIA não me julguem muito mal por isso. A respeito da questão de listas, contudo, acho que haveria algumas coisas que deviam ser esclarecidas, e que talvez -- desta vez -- interessem a todos os elementos da APPIA. A minha "queixa" no mail anterior sobre não participar na discussão e/ou não saber o que de facto se passou acho que é reflectida claramente na minha interacção com o António Branco, "convidado especial", que, após me ter informado sobre a existência de um debate espontâneo na APPIAR, e tendo sido instado por mim a mandar-me quer as mensagens quer uma mensagem para a lista a pedir para eu ser envolvida na discussão, se negou às duas dizendo que era CONVIDADO e que achava eticamente errado fazer forward de mensagens destinadas a uma lista fechada. Peço aqui publicamente ao António Branco autorização para mandar a correspondência que tive com ele sobre esse assunto para a presente lista. Como não estavam em causa questões pessoais nem ele me pediu segredo, considero eticamente correcto informar as outras pessoas do que pode estar em causa quando se usam listas electrónicas com cópias para outros recipientes. Penso que é eticamente defensável fazer forwards de mails de correspondência profissional sobre assuntos que versam uma dada lista para a própria lista e demais "convidados" (ou seja, a minha correspondência com o António sobre este assunto), mas para ser formalmente correcta aqui fica o pedido formal. Esta interacção levanta várias questões sobre comunicação electrónica que me parece interessante aprofundar, sobretudo dada a resposta do Miguel no primeiro mail dele que recebi de que não sabia se eu estava na APPIAR, o que me leva à conclusão de que não é possível a qualquer membro saber quem são os outros, donde não pode assumir, por exemplo, que EU não recebo as mensagens. Sobre o comentário do Miguel de que houve mais discussão na lista da APPIA do que participação naquilo que eu escrevi, noto que não é fácil saber quantas pessoas me mandaram sugestões, críticas ou comentários (além das duas que preferiram assinar documentos separados), a única coisa que nós indicamos é o número de visitas ao nosso site. Mesmo assim estou bastante satisfeita com algumas sugestões e apreciações encorajadoras sobre o que escrevi. Por outro, insisto, quero chamar a atenção para o facto de que EU NÃO RECEBI A MAIOR PARTE DOS MAILS QUE PASSARAM NA APPIAR, e portanto não posso avaliar quantos interessados de facto se manifestaram. Surpreende-me que as pessoas que tiveram a iniciativa de os pôr públicos não se tivessem sequer dignado informar-me do caso, visto que o soube apenas pelo último mail do Miguel. E já agora, sim, Miguel, ou o administrador da lista, agradecia que *alguém* me fizesse forward das ditas várias mensagens, mesmo que as versões publicáveis sejam retocadas e o estejam a ser para publicação. É só para eu saber o que se passou, não é para publicar visto que outros o estão a fazer (e talvez me mandem o endereço?). Saudações, Diana
Diana.Santos@informatics.sintef.no said: > Desde já agradeço ao Miguel Filgueiras o esclarecimento e a maneira > simpática com que me tratou, separando o meu papel (que penso eu, já > foi agora devidamente esclarecido) do papel das autoridades que me > contrataram e com quem, penso eu, estará agora a dialogar. Diana, Posso informar que não recebi até o momento qualquer resposta das autoridades, com a excepção de uma carta do Chefe do Gabinete do Ministro da C&T agradecendo a minha em nome do Ministro. Já agora, sempre supus que a FCT ou o OCT te enviassem cópia dessa minha carta. Quanto à abertura ou não desta discussão: a mim nunca me passou pela cabeça expor as minhas opiniões apenas aos recipientes destas mensagens. Como respondi à Palmira Marrafa noutro dia, ao enviar uma mensagem para uma lista como a APPIAr estou a tornar público o seu conteúdo, pelo que não tenho qualquer problema em que alguém a reenvie para terceiros (na sua totalidade e/ou fornecendo o contexto adequado se necessário). > [...] me leva à conclusão de que não é possível a qualquer membro saber > quem são os outros, donde não pode assumir, por exemplo, que EU não > recebo as mensagens. Para se saber quem está numa lista distribuída pelo sistema usado para a APPIAr basta enviar uma mensagem ao próprio sistema. No caso vertente: para majordomo@ncc.up.pt com o texto who appiar (não sei se a resposta estará limitada aos próprios membros da lista). Devo dizer que não usei esse processo para saber quem está actualmente na lista. > [...] Surpreende-me que as pessoas que tiveram a iniciativa de os pôr > públicos não se tivessem sequer dignado informar-me do caso, visto que > o soube apenas pelo último mail do Miguel. Ainda ninguém pôs nada a público; cf. as mensagens de ontem e hoje da Palmira. > [...] agradecia que *alguém* me fizesse forward das ditas várias > mensagens, mesmo que as versões publicáveis sejam retocadas e o > estejam a ser para publicação. Espero bem que não haja retoques. Como a "publicação" está prevista para hoje acho que não vale a pena estar a mandar as mensagens uma a uma. Miguel
Caros colegas, Conforme mencionei em intervenção anterior, pus acessível em http://www.portugues.mct.pt/branco/Porque.html um texto que argumenta a favor de investir no processamento computacional *do português* em vez de noutra área. Coloquei também no mesmo lugar a carta aberta do Miguel Filgueiras. O texto é preliminar, e desde já agradeço críticas e contra-argumentos. Infelizmente só voltarei a ler o meu correio electrónico a partir de 7 de Abril, e menciono portanto o facto -- que me entristece -- de ainda não me ter sido possível ler o que afinal se passou na lista da APPIAR, e ter portanto de esperar até ao meu regresso. Gostava também de fazer uma crítica pública ao António Branco e à Palmira Marrafa por se terem disposto avidamente a criar um sítio da Web com assuntos que pelo menos são vagamente relacionados com o documento que escrevi (e em que oferecia para publicar o que quer que alguém quisesse dizer sobre o assunto) e não terem tido sequer o cuidado de me informarem da sua iniciativa, da qual apenas vim a saber ontem pela nota do Miguel Filgueiras. Gostava também de dizer que já fiz o reparo pessoalmente (por e-mail) a cada um deles, e que isto não é pois uma tentativa de evitar comunicação directa entre as pessoas. O que me parece é que estão em causa aqui actuações que podem comprometer gravemente uma discussão aberta sobre um assunto que me parece que devia ser discutido por todos e não apenas por aqueles privilegiados que tiveram acesso a um forum de eleitos. De qualquer maneira, quero mais uma vez agradecer ao Miguel Filgueiras o facto de ter provocado uma discussão estimulante e dessa forma ter contribuído para o objectivo do meu texto: discutir a área e os seus problemas, e produzir um consenso (mesmo que seja contra mim :-) ) dos investigadores portugueses. Até depois da Páscoa, as minhas melhores saudações, Diana P.S.Por este meio venho também indicar que quaisquer contribuições minhas a esta lista podem ser publicadas na Web ou redifundidas em qualquer outro meio. Gostava apenas que me dissessem aonde...
Convidam-se todos os interessados a consultar e a divulgar
a pa'gina http://caravela.di.fc.ul.pt/~elcweb
Nesta pa'gina encontram-se compiladas mensagens de um
debate acerca da iniciativa do MCT para o processamento computacional da
li'ngua portuguesa. Este debate teve origem numa mensagem de Miguel
Filgueiras, a que se seguiu uma discussa~o por alguns dos destinata'rios
da mensagem.
Esta pa'gina e' da responsabilidade dos estudantes da Licenciatura da
Engenharia da Linguagem e do Conhecimento. Com ela procuramos dar a
conhecer a uma audie^ncia mais vasta um debate importante, o qual tera'
certamente um dos seus pontos mais altos na reunia~o - aberta a todos os
interessados - do dia 17 de Abril de 1999, no Forum Picoas.
A divulgac,a~o das mensagens e' feita com permissa~o dos
autores, a quem agradecemos a amabilidade.
Solicitamos a Diana Santos, coordenadora do site do MCT para
o Livro Branco sobre o processamento computacional da li'ngua
portuguesa, que considere esta pa'gina como uma contribuic,a~o dos
estudantes do curso de ELC a ser divulgada nesse site.
C.A.L.E.L.C. - Comissa~o de alunos da Licenciatura de
Engenharia da Linguagem e do Conhecimento.
Na sequência do debate sobre a política de ciência e tecnologia para a área da engenharia da linguagem para o período 1999-2007, convido aqueles que continuam interessados em discutir este assunto a visitarem: http://www.di.fc.ul.pt/~ahb/livbranco.html Aí encontram uma contribuição minha para o livro branco com o título "Uma Perspectiva de Progresso para a Engenharia da Linguagem". Com o intuito de minimizar discussões distractivas, gostaria de acrescentar uma breve nota prévia acerca do termo "engenharia da linguagem" que aparece no título: O termo "linguística computacional" não colhe toda a simpatia junto dos praticantes com formação inicial em informática; o termo "processamento de linguagem natural" tem acolhimento semelhante junto dos praticantes com formação inicial em linguística. O termo "engenharia da linguagem" é abrangente e tem sido igualmente bem tolerado pelos dois corpos. A par disso, este é o termo usado pela principal agência de financiamento europeia, a DG XIII da Comissão Europeia, para designar a área (mesmo se no 5º programa-quadro a linha de acção correspondente a esta área se intitulará Human Language Technology, para vincar que agora estão interessados em financiar sobretudo investigação que produza resultados pré-comerciais). "Engenharia da linguagem" é também o termo usado pela Agência de Inovação e pela minha Universidade. Foi o termo usado pelo presidente da Missão para a Sociedade da Informação e pelo Ministro da Ciência e Tecnologia no recente seminário de 26 de Fevereiro no Forum Picoas. Como terão oportunidade de verificar as pessoas que passarem para lá do título, utilizo com tranquilidade ao longo do texto "processamento de linguagem natural", "linguística computacional", "processamento das línguas naturais" e "engenharia da linguagem". Cumprimentos, António Branco
Devido a dificuldades de comunicaça~o obtivemos so' agora
a permissa~o para incluir as mensagens de Fernando Pereira.
As respectivas mensagens ja' esta~o inclui'das na pa'gina do
debate, que continua disponi'vel em
http://caravela.di.fc.ul.pt/~elcweb
C.A.E.L.C.
E se falássemos de coisas sérias ? Se entre os participantes de um secreto forum, entretanto tornado (em parte) público, ainda imperar a máxima - recordada há pouco por uma colega que não a partilhava - das empresas que consideram que, de cada vez que despedem um linguista, o desempenho dos seus sistemas de processamento de linguagem natural aumenta dez por cento, então estou condenada à partida. Contudo, atrevo-me a prosseguir. De facto, em matéria de processamento de linguagem natural (e, por favor, poupem-nos com discussões terminológicas, cujo interesse científico e prático é nulo), em matéria de processamento de linguagem natural (PLN), dizia eu, longe vão os tempos em que tudo apontava para um mundo perfeito, harmónico e auto-suficiente de máquinas inteligentes e de inteligentes especialistas em máquinas. As linguagens artificiais atingiram rapidamente um nível de desenvolvimento suficiente para as aplicações que as utilizavam e esperava-se que elas pudessem dar também bons resultados em relação às línguas naturais. Afinal, qualquer ser humano, por menos inteligente que fosse, adquiria, memorizava e utilizava sem esforço a sua língua materna. Mas as coisas mudaram. As exigências são, agora, outras. À medida que a necessidade de aplicações reais se foi impondo, a insuficiência qualitativa e quantitativa dos recursos linguísticos disponíveis foi-se tornando evidente. Todos os profissionais da área têm consciência do repto que lhes é colocado pelos dados específicos das línguas em geral e de cada uma das línguas em particular. Esta questão dos dados é ineludível. Mesmo os especialistas em sistemas de aprendizagem - que consideram que os recursos linguísticos (dicionários, gramáticas, etc.) serão sempre defeituosos e incompletos e que as suas lacunas só poderão ser compensadas pela utilização de cálculos probabilísticos - avaliam os resultados dos seus trabalhos em função dos dados obtidos com esses métodos. É que, seja qual for o modo como são obtidos, os dados linguísticos são indispensáveis para o funcionamento da maioria das aplicações. Por isso, ao longo dos cinquenta anos que nos separam do seu aparecimento, a área evoluiu muito e tem vindo a mostrar uma maturidade e um profissionalismo crescentes. O seu carácter pluridisciplinar só por poucos é contestado. Assiste-se cada vez mais à colaboração entre especialistas de disciplinas tradicionalmente muito afastadas e ligadas a hábitos de raciocínio (que parecem) incompatíveis: ciências teóricas, ciências experimentais, técnicas de engenharia, humanidades. Parece ser cada vez mais consensual que cada um tem o seu papel. Há ainda divergências quanto ao papel de cada um. E se cada um de nós desempenhasse bem o seu papel e o fizesse de forma civilizada ? Elisabete Ranchhod Elisabete Ranchhod ==================== Elisabete Ranchhod IST - Centro de Automática da UTL Av. Rovisco Pais P - 1049-001 LISBOA (Portugal) Tel + (351 1) 841 71 71 Fax + (351 1) 841 71 67 http://www.ist.utl.pt/pt/investigacao/ ==============
Não sei como tem decorrido a discussão nos últimos dias. Estou com graves problemas no acesso ao meu e-mail que é possível que esteja entupido com alguma mensagem mais longa. Como é do Conhecimento da Diana Santos a lista forum-LP está fora de circulação desde pelo menos Dezembro do ano passado. Uma baixa de tensão danificou o disco em que estava não só informação da lista como muita outra informação. Acredito que nesta altura a Diana já tenha tido acesso à minha posição publicamente expressa e que por tal motivo não necessitaria de retoques porque era pública, publicada na rede da APPIA e tornada pública nos e-mails das pessoa que faziam parte da lista de discussão que me chegou. Neste e-mail segue em apêndice o documento que enviei há pouco mais de duas horas para o endereço que era indicado na mensagem de Diana Santos (TCarvalho@oct.mct.pt). Mando apenas o rtf do documento que escrevi à pressa mas que está escrito e que representa uma posição alternativa à posição avançada na página do MCT. Não sei se representa algumas das preocupações dos actores tradicionais e não tradicionais da área de Processamento Computacional de Língua Natural. Não tive tempo de divulgar o documento antes de o enviar para o ministério e por isso este documento representa tão só a minha posição sobre o assunto, embora reflicta algumas preocupações que foram expostas durante a discussão na lista da APPIA. A 17 de Abril estarei aí para discutir os documentos apresentados embora não conheça nem como vai decorrer essa reunião, nem como está programada, nem quem está previsto que esteja presente. Até Lisboa a 17 de Abril Gabriel Perira Lopes
Não esqueçamos os nossos objectivos =================================== Tenho assitido com estupefacção a uma discussão razoavelmente estéril sobre os documentos do Livro Branco no domínio do PLN (passo aqui por cima das bizantinices dos sub.sub. ... .sub.domínios ou da maior ou menor conveniência que cada um tem na designação). Sou um dos subscritores do documento "Proposta de Estruturação da área do Processamento Computacional do Português" e fi-lo porque me pareceu útil participar, com a minha modesta contribuição, numa discussão pública que pode levar a resultados úteis e à definição dos objectivos da política científica e tecnológica desta área. A princípio quis acreditar que as posições iniciais do Miguel Filgueiras e, depois, do Gabriel Lopes não passassem de arrufos de mau humor naturais num país onde tanta coisa se passa nos nossos domínios à margem da comunidade científica. Tenho inclusive tornado públicas posições bastante críticas ao modo como se desenrolaram certos processos. Devo, ainda, confessar que compreendi perfeitamente o desabafo inicial do Moniz Pereira da mesma maneira como compreendi e concordo, em linhas gerais, com as suas posições posteriores. Parece-me mais importante, neste momento, discutirmos as questões que se prendem com as condições objectivas da área do que prosseguir uma linha mais ou menos insultuosa que visa os métodos seguidos até aqui. A definição das áreas aqui em jogo não é uma questão meramente académica. Creio que todos estamos de acordo em que é difícil justificar que grupos que não tenham competência técnica em linguística possam dedicar-se ao tratamento do português. Seguindo o exemplo já dado da Física, seria absurdo considerar que grupos sem físicos se intitulassem como grupos de Física... No entanto, este argumento (como os anteriormente usados) não pode ser transposto mecanicamente para o domínio do PLN. Só a deficiente compreensão do carácter intrinsecamente interdisciplinar desta área poderá conduzir a não compreender a necessidade de esforços conjugados para o seu desenvolvimento. O debate que se iniciou a partir do Livro Branco só poderá ser útil se formos capazes de definir os objectivos que procuramos atingir e os meios desejáveis para os podermos concretizar. Os objectivos que definimos e as condições necessárias que caracterizámos no documento atrás referido visavam colmatar deficiências graves que julgo serem sentidas pela maioria dos investigadores deste domínio (ou domínios afins). Só numa visão limitada e castrante se pode admitir que uma área científica pode sobreviver ignorando as áreas envolventes. Ao defendir, com particulares cuidados, o aparecimento de um Complexo não foi minha intenção (nem pode ser essa a interpretação) criar um clube de amigos. É provável que no calor destas discussões informais se tomem, sem querer, posições que conduzem objectivamente ao bloqueio de qualquer alternativa positiva à situação actual. Parece-me essencial tomar medidas urgentes no sentido de assegurar à Língua Portuguesa um lugar digno no quadro europeu e mundial e considero-o um objectivo estratégico da política portuguesa. Sugeria, pois, aos participantes neste forum que nos centrassemos mais neste objectivo construtivo e deixássemos para trás interesses (ou querelas) que apenas contribuem para atrasar ainda mais as urgentes medidas a tomar. Samuel Eleutério CAUTL - Instituto Superior Técnico
Caros interessados no processamento computacional da língua portuguesa, Disponibilizei as duas novas contribuições (de António Horta Branco e José Gabriel Pereira Lopes) no nosso servidor, assim como apontei para a "contribuição" de um grupo de estudantes, conforme expressamente pedido pelo CALELC. Tornei também públicas as mensagens que me foram mandadas directamente sobre o assunto da discussão, e que desde já agradeço. Essa nova informação encontra-se em http://www.portugues.mct.pt/branco/reaccoes.html, também acessível a partir da página principal do nosso servidor seleccionando o item "Documentos". Agradecendo toda e qualquer comunicação, reitero aqui o compromisso de a tornar pública e de sobre ela reflectir, Diana ************************************************************************** Diana Santos Processamento computacional do português SINTEF Telecom and Informatics Tel. (directo) +47 22 06 73 12 Forskningsveien 1 Tel. +47 22 06 73 00 Box 124 Blindern Fax. +47 22 06 73 50 N-0314 Oslo Email: Diana.Santos@informatics.sintef.no Noruega http://www.portugues.mct.pt/ **************************************************************************
Data: 12 de Abril de 1999
De: Palmira Marrafa
Endereço electrónico: Palmira.Marrafa@ip.pt
Assunto: Processamento_computacional_da_língua_portuguesa__e_Engenharia_da_Linguagem_e_do_Conhecimento
Caros colegas,
Na sequência do nosso debate electrónico, gostaria de fazer algumas observações.
No documento "Processamento computacional da língua portuguesa: documento de trabalho", encomendado pelo Ministério da Ciência e Tecnologia a Diana Santos, em particular na secção "Política de formação na área do processamento computacional da nossa língua", é referida a licenciatura em Engenharia da Linguagem e do Conhecimento. Na qualidade de coordenadora, pela Faculdade de Letras, desta licenciatura, cabe-me clarificar o seguinte:
Em http://www.portugues.mct.pt/ensino.html pode ler-se que esta licenciatura é da Faculdade de Ciências da Universidade Lisboa.
A licenciatura é uma licenciatura de duas faculdades da Universidade de Lisboa: a Faculdade de Letras e a Faculdade de Ciências (o coordenador pela Faculdade de Ciências é o Prof. Helder Coelho).
Em http://www.portugues.mct.pt/branco/formacao.html pode ler-se que "Não existe formação apropriada a nível universitário de fonética".
Esta licenciatura inclui duas disciplinas obrigatórias neste domínio: "Fonética para a Síntese e o Reconhecimento da Fala" (4º ano, 1º semestre) e "Síntese e Reconhecimento da Fala" (4º ano, 2º semestre), da responsabilidade do Departamento de Linguística Geral e Românica.
Ver também planos curriculares das licenciaturas de Linguística e de Línguas e Literaturas Modernas em todo o país. Ver igualmente cursos de Mestrado das diferentes universidades.
Em http://www.portugues.mct.pt/branco/formacao.html pode igualmente ler-se que não existe "qualquer cadeira (ou formação) em Métodos Estatísticos".
A licenciatura em Engenharia da Linguagem e do Conhecimento inclui a disciplina obrigatória de "Estatística Descritiva e Análise de Dados" (1º ano, 1º semestre), da responsabilidade do Departamento de Estatística e Investigação Operacional.
Com os melhores cumprimentos,
Palmira Marrafa
===============================================================
Palmira Marrafa
Universidade de Lisboa
Faculdade de Letras - Departamento de Linguística Geral e Românica
Alameda da Universidade
1699 Lisboa Codex
Tel: 7920000
Fax:7960063
email: Palmira.Marrafa@ip.pt
Data: 13 de Abril de 1999
De: Diana Maria de Sousa Marques Pinto dos Santos
Endereço electrónico: Diana.Santos@informatics.sintef.no
Assunto: formacao e informacao
At 20:06 12.04.99 +0100, Palmira Marrafa wrote: >>>> Caros colegas, Na sequência do nosso debate electrónico, gostaria de fazer algumas observações. <<<<<<<< Gostava de chamar a atenção para o facto de que estas "observações" não têm nada a ver com um debate, mas são sim informações factuais que me deviam ter sido mandadas directamente, sendo que a Palmira Marrafa desde há muito que me vem "prometendo" feedback ao meu documento. Além disso, gostava também de chamar a atenção para o facto de que as citações nem sequer se encontram correctas. Desde ontem às 14h (dia 12 de Abril) que há uma versão actualizada do documento, em que estes pontos foram de facto alterados. No entanto, e como me responsabilizo evidentemente também pela versão anterior, datada de 9 de Fevereiro, gostava de responder em pormenor à mensagem da Palmira Marrafa. >>>> No documento "Processamento computacional da língua portuguesa: documento de trabalho", encomendado pelo Ministério da Ciência e Tecnologia a Diana Santos, em particular na secção "Política de formação na área do processamento computacional da nossa língua", é referida a licenciatura em Engenharia da Linguagem e do Conhecimento. Na qualidade de coordenadora, pela Faculdade de Letras, desta licenciatura, cabe-me clarificar o seguinte: Em http://www.portugues.mct.pt/ensino.html pode ler-se que esta licenciatura é da Faculdade de Ciências da Universidade Lisboa. A licenciatura é uma licenciatura de duas faculdades da Universidade de Lisboa: a Faculdade de Letras e a Faculdade de Ciências (o coordenador pela Faculdade de Ciências é o Prof. Helder Coelho). Em http://www.portugues.mct.pt/branco/formacao.html pode ler-se que "Não existe formação apropriada a nível universitário de fonética". Esta licenciatura inclui duas disciplinas obrigatórias neste domínio: "Fonética para a Síntese e o Reconhecimento da Fala" (4º ano, 1º semestre) e "Síntese e Reconhecimento da Fala" (4º ano, 2º semestre), da responsabilidade do Departamento de Linguística Geral e Românica. Ver também planos curriculares das licenciaturas de Linguística e de Línguas e Literaturas Modernas em todo o país. Ver igualmente cursos de Mestrado das diferentes universidades. <<<<<<<< Estão aqui misturadas duas questões. A primeira é a da abrangência do catálogo "ensino.html" compilado, com base na nossa própria procura na Web e na correspondência electrónica recebida. A segunda é a questão das afirmações que faço na minha contribuição para o livro branco, e que *não são baseadas nesse catálogo*. De facto, o catálogo que compilámos informalmento em ensino.html foi citado pura e exclusivamente para indicar que há sinais positivos na área, e não como demonstração das afirmações que faço abaixo. Repito aqui o contexto em que é mencionado: "embora já haja alguns sinais positivos: uma licenciatura em engenharia da linguagem e um curso de pós-graduação em linguística computacional, assim como várias cadeiras de especialização ministradas em mestrados de âmbito mais geral, veja-se http://www.portugues.mct.pt/ensino.html)." Em relação ao conteúdo do próprio catálogo, informo aqui que pedi para as pessoas me mandarem informação sobre ensino na área ainda para o Forum-LP (pedido enviado a 7 de Dezembro de 1998). O Forum-LP, para aqueles que o não saibam, era uma lista dedicada a todos quantos se interessavam pela língua portuguesa, gerida pelo grupo do Gabriel Lopes e anunciada internacionalmente. Retiro a conclusão de que se não mandaram, era porque não consideravam que esta informação fosse de facto pertinente. Em relação à quantidade de referências sobre fonética para o processamento da fala que a Palmira parece dar a entender que faltam, de facto sobre elas não recebemos até agora qualquer indicação da sua existência. Talvez porque a fonética ensinada nas licenciaturasArial" de Linguística e Literaturas Modernas em todo o país" não tem de facto muita relação com o processamento de fala? Isto é apenas uma pergunta... os responsáveis dessas ditas licenciaturas e mestrados são evidentemente convidados para informar todo o público e o povo português em geral dos passos que dão na formação dos alunos de forma a incentivar o processamento computacional da língua portuguesa . Se o não fizeram até agora, podem ainda fazê-lo no dia 17, e em geral por todos os meios que as universidades têm ao seu alcance. As listas de actores e recursos PRESENTES NA WEB nunca foram consideradas exaustivas... >>>> Em http://www.portugues.mct.pt/branco/formacao.html pode igualmente ler-se que não existe "qualquer cadeira (ou formação) em Métodos Estatísticos". A licenciatura em Engenharia da Linguagem e do Conhecimento inclui a disciplina obrigatória de "Estatística Descritiva e Análise de Dados" (1º ano, 1º semestre), da responsabilidade do Departamento de Estatística e Investigação Operacional. <<<<< A observação acima é de facto um exemplo gravoso de utilização abusiva de citações fora do contexto. O que está no meu documento e sempre esteve foi: "Apesar de grande parte do trabalho em processamento de linguagem natural ser baseado em métodos estatísticos, parece não existir qualquer cadeira (ou formação) nessa área em Portugal (cadeiras de introdução à estatística são obviamente insuficientes, embora necessárias)." Ou seja, explicando melhor, *parece não existir qualquer cadeira em "processamento de linguagem natural baseado em métodos estatísticos".* E repito, "cadeiras de introdução à estatística são obviamente insuficientes, embora necessárias". Se a Palmira pensa que a cadeira "Estatística Descritiva e Análise de dados" (ver programa abaixo) é de facto uma cadeira de "processamento de linguagem natural baseado em métodos estatísticos", então realmente não falamos a mesma língua! Conteúdo de http://www.di.fc.ul.pt/licenciaturas/lelc/disciplinas/descricao.html#edad: Excerto: Tratamento preliminar de dados. O diagrama de caule-e-folhas, ordenador parcial e revelador da forma da distribuição. Características amostrais. Comparação de diagramas de caule-e-folhas e de histogramas. A forma da cauda da distribuição. Letras-resumo como estatísticas ordinais seleccionadas. Caixa de 5 letras-resumo e de 2k+1 letras-resumo. Caixas-de-bigodes. Transformações-potência homogenizadoras da dispersão. Transformações de dados. Simetrização; linearização de relações. Relação funcional entre duas variáveis. Rectas dos mínimos quadrados e alternativas resistentes. Um olhar sobre os resíduos. Provas binomiais e aplicações na abordagem não paramétrica a problemas simples. Gostava aliás de pedir a todos quantos lêem estas mensagens que separem a informação factual, que agradeço que me seja mandada, das questões de debate sobre o que se deve ou não fazer na área. E gostava de notar que se as pessoas estão de facto interessadas em que a informação seja veiculada claramente, basta mandarem-nos -- não é preciso cópia para o resto do mundo -- as correcções factuais. Repito o que está presente nas nossas páginas "Por favor envie comentários, contribuições e críticas para projecto@informatics.sintef.no. " Sobre a formação, é minha convicção de que há muito por fazer. Se outros têm outra opinião, porque é que não a escrevem e a tornam pública para discussão? Ou porque é que não compilam (por exemplo, pessoas especialistas em fonética, que não é evidentemente o meu caso) catálogos e bibliografias que possam dar uma visão mais completa do que se faz em Portugal? Não foi esse o meu obectivo ao compilar os vários catálogos que apresentamos nas nossas páginas. Tentei apenas dar UM contributo para a comunidade se conhecer melhor. E insisto, é preciso "Transparência, participação e COLABORAÇÃO de todos". Diana
Data: 15 de Abril de 1999
De: Miguel Filgueiras
Endereço electrónico: mig@ncc.up.pt
Assunto: Discussao publica sobre Processamento de Linguagem Natural
Para conhecimento dos interessados, segue cópia de um texto que preparei para a sessão de discussão pública do próximo sábado e que enviei para o Observatório das Ciências e Tecnologias para distribuição aos participantes. Miguel Filgueiras ---------------- Comentário sobre o tema do chamado Processamento Computacional da Língua Portuguesa Miguel Filgueiras DCC-FC & LIACC, Universidade do Porto R. do Campo Alegre 823 / 4150 Porto email: mig@ncc.up.pt 13 de Abril de 1999 O presente escrito foi elaborado por não me ser possível aceitar o convite para apresentar oralmente um comentário na sessão de discussão pública sobre Processamento Computacional da Língua Portuguesa promovida pelo Observatório das Ciências e Tecnologias e pela Fundação para a Ciência e a Tecnologia no âmbito dos trabalhos de preparação do Livro Branco do Desenvolvimento Científico e Tecnológico Português (1999-2007). Apresentarei os meus pontos de vista sobre os seguintes pontos 1) designação do tema 2) estado actual da área em Portugal 3) medidas que poderão levar a um desenvolvimento da área em Portugal 4) erros a evitar e terminarei com alguns comentários finais. 1. Designação do Tema Em carta dirigida às instâncias governamentais competentes e feita circular por correio electrónico junto de vários membros da comunidade científica portuguesa, considerei ser muito estranha a designação escolhida para o tema em análise e o facto de lhe estar a ser dado um tratamento semelhante ao de domínios científicos universalmente reconhecidos como tal. Não irei repetir os argumentos apresentados nessa carta, à qual não obtive qualquer resposta das referidas instâncias. Na discussão que a sua publicitação por correio electrónico suscitou, foi sugerido que tal designação não seria mais que uma mera etiqueta para efeitos políticos, e não pretenderia ter qualquer efeito redutor, ou de afastamento daqueles que pretendem fazer, ou continuar a fazer, investigação no campo, já há muito estabelecido, conhecido pelos nomes de Processamento de Linguagem Natural (falada ou escrita), Linguística Computacional, ou Engenharia da Linguagem --- que aqui referirei pelo nome genérico de Processamento Computacional de Línguas e pela sigla PCL. A ter fundamento esta sugestão, considero ser essencial que oficialmente seja dito, escrito e, principalmente, cumprido aquando da atribuição de financiamentos que os referidos redução e afastamento não terão lugar. Considero ainda que, apenas para não se dar uma imagem de ignorância, seria preferível que as instâncias governamentais passassem a tratar o tema não como um domínio científico, mas como uma área à qual, por razões que ainda não foram oficialmente explicitadas de forma clara, foi decidido conceder um financiamento especial através de um programa específico. Diana Santos, a quem foi encomendado pelo Ministério da Ciência e Tecnologia um documento sobre este tema, defende, num documento disponibilizado na World Wide Web, que a ênfase deve ser de facto no tratamento do português. As razões que apresenta são, algumas, um total contra-senso (por exemplo, que seja mais abrangente o estudo de uma língua, o português, em vez de o estudo de várias línguas, ou que o estudo do português englobe quase toda a Ciência), e, outras, contraditórias (por exemplo, ao criticar a atitude de certos investigadores ao considerarem o inglês como "a linguagem natural" e, ao mesmo tempo, tomar uma atitude semelhante ao querer restringir o estudo ao português). Quero acreditar que tais razões não irão ser tomadas como boas por quem tenha de tomar as decisões nesta matéria, tanto mais que, em certa medida, contrariam o muito louvável esforço de internacionalização do sistema científico português a que se tem assistido nos últimos anos. Em consequência, no que se segue considerarei que a sugestão que mencionei no parágrafo anterior é fundamentada e que o tema de que se está a tratar é o Processamento Computacional de Línguas, sem obviamente se esquecer que o português é uma das línguas que deve ser considerada. 2. Estado actual da área em Portugal Em Portugal, e com excepções pontuais que confirmam a regra, são pouco comuns as colaborações entre investigadores com formação de base na Linguística e os que têm um formação de base na Informática, sendo também ainda raros os investigadores que tenham uma formação mista. O número de equipas de investigação activas na área não deve ser superior a 15, o que multiplicado por uma dimensão média de 6 (provavelmente exagerada), me leva a supor não existirem mais de 100 investigadores activos --- claro que não estou a incluir todas as áreas que tenham ou possam ter ténues ligações com o PCL. Por outro lado a quantidade e/ou a qualidade da produção científica na área são relativamente pequenas. Esta conclusão é evidente dos números coligidos por António Branco na sua muito valiosa contribuição para esta discussão: 6 comunicações (num total de 2.000) desde 1990 nas três conferências internacionais de maior relevo na área, e bastante menos de 10 doutoramentos desde 1979. 3. Medidas que poderão levar a um desenvolvimento da área em Portugal Não é fácil imaginar medidas que no curto e médio prazo possam melhorar muito o panorama apresentado atrás. É para mim claro que não se poderá avançar nesta área sem haver, ou um número suficiente de investigadores com formação mista, ou uma forte colaboração entre investigadores com formação num e noutro domínio. Aumentar o número de investigadores de formação mista é claramente a via mais promissora, mas eventualmente incompatível com os prazos que se queira estabelecer. Para fomentar tal aumento, deveria ser incentivada a criação de cursos de licenciatura e/ou mestrado e o eventual reforço da única licenciatura deste tipo já existente: a licenciatura em Engenharia da Linguagem e do Conhecimento, da responsabilidade das Faculdades de Ciências e de Letras da Universidade de Lisboa. Um dos incentivos absolutamente necessário seria o da criação de perspectivas de emprego para os formandos de tais cursos, sob pena de se estar a formar futuros desempregados. Suponho ser claro, por um lado, que o papel do Ministério da Ciência e Tecnologia neste aspecto seria o de garantir a existência de condições minímas de estabilidade numa carreira de investigação, e, por outro lado, que o lançamento ou reforço de licenciaturas só poderia ter cabimento se for previsível um aumento substancial e sustentado do número de investigadores na área --- caso contrário, seria apenas necessário o apoio a cursos de mestrado. Em paralelo, deveria ser criado um programa de bolsas de doutoramento na área priveligiando a inserção de linguistas em equipas de informáticos e vice-versa. O fomento de um forte grau de colaboração entre investigadores linguistas e investigadores informáticos parece-me mais difícil de atingir, mas poderia ser realizado através do estabelecimento de uma maior prioridade no financiamento de projectos com equipas mistas, e de medidas rigorosas de acompanhamento e avaliação de tais projectos que garantissem a existência real dessa colaboração. A criação e disponibilização de recursos linguísticos poderia ser incentivada do mesmo modo, dando prioridade no financiamento de projectos que as garantissem. As questões relacionadas com direitos de autor poderão ser solucionadas, quer através do estabelecimento de um repositório nacional de recursos linguísticos que cobraria esses direitos, quer através de mecanismos de licenciamento do tipo habitualmente usado para software que permitissem a difusão livre para efeitos de investigação sem fins lucrativos. Um modelo possível para um tal repositório nacional é o criado pela European Language Resources Association. Em resumo, o financiamento acrescido para a área deveria ser aplicado no incentivo à criação ou reforço de cursos universitários para formação de investigadores na área, criação de emprego para tais investigadores, criação de um programa de bolsas para doutoramento "trans-disciplinar", e suporte a projectos de investigação, com prioridade aos que garantissem uma efectiva colaboração interdisciplinar entre linguistas e informáticos e a criação e disponibilização de recursos linguísticos. 4. Erros a evitar Para quem conheceu de perto o insucesso do projecto EUROTRA, que só não foi estrondoso por ter sido politicamente abafado, é evidente que qualquer solução que passe pela criação de um programa único de investigação, ou criação de um único centro (ou complexo) de investigação na área, é completamente inadequada. Para quem não conhece a história do EUROTRA, bastará talvez referir que este contava com uma equipa central que ditava os rumos a seguir pelas equipas existentes em cada país da Comunidade Europeia. Embora tenha sido gasta uma quantidade astronómica de dinheiro, os objectivos iniciais ficaram muito longe de serem alcançados, em grande parte porque as abordagens escolhidas e impostas pela equipa central não se mostraram adequadas. Um financiamento da mesma ordem de grandeza distribuído por equipas trabalhando independentemente teria tido, com toda a certeza, resultados bem mais palpáveis. Esta foi a conclusão a que a Comissão Europeia chegou, pois os financiamentos para a área passaram a ser canalizados para o apoio a projectos independentes, em moldes idênticos aos adoptados noutras áreas. A criação de um único centro (ou complexo) de investigação na área, para além dos problemas inerentes à centralização que acabei de referir, levantaria ainda problemas práticos impossíveis de resolver: seria ingenuidade supor que todos os investigadores interessados na área quereriam colaborar entre si, e que os investigadores não residentes em Lisboa (Lisboa porque obviamente, como é tradição em Portugal, tal centro nunca iria ser criado na "paisagem") quereriam mudar de residência para poderem participar, cabalmente, nas actividades de tal centro. Um aspecto essencial é o de garantir a qualidade e quantidade da produção científica que seja de esperar da investigação que venha a ser financiada. Deverão para tal ser adoptados processos de avaliação e acompanhamento independentes e rigorosos, e tiradas sem hesitações as conclusões lógicas de avaliações negativas (o que nem sempre foi feito no passado). Atendendo aos indicadores que referi atrás e que mostram a actual pobreza dessa produção, esta atitude é absolutamente necessária, a menos que se queira despender dinheiro sem se olhar a objectivos. 5. Comentários finais Não posso deixar de terminar este comentário com uma breve referência aos aspectos de organização da discussão em torno deste tema. Foi completamente infeliz a ideia de encomendar um documento a um único investigador, e esperar que a partir desse documento se obtivessem outras posições. Em primeiro lugar, independentemente da capacidade desse investigador para realizar um trabalho de bom nível e para dialogar com outros interessados antes de o levar a cabo, tal documento apareceria sempre ligado a perspectivas e interesses pessoais que, numa área heterógenea como esta, nunca iriam ser partilhados por muitos outros investigadores. Colocou-se assim, e de modo gratuito, uma pessoa numa posição pouco sustentável. Em segundo lugar, obter posições de outras pessoas por reacção é um método claramente impróprio: não é certamente o melhor ponto de partida para a tomada de uma posição a leitura de um documento com que não se concorda ou que se considera mal elaborado. Teria sido preferível que a comunidade interessada na área tivesse sido informada atempadamente de que as instâncias governamentais tinham seleccionado a área para financiamento especial, e que quem quisesse pudesse apresentar a sua posição sobre o assunto. Do modo como todo o processo se desenrolou ficam uma série de dúvidas, acompanhadas, como não pode deixar de ser, de uma série de boatos e suspeitas. Enfim, uma situação que poderia e deveria ter sido evitada.
Última actualização: 22 de Julho de 2003. Perguntas, comentários e sugestões