Mensagens sobre a contribuição para o livro branco

recebidas pelo projecto Processamento computacional do português

Estas mensagens, incluindo como um dos destinatários a lista da APPIA, foram mandadas directamente para Diana Santos ou para projecto@informatics.sintef.no. As mensagens que as precederam poderão ser (provavelmente apenas parcialmente) consultadas no endereço a que será feita referência mais abaixo.

Esta página foi criada para reflectir a perspectiva do nosso projecto no sentido de ilustrar a ordem com que as várias informações nos foram chegando, e que é muito distinta da ordem cronológica da criação e divulgação parcial das mensagens.

Reiteramos aqui a nossa disponibilidade de publicar tudo o que for escrito sobre o assunto e a que os seus autores nos queiram dar acesso, com a data em que nos chegar.

Data: 18 de Março de 1999
De: Jose Joao Almeida
Endereço electrónico: jj@di.uminho.pt
Assunto: Re: Perfis dos dom nios cient ficos em Portugal

Boa gente,
   penso que esta discussao descambou.
   No minimo acho que era eticamente correcto mandar estes mails `a Diana
(que nao pertence a APPIA)

   Nao me parece ofensivo o ter um documento na rede chamado
      "PLN da lingua portuguesa : UM DOCUMENTO DE TRABALHO"
em que se diz:
      "Pretende-se que este documento seja o ponto de partida para uma 
  discussão alargada sobre o futuro do processamento computacional da língua 
  portuguesa"
e se pede para:
      "Por favor envie comentários, contribuições e críticas para ..."
e nao ter consultado pessoalmente os 10 milhoes de portugueses

   Penso que a existência e melhoramento deste tipo de documentos É UMA BOA 
CAUSA. Estou certo que ainda se ira' a tempo de se contribuir (eu mandei duas
observações e nao fui preso)

Um abraco
J.Joao
-- 
 --------------------------------------------------+------------------------+
        _/_/        _/_/   _/_/      _/      _/_/  |                        |
         _/          _/ _/    _/   _/_/   _/    _/ | J.Joao Dias de Almeida |
        _/          _/ _/    _/ _/    _/ _/    _/  |   Dept. de Informatica |
 _/    _/    _/    _/ _/    _/ _/_/_/_/ _/    _/   |   Univ. do Minho       |
  _/_/   _/   _/_/     _/_/   _/    _/   _/_/      |   Campus de Gualtar    |
 --------------------------------------------------|   4700 Braga  Portugal |
 jj@di.uminho.pt     http://www.di.uminho.pt/~jj   | Fax=351 (0)53 604471   |
 --------------------------------------------------+------------------------+

Data: 18 de Março de 1999
De: Miguel Filgueiras
Endereço electrónico: mig@ncc.up.pt
Assunto: Re: Perfis dos dom nios cient ficos em Portugal


jj@di.uminho.pt said:
>    No minimo acho que era eticamente correcto mandar estes mails `a
> Diana (que nao pertence a APPIA) 

Meu caro,
Agradeço a tua tentativa de me educar (mesmo que tardiamente), mas
eu enviei a minha mensagem inicial a pessoas e à rede da APPIA de modo
a incluir o mais possível quem estivesse próximo da área de PLN. Não
fazia ideia de que a Diana Santos não estivesse na APPIAr, mas de qualquer
modo isso não me preocupa, dado que eu também não soube directamente
da mensagem dela sobre a existência do seu documento. A minha mensagem
inicial era dirigida a quem pudesse estar interessado pelo assunto
mas sem querer atingir os "10 milhões de portugueses" de que tu falas.

>    Nao me parece ofensivo o ter um documento na rede chamado
>       "PLN da lingua portuguesa : UM DOCUMENTO DE TRABALHO" em que se
> diz:
>       "Pretende-se que este documento seja o ponto de partida para uma
> 
>   discussão alargada sobre o futuro do processamento computacional da
> língua 
>   portuguesa" e se pede para:
>       "Por favor envie comentários, contribuições e críticas para ..."
> e nao ter consultado pessoalmente os 10 milhoes de portugueses 

Não se trata de ser ou não ofensivo: por mim, quem quiser que ponha o
que quiser na rede (desde que não seja difamatório). O que está em causa
é a aceitação que esse documento aparentemente está a ter por parte
do Governo e as bases em que assenta.

E, obviamente, não se trata de consultar "pessoalmente os 10 milhoes
de portugueses": trata-se de consultar minimamente a comunidade
interessada na área. Tive a surpresa de ver que a maior parte das
pessoas que conheço com trabalho em PLN em Portugal não sabiam, ou
estavam por fora, de todo este imbroglio. Claro que se reduzirmos
a área a um nicho, reduziremos os interessados... no limite, ficam
só os proponentes!

>  Penso que a existência e melhoramento deste tipo de documentos É UMA
> BOA  CAUSA. Estou certo que ainda se ira' a tempo de se contribuir (eu
> mandei duas observações e nao fui preso)

A existência desses documentos seria uma boa causa se a comunidade
interessada na área tivesse tido oportunidade de colaborar na sua
elaboração e se os pressupostos de base fossem aceitáveis. Ninguém
que interveio nesta discussão está com medo de ser preso; quando
muito o medo é de se ser tomado por parvo.

Um abraço,
Miguel

PS: já agora teria sido interessante teres mandado a tua mensagem
para TODOS os endereços das mensagens anteriores.

Data: 19 de Março de 1999
De: Diana Maria de Sousa Marques Pinto dos Santos
Endereço electrónico: Diana.Santos@informatics.sintef.no
Assunto: Pedido de acesso 'a discussao; pedido de contribuicoes

Miguel,
Soube pelo mail do José João e pelo teu que está a haver uma discussão na
lista da APPIA sobre o documento que escrevi e o projecto em que estou
envolvida.

Gostava muito que me mandassem o conteúdo dessa discussão, assim como
autorização para o publicar na rede de forma a todos os possíveis
interessados que não sejam membros da APPIA também possam dela aproveitar.

Sobre o tom que me parece magoado por não teres sido contactado
directamente, só me resta pedir desculpa porque de facto a minha intenção
era não excluir ninguém. Pelo contrário, gostaria de obter o maior possível
feedback sobre aquilo que escrevi. 

Às vezes é mais difícil do que pensas conseguir difundir uma mensagem
quando não se está pessoalmente no país. Precisamente de forma a não
privilegiar -- e daí excluir -- ninguém, fiquei-me pelo envio às listas
internacionais e à lista do Forum-LP (que esperava que congregasse todas,
ou pelo menos a grande maioria, das pessoas interessadas no processamento
do português). 

Mais tarde quando o Forum-LP desapareceu servi-me dos endereços das pessoas
que me tinham contactado directamente sobre o assunto, pedindo-lhes
especificamente para redirigirem o pedido de feedback e contribuições ao
maior número possível de pessoas. 

Visto que a reunião para discutir o que fazer em relação ao processamento
computacional do português será no dia 17 de Abril, acho que ainda vamos a
tempo. Um mês não é tarde demais para melhorar significativamente o
documento, ou, como outros fizeram, para apresentar documentos
alternativos. Quanto mais opiniões da comunidade científica de interessados
na área, melhor. O único objectivo do documento que eu escrevi, aliás, é
suscitar a discussão sobre alguns assuntos que me parecem importantes. As
conclusões sobre como prosseguir, se bem percebi, é para sairem da
discussão da comunidade, e não estão fixadas pelo que lá se encontra. O meu
documento de trabalho não é mais do que uma achega para uma discussão.

Gostava pois de afirmar publicamente que tenho a certeza que essa discussão
será muito enriquecida com o teu contributo, e que a minha intenção era, ao
pedir contribuições, não excluir ninguém.

Diana

**************************************************************************
Diana Santos				Processamento computacional do português

SINTEF Telecom and Informatics	Tel. (directo) +47 22 06 73 12
Forskningsveien 1			Tel. +47 22 06 73 00
Box 124 Blindern			Fax. +47 22 06 73 50
N-0314 Oslo				Email: Diana.Santos@informatics.sintef.no
Noruega				http://www.portugues.mct.pt/
**************************************************************************

(...)

>
>PS: já agora teria sido interessante teres mandado a tua mensagem
>para TODOS os endereços das mensagens anteriores.
>
>
>
Já agora agradecia que me facultassem a lista destes enderecos, também.

Data: 22 de Março de 1999
De: Miguel Filgueiras
Endereço electrónico: mig@ncc.up.pt
Assunto: Perfis dos domínioscientíficos em Portugal


Serve esta para responder a várias mensagens anteriores. Três delas
não foram distribuídas para todos os endereços acima: uma do José
João Almeida sobre o facto da Diana Santos não estar na lista da APPIA
e não estar a par da discussão, a minha resposta a essa, e uma da Diana
Santos com o título "Pedido de acesso à discussão [...]".

Para começar, continuo a considerar que os dois problemas que levantei
são de facto pertinentes, e não são uma mera questão de intenções ou
de processos. Os interessados terão que dizer se acham que
1) o dito "Processamento Computacional do Português" merece um tratamento
a par dos grandes domínios;
2) o dito "Processamento Computacional do Português" merece um tratamento
preferencial ao da área de PLN/Linguística Computacional/Engenharia da
Linguagem; isto é, da área do processamento computacional das línguas.

Quanto à primeira, a resposta "oficial" parece ser a de que se trata
de um programa específico para uma área carenciada. Se é isso, então
a minha opinião é a de que o título oficial deve ser esse mesmo:
"Programa específico para ...". Como em qualquer programa desse tipo,
que obviamente é a custa de outros domínios e áreas, espero que haja
a coragem de se fazerem avaliações (realmente) independentes e que não
sejam financiadas as acções que não garantam uma qualidade aceitável
em termos internacionais. Infelizmente histórias passadas não confirmam
esse tipo de actuação.

Quanto à segunda, os argumentos a favor têm sido do tipo: "trata-se apenas
de um nome para fins políticos e não terá efeitos de marginalização
relativamente aos ``generalistas''". Gostaria de ver isso por escrito
em papeis oficiais, para depois poder esperar que tal seja cumprido nas
decisões de financiamento.

Finalmente, é claro que as tais questões de intenções e processos
apareceram quando se constatou que muitos interessados estavam a leste
das iniciativas oficiais. Sobre isso apenas referirei a velha frase
de que "à mulher de César não basta ser séria, tem também que parecê-lo".
Neste caso as parecenças foram más, mas como neste momento a maioria
dos interessados já foi posta ao corrente do assunto, passe-se à frente.

Miguel

Data: 23 de Março de 1999
De: Diana Maria de Sousa Marques Pinto dos Santos
Endereço electrónico: Diana.Santos@informatics.sintef.no
Assunto: a mulher de Ce'sar e no's

Miguel,

Concordo plenamente que além de o ser, é preciso parecer, honesto, e daí
acho que vale a pena mandar uma relação pormenorizada das iniciativas que o
nosso projecto tomou para se dar a conhecer ao mundo e sobretudo, claro,
aos portugueses:

- participámos no Workshop sobre Linguística Computacional da APL em Lisboa
em Maio de 1998, na semana em que o projecto começou
- logo que tivemos uma versão do nosso catálogo de recursos, publicitámo-la
nas seguintes listas: Forum LP, Linguist, Ancib, TermiLat, corpora list
- inscrevemo-nos em todos os motores de procura que encontrámos
- participámos no PROPOR (3.o encontro sobre o processamento do português)
em Porto Alegre (Brasil) em Novembro de 1998 e temos lá um artigo convidado
nas actas (acessível das nossas páginas)
- saiu uma notícia em Dezembro/Janeiro sobre o nosso projecto no LEJournal
- quando (Janeiro/Fevereiro) tivemos a primeira versão da MINHA
contribuição do livro branco -- explicitamente a pedir a colaboração de
todos, note-se --, mandámos para as listas, com excepção do Forum-LP que
tinha misteriosamente acabado. Daí que enviei directamente a mensagem ao
Gabriel Lopes (responsável pelo forum-LP) para a distribuir pelo máximo
número de pessoas. [ É claro que por qualquer razão que me escapa ele não
te achou merecedor desse favor, nem a lista da APPIA ]
- na reunião sobre tecnologias da linguagem promovida pelo EUROMAP em
Fevereiro deste ano em Lisboa, foi apresentado o nosso projecto pelo Dias
Coelho e feita menção ao documento para discussão
- saiu informação sobre o nosso projecto no ELSNews de Fevereiro
- ponteiros para o nosso projecto encontram-se vários, em sítios Web no
Brasil e em Portugal. Tenho pena que não sejam mais, mas claramente a nossa
estratégia de comunicação não resultou :(

Lamento muito que nada disto te tenha chegado - nem aos membros da APPIA.
Gostava no entanto de afirmar e protestar a nossa honestidade através desta
mensagem.

Sobre as contribuições, o calendário para serem distribuídas em papel
(organizado pelo Observatório) durante a reunião de 17 de Abril é esta 6.a
feira (mandar directamente para TCarvalho@oct.mct.pt); para serem motivo de
discussão pública é evidentemente até à reunião e certamente depois (não
fui eu que propus nem o calendário nem a localização, como poderás
calcular). Como afirmo no documento e em todo o lado, comprometo-me a
publicá-las no nosso site logo que mas mandem. Sobre isto gostava de
referir que *ainda não recebi qualquer resposta ou cópia autorizada da
discussão que se passou na APPIAR, e que como disse gostava de tornar
pública aqui*.

Considero que o assunto de privilegiar o português ou o processamento de
linguagem natural é pertinente e não deve ser discutido APENAS num fórum
fechado como a APPIAR com alguns convidados (no qual eu não fui além disso
incluída).

Gostava apenas de afirmar que não foi por acaso, e que me vou esforçar por
explicar esmiuçadamente as razões que me levam a preferir o investimento no
processamento do português em vez de na linguagem natural em geral.
Colocarei um documento sobre essa questão nos próximos dias aqui no nosso
servidor, e informarei a vossa lista sobre isso. Claro está que seria muito
interessante se alguém quisesse em paralelo escrever um documento
defendendo a opinião contrária, e que seria publicado ao lado.

Sobre a questão das garantias institucionais, penso que isso era certamente
dirigido a outros que não a mim, visto que sou eu a única responsável sobre
o documento que escrevi, e não suponho que reflicta a opinião do governo.
Pensava que era suficiente assinar com o próprio nome, e escrever na
introdução que se pretendia estimular a discussão, para não se ser acusada
de falta de transparência. Fico a saber que não é, mas já agora gostava que
me dissessem o que fazer então para o evitar.

Saudações,
Diana
     
P.S.Desde já peço desculpa ao Miguel se a "mulher de César" não se referia
ao nosso projecto e ao nosso documento mas a qualquer outra coisa que me
tenha escapado da discussão a que não tive acesso.
**************************************************************************
Diana Santos				Processamento computacional do português

SINTEF Telecom and Informatics	Tel. (directo) +47 22 06 73 12
Forskningsveien 1			Tel. +47 22 06 73 00
Box 124 Blindern			Fax. +47 22 06 73 50
N-0314 Oslo				Email: Diana.Santos@informatics.sintef.no
Noruega				http://www.portugues.mct.pt/
**************************************************************************

Data: 23 de Março de 1999
De: Miguel Filgueiras
Endereço electrónico: mig@ncc.up.pt
Assunto: Re: a mulher de Ce'sar e no's


Diana.Santos@informatics.sintef.no said:
> P.S.Desde já peço desculpa ao Miguel se a "mulher de César" não se
> referia ao nosso projecto e ao nosso documento mas a qualquer outra
> coisa que me tenha escapado da discussão a que não tive acesso. 

Diana,

Em parte (na menor parte) referia: sendo tu (ao que parece ex-) membro
da APPIA e sabendo tu que existem membros da APPIA interessados nestes
assuntos seria de esperar que mandasses a informação para a lista da
APPIA. É simples, basta usar o endereço APPIAr@ncc.up.pt (para quem não
o saiba: o facto de a distribuição ser feita pelas máquinas da
Universidade do Porto tem apenas um significado histórico e não
representa qualquer relação entre a APPIA ou a sua lista e esta
Universidade!).

Em parte (na maior) não me referia: acho que para a elaboração do Livro
Branco deveriam ter sido contactadas as comunidades científicas interessadas
nos aspectos a debater. Alguém inventou o "Processamento Computacional
do Português", alguém aceitou que ele entrasse como "capítulo" do dito
Livro, e alguém te encomendou um estudo sobre o mesmo. Eu não faço ideia
de quem são os "alguéns" referidos atrás, nem porque actuaram dessa forma
e não de outra (o Luís Moniz Pereira falava há uns dias em "segredo dos
deuses"). Eu só soube do assunto por duas razões: alguém (neste caso,
conhecido!) me fez o favor de passar a tua mensagem, e o OCT mandou-me
uma circular sobre os "Perfis científicos...".

Para debate que se quer público e participado parece pouco...

> [...] gostava de referir que *ainda não recebi qualquer resposta ou cópia
> autorizada da discussão que se passou na APPIAR, e que como disse
> gostava de tornar pública aqui*.

A Palmira Marrafa perguntou-me há dias se eu via inconveniente em
que ela juntasse as mensagens e as tornasse públicas através de uma
página da WWW. Achei que era uma boa ideia e estava à espera que ela
o fizesse. Mas se há urgência, ou a Palmira desistir da ideia, posso
fazer "forward" das mensagens sobre este assunto enviadas com cópia
para a APPIAr (supondo que os respectivos autores se não opõem).

> Considero que o assunto de privilegiar o português ou o processamento
> de linguagem natural é pertinente e não deve ser discutido APENAS num
> fórum fechado como a APPIAR com alguns convidados (no qual eu não fui
> além disso incluída). 

Parece que o dito "fórum fechado como a APPIAR com alguns convidados"
incluiu muito mais interessados que todas as listas que usaste para difundir
a informação. É natural que haja muitos outros interessados que ficam
de fora (por exemplo, pessoas da área do processamento da fala), mas
também nunca foi minha intenção atingir todos os interessados. Quanto
à tua inclusão ou não, já disse o que tinha a dizer na minha mensagem
(não para todos os endereços acima) de resposta ao José João Almeida.

> Sobre a questão das garantias institucionais, penso que isso era
> certamente dirigido a outros que não a mim, visto que sou eu a única
> responsável sobre o documento que escrevi, e não suponho que reflicta
> a opinião do governo. 

Evidentemente. Aliás agradeço que me façam a justiça de considerar que a
atitude que tomei ao escrever aos Presidentes da FCT e do OCT com cópia
ao Ministro da CT e à comunidade científica (que consegui atingir) não
tem qualquer aspecto pessoal relativamente a ti. As questões que me
interessam são as que resumi na minha última mensagem, e obviamente
não espero que sejas tu a dar-lhes resposta.

Miguel

Data: 23 de Março de 1999
De: Antonio Branco
Endereço electrónico: Antonio.Branco@di.fc.ul.pt
Assunto: Re: a mulher de Ce'sar e no's

Miguel Filgueiras wrote:
> 

> > [...] gostava de referir que *ainda não recebi qualquer resposta ou cópia
> > autorizada da discussão que se passou na APPIAR, e que como disse
> > gostava de tornar pública aqui*.
> 
> A Palmira Marrafa perguntou-me há dias se eu via inconveniente em
> que ela juntasse as mensagens e as tornasse públicas através de uma
> página da WWW. Achei que era uma boa ideia e estava à espera que ela
> o fizesse. Mas se há urgência, ou a Palmira desistir da ideia, posso
> fazer "forward" das mensagens sobre este assunto enviadas com cópia
> para a APPIAr (supondo que os respectivos autores se não opõem).
> 

Diana,

Está terminada a construção da página. Falta agora pedir
aos autores das mensagens que verifiquem se está tudo OK.
Prevemos que amanhã de manhã (logo que tivermos o Ok de cada
um dos autores) a página seja anunciada e disponibilizada.

A Palmira está com problemas na ligação ao servidor de email.
Logo que o serviço estiver reestabelecido, ela dará este
esclarecimento a todas as pessoas.
Um abraço,

António

Data: 23 de Março de 1999
De: Palmira Marrafa
Endereço electrónico: Palmira.Marrafa@ip.pt
Assunto: Re: Perfis dos domínios científicos em Portugal

Caros colegas,

Na sequência do pedido que dirigi aos participantes nesta discussão, no
sentido de divulgar as suas mensagens num site criado para o efeito pelos
estudandes do curso de Engenharia da Linguagem e do Conhecimento, gostaria,
antes de mais, de agradecer o terem acedido ao pedido.
Quero também informar que a página está pronta. Falta apenas pedir aos
autores que vejam o que vai estar disponibilizado e nos digam se estão de
acordo. Fá-lo-emos amanhã de manhã, pelo que à tarde a página poderá já
estar acessível.

Cumprimentos

Palmira Marrafa

Data: 24 de Março de 1999
De: Palmira Marrafa
Endereço electrónico: Palmira.Marrafa@ip.pt
Assunto: Re: Perfis dos domínios científicos em Portugal


Caros colegas

Na sequência da minha mensagem de ontem sobre a página que
disponibilizará as mensagens dos intervenientes nesta discussão,
venho confirmar que a mesma está a ser ultimada.
Uma vez que eu vou estar indisponível durante todo o dia, pedi ao
António Branco (que é quem tem estado a dar todo o apoio aos estudantes)
que, logo que esteja pronta, a envie aos autores para aprovação.
Agradecia que as respostas fossem enviadas para o António,
o mais brevemente possível, para que a página possa ser disponibilizada
ainda hoje.
Muito obrigada pela colaboração.
Palmira Marrafa

Data: 24 de Março de 1999
De: Diana Maria de Sousa Marques Pinto dos Santos
Endereço electrónico: Diana.Santos@informatics.sintef.no
Assunto: estatuto das listas e da APPIA em particular


Caros membros da APPIAR,

Desde já agradeço ao Miguel Filgueiras o esclarecimento e a maneira
simpática com que me tratou, separando o meu papel (que penso eu, já foi
agora devidamente esclarecido) do papel das autoridades que me contrataram
e com quem, penso eu, estará agora a dialogar.

Esta nota deve pois ser lida como uma nota estritamente pessoal e não a
representar o projecto em que estou a trabalhar, e é escrita para
esclarecer, como cidadã de um mundo parcialmente digital, algumas coisas
que não me parecem muito claras.

Em primeiro lugar, quero reconhecer publicamente que foi um erro meu não
ter dirigido um mail à APPIAR; confesso que pensei que todos os
interessados em LN da APPIA também estivessem no Forum-LP. Acho, contudo,
que fui a principal prejudicada por esse esquecimento, e espero pois que os
membros da APPIA não me julguem muito mal por isso.

A respeito da questão de listas, contudo, acho que haveria algumas coisas
que deviam ser esclarecidas, e que talvez -- desta vez -- interessem a
todos os elementos da APPIA.

A minha "queixa" no mail anterior sobre não participar na discussão e/ou
não saber o que de facto se passou acho que é reflectida claramente na
minha interacção com o António Branco, "convidado especial", que, após me
ter informado sobre a existência de um debate espontâneo na APPIAR, e tendo
sido instado por mim a mandar-me quer as mensagens quer uma mensagem para a
lista a pedir para eu ser envolvida na discussão, se negou às duas dizendo
que era CONVIDADO e que achava eticamente errado fazer forward de mensagens
destinadas a uma lista fechada. 

Peço aqui publicamente ao António Branco autorização para mandar a
correspondência que tive com ele sobre esse assunto para a presente lista.
Como não estavam em causa questões pessoais nem ele me pediu segredo,
considero eticamente correcto informar as outras pessoas do que pode estar
em causa quando se usam listas electrónicas com cópias para outros
recipientes. Penso que é eticamente defensável fazer forwards de mails de
correspondência profissional sobre assuntos que versam uma dada lista para
a própria lista e demais "convidados" (ou seja, a minha correspondência com
o António sobre este assunto), mas para ser formalmente correcta aqui fica
o pedido formal.

Esta interacção levanta várias questões sobre comunicação electrónica que
me parece interessante aprofundar, sobretudo dada a resposta do Miguel no
primeiro mail dele que recebi de que não sabia se eu estava na APPIAR, o
que me leva à conclusão de que não é possível a qualquer membro saber quem
são os outros, donde não pode assumir, por exemplo, que EU não recebo as
mensagens.

Sobre o comentário do Miguel de que houve mais discussão na lista da APPIA
do que participação naquilo que eu escrevi, noto que não é fácil saber
quantas pessoas me mandaram sugestões, críticas ou comentários (além das
duas que preferiram assinar documentos separados), a única coisa que nós
indicamos é o número de visitas ao nosso site. Mesmo assim estou bastante
satisfeita com algumas sugestões e apreciações encorajadoras sobre o que
escrevi. Por outro, insisto, quero chamar a atenção para o facto de que EU
NÃO RECEBI A MAIOR PARTE DOS MAILS QUE PASSARAM NA APPIAR, e portanto não
posso avaliar quantos interessados de facto se manifestaram. Surpreende-me
que as pessoas que tiveram a iniciativa de os pôr públicos não se tivessem
sequer dignado informar-me do caso, visto que o soube apenas pelo último
mail do Miguel.

E já agora, sim, Miguel, ou o administrador da lista, agradecia que
*alguém* me fizesse forward das ditas várias mensagens, mesmo que as
versões publicáveis sejam retocadas e o estejam a ser para publicação. É só
para eu saber o que se passou, não é para publicar visto que outros o estão
a fazer (e talvez me mandem o endereço?).

Saudações,
Diana

Data: 24 de Março de 1999
De: Miguel Filgueiras
Endereço electrónico: mig@ncc.up.pt
Assunto: Re: estatuto das listas e da APPIA em particular



Diana.Santos@informatics.sintef.no said:
> Desde já agradeço ao Miguel Filgueiras o esclarecimento e a maneira
> simpática com que me tratou, separando o meu papel (que penso eu, já
> foi agora devidamente esclarecido) do papel das autoridades que me
> contrataram e com quem, penso eu, estará agora a dialogar. 

Diana, 

Posso informar que não recebi até o momento qualquer resposta das
autoridades, com a excepção de uma carta do Chefe do Gabinete do Ministro
da C&T agradecendo a minha em nome do Ministro. Já agora, sempre supus
que a FCT ou o OCT te enviassem cópia dessa minha carta.

Quanto à abertura ou não desta discussão: a mim nunca me passou pela
cabeça expor as minhas opiniões apenas aos recipientes destas mensagens.
Como respondi à Palmira Marrafa noutro dia, ao enviar uma mensagem para
uma lista como a APPIAr estou a tornar público o seu conteúdo, pelo que
não tenho qualquer problema em que alguém a reenvie para terceiros
(na sua totalidade e/ou fornecendo o contexto adequado se necessário).

> [...] me leva à conclusão de que não é possível a qualquer membro saber
> quem são os outros, donde não pode assumir, por exemplo, que EU não
> recebo as mensagens.

Para se saber quem está numa lista distribuída pelo sistema usado para
a APPIAr basta enviar uma mensagem ao próprio sistema. No caso vertente:
para majordomo@ncc.up.pt com o texto  who appiar  (não sei se a resposta
estará limitada aos próprios membros da lista). Devo dizer que não usei
esse processo para saber quem está actualmente na lista.

> [...] Surpreende-me que as pessoas que tiveram a iniciativa de os pôr
> públicos não se tivessem sequer dignado informar-me do caso, visto que
> o soube apenas pelo último mail do Miguel.

Ainda ninguém pôs nada a público; cf. as mensagens de ontem e hoje
da Palmira.

> [...] agradecia que *alguém* me fizesse forward das ditas várias
> mensagens, mesmo que as versões publicáveis sejam retocadas e o
> estejam a ser para publicação.

Espero bem que não haja retoques. Como a "publicação" está prevista
para hoje acho que não vale a pena estar a mandar as mensagens uma a
uma.

Miguel

Data: 25 de Março de 1999
De: Diana Maria de Sousa Marques Pinto dos Santos
Endereço electrónico: Diana.Santos@informatics.sintef.no
Assunto: porque portugues e nao PLN?

Caros colegas,

Conforme mencionei em intervenção anterior, pus acessível em
http://www.portugues.mct.pt/branco/Porque.html
um texto que argumenta a favor de investir no processamento computacional
*do português* em vez de noutra área. Coloquei também no mesmo lugar a
carta aberta do Miguel Filgueiras.

O texto é preliminar, e desde já agradeço críticas e contra-argumentos.
Infelizmente só voltarei a ler o meu correio electrónico a partir de 7 de
Abril, e menciono portanto o facto -- que me entristece -- de ainda não me
ter sido possível ler o que afinal se passou na lista da APPIAR, e ter
portanto de esperar até ao meu regresso.

Gostava também de fazer uma crítica pública ao António Branco e à Palmira
Marrafa por se terem disposto avidamente a criar um sítio da Web com
assuntos que pelo menos são vagamente relacionados com o documento que
escrevi (e em que oferecia para publicar o que quer que alguém quisesse
dizer sobre o assunto) e não terem tido sequer o cuidado de me informarem
da sua iniciativa, da qual apenas vim a saber ontem pela nota do Miguel
Filgueiras.

Gostava também de dizer que já fiz o reparo pessoalmente (por e-mail) a
cada um deles, e que isto não é pois uma tentativa de evitar comunicação
directa entre as pessoas. O que me parece é que estão em causa aqui
actuações que podem comprometer gravemente uma discussão aberta sobre um
assunto que me parece que devia ser discutido por todos e não apenas por
aqueles privilegiados que tiveram acesso a um forum de eleitos.

De qualquer maneira, quero mais uma vez agradecer ao Miguel Filgueiras o
facto de ter provocado uma discussão estimulante e dessa forma ter
contribuído para o objectivo do meu texto: discutir a área e os seus
problemas, e produzir um consenso (mesmo que seja contra mim :-) ) dos
investigadores portugueses.

Até depois da Páscoa, as minhas melhores saudações,
Diana 

P.S.Por este meio venho também indicar que quaisquer contribuições minhas a
esta lista podem ser publicadas na Web ou redifundidas em qualquer outro
meio. Gostava apenas que me dissessem aonde...

Data: 25 de Março de 1999
De: "Eng. Ling. e do Conhecimento WebPage"
Endereço electrónico: elcweb@caravela.di.fc.ul.pt
Assunto: Contribuic,a~o dos estudantes de ELC para o Livro Branco


  

  Convidam-se todos os interessados a consultar e a divulgar
a pa'gina http://caravela.di.fc.ul.pt/~elcweb
 
  Nesta pa'gina encontram-se compiladas mensagens de um
debate acerca da iniciativa do MCT para o processamento computacional da
li'ngua portuguesa. Este debate teve origem numa mensagem de Miguel
Filgueiras, a que se seguiu uma discussa~o por alguns dos destinata'rios
da mensagem.

    Esta pa'gina e' da responsabilidade dos estudantes da Licenciatura da
Engenharia da Linguagem e do Conhecimento. Com ela procuramos dar a
conhecer a uma audie^ncia mais vasta um debate importante, o qual tera'
certamente um dos seus pontos mais altos na reunia~o - aberta a todos os
interessados - do dia 17 de Abril de 1999, no Forum Picoas.

    A divulgac,a~o das mensagens e' feita com permissa~o dos
autores, a quem agradecemos a amabilidade.
 
    Solicitamos a Diana Santos, coordenadora do site do MCT para
o Livro Branco sobre o processamento computacional da li'ngua 
portuguesa, que considere esta pa'gina como uma contribuic,a~o dos
estudantes do curso de ELC a ser divulgada nesse site.


   C.A.L.E.L.C. - Comissa~o de alunos da Licenciatura de
                  Engenharia da Linguagem e do Conhecimento.

Data: 26 de Março de 1999
De: Antonio Branco
Endereço electrónico: Antonio.Branco@di.fc.ul.pt
Assunto: Contribuição

Na sequência do debate sobre a política de ciência e tecnologia
para a área da engenharia da linguagem para o período 1999-2007,
convido aqueles que continuam interessados em discutir este assunto
a visitarem:

http://www.di.fc.ul.pt/~ahb/livbranco.html

Aí encontram uma contribuição minha para o livro branco com
o título "Uma Perspectiva de Progresso para a Engenharia da
Linguagem".

Com o intuito de minimizar discussões distractivas, gostaria de
acrescentar uma breve nota prévia acerca do termo "engenharia da
linguagem" que aparece no título:

O termo "linguística computacional" não colhe toda a simpatia
junto dos praticantes com formação inicial em informática;
o termo "processamento de linguagem natural" tem acolhimento
semelhante junto dos praticantes com formação inicial em linguística.
O termo "engenharia da linguagem" é abrangente e tem sido igualmente
bem tolerado pelos dois corpos. A par disso, este é o termo usado pela
principal agência de financiamento europeia, a DG XIII da Comissão 
Europeia, para designar a área (mesmo se no 5º programa-quadro a linha
de acção correspondente a esta área se intitulará Human Language
Technology, para vincar que agora estão interessados em financiar
sobretudo
investigação que produza resultados pré-comerciais). "Engenharia da
linguagem" é também o termo usado pela Agência de Inovação e pela
minha Universidade. Foi o termo usado pelo presidente da Missão para
a Sociedade da Informação e pelo Ministro da Ciência e Tecnologia
no recente seminário de 26 de Fevereiro no Forum Picoas.

Como terão oportunidade de verificar as pessoas que passarem para
lá do título, utilizo com tranquilidade ao longo do texto "processamento
de linguagem natural", "linguística computacional", "processamento
das línguas naturais" e "engenharia da linguagem".

Cumprimentos,
 
António Branco

Data: 26 de Março de 1999
De: "Eng. Ling. e do Conhecimento WebPage"
Endereço electrónico: elcweb@caravela.di.fc.ul.pt
Assunto: Actualizac,a~o


      Devido a dificuldades de comunicaça~o obtivemos so' agora
   a permissa~o para incluir as mensagens de Fernando Pereira.
  
   As respectivas mensagens ja' esta~o inclui'das na pa'gina do 
   debate, que continua disponi'vel em 
   http://caravela.di.fc.ul.pt/~elcweb


  C.A.E.L.C.

Data: 26 de Março de 1999
De: Elisabete Ranchhod
Endereço electrónico: elisabet@label.ist.utl.pt
Assunto: E se falássemos de coisas sérias ? (versão completa)

E se falássemos de coisas sérias ?

Se entre os participantes de um secreto forum, entretanto tornado (em parte) 
público, ainda imperar a máxima - recordada há pouco por uma colega que 
não a partilhava - das empresas que consideram que, de cada vez que 
despedem um linguista, o desempenho dos seus sistemas de processamento 
de linguagem natural aumenta dez por cento, então estou condenada à 
partida.

Contudo, atrevo-me a prosseguir.

De facto, em matéria de processamento de linguagem natural (e, por favor, 
poupem-nos com discussões terminológicas, cujo interesse científico e 
prático é nulo), em matéria de processamento de linguagem natural (PLN), 
dizia eu, longe vão os tempos em que tudo apontava para um mundo perfeito, 
harmónico e auto-suficiente de máquinas inteligentes e de inteligentes 
especialistas em máquinas. 

As linguagens artificiais atingiram rapidamente um nível de desenvolvimento 
suficiente para as aplicações que as utilizavam e esperava-se que elas 
pudessem dar também bons resultados em relação às línguas naturais. Afinal, 
qualquer ser humano, por menos inteligente que fosse, adquiria, memorizava 
e utilizava sem esforço a sua língua materna.

Mas as coisas mudaram. As exigências são, agora, outras. À medida que a 
necessidade de aplicações reais se foi impondo, a insuficiência qualitativa e 
quantitativa dos recursos linguísticos disponíveis foi-se tornando evidente.

Todos os profissionais da área têm consciência do repto que lhes é colocado 
pelos dados específicos das línguas em geral e de cada uma das línguas em 
particular. Esta questão dos dados é ineludível. Mesmo os especialistas em 
sistemas de aprendizagem - que consideram que os recursos linguísticos 
(dicionários, gramáticas, etc.) serão sempre defeituosos e incompletos e que 
as suas lacunas só poderão ser compensadas pela utilização de cálculos 
probabilísticos - avaliam os resultados dos seus trabalhos em função dos 
dados obtidos com esses métodos. É que, seja qual for o modo como são 
obtidos, os dados linguísticos são indispensáveis para o funcionamento da 
maioria das aplicações.

Por isso, ao longo dos cinquenta anos que nos separam do seu aparecimento, 
a área evoluiu muito e tem vindo a mostrar uma maturidade e um 
profissionalismo crescentes. 

O seu carácter pluridisciplinar só por poucos é contestado. Assiste-se cada 
vez mais à colaboração entre especialistas de disciplinas tradicionalmente 
muito afastadas e ligadas a hábitos de raciocínio (que parecem) 
incompatíveis: ciências teóricas, ciências experimentais, técnicas de 
engenharia, humanidades. 

Parece ser cada vez mais consensual que cada um tem o seu papel. Há ainda 
divergências quanto ao papel de cada um.

 E se cada um de nós desempenhasse bem o seu papel e o fizesse de forma 
civilizada ?

Elisabete Ranchhod



Elisabete Ranchhod


====================
Elisabete Ranchhod

IST - Centro de Automática da UTL  
Av. Rovisco Pais 
P - 1049-001 LISBOA (Portugal)

Tel + (351 1) 841 71 71
Fax + (351 1) 841 71 67

http://www.ist.utl.pt/pt/investigacao/

==============

Data: 26 de Março de 1999
De: Gabriel Pereira Lopes
Endereço electrónico: gpl@di.fct.unl.pt
Assunto: Re: estatuto das listas e da APPIA em particular

Não sei como tem decorrido a discussão nos últimos dias. Estou com graves
problemas no acesso ao meu e-mail que é possível que esteja entupido com alguma
mensagem mais longa.

Como é do Conhecimento da Diana Santos a lista forum-LP está fora de circulação
desde pelo menos Dezembro do ano passado. Uma baixa de tensão danificou o disco
em que estava não só informação da lista como muita outra informação.

Acredito que nesta altura a Diana já tenha tido acesso à minha posição
publicamente expressa e que por tal motivo não necessitaria de retoques porque
era pública, publicada na rede da APPIA e tornada pública nos e-mails das
pessoa que faziam parte da lista de discussão que me chegou.

Neste e-mail segue em apêndice o documento que enviei há pouco mais de duas
horas para o endereço que era indicado na mensagem de Diana Santos
(TCarvalho@oct.mct.pt). Mando apenas o rtf do documento que escrevi à pressa
mas que está escrito e que representa uma posição alternativa à posição
avançada na página do MCT. Não sei se representa algumas das preocupações dos
actores tradicionais e não tradicionais da área de Processamento Computacional
de Língua Natural. Não tive tempo de divulgar o documento antes de o enviar
para o ministério e por isso este documento representa tão só a minha posição
sobre o assunto, embora reflicta algumas preocupações que foram expostas
durante a discussão na lista da APPIA. A 17 de Abril estarei aí para discutir
os documentos apresentados embora não conheça nem como vai decorrer essa
reunião, nem como está programada, nem quem está previsto que esteja presente.

Até Lisboa a 17 de Abril

Gabriel Perira Lopes

Data: 26 de Março de 1999
De: "Samuel M. Eleuterio"
Endereço electrónico: samuel@label2.ist.utl.pt
Assunto: Na~o esquec,amos os nossos objectivos


Não esqueçamos os nossos objectivos
===================================

Tenho assitido com estupefacção a uma discussão
razoavelmente estéril sobre os documentos do Livro Branco
no domínio do PLN (passo aqui por cima das bizantinices 
dos sub.sub. ... .sub.domínios ou da maior ou menor 
conveniência que cada um tem na designação).

Sou um dos subscritores do documento "Proposta de Estruturação 
da área do Processamento Computacional do Português" e fi-lo
porque me pareceu útil participar, com a minha
modesta contribuição, numa discussão pública que pode levar a 
resultados úteis e à definição dos objectivos da política científica
e tecnológica desta área.

A princípio quis acreditar que as posições iniciais do
Miguel Filgueiras e, depois, do Gabriel Lopes não passassem de arrufos
de mau humor naturais num país onde tanta coisa se passa nos 
nossos domínios à margem da comunidade científica.
Tenho inclusive tornado públicas posições bastante críticas ao modo 
como se desenrolaram certos processos. Devo, ainda, confessar que 
compreendi perfeitamente o desabafo inicial do Moniz Pereira da 
mesma maneira como compreendi e concordo, em linhas gerais, com as 
suas posições posteriores.

Parece-me mais importante, neste momento, discutirmos as questões 
que se prendem com as condições objectivas 
da área do que prosseguir uma linha mais ou menos insultuosa
que visa os métodos seguidos até aqui.

A definição das áreas aqui em jogo não é uma questão meramente 
académica. Creio que todos estamos de acordo em que é difícil 
justificar que grupos que não tenham competência técnica em
linguística possam dedicar-se ao tratamento do português.
Seguindo o exemplo já dado da Física, seria absurdo considerar que
grupos sem físicos se intitulassem como grupos de Física...

No entanto, este argumento (como os anteriormente usados) não pode
ser transposto mecanicamente para o domínio do PLN. Só a deficiente
compreensão do carácter intrinsecamente interdisciplinar desta área 
poderá conduzir a não compreender a necessidade de esforços 
conjugados para o seu desenvolvimento.

O debate que se iniciou a partir do Livro Branco só poderá ser útil
se formos capazes de definir os objectivos que procuramos atingir
e os meios desejáveis para os podermos concretizar. 

Os objectivos que definimos e as condições necessárias que 
caracterizámos no documento atrás referido visavam 
colmatar deficiências graves que julgo serem sentidas pela
maioria dos investigadores deste domínio (ou domínios afins).

Só numa visão limitada e castrante se pode admitir que uma área
científica pode sobreviver ignorando as áreas envolventes. Ao
defendir, com particulares cuidados, o aparecimento de um Complexo
não foi minha intenção (nem pode ser essa a interpretação) criar
um clube de amigos.

É provável que no calor destas discussões informais se tomem,
sem querer, posições que conduzem objectivamente ao bloqueio
de qualquer alternativa positiva à situação actual.

Parece-me essencial tomar medidas urgentes no sentido de assegurar
à Língua Portuguesa um lugar digno no quadro europeu e mundial e
considero-o um objectivo estratégico da política portuguesa.

Sugeria, pois, aos participantes neste forum que nos centrassemos
mais neste objectivo construtivo e deixássemos para trás interesses
(ou querelas) que apenas contribuem para atrasar ainda mais as
urgentes medidas a tomar.

Samuel Eleutério

CAUTL - Instituto Superior Técnico

Data: 08 de Abril de 1999
De: Diana Maria de Sousa Marques Pinto dos Santos
Endereço electrónico: Diana.Santos@informatics.sintef.no
Assunto: discussao publica

Caros interessados no processamento computacional da língua portuguesa,

Disponibilizei as duas novas contribuições (de António Horta Branco e José
Gabriel Pereira Lopes) no nosso servidor, assim como apontei para a
"contribuição" de um grupo de estudantes, conforme expressamente pedido
pelo CALELC.
Tornei também públicas as mensagens que me foram mandadas directamente
sobre o assunto da discussão, e que desde já agradeço.

Essa nova informação encontra-se em
http://www.portugues.mct.pt/branco/reaccoes.html, também acessível a partir
da página principal do nosso servidor seleccionando o item "Documentos".

Agradecendo toda e qualquer comunicação, reitero aqui o compromisso de a
tornar pública e de sobre ela reflectir,

Diana
**************************************************************************
Diana Santos				Processamento computacional do português

SINTEF Telecom and Informatics	Tel. (directo) +47 22 06 73 12
Forskningsveien 1			Tel. +47 22 06 73 00
Box 124 Blindern			Fax. +47 22 06 73 50
N-0314 Oslo				Email: Diana.Santos@informatics.sintef.no
Noruega				http://www.portugues.mct.pt/
**************************************************************************

Data: 12 de Abril de 1999

De: Palmira Marrafa 

Endereço electrónico: Palmira.Marrafa@ip.pt

Assunto: Processamento_computacional_da_língua_portuguesa__e_Engenharia_da_Linguagem_e_do_Conhecimento 

Caros colegas, 
Na sequência do nosso debate electrónico, gostaria

de fazer algumas observações.
No documento "Processamento computacional da língua

portuguesa: documento de trabalho", encomendado pelo Ministério da 
Ciência e Tecnologia a Diana Santos, em particular na secção

"Política de formação na área do processamento 
computacional da nossa língua", é referida a licenciatura em 
Engenharia da Linguagem e do Conhecimento. Na qualidade de coordenadora, pela 
Faculdade de Letras, desta licenciatura, cabe-me clarificar o seguinte: 

Em http://www.portugues.mct.pt/ensino.html 
pode ler-se que esta licenciatura é da Faculdade de Ciências da 
Universidade Lisboa.
A licenciatura é uma licenciatura de duas faculdades da 
Universidade de Lisboa: a Faculdade de Letras e a Faculdade de Ciências (o

coordenador pela Faculdade de Ciências é o Prof. Helder 
Coelho).

Em http://www.portugues.mct.pt/branco/formacao.html pode ler-se que "Não existe formação 
apropriada a nível universitário de fonética". 

Esta licenciatura inclui duas disciplinas obrigatórias 
neste domínio: "Fonética para a Síntese e o 
Reconhecimento da Fala" (4º ano, 1º semestre) e 
"Síntese e Reconhecimento da Fala" (4º ano, 2º 
semestre), da responsabilidade do Departamento de Linguística Geral e 
Românica. 
Ver também planos curriculares das licenciaturas de 
Linguística e de Línguas e Literaturas Modernas em todo o 
país. Ver igualmente cursos de Mestrado das diferentes universidades.

Em http://www.portugues.mct.pt/branco/formacao.html pode igualmente ler-se que não existe "qualquer cadeira 
(ou formação) em Métodos Estatísticos". 

A licenciatura em Engenharia da Linguagem e do Conhecimento 
inclui a disciplina obrigatória de "Estatística Descritiva e 
Análise de Dados" (1º ano, 1º semestre), da 
responsabilidade do Departamento de Estatística e 
Investigação Operacional.
Com os melhores cumprimentos,
Palmira Marrafa
===============================================================
Palmira Marrafa
Universidade de Lisboa
Faculdade de Letras - Departamento de Linguística Geral 
e Românica
Alameda da Universidade
1699 Lisboa Codex
Tel: 7920000
Fax:7960063
email: Palmira.Marrafa@ip.pt

Data:  13 de Abril de 1999

De: Diana Maria de Sousa Marques Pinto dos Santos 

Endereço electrónico: Diana.Santos@informatics.sintef.no

Assunto:  formacao e informacao

At 20:06 12.04.99 +0100, Palmira Marrafa wrote: 

>>>>

Caros colegas, 

Na sequência do nosso debate electrónico, gostaria de fazer algumas
observações.

<<<<<<<<

Gostava de chamar a atenção para o facto de que estas "observações" não
têm nada a ver com um debate, mas são sim informações factuais que me
deviam ter sido mandadas directamente, sendo que a Palmira Marrafa desde
há muito que me vem "prometendo" feedback ao meu documento.

Além disso, gostava também de chamar a atenção para o facto de que as
citações nem sequer se encontram correctas. Desde ontem às 14h (dia 12 de
Abril) que há uma versão actualizada do documento, em que estes pontos
foram de facto alterados. No entanto, e como me responsabilizo
evidentemente também pela versão anterior, datada de 9 de Fevereiro,
gostava de responder em pormenor à mensagem da Palmira Marrafa.

>>>>

No documento "Processamento computacional da língua portuguesa: documento
de trabalho", encomendado pelo Ministério da Ciência e Tecnologia a Diana
Santos, em particular na secção "Política de formação na área do
processamento computacional da nossa língua", é referida a licenciatura
em Engenharia da Linguagem e do Conhecimento. Na qualidade de
coordenadora, pela Faculdade de Letras, desta licenciatura, cabe-me
clarificar o seguinte: 

Em http://www.portugues.mct.pt/ensino.html pode ler-se que esta
licenciatura é da Faculdade de Ciências da Universidade Lisboa.

A licenciatura é uma licenciatura de duas faculdades da Universidade
de Lisboa: a Faculdade de Letras e a Faculdade de Ciências (o
coordenador pela Faculdade de Ciências é o Prof. Helder Coelho).

Em http://www.portugues.mct.pt/branco/formacao.html pode ler-se que
"Não existe formação apropriada a nível universitário de fonética".

Esta licenciatura inclui duas disciplinas obrigatórias neste domínio:
"Fonética para a Síntese e o Reconhecimento da Fala" (4º ano,
1º semestre) e "Síntese e Reconhecimento da Fala" (4º ano,
2º semestre), da responsabilidade do Departamento de Linguística
Geral e Românica.

Ver também planos curriculares das licenciaturas de Linguística e de
Línguas e Literaturas Modernas em todo o país. Ver igualmente cursos
de Mestrado das diferentes universidades.

<<<<<<<<

Estão aqui misturadas duas questões. A primeira é a da abrangência do
catálogo "ensino.html" compilado, com base na nossa própria procura na
Web e na correspondência electrónica recebida. A segunda é a questão
das afirmações que faço na minha contribuição para o livro branco, e
que *não são baseadas nesse catálogo*.

De facto, o catálogo que compilámos informalmento em ensino.html foi
citado pura e exclusivamente para indicar que há sinais positivos na
área, e não como demonstração das afirmações que faço abaixo. Repito
aqui o contexto em que é mencionado: "embora já haja alguns sinais
positivos: uma licenciatura em engenharia da linguagem e um curso de
pós-graduação em linguística computacional, assim como várias cadeiras
de especialização ministradas em mestrados de âmbito mais geral,
veja-se http://www.portugues.mct.pt/ensino.html)."

Em relação ao conteúdo do próprio catálogo, informo aqui que pedi para
as pessoas me mandarem informação sobre ensino na área ainda para o
Forum-LP (pedido enviado a 7 de Dezembro de 1998). O Forum-LP, para
aqueles que o não saibam, era uma lista dedicada a todos quantos se
interessavam pela língua portuguesa, gerida pelo grupo do Gabriel
Lopes e anunciada internacionalmente. Retiro a conclusão de que se não
mandaram, era porque não consideravam que esta informação fosse de
facto pertinente.

Em relação à quantidade de referências sobre fonética para o
processamento da fala que a Palmira parece dar a entender que faltam,
de facto sobre elas não recebemos até agora qualquer indicação da sua
existência. Talvez porque a fonética ensinada nas licenciaturas
Arial"de Linguística e
Literaturas Modernas em todo o país" não tem de facto muita relação
com o processamento de fala? Isto é apenas uma pergunta... os
responsáveis dessas ditas licenciaturas e mestrados são evidentemente
convidados para informar todo o público e o povo português em geral
dos passos que dão na formação dos alunos de forma a incentivar o
processamento computacional da língua portuguesa . Se o não fizeram
até agora, podem ainda fazê-lo no dia 17, e em geral por todos os
meios que as universidades têm ao seu alcance. As listas de actores e
recursos PRESENTES NA WEB nunca foram consideradas exaustivas...

>>>> Em http://www.portugues.mct.pt/branco/formacao.html pode
igualmente ler-se que não existe "qualquer cadeira (ou formação) em
Métodos Estatísticos".

A licenciatura em Engenharia da Linguagem e do Conhecimento inclui a
disciplina obrigatória de "Estatística Descritiva e Análise de Dados"
(1º ano, 1º semestre), da responsabilidade do Departamento
de Estatística e Investigação Operacional.  <<<<<

A observação acima é de facto um exemplo gravoso de utilização abusiva
de citações fora do contexto. O que está no meu documento e sempre
esteve foi:

"Apesar de grande parte do trabalho em processamento de linguagem
natural ser baseado em métodos estatísticos, parece não existir
qualquer cadeira (ou formação) nessa área em Portugal (cadeiras de
introdução à estatística são obviamente insuficientes, embora
necessárias)."

Ou seja, explicando melhor, *parece não existir qualquer cadeira em
"processamento de linguagem natural baseado em métodos estatísticos".*

E repito, "cadeiras de introdução à estatística são obviamente
insuficientes, embora necessárias". Se a Palmira pensa que a cadeira
"Estatística Descritiva e Análise de dados" (ver programa abaixo) é de
facto uma cadeira de "processamento de linguagem natural baseado em
métodos estatísticos", então realmente não falamos a mesma língua!

Conteúdo de
http://www.di.fc.ul.pt/licenciaturas/lelc/disciplinas/descricao.html#edad:

Excerto: Tratamento preliminar de dados. O diagrama de caule-e-folhas,
ordenador parcial e revelador da forma da
distribuição. Características amostrais. Comparação de diagramas de
caule-e-folhas e de histogramas. A forma da cauda da
distribuição. Letras-resumo como estatísticas ordinais
seleccionadas. Caixa de 5 letras-resumo e de

2k+1 letras-resumo. Caixas-de-bigodes. Transformações-potência
homogenizadoras da dispersão. Transformações de dados. Simetrização;
linearização de relações.

Relação funcional entre duas variáveis. Rectas dos mínimos quadrados e
alternativas resistentes. Um olhar sobre os resíduos. Provas binomiais
e aplicações na abordagem não paramétrica a problemas simples.

Gostava aliás de pedir a todos quantos lêem estas mensagens que
separem a informação factual, que agradeço que me seja mandada, das
questões de debate sobre o que se deve ou não fazer na área. E gostava
de notar que se as pessoas estão de facto interessadas em que a
informação seja veiculada claramente, basta mandarem-nos -- não é
preciso cópia para o resto do mundo -- as correcções factuais. Repito
o que está presente nas nossas páginas "Por favor envie comentários,
contribuições e críticas para projecto@informatics.sintef.no. "

Sobre a formação, é minha convicção de que há muito por fazer. Se
outros têm outra opinião, porque é que não a escrevem e a tornam
pública para discussão?

Ou porque é que não compilam (por exemplo, pessoas especialistas em
fonética, que não é evidentemente o meu caso) catálogos e
bibliografias que possam dar uma visão mais completa do que se faz em
Portugal?

Não foi esse o meu obectivo ao compilar os vários catálogos que
apresentamos nas nossas páginas. Tentei apenas dar UM contributo para
a comunidade se conhecer melhor.

E insisto, é preciso "Transparência, participação e COLABORAÇÃO de todos".

Diana

Data:  15 de Abril de 1999

De: Miguel Filgueiras 

Endereço electrónico: mig@ncc.up.pt

Assunto: Discussao publica sobre Processamento de Linguagem Natural

Para conhecimento dos interessados, segue cópia de um texto
que preparei para a sessão de discussão pública do próximo
sábado e que enviei para o Observatório das Ciências e Tecnologias
para distribuição aos participantes.

Miguel Filgueiras

----------------

Comentário sobre o tema do chamado Processamento Computacional
da Língua Portuguesa

Miguel Filgueiras

DCC-FC & LIACC, Universidade do Porto
R. do Campo Alegre 823 / 4150 Porto
email: mig@ncc.up.pt

13 de Abril de 1999

O presente escrito foi elaborado por não me ser possível aceitar o
convite para apresentar oralmente um comentário na sessão de discussão
pública sobre Processamento Computacional da Língua Portuguesa
promovida pelo Observatório das Ciências e Tecnologias e pela Fundação
para a Ciência e a Tecnologia no âmbito dos trabalhos de preparação do
Livro Branco do Desenvolvimento Científico e Tecnológico Português
(1999-2007).

Apresentarei os meus pontos de vista sobre os seguintes pontos

1) designação do tema
2) estado actual da área em Portugal
3) medidas que poderão levar a um desenvolvimento da área em Portugal
4) erros a evitar

e terminarei com alguns comentários finais.

1. Designação do Tema

Em carta dirigida às instâncias governamentais competentes e feita
circular por correio electrónico junto de vários membros da comunidade
científica portuguesa, considerei ser muito estranha a designação
escolhida para o tema em análise e o facto de lhe estar a ser dado um
tratamento semelhante ao de domínios científicos universalmente
reconhecidos como tal. Não irei repetir os argumentos apresentados
nessa carta, à qual não obtive qualquer resposta das referidas
instâncias.

Na discussão que a sua publicitação por correio electrónico suscitou,
foi sugerido que tal designação não seria mais que uma mera etiqueta
para efeitos políticos, e não pretenderia ter qualquer efeito redutor,
ou de afastamento daqueles que pretendem fazer, ou continuar a fazer,
investigação no campo, já há muito estabelecido, conhecido pelos nomes
de Processamento de Linguagem Natural (falada ou escrita), Linguística
Computacional, ou Engenharia da Linguagem --- que aqui referirei pelo
nome genérico de Processamento Computacional de Línguas e pela sigla
PCL. A ter fundamento esta sugestão, considero ser essencial que
oficialmente seja dito, escrito e, principalmente, cumprido aquando da
atribuição de financiamentos que os referidos redução e afastamento
não terão lugar. Considero ainda que, apenas para não se dar uma
imagem de ignorância, seria preferível que as instâncias
governamentais passassem a tratar o tema não como um domínio
científico, mas como uma área à qual, por razões que ainda não foram
oficialmente explicitadas de forma clara, foi decidido conceder um
financiamento especial através de um programa específico.

Diana Santos, a quem foi encomendado pelo Ministério da Ciência e
Tecnologia um documento sobre este tema, defende, num documento
disponibilizado na World Wide Web, que a ênfase deve ser de facto no
tratamento do português. As razões que apresenta são, algumas, um
total contra-senso (por exemplo, que seja mais abrangente o estudo de
uma língua, o português, em vez de o estudo de várias línguas, ou que
o estudo do português englobe quase toda a Ciência), e, outras,
contraditórias (por exemplo, ao criticar a atitude de certos
investigadores ao considerarem o inglês como "a linguagem natural" e,
ao mesmo tempo, tomar uma atitude semelhante ao querer restringir o
estudo ao português). Quero acreditar que tais razões não irão ser
tomadas como boas por quem tenha de tomar as decisões nesta matéria,
tanto mais que, em certa medida, contrariam o muito louvável esforço
de internacionalização do sistema científico português a que se tem
assistido nos últimos anos. Em consequência, no que se segue
considerarei que a sugestão que mencionei no parágrafo anterior é
fundamentada e que o tema de que se está a tratar é o Processamento
Computacional de Línguas, sem obviamente se esquecer que o português é
uma das línguas que deve ser considerada.

2. Estado actual da área em Portugal

Em Portugal, e com excepções pontuais que confirmam a regra, são pouco
comuns as colaborações entre investigadores com formação de base na
Linguística e os que têm um formação de base na Informática, sendo
também ainda raros os investigadores que tenham uma formação mista. O
número de equipas de investigação activas na área não deve ser
superior a 15, o que multiplicado por uma dimensão média de 6
(provavelmente exagerada), me leva a supor não existirem mais de 100
investigadores activos --- claro que não estou a incluir todas as
áreas que tenham ou possam ter ténues ligações com o PCL. Por outro
lado a quantidade e/ou a qualidade da produção científica na área são
relativamente pequenas. Esta conclusão é evidente dos números
coligidos por António Branco na sua muito valiosa contribuição para
esta discussão: 6 comunicações (num total de 2.000) desde 1990 nas
três conferências internacionais de maior relevo na área, e bastante
menos de 10 doutoramentos desde 1979.

3. Medidas que poderão levar a um desenvolvimento da área em Portugal

Não é fácil imaginar medidas que no curto e médio prazo possam
melhorar muito o panorama apresentado atrás. É para mim claro que não
se poderá avançar nesta área sem haver, ou um número suficiente de
investigadores com formação mista, ou uma forte colaboração entre
investigadores com formação num e noutro domínio.

Aumentar o número de investigadores de formação mista é claramente a
via mais promissora, mas eventualmente incompatível com os prazos que
se queira estabelecer. Para fomentar tal aumento, deveria ser
incentivada a criação de cursos de licenciatura e/ou mestrado e o
eventual reforço da única licenciatura deste tipo já existente: a
licenciatura em Engenharia da Linguagem e do Conhecimento, da
responsabilidade das Faculdades de Ciências e de Letras da
Universidade de Lisboa. Um dos incentivos absolutamente necessário
seria o da criação de perspectivas de emprego para os formandos de
tais cursos, sob pena de se estar a formar futuros desempregados.
Suponho ser claro, por um lado, que o papel do Ministério da Ciência e
Tecnologia neste aspecto seria o de garantir a existência de condições
minímas de estabilidade numa carreira de investigação, e, por outro
lado, que o lançamento ou reforço de licenciaturas só poderia ter
cabimento se for previsível um aumento substancial e sustentado do
número de investigadores na área --- caso contrário, seria apenas
necessário o apoio a cursos de mestrado. Em paralelo, deveria ser
criado um programa de bolsas de doutoramento na área priveligiando a
inserção de linguistas em equipas de informáticos e vice-versa.

O fomento de um forte grau de colaboração entre investigadores
linguistas e investigadores informáticos parece-me mais difícil de
atingir, mas poderia ser realizado através do estabelecimento de uma
maior prioridade no financiamento de projectos com equipas mistas, e
de medidas rigorosas de acompanhamento e avaliação de tais
projectos que garantissem a existência real dessa colaboração.

A criação e disponibilização de recursos linguísticos poderia ser
incentivada do mesmo modo, dando prioridade no financiamento de
projectos que as garantissem. As questões relacionadas com direitos de
autor poderão ser solucionadas, quer através do estabelecimento de um
repositório nacional de recursos linguísticos que cobraria esses
direitos, quer através de mecanismos de licenciamento do tipo
habitualmente usado para software que permitissem a difusão livre para
efeitos de investigação sem fins lucrativos. Um modelo possível para
um tal repositório nacional é o criado pela European Language Resources
Association.

Em resumo, o financiamento acrescido para a área deveria ser aplicado
no incentivo à criação ou reforço de cursos universitários para
formação de investigadores na área, criação de emprego para tais
investigadores, criação de um programa de bolsas para doutoramento
"trans-disciplinar", e suporte a projectos de investigação, com
prioridade aos que garantissem uma efectiva colaboração
interdisciplinar entre linguistas e informáticos e a criação e
disponibilização de recursos linguísticos.

4. Erros a evitar

Para quem conheceu de perto o insucesso do projecto EUROTRA, que só
não foi estrondoso por ter sido politicamente abafado, é evidente que
qualquer solução que passe pela criação de um programa único de
investigação, ou criação de um único centro (ou complexo) de
investigação na área, é completamente inadequada. Para quem não
conhece a história do EUROTRA, bastará talvez referir que este contava
com uma equipa central que ditava os rumos a seguir pelas equipas
existentes em cada país da Comunidade Europeia. Embora tenha sido
gasta uma quantidade astronómica de dinheiro, os objectivos iniciais
ficaram muito longe de serem alcançados, em grande parte porque as
abordagens escolhidas e impostas pela equipa central não se mostraram
adequadas. Um financiamento da mesma ordem de grandeza distribuído por
equipas trabalhando independentemente teria tido, com toda a certeza,
resultados bem mais palpáveis. Esta foi a conclusão a que a Comissão
Europeia chegou, pois os financiamentos para a área passaram a ser
canalizados para o apoio a projectos independentes, em moldes
idênticos aos adoptados noutras áreas.

A criação de um único centro (ou complexo) de investigação na área,
para além dos problemas inerentes à centralização que acabei de
referir, levantaria ainda problemas práticos impossíveis de resolver:
seria ingenuidade supor que todos os investigadores interessados na
área quereriam colaborar entre si, e que os investigadores não
residentes em Lisboa (Lisboa porque obviamente, como é tradição em
Portugal, tal centro nunca iria ser criado na "paisagem") quereriam
mudar de residência para poderem participar, cabalmente, nas
actividades de tal centro.

Um aspecto essencial é o de garantir a qualidade e quantidade da
produção científica que seja de esperar da investigação que venha a
ser financiada. Deverão para tal ser adoptados processos de avaliação
e acompanhamento independentes e rigorosos, e tiradas sem hesitações
as conclusões lógicas de avaliações negativas (o que nem sempre foi
feito no passado). Atendendo aos indicadores que referi atrás e que
mostram a actual pobreza dessa produção, esta atitude é absolutamente
necessária, a menos que se queira despender dinheiro sem se olhar a
objectivos.

5. Comentários finais

Não posso deixar de terminar este comentário com uma breve referência
aos aspectos de organização da discussão em torno deste tema. Foi
completamente infeliz a ideia de encomendar um documento a um único
investigador, e esperar que a partir desse documento se obtivessem
outras posições. Em primeiro lugar, independentemente da capacidade
desse investigador para realizar um trabalho de bom nível e para
dialogar com outros interessados antes de o levar a cabo, tal
documento apareceria sempre ligado a perspectivas e interesses
pessoais que, numa área heterógenea como esta, nunca iriam ser
partilhados por muitos outros investigadores. Colocou-se assim, e de
modo gratuito, uma pessoa numa posição pouco sustentável. Em segundo
lugar, obter posições de outras pessoas por reacção é um método
claramente impróprio: não é certamente o melhor ponto de partida para
a tomada de uma posição a leitura de um documento com que não se
concorda ou que se considera mal elaborado. Teria sido preferível que
a comunidade interessada na área tivesse sido informada atempadamente
de que as instâncias governamentais tinham seleccionado a área para
financiamento especial, e que quem quisesse pudesse apresentar a sua
posição sobre o assunto.

Do modo como todo o processo se desenrolou ficam uma série de dúvidas,
acompanhadas, como não pode deixar de ser, de uma série de boatos e
suspeitas. Enfim, uma situação que poderia e deveria ter sido evitada.

Última actualização: 22 de Julho de 2003.
Perguntas, comentários e sugestões