Professora Isabel Trancoso -- INESC
Queria também começar por agradecer o convite para estar presente neste debate. Eu acho que debates deste tipo são importantíssimos, achei particularmente óptima a ideia de convidar colegas que vivem no estrangeiro e que realmente, acho que trouxeram um contributo bastante importante para esta discussão, eu acho que subscrevo completamente todas as palavras que ouvi ao Professor Fernando Pereira, gostei imenso de ouvir o parecer dum... dum Professor alemão sobre um projecto Verbmobil, um daqueles projectos que dá quantidade de financiamento... tem tornado quase verdes de inveja todos os outros países da Europa, no mínimo... e gostava de começar esta minha intervenção por um pedido de desculpas, em particular à Diana, uma amiga de longa data que muitas vezes me disse – envia a tua contribuição para este documento, é importantíssimo ter opinião das pessoas da área do processamento da fala... a minha única desculpa, realmente, foi uma absoluta falta de tempo. Bom, eu li o documento assim há relativamente pouco tempo... o melhor que eu consegui no meio de tanto comitê a que tenho pertencido ultimamente...gostaria de realçar alguns pontos: eu acho que o levantamento de recursos, de projectos e de equipas... que a Diana fez é extremamente positivo, pode ser muito incompleto, mas cabe-nos a nós todos aqui assim contribuir para completá-lo, eu acho que o facto de ter existido um levantamento sem nos obrigar a projectos intermináveis de preenchimento de inquéritos, que apenas olhando para o que existe disponível na Web e noutros meios de estudo do Ministério, acho que foi extremamente importante e é importante que continue a ser actualizado e que nós todos mandemos as nossas contribuições para o enriquecer mais. No que diz respeito à avaliação em projectos, e à validação de recursos que também é mencionada nesse documento, concordo absolutamente, acho que é sobretudo importante tirar partido do que existe hoje realmente, em fóruns de discussão que já existam em vez de estar a criar tudo a partir do nada... criar, digamos, organizações burocráticas que... enfim seja mais uma camada burocrática entre os organismos de financiamento e as instituições de investigação e desenvolvimento talvez não seja a melhor maneira... por exemplo... eu gostava aqui de mencionar que nós temos organizado, têm sido organizadas várias edições do que agora se chama "encontro PROPOR, processamento do português"... a quarta edição vai ser em Setembro deste ano, e eu queria desde já alertar-vos para a oportunidade de todos continuarmos discussões deste tipo num fórum desses, e queria agora também falar um bocadinho de recursos. Já foram muito debatidos aqui, eu subscrevo basicamente a... as estratégias de financiamento e disponibilização que estão mencionadas no documento... gostaria de reforçar a importância da validação de recursos. Nós temos, temos estado bastante empenhados ultimamente na... na criação de recursos sobretudo de corpora de fala, anotados a vários níveis... léxicos de pronúncia, por exemplo, e já fomos validados em alguns destes, destes projectos de criação de recursos ... que eram projectos de índole europeia. E, acho que foi importantíssimo, sei lá, uma das vezes, na vez do léxico de pronúncia por acaso até fomos avaliados por um... por um professor brasileiro, mas... à parte o facto de que ele não tinha uma pronúncia exactamente igual à que nós estávamos à espera, foi importante ter o contributo. Doutra das vezes em que construímos um corpus de fala para cinco mil falantes através através da rede telefónica, fomos avaliados por uma instituição que concorreu para esse financiamento, uma instituição europeia, e que conseguiu detectar falhas que são, que aparecem sempre quando se constroem corpora desta dimensão, e... e, sei lá, havia três ficheiros que tinham conteúdo zero. Havia...na transcriçãodo ... léxico, o nosso léxico associado tinha lá uns hífens que não eram obviamente símbolos fonéticos, mas enfim, ... decorriam do que estava na ortografia e nós mantivemo-los lá por uma questão de clareza, todas essas pequeninas coisas que... dificultam o processamento automático depois do corpus, por outros... por outros grupos, portanto eu acho que isso é extremamente importante. No que diz respeito ao serviço de desenvolvimento de recursos e de ferramentas partilháveis que também é mencionado no documento, mais uma vez acho que nós devemos fomentar sinergias que já existam, evitando redes que... no papel, como a própria Diana diz... no que diz respeito à formação... esta área, como aqui foi várias vezes salientada, é extremamente interdisciplinar... e acho que essa... isso deve ser reforçado a nível da formação... eu neste momento sou coordenadora do curso de engenharia electrotécnica do Instituto Superior Técnico... e aqui há umas semanas atrás pedi aos vários docentes do meu departamento para proporem disciplinas de opção... há quase mais disciplinas de opção do que alunos inscritos. Mas o que eu achei curioso foi ver que vários... muitos, muitos, uma percentagem muito significativa punha uma cruzinha no... no sítio do formulário onde dizia que aceitavam leccionar uma disciplina sem créditos. Isso para mim significou que, nós docentes, estamos muito interessados em ensinar, em arranjar equipas que estejam a trabalhar nas áreas em que nós queremos ensinar, e que portanto, talvez com colaborações... que não envolvem uma burocracia extrema, porque as nossas universidades são máquinas burocráticas extremamente pesadas, a gente possa a pouco e pouco, através de colaborações bilaterais, quase pontuais, e à medida que seja preciso tapar algumas lacunas do processo de formação hoje em dia. A nível do processamento do português falado... a massa crítica que existe hoje em dia no país é claramente insuficiente, somos muito, muito poucos. E se juntarmos a isso ao facto de todos nós termos uma forte acumulação com funções docentes, percebe-se porque é que ainda não... ainda estamos no ponto em que estamos. No que diz respeito... ao processamento, à definição do processamento do português com área prioritária, eu aqui salientava que... no fundo nós temos que mostrar como a, a... sermos capazes de nos desenvolvermos nas áreas onde temos as melhores competências, e no processamento do português somos obviamente aqueles que, à partida, teremos mais hipóteses de ser competentes, portanto acho que faz sentido... no entanto a designação para mim não interessa muito desde que haja lá a ênfase no processamento do português... salientava aqui que a comissão europeia está agora a preparar as linhas de acção básica para o programa das Human Languages Technologies do ano dois mil, e que eu considero importantíssimo como uma instituição de financiamento... a nível nacional, tivesse um papel activo neste tipo de painéis, portanto sugiro que haja uma forte interligação com isso. Só para salientar também que... lá for a há bastantes instituições interessadas nestes tipos de problemas, transcrevi aqui, aliás traduzi... o que no site, no Website da ARPA vinha explicado como sendo a missão deles, permitir aos computadores ouvir e ler, bem como compreender o que ouvem e lêem, e acho que nós ainda estamos muito, muito longe disso, e chamava também a atenção para uma chamada conjunta de propostas em projectos entre... a parte da comissão europeia que trata da engenharia linguística e a NSF sobre, num programa que é Multilingual Information Acess and Managemment, acho que isso também salienta bem a importância crescente desta área. Um problema que eu acho que não foi mencionado com a importância que ele tem para, pelo menos para as pessoas que estão a trabalhar em processamento de fala, é a relação com as grandes multinacionais que neste momento têm... estão já a desenvolver produtos para n línguas. Bom, eu cito aqui, peço desculpa por nem ter tentado traduzir, mas queria manter o rigor da citação, uma frase que apareceu no UK Engineering and Physical Sciences Research Council, e que diz mais ou menos isto: 'o processamento da fala é agora uma área estabelecida no domínio comercial, e é pouco provável que os grupos académicos possam competir de uma forma efectiva. É difícil, portanto, justificar um investimento continuado de investigadores académicos nesta área. As oportunidades agora estão no processamento da língua... gramática, semântica, processamento de linguística em geral, etc'. Ora esta frase suscitou um... um debate enorme na última Conferência Internacional sobre Spoken Language Processing... foi também comentada por vários investigadores da minha área, na revista do European Language and Speak Network, da ELSNet e... eu acho que esta é uma preocupação saber se já estamos, se já está o problema resolvido, se já não temos nada a fazer, é uma preocupação que deveria também ser mencionada... eu achei interessante trazer-vos aqui assim um apanhado de prognósticos... que foram recolhidos numa workshop sobre reconhecimento e compreensão de fala de noventa, algures de Dezembro de noventa e sete, por um colega, o Professor Roger Moore. Ele distribuiu aos participantes, nesta workshop, suponho que a maioria era... de âmbito académico, um questionário em que pedia para eles indicarem datas. À primeira, às duas primeiras perguntas que eram: para quando a aquisição de computadores portáteis com programas de ditado automático já incluídos. Portanto, a esta primeira pergunta toda a gente disse é para muito breve, portanto eles acham que o Bill Gates, ou alguém parecido vai tomar conta disto rapidamente, e que a próxima vez que comprarmos um sistema operativo já vem também com algum programa de ditado automático para a nossa língua. Para quando sistemas telefónicos com entrada vocal sem se restringirem apenas a dígitos. Também está para muito próximo, e eu acho que para estas duas áreas nós já demos algum contributo, nomeadamente porque construímos os recursos que são precisos para isto, e que já estão a ser usados por, inclusive, indústrias lá fora. Para quando a utilização comum de reconhecimento de fala em casa, para controlar os nossos electrodomésticos, por exemplo... Não está para tão breve, mas enfim, já não vai faltar muito. No carro, também, acho que vai ser mais ou menos para a mesma época. Quando é que vamos poder fazer reservas de bilhetes através do telefone... sendo a reserva automática por defeito, ok. Também não falta muito mas ainda há algum caminho, alguma investigação a percorrer. Para quando a legendagem automática na televisão, falta bastante mais. Para quando a transcrição automática, por exemplo, de sessões do parlamento, está aqui a data de dois mil e quarenta, se calhar já não chegamos lá. Quando é que a precisão de reconhecimento automático igualará a de um humano? Dois mil e cinquenta…eu, se calhar são optimistas, não sei. Quando aparecerá o primeiro caso legal em que não é possível distinguir se uma gravação foi feita por uma pessoa ou por um computador. A mesma data, dois mil e cinquenta. Quando é que as pessoas voltarão a comprar teclados para não enrouquecer de tanto falar com o computador? Dois mil e cem. Quando é que vai ser possível conversar durante dez minutos com um computador, através do telefone sem perceber que não é um humano? Dois mil cento e trinta. E quando é que não vai, vai haver mais necessidade de investigação em fala? Dois mil duzentos e quarenta. Vocês devem-se estar a admirar da precisão destas datas, é que de facto houve tantos investigadores a responderem "never", que o Roger fez uma… uma, a "never" atribuiu o ano dois mil, o ano três mil, de maneira que saiu estas datas com esta precisão. As minhas próprias conclusões estão, de alguma forma resumidas, naquela última frase que ali está. A fala é ubíqua. Está em todo lado onde nós tivermos capacidades de falar e do ouvir, estivermos, e onde não vai estar nem um teclado nem um écran. Portanto eu acho que vamos assistir a um… no futuro próximo, a uma explosão de aplicações de, de… processamento de fala, já não falo das outras porque não é bem a minha área de trabalho, a par com progresso científico na área, a capacidade, e isto é extremamente importante, a capacidade de integrar o que hoje em dia se faz em processamento da fala e em processamento de língua natural, eu acho isto fundamental, os avanços em termos de poder computacional e a miniaturização, qualquer dia vou falar para o meu relógio e se calhar vou comandar o chuveiro através da fala. É tudo. Obrigada.