Págico - Português Mágico

Motivação

Págico, Linguateca

In English


Ao tentar fazer um apanhado de quais as razões que nos levam ou levaram a propor o Págico, cinco foram logo patentes, a saber:

As limitações dos sistemas atuais

De um ponto de vista técnico e científico, não nos parece que a comunidade do PLP tenha dado ainda o salto na aplicação do PLN a tarefas de interesse maior do que o próprio PLN. Embora seja natural que primeiro seja preciso desenvolver as ferramentas e os recursos para depois os poder aplicar, continuamos aparentemente ainda e sempre apenas a desenvolver e a avaliar problemas internos à disciplina: ontologias lexicais, florestas, infraestruturas de corpos...

Para tentar mudar essa situação, consideramos que é preciso olhar para a realidade que nos cerca e tentar desenvolver funcionalidades que sejam integráveis no mundo exterior, sem antes disso resolver globalmente os problemas mais limitados que em princípio seriam parte dessa solução, tal como identificação de entidades mencionadas ou correção ortográfica.

Isto porque sistemas perfeitos podem não ser úteis, e sistemas úteis podem não ser perfeitos.

A falta de interesse pela lusofonia

Uma das questões mais problemáticas da comunidade do processamento computacional do português é a sua subjugação ao estrangeiro, à comunidade internacional, que nos faz -- de forma paradoxal -- preterir o que é publicado e escrito na nossa língua ao que é escrito em inglês.

Embora tal seja um produto das políticas erradas dos países lusófonos, não se compreende a passividade e a obediência, neste aspeto, dos vários pesquisadores, dada uma comunidade de mais de 200 milhões de falantes no mundo.

Além disso, a própria falta de interesse pelos temas nacionais e/ou lusófonos vê-se pela sua ausência na internete, e em particular na wikipédia.

O enviesamento da wikipédia em português

De facto, ao contrário da wikipédia ideal, que permitiria que cada língua conferisse a sua relativa importância ao que lhe é mais querido e mais próximo, aparentemente os wikipédicos de serviço em português preferem traduzir do que criar, com o espantoso resultado de que, só para dar alguns exemplos mais flagrantes: Assim, associado ao enviesamento bem conhecido da wikipédia no que respeita a informação sobre mundos fantásticos e informação de base informática e tecnológica (como por exemplo discutido e notado por Tony Veale), junta-se o enviesamento a favor da cultura anglo-americana, ou seja, a globalização a globalizar até nas outras línguas.

A necessidade de juntar esforços com o ensino e o ensino da cultura

Dada essa situação, e de forma a conseguir equilibrar ou pelo menos diminuir o desequilíbrio que existe entre a informação presente e a que poderia estar, parece natural usar o processamento da linguagem natural também para melhorar o ensino da cultura lusófona -- criar tópicos e interesse à volta de factos, pessoas e acontecimentos que formaram o nosso presente e talvez também o do resto do mundo, sem concorrer para a ideia de que apenas as "outras" culturas são ricas e tiveram impacto.

Por outras palavras, fomentar o estudo e a criação de materiais culturais (os chamados "conteúdos") que sejam diversos e genuinamente localizados em outras áreas que não Nova Iorque, Hogwarts ou Notting Hill. Além de que o conhecimento dos vários locais (reais ou imaginários) das outras culturas lusófonas é um bom meio para o conhecimento entre os povos.

O concurso homem-máquina

Finalmente, pretendemos explorar, do ponto de vista mediático, a questão da competição entre seres humanos e "agentes" automáticos: por um lado, tal permite a divulgação e a atenção de ainda mais setores da população; por outro, a comparação com o desempenho humano é tradicionalmente um ponto de interesse da inteligência artificial, e pode ajudar à otimização da divisão do trabalho entre ambos os atores.

Veja-se por exemplo a recente mediatização da vitória do sistema Watson no jogo Jeopardy nos Estados Unidos -- em que naturalmente o único interesse da questão foi a competição homem-máquina, visto que a tarefa em si é completamente inútil. Contudo, foi possivelmente a melhor propaganda para o PLN nos últimos tempos, veja-se a apresentação de Martin Ringel, IBM Watson and Jeopardy!, na conferência NoTur 2011.


Última actualização: 24 de Junho de 2011.
Comentários, sugestões e perguntas sobre o Págico