Págico - Português Mágico
Motivação
Págico,
Linguateca
In English
Ao tentar fazer um apanhado de quais as razões que nos levam ou levaram a propor o Págico, cinco foram logo patentes, a saber:
- As limitações dos sistemas atuais
- A falta de interesse pela lusofonia
- O enviesamento da wikipédia em português
- A necessidade de juntar esforços om o ensino e o ensino da cultura
- O concurso homem-máquina
As limitações dos sistemas atuais
De um ponto de vista técnico e científico, não nos parece que a comunidade do PLP tenha dado ainda o salto na aplicação do PLN a tarefas de interesse maior do que o próprio PLN. Embora seja natural que primeiro seja preciso desenvolver as ferramentas e os recursos para depois os poder aplicar, continuamos aparentemente ainda e sempre apenas a desenvolver e a avaliar problemas internos à disciplina: ontologias lexicais, florestas, infraestruturas de corpos...
Para tentar mudar essa situação, consideramos que é preciso olhar para a realidade que nos cerca e tentar desenvolver funcionalidades que sejam integráveis no mundo exterior, sem antes disso resolver globalmente os problemas mais limitados que em princípio seriam parte dessa solução, tal como identificação de entidades mencionadas ou correção ortográfica.
Isto porque sistemas perfeitos podem não ser úteis, e sistemas úteis podem não ser perfeitos.
A falta de interesse pela lusofonia
Uma das questões mais problemáticas da comunidade do processamento computacional do português é a sua subjugação ao estrangeiro, à comunidade internacional, que nos faz -- de forma paradoxal -- preterir o que é publicado e escrito na nossa língua ao que é escrito em inglês.
Embora tal seja um produto das políticas erradas dos países lusófonos, não se compreende a passividade e a obediência, neste aspeto, dos vários pesquisadores, dada uma comunidade de mais de 200 milhões de falantes no mundo.
Além disso, a própria falta de interesse pelos temas nacionais e/ou lusófonos vê-se pela sua ausência na internete, e em particular na wikipédia.
O enviesamento da wikipédia em português
De facto, ao contrário da wikipédia ideal, que permitiria que cada língua conferisse a sua relativa importância ao que lhe é mais querido e mais próximo, aparentemente os wikipédicos de serviço em português preferem traduzir do que criar, com o espantoso resultado de que, só para dar alguns exemplos mais flagrantes:
- Shakespeare tem muito mais peso que Camões;
- Autores estrangeiros têm mais cobertura do que portugueses ou brasileiros.
- Os artigos sobre pessoas de importância global (veja-se por exemplo Shakespeare, Proust, Churchill, Che Guevara, Descartes, Fleming, ou Gandhi), em vez de serem escritos por especialistas sobre o assunto na nossa língua, são meras traduções de outras línguas.
Assim, associado ao enviesamento bem conhecido da wikipédia no que respeita a informação sobre mundos fantásticos e informação de base informática e tecnológica (como por exemplo discutido e notado por Tony Veale), junta-se o enviesamento a favor da cultura anglo-americana, ou seja, a globalização a globalizar até nas outras línguas.
A necessidade de juntar esforços com o ensino e o ensino da cultura
Dada essa situação, e de forma a conseguir equilibrar ou pelo menos diminuir o desequilíbrio que existe entre a informação presente e a que poderia estar, parece natural usar o processamento da linguagem natural também para melhorar o ensino da cultura lusófona -- criar tópicos e interesse à volta de factos, pessoas e acontecimentos que formaram o nosso presente e talvez também o do resto do mundo, sem concorrer para a ideia de que apenas as "outras" culturas são ricas e tiveram impacto.
Por outras palavras, fomentar o estudo e a criação de materiais culturais (os chamados "conteúdos") que sejam diversos e genuinamente localizados em outras áreas que não Nova Iorque, Hogwarts ou Notting Hill.
Além de que o conhecimento dos vários locais (reais ou imaginários) das outras culturas lusófonas é um bom meio para o conhecimento entre os povos.
O concurso homem-máquina
Finalmente, pretendemos explorar, do ponto de vista mediático, a questão da competição entre seres humanos e "agentes" automáticos: por um lado, tal permite a divulgação e a atenção de ainda mais setores da população; por outro, a comparação com o desempenho humano é tradicionalmente um ponto de interesse da inteligência artificial, e pode ajudar à otimização da divisão do trabalho entre ambos os atores.
Veja-se por exemplo a recente mediatização da vitória do sistema Watson no jogo Jeopardy nos Estados Unidos -- em que naturalmente o único interesse da questão foi a competição homem-máquina, visto que a tarefa em si é completamente inútil. Contudo, foi possivelmente a melhor propaganda para o PLN nos últimos tempos, veja-se a apresentação de Martin Ringel, IBM Watson and Jeopardy!, na conferência NoTur 2011.
Última actualização: 24 de Junho de 2011.
Comentários, sugestões e perguntas sobre o Págico