Págico - Português Mágico

Acesso a informação em português na wikipédia

Linguateca

In English


O que é o Págico?

O Págico é uma avaliação conjunta na área de recolha de informação em português que tem por objectivo avaliar sistemas que encontrem respostas não triviais a necessidades de informação complexas, em língua portuguesa. Veja-se o folheto de divulgação.

A avaliação propriamente dita teve lugar em novembro de 2012, e os recursos criados foram reunidos no Cartola, apresentado no Encontro do Págico, no dia 17 de abril de 2012 em Coimbra.

De certa forma vem no seguimento do GikiCLEF, aproveitando a experiência obtida, mas mudando completamente o foco: em vez de se concentrar em questões especialmente geográficas e enfatizar o multilinguismo e a recuperação cruzada entre línguas e coleções em línguas diferentes, o Págico concentra-se no que, em traços largos, se pode considerar temas de cultura lusófona, e oferece apenas tópicos em português.

A razão da organização do Págico é uma tentativa de aplicar os vários sistemas e tarefas que os membros da comunidade do processamento computacional do português desenvolvem a uma tarefa com inegável interesse prático e cultural: responder de forma automática a necessidades que exigem o folheamento de muitas páginas de informação numa enciclopédia, e que não são portanto praticamente realizáveis em pouco tempo por um ser humano.

Embora estejamos bem conscientes de que a informação na wikipédia em português não é sempre fidedigna ou completa, pensamos que esta iniciativa poderá mesmo contribuir para a melhorar ou pelo menos para identificar criticamente as suas forças e fraquezas.

Existe uma página mais detalhada de motivação do Págico.

Se já está inscrito, entre no Págico por aqui.

Chamada à participação

O Págico é organizado de forma a que o seu encontro final coincida com o PROPOR, ou seja, a apresentação das abordagens seguidas pelos seus participantes constituirá um satélite do Propor 2012, que se realizará em Coimbra de 17 a 20 de Abril de 2012.

Ao contrário das anteriores avaliações conjuntas organizadas pela Linguateca, decidimos desta vez também aceitar participantes humanos, ou seja, um participante pode tentar a sua sorte registando-se como pessoa e não como sistema.

Nesse caso, mantivemos o registo em aberto durante a avaliação até ao dia 30 de Novembro.

Os participantes com sistemas automáticos foram convidados a registar-se no Págico até 30 de Julho de 2011, altura em que receberam instruções detalhadas, assim como tópicos e respostas de exemplo.

A avaliação propriamente dita começou dia 4 de Novembro e decorreu até dia 30 de Novembro para participantes humanos e até 11 de Novembro para os participantes automáticos. Os resultados foram publicitados no princípio do ano (2012), de forma a que os autores tivessem tempo para refletir sobre a sua participação e os seus resultados e esse trabalho pudesse ser devidamente apresentado no Encontro do Págico.

Os artigos descrevendo a avaliação e seus resultados foram publicados numa edição especial da revista Linguamática, saída na data do encontro do Págico, em Abril, com o número 4.1:

Diana Santos, Cristina Mota, Cláudia Freitas e Luís Costa (eds.) Linguamática 4 (1). Abril, 2012, pdf.

Quem organiza o Págico?

O Págico é organizado pela Linguateca, na sua vertente de promover e fomentar a avaliação conjunta como meio de progresso na área, e tem a colaboração das seguintes universidades: Universidade de Oslo (UiO), Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio) e Universidade de Coimbra (UC).

Mais especificamente, dentro da equipa da Linguateca, os principais organizadores do Págico são Cristina Mota, Alberto Simões, Cláudia Freitas, Luís Costa e Diana Santos.

Deve de qualquer maneira ser mencionado que o Págico é desenvolvido a partir do SIGA, que foi desenhado e criado priincipalmente por Luís Miguel Cabral para o GikiCLEF.

Em que consiste a tarefa?

Dada uma necessidade de informação formulada através de um tópico, pretendemos obter as páginas da wikipédia que são a resposta a esse tópico. Eis alguns exemplos de tópicos e algumas das respectivas respostas:

Além de fornecer as respostas, é necessário encontrar as páginas da wikipédia que justificam a escolha de uma dada resposta. Por exemplo, será necessário identificar a página http://pt.wikipedia.org/wiki/Pedro_Nunes_(matemático) como a justificação de que o nónio é uma avanço relacionado com os jesuítas da escola de Coimbra.

As páginas, no entanto, são escolhidas de uma versão estática da wikipédia criada pela Linguateca para o Págico.

Mais informação sobre a participação automática e sobre a participação humana encontra-se na página de perguntas já respondidas sobre o Págico.

Datas importantes

Referências

Os seguintes artigos descrevem de forma geral o Págico: Costa et al. (2012) e Mota et al. (2012).

Veja também alguns artigos que dão uma panorâmica sobre o GikiP e GikiCLEF, precursores do Págico: Santos et al. (2009), Santos et al. (2010) e Santos & Cabral (2010).

Para obter todas as publicações associadas ao Págico ou ao GikiCLEF, basta consultar o catálogo de publicações da Linguateca pedindo publicações com a marca GikiCLEF ou Págico.

Financiamento

A Linguateca e o Págico foram financiados pelas seguintes entidades até 31 de Dezembro de 2011. UMIC - Agência para a Sociedade do Conhecimento FCCN - Fundação para a Computação Científica Nacional

MCTES FCT - Fundação para a Ciência e a Tecnologia

Mas continuaram a ser apoiados pelas seguintes instituições:

UiO PUC-Rio UC


Última actualização: 29 de abril de 2012.
Comentários, sugestões e perguntas sobre o Págico