PAPEL: Palavras Associadas Porto Editora - Linguateca
Linguateca
O PAPEL é um recurso criado pela Linguateca a partir do Dicionário PRO de Língua Portuguesa da Porto Editora através de um protocolo de colaboração com o departamento de dicionários desta empresa.
Ao contrário de outras ontologias lexicais para o português de que temos conhecimento, o PAPEL é público, grátis e utilizável por todos os actores de processamento da língua que o quiserem usar, e encontra-se aberto para subsequente melhoria pela comunidade.
O desenvolvimento do PAPEL oficial terminou com o fim da terceira fase da Linguateca (31 de Dezembro de 2008). A publicação da sua primeira versão teve a data de 17 de Agosto de 2009, e desde aí temos tentado produzir novas versões através da melhoria e validação do seu conteúdo (veja-se o historial para mais informação).
O PAPEL foi desenvolvido no antigo pólo de Coimbra da Linguateca, primordialmente por Hugo Gonçalo Oliveira, mas com a orientação e contribuição de Paulo Gomes (responsável pelo pólo) e Diana Santos, do pólo de Oslo da Linguateca. Essencial para a criação do PAPEL foi também o apoio do núcleo de investigação e desenvolvimento da Porto Editora, assim como a contribuição de Nuno Seco, anterior bolseiro da Linguateca, no desenho das opções e na implementação de algumas ferramentas.
Levantar o PAPEL: zip, ficheiro LEIAME.txt Veja aqui como citar o PAPEL
Mais informação sobre o PAPEL
Conteúdo do arquivo disponibilizado:
- Alguma documentação sobre as relações e sobre o conteúdo do pacote (definicao_relacoes.xml, LEIAME.txt)
- As relações no formato "palavra RELACAO palavra"
- Tal como foram extraídas ("relações brutas")
- Depois de algum pós-processamento para resolver casos erróneos ("relações finais")
- Por tipo de relação, também depois do processamento
Procedemos também aqui à disponibilização dos recursos usados:
- o analisador PEN (disponibilizado sob licença BSD),
- as gramáticas empregues,
- um sistema para visualizar o PAPEL, o Folheador antigo
- um sistema mais potente que permite visualizar não só o PAPEL mas também outras ontologias lexicais para o português, o novo Folheador
Muito brevemente, o PAPEL v3.5 contém relações entre cerca de 102 mil palavras diferentes (em que categorias gramaticais diferentes são contadas como palavras diferentes), e cerca de 191 mil instâncias de relações (ou triplos). Destas, cerca de 83 mil são de sinonímia e cerca de 49 mil de hiponímia.
Mantemos também uma lista de perguntas já respondidas (PJR) sobre o PAPEL, assim como uma descrição das relações no PAPEL.
Artigos e relatórios sobre o PAPEL
Os seguintes artigos e documentação sobre o PAPEL podem ser consultados através do nosso catálogo de publicações, com a marca papel.
Futuro do PAPEL
Pretendemos, naturalmente, fazer investigação e desenvolvimento e construir novos e melhores recursos com base no PAPEL.
Não só no âmbito do doutoramento de Hugo Gonçalo Oliveira, em curso na Universidade de Coimbra, mas também em conjunto com a comunidade interessada, que é aqui desde já convidada a participar.
- 17 de Agosto de 2009
- Lançamento público da primeira versão do PAPEL 1.0.
- 5 de Outubro de 2009
- Início de uma lista de perguntas já respondidas; nova versão do PEN.
- 6 de Outubro de 2009
- Leve correcção ao LEIAME.txt da versão 1.0 do PAPEL
- 10 de Outubro de 2009
- Lançamento da versão 1.1 do PAPEL
- 12 de Março de 2010
- Lançamento da versão 2.0 do PAPEL
- 22 de Dezembro de 2011
- Lançamento da versão 3.0 do PAPEL
- 4 de Outubro de 2012
- Lançamento da versão 3.2 do PAPEL
- 25 de agosto de 2013
- Lançamento da versão 3.5 do PAPEL
Financiamento
O financiamento do PAPEL enquadrou-se no financiamento da Linguateca
Última actualização: 30 de agosto de 2013.
Data de criação da presente página: 7 de agosto de 2009.
Contactar a equipa responsável pelo PAPEL