Desafio de identificação de personagens
In English
Avaliação conjunta organizada por uma parceria entre a Linguateca, o NuPILL, a Universidade Estadual do Maranhão (UEMA) e a Universidade de Oslo (UiO).
Comissão organizadora: Diana Santos, Roberto Willrich, Emanoel Pires, Marcia Langfeldt, Cristina Mota e Rebeca Schumacher Fuão. (Membros anteriores: Patrícia Magalhães, Ricardo Gaiotto e Paulo Silva Pereira)
O que é o DIP?
O objetivo desta avaliação conjunta é desenvolver e avaliar programas que, dada uma obra literária em português, consigam
- identificar as suas personagens (incluindo as variadas formas pelas quais são referidas)
- identificar alguns atributos destas personagens, nomeadamente
- o seu género
- a sua ocupação, profissão ou estatuto social
- identificar as relações familiares entre as personagens
Ver folheto de divulgação.
Exemplo referente a duas obras
Ver também o artigo sobre o DIP no PROPOR2022: Santos et al. (2022).
Perguntas já respondidas sobre o DIP
Ensaio do DIP
Para todos se familiarizarem, e poderem influenciar as decisões do DIP, houve um ensaio (manual), que também produziu mais dados.
Medidas de avaliação
Como avaliar, e os programas usados, está em
Primeiro DIP
Aqui se encontra a coleção que os sistemas tiveram de processar, de cem obras em formato de texto e cem em formato pdf, assim como a coleção dourada relativa às obras em texto usada no primeiro DIP.
Os resultados podem ser consultados aqui.
Iremos aumentando e refinando a coleção dourada relativa a texto, que pode ser obtida aqui.
A saída do sistema participante, o PALAVRAS-DIP, em relação a 213 obras adicionais (a chamada coleção extra, descrita no volume do DIP), pode ser levantada aqui.
Calendário
- 6 de outubro de 2021: início da organização
- 5 de novembro de 2021: envio do anúncio
- 29 de novembro de 2021: reunião virtual com a maioria dos interessados (gravação)
- 29 de novembro de 2021: aberto o ensaio
- 15 de março de 2022: acaba o ensaio
- 16 de março de 2022: reunião virtual sobre o ensaio do DIP
- 15 de setembro de 2022: publicação das 200 obras que serão alvo do desafio
- 17 de setembro de 2022: prazo final para entrega dos resultados pelos participantes
- 1 de outubro de 2022: disponibilização dos resultados do DIP pela organização
- 21 de novembro de 2022: encontro sobre o DIP
- junho de 2023: publicação do volume sobre o DIP na Linguamática -- volume 15, número 1, de 2023
Apoios
Última atualização: 14 de julho de 2023.