Págico - Português Mágico
Perguntas já respondidas sobre a participação automática
Págico,
Linguateca
Aqui incluímos todas as perguntas que nos forem sendo feitas sobre a participação automática, com a resposta respetiva.
A lista de tópicos da avaliação está disponível desde o dia 4 de Novembro e os sistemas terão de enviar os seus resultados no prazo de uma semana, ou seja, até dia 11 de Novembro pelas 23:59.
A coleção sobre a qual o Págico decorrerá tem como base a imagem da wikipédia de 25 de Abril de 2011, e está a ser distribuída em formato XHTML após processamento com a mwlib invocada através do pacote MediaWiki-DumpFile. Aqui podem ver-se alguns exemplos do formato dos artigos individuais: linga.xml e lingeard.xml.
A lista de tópicos é fornecida em UTF-8 no formato TXT e XML.
Nos ficheiros TXT, cada tópico encontra-se numa linha diferente e obedece ao seguinte formato, em que os temas estão separados por vírgula:
<ID_do_TOPICO>: <Descrição do tópico> # TEMA*
Os ficheiros XML obedecem à seguinte DTD:
<!ELEMENT conjtopicos (topico+)>
<!ELEMENT topico (#CDATA)>
<!ATTLIST topico
id CDATA #REQUIRED
tema CDATA #IMPLIED>
O ficheiro de respostas (corrida) deverá estar codificado em UTF-8.
Cada resposta é constituída por três campos obrigatórios separados por espaços e obedece ao seguinte formato:
<ID_TOPICO> <ID_DOC_RESPOSTA> {<ID_DOC_JUSTIFICACAO>*}
- ID_TOPICO: identificador do tópico
- ID_DOC_RESPOSTA: identificador da página da wikipédia que representa a resposta
- ID_DOC_JUSTIFICACAO: identificador da página que serve de justificação à resposta; se houver mais do que uma justificação, estas terão de estar separadas dentro das chavetas por espaços; se não existir justificação, então as chavetas ficam sem caracteres no meio ({}).
Se um tópico tiver mais do que uma resposta, esta deverá estar numa linha separada.
Todas as linhas em branco serão ignoradas; todas as outras serão consideradas respostas aos tópicos.
Se existir um quarto campo ou mais, serão ignorados, podendo servir para escrever comentários.
Exemplos de corridas
Eis alguns exemplos de corridas para ilustrar melhor o formato das respostas:
- Exemplo 1 - ilustra um conjunto de respostas aos tópicos exemplo incluídos em PagicoEXEMPLOS, em que a maior parte das respostas é auto-justificada e as restantes têm uma cadeia de justificação.
Um sistema pode mandar até três corridas ao Págico.
Por tópico:
Agregada:
Última actualização: 8 de Novembro de 2011.
Comentários, sugestões e perguntas sobre o Págico