Problemas com os domadores

Primeiras morfolimpíadas, uma iniciativa de avaliação conjunta para o português, organizada pela Linguateca
Nesta página apresentamos uma discussão de porque é que a questão dos domadores, ou a segunda fase das comparações, não parece poder simplesmente ser aplicada sem desvirtuar todo o processo de comparação.

Em teoria, teríamos a possibilidade de

  1. retirar a informação da lista dourada, e das análises dos sistemas, que um dado sistema não produzia - chamemos a isto a solução redutora
  2. adicionar a informação aos sistemas que a não produziam, chamando a isto a solução aditiva
Contudo, imediatamente nos deparamos com o seguinte: Mais concretamente, vejamos os alguns casos mais complexos, e os problemas que trazem para a solução aditiva:
  1. Se considerarmos que um tipo de adjectivos (marcado de uma dada maneira) é também substantivo, e em conformidade o desdobrarmos dessa forma, obtemos entradas para substantivos com lemas "estranhos" (não conistentes com o resto do sistema), tal como revisto para revistas ou índio para Índia, o que é um problema para a solução aditiva
  2. Se considerarmos que alguns adjectivos (femininos e/ou plurais) correspondem a particípios passados, não temos forma de os calcular (e portanto não há solução aditiva possível para os sistemas que não aceitam particípios passados com flexão em género e número
  3. Se considerarmos que os particípios passados podem ser sempre adjectivos e traduzimos a PoS de V para tanto V como ADJ, temos evidentemente problemas em recuperar o lema do adjectivo
  4. Se considerarmos que o género intrínseco de nomes próprios e o número de numerais são relevantes
Se, por outro lado, apostarmos na opção redutora, que corresponde, no limite, a criar uma lista dourada diferente para cada sistema, e retirarmos os casos que sabemos que os sistemas não produzem da lista dourada, estamos a prejudicar manifestamente os sistemas que produzem mais informação, porque terão mais possibilidades de errar.

Listamos aqui o processamento (ou opções) que foram considerados neste processo de domesticação, para cada sistema (por ordem alfabética):

SistemaSistema ASistema BSistema CSistema DSistema ESistema F
Rel. Abs. Rel. Abs. Rel. Abs. Rel. Abs. Rel. Abs. Rel. Abs.
Formas comparadas 628 655 599 655 590 655 648 655 639 655 640 655
Análises na lista dourada 1199 1255 1101 1228 1085 1228 1232 1247 1219 1255 1222 1239
Análises do sistema1074108010639799021058
Análises comuns928886871808697816
Precisão86,41%82,04%81,94%82,53%77,27%77,13%
Cobertura 77,40% 73,94% 80,47% 72,15% 80,28% 70,93% 65,58% 65,21% 57,18% 55,54% 66,78% 65,86%


Última alteração: 12 de Março de 2009.
Perguntas, comentários e sugestões