Prezados participantes do encontro Avalon 2003: Como não poderei estar presente, estou enviando por escrito uma breve comunicação. Agradeço ao Luís que estará levando-a ao encontro. Num email recente a Diana Santos havia solicitado comentários à Morfolimpíada, e também sugeriu temas específicos para serem desenvolvidos nas apresentações no encontro. No momento não tenho comentários, sugestões ou críticas à Morfolimpíada num sentido técnico, isto é, no tocante aos procedimentos e critérios adotados. Até onde posso ver, a Morfolimpíada está convergindo para um procedimento de avaliação sensato, capaz de ser aplicado a diversos sistemas independentes, o que certamente não é algo simples de se fazer. O br.ispell participou da Morfolimpíada como verificador ortográfico, filtrando os textos fornecidos. Para cada forma, foi obtido também um lema via ispell. O br.ispell possui hoje conteúdo lexical e ferramentas que permitiriam construir um analisador morfológico simples, mas de fato esse analisador ainda não existe. A Diana indicou para o br.ispell o tema "formas desviantes, e como avaliá-las". Sobre isso, seguem algumas observações rápidas. Estão sendo chamadas desviantes as formas «erradas» que guardam alguma analogia com formas «corretas». Nas diferentes listas e emails enviados pelo Luís encontrei os seguintes casos marcados como desviantes: loko (louco) mais (mas) pastéis (pastel) dous (dois) mulhé (mulher) sinhô (senhor) interviu (interveio) capetalismo (capitalismo) níver (aniversário) chego (chegado) scanar (escanear) Um exame rápido mostra que há uma multiplicidade de causas que concorrem nessas formas: a fonética, a semântica (capeta = pessoa má), a abreviação, o uso de um vocábulo estrangeiro, o exótico, etc. A multiplicidade de causas aumenta a complexidade do fenômeno e do seu tratamento computacional. Pergunta-se: como avaliar as formas desviantes? No âmbito da Morfolimpíada, por razões práticas, e dentro do procedimento que vem sendo sedimentado, acredito que a avaliação dessas formas poderia ser sumária, no sentido de desconsiderá-las, sem que isso implicasse em prejuízo para a avaliação da qualidade dos analisadores. Isso não significa que as formas desviantes em si não sejam interessantes, tanto para a análise morfológica quanto para a sua avaliação. As formas desviantes chamam a atenção para processos e fenômenos da língua que podem ser relevantes para o trato computacional da língua, por levar a abordagens do léxico menos estáticas, e mais voltadas aos processos que constroem vocábulos e permitem a associação de significado a eles. Como exemplo elementar temos a semelhança fonética, que encontra já há bastante tempo aplicações na computação, e que poderia ser entendida como associada à análise morfológica. Um problema prático que poderia proporcionar uma oportunidade para examinar mais cuidadosamente a relevância ou não das formas desviantes, seria a tentativa de realizar a análise morfológica de textos com ortografia antiquada e/ou não uniforme, por exemplo textos anteriores ao acordo ortográfico. A Morfolimpíada poderia eventualmente propor alguns desses textos na forma de desafio opcional, como incentivo às iniciativas que tentassem explorar essa vertente. Eu mesmo tenho produzido versões digitais de alguns desses textos, sem contar ainda com ferramentas para lidar com a ortografia deles, por exemplo http://www.claraocr.org/cgi-bin/dict.cgi/R/cf/page Saudações a todos e meus votos de um bom encontro, Ricardo Ueda Karpischek