Avaliação de analisadores morfológicos para o português

Este documento, constantemente em evolução, é o resultado da preparação de umas morfolimpíadas para o português, no âmbito mais geral da avaliação conjunta do processamento computacional da língua portuguesa.

Como principais componentes, menciona-se a proposta inicial de organização inspirada na 1st Morpholimpics (Hausser, 1994), e a discussão na lista avalia sobre o assunto.

Prospecção

A análise morfológica foi a aplicação que maior número de interessados conjugou. Ao contrário do previsto, em vez de se criar uma lista especial para cada sub-área, utilizou-se a lista geral avalia para a reunião e discussão dos vários interessados, porque se concluiu que não só podia ser um bom exemplo de caso como muitas das outras áreas tb envolviam análise (ou geração) morfológica como sub-tarefa...

Os seguintes sistemas/grupos já mencionaram interesse em participar (a ordem é da expressão do interesse)

Conhecem-se, além disso, outros possíveis publicamente acessíveis. e muitos outros incluídos em sistemas comerciais ou descritos na literatura, e que esperamos que ainda se venham a pronunciar.

Exemplo do conteúdo de saída

Foi pedido o resultado da análise de algumas formas, para começar a concretizar o que era preciso para organizar umas morfolimpíadas.
matemática
instante
patas
fontes
reunir-se-iam
vide
acessável
acedível
acessivelmente
ora
percas
objetivo
Os resultados de vários sistemas, alguns com vários formatos de saída, encontram-se aqui, em formato texto, juntamente com a identificação (ou falta dela) fornecida pelas pessoas que enviaram os dados.

Questões levantadas

  1. Variante
  2. Formato de saída
  3. Relação com a geração
  4. Flexibilidade
  5. Tipos de dados de entrada para teste
  6. Conversão entre vários sistemas

Sugestão de calendarização

Primeiro ensaio em Setembro - Outubro. Primeiras Morfolimpíadas por ocasião do PROPOR 2003.

Ensaio

Pode apreciar o desenrolar do ensaio e as diversas acções tomadas.
Última alteração: 25 de Setembro de 2002.

Comentários, críticas e sugestões: projecto@informatics.sintef.no