PPT Slide
3. Parâmetros de Avaliação (continuação)
a) tratamento das unidades lexicais formadas por mais do que uma palavra
b) identificação de zonas problemáticas na identificação das unidades textuais (tokenization)
c) manutenção de múltiplas análises lexicais de forma(s) (incluíndo palavras simples e compostos ambíguos)
d) elementos textuais diversos (abreviaturas, números, marcadores de parágrafos e listagens, separadores (pontuação)
e) tratamento de nomes próprios