Morfolimpíadas: análise sobre as variantes de português
Breve análise lexical do conteúdo das variantes brasileira e portuguesa nos textos das Morfolimpíadas
Primeiras morfolimpíadas para o
português,
processo de avaliação conjunta,
organizado pela Linguateca
Apresentamos aqui algumas observações relativas aos textos usados nas Morfolimpíadas, em relação às variantes brasileira e portuguesa da língua.
Conforme indicado na descrição dos textos usados, as variantes portuguesa e brasileira têm um peso muito semelhante.
Para uma análise mais detalhada, agrupámos os textos por variante, e, usando as listas ordenadas de unidades do
CETEMPúblico (
lista de unidades)
e do CETENFolha
(lista de unidades),
ignorando todas as unidades que não consistissem de uma sequência de minúsculas (excluindo assim números, sinais de pontuação e nomes próprios),
determinámos:
A partir destas últimas duas listas, obtivemos:
- as 101 palavras mais frequentes dos textos brasileiros, não existentes no CETEMPúblico, por ordem de frequência no CETENFolha
- as 101 palavras mais frequentes dos textos portugueses, não existentes no CETENFolha, por ordem de frequência no CETEMPúblico
o que nos permitiu determinar os resultados para os dois grupos de 101 formas, apresentados abaixo (as letras correspondem às
usadas na página sobre o uso do sistema como verificadores):
| Formas
brasileiras | Formas
portuguesas |
| Sistema | Reconhecidas |
Aceitas | Reconhecidas | Aceites |
| A | 101 | 58 | 101 | 100 |
| B | 101 | 20 | 101 | 99 |
| C | 101 | 95 | 101 | 14 |
| D | 97 | 17 | 101 | 101 |
| E | 101 | 84 | 101 | 7 |
| F | 97 | 90 | 100 | 100 |
Última alteração: 12 de Março de 2009.
Perguntas, comentários e sugestões