Floresta Sintá(c)tica

início |  corpus |  acesso |  usos da Floresta |  opções linguísticas e etiquetas |  busca em árvores  |  documentação  |  programas |  equipa
English |  Linguateca

Opcões linguísticas e etiquetas usadas na Floresta

Subjacente a uma floresta sintáctica há sempre um modelo de gramática, com suas regras e etiquetas (classes gramaticais e funçoes sintácticas). O analisador sintáctico PALAVRAS (Bick, 2000), responsável por toda a análise sintáctica dos corpora da Floresta, utiliza o modelo Constraint Grammar.

Porém, no acesso aos corpora da Floresta, procuramos minimizar o impacto de um modelo sintáctico em geral pouco conhecido por aqueles que não trabalham com PLN.

Essa tentativa se dá de duas maneiras:

  • Na documentação exaustiva das opções linguísticas tomadas durante a anotação e revisão, que se referem tanto a estruturas sintácticas, quanto a etiquetas específicas. Chamamos a documentação criada de Biblia Florestal, e é importante notar que o documento está em constante atualização. Além disso, pode ser interessante consultar também
  • Na utilização, sempre que possível, de uma terminologia que tenha pontos em comum com a nomenclatura usada pela gramática tradicional. Embora limitações e inconsistências da GT já tenham sido amplamente discutidas, trata-se da tradição mais difundida, o que possibilita maior autonomia e facilidade de uso: por um lado, consultar gramáticas é algo simples; por outro (e de maneira complementar) não é dificil perceber que tipo de informação está codificado na Floresta, e transpô-lo para o modelo de gramática desejado.

Além disso, e ainda mais importante, procuramos, sempre que possível, descrever os fenômenos lingüísticos assumindo um alto nível de granularidade, pois é mais fácil agrupar fenômenos que podem, eventualmente, ser tratados de maneira disjunta, do que manualmente distinguir casos.

Consulte a página de documentação para os artigos produzidos no âmbito do projeto.


Última actualização: 3 de Novembro de 2008.
Comentários, sugestões e perguntas sobre a Floresta Sintá(c)tica