Uma floresta serve para …
Projecto Floresta sintá(c)tica
Uma floresta sintáctica serve para o treino e avaliação de analisadores morfossintácticos; para estudos baseados em corpus, e para uma investigaçào da língua, não apenas da sintaxe, mas também de aspectos semânticos e discursivos. Pode, ainda, ser um auxiliar no ensino.
Uma floresta sintáctica pode ter diferentes usos, conforme os interesses do usuário. De maneira geral, distinguimos entre dois grandes grupos de utilizadores: linguistas (computacionais ou não) e engenheiros/informatas que trabalham com Processamento automático de linguagem natural (PLN).
Os linguistas seriam os "consumidores" de dados de uma floresta, que pode ser vista como uma gramática empírica (em que se destaca o desempenho e não a competência).
Devido à quantidade e qualidade da informação codificada (informação sintática, hierárquica, morfológica e gramatical), é um espaço naturalmente propício a estudos quantitativos.
Embora seja difícil distinguir usos voltados exclusivamente para pesquisa, e exclusivamente voltados para o ensino, listamos abaixo algumas possibilidades de aplicação:
Para a investigação linguistica, algumas possibilidades são:
- sintagmas nominais em que um substantivo é modificado por outro substantivo
(-->)
- complementos mais frequentes do verbo dar
(-->)
- adjetivos que aparecem mais frequentemente em posição pré-nominal
(-->)
- orações em que o predicado antecede o sujeito
(-->)
- orações relativas com verbo no presente do subjuntivo
(-->)
- orações relativas em que o pronome relativo exerce a função de objeto direto
(-->)
- tempos verbais usados em orações adverbiais
(-->)
- orações predicativas reduzidas de gerúndio
(-->)
- sintagmas preposicionais não adjacentes ao nome que modificam
(-->)
- sintagmas nominais que contêm um adjetivo terminado em -eiro
(-->)
- descrição dos espaços argumentais de determinadas palavras
- informação é sujeito de quais verbos
(-->)
- informação é objeto de quais verbos
(-->)
Para o ensino de línguas, os corpora da Floresta podem ser utilizados tanto para ensino de L1 como de L2. Alguns dos usos mais comuns são
- seleção de frases para elaboração de exercícios (por ex, preencher lacunas) que enfatizam a fluência verbal (exemplo),
- reflexão sobre a língua, contrastando
gramáticas e ocorrências naturais de uso (exemplo)
- reflexão sobre efeitos no texto de estruturas discursivas (exemplo)
- reflexão sobre a escrita: construçoes que dificultam o entendimento do texto (paralelismo; exemplo)
- reflexões semânticas sobre uso e dicionário (exemplo)
Veja aqui como realizar essas e algumas outras pesquisas utilizando o Milhafre.
Uma Floresta pode também ser utilizada para ilustrar uma determinada teoria de gramática, embora essa nao seja a preocupação principal do Projecto Floresta
Sintáctica.
Para considerações sobre as opções linguisticas tomadas na Floresta, consulte a secção .....
De um ponto de vista dos que trabalham com PLN, algumas possibilidades de uso são:
- Treino de analisadores sintácticos e anotadores gramaticais (PoS-taggers)
- Avaliação de analisadores sintácticos e anotadores gramaticais (PoS-taggers), tomando os resultados do Bosque, que já foi revisto, como padrão.
- Comparação de diferentes abordagens de anotação (gramatical e sintáctica)
- Busca por estruturas específicas, para criação de um corpus de treino mais eficaz
Última actualização: 3 de Novembro de 2008.
Comentários, sugestões e perguntas sobre a Floresta Sintá(c)tica