Águia, ferramenta de procura em árvores
Projecto Floresta
sintá(c)tica
Visita guiada
O objetivo desta página é fornecer uma idéia
geral das funcionalidades do Águia.
O Águia é uma ferramenta de busca em árvores
sintáticas (treebanks), desenvolvida pela
Linguateca,
no contexto do projeto Floresta
Sintá(c)tica. Pode ser acessada a partir da Web
(aqui)
e utiliza o IMS
Corpus Workbench como uma ferramenta subjacente para a
codificação de corpus.
Como o Águia ainda está em desenvolvimento, não
estamos (por enquanto) tão preocupados com uma interface
amigável ou com a robustez do sistema, mas sim em encontrar a
expressividade necessária para as buscas. Assim, qualquer
retorno ou comentário relativo a tipos de busca (isto é,
a tipos de perguntas) possíveis é muito bem vindo (e,
por outro lado, comentários relativos a mensagens de erro ou a
problemas encontrados não são, por enquanto, tão
relevantes).
Basicamente, além dos tipos de perguntas padrão em um
corpus anotado, é possível obter outros tipos de
informação, como estrutura do sintagma ou da oração,
profundidade das árvores, etc., que só estão
disponíveis quando os objetos lingüísticos
subjacentes às buscas são árvores (ou grafos).
Abaixo descrevemos algumas dessas possibilidades de busca.
Busca por
informações quantitativas sobre a Floresta
Sintá(c)tica:
- Que
tipos de enunciado são mais freqüentes?
- Traduzindo para os termos da Floresta, o que se deseja na busca é
saber a freqüência de enunciados do tipo STA
(declarativos), QUE (interrogativos), CMD (imperativos) ou EXC
(exclamativos). Para tanto, basta selecionar "Distribuição
dos sintagmas" e e, no campo de busca, digitar [funcao="STA"]
para obter os dados relativos aos enunciados declarativos. Para os
dados relativos aos outros enuncionados, substitua STA por QUE, CMD
ou EXC.
- Quais
são os sujeitos mais freqüentes?
-
Selecionar Distribuição do texto
e, no campo de busca, digitar [funcao="SUBJ"]
- Que
tipos de objectos sintáticos têm função
interrogativa?
- Selecionar Distribuição dos sintagmas e,
no campo de busca, digitar [funcao="QUE"]
- Qual
o verbo mais freqüente em cada tipo de oração?
-
Para saber os
verbos mais freqüentes nas orações finitas (fcl),
selecionar Distribuição
dos lemas e, no
campo de busca, digitar /fcl[classe,"MV:v.*"]
. Para as orações não-finitas (icl), substitua
fcl por icl.
- Qual
a função mais comum de uma oração
finita?
-
Selecionar Distribuição
das funções dos sintagmas
e, no campo de busca, digitar "fcl".
Para refinar a busca ainda mais...
- Que
orações finitas (fcl)
apresentam predicativo do sujeito (SC)?
-
Selecionar concordância
e, no campo de busca, digitar /fun_fcl('SC')
Para procurar exemplos específicos
- Que
SNs contêm uma oração relativa na qual o pronome
exerce a função de sujeito?
- Selecionar
concordância e, no campo de busca, digitar
/np[classe,SUBJ:pron-indp]
- Que
SNs contêm uma oração relativa na qual o pronome
exerce a função de objeto direto ?
- Selecionar
concordância e, no campo de busca, digitar
/np[classe,ACC:pron-indp]
- Que
orações finitas começam com um sujeito
- Selecionar concordância e digitar no campo
de busca /ass_fun_fcl['SUBJ .*']
Buscas
para observar a gramática (constituição
interna) subjacente a determinadas estruturas.
- Qual
a gramática e a distribuição (isto é, a
quantidade de ocorrências no corpus) dos sintagmas adjetivos
(adjp)?
- Selecionar distribuição
dos sintagmas constituintes imediatos e,
no campo de busca, digitar adjp;
- Qual
a gramática subjacente a uma determinada função,
por exemplo, predicativo do sujeito?
- Selecionar distribuição
dos sintagmas constituintes imediatos e, no campo de busca,
digitar [funcao="SC"]
Última actualização: 28 de Dezembro de 2007 por Cláudia Freitas
Comentários e sugestões