Águia, ferramenta de procura em árvores

logo temporário da FS
Projecto Floresta sintá(c)tica

Search interface in English


Experimente o novo interface de Busca para o Bosque, o Milhafre

NB: as versões posteriores à 8.0 do Bosque e 3.0 da Floresta Virgem só estão disponíveis para pesquisa no Milhafre

Escolha do corpus

Bosque (versão 7.5, de 12 de Dezembro de 2007): 9.437 árvores revistas, correspondendo a 1.962 extractos, 9.368 frases distintas, 215.003 unidades, aprox. 184.773 palavras
Floresta Virgem (versão 2.1, de 16 de Março de 2005): 78.246 árvores, correspondendo aproximadamente a dois milhões de palavras, criadas automaticamente a partir do resultado da análise do PALAVRAS do primeiro milhão de palavras do CETEMPúblico e do CETENFolha. Nota: A Floresta Virgem inclui as frases que constituem o Bosque, antes da sua revisão.

Tipo de resultado:
Concordância
Distribuição dos lemas
Distribuição da categoria gramatical
Distribuição das funções das palavras
Distribuição dos sintagmas
Distribuição dos sintagmas constituintes imediatos
Distribuição das funções dos sintagmas
Distribuição das funções dos constituintes imediatos
Distribuição do texto
Distribuição do tamanho

Exprima aqui o seu pedido:

Forma de procura

A sintaxe da procura ainda se encontra numa fase muito pouco amigável. Em princípio, é uma extensão do projecto AC/DC, o que significa que a sintaxe (IMS-CWB) usada neste também se aplica à Floresta. Contudo, os nomes dos atributos e dos valores são um pouco diferentes. Por exemplo, em vez de pos="N", será pos="n"; em vez dos atributos genero, temcagr e numpess, há apenas o atributo morf...

Neste momento, existe apenas uma visita guiada bastante desactualizada, e só cobrindo as extensões (também em inglês). Sugerimos que use uma forma semelhante aos exemplos apresentados em seguida para obter os seus objectivos, e experimente, através das funções de distribuição, que valores é lícito esperar.

Pedido de concordâncias

Pedido de distribuição

Esta procura é feita fisicamente sobre um outro corpus, cujos elementos terminais são os sintagmas. O tipo de expressões a procurar será pois da forma "np" ou [funcao="ACC"], e o tipo de resultados será escolhido através do pedido de distribuição acima.

Por exemplo, para ver que tipos de sujeitos sintagmáticos existem na floresta em relação aos seus constituintes, selecciona-se "distribuição dos sintagmas" acima, usando a expressão de procura [funcao="SUBJ"]. Obter-se-ia a distribuição em termos de número de palavras se fosse escolhida a "distribuição de tamanho".

Por outro lado, para ver que funções desempenham os sintagmas preposicionais na Floresta, basta seleccionar "distribuição da função" e simplesmente digitar "pp" na janela do pedido. Para ver quais as palavras que constituem o PP, escolher-se-ia a "distribuição de texto".

Ainda por implementar

Dados quantitativos globais, relativos ao Bosque

orações22.029
finitas15.572
infinitivas5.693
averbais764
sintagmas nominais59.878
sintagmas preposicionais32.753
sintagmas adjectivais9.447
sintagmas adverbiais975
itens coordenados5.507
árvores9.437
frases com duas ou mais árvores66

Última actualização: 12 de Dezembro de 2007.
Comentários, sugestões e perguntas sobre a Floresta Sintá(c)tica