Corte-e-costura: manual de utilização
Linguateca
O pacote corte-e-costura, além de conter os recursos necessários (programas e regras) para anotar genericamente qualquer corpo anotado previamente pelo PALAVRAS e que esteja no formato do AC/DC, inclui para testes ilustrativos dois programas e duas mantas de retalhos de textos, bem como as correspondentes regras de teste.
Os programas devem ser corridos da directoria onde se encontra o corpo a anotar, o qual deverá ter o nome corpus. As regras devem ser organizadas por campo semântico, acrescentando ao nome do ficheiro um sufixo que corresponde ao campo semântico que as regras anotam. Por exemplo, todos os ficheiros relativos à anotação do campo semântico da cor devem ter o sufixo _cor.
Em seguida, exemplifica-se cada um dos casos de anotação.
- Teste com a manta-de-retalhos_formatoregras:
- Mudar para a directoria manta-de-retalhos_formatoregras
> cd <DIR_CORTECOSTURA>/corpos/manta-de-retalhos_formatoregras
- Correr o programa acdc_corte-e-costura_teste.sh de acordo com o teste que se pretende:
- Opção 1: Correr o programa de teste sem recursividade
> ./acdc_corte-e-costura_teste.sh
- Opção 2: Correr o programa de teste com recursividade
> ./acdc_corte-e-costura_teste.sh -r
NOTA: Este teste usa as regras de teste regras_corte-e-costura_cor_teste.txt.
- Teste com a manta-de-retalhos_fluxoregras:
- Mudar para a directoria manta-de-retalhos_fluxoregras
> cd <DIR_CORTECOSTURA>/corpos/manta-de-retalhos_fluxoregras
- Correr o programa acdc_pinta_corpo_teste.sh de acordo com o teste que se pretende
- Opção 1: Correr o programa de teste com o intuito de produzir apenas o corpo final anotado
> ./acdc_corte-e-costura_teste.sh "1"
- Opção 2: Correr o programa de teste com o intuito de produzir corpos temporários após a aplicação de cada passo da invocação
> ./acdc_corte-e-costura_teste.sh "1" -p
NOTA: Este teste usa as regras genéricas de teste regras_corr_PALAVRAS_cor_teste.txt, regras_positivas_cor_teste.txt, regras_negativas_cor_teste.txt, regras_especializacao_cor_teste.txt e regras_recursivas_cor_teste.txt, e as regras exclusivas desta manta de retalhos que se encontram na directoria deste corpo.
- Anotar genericamente um corpo que esteja no formato do AC/DC e cujo nome completo é, por exemplo, /home/user/meucorpo.txt
- Criar uma directoria dentro da directoria corpos com o nome do corpo:
> mkdir meucorpo
- Copiar o corpo para essa directoria, mudando-lhe o nome para corpus
> cp /home/user/meucorpo.txt <DIR_CORTECOSTURA>/corpos/meucorpo/corpus
- Mudar para a directoria nova onde está o corpo
> cd <DIR_CORTECOSTURA>/corpos/meucorpo/corpus
- Correr o programa acdc_pinta_corpo.sh indicando a posição do lema no corpo:
> ./acdc_corte-e-costura.sh <posição do lema>
NOTA: Neste caso são usadas as regras genéricas regras_corr_PALAVRAS_{cor|roupa}.txt, regras_positivas_{cor|roupa}.txt, regras_negativas__{cor|roupa}.txt, regras_especializacao_{cor|roupa}.txt e regras_recursivas_{cor|roupa}.txt, e as regras exclusivas que o utilizador possa ter criado na directoria do corpo.
O artigo Mota e Santos (2009) descreve em detalhe o formato das regras e as diversas opções que podem ser usadas quando se corre o programa acdc_corte-e-costura.pl.
Última actualização: 25 de Agosto de 2010.
Data de criação da presente página: 27 de Julho de 2010.