Corte-e-costura: anotação semântica de corpos

AC/DC : Linguateca

O corte-e-costura é um recurso criado pela Linguateca para fazer anotação semântica dos corpos do AC/DC, os quais se encontram no formato criado pelo PALAVRAS (Bick 2000). Este pacote é constituído por:

Levantar o corte-e-costura 1.0: zip, ficheiro LEIAME.txt

Instalação

  1. Extrair o conteúdo do pacote para onde for pretendido;
  2. Editar os ficheiros acdc_pinta_corpo.sh, acdc_pinta_corpo_teste.sh e acdc_corte-e-costura_teste.sh e modificar a variável DIR_CORTECOSTURA para o caminho completo onde o corte-e-costura foi instalado;
  3. Fazer a invocação dos programas a partir da directoria que contém o corpo que se pretende anotar.

Manual de utilização

O pacote corte-e-costura, além de conter os recursos necessários (programas e regras) para anotar genericamente qualquer corpo anotado previamente pelo PALAVRAS e que esteja no formato do AC/DC, inclui para testes ilustrativos dois programas e duas mantas de retalhos de textos, bem como as correspondentes regras de teste.

Os programas devem ser corridos da directoria onde se encontra o corpo a anotar, o qual deverá ter o nome corpus. As regras devem ser organizadas por campo semântico, acrescentando ao nome do ficheiro um sufixo que corresponde ao campo semântico que as regras anotam. Por exemplo, todos os ficheiros relativos à anotação do campo semântico da cor devem ter o sufixo _cor.

Em seguida, exemplifica-se cada um dos casos de anotação.

Artigos e relatórios sobre o corte-e-costura

O artigo Mota e Santos (2009) descreve em detalhe o formato das regras e as diversas opções que podem ser usadas quando se corre o programa acdc_corte-e-costura.pl.

Documentação adicional e outros artigos sobre o corte-e-costura podem ser consultados através do nosso catálogo de publicações, com a marca ACDC, que identifica todas as publicações associadas ao projecto AC/DC.

Historial

27 de Agosto de 2010
Lançamento público da primeira versão do corte-e-costura 1.0. Esta versão corresponde à que foi documentada e usada para produzir os resultados no artigo Santos e Mota (2010).

Última actualização: 26 de Agosto de 2010.
Data de criação da presente página: 13 de Maio de 2010.
Perguntas, comentários e sugestões