"Este trabalho foi produzido, parte no âmbito da preparação de doutoramento de João Paulo Teixeira e parte no Projecto ANTIGONA (programa IC-PME)"
Apresentamos a demonstração de uma faixa (com duração de cerca de 110 segundos) da Base de Dados de Fala Etiquetada para Português FEUP/IPB-DB.
Cada faixa (num total geral de cerca de 100 minutos de material gravado), foi cuidadosamente examinada e foram editadas colocadas etiquetas identificativas dos segmentos usando o software Speech Filing System (SFS) da UCL. Três níveis de etiquetas identificam marcas de fonemas, palavra e frase. A sílaba tónica também se encontra identificada com uma marca antes do primeiro fonema desta sílaba. As anotações de cada nível encontram-se num ficheiro de texto com a indicação do instante de tempo de ocorrência de cada elemento. As etiquetas ao nível do fonema são baseadas no código SAMPA (http://www.phon.ucl.ac.uk/home/sampa/home.htm) estendido com outros códigos presentes na tabela. As etiquetas identificativas dos segmentos ao nível da palavra e da frase encontram-se descritas nas linhas finais da tabela.
Etiqueta | Significado |
p, b, t, d, k, g | Segmentos pós-oclusão das consoantes oclusivas em código SAMPA |
! | Segmento de oclusão das consoantes oclusivas |
f, v, s, z, S, Z | Fricativas em código SAMPA |
m, n, J | Consoantes nasais em código SAMPA |
L, l, R, r | Consoantes líquidas em código SAMPA |
l* | l em posição final de sílaba (l velar) |
i, e, E, a, 6, O, o, u, @ | Vogais em código SAMPA |
i~,e~,6~,o~,u~,w~,j~ | Vogais nasais em código SAMPA |
w, j | Semi-vogais em código SAMPA |
X | Silêncio |
XX | Aspiração |
" | Início de sílaba tónica |
Nível de Palavra | |
i | Início de palavra |
f | Fim de palavra |
Nível de Frase | |
i | Início de frase |
. | Fim de frase |
, ! () - ; : ... " | Todas as marcas de pontuação que surgem no texto |