O corpus PortFalDA é composto (neste momento) por 50 textos, de Portugal e do Brasil.
Como citar o (conteúdo do) corpus PortFALDA:
Português Falado: Documentos Autênticos (Gravações audio com transcriçao alinhada), conjunto de quatro CD-ROM, produzido pelo Centro de Linguística da Universidade de Lisboa (CLUL), Instituto Camões, com apoio da União Europeia (Programas LINGUA e SOCRATES/LINGUA) numa parceria entre o CLUL, a Universidade de Toulouse-le-Mirail e a Universidade de Aix-en-Provence.
Estrutura do corpoMarcadores posicionais: varianteMarcadores estruturais: texto [nome do texto], pergunta, resposta, p [parágrafo], s [frase]. Distribuição por varianteA sua distribuição, correspondendo à versão 1.0, é a seguinte:
Versão do corpoCorpo PORTFALDA, texto original dos CD-ROM, anotado a 6 de julho de 2024, versão 6.1Excerto do corpo<texto A:Fazenda.txt> <resposta> <p> <s> -- uma fazenda é, fica em Friburgo, vinte minutos depois de Friburgo, portanto no município de Friburgo. </s> <s> a fazenda é bem grande, tem uma casa tipo colonial. </s> <s> a casa é toda cercada por um varand<E3>o com, com... </s> <s> cerquinha de madeira e depois então dentro tem uma sala muito grande, com duas portas em que se abrem duas alas, que são duas alas de quartos diferentes, cada ala com o seu banheiro... </s> <s> servindo. </s> Dados quantitativos
Número de unidades estruturais
Contabilização de multipalavras
Distribuição por categoria gramatical
Para informação sobre como foram obtidos este valores, consulte esta página |
[ Exemplos | Atomização | Anotação | Corpos | Agradecimentos ]