Acesso a corpos de português: Projecto AC/DC: corpo Diáspora TL-PT

Diáspora TL-PT : AC/DC : Linguateca
O corpo Diáspora TL-PT (Diáspora Timor Leste - Portugal) é um corpo de 12 entrevistas semi-guiadas a membros da comunidade timorense em Portugal, perfazendo seis horas de gravação, compiladas e transcritas no âmbito do projeto Patterns of multilingualism among different generations of the East-Timorese diasporic community in Portugal liderado por Susana Afonso e Francesco Goglia da Universidade de Exeter, no Reino Unido, e financiado pela British Academy (Small Grant SG100616). Para mais informação veja-se Afonso & Goglia (2012).

O corpo Diáspora TL-PT é composto por 12 ficheiros correspondendo cada um a uma entrevista.

Os entrevistados, membros da comunidade timorense em Portugal, têm diferentes idades e foram escolhidos para, tanto quanto possível, representarem as diferentes vagas de migração para Portugal

Como citar o corpo Diáspora TL-PT:

Estrutura do corpo

Marcadores posicionais: ent Marcadores estruturais: entrevista, pergunta, resposta, p [parágrafo], s [frase].

Versão do corpo

Corpus Diáspora TL - PT, anotado em outubro de 2013, criado a 6 de julho de 2024, v. 5.1

Excerto do corpo


<entrevista E10>
<pergunta>
<s> -- Boa tarde, tia . </s>
<s> Então, está tudo bem ? </s>
</pergunta>
<resposta>
<s> -- Bem, obrigada. </s>
<s> Faça favor . </s>
<s> Tem aí uma cadeira . </s>
</resposta>
</entrevista>
...

Dados quantitativos

Corpo DIASPORA Número de formasNúmero de tipos
Unidades 274093069
Total de palavras 219083047
Palavras em minúscula 164912337
Palavras com inicial maiúscula2314528
Palavras todas em maiúsculas 3216
Números 13555
Palavras com números
Palavras mistas33
Pontuação187519

Número de unidades estruturais

Atributo Número
pergunta 245
s 1035
v 0
resposta 213
entrevista 5
mwe 304

Contabilização de multipalavras

Número de entidades Número de unidades
Nomes próprios 650 846
Locuções 304 661
Palavras gráficas 21908 21908
Palavras simples 20401 20401
Palavras 21355 21908

Distribuição por categoria gramatical

Categoria gramaticalExpressão de procura Número de palavrasPercentagem do corpo
Substantivos N|N[^U].* 3442 16,87%
Verbos V.* 3807 18,66%
Adjectivos ADJ.* 765 3,75%
Pronomes pessoais .*PERS.* 786 3,85%
Preposições PRP.* 2889 14,16%
Conjunções K.* 1295 6,35%
Advérbios ADV.* 2375 11,64%
Determinantes .*DET.* 3027 14,84%
Especificadores .*SPEC.* 546 2,68%
Numerais NUM.* 279 1,37%

Para informação sobre como foram obtidos este valores, consulte esta página

[ Exemplos | Atomização | Anotação | Corpos | Agradecimentos ]


Última atualização: 13 de Julho de 2024
Perguntas, comentários e sugestões