Desenho, construção e utilização de corpora
(e sua aplicação em ensino e extracção de conhecimento)
Módulo da Primeira Escola de Verão da Linguateca, leccionado por Ana Frankenberg-Garcia, Belinda Maia, Diana Santos e José João Dias de Almeida.
Descrição geral
- A teoria e as técnicas de construção de corpora.
- Ferramentas e métodos de pesquisa.
- O uso de corpora no ensino e na construção de recursos de conhecimento.
- Definições de corpora. "corpus-driven" vs. "corpus-based".
- Relações entre corpora e ontologias ou dicionários neles baseados.
- Aplicações de corpora no ensino de línguas.
- Aplicações de corpora nos estudos de tradução.
- Aplicações de corpora para estudos contrastivos.
- Validação de hipóteses com base em corpora
- Do corpus "multi-uso" aos corpora específicos
- Tipos de corpora: mono- ou multilingue, paralelo, comparável
- Corpus e género textual ("genre").
- Qualidade e quantidade de textos
- Criação (semi)automática de corpora
- Anotação de corpora
- A Web como corpus?
Leitura obrigatória
- Frankenberg-Garcia, Ana. "A corpus-based study of loan words in original and translated texts". Proceedings from the Corpus Linguistics Conference Series, Vol. 1, no. 1, ISSN 1747-9398, doc
- Frankenberg-Garcia, Ana. "Pedagogical uses of Monolingual and Parallel Concordances" ELT Journal 59/3, June 2005, pp 189-198. pdf
- Maia, Belinda. 2002. "Corpora for terminology extraction the
differing perspectives and objectives of researchers, teachers and
language services providers", in Proceedings of the Workshop
"Language Resources in Translation Work and Research", a pre-conference
workshop to LREC 2002, Third International Conference on Language
Resources and Evaluation, rtf
- Maia, Belinda. "What are comparable corpora?", in Proc. of pre-conference workshop Multilingual Corpora: Linguistic Requirements and Technical perspectives, at Corpus Linguistics 2003, Lancaster UK, 2003, pp. 27-34, doc.
Leitura complementar
- Bowker, Lynne & Jennifer Pearson. Working with Specialised Language: A Practical Guide to using Corpora. Routledge, 2002.
- Frankenberg-Garcia, Ana. "A Peek into What Today's Language Learners as Researchers Actually Do". International Journal of Lexicography, September 2005, pp 335-355. pdf
- Frankenberg-Garcia, Ana. "Lost in parallel concordances" In G. Aston, S. Bernardini &: D. Stewart (eds.) Corpora and language learners. Amsterdam: John Benjamins, 2004, pp 213-229. pdf
- Frankenberg-Garcia, Ana. "Are translations longer than source
texts? A corpus-based study of explicitation". Paper presented at the
Third International CULT (Corpus Use and Learning to Translate)
Conference, Barcelona, 22-24 January 2004. doc
- Maia, Belinda. "Using Corpora for Terminology Extraction:
Pedagogical and computational approaches", in B.
Lewandowska-Tomasczczyk (ed), 2003 PALC 2001 Practical Applications of Language Corpora, Lódz Studies in language, Frankfurt: Peter Lang, 2003, pp. 147-164, doc
- McEnery, Tony & Andrew Wilson. Corpus Linguistics, 2nd Edition. Edinburgh University Press. http://bowland-files.lancs.ac.uk/monkey/ihe/linguistics/contents.htm
- Rocha, Paulo Alexandre & Diana Santos. "CETEMPúblico:
Um corpus de grandes dimensões de linguagem jornalística
portuguesa". In Maria das Graças Volpe Nunes (ed.), V Encontro
para o processamento computacional da língua portuguesa escrita
e falada (PROPOR 2000) (Atibaia, SP, 19-22 de Novembro de 2000),
São Paulo: ICMC/USP, pp. 131-140.rtf
- Santos, Diana & Signe Oksefjell. "Using a parallel corpus to validate independent claims". Languages in Contrast 2.1 (1999), pp. 117-132.
- Wynne, M (editor). Developing Linguistic Corpora: a Guide to Good Practice. Oxford: Oxbow Books. 2005. Available online from http://ahds.ac.uk/linguistic-corpora/
Material
Trabalho prático
Familiaridade com o Corpografo (http://www.linguateca.pt/Corpografo/) e com o projecto AC/DC (http://www.linguateca.pt/ACDC/)
Última actualização: 6 de Setembro de 2006.
Contacte a Linguateca, ou os autores: Ana Frankenberg-Garcia, Belinda Maia, Diana Santos ou José João Dias de Almeida