Estrutura do corpoO corpus contém as etiquetas art (artigo), a (autor), t (titulo), p (parágrafo) e s (frase). Cada parágrafo tem a identificação do jornal e da notícia além do número do parágrafo dentro da notícia. Por exemplo: DA-N0623-1 representa o primeiro parágrafo da notícia N0623 do Diário de Aveiro. O número de identificação da notícia é o o da edição electrónica do jornal.O atributo posicional fonte, que pode assumir os valores DA, DC, DL ou VD, indica de qual dos jornais do grupo é originário um determinado texto. Versão do corpoCorpus DIACLAV, versão texto criada em Abril de 2002, anotado a 7 de julho de 2024, v. 8.1Excerto do corpo<art j=DA e=N0106> <t> PSD propõe mais apoio para cultura popular </t> <p par=DA-N0106-1> <s frag> Os deputados aveirenses do PSD querem ver mais apoiadas as colectividades que se dedicam à recolha e promoção da cultura popular portuguesa </s> </p> <p par=DA-N0106-2> <s> As bandas filarmónicas, escolas de música, tunas, fanfarras, ranchos folclóricos e outras agremiações populares que se dediquem à actividade musical sõ o tema central de uma proposta de projecto de lei que deu, ontem, entrada na Assembleia da República . </s> <s frag> O documento tem a particularidade de ter sido elaborado e entregue pelos deputados do PSD eleitos pelo círculo de Aveiro, Roque da Cunha, Manuel de Oliveira e Hermínio Loureiro e Castro de Almeida, inspirados com certeza na profusõ deste tipo de agremiações no seu distrito de origem </s> </p> Dados quantitativos
Número de unidades estruturais
Contabilização de multipalavras
Distribuição por categoria gramatical
Para informação sobre como foram obtidos este valores, consulte esta página |
[ Exemplos | Atomização | Anotação | Corpos | Agradecimentos ]