Estrutura do corpo
Marcadores estruturais:
ext [identificador do extracto, com informação sobre secção e semestre],
s [frase],
t [título ou subtítulo],
a [identificação do autor],
li [elemento de lista],
marca.
Além da palavra, o corpus tem mais dois atributos posicionais, sem [semestre em que o texto foi escrito ou enviado para o jornal]:
e sec [classificação da secção a que o texto pertencia]. Veja-se a discussão em
Rocha &
Santos (2000) sobre a forma da atribuição deste último.
| semestre | tamanho | clt | clt-soc | com | des | eco | nd | opi | pol | soc
| | 91a | 7886603 | 693593 | 196902 | 0 | 938994 | 554479 | 3085214 | 0 | 1071780 | 1345641
| | 91b | 15192753 | 1340824 | 231836 | 0 | 1528983 | 1011469 | 6131340 | 0 | 2301046 | 2647255
| | 92a | 16348268 | 2673242 | 571960 | 0 | 1629301 | 1630444 | 2235740 | 0 | 4184456 | 3423125
| | 92b | 12261285 | 2361819 | 467620 | 0 | 1398860 | 1393465 | 545759 | 0 | 2895024 | 3198738
| | 93a | 16248024 | 3376560 | 956726 | 0 | 1594643 | 1797613 | 639411 | 0 | 3643634 | 4239437
| | 93b | 12954943 | 2402469 | 623377 | 0 | 1352091 | 1351559 | 1151885 | 0 | 2735006 | 3338556
| | 94a | 16419555 | 3227022 | 932628 | 0 | 1622060 | 1695546 | 1573158 | 0 | 3528260 | 3840881
| | 94b | 15863004 | 2956393 | 928838 | 0 | 1723261 | 1687719 | 1853105 | 0 | 3111101 | 3602587
| | 95a | 17771895 | 2955082 | 1160531 | 0 | 1951429 | 1730870 | 2051920 | 0 | 3299135 | 4622928
| | 95b | 16710434 | 2367651 | 1002660 | 0 | 1722706 | 1521040 | 2200797 | 0 | 3477658 | 4417922
| | 96a | 12726373 | 1735699 | 0 | 13923 | 1528570 | 1032941 | 1288862 | 665855 | 2274510 | 4186013
| | 96b | 12428452 | 1713465 | 0 | 0 | 1651662 | 846772 | 1327352 | 666120 | 2032749 | 4190332
| | 97a | 10565482 | 1450540 | 0 | 18463 | 1414919 | 721358 | 986619 | 666125 | 1745266 | 3562192
| | 97b | 10614785 | 1447537 | 0 | 263668 | 1321656 | 701988 | 1002743 | 607359 | 1935869 | 3333965
| | 98a | 13778651 | 1553186 | 0 | 413544 | 1631575 | 850610 | 1872977 | 690043 | 2110806 | 4655910
| | 98b | 9554076 | 1112954 | 0 | 290884 | 1116165 | 607395 | 916162 | 462371 | 1755329 | 3292816
| | Todos |
| 33368036 | 7073078 | 1000482 | 24126875 | 19135268 | 28863044 | 3757873 | 42101629 | 57898298
|
Versão do corpo
Corpus CETEMPúblico anotado: versão 2.0 do texto, criada a 12 de dezembro de 2023, anotada a 14 de outubro de 2025, v. 12.6
Excerto do corpo
<ext n=1 sec=clt sem=92b> <t> Um revivalismo refrescante </t> <p> <s> O 7 e Meio é um ex-libris da noite algarvia .</s> <s> É uma das mais antigas discotecas do Algarve , situada em Albufeira , que continua a manter os traços decorativos e as clientelas de sempre .</s> <s>É um pouco a versão de uma espécie de « outro lado » da noite , a meio caminho entre os devaneios de uma fauna periférica , seja de Lisboa , Londres , Dublin ou Faro e Portimão , e a postura circunspecta dos fiéis da casa , que dela esperam a música « geracionista » dos 60 ou dos 70 .</s> <s>Não deixa de ser , nos tempos que correm , um certo « very typical » algarvio , cabeça de cartaz para os que querem fugir a algumas movimentações nocturnas já a caminho da ritualização de massas , do género « vamos todos ao Calypso e encontramo-nos na Locomia » .</s> </p> </ext>
Dados quantitativos
| Corpo CETEMPUBLICO
| Número de formas | Número de tipos |
| Unidades | 238291013 | 982265 |
| Total de palavras | 195395130 | 981150 |
| Palavras em minúscula | 143674395 | 272747 |
| Palavras com inicial maiúscula | 23531304 | 308954 |
| Palavras todas em maiúsculas | 1433948 | 32497 |
| Números | 2010391 | 37892 |
| Palavras com números | 237589 | 14374 |
| Palavras mistas | 131514 | 40282 |
| Pontuação | 11670895 | 8 |
Número de unidades estruturais
| Atributo | Número |
| p | 2567953 |
| s | 7017148 |
| ext | 1500637 |
| t | 630938 |
| a | 228842 |
| mwe | 3480754 |
| marca | 3808 |
Contabilização de multipalavras
| Número de entidades | Número de unidades |
| Nomes próprios | 10406438 | 18410164 |
| Locuções | 3480754 | 7404351 |
| Palavras gráficas | 195395130 | 195395130 |
| Palavras simples | 169580615 | 169580615 |
| Palavras | 183467807 | 195395130 |
Distribuição por categoria gramatical
| Categoria gramatical | Expressão de procura | Número de palavras | Percentagem do corpo |
| Substantivos | N|N[^U].* | 39239008 | 23,14% |
| Verbos | V.* | 24576965 | 14,49% |
| Adjectivos | ADJ.* | 11530598 | 6,80% |
| Pronomes pessoais | .*PERS.* | 2870052 | 1,69% |
| Preposições | PRP.* | 34202076 | 20,17% |
| Conjunções | K.* | 7658033 | 4,52% |
| Advérbios | ADV.* | 9205102 | 5,43% |
| Determinantes | .*DET.* | 34835467 | 20,54% |
| Especificadores | .*SPEC.* | 3441927 | 2,03% |
| Numerais | NUM.* | 4169210 | 2,46% |
Para informação sobre como foram obtidos este valores, consulte esta página
|