Estrutura do corpo
Marcadores estruturais:
ext [identificador do extracto, com informação sobre secção e semestre],
s [frase],
t [título ou subtítulo],
a [identificação do autor],
li [elemento de lista],
marca.
Além da palavra, o corpus tem mais dois atributos posicionais, sem [semestre em que o texto foi escrito ou enviado para o jornal]:
e sec [classificação da secção a que o texto pertencia]. Veja-se a discussão em
Rocha &
Santos (2000) sobre a forma da atribuição deste último.
semestre | tamanho | clt | clt-soc | com | des | eco | nd | opi | pol | soc
| 91a | 7886603 | 693593 | 196902 | 0 | 938994 | 554479 | 3085214 | 0 | 1071780 | 1345641
| 91b | 15192753 | 1340824 | 231836 | 0 | 1528983 | 1011469 | 6131340 | 0 | 2301046 | 2647255
| 92a | 16348268 | 2673242 | 571960 | 0 | 1629301 | 1630444 | 2235740 | 0 | 4184456 | 3423125
| 92b | 12261285 | 2361819 | 467620 | 0 | 1398860 | 1393465 | 545759 | 0 | 2895024 | 3198738
| 93a | 16248024 | 3376560 | 956726 | 0 | 1594643 | 1797613 | 639411 | 0 | 3643634 | 4239437
| 93b | 12954943 | 2402469 | 623377 | 0 | 1352091 | 1351559 | 1151885 | 0 | 2735006 | 3338556
| 94a | 16419555 | 3227022 | 932628 | 0 | 1622060 | 1695546 | 1573158 | 0 | 3528260 | 3840881
| 94b | 15863004 | 2956393 | 928838 | 0 | 1723261 | 1687719 | 1853105 | 0 | 3111101 | 3602587
| 95a | 17771895 | 2955082 | 1160531 | 0 | 1951429 | 1730870 | 2051920 | 0 | 3299135 | 4622928
| 95b | 16710434 | 2367651 | 1002660 | 0 | 1722706 | 1521040 | 2200797 | 0 | 3477658 | 4417922
| 96a | 12726373 | 1735699 | 0 | 13923 | 1528570 | 1032941 | 1288862 | 665855 | 2274510 | 4186013
| 96b | 12428452 | 1713465 | 0 | 0 | 1651662 | 846772 | 1327352 | 666120 | 2032749 | 4190332
| 97a | 10565482 | 1450540 | 0 | 18463 | 1414919 | 721358 | 986619 | 666125 | 1745266 | 3562192
| 97b | 10614785 | 1447537 | 0 | 263668 | 1321656 | 701988 | 1002743 | 607359 | 1935869 | 3333965
| 98a | 13778651 | 1553186 | 0 | 413544 | 1631575 | 850610 | 1872977 | 690043 | 2110806 | 4655910
| 98b | 9554076 | 1112954 | 0 | 290884 | 1116165 | 607395 | 916162 | 462371 | 1755329 | 3292816
| Todos |
| 33368036 | 7073078 | 1000482 | 24126875 | 19135268 | 28863044 | 3757873 | 42101629 | 57898298
|
Versão do corpo
Corpus CETEMPúblico anotado: versão 2.0 do texto, criada a 12 de dezembro de 2023, anotada a 7 de julho de 2024, v. 12.4
Excerto do corpo
<ext n=1 sec=clt sem=92b> <t> Um revivalismo refrescante </t> <p> <s> O 7 e Meio é um ex-libris da noite algarvia .</s> <s> É uma das mais antigas discotecas do Algarve , situada em Albufeira , que continua a manter os traços decorativos e as clientelas de sempre .</s> <s>É um pouco a versão de uma espécie de « outro lado » da noite , a meio caminho entre os devaneios de uma fauna periférica , seja de Lisboa , Londres , Dublin ou Faro e Portimão , e a postura circunspecta dos fiéis da casa , que dela esperam a música « geracionista » dos 60 ou dos 70 .</s> <s>Não deixa de ser , nos tempos que correm , um certo « very typical » algarvio , cabeça de cartaz para os que querem fugir a algumas movimentações nocturnas já a caminho da ritualização de massas , do género « vamos todos ao Calypso e encontramo-nos na Locomia » .</s> </p> </ext>
Dados quantitativos
Corpo CETEMPUBLICO
| Número de formas | Número de tipos |
Unidades | 239113359 | 982037 |
Total de palavras | 195231421 | 950002 |
Palavras em minúscula | 143657392 | 272522 |
Palavras com inicial maiúscula | 23531016 | 308922 |
Palavras todas em maiúsculas | 1433952 | 32496 |
Números | 1822324 | 10514 |
Palavras com números | 237589 | 14374 |
Palavras mistas | 131543 | 40307 |
Pontuação | 12858631 | 30928 |
Número de unidades estruturais
Atributo | Número |
p | 2567974 |
s | 7017219 |
ext | 1500650 |
t | 630946 |
a | 228845 |
mwe | 3379657 |
marca | 3808 |
Contabilização de multipalavras
| Número de entidades | Número de unidades |
Nomes próprios | 10406525 | 18410429 |
Locuções | 3379657 | 7198445 |
Palavras gráficas | 195231421 | 195231421 |
Palavras simples | 169622547 | 169622547 |
Palavras | 183408729 | 195231421 |
Distribuição por categoria gramatical
Categoria gramatical | Expressão de procura | Número de palavras | Percentagem do corpo |
Substantivos | N|N[^U].* | 39233114 | 23,13% |
Verbos | V.* | 24571823 | 14,49% |
Adjectivos | ADJ.* | 11530430 | 6,80% |
Pronomes pessoais | .*PERS.* | 2870079 | 1,69% |
Preposições | PRP.* | 34255424 | 20,20% |
Conjunções | K.* | 7658103 | 4,51% |
Advérbios | ADV.* | 9205190 | 5,43% |
Determinantes | .*DET.* | 34632744 | 20,42% |
Especificadores | .*SPEC.* | 3644771 | 2,15% |
Numerais | NUM.* | 4169230 | 2,46% |
Para informação sobre como foram obtidos este valores, consulte esta página
|