Equipa: Cláudia Freitas e Diana Santos
Anotamos a predicação feita sobre seres humanos com a marca sema=pred:X, em que X pode ter os seguintes valores: social, aparencia, carater, emo e outro.
Para obter os casos que mais tarde classificamos como pertencendo a um ou mais destes grupos, fizemos o seguinte trabalho preliminar, com a parte de prosa (classe="Prosa:.*") a partir do século XVIII (data="(1[789].*)|(2.*)") de textos originais da versão 10.9 da Literateca (32,8 milhões de unidades, 674 obras de 205 autores):
([pos="PROP.*" & func=".*SUBJ>.*" & sema="(.*hum.*)|(Pessoa.*)" & classe="Prosa.*" & data="(1[789].*)|2.*" & oritrad="ori"] [lema="ser|estar|ficar"] [pos="ADV.*"]* @[temcagr!=".*PASS.*" & pos="(ADJ|N|V).*" & func=".*<SC.*"])| ( [pos="PROP.*" & func=".*SUBJ>.*" & sema="(.*hum.*)|(Pessoa.*)" & classe="Prosa.*" & data="(1[789].*)|2.*" & oritrad="ori"] [lema="ser|estar|ficar"] [pos="ADV.*"]* [pos="ADJ.*" & func!=">N"] ("," [pos="ADV.*"]* [pos="ADJ.*" & func!=">N"])* [word=",|e"] @[pos="ADJ.*" & func!=">N"])| ([lema="mulher|moça|rapariga|homem|moço|rapaz|senhora?.*|sra?\..*|D\.=.*|Dona\.|Dra?\.=|doutora?.*|dama|donzela|cavalheiro|jovem" & func=".*SUBJ>.*" & classe="Prosa.*" & data="(1[789].*)|2.*" & oritrad="ori"][lema="ser|estar|ficar"] [pos="ADV.*"]* @[temcagr!=".*PASS.*" & pos="(ADJ|N|V).*" & func=".*<SC.*"])| ([lema="mulher|moça|rapariga|homem|moço|rapaz|senhora?.*|sra?\..*|D\.=.*|Dona\.|Dra?\.=|doutora?.*|dama|donzela|cavalheiro|jovem" & func=".*SUBJ>.*" & classe="Prosa.*" & data="(1[789].*)|2.*" & oritrad="ori"][lema="ser|estar|ficar"] [pos="ADV.*"]* [pos="ADJ.*" & func!=">N"] ("," [pos="ADV.*"]* [pos="ADJ.*" & func!=">N"])* [word=",|e"] @[pos="ADJ.*" & func!=">N"])| ([sema="familia:lacos" & lema!="fam[íi]lia" & func=".*SUBJ>.*" & classe="Prosa.*" & data="(1[789].*)|2.*" & oritrad="ori"][lema="ser|estar|ficar"] [pos="ADV.*"]* @[temcagr!=".*PASS.*" & pos="(ADJ|N|V).*" & func=".*<SC.*"])| ([sema="familia:lacos" & lema!="fam[íi]lia" & func=".*SUBJ>.*" & classe="Prosa.*" & data="(1[789].*)|2.*" & oritrad="ori"][lema="ser|estar|ficar"] [pos="ADV.*"]* [pos="ADJ.*" & func!=">N"] ("," [pos="ADV.*"]* [pos="ADJ.*" & func!=">N"])* [word=",|e"] @[pos="ADJ.*" & func!=">N"])| ([lema="el[l]*[ae]" & func=".*SUBJ>.*" & classe="Prosa.*" & data="(1[789].*)|2.*" & oritrad="ori"] [lema="ser|estar|ficar"] [pos="ADV.*"]* @[temcagr!=".*PASS.*" & pos="(ADJ|N|V).*" & func=".*<SC.*"])| ([lema="el[l]*[ae]" & func=".*SUBJ>.*" & classe="Prosa.*" & data="(1[789].*)|2.*" & oritrad="ori"] [lema="ser|estar|ficar"] [pos="ADV.*"]* [pos="ADJ.*" & func!=">N"] ("," [pos="ADV.*"]* [pos="ADJ.*" & func!=">N"])* [word=",|e"] @[pos="ADJ.*" & func!=">N"])| ([sema=".*prof.*" & func=".*SUBJ>.*" & classe="Prosa.*" & data="(1[789].*)|2.*" & oritrad="ori"][lema="ser|estar|ficar"] [pos="ADV.*"]* @[temcagr!=".*PASS.*" & pos="(ADJ|N|V).*" & func=".*<SC.*"])| ([sema=".*prof.*" & func=".*SUBJ>.*" & classe="Prosa.*" & data="(1[789].*)|2.*" & oritrad="ori"][lema="ser|estar|ficar"] [pos="ADV.*"]* [temcagr!=".*PASS.*" & pos="(ADJ|N|V).*" & func=".*<SC.*"] [pos="ADJ.*" & func!=">N"] ([word=","] [pos="ADV.*"]* @[pos="ADJ.*" & func!=">N"])* [word="e|,"] @[pos="ADJ.*" & func!=">N"])| ([lema="mulher|moça|rapariga|esposa|homem|moço|rapaz|dama|donzela|cavalheiro|jovem" & classe="Prosa.*" & data="(1[789].*)|2.*" & oritrad="ori"] @[pos="(N|ADJ|V).*" & temcagr!=".*IND.*" & func=".*(<PRED|<OC|N<).*"])| ([lema="mulher|moça|rapariga|esposa|homem|moço|rapaz|dama|donzela|cavalheiro|jovem" & classe="Prosa.*" & data="(1[789].*)|2.*" & oritrad="ori"] [pos="(N|ADJ|V).*" & temcagr!=".*IND.*" & func=".*(<PRED|<OC|N<).*"] ("," [pos="ADV.*"]* [pos="(N|ADJ|V).*" & temcagr!=".*IND.*" & func=".*(<PRED|<OC|N<).*"])* [word="e|,"] @[pos="(N|ADJ).*" & func=".*(<PRED|<OC|N<).*"])| ([lema="senhora?.*|sra?\..*|D\.=.*|Dona\.|Dra?\.=|doutora?.*" & classe="Prosa.*" & data="(1[789].*)|2.*" & oritrad="ori"] @[pos="(ADJ|V).*" & temcagr!=".*(IND|GER|SUBJ).*" & func=".*(<PRED|<OC|N<).*"])| ([pos="PROP.*" & sema="(.*hum.*)|(Pessoa.*)" & classe="Prosa.*" & data="(1[789].*)|2.*" & oritrad="ori"]"," [pos="ADV.*"]* @[func="N<PRED|.*APP.*" & pos="ADJ"])| ([pos="PROP.*" & sema="(.*hum.*)|(Pessoa.*)" & classe="Prosa.*" & data="(1[789].*)|2.*" & oritrad="ori"]"," [pos="ADV.*"]* @[func="N<PRED|.*APP.*" & pos="ADJ|N|V" & temcagr!=".*(IND|GER|SUBJ).*"] [word="e|,"] @[func="N<PRED|.*APP.*" & pos="ADJ|N|V" & temcagr!=".*(IND|GER|SUBJ).*"])| ([lema="el[l]*[ae]" & classe="Prosa.*" & data="(1[789].*)|2.*" & oritrad="ori"]"," [pos="ADV.*"]* @[func="N<PRED|.*APP.*" & pos="ADJ"])| ([lema="mulher|moça|rapariga|esposa|homem|moço|rapaz|senhora?|dama|donzela|cavalheiro|jovem" & classe="Prosa.*" & data="(1[789].*)|2.*" & oritrad="ori"] "," [pos="ADV.*"]* @[func="N<PRED|.*APP.*" & pos="ADJ"])| ([lema="mulher|moça|rapariga|esposa|homem|moço|rapaz|senhora?|dama|donzela|cavalheiro|jovem" & classe="Prosa.*" & data="(1[789].*)|2.*" & oritrad="ori"] "," [pos="ADV.*"]* [func="N<PRED|.*APP.*" & pos="ADJ|N|V" & temcagr!=".*(IND|GER|SUBJ).*"] ([word=","] [pos="ADV.*"]* [func="N<PRED|.*APP.*" & pos="ADJ|N|V" & temcagr!=".*(IND|GER|SUBJ).*"])* [word="e|,"] @[func="N<PRED|.*APP.*" & pos="ADJ|N|V" & temcagr!=".*(IND|GER|SUBJ).*"])| ([sema=".*prof.*" & classe="Prosa.*" & data="(1[789].*)|2.*" & oritrad="ori"] "," [pos="ADV.*"]* @[func="N<PRED|.*APP.*" & pos="ADJ"])| ([sema=".*prof.*" & classe="Prosa.*" & data="(1[789].*)|2.*" & oritrad="ori"] "," [pos="ADV.*"]* [func="N<PRED|.*APP.*" & pos="ADJ"] [word="e|,"] @[func="N<PRED|.*APP.*" & pos="ADJ"])| ([sema=".*prof.*" & classe="Prosa.*" & data="(1[789].*)|2.*" & oritrad="ori"] "," [pos="ADV.*"]* [func="N<PRED|.*APP.*" & pos="ADJ"] ([word=","] [pos="ADV.*"]* [func="N<PRED|.*APP.*" & pos="ADJ"])* [word="e|,"] @[func="N<PRED|.*APP.*" & pos="ADJ"])| (@[func=">N" & pos="ADJ|V"] [lema="mulher|moça|rapariga|homem|moço|rapaz|senhora?.*|sra?\..*|D\.=.*|Dona\.|Dra?\.=|doutora?.*|dama|donzela|cavalheiro|jovem" & classe="Prosa.*" & data="(1[789].*)|2.*" & oritrad="ori"])| ([func=">N" & pos="ADJ|V"] ([word=","] [pos="ADV.*"]* [func=">N" & pos="ADJ|V"])* [word="e|,"] @[func=">N" & pos="ADJ|V"][lema="mulher|moça|rapariga|homem|moço|rapaz|senhora?.*|sra?\..*|D\.=.*|Dona\.|Dra?\.=|doutora?.*|dama|donzela|cavalheiro|jovem" & classe="Prosa.*" & data="(1[789].*)|2.*" & oritrad="ori"])| (@[func=">N" & pos="ADJ|V" & temcagr!=".*(IND|GER|SUBJ).*"] [pos="PROP.*" & sema="(.*hum.*)|(Pessoa.*)" & classe="Prosa.*" & data="(1[789].*)|2.*" & oritrad="ori"])| (@[func=">N" & pos="ADJ|V" & temcagr!=".*(IND|GER|SUBJ).*"] ([word=","] [pos="ADV.*"]* [func=">N" & pos="ADJ|V" & temcagr!=".*(IND|GER|SUBJ).*"])* [word="e|,"] @[func=">N" & pos="ADJ|V" & temcagr!=".*(IND|GER|SUBJ).*"] [pos="PROP.*" & sema="(.*hum.*)|(Pessoa.*)" & classe="Prosa.*" & data="(1[789].*)|2.*" & oritrad="ori"])| (@[func=">N" & pos="ADJ|V" & temcagr!=".*(IND|GER|SUBJ).*"] [sema="familia:lacos" & lema!="fam[íi]lia" & classe="Prosa.*" & data="(1[789].*)|2.*" & oritrad="ori"])| (@[func=">N" & pos="ADJ|V" & temcagr!=".*(IND|GER|SUBJ).*"] [word="e|,"] [func=">N" & pos="ADJ|V" & temcagr!=".*(IND|GER|SUBJ).*"] [sema="familia:lacos" & lema!="fam[íi]lia" & classe="Prosa.*" & data="(1[789].*)|2.*" & oritrad="ori"])| (@[func=">N" & pos="ADJ|V" & temcagr!=".*(IND|GER|SUBJ).*"] [sema=".*prof.*" & classe="Prosa.*" & data="(1[789].*)|2.*" & oritrad="ori"])| (@[func=">N" & pos="ADJ|V" & temcagr!=".*(IND|GER|SUBJ).*"] ([word=","] [pos="ADV.*"]* [func=">N" & pos="ADJ|V" & temcagr!=".*(IND|GER|SUBJ).*"])* [word="e|,"] [func=">N" & pos="ADJ|V" & temcagr!=".*(IND|GER|SUBJ).*"] [sema=".*prof.*" & classe="Prosa.*" & data="(1[789].*)|2.*" & oritrad="ori"])os casos que nos pareceram provavelmente predicadores de termos humanos, e que podem resumir-se assim
Em casos onde os adjetivos eram sobretudo ou muito positivos, ou muito negativos, mas sem marcar claramente qual a dimensão, como incomparável, maravilhoso, ideal ou terrível marcamos como caráter_social_aparencia ou simplesmente caráter_social. Usamos a classificação outro para posições, doenças e outra caracterizações que não se enquadram na grelha acima. Quando as palavras simplesmente denotavam o resultado de uma ação (punido ), não foram considerados caracterizadores.
A partir de 11 de julho de 2020, passuo portanto a haver essa marcação adicional no corpo Literateca e nos corpos literários que o constituem, e será propagada a outros corpos.
É preciso contudo relembrar que é baseada em textos literários em prosa, e por isso deve ser usada com cuidado em outros tipos de texto.