# comandos para o artigo "Broad coverage emotion annotation" tabela 1: acdc_literateca_emocoes.pl > exp (faz uma tabela em latex) tabela 3: primeiro$genero<-substr(primeiro$genero,1,6) primeiro[primeiro$genero=="Prosa:",]$genero<-"prose" primeiro[primeiro$genero=="Prosa",]$genero<-"prose" primeiro[primeiro$genero=="Poesia",]$genero<-"poetry" primeiro[primeiro$genero=="Teatro",]$genero<-"theater" summary(factor(primeiro$genero)) Drama Poetry Prose 89 100 668 sum(primeiro[primeiro$genero=="Prose",]$tamanho) 31.943.729 sum(primeiro[primeiro$genero=="Poetry",]$tamanho) 2.439.508 sum(primeiro[primeiro$genero=="Theater",]$tamanho) 1.522.400 figura 1: datasnum1<-subset(primeiro, data!="desc") datasnum<-subset(primeiro, grepl("^[12]",data)) datasnum$data<-as.numeric(as.character(datasnum$data)) decada<-function(x) { trunc((x-1350)/50)+1} datasnum$decada<-decada(datasnum$data) soma=array(14) for (i in 1:14) { soma[i]<-sum(datasnum[datasnum$decada==i,]$tamanho) } barplot(soma,names.arg=c("1350","1400","1450","1500","1550","1600", "1650","1700", "1750", "1800","1850","1900", "1950", "2000"),horiz=TRUE,las=1) png("~/R/Literatecatempo.png", height=14,width=14,units="cm", res=600, type = c("cairo", "cairo-png", "Xlib", "quartz")) barplot(soma,names.arg=c("1350","1400","1450","1500","1550","1600", "1650","1700", "1750", "1800","1850","1900", "1950", "2000"),horiz=TRUE,las=1) dev.off() figura 2: acdc_literateca_primeiro.pl acdc_literateca_segundo.pl #(depois de criar o todos) COST<-todos[grep("romance|novela",as.character(todos$genero), perl=TRUE),] COST$data<-COST$data[drop=TRUE] COST$data<-as.numeric(as.character(COST$data)) cost.ca<-corres.fnc(COST[,-c(1,2,4,5,28,140,144,145,146,147)]) png("~/R/periodo.png",height=12,width=15,units="cm", res=600, type = c("cairo", "cairo-png", "Xlib", "quartz")) plot(cost.ca,rlabels=COST$autor,extreme=0.15,rcex=.3,ccex=.3) dev.off() figura 3: # para o género do autor No AC/DC [sema=".*emo:.*"] Distribuição por obra colocar em emocoesObra.tsv No distribuidor obra sexo colocar em generoLiterateca.tsv # substituir fem por female e masc por male e colocar em genderLiterateca.tsv emos<-read.table("~/R/emocoesObra.tsv") colnames(emos)<-c("obra","emos","tamanho") gen<-read.table("~/R/genderLiterateca.tsv") colnames(gen)<-c("obra","tamanho","genero","Lico","lixo") head(gen) summary(gen) tudo<-merge(gen,emos,by=c("obra","tamanho")) summary(tudo) tudo2<-subset(tudo, tudo$genero!="__UNDEF__") tudo<-tudo2 tudo$emosrel<-tudo$emo/tudo$tamanho tudo$genero<-tudo$genero[drop=TRUE] boxplot(tudo$emosrel~tudo$genero) # para o género literário primrel<-primeiro[,-c(1,2,3,115,120,121,122,123,124,125)]/primeiro$tamanho boxplot(primrel$emocoes~primeiro$genero,ylab="relative number of emotions",xlab="") # para ambas as figuras lado a lado png("~/R/DuasCompar.png",height=10,width=20,units="cm", res=1000, type = c("cairo", "cairo-png", "Xlib", "quartz")) par(fig=c(0.1,0.65,0,1)) boxplot(primrel$emocoes~primeiro$genero,ylab="relative number of emotions",xlab="") par(fig=c(0.65,1,0,1), new=TRUE) boxplot(tudo$emosrel~tudo$genero,xlab="",ylab="") dev.off() figura 4: todosrel<-todos[,-c(1,2,3,4,5,28,144,145,146,147)]/todos$tamanho novo=data.frame(todosrel,todos$escola2) novo2<-novo[novo$todos.escola2!="desc",] novo2$todos.escola2<-novo2$todos.escola2[drop=TRUE] png("~/R/escolaLiteratura.png",height=10,width=10,units="cm", res=1000, type = c("cairo", "cairo-png", "Xlib", "quartz")) boxplot(novo2$emocoes~novo2$todos.escola2,xlab="",ylab="", las=2, main="Number of emotions per literary school") dev.off() figura 5: png("~/R/escolaAmor.png",height=10,width=10,units="cm",res=1000, type = c("cairo", "cairo-png", "Xlib", "quartz")) boxplot(novo2$amor~novo2$todos.escola2,xlab="",ylab="", las=2, main="Number of love mentions per literary school") dev.off() figura 6: figura 7: seisautores<-subset(primeiro,primeiro$autor=="JulDin"|primeiro$autor=="EcaQue"|primeiro$autor=="RauBra"|primeiro$autor=="CoeNet"|primeiro$autor=="MacAss"|primeiro$autor=="CamCBra") seisautores$autor<-seisautores$autor[drop=TRUE] png("~/R/SeisAutoresDens.png",height=10,width=18,units="cm", res=800, type = c("cairo", "cairo-png", "Xlib", "quartz")) boxplot(seisautores$emocoes/seisautores$tamanho~seisautores$autor,xlab="",ylab="Emotion density") dev.off() figura 8: No AC/DC [oritrad="ori"] distribuição do campo semântico colocar em emosORI [oritrad="trad"] distribuição do campo semântico colocar em emosTRAD acdc_limpa_emocoes.pl valoresORI acdc_limpa_emocoes.pl valoresTRAD trad<-read.table("~/R/valoresTRAD") ori<-read.table("~/R/valoresORI") colnames(trad)<-c("emo","tam") colnames(ori)<-c("emo","tam") sum(ori$tam) ori$rel<-ori$tam/sum(ori$tam) trad$rel<-trad$tam/sum(trad$tam) png("~/R/PANTERAoritrad.png",height=11,width=15,units="cm", res=1000, type = c("cairo", "cairo-png", "Xlib", "quartz")) par(mar=c(2,2,1,1)+0.1, mfrow=c(1,2)) pie(ori$rel, labels=ori$emo, main="Original Portuguese") pie(trad$rel, labels=trad$emo, main="Translation into Portuguese") dev.off()