library(RMySQL) library(tidyverse) yhendus<-dbConnect(dbDriver("MySQL"), user="root", password="root", host="localhost", dbname='film') paring<-dbSendQuery(yhendus, "SELECT id, production_year FROM efis_film") filmiandmed=fetch(paring, n=-1) head(filmiandmed) filmiandmed %>% group_by(production_year) %>% summarise(kogus=n()) %>% arrange(desc(kogus)) #_____ paring<-dbSendQuery(yhendus, "SELECT film_id, keyword_id FROM efis_film_keyword WHERE film_id<100") andmed1<-fetch(paring, n=-1) head(andmed1) paarid<-andmed1 %>% inner_join(andmed1, by="film_id") %>% filter(keyword_id.x% group_by(keyword_id.x, keyword_id.y) %>% summarise(kogus=n()) %>% arrange(desc(kogus)) %>% ungroup() paring<-dbSendQuery(yhendus, "SELECT keyword_id, value FROM efis_keyword_translation WHERE language='et'") votmesonad<-fetch(paring, n=-1) head(votmesonad) nrow(votmesonad) head(paarikogused) paarikogused %>% inner_join(votmesonad, by=c("keyword_id.x"="keyword_id")) %>% rename(esimene=value) sonapaarid<-paarikogused %>% inner_join(votmesonad, by=c("keyword_id.x"="keyword_id")) %>% rename(esimene=value) %>% inner_join(votmesonad, by=c("keyword_id.y"="keyword_id")) %>% rename(teine=value) %>% select(esimene, teine, kogus) head(sonapaarid) write_csv(sonapaarid, "d:/r/paarid1.csv") #komadega #write.csv2(sonapaarid, "d:/r/paarid1.csv") #semikoolonid vahele Exceli eesti seadete jaoks #_____ paring<-dbSendQuery(yhendus, "SELECT film_id, keyword_id FROM efis_film_keyword ") andmed1<-fetch(paring, n=-1) head(andmed1) paarid<-andmed1 %>% inner_join(andmed1, by="film_id") %>% filter(keyword_id.x% inner_join(filmid1, by=c("film_id"="id")) aastapaarid<-aastapaarid %>% group_by(keyword_id.x, keyword_id.y) %>% mutate(kogus=n()) %>% ungroup() %>% arrange(desc(kogus)) head(aastapaarid) sample_n(aastapaarid, 5) (aastapaarid %>% filter(keyword_id.x==36346, keyword_id.y==82991))$production_year %>% as.numeric() %>% hist() kood1=36346 kood2=82991 sona1<-(votmesonad %>% filter(keyword_id==kood1))$value sona2<-(votmesonad %>% filter(keyword_id==kood2))$value (aastapaarid %>% filter(keyword_id.x==kood1, keyword_id.y==kood2))$production_year %>% as.numeric() %>% hist( main=paste(sona1, " - ", sona2, " paari esinemine aastati"), xlab="aasta", ylab="kogus") paarikogused<-aastapaarid %>% group_by(keyword_id.x, keyword_id.y) %>% summarise(kogus=n()) %>% ungroup() %>% arrange(desc(kogus)) %>% head(5) paarikogused paarikogused[2, ]$keyword_id.x for(nr in 1:nrow(paarikogused)){ print(nr) } for(nr in 1:nrow(paarikogused)){ kood1=paarikogused[nr, ]$keyword_id.x kood2=paarikogused[nr, ]$keyword_id.y sona1<-(votmesonad %>% filter(keyword_id==kood1))$value sona2<-(votmesonad %>% filter(keyword_id==kood2))$value (aastapaarid %>% filter(keyword_id.x==kood1, keyword_id.y==kood2))$production_year %>% as.numeric() %>% hist( main=paste(sona1, " - ", sona2, " paari esinemine aastati"), xlab="aasta", ylab="kogus") }