---
title: "sonapaarid"
output: html_document
---
# Sõnapaaride andmed
```{r }
library(RMySQL)
library(tidyverse)
yhendus<-dbConnect(dbDriver("MySQL"), user="root",
password="root", host="localhost", dbname='film')
paring<-dbSendQuery(yhendus, "SELECT film_id, keyword_id FROM efis_film_keyword ")
andmed1<-fetch(paring, n=-1)
head(andmed1)
paarid<-andmed1 %>% inner_join(andmed1, by="film_id") %>% filter(keyword_id.x% inner_join(filmid1, by=c("film_id"="id"))
aastapaarid<-aastapaarid %>% group_by(keyword_id.x, keyword_id.y) %>% mutate(kogus=n()) %>%
ungroup() %>% arrange(desc(kogus))
head(aastapaarid)
paarikogused<-aastapaarid %>% group_by(keyword_id.x, keyword_id.y) %>%
summarise(kogus=n()) %>% ungroup() %>% arrange(desc(kogus)) %>% head(5)
paarikogused
paarikogused[2, ]$keyword_id.x
for(nr in 1:nrow(paarikogused)){
print(nr)
}
paring<-dbSendQuery(yhendus, "SELECT keyword_id, value FROM efis_keyword_translation
WHERE language='et'")
votmesonad<-fetch(paring, n=-1)
for(nr in 1:nrow(paarikogused)){
kood1=paarikogused[nr, ]$keyword_id.x
kood2=paarikogused[nr, ]$keyword_id.y
sona1<-(votmesonad %>% filter(keyword_id==kood1))$value
sona2<-(votmesonad %>% filter(keyword_id==kood2))$value
(aastapaarid %>% filter(keyword_id.x==kood1, keyword_id.y==kood2))$production_year %>%
as.numeric() %>% hist( main=paste(sona1, " - ", sona2, " paari esinemine aastati"),
xlab="aasta", ylab="kogus")
}
```