---
title: "korrelatsioon"
output: html_document
---
```{r}
library(tidyverse)
dokarvud=read_csv("http://www.tlu.ee/~jaagup/andmed/keel/korpus/dokarvud.txt")
cor(dokarvud$tahti, dokarvud$sonu)
ggplot(dokarvud, aes(tahti, sonu))+geom_point()
cor(dokarvud$kolmetahelistepr, dokarvud$kymnejarohkemtahelistepr)
dokarvud %>% filter(kolmetahelistepr>=10) %>%
ggplot(aes(kolmetahelistepr, kymnejarohkemtahelistepr))+geom_point()
dokarvud %>% select(-kood) %>% cor()
dokarvud %>% head(100) %>% select(-kood) %>% pairs()
cor.test(dokarvud$tahti, dokarvud$sonu)
#esisada=head(dokarvud, 100)
esisada=sample_n(dokarvud, 100)
cor.test(esisada$tahti, esisada$sonu)
dokarvud %>% ggplot(aes(tahti, sonu)) +
geom_point()+ geom_smooth()
dokarvud %>% ggplot(aes(tahti, sonu)) +
geom_point()+ geom_smooth(method="lm")
lm(dokarvud$tahti~dokarvud$sonu)
summary(lm(dokarvud$tahti~dokarvud$sonu))
lm(tahti~sonu, data=dokarvud)
predict(lm(tahti~sonu, data=dokarvud), tibble(sonu=c(10, 100, 1000)))
andmed=read_csv("http://archive.ics.uci.edu/ml/machine-learning-databases/00396/Sales_Transactions_Dataset_Weekly.csv")
colnames(andmed)
nadalad=andmed %>% select(W0:W51)
nadalad[1, ]-nadalad[3,]
(nadalad[1, ]-nadalad[3,])>0
names(nadalad)[(nadalad[1, ]-nadalad[3,])>0]
nadalad=andmed %>% select(Product_Code, W0:W51)
nadalad %>% filter(Product_Code=="P1" | Product_Code=="P3") %>%
select(-Product_Code) %>% t() %>% as_tibble() %>%
mutate(nadal=colnames(nadalad)[2:53], vahe=V1-V2) %>%
filter(vahe>0) %>% .$nadal
nadalad=andmed %>% select(W0:W51)
andmed$Product_Code[order(cor(t(nadalad))[,1 ])]
```