--- title: "korrelatsioon" output: html_document --- ```{r} library(tidyverse) dokarvud=read_csv("http://www.tlu.ee/~jaagup/andmed/keel/korpus/dokarvud.txt") cor(dokarvud$tahti, dokarvud$sonu) ggplot(dokarvud, aes(tahti, sonu))+geom_point() cor(dokarvud$kolmetahelistepr, dokarvud$kymnejarohkemtahelistepr) dokarvud %>% filter(kolmetahelistepr>=10) %>% ggplot(aes(kolmetahelistepr, kymnejarohkemtahelistepr))+geom_point() dokarvud %>% select(-kood) %>% cor() dokarvud %>% head(100) %>% select(-kood) %>% pairs() cor.test(dokarvud$tahti, dokarvud$sonu) #esisada=head(dokarvud, 100) esisada=sample_n(dokarvud, 100) cor.test(esisada$tahti, esisada$sonu) dokarvud %>% ggplot(aes(tahti, sonu)) + geom_point()+ geom_smooth() dokarvud %>% ggplot(aes(tahti, sonu)) + geom_point()+ geom_smooth(method="lm") lm(dokarvud$tahti~dokarvud$sonu) summary(lm(dokarvud$tahti~dokarvud$sonu)) lm(tahti~sonu, data=dokarvud) predict(lm(tahti~sonu, data=dokarvud), tibble(sonu=c(10, 100, 1000))) andmed=read_csv("http://archive.ics.uci.edu/ml/machine-learning-databases/00396/Sales_Transactions_Dataset_Weekly.csv") colnames(andmed) nadalad=andmed %>% select(W0:W51) nadalad[1, ]-nadalad[3,] (nadalad[1, ]-nadalad[3,])>0 names(nadalad)[(nadalad[1, ]-nadalad[3,])>0] nadalad=andmed %>% select(Product_Code, W0:W51) nadalad %>% filter(Product_Code=="P1" | Product_Code=="P3") %>% select(-Product_Code) %>% t() %>% as_tibble() %>% mutate(nadal=colnames(nadalad)[2:53], vahe=V1-V2) %>% filter(vahe>0) %>% .$nadal nadalad=andmed %>% select(W0:W51) andmed$Product_Code[order(cor(t(nadalad))[,1 ])] ```