library(tidyverse) sonad=read_csv("http://www.tlu.ee/~jaagup/andmed/keel/kunglarahvas_lambipirn_hinnad_pikkused_haalikud.txt") sonad2=sonad %>% mutate(tosa=taishaalikuid/sonapikkus) aov(tosa~lugu, data=sonad2) summary(aov(tosa~lugu, data=sonad2)) TukeyHSD(aov(tosa~lugu, data=sonad2)) ilm=read_csv("http://www.tlu.ee/~jaagup/andmed/ilm/harkutund.txt") jaanuar=ilm %>% filter(Kuu==1) summary(aov(TA1H~factor(Kell), data = jaanuar)) summary(aov(TA1H~factor(Kell), data = ilm %>% filter(Kuu==7))) TukeyHSD(aov(TA1H~factor(Kell), data = ilm %>% filter(Kuu==7))) summary(aov(PR1H~factor(Kell), data = ilm %>% filter(Kuu==7))) TukeyHSD(aov(PR1H~factor(Kell), data = ilm %>% filter(Kuu==7))) summary(aov(PR1H~factor(Kell), data = ilm %>% filter(Kuu==1))) TukeyHSD(aov(PR1H~factor(Kell), data = ilm %>% filter(Kuu==1))) summary(aov(WS1H~factor(Kell), data = ilm %>% filter(Kuu==1))) TukeyHSD(aov(WS1H~factor(Kell), data = ilm %>% filter(Kuu==1))) summary(aov(WS1H~factor(Kell), data = ilm %>% filter(Kuu==7))) TukeyHSD(aov(WS1H~factor(Kell), data = ilm %>% filter(Kuu==7))) ilm %>% filter(Kuu==7) %>% ggplot(aes(factor(Kell), WS1H)) + geom_boxplot() #Leidke ANOVA abil, kuivõrd eristatavad on suvekuude (juuni, juuli, august) #keskmised temperatuurid ilm %>% filter(Kuu>=6, Kuu<=8) ilm %>% filter(Kuu %in% c(6, 7, 8)) ilm %>% filter(Kuu%in% c(6, 7, 8)) %>% ggplot(aes(factor(Kuu), TA1H)) + geom_boxplot() summary(aov(TA1H~factor(Kuu), data = ilm %>% filter(Kuu%in% c(6, 7, 8)))) TukeyHSD(aov(TA1H~factor(Kuu), data = ilm %>% filter(Kuu%in% c(6, 7, 8)))) ilm2=read_csv("http://www.tlu.ee/~jaagup/andmed/ilm/harkupaev_toorandmed.txt") summary(aov(DTA08~factor(Kuu), data = ilm2 %>% filter(Kuu%in% c(6, 7, 8)))) ilm2 %>% filter(Kuu%in% c(6, 7, 8)) %>% ggplot(aes(factor(Kuu), DTA08)) + geom_boxplot() TukeyHSD(aov(DTA08~factor(Kuu), data = ilm2 %>% filter(Kuu%in% c(6, 7, 8)))) sonad=read_csv("http://www.tlu.ee/~jaagup/andmed/keel/kunglarahvas_lambipirn_pikkused_haalikud.txt") sonad %>% filter(lugu=="lambipirn") summary(lm(sonapikkus~taishaalikuid, data=sonad %>% filter(lugu=="lambipirn"))) mudel=lm(sonapikkus~taishaalikuid, data=sonad %>% filter(lugu=="lambipirn")) predict(mudel, tibble(taishaalikuid=c(3))) lm(taishaalikuid~sonapikkus+sulghaalikuid+lugu, data=sonad) summary(lm(taishaalikuid~sonapikkus+sulghaalikuid+lugu, data=sonad)) lm(sonapikkus~lugu, data=sonad) #glm(lugu~sonapikkus, data=sonad) kunglasonad=sonad %>% filter(lugu=="kungla") ryhmad=kmeans(kunglasonad %>% select(taishaalikuid, sulghaalikuid), centers=3) kunglasonad$ryhm=ryhmad$cluster kunglasonad kunglasonad %>% ggplot(aes(taishaalikuid, sulghaalikuid, color=factor(ryhm))) + geom_jitter() predict(ryhmad, sonad %>% filter(lugu=="lambipirn") %>% select(taishaalikuid, sulghaalikuid)) install.packages("fdm2id") library(fdm2id) #paiguta Lambipirni sõnad Kungla järgi loodud kolme rühma #kuva tulemus ekraanil, erista lugu täpi kujuga ryhmad2=predict(ryhmad, sonad %>% filter(lugu=="lambipirn") %>% select(taishaalikuid, sulghaalikuid)) lambipirnisonad=sonad %>% filter(lugu=="lambipirn") lambipirnisonad$ryhm=ryhmad2 lambipirnisonad %>% head() lambipirnisonad %>% ggplot(aes(taishaalikuid, sulghaalikuid, color=factor(ryhm))) + geom_jitter() lambipirnisonad %>% ggplot(aes(taishaalikuid, jitter(sulghaalikuid), color=factor(ryhm), label=sona)) + geom_text() lambipirnisonad %>% add_row(kunglasonad) %>% ggplot(aes(taishaalikuid, sulghaalikuid, color=factor(ryhm), shape=lugu)) + geom_jitter()