library(tidyverse) reisijad=read_csv("http://www.tlu.ee/~jaagup/andmed/muu/estonia_reisijad.txt") > mean(reisijad$Age) #aritmeetiline keskmine [1] 44.57533 > sd(reisijad$Age) #standardhälve [1] 17.23515 #Standardviga > sd(reisijad$Age)/sqrt(length(reisijad$Age)) [1] 0.5480457 One Sample t-test data: reisijad$Age t = 81.335, df = 988, p-value < 2.2e-16 alternative hypothesis: true mean is not equal to 0 95 percent confidence interval: 43.49986 45.65080 sample estimates: mean of x 44.57533 > mean(reisijad$Age)+2*standardviga [1] 45.67142 > mean(reisijad$Age)-2*standardviga [1] 43.47924 #Leidke eesti reisijate keskmise vanuse #95% tõenäosuse alam- ja ülempiir T-testi abil #Leidke eesti reisjate keskmine vanus, standardhälve #ning keskmine vanus +- 2-kordne standardviga eestireisijad=filter(reisijad, Country=="Estonia") t.test(eestireisijad$Age) sd(eestireisijad$Age) sv=sd(eestireisijad$Age)/sqrt(length(eestireisijad$Age)) mean(eestireisijad$Age)+2*sv mean(eestireisijad$Age)-2*sv piirid=c( mean(eestireisijad$Age)+2*sv, mean(eestireisijad$Age)-2*sv ) reisijad %>% ggplot(aes(Age)) + geom_histogram(bins=6) reisijad %>% ggplot(aes(Age)) + geom_histogram(bins=6)+ geom_vline(xintercept = piirid) reisijad %>% ggplot(aes(Age)) + geom_histogram()+ geom_histogram(data=reisijad %>% filter(Country=="Sweden"), fill="yellow")+ geom_histogram(data=reisijad %>% filter(Country=="Estonia"), fill="blue") t.test(reisijad %>% filter(Country=="Sweden") %>% .$Age) t.test(reisijad %>% filter(Country=="Sweden") %>% .$Age, reisijad %>% filter(Country=="Estonia") %>% .$Age) #Võrrelge t-testi abi reisijate ja meeskonnaliikmete keskmist vanust t.test(reisijad %>% filter(Category=="P") %>% .$Age, reisijad %>% filter(Category=="C") %>% .$Age) t.test(eestireisijad %>% filter(Category=="P") %>% .$Age, eestireisijad %>% filter(Category=="C") %>% .$Age) #Käivitage keskmise vanuse võrdlus Soome ja Venemaa kodanike vahel #Püüdke sõnastada vastus t.test(reisijad %>% filter(Country=="Finland") %>% .$Age, reisijad %>% filter(Country=="Russia") %>% .$Age, conf.level = 0.99) t.test(reisijad$Age, mu = 45) prop.test(15, 100) prop.test(82, 1739) prop.test(7, 600) #Võtke laevaandmestikust viiekümne vanima Eesti kodaniku andmed #Leidke, mitu neist on naised #prop.test-i abil leidke vanemas seltskonnas olevate eesti naiste #osakaalu alam- ja ülempiir 95% tõenäosusega #Kuvage keskväärtus ning piirid arvteljel kokku=30 naisi=eestireisijad %>% arrange(desc(Age)) %>% head(kokku) %>% filter(Sex=="F") %>% nrow() prop.test(naisi, kokku) piirid=prop.test(naisi, kokku)$conf.int ggplot()+xlim(0, 1)+ylim(0,1)+ geom_vline(xintercept = naisi/kokku)+ geom_vline(xintercept = piirid, color="red") prop.test(c(50, 40), c(100, 100))