--- title: "arvuvordlused" output: html_document --- #arvukogumite võrdlemine ```{r} poistepikkused=c(172, 174, 173) tydrukutepikkused=c(167, 169, 171, 170) t.test(poistepikkused, tydrukutepikkused) poistepikkused_jaanuar=c(170, 173, 173) poistepikkused_mai=c(172, 174, 173) t.test(poistepikkused_mai, poistepikkused_jaanuar, paired = TRUE) t.test(poistepikkused_mai, poistepikkused_jaanuar) t.test(poistepikkused_mai, poistepikkused_jaanuar, alternative = "greater") t.test(poistepikkused_mai, poistepikkused_jaanuar, alternative = "greater", paired=TRUE) ``` #http://www.tlu.ee/~jaagup/andmed/keel/korpus/dokmeta.txt #http://www.tlu.ee/~jaagup/andmed/keel/korpus/doksonaliigid.txt Illustreerige naiste ja meeste nimisõnade (S) kasutust tekstides Püüdke T-testiga näidata nende sarnasust või erinevust ```{r} library(tidyverse) dokmeta=read_csv("http://www.tlu.ee/~jaagup/andmed/keel/korpus/dokmeta.txt") head(dokmeta %>% na.omit()) head(dokmeta %>% filter(!is.na(sugu))) ``` ```{r} doksonaliigid <-read_csv("http://www.tlu.ee/~jaagup/andmed/keel/korpus/doksonaliigid.txt") koos=dokmeta %>% na.omit() %>% inner_join(doksonaliigid, by="kood") head(koos) ``` ```{r} meestenimisonad <- koos %>% filter(sugu=="mees") %>% .$S naistenimisonad <- koos %>% filter(sugu=="naine") %>% .$S t.test(meestenimisonad, naistenimisonad) ``` ```{r} ggplot(koos, aes(sugu, kokku)) + geom_boxplot() + ylim(0, 1000) ``` ```{r} ggplot(koos, aes(kokku, fill=sugu)) + geom_histogram() + xlim(0, 1000) ``` ```{r} ggplot(koos, aes(S/kokku)) + geom_histogram() +facet_wrap(~sugu) ``` ```{r} koos2=koos %>% mutate(nimisonaosakaal=S/kokku) %>% select(sugu, nimisonaosakaal) t.test(koos2[koos2$sugu=="mees", ]$nimisonaosakaal, koos2[koos2$sugu=="naine",] $nimisonaosakaal) ``` ```{r} t.test(koos2[koos2$sugu=="mees", ]$nimisonaosakaal, mu=0.25) t.test(koos2[koos2$sugu=="naine", ]$nimisonaosakaal, mu=0.25, conf.level=0.99) ``` ```{r} koos %>% ggplot(aes(keeletase, S/kokku)) + geom_boxplot() ``` ```{r} koos2=koos %>% mutate(nimisonaosakaal=S/kokku) %>% select(keeletase, nimisonaosakaal) aov(koos2$nimisonaosakaal ~ koos2$keeletase) summary(aov(koos2$nimisonaosakaal ~ koos2$keeletase)) TukeyHSD(aov(koos2$nimisonaosakaal ~ koos2$keeletase)) ``` ```{r} koos2=koos %>% filter(keeletase %in% c("A2", "B1", "B2", "C1")) %>% mutate(nimisonaosakaal=S/kokku) %>% select(keeletase, nimisonaosakaal) aov(koos2$nimisonaosakaal ~ koos2$keeletase) summary(aov(koos2$nimisonaosakaal ~ koos2$keeletase)) TukeyHSD(aov(koos2$nimisonaosakaal ~ koos2$keeletase)) ``` ```{r} ``` ```{r} ``` ```{r} ``` ```{r} ```