---
title: "arvuvordlused"
output: html_document
---
#arvukogumite võrdlemine
```{r}
poistepikkused=c(172, 174, 173)
tydrukutepikkused=c(167, 169, 171, 170)
t.test(poistepikkused, tydrukutepikkused)
poistepikkused_jaanuar=c(170, 173, 173)
poistepikkused_mai=c(172, 174, 173)
t.test(poistepikkused_mai, poistepikkused_jaanuar, paired = TRUE)
t.test(poistepikkused_mai, poistepikkused_jaanuar)
t.test(poistepikkused_mai, poistepikkused_jaanuar, alternative = "greater")
t.test(poistepikkused_mai, poistepikkused_jaanuar, alternative = "greater", paired=TRUE)
```
#http://www.tlu.ee/~jaagup/andmed/keel/korpus/dokmeta.txt
#http://www.tlu.ee/~jaagup/andmed/keel/korpus/doksonaliigid.txt
Illustreerige naiste ja meeste nimisõnade (S) kasutust tekstides
Püüdke T-testiga näidata nende sarnasust või erinevust
```{r}
library(tidyverse)
dokmeta=read_csv("http://www.tlu.ee/~jaagup/andmed/keel/korpus/dokmeta.txt")
head(dokmeta %>% na.omit())
head(dokmeta %>% filter(!is.na(sugu)))
```
```{r}
doksonaliigid <-read_csv("http://www.tlu.ee/~jaagup/andmed/keel/korpus/doksonaliigid.txt")
koos=dokmeta %>% na.omit() %>% inner_join(doksonaliigid, by="kood")
head(koos)
```
```{r}
meestenimisonad <- koos %>% filter(sugu=="mees") %>% .$S
naistenimisonad <- koos %>% filter(sugu=="naine") %>% .$S
t.test(meestenimisonad, naistenimisonad)
```
```{r}
ggplot(koos, aes(sugu, kokku)) + geom_boxplot() + ylim(0, 1000)
```
```{r}
ggplot(koos, aes(kokku, fill=sugu)) + geom_histogram() + xlim(0, 1000)
```
```{r}
ggplot(koos, aes(S/kokku)) + geom_histogram() +facet_wrap(~sugu)
```
```{r}
koos2=koos %>% mutate(nimisonaosakaal=S/kokku) %>% select(sugu, nimisonaosakaal)
t.test(koos2[koos2$sugu=="mees", ]$nimisonaosakaal,
koos2[koos2$sugu=="naine",] $nimisonaosakaal)
```
```{r}
t.test(koos2[koos2$sugu=="mees", ]$nimisonaosakaal, mu=0.25)
t.test(koos2[koos2$sugu=="naine", ]$nimisonaosakaal, mu=0.25, conf.level=0.99)
```
```{r}
koos %>% ggplot(aes(keeletase, S/kokku)) + geom_boxplot()
```
```{r}
koos2=koos %>% mutate(nimisonaosakaal=S/kokku) %>% select(keeletase, nimisonaosakaal)
aov(koos2$nimisonaosakaal ~ koos2$keeletase)
summary(aov(koos2$nimisonaosakaal ~ koos2$keeletase))
TukeyHSD(aov(koos2$nimisonaosakaal ~ koos2$keeletase))
```
```{r}
koos2=koos %>% filter(keeletase %in% c("A2", "B1", "B2", "C1")) %>% mutate(nimisonaosakaal=S/kokku) %>% select(keeletase, nimisonaosakaal)
aov(koos2$nimisonaosakaal ~ koos2$keeletase)
summary(aov(koos2$nimisonaosakaal ~ koos2$keeletase))
TukeyHSD(aov(koos2$nimisonaosakaal ~ koos2$keeletase))
```
```{r}
```
```{r}
```
```{r}
```
```{r}
```