---
title: "standardhalve"
output: html_document
---
```{r}
arvud=c(2, 4, 4, 4, 5, 5, 7, 9)
keskmine=mean(arvud)
erinevus=arvud-keskmine
ruudud=erinevus**2
ruutudesumma=sum(ruudud)
sqrt(ruutudesumma/length(arvud)) #üldkogum, kõik väärtused teada
sqrt(ruutudesumma/(length(arvud)-1)) #valim, alamosa üldkogumist
sd(arvud) #r-i funktsioon standardhälbe arvutamiseks
#standard deviation
plot(arvud)
abline(h=mean(arvud))
abline(h=mean(arvud)+sd(arvud), col="green")
abline(h=mean(arvud)-sd(arvud), col="green")
```
Harjutus:
Tutvuge õunte andmetega
http://www.tlu.ee/~jaagup/andmed/muu/ounad/ounad100.txt
Joonistage välja Kuldrenettide diameetrid
Tõmmake joon aritmeetilise keskmise kohale
Tõmmake jooned keskmisest +- 1 standardhälbe kaugusele
Koostage õuntele vastavalt sordile boxplot
Kuvage arvuna kummagi sordile vastav standardhälve
```{r}
ounad=read.table("http://www.tlu.ee/~jaagup/andmed/muu/ounad/ounad100.txt", header=TRUE, sep=",")
ounad
ounad[ounad$ounasort=="Kuldrenett", "diameeter"]
plot(ounad[ounad$ounasort=="Kuldrenett", "diameeter"])
kuldrenetid=ounad[ounad$ounasort=="Kuldrenett", "diameeter"]
mean(kuldrenetid)
sd(kuldrenetid) #Kuldrenettide diameeter 4 +/- 2,6 cm 2/3 juhtudest
hist(kuldrenetid, xlim=c(-3, 13))
abline(v=mean(kuldrenetid))
abline(v=mean(kuldrenetid)-sd(kuldrenetid), col="green")
abline(v=mean(kuldrenetid)+sd(kuldrenetid), col="green")
abline(v=mean(kuldrenetid)-2*sd(kuldrenetid), col="red")
abline(v=mean(kuldrenetid)+2*sd(kuldrenetid), col="red")
```
Keskväärtuse ning kummalegi poole 2-kordse standardhälbe kaugusele
mahub normaaljaotuse (keskel rohkem) puhul 95% andmetest
Harjutus:
Võtke ette fail 1000 õunaga
Koostage joonis õunte diameetritega
Kuvage jooned keskväärtusega, 1 ning 2 standarhälbe kaugusega keskväärtusest
Loendage, kui palju õunu on kaugemal kui 2 standardhälvet keskväärtusest
Joonistage õunad vastavalt sordile eri värvi
Kuvage iga sordi kohta joon keskväärtuse ning seda ümbritseva standardhälbe kauguse tarbeks
```{r}
ounad=read.table("http://www.tlu.ee/~jaagup/andmed/muu/ounad/ounad1000.txt", header=TRUE, sep=",")
plot(ounad$diameeter)
abline(h=mean(ounad$diameeter))
abline(h=mean(ounad$diameeter)+sd(ounad$diameeter), col="green")
abline(h=mean(ounad$diameeter)-sd(ounad$diameeter), col="green")
abline(h=mean(ounad$diameeter)+2*sd(ounad$diameeter), col="red")
abline(h=mean(ounad$diameeter)-2*sd(ounad$diameeter), col="red")
ounad[ounad$diameeter>mean(ounad$diameeter)+2*sd(ounad$diameeter), ]
suuremaid=length(ounad[ounad$diameeter>mean(ounad$diameeter)+2*sd(ounad$diameeter), "diameeter"])
```
Tuhandest 33 õuna, mille diameeter ületab keskväärtus + 2 standardhälvet
Leidke, mitme õuna diameeter on väiksem kui keskväärtus - 2 standardhälvet
Mitu õuna tuhandest ei mahu keskväärtus +/2 kahe standardhälbe vahele?
```{r}
v2iksemaid=length(ounad[ounad$diameeter