--- title: "standardhalve" output: html_document --- ```{r} arvud=c(2, 4, 4, 4, 5, 5, 7, 9) keskmine=mean(arvud) erinevus=arvud-keskmine ruudud=erinevus**2 ruutudesumma=sum(ruudud) sqrt(ruutudesumma/length(arvud)) #üldkogum, kõik väärtused teada sqrt(ruutudesumma/(length(arvud)-1)) #valim, alamosa üldkogumist sd(arvud) #r-i funktsioon standardhälbe arvutamiseks #standard deviation plot(arvud) abline(h=mean(arvud)) abline(h=mean(arvud)+sd(arvud), col="green") abline(h=mean(arvud)-sd(arvud), col="green") ``` Harjutus: Tutvuge õunte andmetega http://www.tlu.ee/~jaagup/andmed/muu/ounad/ounad100.txt Joonistage välja Kuldrenettide diameetrid Tõmmake joon aritmeetilise keskmise kohale Tõmmake jooned keskmisest +- 1 standardhälbe kaugusele Koostage õuntele vastavalt sordile boxplot Kuvage arvuna kummagi sordile vastav standardhälve ```{r} ounad=read.table("http://www.tlu.ee/~jaagup/andmed/muu/ounad/ounad100.txt", header=TRUE, sep=",") ounad ounad[ounad$ounasort=="Kuldrenett", "diameeter"] plot(ounad[ounad$ounasort=="Kuldrenett", "diameeter"]) kuldrenetid=ounad[ounad$ounasort=="Kuldrenett", "diameeter"] mean(kuldrenetid) sd(kuldrenetid) #Kuldrenettide diameeter 4 +/- 2,6 cm 2/3 juhtudest hist(kuldrenetid, xlim=c(-3, 13)) abline(v=mean(kuldrenetid)) abline(v=mean(kuldrenetid)-sd(kuldrenetid), col="green") abline(v=mean(kuldrenetid)+sd(kuldrenetid), col="green") abline(v=mean(kuldrenetid)-2*sd(kuldrenetid), col="red") abline(v=mean(kuldrenetid)+2*sd(kuldrenetid), col="red") ``` Keskväärtuse ning kummalegi poole 2-kordse standardhälbe kaugusele mahub normaaljaotuse (keskel rohkem) puhul 95% andmetest Harjutus: Võtke ette fail 1000 õunaga Koostage joonis õunte diameetritega Kuvage jooned keskväärtusega, 1 ning 2 standarhälbe kaugusega keskväärtusest Loendage, kui palju õunu on kaugemal kui 2 standardhälvet keskväärtusest Joonistage õunad vastavalt sordile eri värvi Kuvage iga sordi kohta joon keskväärtuse ning seda ümbritseva standardhälbe kauguse tarbeks ```{r} ounad=read.table("http://www.tlu.ee/~jaagup/andmed/muu/ounad/ounad1000.txt", header=TRUE, sep=",") plot(ounad$diameeter) abline(h=mean(ounad$diameeter)) abline(h=mean(ounad$diameeter)+sd(ounad$diameeter), col="green") abline(h=mean(ounad$diameeter)-sd(ounad$diameeter), col="green") abline(h=mean(ounad$diameeter)+2*sd(ounad$diameeter), col="red") abline(h=mean(ounad$diameeter)-2*sd(ounad$diameeter), col="red") ounad[ounad$diameeter>mean(ounad$diameeter)+2*sd(ounad$diameeter), ] suuremaid=length(ounad[ounad$diameeter>mean(ounad$diameeter)+2*sd(ounad$diameeter), "diameeter"]) ``` Tuhandest 33 õuna, mille diameeter ületab keskväärtus + 2 standardhälvet Leidke, mitme õuna diameeter on väiksem kui keskväärtus - 2 standardhälvet Mitu õuna tuhandest ei mahu keskväärtus +/2 kahe standardhälbe vahele? ```{r} v2iksemaid=length(ounad[ounad$diameeter