arvud=c(2, 4, 4, 4, 5, 5, 7, 9)
keskmine=mean(arvud)
erinevus=arvud-keskmine
ruudud=erinevus**2
ruutudesumma=sum(ruudud)
sqrt(ruutudesumma/length(arvud)) #üldkogum, kõik väärtused teada
## [1] 2
sqrt(ruutudesumma/(length(arvud)-1)) #valim, alamosa üldkogumist
## [1] 2.13809
sd(arvud) #r-i funktsioon standardhälbe arvutamiseks
## [1] 2.13809
#standard deviation
plot(arvud)
abline(h=mean(arvud))
abline(h=mean(arvud)+sd(arvud), col="green")
abline(h=mean(arvud)-sd(arvud), col="green")
Harjutus:
Tutvuge õunte andmetega http://www.tlu.ee/~jaagup/andmed/muu/ounad/ounad100.txt Joonistage välja Kuldrenettide diameetrid Tõmmake joon aritmeetilise keskmise kohale Tõmmake jooned keskmisest +- 1 standardhälbe kaugusele
Koostage õuntele vastavalt sordile boxplot Kuvage arvuna kummagi sordile vastav standardhälve
ounad=read.table("http://www.tlu.ee/~jaagup/andmed/muu/ounad/ounad100.txt", header=TRUE, sep=",")
ounad
## ounasort diameeter
## 1 Liivi sibul 3.68
## 2 Liivi sibul 1.79
## 3 Kuldrenett 3.99
## 4 Liivi sibul 3.66
## 5 Liivi sibul 1.95
## 6 Liivi sibul 3.26
## 7 Kuldrenett 3.65
## 8 Liivi sibul 2.56
## 9 Kuldrenett 5.52
## 10 Kuldrenett 2.53
## 11 Kuldrenett 9.76
## 12 Kuldrenett 3.65
## 13 Liivi sibul 2.91
## 14 Kuldrenett 8.16
## 15 Liivi sibul 2.85
## 16 Liivi sibul 3.67
## 17 Liivi sibul 3.47
## 18 Liivi sibul 2.80
## 19 Liivi sibul 1.01
## 20 Kuldrenett 5.50
## 21 Liivi sibul 2.85
## 22 Liivi sibul 4.03
## 23 Liivi sibul 1.95
## 24 Kuldrenett 7.48
## 25 Liivi sibul 3.49
## 26 Liivi sibul 3.44
## 27 Liivi sibul 2.28
## 28 Liivi sibul 3.06
## 29 Liivi sibul 1.99
## 30 Liivi sibul 3.58
## 31 Liivi sibul 2.22
## 32 Liivi sibul 2.81
## 33 Kuldrenett 5.53
## 34 Liivi sibul 2.13
## 35 Liivi sibul 2.19
## 36 Liivi sibul 3.87
## 37 Kuldrenett 1.71
## 38 Kuldrenett 1.82
## 39 Kuldrenett 1.93
## 40 Liivi sibul 3.48
## 41 Kuldrenett 0.42
## 42 Liivi sibul 3.91
## 43 Liivi sibul 4.01
## 44 Liivi sibul 2.74
## 45 Liivi sibul 4.04
## 46 Liivi sibul 2.64
## 47 Liivi sibul 3.48
## 48 Liivi sibul 3.05
## 49 Liivi sibul 3.21
## 50 Kuldrenett 3.49
## 51 Kuldrenett 6.13
## 52 Liivi sibul 2.51
## 53 Liivi sibul 2.00
## 54 Liivi sibul 2.59
## 55 Liivi sibul 4.43
## 56 Liivi sibul 3.41
## 57 Liivi sibul 2.27
## 58 Kuldrenett 1.64
## 59 Liivi sibul 3.35
## 60 Liivi sibul 1.43
## 61 Liivi sibul 2.76
## 62 Liivi sibul 2.77
## 63 Liivi sibul 2.96
## 64 Liivi sibul 3.44
## 65 Liivi sibul 5.67
## 66 Liivi sibul 2.55
## 67 Liivi sibul 2.74
## 68 Liivi sibul 2.85
## 69 Liivi sibul 3.52
## 70 Liivi sibul 1.99
## 71 Liivi sibul 4.53
## 72 Kuldrenett 2.06
## 73 Liivi sibul 2.39
## 74 Liivi sibul 2.98
## 75 Liivi sibul 4.50
## 76 Kuldrenett 6.92
## 77 Liivi sibul 2.18
## 78 Liivi sibul 3.23
## 79 Liivi sibul 4.30
## 80 Liivi sibul 3.11
## 81 Liivi sibul 1.99
## 82 Liivi sibul 4.42
## 83 Kuldrenett 0.75
## 84 Liivi sibul 5.20
## 85 Liivi sibul 2.36
## 86 Liivi sibul 1.85
## 87 Kuldrenett 3.65
## 88 Kuldrenett 6.84
## 89 Liivi sibul 4.13
## 90 Liivi sibul 3.96
## 91 Liivi sibul 2.11
## 92 Kuldrenett 1.17
## 93 Kuldrenett 1.32
## 94 Liivi sibul 3.34
## 95 Liivi sibul 1.66
## 96 Liivi sibul 3.21
## 97 Liivi sibul 2.66
## 98 Liivi sibul 1.57
## 99 Liivi sibul 2.56
## 100 Liivi sibul 4.10
ounad[ounad$ounasort=="Kuldrenett", "diameeter"]
## [1] 3.99 3.65 5.52 2.53 9.76 3.65 8.16 5.50 7.48 5.53 1.71 1.82 1.93 0.42
## [15] 3.49 6.13 1.64 2.06 6.92 0.75 3.65 6.84 1.17 1.32
plot(ounad[ounad$ounasort=="Kuldrenett", "diameeter"])
kuldrenetid=ounad[ounad$ounasort=="Kuldrenett", "diameeter"]
mean(kuldrenetid)
## [1] 3.984167
sd(kuldrenetid) #Kuldrenettide diameeter 4 +/- 2,6 cm 2/3 juhtudest
## [1] 2.600929
hist(kuldrenetid, xlim=c(-3, 13))
abline(v=mean(kuldrenetid))
abline(v=mean(kuldrenetid)-sd(kuldrenetid), col="green")
abline(v=mean(kuldrenetid)+sd(kuldrenetid), col="green")
abline(v=mean(kuldrenetid)-2*sd(kuldrenetid), col="red")
abline(v=mean(kuldrenetid)+2*sd(kuldrenetid), col="red")
Keskväärtuse ning kummalegi poole 2-kordse standardhälbe kaugusele mahub normaaljaotuse (keskel rohkem) puhul 95% andmetest
Harjutus: Võtke ette fail 1000 õunaga Koostage joonis õunte diameetritega Kuvage jooned keskväärtusega, 1 ning 2 standarhälbe kaugusega keskväärtusest Loendage, kui palju õunu on kaugemal kui 2 standardhälvet keskväärtusest
Joonistage õunad vastavalt sordile eri värvi Kuvage iga sordi kohta joon keskväärtuse ning seda ümbritseva standardhälbe kauguse tarbeks
ounad=read.table("http://www.tlu.ee/~jaagup/andmed/muu/ounad/ounad1000.txt", header=TRUE, sep=",")
plot(ounad$diameeter)
abline(h=mean(ounad$diameeter))
abline(h=mean(ounad$diameeter)+sd(ounad$diameeter), col="green")
abline(h=mean(ounad$diameeter)-sd(ounad$diameeter), col="green")
abline(h=mean(ounad$diameeter)+2*sd(ounad$diameeter), col="red")
abline(h=mean(ounad$diameeter)-2*sd(ounad$diameeter), col="red")
ounad[ounad$diameeter>mean(ounad$diameeter)+2*sd(ounad$diameeter), ]
## ounasort diameeter
## 38 Kuldrenett 8.11
## 59 Kuldrenett 9.13
## 60 Kuldrenett 7.81
## 65 Kuldrenett 9.42
## 73 Kuldrenett 7.79
## 90 Kuldrenett 8.82
## 99 Kuldrenett 7.82
## 118 Kuldrenett 7.43
## 129 Kuldrenett 7.41
## 151 Kuldrenett 8.11
## 250 Kuldrenett 8.85
## 285 Kuldrenett 8.87
## 322 Kuldrenett 7.60
## 341 Kuldrenett 8.25
## 348 Kuldrenett 7.43
## 360 Kuldrenett 7.70
## 376 Kuldrenett 7.64
## 414 Kuldrenett 8.01
## 433 Kuldrenett 8.39
## 451 Kuldrenett 9.18
## 458 Kuldrenett 7.71
## 536 Kuldrenett 8.42
## 577 Kuldrenett 10.10
## 630 Kuldrenett 8.34
## 650 Kuldrenett 9.06
## 680 Kuldrenett 9.35
## 685 Kuldrenett 7.93
## 690 Kuldrenett 7.52
## 750 Kuldrenett 8.75
## 783 Kuldrenett 7.55
## 804 Kuldrenett 8.56
## 853 Kuldrenett 8.15
## 945 Kuldrenett 7.69
suuremaid=length(ounad[ounad$diameeter>mean(ounad$diameeter)+2*sd(ounad$diameeter), "diameeter"])
Tuhandest 33 õuna, mille diameeter ületab keskväärtus + 2 standardhälvet Leidke, mitme õuna diameeter on väiksem kui keskväärtus - 2 standardhälvet Mitu õuna tuhandest ei mahu keskväärtus +/2 kahe standardhälbe vahele?
v2iksemaid=length(ounad[ounad$diameeter<mean(ounad$diameeter)-2*sd(ounad$diameeter), "diameeter"])
suuremaid+v2iksemaid
## [1] 38
100*(suuremaid+v2iksemaid)/length(ounad$diameeter)
## [1] 3.8