arvud=c(2, 4, 4, 4, 5, 5, 7, 9)
  keskmine=mean(arvud)
  erinevus=arvud-keskmine
  ruudud=erinevus**2
  ruutudesumma=sum(ruudud)
  sqrt(ruutudesumma/length(arvud)) #üldkogum, kõik väärtused teada
## [1] 2
  sqrt(ruutudesumma/(length(arvud)-1)) #valim, alamosa üldkogumist
## [1] 2.13809
  sd(arvud) #r-i funktsioon standardhälbe arvutamiseks
## [1] 2.13809
            #standard deviation
  plot(arvud)
  abline(h=mean(arvud))
  abline(h=mean(arvud)+sd(arvud), col="green")
  abline(h=mean(arvud)-sd(arvud), col="green")

Harjutus:

Tutvuge õunte andmetega http://www.tlu.ee/~jaagup/andmed/muu/ounad/ounad100.txt Joonistage välja Kuldrenettide diameetrid Tõmmake joon aritmeetilise keskmise kohale Tõmmake jooned keskmisest +- 1 standardhälbe kaugusele

Koostage õuntele vastavalt sordile boxplot Kuvage arvuna kummagi sordile vastav standardhälve

  ounad=read.table("http://www.tlu.ee/~jaagup/andmed/muu/ounad/ounad100.txt", header=TRUE, sep=",")
 ounad
##        ounasort diameeter
## 1   Liivi sibul      3.68
## 2   Liivi sibul      1.79
## 3    Kuldrenett      3.99
## 4   Liivi sibul      3.66
## 5   Liivi sibul      1.95
## 6   Liivi sibul      3.26
## 7    Kuldrenett      3.65
## 8   Liivi sibul      2.56
## 9    Kuldrenett      5.52
## 10   Kuldrenett      2.53
## 11   Kuldrenett      9.76
## 12   Kuldrenett      3.65
## 13  Liivi sibul      2.91
## 14   Kuldrenett      8.16
## 15  Liivi sibul      2.85
## 16  Liivi sibul      3.67
## 17  Liivi sibul      3.47
## 18  Liivi sibul      2.80
## 19  Liivi sibul      1.01
## 20   Kuldrenett      5.50
## 21  Liivi sibul      2.85
## 22  Liivi sibul      4.03
## 23  Liivi sibul      1.95
## 24   Kuldrenett      7.48
## 25  Liivi sibul      3.49
## 26  Liivi sibul      3.44
## 27  Liivi sibul      2.28
## 28  Liivi sibul      3.06
## 29  Liivi sibul      1.99
## 30  Liivi sibul      3.58
## 31  Liivi sibul      2.22
## 32  Liivi sibul      2.81
## 33   Kuldrenett      5.53
## 34  Liivi sibul      2.13
## 35  Liivi sibul      2.19
## 36  Liivi sibul      3.87
## 37   Kuldrenett      1.71
## 38   Kuldrenett      1.82
## 39   Kuldrenett      1.93
## 40  Liivi sibul      3.48
## 41   Kuldrenett      0.42
## 42  Liivi sibul      3.91
## 43  Liivi sibul      4.01
## 44  Liivi sibul      2.74
## 45  Liivi sibul      4.04
## 46  Liivi sibul      2.64
## 47  Liivi sibul      3.48
## 48  Liivi sibul      3.05
## 49  Liivi sibul      3.21
## 50   Kuldrenett      3.49
## 51   Kuldrenett      6.13
## 52  Liivi sibul      2.51
## 53  Liivi sibul      2.00
## 54  Liivi sibul      2.59
## 55  Liivi sibul      4.43
## 56  Liivi sibul      3.41
## 57  Liivi sibul      2.27
## 58   Kuldrenett      1.64
## 59  Liivi sibul      3.35
## 60  Liivi sibul      1.43
## 61  Liivi sibul      2.76
## 62  Liivi sibul      2.77
## 63  Liivi sibul      2.96
## 64  Liivi sibul      3.44
## 65  Liivi sibul      5.67
## 66  Liivi sibul      2.55
## 67  Liivi sibul      2.74
## 68  Liivi sibul      2.85
## 69  Liivi sibul      3.52
## 70  Liivi sibul      1.99
## 71  Liivi sibul      4.53
## 72   Kuldrenett      2.06
## 73  Liivi sibul      2.39
## 74  Liivi sibul      2.98
## 75  Liivi sibul      4.50
## 76   Kuldrenett      6.92
## 77  Liivi sibul      2.18
## 78  Liivi sibul      3.23
## 79  Liivi sibul      4.30
## 80  Liivi sibul      3.11
## 81  Liivi sibul      1.99
## 82  Liivi sibul      4.42
## 83   Kuldrenett      0.75
## 84  Liivi sibul      5.20
## 85  Liivi sibul      2.36
## 86  Liivi sibul      1.85
## 87   Kuldrenett      3.65
## 88   Kuldrenett      6.84
## 89  Liivi sibul      4.13
## 90  Liivi sibul      3.96
## 91  Liivi sibul      2.11
## 92   Kuldrenett      1.17
## 93   Kuldrenett      1.32
## 94  Liivi sibul      3.34
## 95  Liivi sibul      1.66
## 96  Liivi sibul      3.21
## 97  Liivi sibul      2.66
## 98  Liivi sibul      1.57
## 99  Liivi sibul      2.56
## 100 Liivi sibul      4.10
 ounad[ounad$ounasort=="Kuldrenett", "diameeter"]
##  [1] 3.99 3.65 5.52 2.53 9.76 3.65 8.16 5.50 7.48 5.53 1.71 1.82 1.93 0.42
## [15] 3.49 6.13 1.64 2.06 6.92 0.75 3.65 6.84 1.17 1.32
 plot(ounad[ounad$ounasort=="Kuldrenett", "diameeter"])

 kuldrenetid=ounad[ounad$ounasort=="Kuldrenett", "diameeter"]
 mean(kuldrenetid)
## [1] 3.984167
 sd(kuldrenetid) #Kuldrenettide diameeter 4 +/- 2,6 cm 2/3 juhtudest
## [1] 2.600929
 hist(kuldrenetid, xlim=c(-3, 13))
 abline(v=mean(kuldrenetid))
 abline(v=mean(kuldrenetid)-sd(kuldrenetid), col="green")
 abline(v=mean(kuldrenetid)+sd(kuldrenetid), col="green")
 abline(v=mean(kuldrenetid)-2*sd(kuldrenetid), col="red")
 abline(v=mean(kuldrenetid)+2*sd(kuldrenetid), col="red")

Keskväärtuse ning kummalegi poole 2-kordse standardhälbe kaugusele mahub normaaljaotuse (keskel rohkem) puhul 95% andmetest

Harjutus: Võtke ette fail 1000 õunaga Koostage joonis õunte diameetritega Kuvage jooned keskväärtusega, 1 ning 2 standarhälbe kaugusega keskväärtusest Loendage, kui palju õunu on kaugemal kui 2 standardhälvet keskväärtusest

Joonistage õunad vastavalt sordile eri värvi Kuvage iga sordi kohta joon keskväärtuse ning seda ümbritseva standardhälbe kauguse tarbeks

  ounad=read.table("http://www.tlu.ee/~jaagup/andmed/muu/ounad/ounad1000.txt", header=TRUE, sep=",")
plot(ounad$diameeter)
abline(h=mean(ounad$diameeter))
abline(h=mean(ounad$diameeter)+sd(ounad$diameeter), col="green")
abline(h=mean(ounad$diameeter)-sd(ounad$diameeter), col="green")
abline(h=mean(ounad$diameeter)+2*sd(ounad$diameeter), col="red")
abline(h=mean(ounad$diameeter)-2*sd(ounad$diameeter), col="red")

ounad[ounad$diameeter>mean(ounad$diameeter)+2*sd(ounad$diameeter), ]
##       ounasort diameeter
## 38  Kuldrenett      8.11
## 59  Kuldrenett      9.13
## 60  Kuldrenett      7.81
## 65  Kuldrenett      9.42
## 73  Kuldrenett      7.79
## 90  Kuldrenett      8.82
## 99  Kuldrenett      7.82
## 118 Kuldrenett      7.43
## 129 Kuldrenett      7.41
## 151 Kuldrenett      8.11
## 250 Kuldrenett      8.85
## 285 Kuldrenett      8.87
## 322 Kuldrenett      7.60
## 341 Kuldrenett      8.25
## 348 Kuldrenett      7.43
## 360 Kuldrenett      7.70
## 376 Kuldrenett      7.64
## 414 Kuldrenett      8.01
## 433 Kuldrenett      8.39
## 451 Kuldrenett      9.18
## 458 Kuldrenett      7.71
## 536 Kuldrenett      8.42
## 577 Kuldrenett     10.10
## 630 Kuldrenett      8.34
## 650 Kuldrenett      9.06
## 680 Kuldrenett      9.35
## 685 Kuldrenett      7.93
## 690 Kuldrenett      7.52
## 750 Kuldrenett      8.75
## 783 Kuldrenett      7.55
## 804 Kuldrenett      8.56
## 853 Kuldrenett      8.15
## 945 Kuldrenett      7.69
suuremaid=length(ounad[ounad$diameeter>mean(ounad$diameeter)+2*sd(ounad$diameeter), "diameeter"])

Tuhandest 33 õuna, mille diameeter ületab keskväärtus + 2 standardhälvet Leidke, mitme õuna diameeter on väiksem kui keskväärtus - 2 standardhälvet Mitu õuna tuhandest ei mahu keskväärtus +/2 kahe standardhälbe vahele?

v2iksemaid=length(ounad[ounad$diameeter<mean(ounad$diameeter)-2*sd(ounad$diameeter), "diameeter"])
suuremaid+v2iksemaid
## [1] 38
100*(suuremaid+v2iksemaid)/length(ounad$diameeter)
## [1] 3.8