Leidke oma andmestikus olevate pikkuste standardhälve Vikipeedia vastavas artiklis oleva arvutuskäigu abil (käsitsi)
pikkused=c(165, 169, 164, 168, 167, 160, 165)
keskmine=mean(pikkused)
keskmine
## [1] 165.4286
erinevused=pikkused-keskmine
erinevused
## [1] -0.4285714 3.5714286 -1.4285714 2.5714286 1.5714286 -5.4285714
## [7] -0.4285714
ruudud=erinevused*erinevused
ruudud
## [1] 0.1836735 12.7551020 2.0408163 6.6122449 2.4693878 29.4693878
## [7] 0.1836735
ruutudesumma=sum(ruudud)
sqrt(ruutudesumma/length(pikkused))
## [1] 2.770103
sqrt(ruutudesumma/(length(pikkused)-1))
## [1] 2.992053
sd(pikkused)
## [1] 2.992053
# barplot(pikkused)
boxplot(pikkused)
abline(h=mean(pikkused))
abline(h=mean(pikkused)+sd(pikkused), col="green")
abline(h=mean(pikkused)-sd(pikkused), col="green")
Andmete normaaljaotuse (keskel rohkem servades vähem) puhul ligikaudu 2/3 väärtustest jääb aritmeetilise keskmise +- 1 standardhälbe kaugusele
Harjutus:
Võtke 5. klassi andmed http://www.tlu.ee/~jaagup/andmed/muu/5klass.txt
Kuvage pikkuste ja masside xy-joonis (plot) Kuvage joontena välja nii pikkuste kui masside kohta aritmeetiline keskmine ning +- 1 standardhälve
lapsed=read.table("http://www.tlu.ee/~jaagup/andmed/muu/5klass.txt", header=TRUE, sep=",")
plot(lapsed$pikkus, lapsed$mass)
abline(v=mean(lapsed$pikkus))
abline(v=mean(lapsed$pikkus)+sd(lapsed$pikkus), col="green")
abline(v=mean(lapsed$pikkus)-sd(lapsed$pikkus), col="green")
abline(h=mean(lapsed$mass))
abline(h=mean(lapsed$mass)+sd(lapsed$mass), col="green")
abline(h=mean(lapsed$mass)-sd(lapsed$mass), col="green")