Jaotused
pikkused=rnorm(1000, 170, 10)
head(pikkused)
## [1] 182.0977 175.5071 164.1020 171.5319 163.6383 161.5812
hist(pikkused)
Milline osa andmetest oleks jaotuse järgi väiksem kui etteantud väärtus
Kui normaaljaotuse keskväärtus on 170 ja standardhälve 10, siis jaotuse järgi on pooled väärtused väiksemad kui 170
pnorm(170, 170, 10)
## [1] 0.5
Ligikaudu kuuendik on väärtusega keskväärtus - 1 standardhälve
pnorm(160, 170, 10)
## [1] 0.1586553
sum(pikkused<160)
## [1] 167
Proovige, mitu väärtust tuhandest võiks olla alla 130 teoreetilise jaotuse korral (m=170, sd=10) ja katseliselt
pnorm(130, 170, 10)
## [1] 3.167124e-05
sum(pikkused<130)
## [1] 1
1-pnorm(210, 170, 10)
## [1] 3.167124e-05
Pooled inimesed on lühemad kui 170 cm 10% inimesi on lühemad kui 157 cm
qnorm(0.5, 170, 10)
## [1] 170
qnorm(0.1, 170, 10)
## [1] 157.1845
Kui kõrge teha lennuk, et 99% inimesi mahuks seal püsti käima
qnorm(0.99, 170, 10)
## [1] 193.2635
Binoomjaotus - mitmest vabaviskest mitu sisse saab, kui teada pihtasaamise keskmine tõenäosus
Näites 100 katset, kümme vabaviset, ühe viske tabamise tõenäosus 50%
rbinom(100, 10, 0.5)
## [1] 3 4 8 3 3 7 7 4 5 7 5 5 4 7 4 5 4 5 6 5 3 7 2 7 5 7 6 4 5 3 4 8 5 5 4
## [36] 3 4 5 6 5 5 7 5 6 6 5 4 5 3 8 3 5 2 7 2 4 5 3 5 6 6 4 5 5 7 5 6 2 4 5
## [71] 4 6 6 5 5 5 5 7 6 3 3 4 6 7 4 6 5 7 3 3 3 4 7 8 4 7 6 2 4 3
Sama, keskmise tabavusega 20%
rbinom(100, 10, 0.2)
## [1] 1 3 3 1 4 2 2 1 5 2 0 2 2 3 1 1 2 2 1 0 1 1 6 3 3 2 2 2 4 0 2 1 0 2 3
## [36] 3 3 1 2 1 6 1 3 3 2 1 1 2 2 2 2 2 2 1 0 3 0 3 0 1 1 2 1 1 1 4 4 2 3 3
## [71] 2 1 2 1 0 1 1 2 2 0 4 3 5 1 2 0 3 3 2 2 0 2 1 2 3 2 2 2 3 2
tabamused=rbinom(100, 10, 0.2)
hist(tabamused, xlim=c(0, 10))
library(tidyverse)
## -- Attaching packages ----------- tidyverse 1.2.1 --
## <U+221A> ggplot2 3.0.0 <U+221A> purrr 0.2.5
## <U+221A> tibble 1.4.2 <U+221A> dplyr 0.7.6
## <U+221A> tidyr 0.8.1 <U+221A> stringr 1.3.1
## <U+221A> readr 1.1.1 <U+221A> forcats 0.3.0
## -- Conflicts -------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
tabel=tibble(tabamused=rbinom(100, 10, 0.2))
head(tabel)
## # A tibble: 6 x 1
## tabamused
## <int>
## 1 4
## 2 1
## 3 2
## 4 2
## 5 4
## 6 4
tabel %>% group_by(tabamused) %>% summarise(kogus=n()) %>%
ggplot(aes(tabamused, kogus)) + geom_point()
tabel=tibble(tabamused=rbinom(100, 10, 0.2))
sagedused=tabel %>% group_by(tabamused) %>% summarise(kogus=n()) %>% ungroup()
sagedused
## # A tibble: 6 x 2
## tabamused kogus
## <int> <int>
## 1 0 14
## 2 1 28
## 3 2 37
## 4 3 16
## 5 4 3
## 6 6 2
vahemikutabel=tibble(vaartus=0:10)
sagedustabel=vahemikutabel %>%
left_join(sagedused, by=c("vaartus"="tabamused")) %>%
replace_na(list(kogus=0))
sagedustabel
## # A tibble: 11 x 2
## vaartus kogus
## <int> <dbl>
## 1 0 14
## 2 1 28
## 3 2 37
## 4 3 16
## 5 4 3
## 6 5 0
## 7 6 2
## 8 7 0
## 9 8 0
## 10 9 0
## 11 10 0
sagedustabel %>% ggplot(aes(vaartus, kogus)) + geom_col() + geom_text(aes(label=c(0:10), y=-1, x=vaartus)) + theme(axis.text.x=element_blank(), axis.ticks.x = element_blank())
Kui viskan keskeltläbi 20% viskeid pihta, siis tõenäosus, et saan kümnest kuni ühe pihta on
pbinom(1, 10, 0.2)
## [1] 0.3758096
Et saan pihta 0, 1, 2 või 3 tükki
pbinom(3, 10, 0.2)
## [1] 0.8791261
Et saan kümnest pihta rohkem kui 3
1-pbinom(3, 10, 0.2)
## [1] 0.1208739
Täpselt kolme sisse viskamise tõenäosus
pbinom(3, 10, 0.2)-pbinom(2, 10, 0.2)
## [1] 0.2013266
Leidke, mitmel protsendil juhtudest sama tõenäosuse juures viskan sisse täpselt 2 palli kümnest
pbinom(2, 10, 0.2)-pbinom(1, 10, 0.2)
## [1] 0.3019899
10% juhtudest ei saa sisse ühtegi kümnest
pbinom(0, 10, 0.2)
## [1] 0.1073742
Kuni mitu viset saan pihta 87% juhtudest, kui viskeseeria pikkus on 10 ning tabavus on 20%
qbinom(0.87, 10, 0.2)
## [1] 3
Kui tabavusprotsent on 30, kui suur on tõenäosus, et saan kümneses seerias üle viie palli sisse
1-pbinom(5, 10, 0.3)
## [1] 0.04734899
Poissooni jaotus
Keskmisel juhtub aastas ristmikul kaks liiklusõnnetust, siis millised võiksid olla liiklusõnnetuste arvud aastas kümne aasta jooksul
rpois(10, 2)
## [1] 3 1 2 1 3 3 0 1 2 0
onnetusi=rpois(100, 3)
hist(onnetusi)
Keskeltläbi juhtub ristmikul 3 õnnetust aastas. Mitmel protsendil aastatest on kaks õnnetust või vähem
ppois(q=2,lambda=3)
## [1] 0.4231901
ppois(2, 3)
## [1] 0.4231901
Mitmel protsendil aastatest on rohkem kui 10 õnnetust, kui keskmine õnnetuste arv aastas on 3
1-ppois(10, 3)
## [1] 0.000292337
90% aastatest kolme keskmise õnnetuse juures aastas on õnnetusi aastas maksimaalselt
qpois(0.9, 3)
## [1] 5