Jaotused

pikkused=rnorm(1000, 170, 10)
head(pikkused)
## [1] 182.0977 175.5071 164.1020 171.5319 163.6383 161.5812
hist(pikkused)

Milline osa andmetest oleks jaotuse järgi väiksem kui etteantud väärtus

Kui normaaljaotuse keskväärtus on 170 ja standardhälve 10, siis jaotuse järgi on pooled väärtused väiksemad kui 170

pnorm(170, 170, 10)
## [1] 0.5

Ligikaudu kuuendik on väärtusega keskväärtus - 1 standardhälve

pnorm(160, 170, 10)
## [1] 0.1586553
sum(pikkused<160)
## [1] 167

Proovige, mitu väärtust tuhandest võiks olla alla 130 teoreetilise jaotuse korral (m=170, sd=10) ja katseliselt

pnorm(130, 170, 10)
## [1] 3.167124e-05
sum(pikkused<130)
## [1] 1
1-pnorm(210, 170, 10)
## [1] 3.167124e-05

Pooled inimesed on lühemad kui 170 cm 10% inimesi on lühemad kui 157 cm

qnorm(0.5, 170, 10)
## [1] 170
qnorm(0.1, 170, 10)
## [1] 157.1845

Kui kõrge teha lennuk, et 99% inimesi mahuks seal püsti käima

 qnorm(0.99, 170, 10)
## [1] 193.2635

Binoomjaotus - mitmest vabaviskest mitu sisse saab, kui teada pihtasaamise keskmine tõenäosus

Näites 100 katset, kümme vabaviset, ühe viske tabamise tõenäosus 50%

  rbinom(100, 10, 0.5)
##   [1] 3 4 8 3 3 7 7 4 5 7 5 5 4 7 4 5 4 5 6 5 3 7 2 7 5 7 6 4 5 3 4 8 5 5 4
##  [36] 3 4 5 6 5 5 7 5 6 6 5 4 5 3 8 3 5 2 7 2 4 5 3 5 6 6 4 5 5 7 5 6 2 4 5
##  [71] 4 6 6 5 5 5 5 7 6 3 3 4 6 7 4 6 5 7 3 3 3 4 7 8 4 7 6 2 4 3

Sama, keskmise tabavusega 20%

  rbinom(100, 10, 0.2)
##   [1] 1 3 3 1 4 2 2 1 5 2 0 2 2 3 1 1 2 2 1 0 1 1 6 3 3 2 2 2 4 0 2 1 0 2 3
##  [36] 3 3 1 2 1 6 1 3 3 2 1 1 2 2 2 2 2 2 1 0 3 0 3 0 1 1 2 1 1 1 4 4 2 3 3
##  [71] 2 1 2 1 0 1 1 2 2 0 4 3 5 1 2 0 3 3 2 2 0 2 1 2 3 2 2 2 3 2
tabamused=rbinom(100, 10, 0.2)
hist(tabamused, xlim=c(0, 10))

library(tidyverse)
## -- Attaching packages ----------- tidyverse 1.2.1 --
## <U+221A> ggplot2 3.0.0     <U+221A> purrr   0.2.5
## <U+221A> tibble  1.4.2     <U+221A> dplyr   0.7.6
## <U+221A> tidyr   0.8.1     <U+221A> stringr 1.3.1
## <U+221A> readr   1.1.1     <U+221A> forcats 0.3.0
## -- Conflicts -------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
tabel=tibble(tabamused=rbinom(100, 10, 0.2))
head(tabel)
## # A tibble: 6 x 1
##   tabamused
##       <int>
## 1         4
## 2         1
## 3         2
## 4         2
## 5         4
## 6         4
tabel %>% group_by(tabamused) %>% summarise(kogus=n()) %>%
   ggplot(aes(tabamused, kogus)) + geom_point()

tabel=tibble(tabamused=rbinom(100, 10, 0.2))
sagedused=tabel %>% group_by(tabamused) %>% summarise(kogus=n()) %>% ungroup()
sagedused 
## # A tibble: 6 x 2
##   tabamused kogus
##       <int> <int>
## 1         0    14
## 2         1    28
## 3         2    37
## 4         3    16
## 5         4     3
## 6         6     2
vahemikutabel=tibble(vaartus=0:10)
sagedustabel=vahemikutabel %>% 
     left_join(sagedused, by=c("vaartus"="tabamused")) %>%
     replace_na(list(kogus=0))
sagedustabel
## # A tibble: 11 x 2
##    vaartus kogus
##      <int> <dbl>
##  1       0    14
##  2       1    28
##  3       2    37
##  4       3    16
##  5       4     3
##  6       5     0
##  7       6     2
##  8       7     0
##  9       8     0
## 10       9     0
## 11      10     0
sagedustabel %>% ggplot(aes(vaartus, kogus)) + geom_col() + geom_text(aes(label=c(0:10), y=-1, x=vaartus)) + theme(axis.text.x=element_blank(), axis.ticks.x = element_blank())

Kui viskan keskeltläbi 20% viskeid pihta, siis tõenäosus, et saan kümnest kuni ühe pihta on

 pbinom(1, 10, 0.2)
## [1] 0.3758096

Et saan pihta 0, 1, 2 või 3 tükki

 pbinom(3, 10, 0.2)
## [1] 0.8791261

Et saan kümnest pihta rohkem kui 3

1-pbinom(3, 10, 0.2)
## [1] 0.1208739

Täpselt kolme sisse viskamise tõenäosus

  pbinom(3, 10, 0.2)-pbinom(2, 10, 0.2)
## [1] 0.2013266

Leidke, mitmel protsendil juhtudest sama tõenäosuse juures viskan sisse täpselt 2 palli kümnest

  pbinom(2, 10, 0.2)-pbinom(1, 10, 0.2)
## [1] 0.3019899

10% juhtudest ei saa sisse ühtegi kümnest

  pbinom(0, 10, 0.2)
## [1] 0.1073742

Kuni mitu viset saan pihta 87% juhtudest, kui viskeseeria pikkus on 10 ning tabavus on 20%

  qbinom(0.87, 10, 0.2)
## [1] 3

Kui tabavusprotsent on 30, kui suur on tõenäosus, et saan kümneses seerias üle viie palli sisse

  1-pbinom(5, 10, 0.3)
## [1] 0.04734899

Poissooni jaotus

Keskmisel juhtub aastas ristmikul kaks liiklusõnnetust, siis millised võiksid olla liiklusõnnetuste arvud aastas kümne aasta jooksul

  rpois(10, 2)
##  [1] 3 1 2 1 3 3 0 1 2 0
  onnetusi=rpois(100, 3)
  hist(onnetusi)

Keskeltläbi juhtub ristmikul 3 õnnetust aastas. Mitmel protsendil aastatest on kaks õnnetust või vähem

 ppois(q=2,lambda=3)
## [1] 0.4231901
 ppois(2, 3)
## [1] 0.4231901

Mitmel protsendil aastatest on rohkem kui 10 õnnetust, kui keskmine õnnetuste arv aastas on 3

 1-ppois(10, 3)
## [1] 0.000292337

90% aastatest kolme keskmise õnnetuse juures aastas on õnnetusi aastas maksimaalselt

 qpois(0.9, 3)
## [1] 5