Jaotused
pikkused=rnorm(1000, 170, 10)
head(pikkused)## [1] 182.0977 175.5071 164.1020 171.5319 163.6383 161.5812hist(pikkused) Milline osa andmetest oleks jaotuse järgi väiksem kui etteantud väärtus
Kui normaaljaotuse keskväärtus on 170 ja standardhälve 10, siis jaotuse järgi on pooled väärtused väiksemad kui 170
pnorm(170, 170, 10)## [1] 0.5Ligikaudu kuuendik on väärtusega keskväärtus - 1 standardhälve
pnorm(160, 170, 10)## [1] 0.1586553sum(pikkused<160)## [1] 167Proovige, mitu väärtust tuhandest võiks olla alla 130 teoreetilise jaotuse korral (m=170, sd=10) ja katseliselt
pnorm(130, 170, 10)## [1] 3.167124e-05sum(pikkused<130)## [1] 11-pnorm(210, 170, 10)## [1] 3.167124e-05Pooled inimesed on lühemad kui 170 cm 10% inimesi on lühemad kui 157 cm
qnorm(0.5, 170, 10)## [1] 170qnorm(0.1, 170, 10)## [1] 157.1845Kui kõrge teha lennuk, et 99% inimesi mahuks seal püsti käima
 qnorm(0.99, 170, 10)## [1] 193.2635Binoomjaotus - mitmest vabaviskest mitu sisse saab, kui teada pihtasaamise keskmine tõenäosus
Näites 100 katset, kümme vabaviset, ühe viske tabamise tõenäosus 50%
  rbinom(100, 10, 0.5)##   [1] 3 4 8 3 3 7 7 4 5 7 5 5 4 7 4 5 4 5 6 5 3 7 2 7 5 7 6 4 5 3 4 8 5 5 4
##  [36] 3 4 5 6 5 5 7 5 6 6 5 4 5 3 8 3 5 2 7 2 4 5 3 5 6 6 4 5 5 7 5 6 2 4 5
##  [71] 4 6 6 5 5 5 5 7 6 3 3 4 6 7 4 6 5 7 3 3 3 4 7 8 4 7 6 2 4 3Sama, keskmise tabavusega 20%
  rbinom(100, 10, 0.2)##   [1] 1 3 3 1 4 2 2 1 5 2 0 2 2 3 1 1 2 2 1 0 1 1 6 3 3 2 2 2 4 0 2 1 0 2 3
##  [36] 3 3 1 2 1 6 1 3 3 2 1 1 2 2 2 2 2 2 1 0 3 0 3 0 1 1 2 1 1 1 4 4 2 3 3
##  [71] 2 1 2 1 0 1 1 2 2 0 4 3 5 1 2 0 3 3 2 2 0 2 1 2 3 2 2 2 3 2tabamused=rbinom(100, 10, 0.2)
hist(tabamused, xlim=c(0, 10))library(tidyverse)## -- Attaching packages ----------- tidyverse 1.2.1 --## <U+221A> ggplot2 3.0.0     <U+221A> purrr   0.2.5
## <U+221A> tibble  1.4.2     <U+221A> dplyr   0.7.6
## <U+221A> tidyr   0.8.1     <U+221A> stringr 1.3.1
## <U+221A> readr   1.1.1     <U+221A> forcats 0.3.0## -- Conflicts -------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()tabel=tibble(tabamused=rbinom(100, 10, 0.2))
head(tabel)## # A tibble: 6 x 1
##   tabamused
##       <int>
## 1         4
## 2         1
## 3         2
## 4         2
## 5         4
## 6         4tabel %>% group_by(tabamused) %>% summarise(kogus=n()) %>%
   ggplot(aes(tabamused, kogus)) + geom_point()tabel=tibble(tabamused=rbinom(100, 10, 0.2))
sagedused=tabel %>% group_by(tabamused) %>% summarise(kogus=n()) %>% ungroup()
sagedused ## # A tibble: 6 x 2
##   tabamused kogus
##       <int> <int>
## 1         0    14
## 2         1    28
## 3         2    37
## 4         3    16
## 5         4     3
## 6         6     2vahemikutabel=tibble(vaartus=0:10)
sagedustabel=vahemikutabel %>% 
     left_join(sagedused, by=c("vaartus"="tabamused")) %>%
     replace_na(list(kogus=0))
sagedustabel## # A tibble: 11 x 2
##    vaartus kogus
##      <int> <dbl>
##  1       0    14
##  2       1    28
##  3       2    37
##  4       3    16
##  5       4     3
##  6       5     0
##  7       6     2
##  8       7     0
##  9       8     0
## 10       9     0
## 11      10     0sagedustabel %>% ggplot(aes(vaartus, kogus)) + geom_col() + geom_text(aes(label=c(0:10), y=-1, x=vaartus)) + theme(axis.text.x=element_blank(), axis.ticks.x = element_blank())Kui viskan keskeltläbi 20% viskeid pihta, siis tõenäosus, et saan kümnest kuni ühe pihta on
 pbinom(1, 10, 0.2)## [1] 0.3758096Et saan pihta 0, 1, 2 või 3 tükki
 pbinom(3, 10, 0.2)## [1] 0.8791261Et saan kümnest pihta rohkem kui 3
1-pbinom(3, 10, 0.2)## [1] 0.1208739Täpselt kolme sisse viskamise tõenäosus
  pbinom(3, 10, 0.2)-pbinom(2, 10, 0.2)## [1] 0.2013266Leidke, mitmel protsendil juhtudest sama tõenäosuse juures viskan sisse täpselt 2 palli kümnest
  pbinom(2, 10, 0.2)-pbinom(1, 10, 0.2)## [1] 0.301989910% juhtudest ei saa sisse ühtegi kümnest
  pbinom(0, 10, 0.2)## [1] 0.1073742Kuni mitu viset saan pihta 87% juhtudest, kui viskeseeria pikkus on 10 ning tabavus on 20%
  qbinom(0.87, 10, 0.2)## [1] 3Kui tabavusprotsent on 30, kui suur on tõenäosus, et saan kümneses seerias üle viie palli sisse
  1-pbinom(5, 10, 0.3)## [1] 0.04734899Poissooni jaotus
Keskmisel juhtub aastas ristmikul kaks liiklusõnnetust, siis millised võiksid olla liiklusõnnetuste arvud aastas kümne aasta jooksul
  rpois(10, 2)##  [1] 3 1 2 1 3 3 0 1 2 0  onnetusi=rpois(100, 3)
  hist(onnetusi)Keskeltläbi juhtub ristmikul 3 õnnetust aastas. Mitmel protsendil aastatest on kaks õnnetust või vähem
 ppois(q=2,lambda=3)## [1] 0.4231901 ppois(2, 3)## [1] 0.4231901Mitmel protsendil aastatest on rohkem kui 10 õnnetust, kui keskmine õnnetuste arv aastas on 3
 1-ppois(10, 3)## [1] 0.00029233790% aastatest kolme keskmise õnnetuse juures aastas on õnnetusi aastas maksimaalselt
 qpois(0.9, 3)## [1] 5