---
title: "andmed"
output: html_document
---
```{r}
rnorm(10, 170, 10) #Kogus, keskväärtus, standardhälve
round(rnorm(10, 170, 10))
sort(round(rnorm(10, 170, 10)))
rev(sort(round(rnorm(10, 170, 10))))
set.seed(258) #Juhuarvugeneraatori algväärtus
round(rnorm(10, 170, 10))
round(rnorm(10, 170, 10))
eesnimed=c("Juku" ,"Kati", "Mati", "Madis", "Mari", "Martin")
sample(eesnimed, 3)
sample(eesnimed, 3)
head(mtcars) #näitandmed 70ndate autodega
mtcars[1:3, ] #Kolm esimest rida
mtcars[sample(1:nrow(mtcars), 5),] #5 juhuslikku autot, nrows- ridade arv
#Harjutus - arvutage kümne juhusliku auto keskmine mpg (miles per gallon)
mean(mtcars[sample(1:nrow(mtcars), 10),"mpg"])
#mtcars$mpg
1:nrow(mtcars)
sample(5:32, 10) #esimest nelja ei vali
#Viiel korral käivitatakse käsklust, kus valitakse kümne juhusliku auto keskmine
sapply(1:5, function(i){ mean(mtcars[sample(1:nrow(mtcars), 10),"mpg"])})
hist(sapply(1:100, function(i){ mean(mtcars[sample(1:nrow(mtcars), 10),"mpg"])}))
summary(sapply(1:100, function(i){ mean(mtcars[sample(1:nrow(mtcars), 5),"mpg"])}))
sample(eesnimed, 10, replace=TRUE) #Kordused lubatud
#bussiooteaeg ühtlase jaotuse järgi 0-7 min
runif(1, 0, 7) #üks väärtus random uniform
runif(20, 0, 7)
#Püüdke modelleerida bussiga kohale jõudmise aega:
#ooteaeg 0-7 minutit ühtlase jaotuse järgi,
#Sõiduaeg normaaljaotusega keskväärtusega 20 minutit, standardhälve 3 minutit
#Tekitage käsuga üks tulemus, korrake käsku, jälgige tulemusi
runif(1, 0, 7)+rnorm(1, 20, 3)
#Leidke, mitmel juhul sajast oli kohale jõudmise aeg üle 25 minuti
sapply(1:100, function(i){runif(1, 0, 7)+rnorm(1, 20, 3)})
sapply(1:100, function(i){runif(1, 0, 7)+rnorm(1, 20, 3)})>25
ajad=sapply(1:100, function(i){runif(1, 0, 7)+rnorm(1, 20, 3)})
length(ajad[ajad>25])
#ajad[ajad>25]
ajad=sapply(1:100, function(i){runif(1, 0, 7)+rnorm(1, 20, 3)})
length(ajad[ajad>30]) #veidi pikem minekuaeg
#http://www.tlu.ee/~jaagup/andmed/muu/ounad/ounad3_100.txt
ounad3_100=read.table("http://www.tlu.ee/~jaagup/andmed/muu/ounad/ounad3_100.txt", header=TRUE, sep=",")
#ounad2=edit(ounad3_100)
antoonovkad=ounad3_100[ounad3_100$ounasort=="Antoonovka", "diameeter"]
antoonovkad
(antoonovkad=ounad3_100[ounad3_100$ounasort=="Antoonovka", "diameeter"])
t.test(antoonovkad)
t.test(antoonovkad, conf.level=0.9)
#Leidke Kuldrenettide keskmise diameetri usaldusvahemik 99% täpsusega
t.test(antoonovkad, mu=7.5, alternative="less")
mean(antoonovkad)
sd(antoonovkad)
x=seq(3, 10, 0.1)
y=dnorm(x, mean(antoonovkad), sd(antoonovkad))
plot(x, y, type="l") # l nagu line
qnorm(0.95, mean(antoonovkad), sd(antoonovkad))
abline(v=qnorm(0.95, mean(antoonovkad), sd(antoonovkad)))
#95% antoonovkate valimi jaotusega üldkogumist võiksid olla
#väiksemad kui 9,9
#Näidake diameeter, millest nende parameetritega normaaljaotuse puhul
#on õuntest väiksemad 25%, tõmmake vastav joon
kuldrenetid=ounad3_100[ounad3_100$ounasort=="Kuldrenett", "diameeter"]
kuldrenetid
t.test(antoonovkad, kuldrenetid)
#95 percent confidence interval:
# 2.169562 4.034605
attributes(t.test(antoonovkad, kuldrenetid))
t.test(antoonovkad, kuldrenetid)[["conf.int"]]
t.test(antoonovkad, kuldrenetid)[["conf.int"]][1]
piirid=round(t.test(antoonovkad, kuldrenetid)[["conf.int"]], 2)
paste('Antoonovkad on 95% tõenäosusega suuremad ', piirid[1],
'kuni', piirid[2], "cm")
#Kuvage Antoonovkate ja Liivi sibulõunte keskmise diameetri erinevus
#välja 90% tõenäosusega
```