--- title: "joonised" output: html_document --- Histogramm ```{r} ounad=read.table("http://www.tlu.ee/~jaagup/andmed/muu/ounad/antoonovka2.txt", sep=",", header=TRUE) head(ounad) hist(ounad$august, yaxp=c(0, 25, 5), ylim=c(0, 25), las=1, xlab="diameeter", ylab="kogus", main="Õunte läbimõõtude jaotus") abline(v=mean(ounad$august), col="red") text(mean(ounad$august)-0.25, 10, "keskmine", srt=90) points(3, 15, col="green") points(5:7, c(15, 15, 15), col="green") segments(2, 0, 5, 20) # lines(density(ounad$august)) ``` Tihedusgraafik ```{r} plot(density(ounad$august), xlim=c(0, 10)) lines(density(ounad$september), col="blue") ``` XY ```{r} plot(ounad$august, ounad$september) #Lisage joonisele seletused plot(ounad$august, ounad$september, xlab="Diameeter augustis, cm", ylab="Diameeter septembris, cm", main="Õunte läbimõõdud") paljukasvanud=ounad[ ounad$september/ounad$august>1.4, ] points(paljukasvanud$august, paljukasvanud$september, col="red") #Värvige siniseks õunad, mis on kasvanud vähem kui 1.5 cm vahekasvanud=ounad[ounad$september-ounad$august<1.5,] points(vahekasvanud$august, vahekasvanud$september, col="blue") ``` Jitter Muuda algandmeid vaevumärgatavalt. Praegu selleks, et samade koordinaatidega õunad ei satuks üksteise peale ```{r} plot(jitter(ounad$august), jitter(ounad$september), col=rgb(0, 0, 0, 0.3), pch=19, cex=3) ``` Karp ja vurrud ```{r} boxplot(ounad$august) ``` ```{r} #install.packages("reshape") library(reshape) pikk=melt(ounad) head(pikk) tail(pikk) colnames(pikk)=c("kuu", "diameeter") head(pikk) boxplot(pikk$diameeter~pikk$kuu) #Joonistage histogramm ning karp-ja-vurrud diagramm #juurdekasvude absoluutse ja suhtelise jaotuse kohta vahesentimeetrid=ounad$september-ounad$august suhe=ounad$september/ounad$august hist(vahesentimeetrid) boxplot(vahesentimeetrid) hist(suhe) boxplot(suhe) ``` ```{r} head(ounad) quantile(ounad$august) plot(quantile(ounad$august)) plot(quantile(ounad$august), xaxt="n") mtext(c("0%", "25%", "50%", "75%", "100%"), side=1, at=1:5) kvantiilid=quantile(ounad$august, seq(0, 1, 0.1)) plot(kvantiilid, xaxt="n") mtext(names(kvantiilid), side=1, at=1:length(kvantiilid), cex=0.5) plot(ounad$august, ounad$september) #iga täpp on sama õun kahel kuul qqnorm(ounad$august) qqnorm(ounad$september) qqline(ounad$september) qqplot(ounad$august, ounad$september) ``` Kahe õunasordi võrdlemine ```{r} ounad=read.table("http://www.tlu.ee/~jaagup/andmed/muu/ounad/ounad1000.txt", header=TRUE, sep=",") mean(ounad$diameeter) quantile(ounad$diameeter) quantile(ounad$diameeter, seq(0, 1, 0.1)) #Kuvage õunte diameetrite detsiilid joonisel #võimalusel lisage ka protsendisildid kvantiilid=quantile(ounad$diameeter, seq(0, 1, 0.1)) plot(kvantiilid, xaxt="n") mtext(names(kvantiilid), side=1, at=1:length(kvantiilid), cex=0.5) ``` ```{r} mean(ounad$diameeter) head(ounad[ounad$ounasort=="Liivi sibul", ]) ounad[ounad$ounasort=="Liivi sibul", "diameeter"] mean(ounad$diameeter) mean(ounad[ounad$ounasort=="Liivi sibul", "diameeter"]) mean(ounad[ounad$ounasort=="Kuldrenett", "diameeter"]) tapply(ounad$diameeter, ounad$ounasort, mean) tapply(ounad$diameeter, ounad$ounasort, max) tapply(ounad$diameeter, ounad$ounasort, min) tapply(ounad$diameeter, ounad$ounasort, function(diameetrid){max(diameetrid)-min(diameetrid)}) barplot(tapply(ounad$diameeter, ounad$ounasort, mean)) barplot(tapply(ounad$diameeter, ounad$ounasort, mean), main="Diameetrite võrdlus", ylab="Keskmine diameeter (cm)") boxplot(ounad$diameeter~ounad$ounasort) ``` ```{r} t.test(ounad$diameeter) ``` Nende õunte diameetrite põhjal võin väita, et 95% tõenäosusega on selle aia õunte diameetrite keskmine vahemikus 3,64 kuni 3,86 cm Ehk siis: kui korjan korduvalt 1000 õuna ja mõõdan diameetrid, siis keskmiselt 95-l juhul sajast jääb nende mõõdetud diameetrite keskmine nimetatud vahemikku 95 percent confidence interval: 3.643672 3.869308 99 percent confidence interval: 3.608118 3.904862 ```{r} t.test(ounad$diameeter, conf.level = 0.99) ``` Võrdlus eelmise aasta keskmisega (4.0) ```{r} t.test(ounad$diameeter, mu=4.0) ``` t = -4.2356, df = 999, p-value = 2.49e-05 Pragune keskmine (3,75) on võrreldavast keskmisest (4.0) 4,23 Studenti hälbe jagu väiksem Tõenäosus, et praeguste õunte keskmine võiks juhuslikult siiski olla 4, on 2.49e-05 0,0000249 ```{r} t.test(ounad$diameeter, mu=3.8) ``` Tõenäosus, et õunte keskmine diameeter võib olla 3,8 on 44,9% ```{r} t.test(ounad[ounad$ounasort=="Liivi sibul", "diameeter"], ounad[ounad$ounasort=="Kuldrenett", "diameeter"]) ``` 95 percent confidence interval: -1.2355042 -0.8614071 95% tõenäosusega on Liivi sibulate keskmine diameeter Kuldrenettide keskmisest diameetist selles aias väiksem 0,86 kuni 1,23 cm võrra ```{r} #hist(ounad$diameeter) nahtav=0.4 keskmine=mean(ounad$diameeter) xpiirid=c((1-nahtav)*keskmine, (1+nahtav)*keskmine) plot(density(ounad$diameeter), xlim=xpiirid) abline(v=mean(ounad$diameeter), col="red", lty=2) tulemus=t.test(ounad$diameeter, conf.level=0.99) abline(v=tulemus$conf.int, col="blue") ``` ```{r} ounad=read.table("http://www.tlu.ee/~jaagup/andmed/muu/ounad/antoonovka2.txt", sep=",", header=TRUE) head(ounad) plot(ounad$august, ounad$september) cor(ounad$august, ounad$september) cor.test(ounad$august, ounad$september) cor.test(ounad$august, ounad$september, conf.level=0.90) lm(ounad$september~ounad$august) abline(lm(ounad$september~ounad$august)) ``` lm(ounad$september~ounad$august) Coefficients: (Intercept) ounad$august 1.85 1.01 Õunte ennustatav diameeter septembris = 1.85cm + 1.01 x diameeter augustis