Arvestuse saamiseks tarvilik kursusel Kvantitatiivne digihumanitaaria kevadsemestril 2018 * DataCamp ggplot kursus 1. osa 02.02 * Kümme eriilmelist joonist filmibaasi põhjal 09.02 * Kahe filmibaasi arvukogumi keskväärtuse võrdlus T-testi abil 16.02 * Kahe filmibaasi arvukogumi võrdlus Hii-ruut-testi abil 23.02 * Filmibaasi interaktiivne väljund Power Bi abil 02.03 * Arvuline ennustamine lineaarse regressiooni abil 09.03 * Filmiandmete tutvustusüllitise peatükitoorikud 16.03 * Filmiajaloo väljaande esitlus 27.03 * Peakomponentide analüüs 06.04 * Rühmakuuluvuse ennustamine 13.04 * Video filmibaasi andmete põhjal 20.04 * Filmiajaloo väljaande viimistluseks valmistamine 27.04 * Joonis(ed) kirjete läheduse illustreerimiseks 11.05 * Seminar 22.05 Selgitused * DataCamp ggplot kursus 1. osa https://www.datacamp.com/courses/data-visualization-with-ggplot2-1 1: Kristina, Anastasia, Katarina 2: Astrid, Annika, Liisi 3: Sandra, Kert, Gätlin 4: Kaisa, Hagi, Kairi 5: Merilin, Marianne, Jekaterina (tagumine osa jääb võibolla teisipäevaks) * Kahe filmibaasi arvukogumi keskväärtuse võrdlus T-testi abil Otsige välja sama tüüpi arvulised väärtused (nt. eri rühmade sünniaastad) Näidake T-testi abil, kas ja kui palju nende aritmeetilised keskmised mõõdetavalt erinevad. Soovitavalt juurde ka vähemalt histogrammid kummagi arvukogumi iseloomustamiseks. * Kahe filmibaasi arvukogumi võrdlus Hii-ruut-testi abil Aluseks 6. tunni näited. Koostage sagedustabel ridade, veergude ja kogustega Näidake testi abil veergude erinevuse tõenäosust Illustreerige andmeid joonistega ja näidake võimalusel sarnasuse/erinevuse tagamaid * Peakomponentide analüüs Ruudukujulisest andmetest peakomponentide analüüsi (prcomp) tulemuste leidmine - mitu arvu mõõdetava kohta iseloomustavad kui suure osa tema eripärast. Tunnis vaatame tehtud näiteid ja püüame märgata seoseid. * Rühmakuuluvuse ennustamine Mudeli õpetamine näitandmete abil. Tulemuse ennustamine mudeli ja sisendandmete abil. Vastuse illustreerimine joonisega. Soovitav kasutada Microsoft Azure Machine Learning Studiot ning sinna juurde kuuluvat Jupyter Notebooki * Video filmibaasi andmete põhjal Soovitav kasutada R-i animeerimisvahendeid * Filmiajaloo väljaande viimistluseks valmistamine Igaühelt võimalikult kõik materjalid viimistletuna kokku + koodinäited mustandifaili