Kursusel tulemuse kirja saamiseks tarvilik * Märksõnade paarid filmi andmebaasis 13.09 * Arvutused + joonis filmiandmestiku põhjal 04.10 * Võrgustiku uuring filmiandmestiku põhjal 18.10 * Jaotused ja tõenäosusfunktsioonid 18.10 * Rühmade arvulised võrdlused (T-test ja ANOVA) 08.11 * Shiny interaktiivsed joonised filmibaasi põhjal 15.11 * Multidimensionaalne skaleerimine 22.11 * Peakomponentide analüüs, faktoranalüüs 29.11 * Kontrolltöö 06.12 * Seminar 13.12 * Eksamitöö ja selle kaitsmine Selgitusi * Märksõnade paarid filmi andmebaasis Filmirühma (näiteks etteantud aastakümnes tehtud filmide) puhul sama filmi juures koos kasutatud märksõnade paarid järjestatuna paaride sageduse järgi * Arvutused + joonis filmiandmestiku põhjal Keerukus vastavalt võimetele. Võib olla ülevaade ühe tabeli andmete põhjal, aga põnevad avastused alati oodatud. Väljund soovitavalt R Markdowni abil * Võrgustiku uuring filmiandmestiku põhjal Näiteid: märksõnade koosesinemine, filmid ja festivalid, näitlejad ja filmid, ajatelg. Vaja katsetada, kuidas andmehulka piirata, et tulemus loetav oleks Temaatiline esitlus (2-5 minutit) + seletus, kuidas see koostati * Jaotused ja tõenäosusfunktsioonid Normaaljaotus, binoomjaotus, poisooni jaotus rnorm, pnorm, qnorm, pbinom, ppois * Rühmade arvulised võrdlused (T-test ja ANOVA) Soovitavalt keeleandmestiku põhjal. Andmestiku üldine tutvustus arvude ja jooniste abil. Kahe arvukogumi võrdlus T-testi abil, juurde seletavad laused Jaotuse sõltuvus rühmast ANOVA abil, juurde seletavad laused, karpdiagramm Võimalusel MANOVA Esitus soovitavalt R Markdowni abil loodud HTML-leht * Shiny interaktiivsed joonised filmibaasi põhjal Kasutaja sisestusest/valikust sõltuvad joonised Shiny veebilehel * Multidimensionaalne skaleerimine Andmete graafiline rühmitamine. Nt. tekstid eri allikatest, näitlejad ja esinemised filmides aastati. jaagup@tlu.ee