Tulemuse saamiseks tarvilik kursusel Andmeanalüüsi lahendused R keeles sügissemestril 2017 * Rahvusarhiivi märgendite uuring 26.09 * Rahvusarhiivi märgendite uuring II 03.10 * Pildimärgendite põhjal isiklik uuring 17.10 * DataCamp kursus 31.10 * Tekstiandmete tunnuse väärtuse ennustamine 07.11 * Tekstide rühmitamine ngramide põhjal 14.11 * Multidimensionaalne skaleerimine 14.11 * DataCamp ggplot2 kursus 21.11 * Bigramide graafiline otsing 28.11 * Kontrolltöö 05.12 * Seminar 12.12 * Eksamitöö Selgitusi * Rahvusarhiivi märgendite uuring Valitud ülesanne loendist koos vajadusel omapoolsete täiendustega http://minitorn.tlu.ee/~jaagup/kool/java/kursused/17/r/naited/4.txt Tulemus vormistage R-markdowni abil, kus jutuga seletatakse, mida tehti ning mida saadi. Käskude abil lugege sisse algsed arusaadaval kujul andmed ning tehke järjest läbi lõpptulemuseks vajalikud operatsioonid. Tunnis kohalolnud võivad esitada rühmas. * Rahvusarhiivi märgendite uuring II http://minitorn.tlu.ee/~jaagup/kool/java/kursused/17/r/naited/5.txt Valitud ülesanne loendist koos vajadusel omapoolsete täiendustega Tunnis kohalolnud võivad esitada rühmas. * Pildimärgendite põhjal isiklik uuring Eelnenud rühmatööde näitel omakoostatud terviklik uuringunäide, kus tutvustatakse sisseloetavaid andmeid, arvutatakse neist arusaadavad vahetulemused ning andmete mõnda omadust, seoseid ja/või sarnasusi näitav tulemus ja sõnastatud järeldus. Töö vormistada autonoomselt käivitatava R-markdownina ning esitada ka tulemusena saadav HTML https://www.tlu.ee/~jankos/salajasedasjad/kodutyy_1.html http://www.tlu.ee/~stenverk/R/kodune.html http://www.tlu.ee/~brigid/R_keel/kodune.html http://www.tlu.ee/~mats96/rkeel/kodutoo/kodutoo.html http://test2.multirootor.eu/R/KodukasSmth.html http://test2.multirootor.eu/R/kodutoo_RA_KellyLeppik.html http://www.tlu.ee/~bb073196/kodune.html http://www.tlu.ee/~urmetno/R/kodune/kodune.html * DataCamp kursus Soovituslikult https://campus.datacamp.com/courses/sentiment-analysis-in-r-the-tidy-way/ Võib valida ka mõne muu vähemasti sama asjaliku kursuse * Tekstiandmete tunnuse väärtuse ennustamine Andmete asukoht: http://www.tlu.ee/~jaagup/andmed/keel/korpus/ Valige üks tunnus ning näidake, millest ta sõltub. + Kuvage seoseid valitud tunnuse ja mõne muu tunnuse vahel nii arvudena kui graafiliselt + Looge mudel valitud tunnuse sõltumiseks ühest muust tunnusest + Ennustage selle põhjal paarkümne tabelirea väärtusi ning näidake ennustuse tulemuse täpsust võrrelduna keskmise väärtusega. + Looge mudel valitud tunnuse sõltumiseks kahest muust tunnusest + Ennustage väärtusi ja näidake ennustuse täpsust * Tekstide rühmitamine ngramide põhjal Andmete asukoht: http://www.tlu.ee/~jaagup/andmed/keel/korpus/ 9. tunni näited Leia (kahele) väärtusele ühest grupist (sugu, keeletase, ...) iseloomulikud ngramid Joonista kõikide tekstide asukohad joonisele vastavalt kummagi grupi iseloomulike tunnuste esinemisele. Tutvu, kuidas andmed on jaotunud, püüa kirjeldada eraldiseisvaid rühmi. * DataCamp ggplot2 kursus Omal valikul DataCamp üks kolmest kursusest, mis veel siiani tegemata * Bigramide graafiline otsing http://minitorn.tlu.ee/~jaagup/kool/java/kursused/17/r/naited/11_bigramid.txt * Eksamitöö Oma otsitud andmestiku kohta analüüs. Püüdke leida ning arvude ja jooniste abil välja näidata seoseid, mis kohe peale vaadates välja ei paista. Andmestike allikaid: http://kaggle.com http://archive.ics.uci.edu/ml Eksamipäeval näitab üliõpilane kodus tehtud töö ette ning teeb sinna õppejõu juhatusel täiendusi. Töö mahukuselt võrreldav rahvusarhiivi või keelekorpuse mõne kodutööga