Arvestuse saamiseks tarvilik kursusel XML rakendused kevadsemestril 2017 Intermediate R esimene peatükk 09.02 Intermediate R peatükid 2-4 16.02 Intermediate R peatükk 5 20.02 Andmeallikate ühendamine, ülevaated ühendandmetest 27.02 Power Bi omaduse tutvustamine 02.03 Skeem 13.03 Andmete põhjal õppimine (Datacamp kursus) 27.03 Andmepuu 30.03 Andmepuu rekursiivne töötlus 10.04 Masinõpe lähinaabrite järgi 17.04 Selgitusi Keskkonna datacamp.com kursuse Intermediate R https://www.datacamp.com/courses/intermediate-r esimese peatükiga (Conditionals and Control Flow) tutvumine, vähemalt poolte ülesannete lahendamine Keskkonda registreerimiseks andke õppejõule oma e-posti aadress * Intermediate R peatükid 2-4 https://www.datacamp.com/courses/intermediate-r * Andmeallikate ühendamine, ülevaated ühendandmetest Uuritav andmestik saadakse kokku merge abil eri allikatest tulevaid andmeid ühendades Tulemus näidatakse Shiny veebirakendusena, kus vastavalt kasutaja valikutele kuvatakse joonisel eri näitajaid, muuhulgas t-testiga seotud usaldusvahemikke. Näiteks: õunte diameetrite andmed http://www.tlu.ee/~jaagup/andmed/muu/ounad/ounad1000.txt Tihedused http://www.tlu.ee/~jaagup/andmed/muu/ounad/tihedused.txt Kasutaja näeb kogumasse õunasortide kaupa. Kasuta saab valida usaldusintervalli ning õunasordi ning talle näidatakse vastavalt sorti õunte diameetrite jaotust ning üldkogumi diameetri keskmise alam- ja ülempiiri valitud usaldusintervalli juures. PowerBi omaduste tutvustamine https://docs.google.com/presentation/d/1s2r0wUY7W7CdA6f3x9T6U_rWYZzz5edWgOx5S1vewVY/edit#slide=id.g1d06252ff9_0_13 https://docs.google.com/presentation/d/1sDqL48JExf8uORwc-uFtovVpKQZ4VrR-qhgLSqdsTII/edit?ts=58b7d9d0#slide=id.p https://docs.google.com/presentation/d/1v15Kz7wSyfvshLq3rvTzlkFIxjh4D6QpvX8W-jS8oWI/edit?ts=58b7d9e2#slide=id.p https://docs.google.com/presentation/d/1woIL0r43h-FQbb3WJXjA1LHiS7DyHtYyvqgNdCfAsr4/edit?ts=58b7e61b#slide=id.p https://jaanmk.ddns.net/ope/powerbi/ Skeem Temaatiline XML-andmestikku kirjeldav XSD-skeem. Võimalusel kasutada andmetüüpide piiranguid. Näiteid: arvuti riistvara kirjeldus, koduloomade register, kokaraamat. Juurde näitfail(id) Andmete põhjal õppimine DataCamp kursus https://www.datacamp.com/courses/unsupervised-learning-in-r läbi teha Andmepuu Andmete lisamine, kasutamine ja kuvamine andmepuus data.tree või mõne muu vahendi näitel oma andmetega. http://minitorn.tlu.ee/~jaagup/kool/java/kursused/17/xmlrak/tark/puud.R https://cran.r-project.org/web/packages/data.tree/vignettes/data.tree.html Andmepuu rekursiivne töötlus Näiteks kategooria koefitsientide abil toodete lõpphinna arvutamine http://minitorn.tlu.ee/~jaagup/kool/java/kursused/17/xmlrak/tark/tootepuu/ Masinõpe lähinaabrite järgi Tutvu juhendiga andmerühmade määramiseks lähinaabrite järgi https://www.datacamp.com/community/tutorials/machine-learning-in-r tee näited läbi. Otsi analüüsiks mõned programmikooditekstid ja mõned ajaleheartiklid. Leia kummagi kohta tähtede (või kahe/kolmetäheliste tähejärjestuste) (suhtelised) esinemissagedused. Lisage eraldi uuritavatekst tekstideks paar artiklit ja paar programmikoodi. Näita, kui hästi masinõppe algoritmi alusel tehakse kindlaks, kumba tüüpi tekstiga on tegemist.