Arvestuse saamiseks tarvilik kursuses XML rakendused kevadsemestril 2017 (digimeedia rühm) * Päringud data.frame-st 9.02 * Andmete sidumine, joonised 16.02 * Veebis töötavad muudetavate parameetritega joonised 23.02 * Muudetavate andmete ja usaldusnivooga veebijoonis 02.03 * XSD skeem koos XML näitfailiga 09.03 * Peakomponendid, faktoranalüüs ja korrespondentsanalüüs 30.03 * Multidimensionaalne skaleerimine, klasterdamine 06.04 * Masinõpe keeleandmete järgi 13.04 Selgitusi * Päringud data.frame-st Koostage aluseks andmete loetelu oma kümnekonnast tuttavast Nt. eesnimi, pikkus, sugu, sünniaasta, lastearv Tehke andmestikule mõned päringud R-keele abil Näiteks: Vanima inimese sünniaasta Meesterahvaste keskmine pikkus Vanus vastavalt sünniaastale Keskmine sünniaasta sugude kaupa Esitamiseks piisab väljundi koopiast * Andmete sidumine, joonised Sisendiks kasutage kahte andmefaili. Näiteks: eelmise tunni tarbeks loodud tuttavad, kuhu iga isiku kohta sisestate, millisel aastaajal ta sündis. Teise faili igale reale kirjutage aastaaeg ning sellele vastav värvitooni nimi. Merge abil siduge kahest failist tulevad andmed kokku. Koostage andmete põhjal paar joonist. * Veebis töötavad muudetavate parameetritega joonised Illustreeriv joonis, mille välimust ja esitatavaid väärtusi saab kasutaja veebis muuta. Kasutada võib näiteks shinyapps.io serverit * XSD skeem koos XML näitfailiga Näite aluseks failid http://minitorn.tlu.ee/~jaagup/kool/java/naited20/html/xml/inimesed1.xsd http://minitorn.tlu.ee/~jaagup/kool/java/naited20/html/xml/inimesed1.xml Koostage jada oma andmetega (nt. koerad). Kasutage ka valikulisi elemente ning erisuguseid andmetüüpe. * Peakomponendid, faktoranalüüs ja korrespondentsanalüüs 30.03 Oma otsitud andmetega näide peakomponentide analüüsist, faktoranalüüsist ja korrespondentsanalüüsist. http://minitorn.tlu.ee/~jaagup/kool/java/kursused/17/xmlrak/baayenCUPstats.pdf 5. peatükk http://minitorn.tlu.ee/~jaagup/kool/java/kursused/17/xmlrak/digi/08faktorid/ * Multidimensionaalne skaleerimine, klasterdamine 06.04 5. peatükk eelmises ülesandes viidatud õpikust Oma otsitud andmete põhjal näide multidimensionaalse skaleerimise kohta, k-keskmiste abil rühmitamise kohta, hierarhilise klasteranalüüsi abil tunnuste rühmitamise kohta, hierarhilise klasteranalüüsi abil objektide rühmitamise kohta http://minitorn.tlu.ee/~jaagup/kool/java/kursused/17/xmlrak/digi/09klastrid/ Masinõpe lähinaabrite järgi Tutvu juhendiga andmerühmade määramiseks lähinaabrite järgi https://www.datacamp.com/community/tutorials/machine-learning-in-r Võta aluseks eelnevalt rühmadesse määratud tekstid. Püüa uuritav tekst sobivasse rühma paigutada.