Kordamisküsimused õppeaines Kvantitatiivne digihumantiaaria kevadsemestril 2019 * R-keele võimalused andmetöötluse juures. Käivitusmoodused, levinumad käsud. Muutujad, omistamine. Arvukogumid ja funktsioonid nendega - min, max, mean, median, range, summary, length, head, tail, unique, lugemine failist * "Vana" R-i joonistuskäsud - hist, plot, text, boxplot * Pakett tidyverse - vajadus, võimalused, tähtsamad osad. Andmetabeli sisselugemine, sample_n, head, tail, arrange / desc, filter / %in% , mutate, rename, count. Käsk select - tulpade loend, tulpade vahemik, tulba eemaldamine, add_row, add_column. Grupeerimine - vajadus ja võimalused - group_by, mutate grupeerimisel, summarise, summarise_all, summarise_if - ka mitme tulemustulbaga, rename_all, ungroup. Tibble-tüüpi tabeli loomine, dataframe, matrix, vector * Joonistuspakett ggplot2. Käsu üldkuju, aes, geom_point / jitter, geom_text, geom_boxplot, geom_col / position_dodge, grupeerimine, värvimine vastavalt grupile, geom_line, geom_curve, xlim, ylim, ggtitle * Andmetabeli pikk ja lai kuju, spread, gather * Kordused (for), (s)apply * Testid, prop.test - usaldusvahemik/intervall, usaldusnivoo. Arvupaar, 2X2 tabel, rohkem mõõtmisi * Hii-ruut test. Kahe tulbaga, rohkemate tulpadega * T-test, kahe rühma aritmeetiliste keskmiste võrdlemine, tulemuste usaldusintervall. Paarikaupa t-test, ühepoolne t-test. * ANOVA, rohkem kui kahe rühma keskmiste võrdlemine. Post hoc test. * Korrelatsioon - kahe arvukogumi vahel, tabeli tulpade vahel, pairs() * Peakomponentide analüüs, tunnuste kaalud komponentide juures. Dimensioonide vähendamine - valik, kui palju komponente arvestada. Illustreerimine biplot-i abil - tunnused ja objektid ühel joonisel * Faktoranalüüs * Mitmemõõtmeline skaleerimine, näited, võrdlus markeritega * Stilomeetria - kasutatavad meetodid ja vahendid. Väljundjoonised tasandil, läheduste puu * Regressioon - vabaliige, koefitsient, ruutliige, mudeli loomine, ennustamine. * Rühmitamine - k-keskmised * Statilised arvutused Pythoni abil. T-test, ANOVA, Hii-ruut test, korrelatsioon, regression, MDS, PCA