reshape(x, varying=list(c("kuu1aeg", "kuu2aeg", "kuu3aeg"), c("kuu1summa", "kuu2summa", "kuu3summa")), direction="long", idvar="ID") Võimalikud küsimused Rahvusarhiivi andmestiku kohta: - (võtmeküsimus) Kui vaadata vaid kasutajate märksõnu (< 5000), siis kui kasulikud need on? Kas tegemist on arusaadavate võimalike otsisõnade või fraasidega? Kui palju on kasutajad eksinud süntaksireegli vastu ja tahtnud kirjutada kasulikku fraasi, millest süsteem on lugenud kõik sõnad erinevate märksõnadena ja nii on tekkinud märksõnadeks side- ja asesõnad jms? Kui parandada need vead (nt võtta kasvõi kõige enam märksõnu lisanud kasutajate sõnad), kui palju siis kasulikke märksõnu või fraase on? Standardhälve analüüsitud kasutajate peale (kas mõned lisavad ainult teistele ebavajalikke tage, teised ainult kasulikke)? - kui veebist leiab alla laetava tesauruse, siis kas saame sellega võrrelda Rahvusarhiivi piltidele antud märksõnu ning näha, kui palju ja millised Rahvusarhiivile antud märksõnadest puuduvad märksõnastikust? - kas saame nt kõige enam esinevatest märksõnadest tekitada temaatilisi klastreid? Kuidas tulemust kuvada? - kas enim tage saanud pildid on ka rohkem vaadatumad (tulp: Views)? Olemasolev küsimus on ka väga aktuaalne: kui autoritel kattub üks tag, kas kattuvad ka teised? Enne töötlust eemaldada rahvusarhiivi oma märksõnad autor=31575009@N05 1 kas enim tage saanud pildid on ka rohkem vaadatumad Pildi tagide loetelu Pildi vaatamiste arv XY graafik segav eemaldada logaritmiline skaala? proovida masinõppe abil klastriteks jagada http://www.tlu.ee/~stenverk/R/tund4.html http://www.tlu.ee/~stenverk/R/database.txt 2 kas saame nt kõige enam esinevatest märksõnadest tekitada temaatilisi klastreid? Kuidas tulemust kuvada? Märksõnade sagedustabel Käsitsi loetelu? "imelike" eraldamine (erisümbolid) (temaatiliste sõnade list ja sobivus sinna) http://www.tlu.ee/~jankos/salajasedasjad/teine.html 3 tesaurus, sõnade loend Kui palju on korrektselt kirjutatud sõnu, millised need on sõnastikus puuduvate sõnade erinevad mustrid imelikest kirjetest sõnade eraldamine http://www.tlu.ee/~urmetno/R/nimi.html 4 Kui paljude kasutajate/piltide puhul moodustavad märksõnad lause Kuivõrd see segab tulemuste väärtust http://www.tlu.ee/~martinn7/R/rahvusahriiv.html