Arvestuse saamiseks vajalik kursusel Digihumanitaaria tehnoloogiad sügissemestril 2018 * Nimede analüüs 11.09 * Regulaaravaldised 18.09 * Shelli skript 25.09 * Pythoni katsetused 02.10 * Andmetöötlusteegi Pandas katsetused 09.10 * Kahe teksti võrdlus estnltk andmete abil 16.10 * Tekstide võrdluse esitamine veebilehena 30.10 * Joonised veebilehel 06.11 * SQL andmetabel 13.11 * Keelebaasi andmeid võrdlevad päringud 20.11 * Keelebaasi päringud Pythoni kaudu 27.11 * PHP päringud keelebaasist 04.12 * Sisestatavate tekstide võrdlemise veebirakendus 11.12 * Seminar 14.12 Selgitusi * Nimede analüüs Otsi veebileht isikute nimedega. Puhasta välja eesnimed. Märgi punktidena üles, mida ja kuidas tegid. Otsi naisenimede loetelu, puhasta nimed välja. Koosta vahend kontrollimaks, kas uuritav nimi leidub loetelus. Näita välja, millised esimeselt lehelt võetud nimed on naisenimed. Kuva mitu protsenti lehel olevatest nimedest on naisenimed, mitu protsenti mehenimed, mitu protsenti teadmata. Koosta 2x2 tabel veebist leitud andmete põhjal - näiteks uudisvoo kohta: kas autor on naine/mees? kas kommentaare on vähemalt 10? Arvuta rea- ja veerusummad ning üldarv, sõnasta mõne arvu kohta neist lause Leia osakaalud ridade kaupa, veergude kaupa ning üldarvu suhtes, sõnasta Leia kummagis suunas suhted algandmed, sõnasta Leia osakaalude suhted, sõnasta Leia algandmete suhete suhted, sõnasta, too lugejale selgitav näide. * Regulaaravaldised Katseta tekstist erisuguseid otsinguid - nt. suurtähega algavad nimed, veebiaadressid, elektronpostiaadressid Proovi asendusi - nt. ainekoodi tähtede ja numbrite vahele alljoone panek * Shelli skript Andmete töötluslahendus, mis võtab sisendi failist ning paneb ka tulemuse faili * Pythoni katsetused Pythoni käskude proovid üksikute sõnade, lausete, arvude, massiivide, tingimuste ja kordustega * Andmetöötlusteegi Pandas katsetused CSV-andmetabeli sisselugemine, tabeli ridade järjestamine, filtreerimine, koondarvutused andmete põhjal * Kahe teksti võrdlus estnltk andmete abil Teksti andmete uuring (vähemasti sõnaliigid) Tekstide sarnasuste ja erisuste välja toomine * Tekstide võrdluse esitamine veebilehena Mitu võrdlust tekstide vahel (nt. tähepaarid, käänded) ning tulemuse salvestamine võimalikult mugavalt loetava HTML-lehena * SQL andmetabel Omaloodud tabel. Andmete sisestamine, kustutamine, muutmine. Päringud järjestades ja filtreerides. Arvutused rühmade kaupa. * Keelebaasi andmeid võrdlevad päringud Erinevuste ja/või sarnasuste välja toomine tekstide ja/või kasutajarühmade kaupa. Soovitav kasutada alampäringuid * Keelebaasi päringud Pythoni kaudu Väljund soovitavalt joonis(te)ga veebilehena, kasutaja saab sisestada parameetreid * PHP päringud keelebaasist Veebilehelt sisestatud andmetele vastavad tulemused * Sisestatavate tekstide võrdlemise veebirakendus Tekstide sisestamine + valitud teksti suhtes järjestamine vastavalt parameetritele * Seminar Vestlustund semestri teemade põhjal. Arvestage, et suudaksite õpitut seletada sellega varem mitte kokku puutunud inimestele. jaagup@tlu.ee