Seletuskiri Uurisin hüpernüüme. Näitab ülemmõisteid küll, aga otsest ranget puud pole. Sõnal võib olla mitu ülemmõistet ning neidpidi võib seletus üsna "jalutama" minna. hobune - kabjaline - keelikloom - loomaliik - liik - jaotus - korraldus toimib nagu hästi Lisaread liik - tõu jaotus - loogika korraldus - kommunikatsiooniakt tekitavad aga segaduse. Võtsin ette Eri Klasiga seotud tekstid (ca 600 tükki, veidi alla 3 miljoni sõna) Neist vasakpoolses (detailsemas) rühmas oli ~900000, parempoolses (üldisemas) 500000. Kaks miljonit lemmaesinemist polnud kummaski rühmas. Täpne loetelu https://minitorn.tlu.ee/~jaagup/oma/too/23/12/err_sonaryhmad/kogused0.txt , arvud faili lõpus. Kontrollisin üle - mu 1000-parvelises lemmahulgas olid kõik sees. Järelikult võtsin ikka kõik, mitte need, mida vähemalt 50 korda esinenud. Meenutasin, et lubasin oma rühmi ametliku märksõnastikuga seostada, et oleks lihtsalt ise pandud sõnadele ka ametlik seos olemas. Võtsin aluseks Hermani märksõnade faili https://minitorn.tlu.ee/~jaagup/oma/too/23/12/err_sonaryhmad/marksonad.csv Vaatasin ka seda, kuidas ta oli tekstide võtmesõnad üldmärksõnadega seostanud. Muidu keskeltläbi usutav, aga kahtlaselt palju sõnu oli määratud kohanimedeks - ka neid mis lisaks kohanimele ka midagi muud ja kõhutunde järgi tähtsamat tähendavad. Leidsin iga oma rühma sõnadele ka tabelist märksõnad juurde. https://minitorn.tlu.ee/~jaagup/oma/too/23/12/err_sonaryhmad/jaotus1000_lisa.txt Näitas üsna usutavalt, samas kohanimesid andis ka rohkem kui tarvilik tundunuks. Enamasti oli ühe märksõnaga seotud sõnu rühmas teistest märgatavalt rohkem. Selle valisin "peasõnaks", kohanimed jätsin arvestamata. Näitan ainult rühmi, kus peasõnaga on vähemalt viis seost. https://minitorn.tlu.ee/~jaagup/oma/too/23/12/err_sonaryhmad/jaotus1000_peateemaga.txt Eraldi tõin välja tekstide aastaarvud https://minitorn.tlu.ee/~jaagup/oma/too/23/12/err_sonaryhmad/tekstiaastad.txt Vastavalt ajavahemikus olevatele tekstidele lasin Gephi Fruchterman Reingold-i algoritmil lähemale tõmmata need märksõnad, mis tekstidega sellel ajavahemikul parasjagu rohkem seotud olid. https://minitorn.tlu.ee/~jaagup/oma/too/23/12/err_sonaryhmad/eri_klas_marksonad.mp4 Tegin sarnase andmestiku peamärksõnaga lemmarühmade seoste kohta failide sõnadega. https://minitorn.tlu.ee/~jaagup/oma/too/23/12/err_sonaryhmad/seosed5.csv Lasksin samuti algoritmil seoste tugevuse järgi kaugusi sättida. Mängisin ajavahemikega ning vaatasin, millised rühmad lähemale tulevad. https://minitorn.tlu.ee/~jaagup/oma/too/23/12/err_sonaryhmad/jaotus1000_peasonad.mp4