Retsensioon Sander Otsa bakalaureusetööle Statistikapõhise tarkvara loomine morfoloogiliste kollokatsioonide eraldamiseks eesti keele tekstidest. Bakalaureusetöö teoreetiline alus on kokku seatud vastava seminaritöö raames. Levinumate järjestuste otsimine nii tunnustatud kirjandus- ja ajakirjandustekstide seas ning samuti levinumate vigaste järjestuste leidmine õppijakeele juures aitab keeleuurijaid märgatavalt. Programmikood jättis läbivaatlusel viisaka ja süstemaatilise mulje. Samuti veenduti koos autoriga süsteemi toimimiseks ka suuremate andmehulkade korral. Koodi esialgselt analüüsides jäigi võimaliku kitsaskohana silma algoritmi ajaline keerukus, sest järjestuste otsimise juures käidi samad andmed korduvalt üle. Reaalses töös ettetulevate tekstimahtude juures aga see veel rakenduse kasutamist segama ei hakanud. Küll aga tasub tõenäoliselt algoritmide optimeerimise peale mõtlema hakata siis, kui on sama vahendi põhjal kavas hakata analüüsima suuremaid keelekorpusi. Kood on mugavalt liigendatud pakettide ja klasside kaupa. See on ka vajalik tulevikku arvestades, sest tõenäoliselt soovitakse koostatud lahendust kasutada mitte ainult eraldi programmina, vaid moodulina suurema süsteemi sees, kus siinne pakutav klastrite leidmise vahend on vaid üks moodustest tekstide kohta info hankimisel. Küsimusi bakalaureusetöö kaitsjale: * Kas ja millist tagasisidet on siiani filoloogidelt rakenduse kohta saadud? * Milline oli ligikaudne tööjõukulu jaotus eri pakettide loomise juures? * Kas ja milliseid probleeme ja turvariske võiks ette tulla, kui loodud kollokatsioonide eraldamise moodulit soovitakse kasutada veebirakenduse koosseisus, kus kasutaja sisend saabub avalikult veebilehelt? Leian, et tegemist on tarviliku ja tugeva tööga ning eduka kaitsmise korral pakun sellele hindeks A (suurepärane). Jaagup Kippar Tallinna Ülikooli Informaatika Instituudi lektor Tallinnas, 16. mail 2012