Eesti keel infoühiskonnas, tulevikuühiskonnas on ka täna keele saate teema. Tere Eesti keele Instituudi kõnesünteesi töörühma juht Meelis Mihkla. Tere ka kuulajatele. Minu nimi on Piret Kriivan ja täna me räägime täpsemalt infotehnoloogiast kõnesünteesist, kõne tuvastusest ja eesti keelest, infotehnoloogias ja arvutites. See on see, millest me peame rääkima, kui me peame silmas eesti keele tulevikku. Meelis Mihkla. Jah, nii ta on. Ja märkamatult oleme siis sisenenud infoühiskonda, kus informatsioon on muutunud kaubaks. Paraku see kaup valdavalt selles keskkonnas on võõrkeelne peamiselt inglisekeelne. Ja see inglise keel globaliseeruvas maailmas surub meile peale kõigele rahvuskeeltele, et iga rahvuskeele jaoks peaks olema selline keeletehnoloogiline tugi millega siis rahvuskeel saaks toimida ka eesti keel igas valdkonnas. See peaks siis hõlmama nii arvutikeskkonda veebisait. Hea oleks ka, kui arvutimänge, internetifoorumeid, aja väebe ja eesti keel selles infoühiskonnas ei ole üldse mitte halvas seisus, ta on täitsa olemas olemas ja, ja, või noh ehkki kõnelejate arvult oleme väike keel, siis ma usun, et infotehnoloogia valdkonnas. Me paljuski kuulume maailma noh, 30 valitud keele hulka, kellel on keeletehnoloogiline tugi väga paljudes valdkondades, meil on toimiv kõnesüntees tuvastus. Windows keskkond on eestikeelne, samuti laiatarbekontorite tarkvara on eestikeelne. Pigem on küsimus nendes hoiakutes, et kas me ikka soovime seda eesti keelt ka selles arvutikeskkonnas ja ja meedias kasutada. Kui palju on näiteks riik teie hinnangul selle eest hoolitsenud, et see suhtumine vaid need hoiakud muutuksid? Meil on uus keeleseadus, meil on uus keelestrateegia alles nüüd tutvustati seda septembrikuus, kas nendes on piisavalt tähelepanu pööratud sellele? Ma arvan, et keelestrateegias on küllaltki piisavalt sellele tähelepanu pööratud, nüüd see uus keelestrateegia on siis kuni aastani 2017. Ja see eelmine keelestrateegia, kui ta loodi ja vastu võeti, võib-olla oli natuke rohkem idealistlikum seal kõik need tegevused või need strateegilised tegevused, mida me pidime või peaksime tegema teatud aja jooksul. Võib-olla noh, kõik ei olnud siis veel kaetud sellise riigipoolse toega ja praegune strateegia ma arvan, et on realistlikum ja ja kuna meil on ka kaks-kolm riiklikku programmi, mis siis toetavad kõiki neid tegevusi kas või minimaalsel määral, siis etne strateegilised eesmärgid saavad ka ellu viidud. Nüüd, mis puutub keeleseadusesse, mis jõustus vist esimesel juulil, siis keeleseadusega oli nagu see eelnev, et elu keskendunud põhiliselt siis nende võõrkeelsetele tänava siltidele ja ka seda, et siis elektrooniline ajakirjandus peaks kasutama korrektset eesti keelt. Ja, ja tähelepanu alt oli välja jäänud just nii-öelda mittetraditsioonilised massimeediavaldkonnad siis arvutikeskkond, veebisaidid, arvutimängud, internetifoorumid ja kõik see, et küllaltki täpselt on siis reguleeritud raadio, televisiooni ja trükiajakirjanduskeelekasutust. Paraku on need meediavormid marginaliseerunud, sest noorem põlvkond see põhimeediakeskkond on internet, kus, kus nemad saavad oma info ja, ja ka meelelahutuse. Et, et selles suhtes neid valdkondi puudutab see keeledes seadus vaid riivamisi ja, ja noh, minu isiklik arvamus, et et riik oleks keeleseaduses teatud valdkondades pidanud jõulisemalt ennast kehtestama. Noh, näiteks oleks võinud, praegu on seal keeleseaduses vist, et riik toetab eestikeelse tarkvara loomist mõtlemist ja keeletehnoloogiliste vahendite. Et see oleks võinud täitsa seadus paragrahvina, et eestikeelse tarkvara kasutus riigi ja omavalitsusasutustes üldhariduskoolides oleks kohustuslik. Tähendab ma ei tea, kui suur protsent praeguse eestikeelse tarkvara kasutus on. Aga sellel Võinud olla ka sellised kaudsed positiivset või tulevikku mõjutavad suundumused. Selle arvuti kasutustavad me omandame või praegused lapsed omandavad noores eas ja kui see esimene arvutiõpetus koolis käiks eestikeelse tarkvaraga. Ma usun, et need harjumused säiliksid kogu eluks. Ja kaudselt mõjutatakse ka mitte eesti keelt kõnelevaid õpilasi, et see oleks nagu selliseks. Lõimumisprotsessile kasulik? Lõimumisprotsessile selliseks moodne sõna vist keelekümbluskeskkonnaks. Et see aitaks, aitaks kindlasti kaasa ja ka minu teada paljudes omavalitsustes töötab mitte eestikeelseid inimesi, ka neile oleks nii-öelda mingiks stiimuliks või positiivseks. Ajendiks või või tõud tõukeks, et noh, eestikeelses keskkonnas arvutiga suhelda Aga ilmselt praegu on palju neid inimesi ja ma usun, et rohkem ka keskealiste seas on neid inimesi, kes ütlevad, et Microsoft öeldis on ikkagi lihtsam toimetada Ta ta, kui seal on fail, Elitvjuu insert ja seda jääldate ju veel inglise keeles väljagi, et või peaksid ikkagi olema need ka eestikeelsed terminid. Mina arvan, et peaks, et see on pigem sellist edevate arvutikasutajate ja selline ütleme kadakasakslus 21. sajandil, noh kui 100 aastat tagasi leiti, et eesti keeles ei ole selliseid viisakusväljendeid, mida oleks sellises kõrgemas seltskonnas võimalik kasutada, siis arvutikeeled on täpselt samuti, et minu arust need eestikeelne tarkvara on tõlgitud väga heal tasemel. Need uued terminid tuleb selgeks saada ja, ja minu arust on noored inimesed, on need uued terminid küllalt hästi vastu võtnud. Oskate te öelda, need terminid kohe fail, kuidas on tõlgitud? Ikka fail edit, see on siis redigeerimine või toimetamine. Jou vaata. Insert, insener. Lisaformat siis formateeris siin vist ei ole eestikeelset vastet. Järelikult on vaja välja mõelda Jah, no kindlasti need ajas ajas ka arenevad, kui on kasutuslaialdasem, siis ka need terminid igas valdkonnas ju arenevad ja ka nüüd arvuti või arvutikeskkonnaterminid peaksid arenema. Eesti keel on, on tegelikult juba paljudes kohtades olemas, eesti keel on näiteks olemas ka Google'i otsingumootoris on olemas automaattõlge. Ausalt öeldes, see on kohati päris kole. No see päris kole jah, ta vist töötab põhiliselt nii-öelda paralleeltekstide peal, aga siiski see on üks võimalus, kuidas aru saada mingis võõras keel võõrkeelsest tekstist vähemalt midagi, ta tähendab, sellist täiuslikku autentset tõlget ei ole veel üheski keeles või ühegi kahe keele vahel olemas. Sele Eesti keele keeletehnoloogia programmi raames on Tartus välja töötatud ilmselt hoopis parema kvaliteediga eesti inglise keele masintõlge. Aga aga noh, sellised Google'i tõlkeid paratamatult kasutatakse ja. Aga kuna me kuna meil endal veel ei ole midagi paremat välja pakkuda, siis on see ikkagi üks abivahend, kuidas võõrkeelsest tekstist midagigi aru saada. Kas mõnikord võib ka kahju teha, et tõlge on nii, nii automaatne eesti keele kõnelejale? No võib-olla tõesti noh, seal ilmselt ei ole arvestatud eesti keele grammatikat ja lauseehitust ja selline otsene tõlke vahel tõesti mõjub probussana, aga noh, midagi ei ole teha ja selles suunas on vaja edasi keeletehnoloogilisi vahendeid arendada. Et ei tohi peatuma jääda. Ja, ja, ja praegu need riiklikud programmid jätkuvad ja selles osas on Eesti riigi hoiak igati positiivne, et sellesse valdkonda panustatakse ja vahel on isegi probleeme, et ei ole, alati, on küsimus rahas, vaid on tegijateks küsimus, et alati ei jätka, et kui vastava erialaga inimesi noh, kellel on ühelt poolt kas siis lingvistid haridus või siis tehniline haridus ja hea keelevaist või siis lingvistid, peaks olema tehniline vaist, kuidas neid probleeme masinale selgeks teha nii-öelda programmeerida. Et minu arust praegu see riiklik toetus toimib ja hiljuti olin ühel konverentsil, kus, Oletus keeletehnoloogilise toe loomisse oli noh, samas suurusjärgus Eesti riigi toetusega tšehhi keelt kõneleb 10 miljonit inimest, meil 10 korda vähem eesti keelt. Aga noh, see ei tähenda seda, et väiksemal keelel oleks vaja vähem vahendeid ja raha kui mingil suuremal keelena. Noh, meie eeskuju on muidugi Põhjamaad Soome, Rootsi kus siis keeletehnoloogiasse panustatakse oluliselt rohkem raha. Aga ka nende keeletehnoloogid sageli. Et Eestis on positiivne see, et seda globaliseerumise ohtu on tajutud ja ohtu just rahvuskeeltele, et Rootsis Soomes ollakse natuke liiga muretud, et sealse riigi tugi on suur ja selles valdkonnas tehakse ka tööd. Aga selline märkamatu inglise keele nii-öelda sisseimbumine üks näide on see, et kui noh, Nõukogude Vene ajal meil sunniti väitekirju kirjutama ja kaitsma vene keeles siis Soomes, Rootsis sellist võõrkeele sundus ei ole kunagi olnud. Aga märkamatult on üle mindud seal väitekirjade kirjutamisel, kaitsmisele inglise keelele ja ka palju loenguid ülikoolis toimub inglise keeles, et, et see nüüd keeletehnoloogia teeb just murelikuks see, et, et näiliselt oleks nagu kõik korras, aga aga just ühiskond ei taju nagu seda ohtu Testis tajuka ühiskond ohtu arvate või ainult teadlased ja ja poliitikud. Ei, mul on tunne, et see on ka ühiskonnas ja aitama. Korraks selle Microsoft Vöödi juurde tagasi, et kui kättesaadav on see eestikeelne programm eestlastele, et kas see maksab palju, kas seda saab ka on sellel riigi tugi taga. Riigi tuge ei ole seda minu teada Eesti endas üks erafirma. Ja see maksab sama palju kui inglisekeelne versioon. Küsimus on lihtsalt lihtsalt hoiakutes, et inimesed peaksid settaise nõudma ja muidugi on ka sageli ma olen ise sattunud mingit rüperaali ostma või sülearvutit ja siis arvutifirma teatab, et sellel sellel ongi inglisekeelne versioon peal ja midagi nemad ei saa teha, et see on juba need nendeni jõudnud. Aga kui ütleme selline eestikeelse tarkvarakohustus riigiasutustes koolides oleks, ma usun, et seda agaramalt ka need tarkvarafirmad hakkaksid seda tarkvara lokaliseerima või eesti keelde tõlkima, et siis oleks neil kindlused, et selline püsiv tarbijaskond on olemas, siis võiks ka minust riigihangetel saada teatud soodustusi. Et, et selles oleks keeleseadus, mis oli natuke liiga ettevaatlik selles valdkonnas täitsa midagi positiivset või nii-öelda protsessi mõjutada tulevikusuundumus. Keeletehnoloogilise toe juurest eesti keele tuleviku puhul on väga oluline ka kõnesüntees. Nüüd kuulame ühte sünteeskõne. Tavaliselt kohisevad puud sulle, tere hommikust, suudel nudki kuud hoopis mingit muusikut. Värvi koorub vannitoas baaripukist lilla kints, august alla kraani voolas lootus leida prints. See oli Lauri Saatpalu laulust üks salm ja ma usun, et kuulajad said kõik aru sellest tekstist, see oli moodustatud siis Eesti keele Instituudi keeletehnoloogia sihtprogrammi kodulehel saab niisugust asja teha, et kirjutad teksti sisse ja siis masin loeb sulle selle ette, kuidas see sinna masinasse saab siis see tekst, mis sinna masinasse pannakse ja inimene peab ikka masinasse panema midagi. Jah noh, see, kuidas teks sinna masinasse jõuab, see on suhteliselt lihtne. Aga selleks, et midagi sünteesida, peab nii-öelda kordades rohkem analüüsima ja kõigepealt siis kõnesüntees algab tekstianalüüsiga tähendab, eestikeelne tekst tundub eestlasele kergesti täheldatav mitte eestlasele arutele valmistab see sageli raskusi, kuna teine, kolmas välde ei ole kirjakeelses tekstis alati eristatav. Samuti need palataliseeritud konsonandid nagu palk, palk, tulp ja tulp on siis pikka diftongeerumist kirjutame müüa, hääldame müüa ja palju muud. Et see kirjalik tekst tuleb kõigepealt teisendada hääldustekstiks siis on järgmine trump, kus me peame sellele tekstile tekitama teatud kõne, see tähendab siis nende häälikute kestusi, samuti hääle kõrgust nii sõnades kui kui, kui kogu lauses ja lõpuks siis pannakse see kõnesignaal kokku siis üksikutest ühikutest. See, mis nüüd praegu sai sünteesitud, see oli siis Typhoon süntesaatoriga tehtud, see tähendab kahe naaberhäälikute segmendid niimoodi kokku ühendatud sujuvaks kõneks. Jaa, difoonide kasutamine on sellepärast hea, et seal on, et häälikult häälikule üleminekut just loomulikus vormis ybase algses kõnesignaalis olemas. Et palju lihtsam on selliseid üksikuid häälikuid nagu vokaale A-e sünteesida, aga just arvutile kõige enam raskusi valmistab. Täielikult häälekule sujuvad üleminekud. Ja noh, praegu see kõnesünteesialane tegevus meil instituudis jätkub ja kui siin olid vaid kahest naaber häälikust koosnevad segmendid, siis praegu me tegeleme põhiliselt siis kõnekorpustel põhinevate süntesaatoritega, kus siis on aluseks ühe inimese tund kuni viis tundi kõnet. Nendeks keelejuhtideks on sageli siis kas koolitatud hääled, raadio, diktorid või ka siis võivad ka olla tavainimesed, aga põhiline, et see inimene suudaks kuni viie tunni jooksul oma häält kontrollida. Et see oleks enam-vähem ühesuguses kõnetempos laetud. Ja see hääle kõrgus ei tohiks ka liiga palju selle ettelugemise ajal. See tähendab, et inimene loeb sisse mingid tekstid ja arvutid, arvuti tunneb häälikuid seal ära, mitte terviksõnu. Ikka noh, nii nii häälikuid kui kui terviksõnu tähendab eelnevalt on see teine laine nii-öelda vastavusse viidud tekstiga inimese poolt, siis on ta nii häälikuteks silpideks kui sõnadeks fraasides jaotatud ja arvuti, siis otsib sellest nii-öelda sünteesi akustilisest baasist võimalikult pikki sobivaid kõnelõike, mis siis nii, lingvistilised sobiksid sellesse sünteesitavasse lausesse kui ka siis akustiliste parameetrite poolest. Selles samas kõnesünteesi vallas on Eesti ka 6000 maailma keele seas ikkagi esirinnas. Jah, no kuskil neli-viis aastat tagasi oli mingi kirjutus, kus väideti, et maailmas on 35 keelt, millel on nii-öelda toimiv kõnesüntees ja Eesti oli juba siis nende keelte hulgas nüüd neid toimiva kõnesünteesiga keeli on ilmselt juurde tekkinud, aga ma usun, et meil Otseselt ei ole midagi häbeneda muidugi praegu kõnesünteesi põhilised kasutajad on ikka nägemispuudega inimesed ja nende nende ees võib-olla teadlased on ikka midagi võlgu, et see süntees peaks toimima ühelt poolt paremini ja, ja teiselt poolt on meie praegune suund ka siis luua selliseid kõnesünteesiliidesed, tähendab et need süntesaatorid, kui moodulid oleksid lülitatavad, siis teiste programmide koosseisu näiteks näiteks on pimedatel selline programm nagu ekraanilugeja mis siis loeb ekraanilt, et kogu teksti, no ütleme kas siis hiire ümbrusest või, või siis mingist aktiveeritud aknast ja selleks, et, Ja eesti keele süntesaator oleks selles programmis kasutatav. Selleks on vaja sellist kõnesünteesiliidesed luua. Ja põhimõtteliselt ka väga paljudes. Microsoft sele Office'i programmides on ju hääle tugi olemas, et põhimõtteliselt saab ka seal kõnesünteesi kasutada. Nüüd valdkond, kus praegu kasutatakse kõnesünteesi, on juba päris märkimisväärne ja tulevikus laieneb kogu aeg. No eks ikka tuuakse selliseid näiteid, et külmkapp hakkab teiega rääkima ja ja peab ta ikkagi eesti keeles. Jah, tähendab see kõnesüntees sellise tõelise rakenduse leiaks siis, kui, kui see teine teisendus, kuidas kõnet tekstiks muuta, tehakse sellisel kvaliteetsel tasemel, mida tähendab sellest klaviatuurilt, arvutist räägitakse juba kuskil 15 aastat, et, et nüüd nüüd järgmise viie aasta jooksul tuleb siis klaviatuurid arvuti turule, et me saame siis arvutile teksti dikteerida, käsklusi jagada, kui ka siis kodumasinaid juhtida. Ja vot siis oleks loomulik, et nii arvuti kui kodumasinad vastaksid neile ka suulises kõnes või, või kõnekeeles. Ja siis kõnesüntees leiaks tõelise rakenduse. Et mitte ainult nägemispuudega inimesed ei kasutaks vaid vaid vaid see kasutus muutuks laiaks. Puutetundlikku telefoni kasutusaeg võib osutuda lühikeseks. Jah võib ka seda olla, noh küsimus on lihtsalt jälle meie harjumustes, et et kas me oleme nii väga valmis ja kas me tahame hakata arvuti kodumasinatega rääkima või või, või, või ikka eeldan, eelistame teksti klaviatuurilt sisse tippida. Noh, siin ilmselt noored inimesed võtavad need muutused kiiremini üle, kui kui vanem Põlvkond, Seesam, Seesam, avane. Jah, ma usun, et see see, mis nii-öelda varjatud unistus elab vast kõigis vähemal kui või rohkemal määral sees juba tuhandeid aastaid või vähemalt sadulast. Aga kas on teada, kes esimesena üldse maailma ajaloos nagu välja ütles, selle muinasjutt muinasjutuks, aga, aga oli see jälle Leonardo da Vinci või või ikka hilisem? Seda kõnetuvastuse ideed ma isegi ei tea, aga aga kõnesünteesi formuleeris esimesena teadaolevalt Šveitsi matemaatika füüsik Leonard oiler ja noh, tema oli küll unistaja, aga tema kaasaegsed, näiteks Wolf, kang on kempele tema, kas juba aktiivselt seda ideed ellu viima ja esimesed kõnesüntesaatorid olid siis inimese kõnetrakti sellised, et mudelid, või kus siis kopsude asemel oli mingi lõõts ja, ja neid huuli väljendas mingi mingi ruupor või, või toru ja vahepeal oli siis üks kast, kus sai siis erinevaid häälikuid seadistada. Aga kaasaegsel tasemel kõnesünteesi on ikka viljeldud üks 70 aastat või nii-öelda tulid esimesed sead, elektroonilised seadmed. Aga noh, kus riigist siis Ameerikas oli? Esimest korda üks kõneleja, kõneleb masin, noh, põhimõtteliselt, et võib ka internetis on need hääled olemas, et võib ka, ma ei tea, demonstreerida kui, kui on vajaga. Aga noh, Euroopast on, võib-olla Rootsis on kõige varem hakati kõnesünteesi edukalt viljelema Gunnar Fanti oli seal üks esimesi pioneere ja Eestis võib öelda, et kõnesünteesiga on ka pea pool sajandit tegeletud eelmise sajandi seitsmekümnendatel kaheksakümnendatel küberneetika instituudis ja ka Eesti keele instituudis loodi sellised seadmed tol ajal nad olid tõesti seadmed sellised kastid laua peal, mida juhiti küll arvutiga või mingi terminaliga. Aga noh, täiesti eks nad olid oma aja lapsed ja see kvaliteet oli vastavalt siis noh, nüüd üheksakümnendatel aastatel on siis kõnesüntesaatorid nii-öelda arvutiprogrammide näol kolinud arvutitesse ja mingitest seadmetest, noh, nii tavapärases mõistes me ei saa rääkida. Meelis Mihkla üldiselt kui me mõtleme eesti keele tulevikule tulevikuühiskonnas infoühiskonnas, siis väikeste mööndustega võime praegu natukene rahul ka olla olukorraga. Mingil määral küll, aga noh kuna ei ole täiusliku kõnesünteesiga kõnetuvastust, siis noh, mina kõnesünteesi valdkonnas küll ei saa öelda, et me oleme rahul selle selle tulemusega, et alati on midagi täiustada või, või siis täiesti uutel alustel teha. Aga ma siiski meenutan, et kuigi eesti keel on maailma 200 riigikeele hulgas poolesaja kõnesünteesi valdava keele hulgas omakeelse kõnetuvastuse vallas veelgi paremal kohal ja, ja mõnel muul alal ka siiski tuleb meeles pidada pessimistlikumate ennustuste, et tulevikus, kui keelt ei ole masinates, siis seda keelt ei ole olemas ja sellepärast kuulame üht kõnesünteesi näidet Eesti keele Instituudi kodulehelt. Kuulame, kuidas masin lehte loeb, et teada, mis on olemas ja mida veel teha tuleb. Igav ütles ETV terevisioonis, et väikesel Eesti lennujaama võimalused saada suureks regionaalseks sõlmpunktiks, kust oleks võimalik otse lennata väga paljudesse kohtadesse, on väga head. Vaatame Amsterdami, seal on 600000 inimest, aga Skripali lennujaam on üks suurimaid sõlmpunkte. Tegemist on kohaliku väikese elanikkonnaga, aga lennuliin on loonud sellise struktuuri, et sellest lennujaamast on saanud suur sõlmpunkt ja toob väga palju turitega, lausus niga Halifaxist läbi Berliini ja Riia Tallinnasse lennanud, nii ka rääkis, et tegelikult soovinuks Tallinnat Kanadast Eestisse otselennuga ning otselendu sooviks tagasi Singapuri. Saates esines Eesti keele Instituudi kõnesünteesi töörühma juht, vanemteadur Meelis Mihkla Instituudi masinad rääkisid ja saate toimetaja Piret Kriivan, kuulake meid jälle nädala pärast, pühapäeval kell 15. Null viis ja neljapäeva südaööl.