Masintõlkest, mis on masintõlge, missugused on masintõlke puudused ja missugused on tema voorused. Ja küsimusest, kas masintõlge ongi tõlkimise tulevik, sellest räägime keeles, et seekord mina olen saate toimetaja Piret Kriivan ja minu saatekaaslane on suurte kogemustega tõlkija Mall Laur, tere. Tere. Kas võibki öelda, kui inimene tegeleb, kui tõlkija tegeleb masintõlkega, kas ta on siis masin, tõlk? Jah? No ei, päris niimoodi, ma ei ütleks. Kõigepealt see masintõlkimine, seal, see masin kõlab nagu liiget tugevasti, nii nagu me tõesti nagu olekski mingi isikustatud masin selle taga. Tegelikult on see ju programm, asi, tõlkimise programm ja, ja see on lihtsalt üks abivahend. Ja päris kindlasti see muudab meie tõlkimise maastiku. No kasvõi niimoodi, et tõlkija ja toimetaja ametid lähenevad väga tugevasti ja võib-olla ei saagi neid enam täiesti eristada ja sellepärast, et kui, kui võtta masintõlkeprogrammi poolt ette valmistatud tõlkepõhi, siis seda tuleb lihtsalt järel toimet, aitäh. Sellega tõlkija muutubki nagu toimetajaks. Aga masin üksinda ikkagi hakkama ei saa, ikka inimene peab selle juures olema. No loomulikult see programm, see on lihtsalt programm, aga see on jõudnud väga kaugele tänapäeval. Nii et kui on vaja näiteks lihtsalt teed küsida, ütleme lähete võõrasse linna televaheteed küsida ei tunne seda keelt siis teil on võib-olla telefonis selline äpp, et dikteerib selle küsimuse telefonisse. Ja seesama äpp muudab selle küsimuse tekstiks siis te vajutate nupule, mis keelde seda tahate, seda küsimust äpp tõlgib selle kiiresti teise keelde sellesse keelde, kus te parasjagu olete näiteks hispaania keelde ja Te näitate seda telefoni ehk koos selle küsimusega või siis võib-olla on seal veel läpet muuta seesama tekst uuesti suuliseks kõneks vastutulijale ja ta vastab teile ja siis see vastus masin jälle muudab, telefon jälle muudab selle kiiresti eestikeelseks. Palun väga, aga see ei ole reaalsus, praegu veel. Ma ei oska siin teada anda, aga selline äpp on minu meelest juba täiesti olemas, et võite oma kõne dikteerida, telefonisse telefon vastab teile. Võite näiteks öelda, et teil on vaja sõita, kõnelda telefonile, et ma tahan sõita Akadeemia tee 21 ja telefon automaatselt otsitele Google märtsist välja selle aadressi olemas. Et eesti keele eesti keele uurimises ja eesti kõneuurimises on tehtud ikka kogu aeg päris suuri edusamme. Kui palju neid programme, mille abil tõlgitakse? Kui palju neid programme on Eestiski jooni oma programm olemas? Siin ei ole mitte üks programm. Ma ütleks niimoodi, et tehniliste ja tarbetekstide tõlkija selles ametis on arvutioskus ja programmide tundmine on väga suur, väga suure tähtsusega kude konkureerite kuhugi või, või tahate saada kas või Eesti tõlkebüroos tööd siis ilma arvutioskuseta te päris kindlasti seda ei saa ja päris kindlasti peab tunda üsna mitut tekstitöötlusprogramme, kuidas dokumente vormistada. Edasisest dokument tuleb esitada samal kujul, nagu on originaalkeeles. Aga see ei ole ainult tekstitöötlust, peab tundma ka tõlkemälude programme, samuti andmebaaside programme. Kuidas otsida siit või sealt. Et tõlkija on väga-väga 90 protsenti, vahelisegi ajast kulub sellele Tehnikale kui me räägime dokumentide tõlkimisest ja, aga kui ilukirjanduse tõlkimisest, kas üldse ilukirjandust saaks masin tõlkida? Muidugi saaks muidugi saaks. Sest et mis see tõlkimine on siis, kas see on siis see, et ma võtan selle teksti ja võtan sõnaraamatuid, lappan seal, võtsin sõnad välja, panen siis teksti ritta teises keeles, see ei ole ju tegelikult Me vahendame mõtet. Ja üks põhimõte on üks väga tähtis põhimõte on see, et sel mõte peab sobima selleks eesmärgiks, milleks see originaaltekst on loodud. Inglise keeles öeldakse hästi lihtsalt selle kohta Fithoperdas see tekst peab sobima sellesse konteksti, ilukirjandus on, loome. Nüüd kui tõlkija tõlgib, siis ta ka loob selle teksti uuesti. Aga seal on üks nüanss juures. Et kui me tõlgime, ükskõik, kas siis ilukirjandusest olid tarbeteksti, siis see mõistestik peab olema ühtlane. Ei saa niimoodi, et ka ilukirjanduses, et näiteks esimesel leheküljel. Ma tõlkisin printsess hernetera, aga leheküljel 20 juba räägin kuningat, tar hernekesest mõistet peab jääma samaks. Vot siin tulebki appi tõlkemälu. Nii et ma küll ei näe mingit põhjust, miks ei võiks ilukirjanduse tõlkimisel kasutada tõlkeabivahendeid. Kas siis sõltub väga palju ka sellest, missugune on sõnavara, mis on masinasse sisestatud, ütleme programmi sisestatud ja loomulikult kõik tõlkemälu ja kõik tõlkeabivahendite programmid sõltuvad ikkagi sellest mahust korpustest, mis on sisestatud masinatesse. Mida suurem see on, seda parem on tulemus. Aga mitte ainult. Te nimetasite, et tuleb vahendada mõtet ja, ja tõlkimine on loomine, kuidas masin loob? Ei usu. No jälle, kas siis isikustame selle masina või tõlkeprogramm? See sõltub just lähteandmetest, milliseid lähteandmed on sisestatud masinasse. Kuidas ta loob, seal on ka palju erinevaid põhimõtteid, kuidas see masintõlketekst tekib? Kõige suurem vajadus tekkis masintõlke järele teise maailmasõja ajal siis ei olnudki ju veel õigeid arvuteid, aga midagi ikkagi juba tekkis. Ütleme niimoodi, et infoteadus ja arvutiteadus oli mähkmetes, teda juba oli tekkimas täiesti. Ja nüüd, kui tuli külm sõda külma sõja perioodil oli väga kiiresti vaja läbi töötada väga palju tekste vene keeles näiteks. Ja leiti, et tõepoolest, miks mitte. Et võib-olla on juba alles algusjärgus arvutitest siin abi hakati püüdma selle poole, et luua masintõlkeprogramme. Aga neid hakkasid looma matemaatikud matemaatika või ütles, et ala, inimese ettekujutus tõlkimisest ootan seda raamat otsinud tundmatud sõnad välja, panen need ritta siis ma pean teadma grammatikareegleid, kuidas need sõnade ühendada normaalseks, lauseks, teises keeles. Nii tehtigi. Söödeti masinasse sisse kakskeelsed sõnastikud, masinad võiks ära, mis Ena, millele vastab, ja grammatikareeglit, kuidas lauset moodustada, need formaliseeriti muudeti arusaadavaks masinale, ütleme niimoodi. Hästi lihtsustatult. Et ta siis moodustaks lause teises keeles, kui tal on algkeeles lause, et siis antaks natukene otsustaks lauset teises keeles. Ja 54. aastal näidati üldsusele Ameerikas. IBM suur arvutifirma näitas oma tulemusi masintõlketulemusi ja mis siis tulemus oli? Arvuti mälus oli 250 sõna. Kahes keeles inglise ja vene keeles. Ja arvuti suutis tõlkide 49 lauset Vene keelest inglise keelde keenialast lauset. Tohutu edu. Praegu on need numbrid ilmselt ei öelda. Kui palju suurem näide veidi naeruvärvi. Ja eks siis jah, töötati edasi sellel kallal ja ma ei ütleks, et tulemus ei olnud, olid selles mõttes, et tõepoolest nende tolleaegsete programmidega oli võimalik läbi töötada tohutu hulk tekste ja saada vähemalt aru, kas konkreetses dokumendis on mingit strateegilist infot või ei ole. Selles mõttes oli see töö tulemusrikas, aga aga mitte nii, et nüüd seda tõlget oleks saanud kasutada. Tõlked olid ikkagi keeleliselt nigelad. Kui nüüd veel ajaloost rääkida, siis tegelikult peetakse masintõlke, no ütleme, niisuguseks hüpoteetiliseks mitte nüüd loojaks, aga visionääriks masintõlke visionääris peetakse matemaatik vorm, kuivereid kirja küberneetikale Norbert viinerile, mille ta kirjutas 47. aastal. Ja seal oli neli põhivad millest peaks masintõlkimise programmi loomisel lähtuma. Sõnadel on palju tähendusi ja neid tähendusi, neid erinevaid tähendusi saab määratleda sõna- vahetu konteksti abil. Tõlkimine on kui formaalloogika probleemi lahendamine, kus lähtekeel annab lähteandmed või eeldused ja neist tuletatakse järeldused sihtkeeles. Kusjuures arvuti abil saab automaatselt tuletada loogilise järelduse. Nähte matemaatiku mõtlemine, eks ole? Samal ajal CD tugines tolleaegsetele aju närvivõrkude uuringutele. Seal oli päris kaugele jõudnud. Tõlkimisprotsessile saab rakendada tähekombinatsioonide sagedusi, arvestatavaid krüptograafilisi meetodeid. Krüptograafia teatavasti arenes sõja ajal päris kõrgele tasemele, sest teateid tuli kogu aeg krüptida. Ja see lõpuks siiski informatsiooniteooria väljatöötamisele. Ja nüüd viimane põhimõte oli, et inimkeel tugineb keelelistele universaalidele, nende tundmine lihtsustab tõlkeprotsessi. Kiiver ei täpsustanud, millistele universaalideledes lingvistiliste Loi tähenduslikele. Sest sellistest universaalidest rääkis juba saksa filosoofia matemaatik, lipnits. No siit võeti ainult üle siis formaalloogika probleemi lahendamine. Ja kõik muu, nagu jäi kõrvale sellest, mis Viiver ütles. Ja tegelikult saigi tolleaegsele, ütleme, reeglipõhisele masintõlkesüsteemile sai saatuslikuks, sest see ei arvestatud, et sõnadel on palju tähendusi. See on ju loomulik. No nii hea oleks, kui igal sõnal oleks ainult üks tähendus ja siis me teame, otsime üles teise sõna seal, teises keeles, millel on ka ainult üks, tähendab paraku nii ei ole. Mitte ühegi sõnaga. Ja mitte üheski keeles, muidu eesti keeles ei ole ja on, on vähem, tähendusi on rohkemgi, lahendusi on, mõned sõna leidlikkus tõesti võib, võib sellest lähtuda nagu näiteks isikulise asesõnad. Aga jah, neid sõnumis annavad lausele tähenduse. Nendele on kõigile ikka mitu tähendust. Lause tähendus ei ole sõnade tähenduste automaatne summa. Lause tähendus on omaette tähendus. Tere, olete uurinud ka erinevaid programme, et milles masin tavaliselt eksi või milles kõige rohkem eksib. Seda nüüd väga raske öelda, kui me räägime masin tõlkimisest siis siin me peame ka vaatama, millises konkreetses programmis masintõlkeprogramm töötab või milliseid põhimõtteid ta kasutab kui siin jälle ajaloo poole pöörduda, sest ma tahtsingi rääkida sellele esialgsele reeglipõhisele süsteemile, nii nagu me isegi kujutame ette, et võõrkeele õppimiseks on vaja ju teada teatavat hulka sõnu ja siis need grammatikareegleid. Sellele saigi saatuslikuks sõnade mitmetähenduslikkus ja anti selline lause. Ma võin inglise keeles ette lugeda need kolm lauset, mille põhjal võeti ära valitsuse toetusmasintõlkeprogrammide loomisele. Need laused olid sellised. Jon vahest toibaks päike, Jon otsis oma mänguasjade, kästi Fainelisi Foundeid, lõpuks leidis selle. Ja nüüd pange tähele, paksose hindat Henn. Jah, see on esimene tähendus, aga sellel on teine tähendus ka aedik. Ja muidugi masinaid tundnud seda ära ei teadnud, seda. Ei tulnud selle peale, et sellel sõnal on mitu tähendust sest seda tähendust lihtsalt ei olnud antud, sest see oli nii kolmandajärguline, tähendas. Ma proovisin muide sedasama lauset täna eile Google Translate'i abil. Samamoodi ei tundnud ära tõlkiski, et et kas tuli pliiats siis. Ühesõnaga üks asi on sõnade mitmetähenduslikkus, aga teine asi on see Statistikat ei, arvestate, reeglipõhine süsteem ei arvesta statistik nüüd kui siin ees oli juba linde uuem süsteem, mis loodi reeglipõhise süsteemi peale hakkas arvestama seda, kuidas sõnad koos seisavad vette neile seda on grammatikareeglid vaid, millise tõenäosusega, milline sõna tuleb nüüd järgmiseks, kui siin on eessõna in ja siis artikkel siis järgmiseks võid olla ikkagi mingisugune nimisõna, millel on mingisugune omadused, sinna sisse saab midagi panna, eks ole. Pliiatsi sisse ei saa ju panna. Järgmine etapp oligi statistikapõhise masintõlkesüsteemi väljatöötamine, aga selleks oli vaja läbida, eks, teine etapp, selleks oli vaja koguda tohutul hulgal andmeid. Ja selleks arvuti sobis hästi arvuti mälumahud tõusid ja esialgu hakatigi koostama ükskeelseid keele korpuseid. Ja nende põhjal kirjutati esimesed sõnaraamatud American Heritage Dictionary näiteks anti välja 67. aastal juba, mis oli see ligi koostatud keelekorpuste põhjal üks aasta pärast seda, kui oli vahetada ära, poetas masintõlkeprogrammide loomisele. Ühesõnaga keele uurimine ja grammatikat ja kõik need läksid hoopis teistele alustele. See oli väga suur revolutsioon üldse keeleteaduses, sellepärast et vaadake, grammatika oli veel kahekümnendatel aastatel. Eelmise sajandi kahekümnendatel aastatel tugines ladina keelega grammatikale inglise keele grammatika. Otsiti seal, selliseid käändeid inglise keeles lihtsalt ei ole, ei olegi. Vanas inglise keeles oli aga, aga nii 100 aastat juba enam ei olnud. Keelt kirjeldati ladina keele põhjal, kõiki keeli kirjeldati ladina keele grammatika põhjal. Nüüd järsku toimus nihe. Keelt hakati kirjeldama selle peale, kuidas seda kõneldakse ja kuidas seda kasutatakse. See oli väga suur revolutsioon ja selleks oli seda korpuslingvistikas ja selleks oli arvutit vaja. Nüüd samal ajal arenes edasi tõlkimine tõlkemälud selleks et tõlkemälud saaksid tekkide tekkisid paralleelkorpused üks ja sama tekst lähtetekst siis on tõlketekst, nendest moodustati sellised kakskeelsed korpused, joondati need, need sama lause lähtekeeles sama lause sihtkeeles. Ja vaat selle baasil saieva hakates statistiliselt otsinud millised segmendid, millega tõenäoliselt võivad kokku käia. Sõnaraamatut jäeti kõik nurka, neid polnud enam vaja sellisel kombel. No ja tulemused olid üsnagi head, sõltuvalt sellest, milline oli selle keele struktuur. Näiteks inglise-prantsuse prantsuse, inglise andis üsnagi normaalseid tulemusi. Aga kui keelestruktuur oli erinev näiteks inglise keelest eesti keelde Fess tuli lihtsalt sõnajada. Ei arvestatud, et kuidas need sõnad lauseks peaks moodustama. Aga eesti keelest inglise keelde samal ajal poldiga. Kui nüüd vaadata inglise keelest eesti keelde, siis missugused on? Kas saab niimoodi üldistada või on erinevates programmides erinevad, programmides ongi erinevad vead. Statistikapõhine programme ei suudagi niisugust lõpuni grammatiliselt korrektset lauset eesti keeles moodustada, samuti mitte Ungari või Soome või ka saksa keeles. Sest lihtsalt see grammatika on liiga keeruline, seda peaks hakkama väga paljude reeglitega siis sätestama, seal polnud nagu mõtet erilist. Aga nüüd on hoopis uuemad programmid. Ja need põhinevad sellel samal asjal, millele viitas kunagi Borelviiver, et tuleks uurida neid aju, närvivõrkusid Need, uuemad programmid, neid nimetataksegi neurotõlkeks põhinevadki ütleme sellel, kuidas me märgistamata andmetest saame üldistada mingi tulemuse. Ühesõnaga tehisintellekt või siis programmiga masin peab ise välja mõtlema, kuidas nüüd sellest andmehulgast moodustada lause, ilma et tal oleksid mingid reeglid seal ees. Et selle tulemuseni õude õpetati kõigepealt masina ära tundma. Kassi pildi. Teatavasti kassid maid, väiksed kassi pildid, levinumad pildid internetis. Kõikidele meeldivad kassid. Teete, et kui kass on teatud tõugu metal kõrvadele kikkis siis paariaastane laps tunneb ikka ära, et see on kass kassi pildi peal avate arvuti tundnud. Miks te ei tunne? Ei tunne? Läks tükk aega, seda uuris Google'i meeskond, miks ta ei tunne, kuidas panna arvuti ära tundma kassiga siis kui ta kõrvalt ei olegi kikkis? Kuidas õnnestus siis ja see õnnestus lõpuks niimoodi, et sedasama masin suutis talle antud andmetest välja selekteerida, need kõige tähtsamad üldistada? Pildistame kogu aeg kõneledes suutis lõpuks üldistada. Vot see oli esimene, see oli väga tähtis etapp ja nüüd järgmiseks, vot nüüd võis hakata keelt juba ka õpetama masinale hoopis teisel põhimõttel ja keeletöötlemist. Sest keel on palju keerulisem pildi ära tunginud, staatiline protsess, keel on dünaamiline. Kui me kõneleme, siis kulgev ajas lauset alustame see, kes kuulab, ei tea, kuidas lause lõpeb, age ta ikkagi saab kogu aeg aru. Keel on dünaamiline protsess, ka kirjas see, kuidas silmad liiguvad, kuidas see kiri on kirjutatud, kas paremalt vasakule, vasakult paremale, ülevalt alla. Silmad peavad liikuma lause alguses lause lõpu tegema üldistusi, mis see mõte oli? Ja vaat seda õpetada masinale, see oli juba palju keerulisem, aga see põhi oli olemas, üldistamisvõime oli olemas. Ja vaat need uued süsteemid, mis põhinevad neurotõlkel, Need on juba palju paremad süsteemid. Ja kõigepealt ise proovinud jah, olen ise proovinud. See on päris põnev. Ma tegin kaks sellist katset, üks oli, kogusin kokku need laused, mis olid läinud inimtõlkijal valesti. Ja sõitsin mitmesse masintõlkeprogrammi, üks oli Google Translate mis töötab veel suurtel keeltel töötab ta juba uuel põhimõttel. Sest Google, Translate'i meeskond koostaskisele neurotõlke programmi, aga väikestel keeltel nagu eesti keel töötata endiselt statistika põhiselt, aga ikkagi see keele korpus seal ka kogu aeg suureneb ja suureneb. Tõlge paraneb. Ja siis on Euroopa komisjonis on statistikapõhine programm, mida nüüd ka praegu täiustatakse ja Ma isegi ei oska öelda, võib-olla see on ka läinud juba üle kas osade keelepaaride puhul või kõikide keelepaaride puhul neurotõlkele. Ja siis Eestis on üks selline firma nagu tilde Osain tilde, väga tore firma, toreda nimega ka toredad. Kellel on veebiportaal, kus on võimalik nii lauset, kaupa, kuigi dokumente, papp proovile masintõlget sõnuga juures hoiatas, et seda tõlgendab kohendama, et see ei ole päris tõlge. Aga tulemused on väga head. Ja no mis siis oli see, mis ma leidsin? See oli päris päris huvitav. Kui nüüd Vaziney, ütleme Google Translate ei saanud aru mõnest sõnast, mis ta jättis selle lihtsalt tõlkimata. Või siis võeti see sõna kuskilt teisest kontekstist tõlgiti ära, et ikka ikka oleks kõik tõlgitud. Noh, ma ju tean, tõlgin kõik ära. Ma olen siin mõned näited tuua näiteks selline lause inglise keeles Voitka sündi Eestis, Charles Endbyycloudest poist vaade, see on niisugune hoiatused ei tohiks pidevalt või siis kui on hästi palju seda äravoolu või reovett siis ei tohiks seda pidevalt sinna kanalisatsiooni lasta. Aga nüüd see sõna dist, Charles on hästi suure kasutusega Euroopa Komisjoni tekstides eelarve täitmisel heakskiiduandmisega seotud Euroopa Komisjoni masintõlkeprogramm, sellele siis tol hetkel, kui ma tegin, oligi statistikapõhine, tõlkis selle niimoodi eelarve täitmisele heakskiidu andmise ja vältida tippkoormuse ajal pidevalt juhtide täiesti mööda. Nüüd guugel Google tõlkes vältida püsiva tühjenemise tippkoormuse heitveetorudega. Natukene natukene. Aga tilde aldis, vältige veel pidevat väljalaskmist koormust, heitvete viimane pool on natukene jah, mis on juba nagu mõttelt isegi peaaegu õige, aga noh, vajab natukene kohendamist. Kuidas inimene tõlgiks, selle? Kohe vältige vee pidevalt. Või tuleb täpsustada ikka heitvesi ja vältige heitvee pidevad väljutamist ja väga hea ja mida siis veel? Need ongi väiteid, koormusi tõlkija olid välistõlkija teinud sinna. Ta oli tõlkinud selle nimodi, vältige heitre pidevalt väljutamist ja tippkoormusi. Ja oli siia vahele järsku tulnud. Ja see siis sai parandatud, niimoodi vältige pidevalt suurte koguste väljutamist reovett. Selge muidugi, see on niisugune kontekstivaba lause mõnes mõttes ja tegelikult need ongi kõige keerulisemad. Kui on mingisugune loend või midagi sellist on vaja tõlkida, siis otsid seda konteksti, aga mis see siis on, et et ja aga kuidas siis käib siis tegelikult kui inimtõlkija masintõlge on inimtõlget, kõigepealt töötab masin ja siis inimene, tõlkija vaatab selle teksti üle, tal peab olema ikkagi ka päris lähteteksti. Algallikast peab tal olema ikkagi kõrval absoluutselt loomulik. See on kogu aeg, see on ikka kogu aeg ja nüüd üheksakümnendatel võeti kasutusele väga mahukad tõlkemäluprogrammid, siks levinumaid olid raadio soetlents. Kus siis olid need laused joondatud lähtekeele sihtkeelne lause ja nüüd kõik sõltus sellest, kas seal tõlkemälus oli midagi või ei olnud. Kui oli mingi uus valdkond, siis tõlkemälu oli päris tühi, seal ei olnud mitte midagi. Aga kui oli juba enne tõlgitud, ütleme sadu kordi umbes samal teemal tekste, siis oli juba tulid lauset kus isegi oli näha, et kattuvus on 75 protsenti, näiteks ütleme, kaks sõna on seal ei ole varem tõlgitud või selle lause niimoodi moodustatud, et seal on kaks uut sõna sees. Ja nüüd tuleb seda tõlget kohendada, need kaks sõna, mis olid siis varem tõlkimata, varem ei olnud esinenud, need olid ka selles programmis märgistatud, nii et tõlkijal oli väga lihtne leida, et mis nüüd on vaja seal muud. Kuigi ütlesin siin loetelud, aga on alati raskusi. Ka siis mälu andis ette asju, nii et kui Eesti riik hakkas ühinema Euroopa Liiduga ja pidi olema teatud hulk Euroopa Liidu õigustikus tõlgitud sest need tekstid tuli küll kiiresti ka üle vaadata, siis selgus viimasel minutil selgus, et nii mõneski loetelus oli türgi muutunud kalkunipoisis oli oranžist saanud apelsin värvide loe. Seda tulijat. Seda jah, see need programmid teevadki, et kui ei leia sõna sellest valdkonnast, siis võetakse kuskilt mujalt. No tule see igaveseks üles leida. Seda viga üles leida ei ole üldse keeruline. Aga mis on huvitav, on see, et üks selline tüüpiline viga, mida ka inimene teeb, on see, ta pöörab selle tähenduse algkeelse tähenduse, vastupidiselt siis inimtõlkija enim tõlke. Näiteks suurem asemel tõlgib vähem, rohkem asemel vähem. Kuidas see võimalik on? Ma ei tea, ma ei oska öelda, ma olen ise ka seda teinud. Juhtub hommiku asemel, tõlgid õhtu. Miks see nii on, ma ei tea. Ja see ei ole mitte ainult inglise keelest eesti keelde, ma pidin kontrollima inglise keelest vene keelde tõlgitud tekste, näiteks panganduses oli seal selline tekst, et raha pangatähti ei tohi kopeerida või ainult sellisel juhul, kui ta on suurem kui teatud protsenti või väiksem kui teatud protsenti nendel täpselt vastupidisel tõlkes. Sellist viga ei leia. Kui sa ei loe originaalteksti koos sihtkeelse tekstiga. Aga kõigil on kiire kogu aeg ja kui sa pead lugema ülemisest, me pidime alati lugema üle oma kolleegide tõlked või siis väljast tulnud tõlked vaatad algul, et noh, enam-vähem hea tõlge ja lasen silmadega üle ei vaata lause lauset, sest et kui sa lause lauset vead kogu aeg kõrvutama, siis läheb ju kaks korda rohkem aega, aga aega on vähe. Lasedrute üle sa ei märkagi seda, et midagi on seal läinud valesti. Ja mitu pead on ikka mitu pead. Ja nüüd minul kui üks neist on masin ja minul autos oli see, et no nüüd vaat seda teed iganenud masin küll ei saa teha. Pöörab jaotlase ehituseks eituse jaotuseks, suurema asemel tõlgid vähem või? Tegi ikka tegi masin ka Masinaga. Miks ta tegi? Sellepärast, et tal võib-olla oligi seal allkorpuses juba nendes suurtes mahtudes, mis oli sisse söödetud, olid inimeste tehtud ja inimeste söödetud tekstides oligi see viga juba olemas. Ta ei eristanud ära, vaat kui on lühike lause, siis saad aru, et seal oli ka, aga kui on see lause terve lõik. Ja kui see tekst on keeruline nagu meditsiinialane tekst, siis ei saa aru sellest. Siin algul rääkisime sellest, et mis erinevus on ilukirjanduse tõlkijal ja tehnilise või tarbeteksti tõlkel? Ma arvan, et hästi suur vahe tekib sellest, et milline on tõlkija vastutus. Kui nüüd ilukirjanduse tõlkija tõlgib valesti mingi metafoorselt väljendi näiteks tõlgib kabinet kabinetis või selle asemel, et öelda provintsis hiivas Braun Stadi tõlgib võttali pruunis kabinetis, selle asemel, et öelda, et, et tal oli kurb tuju. Dali melanhoolseks tunnis. Selline metafoorne väljend inglise keeles praam Stadil hindav round stardis oli. Tänapäeval võib-olla ei kasutata enam, aga kool sfääris näiteks on midagi juhtu sellest, kui see avastatakse ojade aasta lind näeb, et palju on selliseid vigu sisse tõlkija ei saa võib-olla tööd, aga midagi muud ei juhtu. Aga nüüd oli selline juhtum, et Floridas vanemad tõid oma lapse haiglasse kiirabi haiglasse. Laps oli koomas juba. Aga need vanemad rääkisid inglise keelt halvasti, nad olid hispaaniakeelseid otsiti haigla, otsis telgi ja vanemad, ütlesid intoksikaadu intoksikaado mille siis kakskeelne meditsiinitöötaja, tõlkis intoksiketid intoksid kehtid tähendab inglise keeles joobes, mitte mürgistatud Intaksikaade tähendas, et tal mürgistus võib-olla sai mingit tabletti sisse või jumal teab. Ja selle tagajärg oli see, et kui see laps tuli koomast välja, siis tal olid käed-jalad liikumatud eluks ajaks. Teda raviti valesti, raviti valesti, sellepärast et see üks sõna läks tõlkes valesti. Ja pärast pidi haiglamaks on 75 miljonit dollarit kahjutasu. Vaat see on vahe, dokumendid või tarbeteksti tõlkimisel ilukirjanduse tõlkimisel. Vastutuse vahe, kujutage ette, tõlgime IGA PÄEV tõlkisin veel ravimiteabelehti, kui seal läheb valesti, mikrogrammi asemel tuleb milligramm, see ei olegi ju tõlge, see on ju tähis läheb kogemata valesti. Mis on selle tulemuseks? Väga kurb tulemus. Nii et vot see on, see on hästi tähtis, et siin kindlasti aitab masintõlge kaasa niisugusi. Ühikute puhul niisugusi vigu kindlasti ei tule. Aga kui on sellised nii-öelda valed sõbrad, seal sõltub ikka suuresti sellest, kui suur on see korpus, aluskorpus, mille põhjal ma sind nüüd järeldusi ja kuidas. Kuidas siis nüüd see toimetaja ametis tõlkija, seda vaatab, seda teksti? Mall Laur lõpetuseks keele saate kuulajale. Mida te soovitate silmas pidada või kõigepealt kas soovitate ja kui palju ja mis puhul soovitate masintõlget kasutada internetis on selleks võimalusi erinevaid ja mida siis silmas pidada? Masintõlget võib kohe täiesti rõõmsalt kasutada, et mina leian, et see on nii tore, et niisugune asi on olemas. Aga päris päris kindlasti oleme valvas, sest et see ei asenda ikkagi inimtõlget ja seda noh, ütleme niimoodi, et need keelekauge inimene leiab, et tal ei olegi vaja tõlkijad palgata, ta saab sellega suure kokkuhoiu, et ta laseb need dokumendid sealt sellest masintõlkeportaalist läbi ja saab kohe valmis inglisekeelse prantsuskeelse dokumendi. Vot see nüüd küll ei lähe, või vastupidi, inglise keelest eesti keelde, et kindlasti ikkagi peab inimsilm selle üle vaatama. Inimene ei kao kuhugi. Mulle hästi meeldib, üks lausemasin on kui laps, mis vajab tuge. Keegi Mall Laur on niimoodi öelnud ja täpselt nii see on. Näiteks selline lause raamatu lõpulause. Laivo Revain Jörg väätmeibee. Sellele lausele eelnes teine lause, kust sai aru, et Väi tähendab probleeme aga masintõlkes selleni nad valetavad, kus sa oled kus iganes Euroopas. Aitäh. Rääkis tõlkija Mall Laur. Mina olen saate toimetaja Piret Kriivan ja keelesaatevaramust soovitan kuulata Ta Eesti keele Instituudi keele sünteesi töörühma juhi Meelis Mihkla, Saadet keele tulevikust ühiskonnas ja Tartu ülikooli vanemteaduri Heiki-Jaan, Kaalepi saadet masintõlkes kesk ja sellest, kuidas toimib Google'i tõlkeprogramm head kuulamist ja Kuulmiseni nädala pärast järgmises keelesaates.