Raadio Kauks tõrvist raadiomajas on taas alanud saade nimega puust ja punaseks, järgmised tund aega on siin populaarteaduslike teemadega sinuga rääkimas Arko Oleski, Madis Aesma ja nagu ikka, me anname vastused selles saates paarile kuulaja küsimusele, vaatame läbi huvitavamad uudised sellest nädalast ning võtame ette ka ühe pikema ja põnevama teema, mille siis üritame teha puust ja punaseks mis sulle silma hakanud on, kui nende uudiste juurde tulla just nimelt uudiste juurest. Noh, meil on selline saates päike leitav motiiv ikka aeg-ajalt kerkib üles teema asteroidid ja kosmos ja, ja kas see nädal tõi selles vallas selliseid huvitavaid, ma ütleksin isegi häid uudiseid. Et kui me siin varem oleme rääkinud asteroidide selle plaaniga, et üks firma teatab, et tema soovib minna, kaevandada seal Ma olin midagi konkreetsemalt välja lubamata, siis sel nädalal tuli selline uudised. President Obama siis Ameerika Ühendriikides esitas kinnitamiseks uue riigieelarve, kus on siis ka NASA reale ette kirjutatud üks selline korralik summakene noh, umbes 100 miljonit dollarit. Et NASA saaks hakata ette valmistama sellist missiooni, et lennata mõne lähedal oleva asteroidi juurde. Ja võta see kaasa, Tuua ta kuu orbiidile ümber kuu tiirlema ja siis saaksid Ameerika astronaudid siit maa pealt kenasti lähedalt võtta kätte ja lennata sinna ja proovida, kuidas seal maanduda. Kuidas on seal võimalik kaevandada, mida sellega üldse ette võtta saab? Vana hea kuu saab lõpuks ikkagi endale oma kaaslase, ei pea olema alati selline planeet maa, doktor Watson, selline väike abiline. No eks seda sellist väikest prügi tiirleb siin muidugi igal pool omajagu nii maa kui kuu ümber, aga see on tõesti noh, mitte nüüd väga suur asteroid, mida nad plaanivad. Nonii, mõnemeetrine seitse kuni 10 meetrit, kui nad kusagilt leiavad välja mõtlevad, et kuidas seda siis kõige parem oleks niimoodi tirida ja vedada ümber kuu. Et ka selles osas on veel selliseid küsimärk, et kuidas täpselt seda teha. Aga, aga vähemalt noh, nüüd on selline projekt käima lükatud, et NASA eelarves on rida olemas ja saab hakata seda asja uurima. Oota, sa ütlesid niimoodi, et seda asteroidi on vaja sinna ümber kuu tiirlema, selleks et seal pealseks harjutada, siis maandumist astronaudid kui see on seitsme kuni kümnemeetrine, millega nad sinna laskuvad ja selg, kui mingisugune kosmoseaparaat on seal seisma jäänud, seal ei ole aega enda ümberpööramiseks, ruumigi ma kujutan ette, on, ega see kerge ei ole, nad tõesti üritavad selle peal harjutada, nad ütlevad, et see on selline eelharjutus, et lennata näiteks Marsile või Marsi kaaslastele mingitele suurematele paljudele, et nagu nad ka välja tavatsesid, tehnilisi küsimusi selle asja juures on veel omajagu, sellepärast näiteks näiteks asteroidi ju samamoodi pöörleb nii nagu iga taevakeha, nagu ka Maa ja Kuu, et, et selleks, et teda korralikult transportida, tuleta kuidagi niimoodi pöörlemine seisma saada või kui talitavaks on seitse kuni 10 meetrit, siis ikka saab mingisuguse võrguga ta tegelikult kohale sokutada, päris vabalt, ma kujutan, ütlesin primitiivse inimesena, siis peab olema ka selline tohutu kosmoselaevani, mis jaksab teda tarida. Kaaluta olekus ei tohiks probleeme olla eriti no tal mass on ikka omajagu. Nagu paigalt kohalt võttes on umbes niimoodi jalgrattaga üritaks vedurit niimoodi liikuma tõmmata. Selline näide, võib-olla need proportsioonid ei ole päris, need aga umbes niimoodi igal juhul nad plaanivad, et et pigem mingisugused mootorid asteroidi külge panna ja siis teda niimoodi siia kohale tuua, siis see ongi nagu omaette selline kivist kosmoselaev. Ja eks siis ole näha, mis sellest plaanist saama hakkab stega ajalises plaanis paistab, et ega enne enne viit-kuut aastat nagu midagi reaalselt valmis ei ehitata, siis kujutatakse ette, et siis ka selle asteroidi lendamine võtab mõni aasta aega pluss siis veel kohaletoomine veel mõni aasta otsa, nii et et homme veel midagi juhtuma ei hakka. Selle viie-kuue aasta jooksul aga koguneb meie ümber ja meie sees olevasse infosfääri hulgaliselt numbreid, hulgaliselt arve, hulgaliselt statistikat, kui nüüd teha selline täielik kannapööre, siirduda meie tänase peo teema juurde. Statistika arvude maailm, Ongi tänaseks põhiliseks fookuseks just ja mida nendega siis ette võtta saab, sellest hakkab pärast muusikapala rääkima. Laatuma Urmas Reinsalu Saade puust ja punaseks üritab täna selgeks teha, kui paljud asjad on siis puust ja kui paljud neist on punased ikkagi me räägime täna statistikast ja oleme külla kutsunud Tallinna Ülikooli andmeanalüüsi professori ja teadusprorektori Katrin Niglase, tere. Tere. No tegelikult praegu on lauset käimas ülemaailmne statistika aasta. Siis ongi nagu paslik küsida, et mis asi on statistika ja kui oluline see meil tänapäevaelus üldse on, kus seda üldse kasutatakse? Statistikat inimesed mõistavad ilmselt kitsamalt ja laiemalt erinevates kontekstides, et kui võtta keskmine definitsioon, et siis ta on selline andmete kogumisele ja nende analüüsimisele ja sellest siis teatud järelduste tegemise meetodite või tehnikate kogum. Seal niukses kitsamas pool võib-olla mõistetakse, kus kuskil asutuses on statistikaosakond, mõeldakse seda ainult teatud andmeid kogumisena või sellise andmebaasi kogumise nagu väga keerukat matemaatilist metoodikat nende andmete analüüsimiseks ei kasutadagi. Teised pool. Tänased arvutus. Arvutite võimalused lubavad väga-väga keerukaid meetodeid välja mõelda, jaga arvutuslikult läbi viia. No me teame, et meie riigijuhid on sellised, kes armastavad väga niimoodi arvude ja numbritega ja statistikaga mängida, et kas ilma statistikat üldse ongi võimalik tänapäeval mingisuguseid otsuseid langetada või, või on see kõik ongi kõik nagu viidud, aga sellisele andmetöötluse andmeanalüüsi tasandil, et leida sealt üles need seadust. Prantslased. Hakata jälle otsast peale, et ma usun, et täna tegelikult üheski valdkonnas ei saa ilma vähemalt statistilise mõtte viisitaja statistikat ta hakkama teisest küljest, kui kriitilisemalt vaadata neid otsuseid, mis tehakse siis tihti tihti seal isegi on seda statistikat nagu näha ja all aga kõrvaltvaatajana jätab mulje, et seda kas ei võeta piisavalt arvesse või seda siis ühel või teisel põhjusel ignoreeritakse neid statistilisi näitajaid või trende või tulemusi. Kas statistika abil saab siis ikkagi välja selgitada mingisuguses konkreetses valdkonnas absoluutselt õega? Kindlasti, võib-olla natuke selline filosoofiline küsimus. Just just, et pidin sinna jõudma, et, et see hakkab juba sealt sellisest teadusfilosoofilisest või maailmavaatelised küsimused, et kes meist üldse usuvad, et teaduse või, või üleüldse inimtegevuse tulemusena on võimalik absoluutsele tõele ligi saada või teada saada reaalsuse objektiivne ja otsene peegeldus, et mina ise sellesse ei usu, siis ma ei saa ka. Siis ma isaga seda statistika kohta väita. Et selline, aga kindlasti on võimalik statistika abil näidata, et antud teadmist antud teoreetilise raamistiku kontekstis see on parim võimalik teadmine, mis meil täna on. Aga tegelikult on võimalik, aga ikkagi noh, mingis mõttes absoluutne tõde saavutada, sest et kui siin võtta näiteks selline väga lihtne näide, meie oleme siin praegu kolmekesi, mina, Arko ja meie külaline, Katrin Niglas. Kui me teeme siin näiteks sellist meeste naistestatistikat, siis siin on kaks meest ja üks naine, see on absoluutne tõde. Ikka kui väga triviaalselt esse olukordadesse minna, siis, siis tõepoolest saab sellist, et väga veavaba. Niisuguseid klassikalise statistika käib kokku see juhusliku vea arvutamise loogika ja selle sissemõtlemine siis selge see, et on elus selliseid triviaalsed kokkuleppeid, aga muidugi, kui väga kaugele urgitseda, siis võib nende definitsioonide taga ju ka. Aga probleem siin siinkohal on ilmselt see, et selle põhjal, et meie mees stuudios oleva valimi põhjal Me ei saa üldistada, kuidas on ühiskonnas tervikuna meeste ja naiste suhe. Et muidugi mitte seda kindlasti, et seda statistika vist ongi. Mul on selline tunne, et ta püüabki mingisuguseks kitsama andmekogumi põhjal teha järeldusi sellise laiemate nähtuste, ühiskonna kohta. No see on selline klassikalise statistika põhi, põhitees või põhiülesanne on tõepoolest aga täna nii nagu ma alustasin, see statistika mõiste on nii nii lai, et kui kõik ülejäänud statistika rakendusvaldkonnad kokku võtta, siis, siis see osa statistikast, mis tegeleb selliste empiiriliste üldistuste tegemisega kogumile on kindlasti vähemuses. Mis on siis enamuses? No alates sellisest samast kokku võtvast statistikast, et kui, kui alustada sealt rahvaloendusest, kus püütakse tõepoolest kõik ära küsitleda, kes sellesse kogumisse kuuluvad ja ja, ja kui see on hästi läbi viidud, siis tõepoolest see niisugune küsitlemata jäänu piir on ühe, kahe protsendi juures ainult, mis siis selle klassikalise statistika vea arvutustega kindlasti ei lähe kui, ja teistpidi ka siis kui küsitakse selliseid asju, kus me ikkagi võtame noh, nagu seesama mees või naine, et me eeldame, et sellise andmete kogumisel juhuslikku viga mõõtmise juures andmete kogumise juures ei ole. Teisest küljest noh, täpselt samamoodi niisugused erinevates eluvaldkondades, kui me räägime kas või spordist, kus võetakse tulemused, tulemused kokku, kes võitis kui palju hooaja jooksul. Samas muidugi, kui hakata minema kuskile sinna jooksu tulemuste juurde, kus on juba sekundite või sentimeetritega mõõtmine, siis võiks hakata mõtlema selles vea juhusliku mõõtmisel tekkiva juhusliku vea piires tavaliselt noh, kui see ei ole teaduse spetsiifilises kontekstis, siis seda muidugi igapäevases elus ei tehta, et võetakse ikkagi kokku, et need tulemused on keskmiselt sellised või, või on trend paremaks või halvemaks Pinemisele teiselt poolt jällegi väga keerulise Mis võimaldavad ka väga suurtes andmestik, ess mustreid leida, ilma et seal oleks niisugune otsene tõenäosuspõhine üldistamis, soov või loogika taga on, on täna üha laialt laiemalt levimas sellised ühe kogumi ühe juhtumi kirjeldamiseks ka ka näiteks uuemad meetodid tulevad sealt nimetatakse tingimuslikult tingimisi vahest Väikse enni, ehk ehk siis, kui on väike, koguvad andmeid, on andmeid, on suhteliselt väheste indiviidide või objektide kohta, et, et ka seal siis matemaatilised statistilised mudelid, mida rakendatakse, kus ei olegi püüdu siis sellest väiksest kogumist otseselt tõenäolisust, põhiseid, üldistusi teha, suuremale kogumist No kui me tahaksime näiteks midagi välja selgitada meie Tänaste kuulajate kohta, siis, siis kust sa peaksime alustama sellise statistika tegemist, kas me siis peaksime tõesti nad kõik üles otsima küsitlema neid, või saame kuidagi piirduda ka mingisuguse väiksema, väiksema seltskonnaga, kust me peaksime alustama? No ma usun, et selle küsimuse kontekstis ma keeraks selle hoopis teistmoodi, peaks alustama sellest, et küsin, kui palju meil ressurssi on selleks raha? Raha ei ole ainuke ressurss, kuigi see on ka oluline ressurss, aga seesama inimressurss sealjuures mida ju saab rahas mõõta lõpuks selles mõttes, et need inimesed, kes seda läbi viivad, kas nad teevad seda ainult sisemisest missioonist või, või uudishimust või tahavad selle eest palka saada, kes seda, kes seda teevad ja, ja, ja loomulikult ka sellest, et mis see midagi on, mis me tahtsime teada saada, et võib võtta väga suurelt ette. Aga siis tuleb arvestada, et see maksab hästi palju ja siis võib mõelda nii, et kui mul on ressurssi vähe, siis ma teen kasvõi vähe, teen selle, mis ma saan, olen ise selge oma piirangutes, milliseid järeldusi ja üldistusi, kas ja üldse ma saan sealt teha, aga vähemalt mul on mingisugune hulk infot rohkem kui siis, kui ma midagi ei tee. Ütleme, kui meil on selline soov, et me tahame teada saada näiteks seda, et kas meie saate kuulajatel on saate ajal pigem hea tuju või pigem halb? No see on selline väga emotsionaalne statistika, mis ilmselt on väga suure eksimisruumiga, eks ole, sellepärast et inimene tagantjärele ei pruugi üldse mu tuju mäletadagi. Aga kas põhimõtteliselt sellise asja tegemine on siis kulukas või, või pigem odav? No kui te mõtlete selles raamis, et raadio kahe ja selle saate kõik kuulajad kogumina, siis kindlasti on üsna kulukas see lugu, kui hakata jälle sealt teisest otsast peale, et kui teil on tagasisidega saade lubate onlain inimestel sisse helistada ja, ja oma emotsioone avastada, siis, siis on suhteliselt ressursivaba ja ka mingisugune info ilmselgelt ei saa seda üldistada siis kõigile selle saate kuulajatele, aga kui tahta kõigile, siis ilmselt ei ole raadio kahel näiteks endal pädevust, võimeid, seda kogumit siis kõik see naid, siis tuleb pöörduda nende küsitlusfirmade poole, kes siis teavad, kuidas neid vali meid teha, eriti sellises olukorras on see keerukas nagu raadio kahe kuulajaskond, kus meil ei ole nimekirja kõigist nendest võimalikest, et seal tegelikult on juba kompromiss algusest peale hädavajalik kompromiss sisse kirjutatud sellesse mudelisse selles mõttes sellises klassikalises klassikalises mudelis tagamaks täiusliku või täiuslikulähedast usaldusväärsust ja üldistatavust oleks oleks vaja seda nimekirja, kelle hulgast siis juhuslik alamosa või valib nii nagu teda sellesse statistika kontekstis nimetatakse välja. Aga kuidas see, kuidas see valimi siis ikkagi täpselt tehakse, kui meil on siin tõesti nüüd plaan selline asi kuulajate seast välja selgitada, siis on selge, hakka neid kõiki, eks ole läbi küsitlema sellepärast et need on ikkagi tuhandeid, on vaja teha see nii-öelda valimisnende põhjal otsustada, nagu näiteks tehakse ka ju raadio kuulatavuse päeviku uuringutega, eks ole, ja niimoodi kuidas see valin, ikkagi tekib, kas võetakse täiesti suvalisest need inimesed sealt? Et siin on see põhiline märkus, ongi, kui statistika keeles oleks vaja siis seda ideaalis seda juhuslikku valimit siis see nii-öelda keskmine inimene, kes, kes ei ole süvenenud statistika sellesse köögipoolde arvab, et see ongi sünonüüm suvalist. Tahtsime silmad kinni näpuga kusagile peale ja mis nimi alle? Aga aga see juba hakkab, et kui nimekiri on olemas ja silmad kinni ja näpuga peale, siis see on juba päris lähedal juhuslike juhusliku valimi põhimõte on see, et ma pean kõigile seda valimit moodustades kõigile selle kogumi liikmetele tagama, võrdse võimaluse valimisse sattuda ja see kõige lihtsam viis, kui mul oleks kõikide nimekiri olemas, ongi seesama, mis lapsed teevad, et panevad nimed kübarasse, silmad kinni ja võtavad kübarast, et see on täiesti adekvaatne, lihtsalt suurte kogumite puhul on see tülikas ja on selleks mugavamaid viise välja võetud, aga aga sellises olukorras, kus seda nimekirja ei ole, nagu ma eeldan raadi kahe kuulajate konkreetse, eriti veel konkreetse saate, siis tuleb kõvasti taustauuringut või taustaandmeid ja mõelda, läbi mõelda ja uurida, et kes on eelmiste uuringute põhjal see, milline vanuserühm, millistes kohtades ja siis hakata kitsendama seda huviäratavat sihtkogumit ja ja sealt siis ühtede teiste tehnikatega siis püüda võimalikult esindav kogum leida, nii et tihtipeale sellistes kompromissi olukordadesse juhusliku valimi põhjal kombineeritakse kokku sellise sooviga, et kui mul on teada enam-vähem, millised alamrühmad sellesse kogumisse kuuluvad, et siis ma püüan selle valimi moodustada nii, et need olulised oletuslikult süstemaatiliselt erinevad arvamuse või erineva hoiakuga alamrühmad saaksid kõik piisavalt suurena esindatud. Et selline selline eluline kompromiss. No meil oli siin hiljuti rahvaloendus ja selle puu siis täiesti üritati nagu üle küsitleda kõik Eesti elanikud ja seda statistikat selle põhjal nüüd ikka tuleb aeg-ajalt ikka juurde ja juurde. Kas nende andmete põhjal on kuidagi võimalik selgitada keskmine eestlane? Kas statistika kuidagi võimaldab kirjeldada, et kes on nagu see kõige keskmisem tavalisem eestlane ja kuidas seda teha saaks? Kindlasti on võimalik, kui see enda jaoks ikkagi läbi mõelda, et kas see, kas ja millisel kujul see keskmise eest lase, leidmine on mõttekas või, või mõtestatud tegevus, et, et selles mõttes, kuna sellel rahvaloenduse puhul on tõesti peaaegu kõik see siis püsielanikud, seal on see defineeritud kenasti ja ja veebist võib ka seda vaadata, et keda keda sellest välja jäetakse ja keda sinna sisse loetakse, isegi kui ta Eestis tollel hetkel ei ole ja, ja selge see, et kõiki küsitleda isiklikult vaid osade inimeste kohta annavad teised leibkonna liikmed seda infot. Aga põhimõtteliselt kui tulla selle keskmise juurde, siis, siis küsitakse ju sellist uuringut käigus hästi paljude erinevate aspektide kohta infot ja nende iga aspekti lõikes eraldi sisuliselt ka seda avalikult esitletakse seda keskmist. Nüüd tekibki sellest, et mis tüüp või need andmed siis on, et kui me räägime, alustame sellest kõige lihtsamast soost, et kas ma saan, et isegi kui ma statistikuna Diane et arvuti abil võib või noh, täna lihtsalt käsitsi arvuta keegi muidu käsitsi ka saab välja arvutada keskmine sugu on 1,62 siis minu jaoks on sellel arvul sisuline tähendus ka tavalise kuulaja jaoks ilmselt ei ole, et, et siis tuleb hakata mõtlema, et, et kuidas see naine ja mees kui tegelikult noh, andmeühikud või, või statistika keeles väärtused on selles andmetöötluse käigus ära kodeeritud üheks ja kaheks näiteks ja siis ja siis sealt edasi juba hakata mõtlema, et kui ühtede ja kahtede keskmine on 1,62, siis tegelikult ta väljendab seda osakaalu, et kui, kui palju oli ühtesid ja kui palju oli teisi, aga noh, põhimõtteliselt siis võib ju sealt edasi öelda, et kui naisi oli rohkem pigem nagu me teame, et Eestis Eestis on need, siis hakkame sealt peale, et keskmine eestlane, naine pigem lainel. Vaat. Et selles mõttes, et see viibki selle juurde, et kui mõttekas on see niisuguse keskmise kokkupanemine, et kas et ja millise, millise näitaja me võtame, et kui me võtame sellesama keskmise 1,62 ja ütleme sealt pinnalt. Aga kui me võtame selle moodi, et mida ka noh aluseks aga siis me võime talle sealt edasi vaadata, et keskmine vanus on selline ja panna nad ja niimoodi järjest kokku, aga muidugi selleks, et sellel veel mingisugune niisugune sellel keskmisel eestlasel oleks raami ümber peame me muidugi ennast oluliselt piirama, et kui me paneme kõik selle andmekokku ja hakkame otsast lugema, et keskmine eestlane on see, siis noh, esimene ots on ammu läinud sellest pildist, kui teine, teine alles tuleb. Et igas sellises hetkes me peaksime endale endale aru andma, et mis on see praegu, et kui me räägime sellest keskmisest, eestlased tegelikult, mis aspektide osas me oleme eelkõige huvitatud ja siis me saame küll neid aspekte kokku panna ja kui meil on hästi suur andmehulk, siis siis võib tõepoolest mõelda ka nii, et, et see paljudes aspektides niisugune näiteks aritmeetilise keskmisena arvutatud keskmine on ka kõige tüüpilisem, aga üldse ei pruugi olla selles mõttes, et, et see on see vana nali, et ühte jalga pidi kuumaveeämbrist teise jalgapidi külma veeämbris keskmiselt on hästi tore mõnus temperatuur, aga et kas tegelikult on see keskmine olemas ja mõnus, et, et ei ole, et ei pruugi selle? Selles mõttes tuleb alati ettevaatlik nende keskmistega olled, sellist ei pruugi üldse olemas olla. Mis keskmiseks tule. Ma ise kunagi tegin, kui ma töötasin ühes ajakirjas, siis ma tegin ise sellise täiesti meelevaldse statistilise keskmise eesti mehe, oleme valmis ja siis ma tegin selle niimoodi, et ma võtsin kõigepealt aluseks, millisel aastal on kõige rohkem mehi Eestis sündinud, sõidutatakse 70, läksin sealt niimoodi väga meelevaldselt edasi, vaatasin mis eesnime pandi sel aastal kõige rohkem, see oli Margus kõige rohkem perekonnanimesid, Eestis on teatavasti tammesid eesti nimedest, eks ole, siis mul oli juba olemas, et keskmine eesti mees on tankisin sõidetud 70, kõige rohkem autosid oli Volkswagen Passat. Et tal on Volkswagen Passat pikkuse sai ka kusagilt välja keskmise eesti mehe rikkuse ja panin siis nagu lõpuks sellise pildi kokku oli see muidugi ilmselt te iseloomustage tegelikult mitte midagi, kuigi ma tunnen ise päris mitut Margus Tammega. Et ta justkui see kontekst sinna avatud taha, et kust see tuleb ja mis mõte sellisel on, küll ta hakkab kõnetama meist paljusid, et just selle statistika niisuguse esitamise mure või kust tekivad need mured, on tavaliselt, et need kuulajaskond, kas talle ei avata seda tausta, et kust need andmed tulevad, millisel kaalutlusel on nad kokku pandud sellisena ja, või nad lihtsalt siis see info esitatakse sellisel kujul otse kuulajani. Noh, ei jõua, ta ei saa sellest aru, ta ei adu seda konteksti ja, ja siis ta tõlgendab seda muidugi oma mõtte, mõttemaailma, piiratusest või, või avatusest või loovusest lähtuvalt. Aga sellise skeemi järgi tegelikult statistikat mitte midagi kusagil kokku ei pane, eks ole, kõigepealt võetakse üksusi aluseks, vaadatakse siis midagi sinna kõrvale ja nii edasi ja nii edasi. See, see, mida mina tegin, on ju tegelikult ikkagi täiesti selline täiesti. No nii, triviaalselt kindlasti, aga tegelikult see selline persoonide loomise tehnika on täiesti kasutusel, eriti ütleme siis turunduse valdkonnas, aga, aga ka arendus projektides näiteks, kus, kus uusi toota, Teid arendatakse ja, ja reeglina muidugi piirduda ühe tüüpilise siis selle persooniga vaid, vaid luuakse neid. Kolm, neli, viis, kuus oleneb jälle, kui palju ressurssi ja kui palju neid võimalusi mul on ja, ja, ja tegelikult, et see pannakse sellisel statistilisel alusel kokku tsoon ja tõepoolest minnakse sinnamaani välja. Ta on niisugune keskharidusega mees, kellel on sellised harjumused ise, siis püütakse nagu opereerida, et suunata seda arendustegevust või, või siis seda turundust just et millised võtted, millised tehnikad kõige paremini töötaksid, et, et see ei ole. Raadio kaks me räägime saates puust ja punaseks statistikast. Meil on külas Tallinna Ülikooli andmeanalüüsi professor Katrin Niglas. No siin oligi juttu nendest keskmistest, just enne seda muusikapala ja neid keskmisi on vist ka päris palju erinevaid, et me ei saagi rääkida ühest keskmisest, vaid neid viise, kuidas neid leida. Kui me vaatame kas või keskmise palga puhul, mis aeg-ajalt tuleb meil niimoodi ajakirjandusse, siis seal on ka erinevaid viise, kuidas seda leida. Üks võimalus on see, et sa liidad lihtsalt palgad kokku. Jagad palkade, kui läbi saad keskmise numbri, teine võimalus on vist vaatad, et mis on see number, millest rohkem saab ühepalju inimesi, vähem saab sama palju inimesi. Et kui palju neid erinevaid võimalusi selle puhul siis tegelikult on. No tegelikult, eks neid keskmisi on veel ja veel, iseasi, et need kaks, millest sa alustasid ilma nime nimetamata, esimene meetiline keskmine, siis mida meile vähemalt mul näiteks koolis kuuendas klassis kuskil valem selgeks õpetatakse. Ja, ja uuemal ajal ka seda teist ehk siis seda mediaani, et seda niisugust poolituspunkti Ja kolmas on vist see mood, et mis on see number, mida kõige rohkem inimesi saab? Jah, et kõige kõige sagedamini esinev väärtus statistikakeeles, et need on need kolm niisugust, kõige tüüpilisemad sellises tavastatistikas kasutatavat, aga matemaatilise, eks kui kui kas koolist või siis natukene kõrgemalt matemaatika tasemelt on geomeetrilised keskmised ja harmoonilised keskmised ja, ja kui statistika juurde rohkem tagasi tulla, siis siis hästi palju segadust tekitab näiteks kaalutud keskmise mõista ja selles mõttes, et tihtipeale eeldatakse, et see on uus, uus arvutusloogika järgi keskmine, aga tegelikult see on andmete olemusest lähtuvalt seesama aritmeetiline keskmine, ainult et kui mul ei ole algandmed ühekaupa enam olemas, vaid on algandmed juba mille kohta ja siis mul on selle grupid pean kokku panema ja, või siis teine kaalutud keskmise loogika on seesama, et kui me rääkisime enne valimi esindavusest kogumi suhtes, et kui me teame, et meil näiteks kogumis peab olema naisi 60 protsenti ja mehi 40 protsenti ka valimis on millegipärast, et vastupidi, et need proportsioonid on paigast ära, et siis kui ma kogu sellisele proportsionaalselt paigast ära valimi põhjal paneksin tervikpildi üldise keskmise kokku, siis nihkes räägitakse sellepärast et, et kui seal on süstemaatiline erinevus nende kahe alamgrupi vahel ja see, et siis siis ka kaalutakse muidugi seal vaja seda kogumi proportsiooni siis teada ja siis on võimalik matemaatiliselt paika kaaluda, ehk siis piltlikult, kui naisi oli liiga vähe, siis neid kaalutakse matemaatiliselt juurde korrutada. Eks see üks koma millegiga ja, ja meeste andmeid kaalutakse vähemaks, ehk siis vastavalt välja arvutatud null koma millegiga korrutatakse, nagu me kõik teame, null kohaga korrutamine läheb, läheb summa summa väiksemaks, nii et neid keskmisi on tõesti palju. Aga muidugi, eks see on, et kui lihtsalt öeldakse käigu pealt keskmine, siis, siis vaikimisi on see aritmeetiline keskmine ilmselt, millest räägitakse. See tekitab ka inimestes kahtlemata tõsiseid probleeme arusaamisega, sest kui näiteks ajakirjandus öeldakse, et keskmine palk on seal vist ongi 250 eurot ja kui inimene mõtleb, et mina saan sellest vähem kõik minu sõbrad saavad sellest vähem minu laaberdab sellest vähem, et siis tekita, tekita loomulikult küsimus, et kust, kust see keskne siis tuleb, kui minu enda kogemus ütleb, et suurem osa inimestest tegelikult saab sellest vähem. Aga see ongi see mure sellega, et kui talle kuuendas klassis seal meetiline keskmine ära õpetati et siis jäeti olulised asjad, õpime õpetamata või siis nüüd ei jõudnud kohale või ei jäänud külge. Ehk siis see teadmine, et, et üks, üks on see teadmine, et kuidas ta tehniliselt ära arvutada, liidan kõik kokku ja jagan liidetavate arvuga, see on kõigil kõigil meeles. Aga aga, kui hakata küsima, et mis selle niimoodi saadud arvu tähendus on, milliseid tõlgendusi, millises kontekstis talle saab anda ja milliseid ei saa siis enamus enamus isegi statistikat ülikoolis õppinud üliõpilasi tihtipeale ei oska, ei oska mõelda või vaatavad nüüd imestunud silmadega otsa, et põhimõtteliselt seal hakkab tulema see, et et tuleb hakata mõtlema ja rääkima sellest, et kui ma kõik need andmed kokku võtan, siis ma saan sellise asja, mida nimetatakse võrdluseks maa keelsemalt jagunemiseks, et millised need olid, kas nad olid kõik ühes nurgas koos need nagu palgad on, et madalaid palku on palju ja siis üksikutel on hästi kõrged teistest kaugemal jälle statistika keeles räägitakse siis asümmeetrilisest jaotusest, et see ootuspärane klassikaline jaotus on see, et keskel on hästi palju keskmisi ja siis mõlemas sortses madalaid ja ja kõrgeid tulemusi on vähe ja sel juhul tõepoolest aritmeetiline keskmine enam-vähem noh, ligikaudu jagab poole. Aga kui on sellised jaotused ja mida päriselus siis igapäevaelust andmeid kogudes on väga tihti, et need jaotused on sellised, et koondumine on mõõdikuses ühte ühte otsa ja teise otsa on siis suur venimine, siis siis seesama keskmise arvutamise reegel, need, need üksikud kaugele venivad, sikutad seda aritmeetilist keskmist ära, nii et et nende sissetulekute või palkade puhul on tavaline, et suurusjärgus ligikaudu kaks kolmandikku üks kolmandik jagab jagab üldse aritmeetiline keskmine, et kui ma tahaks päriselt seda keskmist jagamise punkti mõtest saada, siis oleks ikkagi mediaani sinna kõrvale vaja. Aga noh, see, see on jälle see et seesama küsimus, et kui neid rohkem anda, aga kui kui ei ole seda teadmist, siis on võib-olla segadus veel suurem, et mis siis, mis siis nüüd, aga, aga tegelikult see on kõik see, kuhu me kõik koos püüame. Ma usun, et samm-sammult ja noort nooremate inimeste teadlikkus nendest erinevate numbrite tagamaadest pidevalt. Kasvab ka siin ongi need jutuks seesama, mis alguses korra läbikesse statistiline arusaam või mõtteviis kirjaoskuse, et, et mida vist koolis üht-teist saabumine mäletan, ka keskkoolis tegi väikesi statistikatöid. Mediaan, lood on, on meeles, aga kui palju teile tundub, et üldse nägu mõistetakse ühiskonnas? Kui palju peaks tavaline inimene üldse statistikast statistika meetoditest teadma? No ikka ikka, kuna see tänane elu, kui me vähegi oleme, selle niisuguse meedia väljas oma omaenda mõtetega, jaa jaa, kuuleme ja kuulame seda, siis siis tõepoolest selleks, et enda jaoks mõtestada ja, ja aru saada on, on seda taust teadmist ikkagi ikkagi selles vähemalt selles baas niukses klassikalises osas hädasti vaja just needsamad, et muidu ma lasen iseenda sees, et mitte statistik või statistika ei valeta, aga kui mul endal taust puudub, selle, selle näitab taia korrektseks tõlgendamiseks teadmaks neid ohtusid, mis selle ühes või teises kontekstis tõlgendamisega kaasa tulevad, et siis siis ma muidugi võin ise endale konstrueerida nende numbrite põhjal vale vale arusaama ja pildi. Et selles mõttes see on niisugune ülemaailmne ja suur suur liikumine hariduse hariduse poole peal, siis statistika ka hariduse eest seismine. Ma usun, et Eesti muidugi nii nagu muuski osas akadeemilise poole pealt oleme me üsna tublid maailma maailmakaardil. Aga aga mis on just see meie, meie hariduse, võib-olla natukene see, et lihtsalt meie laste teadmised, meie teadmised on rohkem sellised tehnilised faktilised just see nagu kasutamisoskus, tõlgendamisoskus, loovus sealjuures seda teadmist siis ära kasutada kuidagi millegi uue kvaliteedi tutvumiseks on see see pool, kus me ilmselt koos peame veel kõvasti tööd tegema. Päris siin jutuajamise alguses küsisin seda ka, et kas statistika noh, on olemas selline asi nagu absoluutne tõde statistikas saab absoluutse tõe välja selgitada ja noh, ei saa, eks ole, aga kas samal ajal siis on üldse põhjendatud, see statistika teeb inimesi nii emotsionaalseks sellepärast et väga palju selliseid erinevaid meeleolusid teinekord ikkagi lendab lake, kui jälle tulevad mingisugused infokillud, kas tõesti siis selle keskmise palga kohta keskmiselt toidukorvi kohta mille iganes kohta rahvaarvu kohta väljarände kohta kas statistika siis hoolimata sellest, et seal võib olla tegelikult ei olegi seda päris pilti kunagi välja koormus, kas, kas, kas me peaksime sellesse äkki kuidagi rahulikum? Suhtlema, ja ma usun, et igal juhul tuleks rahulikult ja analüütiliselt ja mõistusega suhtuda. Samas ega emotsioone inimestele keelata ei saa, et mina usun, ised emotsioon on selles mõttes parem kui passiivne, ükskõik siis igal juhul selles mõttes, et, et selle emotsiooni tagant ju siis tulevad noh, nendele, kes tahavad näha ja kuulata või kes on selle eest seatud mõtlema need, need ebakohad välja, et see annab selle ajendi mõtlemaks, et kus on puudujääk, miks, miks see niimoodi üle võlli kipub minema nagu tordi poksis, eks ole. Nüüd on teatud teatud indikaator ikkagi ikkagi selles mõttes, et statistika isenesest, et vähemalt Eesti kontekstis, mis laiemas laastus eriti sealt rahvaloendusest on, on usaldusväärne, selge see, et on ka selliseid selliseid firmasid võib-olla, kes viivad uuringuid läbi raha eest ja kus, kus on põhjust kriitiline olla selles metodoloogiliselt köögipooles, aga see on ju mitte statistika viga, vaid vaid inimeste viga, kes on kas ebaprofessionaalsed või, või mõnel juhul ka ebaeetilised. Kui nad ise aduvad et nad mängivad näiteks kuulajaskonna teadmatuse peal ja sedakaudu siis püüavad midagi, mis ei, ei peegeldu otseselt andmetes tegelikult nagu välja näidata. Kas seda hakkab teile Eestis tihti silma, et üritatakse statistikat kuidagiviisi väänata niimoodi kõneleja kasuks ütleme näiteks, kui me võtame siin tõesti poliitikud, olete, kas, kas tundub, et nad nagu sageli räägivad nendest samadest külmudest arvudest niimoodi, et neid on siiski võimalik kuidagi ühele või teisele poole kallutada? No see on nüüd tõepoolest niisugune sisetunne ja pinnapealne, mida ma saan välja öelda, et ma ikkagi tulen enda selle arvamuse juurde tagasi, mis ma enne ütlesin, et pigem pigem ehk ehk ignoreeritakse või ei osata või ei taheta. Ta on andmeid adekvaatselt arvesse võtta, kui et kui neid sisi teadlikult väänataks sihtgrupi eksiteele viimiseks sõnalitamiseks. Ühesõnaga, vaadatakse siis ühtesid arvusid, aga samal ajal teised näiteks jäetakse kõrvale, see on siis. Genev pehmem viis, aga aga põhimõtteliselt ka, et kuna meetodid ja, ja nagu ma ütlesin, et, et üks on see niisugune tehniline arv, mida me näeme, aga tegelikult selle adekvaatseks tõlgendamiseks on vaja tohutut taustainfot selle kohta, millisest kontekstist, milliste mõõdikute, milliste indikaatorite kaudu see alginfo on kogutud ja juba see on see, et kui meil selle kohta, kust need alginfo tuleb, kui me selle kohta ei ole piisavalt informatsiooni, siis see tehniline arv, mis seal on, ta võib olla täiesti korrektselt statistilise valemi abil kokku arvutatud, aga, aga meil ei ole lihtsalt alust otsustamaks, kas ta, kas ta on usaldusväärne arv ja ka selle üle, et kuidas ja kuhu, kust pidime teda ikkagi saan ja kus pidi ei saa interpreteerida ja millisesse konteksti rakendada, nii et et ta on selles mõttes nagu laiem küsimus. No kui tihti tänapäeval üldse kohtate seda, et keegi tuleb teie juurde, ütleb, et ah, et statistika võib näidata mida iganes, paneme lihtsalt mingisuguse natuke teistsuguse valemi või kasutada mingit teistsugust jaotust ja ongi meid popis võib-olla isegi peaaegu risti vastupidine tulemus, et kui palju, kui palju inimesed seda senimaani veel arvavad? No mina toimetan põhiliselt ju seal ülikoolis ja ma ei ütleks, et ma sellist arvamust näen, pigem see, mis on ikkagi noh, see niisugune on see, et statistika on nii keeruline, hirmus ja kole, et mina sellest küll jagu ei saa, et ju püüda ja õpetada, et pigem on see niisugune, niisugune kurb, kurbust tekitav, aga ma arvan, et seda on ka oluliselt vähemaks jäänud ja ja eks seal on ka just sellesama selle inimese, kes vahendab, kes õpetab, seda statistikat ja see juba juba ju see nii-öelda tudengifolkloor läheb ju eelmistelt järgmistele, et, et siis ka Seefaktori, et, et kui eelmised on lõpuks ikkagi aru saanud, siis, siis järgmised juba teavad, et on küll võimalik on küll võimalik aru saada ja ka neid hirmusid on võimalik sedakaudu sedakaudu vähendada, aga jah, et sellist sellist suhtumist, et nüüd et keegi tuleks küsima, et kas et kas ma kuidagi saaksin, saaksid neid andmeid nii keerata, et öelge mulle nipp, et ma saaksin seda seda näidata, mida ma just tahan, et et seda, seda ma ei usu või, või ei ei ole nii palju, et, et pigem pigem on jah, see jälle teistpidi, et see niisugune mitteteadmisest tulenev õnnetus, et mul on sinna andmed, et aga mõtlesin, et võiks seda ja teist teha, aga, aga et äkki äkki keegi ütleks, et mida ma päriselt teha nende andmetega, et see on see, mis seal vast paistab välja. Väga tore, me rääkisime tänases saates puust ja punaseks statistikast statistika teatavasti on viimasel ajal ka väga populaarne teema seoses Veerpalu Andrus Veerpalu juhtumi dopinguasjaga, nii et kes soovib natukene selle statistilist tausta teada, siis soovitame lugeda eelmisel laupäeval Postimehes ilmunud Christoph Fisheri artiklit selle kohta, kuidas, kuidas teha testimisse mõõdab, mõõdab õigesti. Nii et soovime kõigile kuulajatele head statistilist mõtlemist. Täname Katrin Niglast Tallinna Ülikooli andmeanalüüsi professorit, teadusprorektorit, kes meil täna külas olla. Kuulaja. Siirdume kuulaja küsimuste juurde ning Piia on meie foorumisse postitanud järgmise küsimuse väga selline päeva ja ilmakajaline. Millest tuleb see, et külmal ja päikesepaistelisel päeval võib rõduust paraatades seinal näha õhu liikumise varje ja oleme helistanud omale heale tuttavale Andres juurele Ahhaa keskusest, kes loodetavasti oskab sellele küsimusele vastuse anda. Tere, Andres. Tere tere. Küsimus on väga hea ja tabav küsimus tõepoolest. Aga, aga see tuleb nüüd lahata päris mitme nurga alt. Tuleb välja, et külmal ja kuumal õhul on natuke erinevad omadused, külm kuum tähendab siis igasugust temperatuuride erinevust, et kui õues on külm ja toas on soojem, siis ongi meil suhteliselt külm ja kuum õhk olemas. Aga miskipärast on niimoodi, et valgus levib soojemas külmemas õhk erineva kiirusega ja, ja tuntakse kogu murdumisnäitajat ja kes kaheksanda klassi koolifüüsikat mäletab, siis läätsede puhul ka prilliläätsede puhul räägiti sellisest asjast nagu murdumisnäitaja. Ja teine huvitav asi on see, et kui kui valgus muudab oma liikumise kiirust, ehk siis näiteks läheb klaasja tuleb klaasi seest välja või, või läheb siis jahedas õhust soojemasse õhku siis valgus murdub, ehk siis muudab oma levikusuunda. Ja kui meil nüüd seal usbraatodes külm ja kuum õhk hakkavad segunema, siis tekivad ka sellised piirpinnad, et kus külmast kuumast õhust läheb valgus läbi iga kord, kui ta oma kiirust muudab, muudab ka natukene oma suunda. Ehk siis tekivad sellised nii-öelda mitte päris füüsikaliselt korrektse väljendiga väljendatud nagu väikesed läätseke, mis hakkavad siis valgus kas koondama või hajutama ja seetõttu tekib siis muster seinale. Kas sellist sarnast nähtust veel kusagil kohata võib, tavalises elus või maa peal? Kõige lihtsam näide on ju tegelikult miraaž või värelev asfalt kuumal suvepäeval, kus siis maapinna lähedal olev õhk on väga kuumaks köetud ja see muudab valguse nii-öelda liikumissuunda ja, ja kõrbes siis lausa nii palju, et langev nii-öelda pilvede või, või taevasina pilt, siis pööratakse siis meil silma nii et me näeme tegelikult taevaste arvame, et tegemist on meiega. Suur aitäh, Andres Juur. Puust ja punaseks. Järgmine kuulajaküsimus meie saate internetifoorumis tuleb meeliselt ja Meelis küsib selliseid asju, et miks lähestikku asuvad Eesti ja Soome nii erineva geoloogiaga on ehk siis miks meil on paekivi ja neil graniit, kas Eesti ainsana triivi sekvaatorilt oma ladestustega siia graniidi vahele? Selleks, et selles asjas selgust saada, oleme helistanud Tallinna tehnikakõrgkooli professorile paevanale. Rein Einasto, palun. Soome asub balti kilbi ja Balti kilp nagu kõik kilbid on maakoore osad, mis pidevalt kogu miljonite aastate vältel kerkivad järelikult kõik nende pealmised kihid järjest kulutatakse maha. Ja kui ühes kohas kerkib tasakaalu mõttes naabruses vajub Balti lõgu keskusega Riias on jälle kogu aeg vaikselt vajunud ja niimoodi on Eesti kujunenud siis balti kilbi lõunanõlvale ja madal veelise merre ajal, kui meri on kujutanud üle ka Lõuna-Soome, aga need on hiljem ära kulutatud. Alguses, kui me tahame teada, miks just see Soome laht on nii terav piir siis ütleme, geoloogilist ehitusest kaugel lõunas, kus kogu see Baltika kontinent, nii-öelda see kilp, kui ka kogu vene tasandik Uuralist ja Kaukaasiat nii-öelda piiritatuna oli lõunapooluse lähedal, siis esialgu tekkisid seal ainult liivakivid ja savid, nagu meie sinisavi on maailma kõige vanem veel kivistumata, saagid. Aga hiljem, kui riivis kogu see kontinent Põhja-Eesti ekvaatori poole, siis subtroopikas juba algas paetekke soojas vees madalas vees. Ja nii kujunesid meil siis üle 70 miljoni aasta järjest paekihid ja sel ajal oli juba kontinent triivinud troopikas. Aga see terav kiirkujunes selle tõttu, et liivakivi on kergemini kulutatavad. Ja kui kilbi lõunanõlval mingisugune veesool lõikus Liba maakoorde siis tiivakividesse ja niimoodi siis kunagine praegu või ütleme, Soome lahe kohal olev jõgi, ürgleevaks nimetatu kulutas siis juba siia korraliku laia jõe olulgi just liivakividesse ja siis ülevalt järjest muidugi kukkus ka paekivi alla, aga miljonite aastate vältel kõik lagunes ja niimoodi siis taandusse järk-järgult praeguse balti pankranniku kohale lõuna pool on kogu aeg Tšettinud, kui oli meri peal, siis väga pikka aega seltsi paekivi lubimudad ja teralised, eestid ja nii edasi, mis troopikas iseloomulik. Aga siis, kui Skandinaavia mäed kerkisid, see oli siis, kui kontinent see Põhja-Ameerika Lavrenti aga kokku põrkus, siis kerkis kõrged mäed ja mägede kulutus material Liba devoni ajastul sütitas meile siia siis need punased liivakivid Lõuna-Eestis. Rein Einasto, suur aitäh. Kõike head. Puust ja punaseks. Niisugune saigi tänane saade puust ja punaseks. Ootame jätkuvalt sinu poolt esitatud kuulaja küsimusi, et neile spetsialistide abil vastust leida. Need kohad on endiselt muutumatut. Te leiate kergesti tee meie saate foorumisse. Kui lähete leheküljele R2 leiate meid ka Facebookist ergaks puust ja punaseks ning meiljadeski töötab ja loeme kõike, mida te sinna saadate, sealt siis puust ja punaseks. Ät R punkt. Kohtumiseni. No. Tartu linn Saatis mind nüüd Tartu kõne. Kauge ja kätte ka. Kuidagi neid aidata. Taanlanna. Samatiive. Kauge ja. Kui ta noortele kõrv Ära. Ja ta. Ei ta ei tea. Palun. Lõpetage.
