Google Flu Trends'i ennustused erinevad jätkuvalt reaalsusest
Kuus aastat tagasi esitletud rakendus Google Flu Trends tööpõhimõte on lihtne. Otsinguhiiu insenerid märkasid, et hooajati kasvavad käsikäes nakatumisjuhtumite arvuga teatud otsinguterminite sagedus. Võttes arvesse, et Google teab tänapäeval tihti inimese haigusest enne kui tema perearst, lootsid nad, et suudavad nõnda suhteliselt usaldusväärselt nakatumisjuhtumite arvu hinnata. Erinevalt haiguste ennetus- ja kontrollikeskuste statistikast oleks see olnud peaaegu reaalajas uuenev, andes rahvuslikele terviseametitele kiiremat infot gripilaineks valmistumiseks. Kolme aasta vältel – 2011. aasta augustist kuni 2013. aasta septembrini – on aga rakendus nakatunute arvu järjepidevalt ülehinnanud. Eelmise aasta alguse gripilaine ajal erines selle poolt antav hinnang tegelikust olukorrast suisa kahekordselt. Suur andmehulk ei tundunud seekord erilist eelist pakkuvat. David Lazeri töörühm näeb süstemaatiliselt ilmneva nähtuse potentsiaalse põhjusena kahte asjaolu. Esimene on tingitud otsinguhiiu enda poolt otsingumootoris tehtud muudatustest, mis lisaks kasutajamugavuse tõstmisele ka potentsiaalset reklaamitulu kergitasid. Kaks aastat tagasi hakkas Google teatud otsinguterminite puhul ise diagnooside kirjeldusi pakkuma. Näiteks kirje „ebanormaalne valu paremal kehapoolel“ vastuseks võib saada nii neerukivide kui ärritunud soole sümptomite kirjelduse. Samuti on otsingumootor õppinud pakkuma teatud kirjete, nagu „gripp“ või „palavik“, ka terminitega seotud vasteid, näiteks „oksendamine“. Mõlemal täiendusel oleks ennustatavate nakatunute arvu võimendav mõju. Tuleb ka märkida, et osadel otsinguterminitel, mis gripijuhtumitega käsikäes näivad käivat, pole haiguse mingit seost, vaid need seostuvad talvega. Kuigi insenerid on neid ajapikku mudelist käsitsi eemaldanud, ei seostu endiselt kõik sellesse kaasatud kirjed viirushaigustega. Viimaks ei tohiks alahinnata meedia mõju. Gripilaine tipphetke käsitlevate artiklite lugemise järel kipuvad inimesed ikka ja jälle otsima, kas gripi sümptomeid esineb ka neil. Seega, kuigi Google Flu Trends ei peegelda hetkel veel täielikult reaalsust, võib see siiski aidata gripitrende ette näha. Prooviks kombineeris Lazer kolleegidega mudeli andmeid traditsioonilisemate haiguste ennetus- ja kontrollikeskuste kahe nädala vanuste andmetega ning sai tulemuseks reaalsusele lähema tulemuse. Samal ajal kulges analüüs kiiremini, kui traditsioonilisi meetodeid rakendades. Siiski jääb töörühma hinnangul järgnevatel aastatel mudeli lihvimisel probleemiks ligipääs Google'i inseneride poolt kasutatavale lähtekoodile. Uurimus ilmus ajakirjas Science.
