Uus lahendus Skype’is petturite avastamiseks
Küllap igaüks on saanud e-maile, kus tundmatud paluvad abi kaugel Aafrikas surnud sugulase hiigelpäranduse vormistamisel, kirjutab Villu Päärt Tartu ülikooli teadusportaalis Novaator. Kuid petised ja spämmerid ei piirdu ainult meilidega, nad püüavad sisse imbuda ka sotsiaalvõrgustikesse ning neist pole pääsenud ka Microsofti internetitelefon Skype, millel on üle maailma ligi 300 miljonit kasutajat. Netitelefonis võib spämmeri tegevus piirduda lihtsalt tüütute sõnumite saatmisega. Hullemal juhul võivad petised aga välja petta krediitkaardiandmeid või kaaperdada kasutajakonto, et seda enda huvides ära kasutada. Tartu Ülikooli doktorant Anna Leontjeva uuris koostöös Silicon Valleys asuva Microsofti uurimiskeskuse töötajatega, kuidas on võimalik netitelefonist Skype spämmereid ja petiseid automaatselt eemal hoida kasutades masinõppe algoritme. Automatiseeritud petiste tuvastussüsteem võtab aluseks esmalt Skype’i kasutaja profiili: kaua tal on netitelefoni kasutajastaaži, kui palju on ta selle aja jooksul teinud kõnesid või vahetanud kirjalikke sõnumeid. Järgmise sammuna teeb masin järeldusi kasutaja suhtlusvõrgustiku põhjal: kui palju on ta ise Skype’s kontakte lisanud ja kustutanud ning palju on teda lisatud ja palju blokeeritud. Otsingumootor Google kasutab internetilehekülgede järjestamisel PageRank-algoritmi. Samalaadse kasutajate tegevuse hindamissüsteemi pakuvad teadlased välja ka Skype’is petturite tuvastamiseks, ainult süsteem töötaks täiesti vastupidiselt. Google’i hindamissüsteem järjestab lehekülgi muuhulgas selle põhjal, kui paljudelt teistelt lehekülgedelt sellele lehele viidatakse. Mida rohkem viiteid, seda olulisem lehekülg. Kui rämpspostitaja saadab ise välja väga suures koguses kirju või sõnumeid, aga saab neile väga vähe vastuseid, siis tõlgendab PageRank-algoritm seda võimaliku spämmeri käitumisena. Anna Leontjeva sõnul oli nende töös kasutusel Skype’i andmebaasist pärit nelja kuu andmed 34 000 kasutaja tegevuste kohta. Need kasutajad olid omakorda valitud 200 tuhande konto hulgast, mis olid olnud aktiivsed vähemalt neli kuud. Valikus oli nii petiseid kui täiesti tavalisi ausaid telefonikasutajaid. Uudne algoritm suutis petised ära tunda 68-protsendilise täpsusega. Valepositiivseid tulemusi – kus programm pidas spämmeriks tegelikult ausat kontoomanikku, oli viis protsenti. Kõnede ega sõnumite sisu uurijate kasutuses ei olnud, ka kasutajanimed olid kodeeritud kujul. Neli kuud on kompromiss: pikema ajavahemiku puhul läheks andmemaht suuremaks, aga ka täpsemaks, samas peavad töö autorid ebatõenäoliseks, et petistel õnnestub Skype’i võrgustikus avastamata tegutseda paljude kuude vältel. Raskem on automaatselt tuvastada selliseid petuskeeme, kus kasutaja konto pahatahtlikult häkitakse ning seni tavalise telefonikasutusega konto alt hakatakse tegema ahvatlevaid ettepanekuid petuskeemides osalemiseks. “Skype’il on olemas süsteem, kuidas pettureid eemale hoida, näiteks kogutakse andmeid kahtlaste maksete kohta. Meie eesmärk oli näidata, kuidas masinõppe algoritmid, mis põhinevad kasutaja sotsiaalsel profiilil, võivad petiste tuvastamisel olla lisaabivahend,” ütles Leontjeva. Tema sõnul ei ole praegu veel teada, kas selle töö tulemused ka reaalselt Skype’i puhul rakendust leiavad. “See on hetkel veel lahtine,” ütles ta. Tööd esitleti Berliinis masinõpet ja tehisintellekti puudutaval konverentsil AISec’13.
