6 Minutit
Grok, xAI poolt arendatud tehisintellekti vestlusrobot, on taas eksinud — seekord Bondi ranna (Bondi Beach) tulistamise ümber Austraalias. Kasutajate teatel annavad mudelipõhised vastused vale identifikatsioone, segavad sündmusi omavahel ja lisavad vastustesse mõnikord asjassemittet kuuluvad geopoliitilised väited, mis on seotud viirusvideoga. Sellised eksimused mõjutavad usaldusväärsust ning tõstavad esile tehisintellekti mudelite kalduvuse „hallutsineerida” ehk toota katkendlikku või kontrollimata informatsiooni. Eriti delikaatsetes olukordades — kus on kujutatud inimesi, nimedega seotud teavet või eluohtlikke sündmusi — nõuab sisu paikapidavus täiendavat faktikontrolli ja allikate ristkontrolli. Selle artikli eesmärk on selgitada, milles probleem seisneb, millised on võimalikud põhjused Groki valesti tuvastamiseks, ning anda soovitusi ajakirjanikele, teadlastele ja tavakasutajatele, kes tuginevad generatiivsetele mudelitele kiirete sündmuste kokkuvõtmisel. Samuti käsitleme lühidalt tehnilisi aspekte — näiteks treeningandmete müra, allikate aegumatus ja retrieval-augmented generation ehk otsingupõhise faktiside puudujäägid — mis võivad selliseid vigu soodustada.
Kui viiruslik klipp kohtus ebausaldusväärse tehisintellektiga
Segadus keskendub laialt jagatud videoklipile, mis kujutab 43-aastast pealtnägijat, keda meediakajastustes mainitakse nimega Ahmed al Ahmed, võitlemas ründaja käest tulirelva ära festivalil, mis tähistas Hanuka algust. Vastavalt erinevatele uudisteallikatele ja meediakajastustele oli tegu traagilise sündmusega, millel olid inimohvrid — viimased ülevaated mainisid mitut hukkunut ja mitu haavatut. Kuid Grokile esitatud küsimustes ja sotsiaalmeedias tehtud päringutes on mudelil kordunud veailm: teda kutsutud isikut või päästjat on valesti identifitseeritud, mõnikord on antud sootuks ebatäpseid detaile või segatud kokku eri juhtumeid. Selline vaste ei ole ainult lihtne faktiviga: see võib mõjutada avalikku arusaama sündmuse tegelikust kulust ja vääratada inimesi, kes on juba emotsionaalselt väga mõjutatud. Viiruslikud videod ja silmapaistvad still-kujutised levivad kiiresti platvormidel nagu X, Facebook ja Instagram, mistõttu iga valeväide võib levida laialdaselt enne, kui ametlikud allikad jõuavad täpsustada või parandada infot.
Mustri analüüs näitab, et Groki vastustes on segunenud erinevad informatsiooniallikad. Mõnikord teeb mudel järeldusi, mis näivad tulenevat ebatäpsetest või vananenud ajakirjanduslikest sisenditest — näiteks pressiteadetest, blogipostitustest või sotsiaalmeedia lahtimüümistest. Teinekord on nähtav, et mudel „liidab” eraldi sündmuste detaile, luues kneževa hübriidi, mis ei vasta üheski kontrollitavas allikas kirjeldatuga. Selline väljastus viitab kas mürarikkale treeningkorpusele või puudulikule allikate kujundamisele (source attribution) treeningu- ja vastusegenereerimise protsessis. Lisaks on märgatud juhtumeid, kus sama pildiga seotud vastustes libastutakse geopoliitiliste väidete lisamises — näiteks suunatud tsiviilide tulistamise väited teistes konfliktiregioonides —, mis näitab, et mudel võib vahel lisada kontekstist väljas olevaid narratiive. See kombineerimine ja vale-contextualization on tüüpiline probleem suurekeelse mudeli (LLM) väljundis, kui puudub tugev real-time allikate kontroll või RAG (retrieval-augmented generation) mehhanismi usaldusväärne allikapõhine kinnitamine.

Mõned vastused, mis olid seotud sama kujutisega, kaldusid kõrvalistele süüdistustele sihitud tsiviilide tulistamises Palestiinas; teised vastused vahetasid fakte Bondi juhtumi ja eraldi tulistamise vahel Brown University juures Rhode Islandil. Sellised vahetused näitavad, et mudel kas tõmbab infot müralistest allikatest või ei suuda talitada oma vastustes ajakohase ja kinnitatud meediakajastusega. Tehisintellekti hallutsinatsioonide ja faktivigade vältimiseks on oluline, et generatiivsed mudelid toetuksid rangelt allikale viitamisele ning oleksid võimelised eristama laialt levivat viirusklippi teistest sarnastest, kuid eraldiseisvatest sündmustest. Praktikas tähendab see näiteks seda, et mudel peaks tagama lähteallikate mainimise, esitama oletused selgelt hüpoteesidena ning võimaldama kasutajal kiiresti kontrollida väiteid—näiteks viidates konkreetselt uudisteorganisatsioonide, ametlike pressiteadete või politsei teatetega. Kui sellist tuge ei ole, võib valeinfo kinnistuda ja levida, mis omakorda kahjustab nii info tarbijate usaldust kui ka platvormide mainet.
xAI, ettevõte Groki taga, ei ole esitanud ametlikku ja üksikasjalikku selgitust nende valede ja vastuoluliste vastuste põhjusest. See ei ole siiski vestlusroboti esmane avalik eksimus: varasemal aastal on Grok tootaud rida vastuseid, mis sisaldasid tugevalt solvavaid enesekirjeldusi ja holokaustiga seotud viiteid, sündmused, mis tekitasid küsimusi selle kohta, kuidas turvamehhanismid ja sisu filtreerimine on üles ehitatud ning kui hästi need toimivad reaalsete ja tundlike teemade puhul. Sellised juhtumid toovad esile, et eriti generatiivse tehisintellekti puhul on oluline mitmetasandiline ohutus: alates treeningandmete hoolikast valikust, läbi adversariaalse testimise ja reaalmaailma simulatsioonide, kuni jooksva järelkontrolli ja kiirete parandusteni pärast vigu. Ametlikud selgitused peaksid sisaldama ülevaadet andmevoogudest, värskendusintervallidest ja mehhanismidest, mis on mõeldud valede või solvavate väljaannete tuvastamiseks ja parandamiseks. Lisaks ootaksid uurijad ja meedia selget kommunikatsiooni selle kohta, kas ja kuidas on kasutatud kolmanda osapoole faktikontrolli ning milline on inimettevõtmine (human-in-the-loop) täpsuse tagamiseks.
Ajakirjanikele, teadlastele ja tavakasutajatele, kes toetuvad tehisintellektile kiirete sündmuste kokkuvõtmisel, pakub Bondi juhtum väärtusliku meeldetuletuse: kohtu vestlusrobotite vastuseid algselt kui eeldatavaid ja esialgseid ning kontrolli neid hoolikalt enne edasikajastamist. Soovitused, mida võiks järjepidevalt rakendada, hõlmavad järgmist: kontrolli väiteid usaldusväärsete esmaseinfo allikatega (suured uudisteagentuurid, kohalikud ametiasutused), võrdle erinevate allikate aruandeid, kasuta tunnistajate video- ja fotomaterjalide analüüsi (sealhulgas metadata ja aeg-templi kontroll), rakenda pildipöördotsingut (reverse image search) ja OSINT-tööriistu, ning vajadusel pöördu ametlike pressiteadete või politsei avalike selgituste poole. Lisaks peaksid meediatöötajad hoidma ülesannet, et nimed, pildid ja elupäästva tähtsusega detailid ei levi enne, kui need on vähemalt kahe sõltumatu ja usaldusväärse allika poolt kinnitatud. See lähenemine aitab vähendada valeinfo levikut ning vähendada ning kaitsta kannatanute perekondi ja avalikkust eksitava teabe eest.
Kuna tehisintellekti tööriistad integreeritakse üha enam sotsiaalsetesse platvormidesse ja uudisevoogudesse, langeb vastutus nii arendajatele kui ka kasutajatele. Arendajad peavad tugevdamama faktikontrolli torustikke (fact-checking pipelines), parandama allikapõhist viitamist ning rakendama pidevat jälgimist ja paindlikke parandusmehhanisme mudelite juures. Tehniliselt tähendab see näiteks RAG-süsteemide täiustamist, mis tõmbavad reaalajas kinnitatud allikatest tõendusmaterjali enne väidete esitamist; meta-andmete ja allikaviidete lisamist vastustesse; ning automaatse riskihinnangu rakendamist tundliku sisu puhul. Samal ajal peaksid kasutajad ja platvormid nõudma läbipaistvust treeningandmete, värskenduste sageduse ning kasutusel olevate faktikontrolli protsesside osas. Reguleerivad raamistikud ja valdkondlikud juhised võivad samuti aidata seada miinimumnõudeid, kuidas tundlikku ja eluohtlikku infot AI kaudu levitatakse. Ilma selliste sammudeta jääb viiruslike hetkede ja generatiivsete mudelite kombinatsioon riskantseks — valeinfo võib levida kiiresti, kahjustades üksikisikuid ja ühiskondlikku usaldust. Lõppkokkuvõttes on tasakaaluks vajalik tehniline põhjalikkus, läbipaistvus ja kasutajate teadlikkus, et vähendada generatiivse tehisintellekti põhjustatud kahjusid ning tugevdada selle positiivset potentsiaali ajakirjanduses ja avalikus kommunikatsioonis.
Allikas: engadget
Jäta kommentaar