Kui juturobot räägib nagu telefon: uus interaktsioonimudel

Kui juturobot räägib nagu telefon: uus interaktsioonimudel

Rasmus Kask Rasmus Kask . Kommentaarid

3 Minutit

Enamik tehisintellekti süsteeme käitub endiselt nagu viisakad raadiosaatjad. Sina räägid, nemad ootavad. Nemad vastavad, sina vaikid. See rütm on vorminud peaaegu kõiki tänapäeval kasutatavaid vestlusroboteid ning seda tahab Thinking Machines Lab nüüd murda.

Idufirma, mille asutas endine OpenAI CTO Mira Murati, on avalikustanud seda, mida nad kutsuvad interaktsioonimudeliteks, uue lähenemise, mille eesmärk on teha tehisintellekt vähem nagu viivitatud sõnumijada ja rohkem nagu päris vestlus. Põhiidee on lihtne, kuid ambitsioonikas: selle asemel, et pidada kuulamist ja vastamist eraldi käikudeks, tegeleb mudel mõlemaga samaaegselt.

See muutus on oluline. Inimesevahelises dialoogis ei suhtle inimesed ideaalselt järjekorda pandud plokkidena. Nad peatuvad, reageerivad, sekkuvad, kohandavad tooni ja mõnikord räägivad vahele. Thinking Machines panustab, et tehisintellekt peaks toimima samamoodi algusest peale, mitte toetuma hiljem lisatud häälekihile, mis vaid matkib loomulikku vahetust.

Rohkem telefonikõne kui juturobot

Ettevõtte uurimuse eelvaade keskendub mudelile nimega TML Interaction Small. Tehniliselt on see loodud täielikuks duplekskommunikatsiooniks, mis tähendab, et see suudab saabuvat kõnet töödelda samal ajal, kui genereerib vastust. Lihtsustatult tähendab see, et süsteem peaks kuulama, samal ajal kui ta räägib.

Thinking Machinesi andmetel vastab mudel umbes 0,40 sekundiga, mis on kiiruse poolest lähedane inimliku kiire vahetuse temposse. Kui see number peab ka väljaspool laborit paika, võib see tähendada märkimisväärset edasiminekut vestlusliku tehisintellekti puhul, eriti häälassistendi, reaalajas tugivahendite ja digitaalagentide valdkonnas, mis peavad tunduma vähem robotlikuna ja rohkem kohalolijana.

Siin läheb ka laiem tööstusharu konkurents huvitavaks. OpenAI, Google ja teised suuremad tegijad on kõik liikunud kiirema ja sujuvama häälinteraktsiooni suunas, kuid kogemus võib endiselt tunduda lavastatud. Mudel, mis on loodud omama interaktiivsust loomuliku käitumisena, mitte ainult hiljem pealepandud kihina, võiks nende vahetuste olemust märgatavalt muuta.

Kuid praegu on tegu ikka veel uurimislooga, mitte tarbijale suunatud käivitusega. Ettevõte ei ava mudelit veel avalikkusele. Piiratud uurimuse eelvaade on oodata järgnevate kuude jooksul, laiem väljaanne on planeeritud hiljem sel aastal.

Kas see on tõesti vestluslikuma tehisintellekti ajastu algus? Võib-olla. Läviväärtuste väited on paljulubavad ja eeldus on raske tähelepanuta jätta. Kuid sujuvad latentsusnumbrid ja reaalsed vestlused ei ole alati sama asi. Seni, kuni inimesed ei saa mudelit testida selle järgi, kuidas ta talub katkestusi, segast kõnet, kõhklust ja ettearvamatust, on teatav skepsis kohane.

Sellegipoolest jõuab idee õigesse aega. Tehisintellekti tööstus on aastaid õpetanud masinaid vastama. Nüüd liigub surve raskema eesmärgi suunas: õpetada neid suhtlema. See on väga erinev väljakutse ja Thinking Machines soovib selgelt olla üks esimesi sellel alal.

"Ma kirjutan tehnikauudiseid, sest usun, et innovatsioon algab teadmiste jagamisest. Hea artikkel võib panna kedagi teist midagi uut looma."

Jäta kommentaar

Kommentaarid