Kui juturobot räägib nagu telefon: uus interaktsioonimudel

2 Minutes

Enamik tehisintellekti süsteeme käitub endiselt nagu viisakad raadiosaatjad. Sina räägid, nemad ootavad. Nemad vastavad, sina vaikid. See rütm on vorminud peaaegu kõiki tänapäeval kasutatavaid vestlusroboteid ning seda tahab Thinking Machines Lab nüüd murda.

Idufirma, mille asutas endine OpenAI CTO Mira Murati, on avalikustanud seda, mida nad kutsuvad interaktsioonimudeliteks, uue lähenemise, mille eesmärk on teha tehisintellekt vähem nagu viivitatud sõnumijada ja rohkem nagu päris vestlus. Põhiidee on lihtne, kuid ambitsioonikas: selle asemel, et pidada kuulamist ja vastamist eraldi käikudeks, tegeleb mudel mõlemaga samaaegselt.

See muutus on oluline. Inimesevahelises dialoogis ei suhtle inimesed ideaalselt järjekorda pandud plokkidena. Nad peatuvad, reageerivad, sekkuvad, kohandavad tooni ja mõnikord räägivad vahele. Thinking Machines panustab, et tehisintellekt peaks toimima samamoodi algusest peale, mitte toetuma hiljem lisatud häälekihile, mis vaid matkib loomulikku vahetust.

Rohkem telefonikõne kui juturobot

Ettevõtte uurimuse eelvaade keskendub mudelile nimega TML Interaction Small. Tehniliselt on see loodud täielikuks duplekskommunikatsiooniks, mis tähendab, et see suudab saabuvat kõnet töödelda samal ajal, kui genereerib vastust. Lihtsustatult tähendab see, et süsteem peaks kuulama, samal ajal kui ta räägib.

Thinking Machinesi andmetel vastab mudel umbes 0,40 sekundiga, mis on kiiruse poolest lähedane inimliku kiire vahetuse temposse. Kui see number peab ka väljaspool laborit paika, võib see tähendada märkimisväärset edasiminekut vestlusliku tehisintellekti puhul, eriti häälassistendi, reaalajas tugivahendite ja digitaalagentide valdkonnas, mis peavad tunduma vähem robotlikuna ja rohkem kohalolijana.

Siin läheb ka laiem tööstusharu konkurents huvitavaks. OpenAI, Google ja teised suuremad tegijad on kõik liikunud kiirema ja sujuvama häälinteraktsiooni suunas, kuid kogemus võib endiselt tunduda lavastatud. Mudel, mis on loodud omama interaktiivsust loomuliku käitumisena, mitte ainult hiljem pealepandud kihina, võiks nende vahetuste olemust märgatavalt muuta.

Kuid praegu on tegu ikka veel uurimislooga, mitte tarbijale suunatud käivitusega. Ettevõte ei ava mudelit veel avalikkusele. Piiratud uurimuse eelvaade on oodata järgnevate kuude jooksul, laiem väljaanne on planeeritud hiljem sel aastal.

Kas see on tõesti vestluslikuma tehisintellekti ajastu algus? Võib-olla. Läviväärtuste väited on paljulubavad ja eeldus on raske tähelepanuta jätta. Kuid sujuvad latentsusnumbrid ja reaalsed vestlused ei ole alati sama asi. Seni, kuni inimesed ei saa mudelit testida selle järgi, kuidas ta talub katkestusi, segast kõnet, kõhklust ja ettearvamatust, on teatav skepsis kohane.

Sellegipoolest jõuab idee õigesse aega. Tehisintellekti tööstus on aastaid õpetanud masinaid vastama. Nüüd liigub surve raskema eesmärgi suunas: õpetada neid suhtlema. See on väga erinev väljakutse ja Thinking Machines soovib selgelt olla üks esimesi sellel alal.

Rasmus Kask

"Ma kirjutan tehnikauudiseid, sest usun, et innovatsioon algab teadmiste jagamisest. Hea artikkel võib panna kedagi teist midagi uut looma."

Comments

No comments yet.

Kui juturobot räägib nagu telefon: uus interaktsioonimudel

Thinking Machines Lab tutvustab interaktsioonimudeleid, mis lasevad tehisintellektil samaaegselt kuulata ja vastata, muutes häälvestlused loomulikumaks. Uurimuse eelvaade on piiratud; laiem avalikustamine tuleb hiljem sel aastal.

Rohkem telefonikõne kui juturobot

Leave a Comment

Comments

Related Posts

Canberra seab tehisintellektile veenõuded ja loomekaitse

DeepSik V4 Pro: ohtlik uus konkurent AI-kodeerimisel

ChatGPT-teavitused vanematele: teismelise konto peatamine

Alibaba avaldab Qwen3.8: 2,4 triljonit parameetrit nüüd

Jaapan ja NVIDIA: riiklik AI-keskus robotitele ja tehastele

SpaceXAI kaks triljonit parameetrit, efektiivne ja kiire mudel

SpaceX kui pilvepakkuja Pentagonile: AI-arvutusvõimsus

Veebi viha muutub reaalseks ohuks: tehisintellekti ohud

Gemini 3.5 Pro viivitus ja selle mõju Google'i positsioonile

Google'i otsingu AI-funktsioonid ohustavad õpilasi

Nvidia Cosmos 3 Edge annab robotitele olukorrateadvuse

Jetson Thor: väiksemad moodulid, suurem reaalsus ja tootmine