3 Minutit
Kõige tüütum osa tehisintellekti kasutamisel arvutis ei ole AI ise. Vaid pidev kõrvalteekond. Sa peatud töö pooleli, lülitud vestlusrobotisse, selgitad, mis su ekraanil on, kopeerid vastuse ja naased seejärel oma algse töö juurde. Google DeepMind tahab nüüd seda takistust vähendada lihtsa, üllatavalt radikaalse tundega ideega: muuta kursor intelligentseks.
Uutes demonstratsioonides ja uurimuse eelvaadetes näitab DeepMind, kuidas Gemini-põhine kursor võiks mõista nii seda, kuhu sa osutad, kui ka mida selle all on. See muudab suhtluse täielikult. Selle asemel, et kirjutada pikk käsuettekanne, osutad millelegi ja palud soovitud tulemust. Süsteem loeb ise ümbritseva visuaalse ja semantilise konteksti.
See nihe võib tunduda väike. See ei ole. See muudab hiirekursori passiivsest navigeerimistööriistast aktiivseks AI-abikihiks, mis asub täpselt seal, kus su tähelepanu juba on.
Kujuta ette, et hoiad kursorit andmetabeli kohal ja palud sektordiagrammi. Või osutad retseptile ja palud kahekordistada koostisosade koguseid. PDF võib muutuda ilusti vormistatud punktide loendiks, valmis saatmiseks e-kirjas. Peatud reisivideos restoranikaadril ja süsteem võiks kuvada broneerimislingi. Igal juhul on lubadus sama: vähem selgitamist, vähem rakenduste vahel vahetamist, vähem käsitsi korrigeerimist.
DeepMind kirjeldab seda liikumisena loomuliku lühiväljendi suunas. See väljend on oluline. Aastate jooksul on AI-tööriistad nõudnud, et kasutajad muutuksid osavateks käskluste kirjutajateks. See lähenemine pöörab koormuse ümber. Arvuti teeb suurema osa tõlgenduslikust tööst ja kasutaja vaid žestib ja palub.
Kursor ei ole enam lihtsalt kursor
See ei jää pelgalt laboritingimustesse. Google'il on juba kaks töös olevat eksperimenti AI Studios, mis keskenduvad pilditöötlusele ja kaardotsingule ning annavad varajase ettekujutuse sellest, kuidas see suhtlusmudel võiks reaalses maailmas toimida. Laiem plaan ulatub kaugemale.
Google ütleb, et tehnoloogia on teel Chrome'i, kus kasutajad saavad veebilehel sisu esile tõsta või osutada sellele ja küsida Geminilt ilma eraldi aknasse pikka selgitust tippimata. See on loomulik jätk AI-funktsioonidele, mida Google on juba oma brauserisse lisanud. Näiteks Auto Browse võimaldab Geminil juba praegu veebis mitmeastmelisi ülesandeid täita.
On ka operatsioonisüsteemi aspekt. Versioon nimega Magic Pointer peaks jõudma Googlebooki, ettevõtte äsja välja kuulutatud Geminile keskenduvasse sülearvutite sarja. Kui see juurutus toimub nagu esitatud, liigub kontseptsioon edasi brauseri vahekaartidest laiemasse töölaua kogemusse.
Just siin näib see kasvavat millekski enamat kui kena demo. Külgpaneelid ja vestlusaknad paluvad kasutajatel endiselt lahkuda sellest tegevuste voost. AI-kursor teeb vastupidist. See hoiab abi manustatuna täpses kohas, kus küsimus ilmneb.
Arvutihiir ei ole viimase poole sajandi vältel sisuliselt muutunud. See ikka klõpsib, lohistab, valib ja osutab peaaegu samamoodi nagu alati. DeepMindi idee on kaasahaarav, sest see ei püüa seda tuttavat käitumist asendada. Sellele lisatakse arusaamine.
Kas sellest saab kaasaegse arvutikasutuse standardfunktsioon sõltub teostusest. Kontekstitundlik AI kõlab võimsalt, kuid see tekitab ka tuttavaid küsimusi täpsuse, privaatsuse ja selle kohta, kui palju kasutajad usaldavad süsteemi, mis pidevalt tõlgendab, mis ekraanil on. Igal juhul on suunda raske eirata. Kui vestlusrobotid olid generatiivse AI esimene suur liides, võib kursor olla järgmine, mis tõeliselt tundub arvuti loomuliku osana.
Jäta kommentaar