Gemma 4: Androidi kohaliku AI uus, kiirem ja säästlik

Gemma 4: Androidi kohaliku AI uus, kiirem ja säästlik

Rasmus Kask Rasmus Kask . Kommentaarid

3 Minutit

Mitme aasta vältel on telefonide tehisintellekt kandnud teatud maski. Sa küsid, see vastab, aga kusagil protsessi keskel liigub su andmeedastus kaugserverisse, seal töödeldakse ja saadakse tagasi sinu seadmesse. See peidetud kõrvaltee on alati olnud hinnaks. Google tahab nüüd ühendust katkestada ning Gemma 4 on selgeim märk sellest, et Androidi seadmetel töötav tehisintellekt muutub tõsiseks.

Google DeepMind tutvustas eelmisel nädalal Gemma 4 koos Armiga, selge eesmärgiga: lasta arenenud tehisintellektil töötada otse Arm-põhistes Android-telefonides, mitte toetuda pilvele. Google'i sõnul on uus mudelite perekond kuni neli korda kiirem kui varasemad versioonid ning võib kasutada kuni 60% vähem akut. Väikesed E2B ja E4B variandid on loodud telefoni kasutust silmas pidades ning suudavad käsitleda teksti, pilte ja heli ilma päringuta interneti kaudu.

Miks Arm siin oluline on

Sel hüppe taga töötab vaikne mootor: Armi SME2 käsukomplekt, mis on osa uuematest Armv9 kiibidest. Lihtsustatult kiirendab see maatriksarvutusi, millest tänapäevane tehisintellekt sõltub. Arm väidab, et varajased inseneritestid näitasid keskmiselt 5,5-kordset paranemist kasutaja sisendi töötlemisel ning vastuse genereerimine oli Gemma 4 E2B mudelil kuni 1,6 korda kiiremini. Huvitav osa? Arendajad ei pea oma rakendusi ümber kirjutama, et kasu saada. Armi KleidiAI tarkvarakiht ühildub Google'i olemasolevate käitusteekidega, nii et paranemine saabub vähese hõõrdumisega.

Seda tüüpi nähtamatu uuendus võib viia seadmes töötava tehisintellekti demo tasandilt igapäevaseks kasutuseks. Kiirem. Kergem. Vähem sõltuv andmesidest. Need on kolm asja, mida mobiilne tehisintellekt on algusest peale ajanud.

Kõige selgem näide tuleb Envisionist, ligipääsetavusrakendusest pimedatele ja vaegnägijatele. Seni sõltus stseenide mõistmine sageli pilveühendusest. Prototüübis, kus Gemma 4 töötas kohapeal Arm CPU-del, võis kasutaja teha foto ja saada stseeni üksikasjaliku kirjelduse koheselt ilma võrguta. Sellise rakenduse puhul ei ole võrguvaba tugi lisafunktsioon, see on peamine omadus.

Google valmistab ka ette järgmist sammu. Gemma 4 on aluseks Gemini Nano 4-le, tulevale Androidi seadmes töötavale mudelile. See tähendab, et arendajad, kes loovad tänapäeval Gemma 4-ga, peaksid saama Gemini Nano 4 ühilduvuse, kui see sel aastal lipulaevadele jõuab. Gemini Nano annab juba kohalikke funktsioone nagu nutikad vastused ja heli kokkuvõtted ning kiibitootjad nagu MediaTek on sama suuna poole tugevalt liikunud. Gemma 4 toob valikusse veelgi, lisades multimodaalse toe ja sisseehitatud agentseid võimeid.

Arendajatele on juurdepääs juba avatud. E2B ja E4B mudelid on Google AI Edge Gallery kaudu saadaval Androidis ja iOS-is Apache 2.0 litsentsi all. See on oluline, sest võitlus kasuliku, privaatse ja väikese latentsusega tehisintellekti eest ei toimu enam ainult pilves. See liigub sinu käes olevasse telefoni.

"Ma kirjutan tehnikauudiseid, sest usun, et innovatsioon algab teadmiste jagamisest. Hea artikkel võib panna kedagi teist midagi uut looma."

Jäta kommentaar

Kommentaarid