Nvidia RTX Spark: kohaliku AI superkiirus ja privaatsus

Nvidia RTX Spark: kohaliku AI superkiirus ja privaatsus

Kristel Õun Kristel Õun . Kommentaarid

4 Minutit

Kujutage ette: ütlete oma sülearvutile, mida soovite, ja see lihtsalt teeb seda. Ilma pilveteenuse, ilma ootamiseta. Ainult kohene kohalik tehisintellekt. Seda lubavad Nvidia ja Microsoft RTX Sparki, superkiibi, mille Nvidia avalikustas koos muudetud Windowsi strateegiaga.

Sisemus: kiip ehitatud nagu kompaktne andmekeskus

RTX Spark ei ole väike uuendus. See ühendab 3-nanomeetrise protsessi, Blackwell GPU, millel on 6 144 CUDA tuuma, ja umbes 20 Grace'ist pärit protsessorituuma üheks paketiks. MediaTek osales kiibi arenduses. Kaks domeeni, CPU ja GPU, suhtlevad kõrgekiiruselise NVLink-C2C ühenduse kaudu. Mälu on muljetavaldav: kuni 128 gigabaiti ühtset LPDDR5X-mälu ja AI tippvõimsus umbes üks petaflops. See võimaldab masinatel käitada 120-miljardiliste parameetritega keelemudeleid võrguühenduseta ning hoida kontekstiaknaid, mille ulatus on sadu tuhandeid kuni miljon tokenit.

Energiatarve sõltub töökoormusest. Kerge töö puhul joonistab see vähe energiat, rasketel AI-töökoormustel võib see tõusta kuni umbes 80 vatti. Nvidia plaanib tulevikus soodsamaid SKU-sid 16 gigabaidise ühtse mäluga. Kuna disain põhineb ARM-il, jooksevad vanemad x86 Windowsi rakendused Microsofti Prismi ühilduvuskihina. Nvidia rõhutab, et Spark on loodud Windowsi jaoks ning see ei ühendu eraldi GPU-ga lauaarvutikorpuses.

Kohalik tehisintellekt, mis on pakitud Windowsi turvameetmetesse

Suuremahuliste mudelite kohaliku käitamisega lahendatakse üks tundlik probleem: privaatsus. Kuid see tekitab ka uusi väljakutseid juurdepääsu ja andmelekkete osas. Microsoft on laiendanud Windowsi natiivsete turvakihte, konteineriseerimise ja täpsemate õiguste juhtimisega, et seadmele paigaldatud assistendid saaksid töötada liivakastis. Nvidia täiendab seda OpenShelliga, tööriistaga, mis lubab kasutajatel määrata, millistele süsteemi osadele assistent pääseb ligi, ning anonüümib isikuandmeid enne pilve edastamist.

Siin on ka äriline loogika: kohalik inferents väldib pidevaid pilvetasusid ja latentsusaega. Professionaalidele, kes töötlevad tundlikku meediat või omandikoodi, on see sama oluline kui puhas kiirus.

Adobe astus varakult mängu. Ettevõte üles ehitas Premiere'i ja Photoshopi, et natiivselt kasutada Sparki ühtset mälu ja Blackwell-tuumasid, väites kuni kaks korda suuremat kiirust AI-põhiste tööriistade, nagu Generative Fill, ja uute Premiere'i generatiivsete ajajoonte funktsioonide puhul. Teised rakendused, nagu Blender, DaVinci Resolve, CapCut, ComfyUI ja hulk audio-tööriistu, on lubanud natiivset tuge või optimeerimisplaane.

Mängimine oli loomulik test. Nvidia sõnul Spark'i GPU jõudlus asetseb sülearvuti tasemel, võrdne RTX 5070-ga, piisav paljudes kaasaegsetes mängudes saavutamaks 1440p ja üle 100 kaadri sekundis. See jõudlus töötab koos rasketega AI-töödega, mis ongi mõte: üks õhuke ja kerge seade, mis päeval on loovtööjaam ja õhtul kõrge värskenduskiirusega mängumasin.

Oli ka petmisvastane takistus. Ajalooliselt on Windows ARM-il võrgumängude puhul komistanud, sest petmisvastased süsteemid ei toetanud arhitektuuri. Nvidia ja Microsoft tegid koostööd tarnijatega nagu Easy Anti-Cheat, BattlEye ja Denuvo. Stuudiod nagu Riot ja Krafton valmistavad nüüd ette natiivseid ARM-väljaandeid suurtele pealkirjadele, sealhulgas League of Legends, Valorant ja PUBG.

Riistvarapartnerid asusid kiibi ümber disainima. Oodata on selle sügisel RTX Spark sülearvuteid firmadelt Asus, Dell, HP, Lenovo, MSI ja Microsoft, millele järgneb Acer ja Gigabyte. Vormitegurid kalduma õhukeste ja kergete poole: 14–16-tollised masinad, umbes 14 millimeetrit paksused, ligikaudu 1,3 kilogrammi, freespindalaga alumiiniumkorpused, pikk aku kestvus ja Tandem OLED-ekraanid G-SYNC-iga. Üle 30 sülearvuti disaini ja umbes 10 mini-PC-d on väidetavalt arendusjärgus. Nvidia avalikustas ka DGX Stationi Windowsi jaoks, lauaklassi Blackwell süsteemi ettevõtete arendajatele.

Mis siis muutub? Loojate jaoks tähendab see kiirust ja privaatsust. Arendajatele on see uus arvutuslik sihtmärk, mis ühendab raske AI- ja GPU-töö üheks ühtseks mäluruumiks. Mänguritele on see võimalus säilitada tipptasemel kaadrisagedusi, samal ajal kui seade kahekordistub AI-tööjaamana. Tööstusele on see uus tõuge muuta Windows ARM-il tavapäraseks platvormiks, mitte nišikatseks eksperimendiks.

Küsimused jäävad. Nvidia ei ole veel avaldanud ammendavaid jõudluse tabeleid ega hinnaandmeid. Algne laine kaldub premium-sülearvutite ja kompaktsete lauaarvutite poole, odavamad komponendid on oodata hiljem. Kuid üks selge järeldus on: Nvidia tahab, et PC ei oleks enam passiivne vahend, mis lihtsalt käitab teie rakendusi, vaid aktiivne partner, mis mõistab ja kiirendab tööd, mida te temalt palute.

Allikas: smarti

"Minu huvi tehnoloogia vastu algas lapsepõlvest. Tänapäeval püüan kirjutada nii, et ka keerulised teemad oleksid kõigile arusaadavad."

Jäta kommentaar

Kommentaarid