Vera: NVIDIA muudab andmekeskuste AI-arhitektuure nüüd

Vera: NVIDIA muudab andmekeskuste AI-arhitektuure nüüd

Laura Mägi Laura Mägi . Kommentaarid

3 Minutit

Andmekeskused ei muutu tavaliselt üleöö. Kui need siiski muutuvad, märkad suminat. Riiulid muutuvad tihedamaks. Latentsus langeb. Kulud ümber kujunevad. Nvidia panustab, et see sumin saab peagi uue nime: Vera.

Nvidia väidab, et Vera pakub umbes 1,8-kordset jõudlust juhtivate x86 kiipidega võrreldes. See väide on pealkiri. Riistvara taga olev lahendus alustab tegelikku arutelu. Vera on Vera Rubin platvormi CPU-pool, mis ühendab ARM-põhise protsessori Rubin GPU-ga töökoormuste jaoks, mis vajavad suurt mäluläbilaskevõimet ja tihedat CPU-GPU koordineerimist.

Miks Vera muudab AI-serverite mõtlemist

Vera on ehitatud 88 Olympus-südamiku ümber, millel on ruumiline mitmelõimelisus, pakkudes 176 lõime pistiku kohta. Mälu ei ole pärastmõte: ühe protsessoriga saab siduda kuni 1,5 terabaiti LPDDR5X-i, mis annab umbes 1,2 terabaiti sekundis läbilaskevõimet. AI-järelduste ja agentipõhiste mudelite puhul, mis tarbivad palju konteksti ja kaalusid, on see läbilaskevõime ellujäämise mõõdupuu.

Mõtle mastaabile. Nvidia tutvustas Vera CPU Racki, mis mahutab ühte šassiisse 256 protsessorit. See tähendab 22 528 südamikku ja 45 056 lõime. Selline tihedus on see, mida pilveteenuse pakkujad ihkavad, kui püütakse suuri mudeleid viia välja kallitest ainult GPU-põhistest saarestikest ja suunata neid paindlikumatesse, protsessorikesksetesse arhitektuuridesse.

Vera sobib hästi ka Rubin GPU-dega. NVL72 konfiguratsioon ühendab 36 Vera protsessorit 72 Rubin GPU-ga ning Nvidia rõhutab nendevahelist 1,8 terabaiti sekundis NVLink-C2C ühendust. Eesmärk ei ole GPU-de asendamine, vaid hosti ja kiirendi suhte ümbermõtestamine, nii et andmed liiguksid kiiremini ja tarkvara kohtaks vähem kitsaskohti.

Kasutusjuhtumid on tuttavad, kuid kasvavad: agentipõhine tehisintellekt, tugevdamisõpe, mahukad analüüsid ja suuremahuline järeldamine. Vera võib toimida iseseisva arvutusnode'ina nende tööde jaoks või hostina, mis hoiab Rubin GPU-sid toidetuna ja sünkroonis.

Kasutuselevõtt on juba alanud. Anthropic, OpenAI ja SpaceXAI on platvormile oma mudetöökoormuste jaoks pühendunud ning hüperskaalerid nagu ByteDance, CoreWeave ja Oracle Cloud Infrastructure on samuti liitunud. Süsteemide poolelt pakuvad Vera-põhiseid servereid Dell, HP, Lenovo ja Supermicro. Peamised tootjad nagu Asus, Compal, Foxconn, Gigabyte, Pegatron, Quanta Cloud Technology, Wistron ja Wiwynn valmistavad kiipi ümbritsevat riistvara.

Isegi mittetraditsioonilised kliendid pööravad tähelepanu. New Yorgi börs, mis töötleb umbes 1,1 triljonit sõnumit päevas, uurib Verat koos partneritega Redpanda ja HP, et mõtestada latentsusele tundlikku infrastruktuuri uuesti. Selline huvi näitab, et platvormi hinnatakse mitte ainult mudelite treenimiseks, vaid ka reaalajas suure läbilaskevõimega süsteemide jaoks, kus iga mikrosekund loeb.

Nvidiale laiendab Vera tuttavat strateegiat: rakendada GPU-esimestest AI-liidestest saadud õppetunnid protsessori disaini. Ettevõte on varem integreerinud oma AI-töid toodetesse nagu RTX Spark, mis tõi Grace CPU-d ja Blackwell GPU-d LPDDR5X-mäluga fookusesse. Nüüd on fookus nihkunud ühe sõlme GPU-jõudluselt süsteemi tasakaalule ja läbilaskevõimele.

Kas Vera tõrjub x86 välja andmekeskustes? Mitte üleöö. Kuid arhitektuur sihib konkreetseid probleeme AI-töökoormuste puhul: mäluläbilaskevõime, lõimede tihedus ja kiire CPU-GPU ühendus. Inseneride ja arhitektide jaoks, kes tegelevad mudelite kulude ja läbilaskevõime optimeerimisega, on see praktiline algus.

Allikas: gsmarena

"Tehnoloogia liigub kiiremini kui kunagi varem ja ma naudin selle jälgimist. Iga uus seade või rakendus jutustab loo inimlikust loovusest."

Jäta kommentaar

Kommentaarid