8 Minutit
Ülevaade
Pilvehiiglased ostavad mälu nagu oleks see kuld. Hyperscalerite tellimused on paisunud nii suureks, et hinnad tõusevad ja tarneahelad pingestuvad.
Song Jai-hyuk, Samsungi Device Solutionsi üksuse tehnoloogiadirektor (CTO), tõi selle reaalsuse välja Semicon Korea konverentsil ja joonistas ette, mida ettevõte tulevikus näeb: kõrgjõudlusega mälu nõudlus jääb kõrgele tasemele mitte ainult selleks aastaks, vaid ka aastani 2027. Lühike lause. Suur tähendus.
Samsungi fookus ja HBM4
Samsungi vahetu tähelepanu on HBM4-il, järgmise põlvkonna kõrge ribalaiusega mälul (high-bandwidth memory), mis on mõeldud AI mudelite ja muude väga intensiivsete arvutuskoormuste nõudmiste rahuldamiseks. Pärast tugevat HBM3E müüki kolmandas ja neljandas kvartalis ütleb tootja, et liigub HBM4 massitarnete suunas esimesel kvartalil. Vastavalt CTO-le on esimesed ettevõtteklientidelt saadud HBM4 saadetised näidanud väga rahuldavat jõudlust.
HBM4 tähistab järgmise astme ribalaiuse ja tihendatud andmeedastuse arhitektuuri, mis on optimeeritud suure läbilaskevõimega serveritele ja andmekeskuste akseleratsioonikaartidele. Sellel on potentsiaal vähendada latentsust ja suurendada andmete paralleelsust, mis on eriti oluline massiivsete tehisintellekti mudelite treenimisel ja inferentsil.
Pakendamine, termika ja hübriidühendused
Ettevõte ei piirdu ainult suurema mahuga. Samsung liigutab edasi ka pakendamise ja termokeemia valdkondi. Üks tähelepanuväärne areng on hübriidne sidumine (hybrid bonding) HBM-kimpude puhul. Muutes väikeste kiipide (die) vahelisi sidumisviise, teatab Samsung ligikaudu 20% langusest termilises takistuses 12-kihiliste ja 16-kihiliste kimpude puhul ning umbes 11% langusest baas-kihi temperatuuris laborikatsetes. Kui kiibid töötavad jahedamalt, paranevad nii jõudlus kui usaldusväärsus.
Hübriidühenduse tehnoloogia võimaldab tihedamat elektrilist ja termilist kontakti kihtide vahel, mis omakorda parandab soojusjuhtivust ja vähendab kuumenemisest tingitud jõudluspiiranguid. See on kriitiline, kuna suurema ribalaiuse saavutamiseks on kombeks kuhjata mälukihte üksteise peale, mis ilma optimeerimata võib tekitada kuumuse kuhjumist.
zHBM: Z-telje ümbermõtestamine
Joonisel on ka teine idee nimega zHBM, mis paigutab mälukihid ümber Z-telje suunas. Kontseptsioon on julge: potentsiaal kuni neljakordseks ribalaiuseks, samal ajal vähendades energiakulu umbes neljandiku võrra. See on arhitektuurne muutus, mis võib oluliselt muuta andmekeskuste lähenemist läbilaskevõime ja energiabilansi optimeerimisele.
zHBM-i idee tugineb sellele, et kihtide vahelised ühendused ja andmete teekond optimeeritakse selliselt, et terve puudutuskohapind muutub efektiivsemaks. See võib vähendada pikamaa liinide ja sildade arvu, mis omakorda vähendab takistust ja energiakadusid. Teoreetiliselt tähendaks see, et andmekeskused saaksid saavutada suurema läbilaskevõime väiksema võimsuskuluga — just see, mida hüperscalerid otsivad.
Võimalikud arhitektuursed eelised
- Suurem ribalaius võrreldes traditsioonilise HBM-kihisti struktuuriga.
- Madalamad pingekad energiakadud ja seetõttu parem joule-per-op (J/op) suhe.
- Parem soojusjuhtivus lubades tihedamaid paigutusi ilma täiendava jahutuseta.
Töötlemine mälus (PIM) ja integreeritud lahendused
Töötlemise viimine mälusse (processing-in-memory, PIM) on samuti osa lugu. Samsung on katsetanud kohandatud HBM-väljaandeid, mis koondavad arvutusüksuseid mälukimpude sisemusse. Selle lähenduse eesmärk on vähendada andmeedastuse mahtu protsessori ja mälu vahel, tuues töötluslähedase arvutuse otse sinna, kus andmed asuvad.
Samsungi sõnul andis selline tihe integratsioon ligikaudu 2,8x jõudluse tõusu ilma võimsuse efektiivsuse ohverdamiseta. Üheks tõestuseks testiti HBM-PIM lahendust kohandatud AMD Instinct MI100 konfiguratsioonis, mis näitas, kuidas mäluga integreeritud loogika võib kiirendada konkreetseid töökoormusi — eelkõige need, kus suur osa arvutusest on mälust andmete edastamise takerdumise taga.
PIM-i praktilised mõjuvaldkonnad
- Andmete eelprotsessimine ja filtreerimine enne nende saatmist põhiprotsessorile.
- Massiivsed vektor- ja maatriksoperatsioonid, mis on levinud masinõppes ja inferentsis.
- Reaalajas analüüs ja edge-juhtumid, kus latentsus ja andmeülekanne on kriitilised.
Turumõjud ja tarneahel
Hyperscalerite suurenenud nõudlus on juba tekitanud mõningaid turumõjusid: hinnad kerkivad ja tarneahelad püüavad tempo hoida. Kui mõned pilveettevõtted broneerivad suuremahulisi varusid ette, võib see lühiajaliselt pingestada olemasolevat varu ning viia hindade tõusuni, kuna tootjad hakkavad prioriseerima suuri ärikliente.
Samal ajal suunab see tootjaid kiirendama R&D-d ja investeeringuid tootmisvõimendusse, et rahuldada jätkuvat nõudlust. See tähendab, et ettevõtted, kes suudavad esimesena ulatuslikult HBM4 ja teisi täiustusi tarnida, saavad turupositsiooni tugevdada — nii tehnilise prestiiži kui ka finantsturu vaates.
Riskid ja kitsaskohtade haldamine
- Tehniline risk: laborikatsete ja esialgsete proovide ning massitootmise vahel on sageli mõõtme-, usaldusväärsuse- ja saagise probleeme.
- Tarnimise risk: kiire nõudluse korrelatsioon piiratud tootmisvõimsusega võib viia ebaühtlase tarnimisplaanini ja hinnakõikumisteni.
- Standardiseerimise küsimus: kui iga tootja liigub oma lähenduste ja laiendustega (näiteks zHBM või erinevad PIM-implementatsioonid), võib see ajutiselt segadust lisada tööstuse standardite ja ühilduvuse osas.
Millal jõuavad uued tehnoloogiad laiemalt turule?
Hübriidühendusega või zHBM-toodete väljaandmise täpsed kuupäevad on siiani ebamäärased. Just seda osa on vaja jälgida: kas need tehnoloogiad liiguvad laborist serveririiulitele sellisel kiirusel, nagu nõudlus seda nõuab. Järgnev aasta ütleb, millised uuendused skaleeruvad ja millised jäävad eksperimentaalseks.
Massitarneteks vajalikud künnised hõlmavad kõrget saagist, komponentide kvaliteeti, jahutuslahenduste kohandamist ja tarkvara/hõlmava platvormi tugi — nimelt, tarkvara peab olema suunatud uute mälulähedaste arhitektuuride kasutamiseks, et tegelik jõudluskasv realiseeruks.
Tehniline sügavus: mida HBM4, hübriidühendus ja zHBM tegelikult tähendavad
HBM4 on järgmine evolutsiooniastme samm pärast HBM3E, eesmärgiga pakkuda suuremat andmeedastuskiirust riba per pin ning tihedamat integreerimist akastide (stack) vahel. Põhimõtteliselt tähendab see rohkem bitti paralleelselt edastatuna ja lühemaid ning kiiremalt korduvaid andmevahetusi, mis on õige keskkonna korral kriitiline eriti sügavate närvivõrkude õppimisel ja massandmete töötlemisel.
Hübriidühendus (hybrid bonding) võimaldab suuremat IO tihedust ja madalamat elektrilist ning termilist takistust kihtide vahel. See on oluline samm edasi võrreldes traditsiooniliste TSV (through-silicon via) ja teiste mehaaniliste ühendustega, sest see vähendab signaali ja soojust piiravaid elemente, võimaldades efektiivsemat soojuse hajutust ja parem jõudlust pikaajalistes intensiivsetes töökoormustes.
zHBM arhitektuuride puhul tuleks arvestada nii disaini keerukust kui ka tootmistehnoloogiat: kihistuse ümberpaigutamine Z-telje suunas võib nõuda uut tüüpi mõõtmeid, täpsemat balansseerimist signaalide pidevuse ja ajastuse osas ning spetsiifilisi tihendus- ja jahutustehnikaid, et realiseerida lubatud jõudlus- ja energiasäästu kasud.
Konkurents ja tööstuse maastik
Samsungi saavutus ja avaldused panevad surve alla teisi suurtootjaid, sealhulgas SK hynix ja Micron, mis samuti investeerivad HBM-i ja seotud tehnoloogiate arendamisse. Konkurents toob kaasa kiiremalt areneva innovatsiooni, kuid võib ka põhjustada fragmentatsiooni, kui iga tootja hakkab edendama oma variatsioone standardsete lahenduste asemel.
Andmekeskuste ja hüperscalerite perspektiivist on oluline, et olemas oleks selge teekaart (roadmap) ja ühilduvuskiht, mis lubaks integreerida uusi HBM-lahendusi ilma suurema infrastruktuuri ümberkujunduseta. Selle tagamiseks teevad mitmed suuremad kliendid koostööd tootjatega varajases staadiumis, katsetades eritellimusi ja kohandusi, mis vastavad nende spetsiifilistele töökoormustele.
Võtmetähtsusega punktid ja järeldus
Lühidalt: hyperscalerid põhjustavad enneolematut nõudlust HBM-i järele ja Samsung vastab HBM4, hübriidühenduse, zHBM-i ja PIM-iga — igaüks neist suunatud ribalaiuse tõstmisele ning soojus- ja energiaprobleemide vähendamisele.
Väljalaskekuupäevad hübriidühendusega või zHBM-toodetele jäävad ebamääraseks. See on see osa lugu, mida tuleks jälgida: kas need tehnoloogiad liiguvad laboripinkidelt serveririiulitele sellisel kiirusel, nagu nõudlus seda nõuab. Järgnev aasta näitab, millised uuendused skaleeruvad ja millised jäävad eksperimentaalseks.
Kõigile nendele arengutele vaatamata näib, et mälu turg on valmis pikema sprinti jaoks. Küsimus on: kes suudab tempoga kaasas käia ja kes jääb maha? See hõlmab mitte ainult tehnilist võimekust, vaid ka tarnevõimet, tarkvara ökosüsteemi ja partnerlussuhteid suurklientidega.
Peamised tegevused, mida jälgida järgmise 12–18 kuu jooksul
- Tootjate ametlikud massitarnete kuupäevad HBM4 jaoks.
- Laboritestide tulemused hübriidühenduse ja zHBM-i osas ning sõltumatud jõudlustestid.
- PIM-i integreerimise kasv ja tarkvaratööriistade tugi mälupõhiste operatsioonide optimeerimiseks.
- Andmekeskuste jahutus- ja energiavõimekuse kohandused, et toetada tihedamaid HBM-konfiguratsioone.

Kas see kõik juhtub kiiresti? Mõned osad võivad jõuda tööstusnormi üsna kiiresti, eriti kui HBM4 massitooted osutuvad stabiilseteks ja kulutõhusateks. Teised, nagu zHBM või laialdane PIM-i vastuvõtt, võivad võta rohkem aega, kuna need nõuavad arhitektuurseid, tootmis- ja tarkvaralisi kohandusi. Küll aga on selge, et nõudlus suure ribalaiusega mälu järgi ei kustu: hüperscalerite ostuhuvi sunnib kogu ökosüsteemi liikuma kiiremini.
Kui vaatame ette, jääb küsimus: kes suudab kõige paremini ühendada tootmismõõtme, tehnilise innovatsiooni ja kliendi- ning tarkvaratoe, et pakkuda järgmise põlvkonna HBM-lahendusi laialdaselt ja usaldusväärselt? Vastus sellele määrab osaliselt ka andmekeskuste ja AI-infrastruktuuri arengu suuna lähiaastatel.
Allikas: gsmarena
Jäta kommentaar