5 Minutit
ByteDance, TikToki omanik Hiinast, valmistub väidetavalt suuremaks NVIDIA tehisintellekti protsessorite ostuks, kui ettevõte kiirendab oma tegevust generatiivse tehisintellekti valdkonnas. Ettevõtte plaan on kulutada umbes 100 miljardit jüaani (ligikaudu 14 miljardit dollarit) NVIDIA H200 graafikaprotsessoritele (GPU-dele) 2026. aastal, mis täiendaks juba märkimisväärset NVIDIA riistvara varu. See samm peegeldab ByteDance’i ambitsiooni suurendada nii mudelite treenimise kui ka operatiivse teeninduse mahte ja kiirust ning tugevdada positsiooni generatiivse AI arendamisel ja tootmises.
Miks NVIDIA GPU-d on endiselt olulised
Pinnapeal võib see liigutus tunduda vastuoluline: ByteDance arendab oma riistvara lahendusi koostöös partneritega nagu Broadcom ja TSMC, samal ajal kui ta jätkab masstoodanguna välismaiste GPU-de ostmist. Tähtis on mõista, kuidas erinevaid kiipe kasutatakse ja milliseid töökoormusi need toetavad. NVIDIA H200 ja sellega sarnased tipptasemel GPU-d on optimeeritud raskete treeningutöökoormuste jaoks, mis on vajalikud suurte algmudelite (foundation models) loomisel ja täiustamisel. Need GPU-d pakuvad suurt aritmeetilist läbilaset, spetsialiseeritud tensorituumasid, laia mälu ribalaiust ning arenenud interconnect-lahendusi (nt NVLink ja kõrge ribalaiusega asünkroonne side), mis lubavad horisontaalset ja vertikaalset mudeliparalleelsust, sh 8-bitiste ja hübriidarvutuste (FP8, BFLOAT16 jms) optimeerimist.
Võrreldes sellega on kodumaised kiibid, mille kallal ByteDance töötab, sageli kohandatud inference- ehk teenindusfaasi jaoks. Inference tähendab juba treenitud mudelite käitamist suurtes tootmiskeskkondades — näiteks TikToki sisu soovitusmootorites, reklaamijaotuses ja sisumooderaatorites. Selliste kiipide disain keskendub energiakasutuse optimeerimisele, väiksemale viivitusele (latentsusele), tihedale integreerimisele serverite ja edge-seadmetega ning kuluefektiivsusele massilises reaalajas teeninduses. Seetõttu on loogiline ja praktiline strateegia siduda ülipotentsiaalsed treeningu-GPU-d kodumaiste inference-kiipidega: hübriidlahendus, mis tasakaalustab kulud, jõudluse ja tehnilise kontrolli.
Isegi kui ambitsioonikad kohaliku disaini kiibid peaksid turule jõudma 2026. aastal, ei asenda need tõenäoliselt kohe GPU-de rolli suurte mudelite treenimisel. GPU-de ekosüsteem — tarkvara optimeerimised, raamistike (PyTorch, TensorFlow) toetus, riistvara-spetsiifilised bibliotekid (CUDA, cuDNN, NCCL) ja skaleeritavad andmekeskuse lahendused — on aastate jooksul välja arendatud, mis annab NVIDIA lahendustele märkimisväärse eelise treeningtöökoormuste efektiivsuses. Samuti on olemasolevad andmekogud, treeningprotsessid ja parameetrid hästikohandatud GPU-arhitektuuridele, mis vähendab treeningtsüklite aega ja kulusid.
ByteDance on näidanud, et on valmis välistesse riistvaralahendustesse suurt investeerima. 2025. aastal investeeriti ettevõtte poolt aruannete kohaselt umbes 85 miljardit jüaani NVIDIA kiipidesse. See on osa suuremast strateegiast: kui ettevõtte turuväärtus on ligikaudu 500 miljardit dollarit ja üks peamisi tooteid, TikTok, toimib tõeliselt massiivse inference-mootorina — rikastades kasutajakogemust isikupärastatud soovituste, reklaamide ja sisu moderatsiooni kaudu — vajab ByteDance nii treenimis- kui ka reaalse aja teenindusvõimekust suures mahus. See tähendab mitte lihtsalt riistvara omamist, vaid ka laiahaardelist infrastruktuuri, tarkvara optimeerimist, töökoormuste orkestreerimist ja andmekeskuse arhitektuuri planeerimist.
Poliitika, ekspordi reeglid ja pragmaatilised lahendused
See suurmahuline ostuprogramm järgneb ka muutusele USA poliitikas: Washington lubas hiljuti NVIDIA H200 protsessorite (põhinedes vanemal Hopper arhitektuuril) müüki Hiinasse. Selline otsus avas ukse tehingutele, mis olid varem laiemate ekspordikontrollide raames piiratud. Sellised poliitilised ja regulatiivsed nihked mõjutavad otseselt tehnoloogiate liikumist rahvusvahelistel turgudel ning sunnivad ettevõtteid, nagu ByteDance, kiiresti kohanema muutuva teguriga: mitme hankeallika haldamine, hankelepingute järelevalve ja hulgimüügilepingu läbirääkimised uues õigusruumis.
Samal ajal on Pekingi poolne lähenemine pigem ettevaatlik. Hiina valitsus on pidanud läbirääkimisi kohalike tehnoloogiaettevõtetega, et hinnata vajadusi ja strateegilisi prioriteete, ning on tugevalt rõhutanud andmekeskuse tehnoloogia isemajandamise ja kohaliku taristu tootmise arendamist. See poliitiline surve toetab kohalikke disainialgatusi ja tootmisvõimekuse kasvatamist ning soodustab koostööd kohalike TSMC-sarnaste ja Broadcom-i tüüpi partneritega. Samas tähendab see ka seda, et ettevõtted nagu ByteDance peavad navigeerima keerukate geopoliitiliste suhete, ekspordikeeldude ja tehnoloogiatõkete keskel, otsides samal ajal parimaid tehnilisi ja ärilisi lahendusi.
ByteDance on juba astunud samme geopoliitiliste riskide leevendamiseks. Ligikaudu aasta tagasi alustas ettevõte pilveressursside rentimist väljaspool Hiinat — see on tööriist, mis võimaldab hoida teenuseid ja mudelite arendamist liikumas ka sanktsioonide või ekspordipiirangute tingimustes. Selline geograafiline hajutamine (multi-region cloud deployment) aitab vältida toimingute täielikku halvatust, võimaldab ligipääsu erinevatele riistvara variantidele ja annab parema paindlikkuse andmetöötluse ning mudelite treenimise koordineerimiseks rahvusvaheliste partneritega. Lisaks on mitmekesised tarnijad ja alternatiivsed hanketingimused olulised strateegiad liikumapanevaks jõuks riistvara kättesaadavuse tagamisel.
Lõppkokkuvõttes on ByteDance’i suuremahuline NVIDIA ost praktiline vastus kiireloomulisele tehnilisele vajadusele: massiivne, kuluefektiivne GPU-maht treenimiseks ja mudelite iteratiivseks arendamiseks. See võimaldab ettevõttel säilitada konkurentsivõime generatiivse AI arengus, kus mudelite korduv treenimine, hüperparameetrite otsingud ja A/B-testid nõuavad suurt paralleelset loendusvõimsust. Samal ajal ehitab ettevõte välja kodumaist inference-riistvara ning navigeerib keeruka regulatiivse maastikuga — strateegia, mis püüab ühendada kaupmeistrid, riskijuhtimise ning tehnilise innovatsiooni.
Sellel tasakaalustatud lähenemisel on laiemad tagajärjed nii tehnoloogiaökosüsteemile kui ka rahvusvahelisele konkurentsile andmekeskuse riistvara ja tehisintellekti platvormide valdkonnas. Suured ostud nagu see mõjutavad tarneahelaid, hinnastruktuure ja uuenduskiirust: nad annavad signaali nii tarnijatele kui ka konkurentidele, et nõudlus kõrgjõudlusega treening-GPU-de järele jääb tugevaks. Samuti suurendab see survet kodumaiste lahenduste arendajatele — et pakkuda konkurentsivõimelisi alternatiive treeningmahule tulevikus. Kokkuvõttes näitab ByteDance’i tegevus, kuidas globaalsed tehnoloogiaettevõtted üritavad leida tasakaalu sõltuvuse vähendamise, kulutõhususe ja tipptasemel jõudluse vahel muutuvas geopoliitilises kontekstis.
Allikas: smarti
Jäta kommentaar