NVIDIA-ini Blackwell AI čipovi nove generacije suočavaju se s ozbiljnim problemima s pregrijavanjem kada su instalirani u police visokog kapaciteta.Ova su pitanja dovela do promjena dizajna i kašnjenja, te su izazvala zabrinutost među kupcima kao što su Google, Meta i Microsoft o pravodobnom raspoređivanju Blackwell poslužitelja.
Insajderi su otkrili da se Nvidia Blackwell GPU može pregrijavati ako se koristi u poslužiteljima sa 72 čips.Očekuje se da će ovi uređaji konzumirati do 120kW snage po stalku.Ova pitanja prisilila su NVIDIA da više puta procjenjuje svoj dizajn stalka poslužitelja, jer pregrijavanje može ograničiti performanse GPU -a i predstavljati rizik od oštećenja komponenti.Kupci su zabrinuti da ovi nedostaci mogu ometati njihov raspored za implementaciju novih čipova u podatkovnim centrima.
Prema izvješćima, Nvidia je uputila svoje dobavljače da naprave višestruke promjene dizajna u stalak za rješavanje problema pregrijavanja.Tvrtka usko surađuje sa svojim dobavljačima i partnerima na razvoju inženjerskih revizija kako bi poboljšala hlađenje poslužitelja.Iako su ta prilagođavanja uobičajena praksa za tako veliko izdanje tehnologije, oni i dalje dodaju kašnjenja i dodatno odgađaju očekivani datum isporuke.
Prema izvješću First Financial -a, kao odgovor na kašnjenja i pregrijavanje, glasnogovornik NVIDIA -e izjavio je: "Mi surađujemo s vodećim pružateljima usluga u oblaku kao bitan dio našeg inženjerskog tima i procesa. Inženjerijske iteracije su normalne i očekivane.GB200, najnapredniji sustav do danas, u različita okruženja podatkovnog centra zahtijeva zajednički dizajn s našim kupcima. "Nvidia je također izjavila da "kupci trenutno iskorištavaju tržišnu priliku za sustave GB200.
Prije toga, Nvidia je morala odgoditi proizvodnju Blackwella zbog oštećenja dizajna u prinosu čipa.NVIDIA-e Blackwell B100 i B200 GPUS koriste TSMC Conos-L tehnologiju pakiranja za povezivanje svoja dva čipa.Ovaj dizajn uključuje RDL intermedijarni sloj s mostom LSI (lokalni silikonski interkonekcija), podržavajući brzinu prijenosa podataka do 10TB/s.Precizno pozicioniranje ovih LSI mostova ključno je za tehnologiju koja djeluje kako se i očekivalo.Međutim, neusklađenost u karakteristikama toplinske ekspanzije između GPU čipova, LSI mostova, RDL -ovih međuslojnih i podloga matične ploče dovela je do propusta i neuspjeha u sustavu.Da bi se riješili ovo pitanje, NVIDIA je modificirala gornji metalni sloj i strukturu GPU silicija kako bi poboljšala pouzdanost proizvodnje.
Stoga će konačni revidirani Nvidia Blackwell GPU započeti masovnu proizvodnju tek krajem listopada, što znači da će NVIDIA ove čipove moći isporučiti od kraja siječnja sljedeće godine.
Nvidijini klijenti, uključujući tehnološke divove poput Googlea, Meta i Microsofta, koriste NVIDIA GPU -ove za osposobljavanje svojih najmoćnijih velikih jezičnih modela.Kašnjenje Blackwell AI GPU -a prirodno će utjecati na planove i proizvode NVIDIA -e.