Nadšený šéf Nvidie podepsal AI servery nové generace, které se budou vyrábět v Česku. Složí se za pět minut

Dnes
Doba čtení: 6 minut

Sdílet

Paměťová krize jen tak neskončí. Generace Nvidia Vera Rubin bude opět obsahovat hromadu HBM, ale to výroby se zapojí i Česko. Podívejte se, jak tyto servery vypadají. Uvnitř: GALERIE.

Nvidia by koncem letošního roku měla začít prvním zákazníkům dodávat novou generaci svých grafických karet, procesorů a serverů určených pro chod umělé inteligence typu OpenAI nebo Anthropic. Půjde o produkty označené jako Vera Rubin, které naváží na aktuální Blackwell. Partneři Nvidie už pomalu startují produkci. Jeden z nich se chystá vyrábět také v České republice. Tchajwanská společnost Foxconn má rozjet výrobu serverů a celých rozvaděčů (racků) v závodech v Pardubicích a Kutné Hoře.

Servery pro umělou inteligenci z Česka budou odebírat dva zákazníci. V Kutné Hoře už několik let vyrábí takzvané superpočítače chlazené kapalinou americký podnik Hewlett Packard Enterprise (HPE). Ten má i díky současnému AI boomu obří poptávku, takže chystá expanzi. Součástí kutnohorské výroby je testovací datacentrum, protože se složené clustery před odesláním musí zkoušet. Datacentrum má nyní kapacitu 10 MW, což nestačí, takže se rozroste na 35 MW.

Továrna Foxconnu v Pardubicích bude ve výrobě AI serverů nováčkem. V tamních halách aktuálně vznikají hlavně síťové prvky pro Cisco, počítače pro HP, výrobky Broadcomu nebo úložná zařízení pro Everpure (Pure Storage). V dohledné budoucnosti by se měla přidat francouzská společnost Bull.

Bull jako evropská naděje

Bull je legendární výrobce superpočítačů, který byl nějakou dobu součástí kolosu Atos/Eviden. Francouzská vláda nedávno Bull koupila, protože je součástí tamního jaderného programu (náročné výpočty se dělají na superstrojích) a zároveň představuje cenné a v podstatě jediné evropské aktivum ve výrobě serverů pro AI. Atos a Eviden jsou dlouhodobě v problémech a nekončících restrukturalizacích a hrozilo, že Bull skončí v rukách zahraničního kupce.

Bull se nyní připravuje na větší expanzi v AI serverech a byznysu s umělou inteligencí obecně. Součástí těchto snah je i akvizice pražské firmy DataSentics zaměřené na práci s daty. Jde už o druhou důležitou stopu ve strukturách Bullu. Druhou je dlouhodobě operující pražský superpočítačový tým, který pracuje na mezinárodních zakázkách společnosti.

Podívejte se, co asi budí šéfa Nvidie ze spaní. Google nabízí hyperpočítače s miliony vlastních AI čipů Přečtěte si také:

Podívejte se, co asi budí šéfa Nvidie ze spaní. Google nabízí hyperpočítače s miliony vlastních AI čipů

Bull se v rámci expanze chystá vyrábět AI servery právě ve Foxconnu v Pardubicích, další část bude řešit doma ve Francii. V Pardubicích je nyní k dispozici prázdná hala, kde měla Lupa možnost nahlédnout na ukázkové servery a rack zmíněné nové generace Nvidia Vera Rubin.

Příchod Bullu je mimochodem další ukázkou toho, že Česko má slušnou pozici ve výrobě technologií pro AI. Vedle Foxconnu (HPE a Bull) u nás servery pro Metu, Microsoft či Amazon produkují další tchajwanské firmy Wistron a Inventec. Onsemi, které má výrobu čipů v Rožnově pod Radhoštěm, zase získalo zakázku od Nvidie na dodávku napájecích čipů do datacenter pro Veru Rubin.

Samotný Foxconn je druhým největším exportérem v Česku. Operuje u nás 26 let, zaměstnává kolem 4,5 tisíce lidí, financuje laboratoře na školách a kromě výroby zde má také softwarový vývoj. Foxconn také chystá nový rozsáhlý komplex v Polsku, který se rovněž zaměří na AI servery a technologie.

Foxconn Nvidia Vera Rubin NVL72

Vera Rubin se opět bude kromě jiného dodávat v rozvaděčích NVL72, což jsou serverové racky vycházející ze standardizovaného návrhu Nvidie. Každý výrobce si dělá vlastní úpravy a verze a výjimkou není ani Foxconn, respektive Bull.

NVL72, který si můžete prohlédnout v naší galerii, zvládne pojmout až 220 kW na rack. Součástí rozvaděče je 18 serverů. Každý z nich obsahuje čtyři grafické karty Rubin a dva procesory Vera. Celkově jde o 72 grafických karet a 36 procesorů.

Jedna GPU má k dispozici 288 GB paměti HBM4  s šířkou pásma až 22 TB/s, na rack to dělá 20,7 TB. GPU se vyrábí 3nm procesem TSMC (N3P) a obsahuje 336 miliard tranzistorů (Blackwell má 208 miliard). NVLink zvládne oběma směry 3,6 TB/s na jedno GPU.

Vera CPU využije 88 jader ARM s označením Olympus, k dispozici bude takzvaný Spatial Multithreading se 176 vlákny. L2 cache bude mít dva MB na jádro, sdílená L3 cache dosáhne na 164 MB. Podpora pamětí bude LPDDR5X s propustností 1,2 TB/s. Do jednoho racku NVL72 se vejde 54 TB RAM. Integrován bude NVLink chip-to-chip s propustností 1,8 TB/s, což umožní rychlou komunikaci mezi CPU a GPU bez úzkého hrdla v podobě PCIe.

Nvidia v rámci nadcházející generace poprvé začlení technologii LPU od v podstatě koupené firmy Groq. Tyto čipy pro inferenci pracují s ultrarychlou pamětí SRAM, která má propustnost 150 TB/s, což je oproti HBM4 několikanásobek. Nevýhodou je objem, na čip půjde dát 500 MB SRAM a do jednoho racku se vejde 256 čipů s celkově 128 GB SRAM. Nvidia tuto technologii pozicuje na inferenci tam, kde jsou nutné co nejrychlejší výsledky a pro ty, kdo jsou ochotní za to zaplatit. Groq je jeden z více hráčů v SRAM, nedávno na burzu vstoupil Cerebras, který má čipy o velikosti waferu, ukázali jsme je zde.

Součástí galerii je pohled také na samotné servery. Nvidia zde s partnery jako Foxconn udělala velké pokroky v konstrukci. Servery Vera Rubin jsou modulární, bezkabelový a lze je velice rychle skládat. Technici Foxconnu Lupě řekli, že jeden server lze dát dohromady za pět minut, u Blackwellu jsou to dvě hodiny. Proces je automatizovaný. Šéf Nvidie Jensen Huang byl z Foxconnu nadšený, proto na ukázkový server hodil svůj pochvalný vzkaz s podpisem.

Vera Rubin je zároveň první generace, kterou už nepůjde chladit vzduchem, ale pouze kapalinou. Rack se konkrétně chladí na 45 stupňů Celsia.

Design přiloženého racku a serveru se ještě může mírně upravovat než se nastartuje finální produkce. Vera Rubin zároveň nebude levnou záležitostí. Zatímco rack NVL72 lze v případě současného Blackwellu koupit  za až čtyři miliony dolarů, nadcházející generace vyjde na pět až sedm milionů dolarů. Nvidia dodává, že cena na generování tokenů klesne až desetkrát, ale uvidíme v praxi.

Podívat se můžete také na samotnou desku Vera Rubin, takzvaný superčip osazený zmíněnými technologiemi. Jde o vzorek, který Lupa vyfotila na konferenci Google Cloud Next 2026 v Las Vegas. Právě firmy jako Google budou mezi prvními odběrateli.

CIF26

Foxconn Nvidia HGX Rubin NVL8

Pardubický Foxconn rovněž ukázal server Nvidia HGX Rubin NVL8, což je kapalinou chlazený 2RU systém. Obsahuje osm grafických karet Rubin, dva procesory Intel Xeon 6 (Granite Rapids), 32 modulů DDR5 s osmi kanály na CPU, osm slotů pro disky E1.S NVMe, dva sloty pro disky M.2 NVMe a nabízí podporu dvou jednotek BlueField-3 DPU pro offload určitých operací. Server je rovněž k prohlédnutí v naší galerii.

Foxconn Nvidia MGX 4U System

Foxconn vyrábí i aktuální generaci serverů Nvidia. V galerii se lze podívat na model Nvidia MGX s osmi grafickami RTX Pro 6000 Blackwell, dvěma procesory Intel Xeon 6, 32 sloty pro DDR5, šestnácti sloty pro E1.S NVMe a dvěma pro M.2 NVMe. Tato generace je ještě chlazená vzduchem.

  • Chcete mít Lupu bez bannerů?
  • Chcete dostávat speciální týdenní newsletter o zákulisí českého internetu?
  • Chcete mít k dispozici strojové přepisy podcastů?
  • Chcete získat slevu 1 000 Kč na jednu z našich konferencí?

Staňte se naším podporovatelem

Autor článku

Dlouholetý technologický novinář, kmenový redaktor portálu Lupa.cz. Kromě Lupy publikuje i na webu E15 a v zahraničních médiích.



Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).