NVIDIA GTC 2025: Reálná AI, reálné problémy, reálná řešení
Letošní ročník NVIDIA GTC byl s ohledem na rychlý vývoj v oblasti AI, na rostoucí konkurenci i klíčovou roli, kterou v tomto segmentu NVIDIA hraje, netrpělivě očekáván. Novinek přímo od společnosti NVIDIA nebo jejích technologických partnerů, bylo opět představeno obrovské množství, alespoň ty nejdůležitější se vám nyní pokusíme představit.
Nejdůležitější novinky a vize společnosti jako obvykle představil během své key note zakladatel a generální ředitel společnosti NVIDIA Jensen Huang. O čem se tedy v jejím průběhu hovořilo?
Huang zahájil konferenci prohlášením, že AI se nachází v „bodě zlomu“ a že poptávka po GPU neustále stoupá. Předpověděl, že příjmy společnosti NVIDIA z datové infrastruktury by do roku 2028 mohly dosáhnout bilionu dolarů. Tento odhad je podpořen také rostoucím zaváděním AI v různých odvětvích a zvyšující se složitostí modelů AI, které vyžadují stále výkonnější infrastrukturu. Představil také koncept „továren na umělou inteligenci“ (AI factories) a zdůraznil potřebu extrémního výpočetního výkonu a efektivity pro inferenci AI.
Podle jeho slov se AI zároveň posouvá směrem k uvažování a agentní AI, což vyžaduje podstatně více výpočetních zdrojů. Huang rovněž oznámil roční cyklus pro vývoj AI infrastruktury, na jehož základě budou každoročně představovány nové GPU, CPU a pokroky v akceleraci výpočtů. Zdůraznil také, že fyzická AI pro průmyslové a robotické aplikace představuje příležitost v hodnotě 50 bilionů dolarů.
Nástup nové generace hardwaru
Blackwell Ultra
Nejnovější generaci grafické architektury pojmenovala NVIDIA jako Blackwell Ultra a prozradila, že na trh by se měla dostat ve druhé polovině roku 2025. V porovnání s předchozí generací (Hopper) má novinka nabízet až 11× vyšší výkon AI pro inferenci a 4× rychlejší trénování. Architektura je navržena pro škálování inferencí v době testování a pro akceleraci aplikací využívajících AI pro uvažování, agentní AI i fyzickou AI.
Systém GB300 NVL72 bude obsahovat 72 GPU Blackwell Ultra, 36 CPU Grace a 288 GB paměti HBM3e. Podle tvrzení společnosti NVIDIA dosahuje toto řešení výkonu 15 PFLOPS v operacích FP4 a přinese 1,5× vyšší výkon než předchozí model B200.
Vera Rubin
NVIDIA dále představila architekturu Rubin Ultra, která má nabídnout zvýšenou šířku pásma a rychlost a koncem roku 2026 nahradí generaci Blackwell Ultra.
Architekturu Rubin při uvedení na trh doplní vylepšené procesory „Vera“. První systém Vera Rubin NVL144 má slibovat 3,3× vyšší výkon než systém GB300. Pro rok 2027 je plánován Rubin Ultra NVL576, který má nabídnout až 14× vyšší výkon než GB300.
Rubin má obsahovat dvojici výpočetních jader vyrobených 3nm procesem TSMC s výkonem 50 PFLOPS v operacích FP4 a 288 GB paměti HBM4. CPU Vera bude vybavena 88 zakázkovými ARM jádry a NVLink konektivitou. Rubin Ultra je navržen tak, aby do jednoho racku s příkonem 600 kW vměstnal 576 GPU jader. V roce 2027 by měla dorazit také vylepšená generace Rubin Ultra s pamětí HDM4e.
Někdy v roce 2028 by pak měla následovat generace Feynman s pamětí HBM5.
Systémy DGX
Společnost NVIDIA představila také „osobní desktopové AI superpočítače“ DGX Spark a DGX Station založené na platformě Grace Blackwell.
Další kategorií zařízení jsou systémy DGX GB300, které budou obsahovat čipy Grace Blackwell Ultra (36 CPU Grace a 72 GPU Blackwell Ultra).
Například DGX SuperPOD se systémy DGX GB300 bude schopen škálovat až na desítky tisíc čipů.
NVIDIA Blackwell RTX PRO
NVIDIA na GTC 2025 představila i nové profesionální desktopové grafické procesory z rodiny Blackwell RTX PRO. Novinky založené na architektuře Blackwell nesou označení RTX Pro, aby se odlišily od předchozích generací (Ada Lovelace, Ampere a Turing) a od běžných spotřebitelských modelů. Nejvýkonnější modely nabídnou 96 GB paměti ECC GDDR7 a výkon až 4 000 AI TOPS (dvojnásobek, co zvládne dřívější výkonnostní šampion RTX 6000 a čtyřnásobek výkonu nejlepšího grafického procesoru na spotřebitelském trhu RTX 5090).
Představeny byly také o něco hůře vybavené modely Pro 5000, Pro 4500 a Pro 4000. V neposlední řadě byly prezentovány také ekvivalentní varianty čipů pro přenosné počítače (jejich nabídce bude dominovat model RTX Pro 5000 Blackwell s 24GB pamětí GDDR7). Tyto novinky by měly být k dispozici během května a června letošního roku.
Tyto karty budou dále k dispozici i ve variantě „Server Edition“ určené pro nasazení v datových centrech.
Budoucnost AI infrastruktury
Společnost NVIDIA na konferenci GTC 2025 představila svou vizi budoucnosti infrastruktury umělé inteligence, která zahrnuje řešení a systémy jako:
- AI Factories (továrny na umělou inteligenci): Přechod od tradičních datových center k specializovaným prostředím určeným pro generování inteligence AI ve velkém měřítku. AI factories představují posun směrem k účelově navrženým prostředím určeným k efektivnímu využívání různých forem AI.
- Spectrum-X Photonics: Nový síťový přepínač založený na křemíkové fotonice nabízející propustnost 1,6 terabitů za sekundu na port. Vyznačuje se výrazným snížením spotřeby energie a zlepšením odolnosti signálu a hodí se pro nasazení v AI Factories.
- AI Data Platform (platforma pro data AI): Přizpůsobitelný referenční návrh pro podnikovou infrastrukturu určenou pro hostování AI agentů.
- Inovace v oblasti sítí: Zaměření na pokročilá síťová řešení, jako jsou NVIDIA Quantum-X800 InfiniBand a Spectrum-X Ethernet pro zlepšení škálovatelnosti a efektivity AI.
- Úložiště optimalizovaná pro AI: Zdůraznění potřeby přehodnotit úložiště pro podporu pracovních zátěží AI s posunem směrem k sémanticky založeným systémům pro vyhledávání.
Novinky v oblasti softwaru pro AI
NVIDIA Dynamo
Dynamo je open-source software určený pro akceleraci a škálování AI modelů uvažování (reasoning) v systémech typu AI Factory. Zjednodušeně řečeno, NVIDIA Dynamo řeší otázku efektivního nasazení a škálování modelů AI pro uvažování, které jsou stále složitější a náročnější. Novinka, která nahradí řešení NVIDIA Triton Inference Server, orchestruje a urychluje komunikaci inferencí napříč tisíci GPU a rozděluje zpracování a generování velkých jazykových modelů na různých GPU. Například při práci s AI modely Llama by mělo být možné dosáhnout až dvounásobného výkonu.
AI-Q Blueprint a modely Llama Nemotron Reasoning
Open-source softwarová knihovna AI-Q Blueprint je určena pro budování komplexních agentních AI služeb. Dále byla oznámena rodina otevřených modelů NVIDIA Llama Nemotron Reasoning s vylepšenými schopnostmi uvažování pro budování pokročilých AI agentů, která je součástí kolekce NIMs a je spustitelná na jakékoli platformě.
Představení AI-Q Blueprint a modelů Llama Nemotron Reasoning signalizuje závazek společnosti NVIDIA umožnit vývoj sofistikovaných AI agentů schopných uvažovat a interagovat se světem komplexnějším způsobem. Tyto nástroje poskytují vývojářům stavební kameny pro vytváření AI systémů, které přesahují jednoduché rozpoznávání vzorů a mohou provádět abstraktnější úkoly vyžadující porozumění, plánování a rozhodování.
NVIDIA Isaac GR00T N1 a Newton
NVIDIA Isaac GR00T N1 je první otevřený a plně přizpůsobitelný základní model pro generalizované uvažování a dovednosti humanoidních robotů. Model využívá dvousystémovou architekturu inspirovanou principy lidské kognice (rychle myslící akční model a pomalu myslící model pro rozhodování), je trénován na lidských i syntetických datech generovaných platformou NVIDIA Omniverse a měl by být schopen generalizovat běžné úkoly a provádět víceúrovňové úkoly vyžadující dlouhý kontext a kombinace obecných dovedností. Je přizpůsobitelný pro specifické roboty nebo úkoly prostřednictvím dodatečného trénování. Model je dostupný jako open-source na GitHubu.
Společnost také představila například open-source fyzikální engine Newton určený pro vývoj robotů vyvíjený ve spolupráci s Google DeepMind a Disney Research.
Digitální dvojčata a průmyslové aplikace
NVIDIA Omniverse se stává klíčovou platformou pro průmyslovou digitalizaci, umožňující vytváření vysoce věrných digitálních dvojčat pro různé aplikace, od návrhu produktů po automatizaci továren. Nyní se tento ekosystém pro vytváření a spolupráci v oblasti fyzikálně přesných 3D simulací a digitálních dvojčat dále rozšiřuje. Na konferenci byla představena řada spoluprací v této oblasti:
- Siemens: Integrace technologie NVIDIA Grace Blackwell a rozhraní API Omniverse pro vytváření pohlcujících digitálních dvojčat. Fotorealistická vizualizace Teamcenter poháněná Omniverse je nyní obecně dostupná.
- Ansys: Využití NVIDIA Omniverse Blueprint pro CAE s využitím CUDA, Modulus a Omniverse pro vytváření a nasazování digitálních dvojčat.
- Omron: Demonstrace propojení inspekčních a automatizačních technologií s NVIDIA Omniverse pro zlepšení provozní efektivity ve vývoji průmyslové automatizace.
- Coca-Cola Consolidated: Využití monitorování v reálném čase, spolupráce a fyzikálně založené vizualizace poháněné Azure IoT, NVIDIA Omniverse cloud APIs, OpenUSD a řešeními Sight Machine.
- Rockwell Automation: Využití Emulate3D, OpenUSD a Omniverse Cloud APIs pro simulace digitálních dvojčat továren.
- BMW Group: Využití avatarů v Omniverse pro interaktivní pozorování a dotazování v montážních stanicích baterií.
Iniciativy v oblasti autonomního řízení
Společnost NVIDIA pokračuje ve svých iniciativách v oblasti autonomního řízení, přičemž na konferenci GTC 2025 oznámila:
- Partnerství s General Motors (GM): Vývoj zakázkových AI systémů pro autonomní vozidla a integrace „AI do auta“ s využitím NVIDIA DRIVE AGX založené na architektuře Blackwell.
- NVIDIA DRIVE AGX: Platforma využívaná většinou společností zabývajících se autonomním řízením.
- NVIDIA Halos: Nový komplexní bezpečnostní systém pro autonomní vozidla.
- Simulace a syntetická data: Využití Omniverse a Cosmos pro generování realistických jízdních prostředí pro trénování autonomních vozidel.
- Rozšíření ekosystému: Spolupráce se společnostmi Magna, Lenovo, Volvo Cars, Gatik, Uber Freight, Plus, Foretellix, CARLA a Nuro v oblasti autonomního řízení.
Kvantové výpočty
Společnost během letošního ročníku GTC oznámila založení výzkumného centra NVIDIA Accelerated Quantum Computing Research Center (NVAQC) zaměřeného na bádání v oblasti kvantového hardwaru a algoritmů. NVAQC bude vybaven „superpočítačem“ s 576 GPU Blackwell, určeným pro rozsáhlé simulace kvantových algoritmů a hardwaru.
Vstup společnosti NVIDIA do výzkumu kvantového počítání signalizuje strategii zaměřenou na zkoumání a potenciální integraci kvantových technologií se stávajícími odbornými znalostmi společnosti v oblasti akcelerovaného počítání a AI. Přestože je kvantové počítání stále v rané fázi vývoje, společnost NVIDIA si uvědomuje jeho potenciál řešit složité problémy, které přesahují možnosti klasických počítačů, a zřízením výzkumného centra a spoluprací s akademickými institucemi, jako je MIT, se NVIDIA snaží etablovat jako lídr v tomto nově vznikajícím oboru.