Giga Computing rozšiřuje své portfolio o GPU servery pro generativní AI
S rostoucím zájmem o aplikace HPC (high performance computing) a umělé inteligence, konkrétně generativní umělé inteligence (GAI), se tato řada serverů spoléhá ve velké míře právě na výkon GPU, aby zvládla výpočetně náročné úlohy, které zpracovávají velké množství dat. S příchodem ChatGPT od OpenAI a dalších chatbotů AI se nasazují velké clustery GPU s optimalizací na úrovni systému pro trénování velkých jazykových modelů (LLM, large language model). Tyto LLM mohou být zpracovávány novými servery GIGABYTE s optimalizovaným designem, které nabízejí vysokou úroveň přizpůsobení na základě požadovaných pracovních zátěží a potřeb uživatelů.
Servery GIGABYTE řady G jsou postaveny především pro podporu výkonných výpočtů na GPU jednotkách využívající nejnovější technologie PCIe. Počínaje 2U servery mohou nové modely G293 podporovat až osm dvouslotových GPU nebo 16 jednoslotových GPU v závislosti na modelu serveru. Pro maximální výkon CPU a GPU jsou tu servery G493 4U, které kromě podpory osmi GPU (Gen5 x16), nabízí i různé síťové možnosti a konfigurace pro úložiště. Nejvyšší výkon pro HPC a AI podporují řady G363 a G593 s grafickými procesory NVIDIA H100 Tensor Core.
Všechny nové 2U servery se dvěma paticemi pro CPU jsou určeny buď pro procesory AMD EPYC 4. generace, nebo pro procesory Intel Xeon Scalable 4. generace.
Řada G293 (nové modelyG293-S42, G293-S43, G293-S45) čítá servery se dvěma paticemi Intel Xeon (TDP až 225 W), které podporují buď osm dvouslotových GPU, nebo šestnáct jednoslotových GPU, a také osm 2,5" pozic pro úložiště.
Řada G363 (G363-SR0) umožňuje osadit dvoupaticový procesor Intel Xeon se čtyřmi GPU NVIDIA HGX H100 a dále nabízí šest nízkoprofilových slotů.
Řada G493 (G493-SB0, G493-SB1, G493-SB2, G493-SB3) je tvořena servery s proesory Intel Xeon se dvěma paticemi a podporuje více rozšiřujících slotů a možností pro ukládání dat.
Řadu G593 (G593-SD0)servery s CPU Intel Xeon se dvěma paticemi a prostorem pro osm grafických procesorů NVIDIA HGX H100.
Servery NVIDIA HGX H100
NVIDIA HGX H100 je aktuálně nejvýkonnější superpočítačová platforma pro umělou inteligenci na světě, která spojuje výkon grafických procesorů NVIDIA H100 a plně optimalizovaný software NVIDIA AI Enterprise a NVIDIA HPC. Tato platforma je schopna pohánět aplikace v oblastech simulací, analýzy dat a umělé inteligence. Softwarová vrstva platformy NVIDIA AI Enterprise urychluje datové vědecké procesy a zefektivňuje vývoj a nasazení produkčních AI včetně generativní AI, strojového vidění, hlasové AI a dalších. Obsahuje více než 50 frameworků, předtrénovaných modelů a vývojových nástrojů.
HGX H100 je k dispozici jako serverový stavební blok v podobě integrovaných základních desek v konfiguracích se čtyřmi nebo osmi grafickými procesory H100. Čtyři grafické procesory H100 nabízejí propojení mezi GPU přes NVLink, zatímco konfigurace s osmi GPU nabízí plnou šířku pásma mezi GPU prostřednictvím technologie NVIDIA NVSwitch. S využitím výkonu procesorových jader Tensor poskytuje osmisměrný server HGX H100 výpočetní výkon pro pokročilé učení na úrovni až 32 petaFLOPS (FP8).