Giga Computing rozšiřuje své portfolio o GPU servery pro generativní AI

4. 10. 2023. (redaktor: František Doupal, zdroj: Giga Computing)
Giga Computing, dceřiná společnost firmy GIGABYTE, nově nabízí řadu výkonných GPU serverů s nejnovějšími procesory Intel a jednotkami NVIDIA HGX H100 se čtyřmi i osmi GPU moduly. Nové servery umožňují instalaci GPU jednotek přes PCIe nebo formou integrovaných základních desek.

S rostoucím zájmem o aplikace HPC (high performance computing) a umělé inteligence, konkrétně generativní umělé inteligence (GAI), se tato řada serverů spoléhá ve velké míře právě na výkon GPU, aby zvládla výpočetně náročné úlohy, které zpracovávají velké množství dat. S příchodem ChatGPT od OpenAI a dalších chatbotů AI se nasazují velké clustery GPU s optimalizací na úrovni systému pro trénování velkých jazykových modelů (LLM, large language model). Tyto LLM mohou být zpracovávány novými servery GIGABYTE s optimalizovaným designem, které nabízejí vysokou úroveň přizpůsobení na základě požadovaných pracovních zátěží a potřeb uživatelů.

Servery GIGABYTE řady G jsou postaveny především pro podporu výkonných výpočtů na GPU jednotkách využívající nejnovější technologie PCIe. Počínaje 2U servery mohou nové modely G293 podporovat až osm dvouslotových GPU nebo 16 jednoslotových GPU v závislosti na modelu serveru. Pro maximální výkon CPU a GPU jsou tu servery G493 4U, které kromě podpory osmi GPU (Gen5 x16), nabízí i různé síťové možnosti a konfigurace pro úložiště. Nejvyšší výkon pro HPC a AI podporují řady G363 a G593 s grafickými procesory NVIDIA H100 Tensor Core.

Všechny nové 2U servery se dvěma paticemi pro CPU jsou určeny buď pro procesory AMD EPYC 4. generace, nebo pro procesory Intel Xeon Scalable 4. generace.

Řada G293 (nové modelyG293-S42, G293-S43, G293-S45) čítá servery se dvěma paticemi Intel Xeon (TDP až 225 W), které podporují buď osm dvouslotových GPU, nebo šestnáct jednoslotových GPU, a také osm 2,5" pozic pro úložiště.

Řada G363 (G363-SR0) umožňuje osadit dvoupaticový procesor Intel Xeon se čtyřmi GPU NVIDIA HGX H100 a dále nabízí šest nízkoprofilových slotů.

Řada G493 (G493-SB0, G493-SB1, G493-SB2, G493-SB3) je tvořena servery s proesory Intel Xeon se dvěma paticemi a podporuje více rozšiřujících slotů a možností pro ukládání dat.

Řadu G593 (G593-SD0)servery s CPU Intel Xeon se dvěma paticemi a prostorem pro osm grafických procesorů NVIDIA HGX H100.

Servery NVIDIA HGX H100

NVIDIA HGX H100 je aktuálně nejvýkonnější superpočítačová platforma pro umělou inteligenci na světě, která spojuje výkon grafických procesorů NVIDIA H100 a plně optimalizovaný software NVIDIA AI Enterprise a NVIDIA HPC. Tato platforma je schopna pohánět aplikace v oblastech simulací, analýzy dat a umělé inteligence. Softwarová vrstva platformy NVIDIA AI Enterprise urychluje datové vědecké procesy a zefektivňuje vývoj a nasazení produkčních AI včetně generativní AI, strojového vidění, hlasové AI a dalších. Obsahuje více než 50 frameworků, předtrénovaných modelů a vývojových nástrojů.

HGX H100 je k dispozici jako serverový stavební blok v podobě integrovaných základních desek v konfiguracích se čtyřmi nebo osmi grafickými procesory H100. Čtyři grafické procesory H100 nabízejí propojení mezi GPU přes NVLink, zatímco konfigurace s osmi GPU nabízí plnou šířku pásma mezi GPU prostřednictvím technologie NVIDIA NVSwitch. S využitím výkonu procesorových jader Tensor poskytuje osmisměrný server HGX H100 výpočetní výkon pro pokročilé učení na úrovni až 32 petaFLOPS (FP8).

Štítky: 

Podobné články

Celosvětové tržby z prodeje serverů ve čtvrtém čtvrtletí roku 2024 vzrostly o 91 %

24. 3. 2025. (redaktor: František Doupal, zdroj: IDC)
Podle studie společnosti IDC dosáhl trh se servery v posledním čtvrtletí roku 2024 rekordních tržeb ve výši 77,3 miliardy dolarů. Sledované období vykázalo druhé nejvyšší tempo růstu od roku 2019. Čtěte více
Jan Bureš, country leader CZ/SK ve Fujitsu

Jan Bureš (Fujitsu): Na éru AI jsme dobře připraveni

5. 9. 2024. (redaktor: František Doupal, zdroj: DCD Publishing)
S Janem Burešem, country leaderem CZ/SK ve Fujitsu, jsme hovořili o nabídce společnosti pro oblast umělé inteligence. Na následujících řádcích se tak můžete seznámit s produkty a službami Fujitsu pro tento segment, ale i s přístupem společnosti k bezpečnosti dat nebo kooperací s dalšími dodavateli, a hlavně s partnery. Čtěte více

HPE podporuje rozvoj agentní AI specializovanou jednotnou inteligentní datovou vrstvou

26. 3. 2025. (redaktor: František Doupal, zdroj: Hewlett Packard Enterprise)
Společnost Hewlett Packard Enterprise představila jednotnou datovou vrstvu pro umělou inteligenci, hlubší spolupráci se společností NVIDIA a významná vylepšení v celém svém portfoliu podnikových datových úložišť. Podniky budou moci rychleji získávat poznatky z dat díky snadnému přístupu, vestavěné inteligenci a společnému řízení multicloudových dat od různých poskytovatelů. Čtěte více

SoftBank za 6,5 miliardy USD kupuje čipovou společnost Ampere

21. 3. 2025. (redaktor: František Doupal, zdroj: SoftBank)
Japonská skupina SoftBank Group oznámila, že za 6,5 miliardy dolarů koupí společnost Ampere Computing, která se zabývá vývojem serverový čipů založený na architektuře ARM. Čipy společnosti Ampere se mimo jiné využívají také pro AI výpočty.q Čtěte více