Giga Computing rozšiřuje své portfolio o GPU servery pro generativní AI

4. 10. 2023. (redaktor: František Doupal, zdroj: Giga Computing)
Giga Computing, dceřiná společnost firmy GIGABYTE, nově nabízí řadu výkonných GPU serverů s nejnovějšími procesory Intel a jednotkami NVIDIA HGX H100 se čtyřmi i osmi GPU moduly. Nové servery umožňují instalaci GPU jednotek přes PCIe nebo formou integrovaných základních desek.

S rostoucím zájmem o aplikace HPC (high performance computing) a umělé inteligence, konkrétně generativní umělé inteligence (GAI), se tato řada serverů spoléhá ve velké míře právě na výkon GPU, aby zvládla výpočetně náročné úlohy, které zpracovávají velké množství dat. S příchodem ChatGPT od OpenAI a dalších chatbotů AI se nasazují velké clustery GPU s optimalizací na úrovni systému pro trénování velkých jazykových modelů (LLM, large language model). Tyto LLM mohou být zpracovávány novými servery GIGABYTE s optimalizovaným designem, které nabízejí vysokou úroveň přizpůsobení na základě požadovaných pracovních zátěží a potřeb uživatelů.

Servery GIGABYTE řady G jsou postaveny především pro podporu výkonných výpočtů na GPU jednotkách využívající nejnovější technologie PCIe. Počínaje 2U servery mohou nové modely G293 podporovat až osm dvouslotových GPU nebo 16 jednoslotových GPU v závislosti na modelu serveru. Pro maximální výkon CPU a GPU jsou tu servery G493 4U, které kromě podpory osmi GPU (Gen5 x16), nabízí i různé síťové možnosti a konfigurace pro úložiště. Nejvyšší výkon pro HPC a AI podporují řady G363 a G593 s grafickými procesory NVIDIA H100 Tensor Core.

Všechny nové 2U servery se dvěma paticemi pro CPU jsou určeny buď pro procesory AMD EPYC 4. generace, nebo pro procesory Intel Xeon Scalable 4. generace.

Řada G293 (nové modelyG293-S42, G293-S43, G293-S45) čítá servery se dvěma paticemi Intel Xeon (TDP až 225 W), které podporují buď osm dvouslotových GPU, nebo šestnáct jednoslotových GPU, a také osm 2,5" pozic pro úložiště.

Řada G363 (G363-SR0) umožňuje osadit dvoupaticový procesor Intel Xeon se čtyřmi GPU NVIDIA HGX H100 a dále nabízí šest nízkoprofilových slotů.

Řada G493 (G493-SB0, G493-SB1, G493-SB2, G493-SB3) je tvořena servery s proesory Intel Xeon se dvěma paticemi a podporuje více rozšiřujících slotů a možností pro ukládání dat.

Řadu G593 (G593-SD0)servery s CPU Intel Xeon se dvěma paticemi a prostorem pro osm grafických procesorů NVIDIA HGX H100.

Servery NVIDIA HGX H100

NVIDIA HGX H100 je aktuálně nejvýkonnější superpočítačová platforma pro umělou inteligenci na světě, která spojuje výkon grafických procesorů NVIDIA H100 a plně optimalizovaný software NVIDIA AI Enterprise a NVIDIA HPC. Tato platforma je schopna pohánět aplikace v oblastech simulací, analýzy dat a umělé inteligence. Softwarová vrstva platformy NVIDIA AI Enterprise urychluje datové vědecké procesy a zefektivňuje vývoj a nasazení produkčních AI včetně generativní AI, strojového vidění, hlasové AI a dalších. Obsahuje více než 50 frameworků, předtrénovaných modelů a vývojových nástrojů.

HGX H100 je k dispozici jako serverový stavební blok v podobě integrovaných základních desek v konfiguracích se čtyřmi nebo osmi grafickými procesory H100. Čtyři grafické procesory H100 nabízejí propojení mezi GPU přes NVLink, zatímco konfigurace s osmi GPU nabízí plnou šířku pásma mezi GPU prostřednictvím technologie NVIDIA NVSwitch. S využitím výkonu procesorových jader Tensor poskytuje osmisměrný server HGX H100 výpočetní výkon pro pokročilé učení na úrovni až 32 petaFLOPS (FP8).

Štítky: 

Podobné články

Jan Bureš, country leader CZ/SK ve Fujitsu

Jan Bureš (Fujitsu): Na éru AI jsme dobře připraveni

5. 9. 2024. (redaktor: František Doupal, zdroj: DCD Publishing)
S Janem Burešem, country leaderem CZ/SK ve Fujitsu, jsme hovořili o nabídce společnosti pro oblast umělé inteligence. Na následujících řádcích se tak můžete seznámit s produkty a službami Fujitsu pro tento segment, ale i s přístupem společnosti k bezpečnosti dat nebo kooperací s dalšími dodavateli, a hlavně s partnery. Čtěte více

Entec Solutions představuje serverová řešení xFusion

21. 11. 2024. (redaktor: Reseller Magazine OnLine, zdroj: Entec Solutions)
V dnešním rychle se měnícím světě IT je důležité mít spolehlivou a moderní infrastrukturu, která zvládne náročné potřeby zákazníků. Odpovědí na tyto požadavky jsou rackové servery architektury x86 od společnosti xFusion, jejichž řešení přináší na český trh VAD Entec Solutions. Čtěte více

HPE vyhlásilo partnery roku 2024

19. 11. 2024. (redaktor: František Doupal, zdroj: HPE)
Společnost Hewlett Packard Enterprise během slavnostního večera, který proběhl ve čtvrtek 31.10. 2024 v Praze, ocenila své nejlepší české prodejce a distributory roku 2024. Čtěte více

Dell Technologies rozšířil portfolio Dell AI Factory o nové servery PowerEdge

5. 11. 2024. (redaktor: František Doupal, zdroj: Dell Technologies)
Společnost Dell Technologies dále rozšiřuje své portfolio řešení pro generativní umělou inteligenci označované jako Dell AI Factory o doplňky přizpůsobené pro prostředí AMD. Tato řešení nabízejí podnikům rozšířené možnosti využití umělé inteligence, včetně lepší škálovatelnosti a vyšší flexibility, aby si udržely konkurenceschopnost v proměnlivém technologickém prostředí. Čtěte více