Co přinese nová generace serverových procesorů Intel Xeon?
Procesory řady Xeon společnost Intel nabízí dlouhá léta. Jsou speciálně navrženy pro servery, datová centra a superpočítače (HPC). Kromě „běžných úloh“ se stále častěji využívají také při páci s neuronovými sítěmi, umělou inteligencí nebo strojovým učením. Velmi dobře se uplatní také v oblasti sítí, edge computingu či obecného cloud computingu.
Právě v tom tkví jedna z klíčových vlastností nových procesorů Intel Xeon Scalable čtvrté generace. Společnost totiž dodává diferencovaná řešení vyladěná pro konkrétní pracovní zátěže s výkonem, spotřebou i cenou, které odpovídající individuálním potřebám každého zákazníka. V portfoliu procesorů Intel Xeon tak lze najít procesory orientované např. na:
- všeobecný výkon;
- IMDB, analytiku a virtualizaci;
- 5G a další sítě;
- AI a ML, HPC;
- cloud computing a IaaS;
- hyperkonvergovaná řešení a storage.
- dlouhodobé použití (IoT);
Intel procesory Intel Xeon Scalable čtvrté generace dělí na řady Max (9000), Platinum (8000), Gold (6000 a 5000), Silver (4000) a Bronze (3000). Platí, že čím vyšší řada, tím vyšší výkon a výbava. Kompletní nabídku, která zahrnuje přes 50 modelů, si můžete prostudovat v přiložených tabulkách.
Procesory se liší také podporou systémů s více sockety – „platinové“ většinou podporují až osm socketů, „zlaté“ čtyři a „stříbrné“ dva (i zde se však dají nalézt v závislosti na konkrétním modelu určité odlišnosti).
Pro zajímavost si uveďme, že nejdražší procesor přijde v plné ceníkové ceně na 17 000 USD.
Intel Xeon Max
Modely Intel Xeon řady Max (Sapphire Rapids HBM) jsou prvními procesory typu x86 s pamětí s velkou šířkou pásma, které umožňují urychlit vybrané pracovní úlohy (bez nutnosti provádět jakékoli změny kódu). Procesory nabízejí až 64 GB rychlé paměti HBM2e a ve porovnání s nejlepšími modely Intel Xeon Scalable 3. generace poskytují v reálných aplikacích, jako je modelování energetických a geologických systémů, až 3,7× vyšší výkon.
Společné hardwarové inovace
Nové procesory mají i společné vlastnosti jako, jako jsou podpora osmikanálových pamětí DDR5 (16 × DIMM na socket, 4 800 MHz), rozhraní PCI Express 5.0, CXL (Compute Express Link) 1.1 či až 50% nárůst počtu jader na socket. Důležitou inovací je také nasazení specializovaných výpočetních akcelerátorů, o kterých budeme hovořit později.
Oproti předchozím generacím serverových procesorů došlo také ke konstrukčním změnám. Produkce je založena na výrobním procesu Intel 7 a jádrech architektury Golden Cove. Zajímavé že, že Intel tyto procesory vyrábí jak v čipletové verzi (XCC, složené ze čtyř bloků) s až 60 jádry, tak i v monolitické variantě (MCC, až 32 jader).
Vylepšená energetická efektivita
Jedním z provozních aspektů, na které se v Intelu intenzivně zaměřili, je energetická efektivita. Výrobce uvádí, že ve zkušební sadě nejběžnějších reálných pracovních zátěží naměřil až 2,9× zlepšení efektivity poměru „výkon na watt.“ Další úspory slibuje nový režim „Optimized Power Mode“ schopný u specifických typů zátěže přinést až 20% snížení spotřeby energie na socket při méně než pětiprocentním dopadu na výkon. Určitou redukci spotřeby mohou doručit také změny v oblasti chlazení (vzduchového i kapalinového).
Procesory Intel Xeon čtvrté generace navíc disponují celou řadou specializovaných akcelerátorů, které ve vybraných operacích snižují spotřebu již na úrovni platformy.
Suma sumárům by měly nové procesory zákazníkům snížit TCO až o 66 %.
Výkon v oblasti umělé inteligence
Pokrok oproti předchozí generaci procesorů může ilustrovat např. až desetkrát vyšší výkon při vytváření a trénování neuronových sítí v reálném čase ve frameworku PyTorch. Ještě větší nárůst výkonu mohou (prý) nové procesory přinést při zpracování přirozeného jazyka – u velkých lingvistických modelů je zrychlení až 20×.
Výhodou může v tomto ohledu být také softwarová sada Intel AI (testovaná na více než 400 modelech strojového učení a hlubokého učení AI v různých odvětvích a aplikacích), kterou mohou vývojáři ve svých oblíbených nástrojích využít pro zvýšení produktivity a urychlení vývoje. Sada je navržená pro využití na lokální pracovní stanici i pro nasazení v edge prostředí nebo v cloudu.
Uplatnění v sektoru sítí a HPC
Procesory Intel Xeon Scalable 4. generace nabízejí také modely optimalizované pro vysoce výkonné sítě s nízkou latencí a edge prostředí. Např. v případě 5G sítí mohou vestavěné akcelerátory pomoci zvýšit propustnost a snížit latenci a současně i zvýšit energetickou efektivitu. Procesory mohou také (ve srovnání se Xeony 3. generace), bez vyšší spotřeby energie, zdvojnásobit kapacitu virtualizované rádiové přístupové sítě (vRAN). Taková vylepšení umožní poskytovatelům komunikačních služeb zdvojnásobit výkon na watt a zároveň dovolí snadněji škálovat síťové zdroje podle aktuálního vytížení.
Produkty Intel Xeon Scalable 4. generace představují spolu s řadou Intel Xeon Max plynule škálovatelnou architekturu, která kombinuje CPU (a GPU) s otevřeným softwarovým ekosystémem pro náročné výpočetní úlohy v oblasti HPC a AI. Za tímto účelem Intel poskytuje sadu otevřených nástrojů a knihoven oneAPI, které vývojářům umožňují vytvářet kód spustitelný na různých platformách (včetně CPU, GPU a dalších specializovaných procesorů), což umožňuje zjednodušit vývoj a optimalizaci aplikací.
Bude to stačit na konkurenci? Do hry vstupují akcelerátory
Procesory Intel Xeon v určité době držely drtivé tržní podíly, takřka neměly konkurenci. Časy se však mění a „ze zákaznického koláče“ si v posledních letech začalo díky procesorům řady Genoa poměrně agresivně ukusovat i konkurenční AMD. V mnoha ohledech (např. v počtu jader, kterých AMD nabídne až 96, zatímco Intel maximálně 60, nebo PCI linek) se může zdát, že AMD má stále navrch a že reakce Intelu přichází později, než by bylo zdrávo… Na druhou stranu Intel bojuje řadou akcelerátorů a jiných chytrých funkcí, které mohou výhodu v počtu jader zvrátit.
Sázka na akcelerátory, které si na čipu ukusují část místa (tranzistorů) s sebou však nese určitá rizika. Za prvé nikde není dáno, že se konkrétní akcelerace mezi zákazníky ujme. Pokud se tomu tak nestane, půjde jen o drahou přítěž pro všechny zákazníky. U zátěží, které akcelerátory nedokáží využít, jde navíc v ten moment rovněž pouze o „mrtvou váhu“. V neposlední řadě mohou akcelerátory představovat i nová bezpečností rizika.
Na druhou stranu však akcelátory dokáží (při vhodném využití) relativní výkon na jedno jádro skutečně výrazně zvýšit. Ve světě softwaru licencovaného „na jádro“ to tedy může být i velká výhoda.
Situace s akcelerátory u jednotlivých modelů však není vůbec jednoduchá. Vedle některých méně významných akcelerátorů (nebo těch, které již známe z dřívějších procesorů, jako AVX-512), jsou zde čtyři hlavní:
- DSA (Intel Data Streaming Accelerator): pomáhá zrychlit přenos dat napříč procesorem, pamětí a mezipamětí i všemi připojenými zařízeními.
- QAT (Intel QuickAssist Technology): zajišťuje šifrování, dešifrování a kompresi dat.
- DLB (Intel Dynamic Load Balancer): pomáhá zlepšit výkon související se zpracováním síťových dat.
- IAA (Intel In-Memory Analytics Accelerator): pomáhá zpracovávat databázové a analytické úlohy.
Problém je však v tom, že část nových procesorů v základu obsahuje pouze DSA (které je navíc jen u 27 % modelů osazeno v plné konfiguraci – zbytek CPU si musí vystačit s omezením jeho výkonu na čtvrtinu). Zbývající trojicí jednotek (QAT, DLB a IAA) pak disponuje jen necelá polovina ze všech dostupných modelů. (Detaily si můžete prostudovat na jedné z přiložených tabulek.)
Intel On Demand
S akcelerátory úzce souvisí i služba Intel On Demand (dříve se označovala jako „softwarově-definovaný křemík, SDSi). Prostřednictvím této služby lze totiž na vybraných procesorech aktivovat podporované hardwarové funkce včetně akcelerátorů, a to za jednorázový nebo opakovaný (např. měsíční) poplatek. Jmenovitě jde např. o Intel Dynamic Load Balancer, Intel Data Streaming Accelerator, Intel In-Memory Analytics Accelerator, Intel Quick Assist Technology nebo Intel Software Guard Extensions.
Zákazníci tak mají možnost si u některých modelů vybrané funkce pořídit při koupi procesoru, nebo později formou upgradu (který může proběhnout i vzdáleně). Intel spolu s některými partnery pracuje také na modelu, kdy budou dodatečné funkce účtovány na základě skutečné spotřeby.
Zákazníci tak sice mohou snížit počáteční pořizovací cenu a vybrané funkce si aktivovat až v momentě, kdy je skutečně potřebují, zároveň však jde v mnoho ohledech o dost kontroverzní přístup, který navíc může způsobit další zmatky v již tak ne zrovna přehledné nabídce.
Výkon
Na internetu jsou již dostupné výsledky nejrůznějších testů a benchmarků, díky kterým máme o výkonu nových procesorů Intel Xeon přesnější obrázek. Obecně můžeme – podle očekávaných předpokladů – říci, že v zátěžích, kde jde primárně o hrubou výpočetní sílu, většinou opravdu dominují spíše procesory AMD Epyc.
U operací, kde se zapojí akcelerátory, již situace tak jednoznačná není. Někde je stav vyrovnaný, jinde dokonce vítězí Intel. Jednoznačného prohlášení, zdali je lepší AMD nebo Intel, se tedy v tomto ohledu nejspíš nedočkáme, protože vždy bude záležet na konkrétní zátěži, výpočetním prostředí, přesné konfiguraci, metodě nasazení i dalším použitém hardwaru.
Navíc do hry vstupují i faktory, jako jsou ceny a TDP.
Na podrobná porovnání se můžete podívat např. na portálech hothardware.com nebo www.servethehome.com.
Shrnutí
Je zřejmé, že pro mnoho organizací budou nové procesory od Intelu opravdu atraktivní volbou. Pro sérii Xeon jde o největší posun za mnoho let, protože nárůst počtu jader a PCI Express linek i adopce technologií jako CXL 1.1, DDR5 či PCIe 5.0 se spolu s novými vestavěnými akcelerátory jednoznačně projeví ve výrazně širší využitelnosti těchto čipů.
O výkonu jsme již hovořili – zde je jakékoli porovnání komplikované a vždy bude záležet na řadě individuálních okolností.
Procesory AMD Epyc 9004 (Genoa) jsou již nějakou dobu na trhu a Intel proto věděl, s čím se bude poměřovat. AMD tak sice dokáže nabídnout některé skutečně výkonné modely, na které Intel zdánlivě nemá přímou odpověď, ale na druhou stranu nabízí podstatně širší produktové portfolio – jen v případě CPU s TDP pod 200 W nabízí Intel srovnatelný počet modelů, jako má AMD celkově. I toto může být jedna z výhod, které v budoucnu promluví ve prospěch Intelu…