HPE představilo komplexní portfolio pro generativní umělou inteligenci

26. 3. 2024. (redaktor: František Doupal, zdroj: Hewlett Packard Enterprise)
Společnost Hewlett Packard Enterprise oznámila aktualizaci svého komplexního portfolia s nativní umělou inteligencí. Společně navržená softwarová a hardwarová řešení podnikové třídy od společností HPE a NVIDIA urychlí vývoj a nasazení aplikací GenAI. Záměrem je podpořit provoz aplikací generativní umělé inteligence (GenAI), deep learningu a strojového učení (ML).
Jensen Huang, zakladatel a generální ředitel společnosti NVIDIA

„Abychom dodrželi náš slib o GenAI a efektivně využili celý životní cyklus AI, musí být řešení ze své podstaty hybridní,“ řekl Antonio Neri, prezident a generální ředitel společnosti HPE a dodal:„Umělá inteligence je hybridní cloudovou pracovní zátěží. Pomocí ní se modely trénují a ladí jak v on-premises, tak v kolokačním centru nebo veřejném cloudu a nechybí možnost provádět inferenci na okraji sítě. Se společností NVIDIA spolupracujeme dlouhodobě na inovacích, a nadále budeme dodávat navržená softwarová a hardwarová řešení využívající umělou inteligenci, která firmám pomáhá urychlit vývoj a nasazení GenAI“.

Mezi nejdůležitější představené novinky patří:

  • Dostupnost dvou společně vyvinutých řešení GenAI od společností HPE a NVIDIA.
  • Náhled na software HPE Machine Learning Inference.
  • Referenční architektura pro podnikové vyhledávání rozšířené o generování (RAG).
  • Podpora vývoje budoucích produktů založených na nové architektuře NVIDIA Blackwell.

„Generativní umělá inteligence dokáže proměnit data z připojených zařízení, data center a cloudů na poznatky, které mohou být průlomovými skrz celé odvětví,“ uvedl Jensen Huang, zakladatel a generální ředitel společnosti NVIDIA, a dodal: „Se společností HPE dále rozvíjíme spolupráci, což podnikům umožní dosáhnout nebývalé produktivity pomocí využití jejich soukromých dat k vývoji a nasazení nových aplikací poháněných umělou inteligencí a změní jejich podnikání.“

Výcvik a ladění GenAI s využitím superpočítačů

Superpočítačové řešení HPE pro generativní AI, oznámené na konferenci SC23, je k dispozici pro organizace hledající předem nakonfigurované a vyzkoušené řešení pro vývoj a trénování velkých modelů AI. Vytvořeno je na míru zákazníkům, kteří chtějí urychlit své projekty v oblasti GenAI a deep learningu. Pohání ho NVIDIA technologie a může podporovat až 168 čipů GH200 Grace Hopper SuperChip. Řešení umožňuje velkým podnikům, výzkumným institucím a vládním subjektům zefektivnit proces vývoje modelů díky softwarovému balíku pro AI/ML, který pomáhá urychlit projekty v oblasti generativní umělé inteligence a deep learningu, včetně velkých jazykových modelů (LLM), doporučovacích systémů a vektorových databází. Toto řešení (dodávané se službami a nastavením na klíč) je určeno k použití ve výzkumných AI centrech a velkých podnicích s cílem zkrátit dobu potřebnou k dosažení návratnosti investic a dvakrát až třikrát zrychlit výcvik. Další informace jsou k dispozici zde.

Ladění a inference GenAI pro velké podniky

Řešení společnosti HPE pro podniky zaměřené na generativní umělou inteligenci, které bylo poprvé uvedeno na konferenci Discover Barcelona 2023, je dostupné na přímo nebo prostřednictvím služby HPE GreenLake s flexibilním a škálovatelným modelem platby za použití. Předkonfigurované řešení bylo vyvinuto se společností NVIDIA, a je navrženo tak, aby zkrátilo dobu implementace a snížilo náklady tím, že nabídne kombinaci výpočetního výkonu, úložiště, softwaru, sítě a konzultačních služeb, které organizace potřebují k tvorbě aplikací s GenAI. Toto kompletní řešení poskytuje rychlost, škálovatelnost a kontrolu potřebnou k přizpůsobení základních modelů s využitím soukromých dat a nasazení aplikací GenAI v hybridním cloudu. 

Díky vysoce výkonnému výpočetnímu AI clusteru a softwaru od společností HPE a NVIDIA je řešení ideální pro nenáročné doladění modelů, RAG (retrieval-augmented generation) a škálování inference. Doba doladění modelu Llama 2 se 70 miliardami parametrů provozovaného na tomto řešení lineárně klesá s počtem uzlů a na 16uzlovém systému trvá jen asi šest minut. Rychlost a výkon podnikům přinese rychlejší návratnosti investic díky vylepšené produktivitě prostřednictvím aplikací s AI, jako jsou virtuální asistenti, inteligentní chatboti a firemní vyhledávání.

Řešení je založeno na serverech HPE ProLiant DL380a Gen11 s předkonfigurovanými grafickými procesory NVIDIA, síťovým připojením přes platformu NVIDIA Spectrum-X Ethernet a jednotkami NVIDIA BlueField-3 DPU. Kromě platformy strojového učení a analytiky HPE je obohaceno o software NVIDIA AI Enterprise 5.0 s novou NVIDIA NIM mikroslužbou pro optimalizované odvozování generativních modelů umělé inteligence a NVIDIA NeMo Retriever a další datové rámce a AI knihovny. 

Experti společnosti HPE Services pomohou podnikům s návrhem, nasazením a správou řešení, včetně nastavení použití vhodných technik ladění modelů, a to s cílem pomoci překlenout nedostatek odborníků na umělou inteligenci. Další informace jsou k dispozici zde.

Od prototypu k produktivitě

Společnosti HPE a NVIDIA spolupracují na softwarových řešeních, která pomohou podnikům udělat další krok a přeměnit experimentální projekty v oblasti AI a ML do produkce. Software HPE Machine Learning Inference, dostupný ve fázi technologického náhledu, umožňuje organizacím rychle a bezpečně nasazovat ML modely ve velkém měřítku. Nová nabídka je propojena s knihovnami NVIDIA a poskytuje předem sestavené kontejnery s optimalizovanými základními modely NVIDIA.

Firmám, které potřebují rychle budovat a nasazovat GenAI aplikace využívající vlastní data, vytvořila společnost HPE referenční architekturu pro podnikový RAG. Založena je na mikroslužbě NVIDIA NeMo Retriever. Nabídka se skládá z komplexního datového základu HPE Ezmeral Data Fabric Software a HPE GreenLake pro File Storage. Nová referenční architektura poskytne podnikům plán pro tvorbu chatovacích robotů, generátorů nebo kopilotů na míru.

S cílem pomoci s přípravou dat, trénováním AI a inferenci, řešení spojuje celé spektrum open-sourcových nástrojů a řešení HPE Ezmeral Unified Analytics Software a software HPE AI, který zahrnuje software pro správu dat strojového učení HPE, vývojové prostředí pro strojové učení HPE a nový software pro inferenci strojového učení HPE. Software HPE pro umělou inteligenci je k dispozici jak na superpočítačích HPE, tak na podnikových výpočetních řešeních pro GenAI, aby podnikům poskytl konzistentní prostředí pro správu jejich pracovních úloh v oblasti umělé inteligence.

Řešení nové generace postavené na architektuře NVIDIA Blackwell

Společnost HPE bude budoucí produkty vyvíjet na nově oznámené architektuře NVIDIA Blackwell, která obsahuje inferenční engine pro zrychlení pracovních úloh GenAI. Další podrobnosti a dostupnost chystaných produktů HPE se superčipem NVIDIA GB200 Grace Blackwell, HGX B200 a HGXB100 budou oznámeny později.

Štítky: 
Umělá inteligence, Strojové učení, Hewlett Packard Enterprise, Nvidia

Podobné články

HPE postavilo nejvýkonnější superpočítač v Polsku

17. 5. 2024. (redaktor: František Doupal, zdroj: Hewlett Packard Enterprise)
Společnost Hewlett Packard Enterprise představila nově sestavený superpočítač pro Akademické výpočetní centrum Cyfronet krakovské univerzity AGH, který se tak stal nejvýkonnějším výpočetním systémem v Polsku. Superpočítač podpoří umělou inteligencí řízený vědecký výzkum v astronomii, medicíně a ochraně klimatu díky vyššímu výkonu a vyšší energetické účinnosti. Čtěte více

Polovina českých firem si není jistá budoucností svého oboru, počítají ale s vlivem AI

17. 5. 2024. (redaktor: František Doupal, zdroj: Dell Technologies)
Téměř polovina (46 %) českých firem si není jistá, jak bude jejich odvětví vypadat v příštích třech až pěti letech, 71 % však potvrzuje, že na jejich budoucnost bude mít velký vliv umělá inteligence (AI) a generativní umělá inteligence (GenAI). Čtěte více

OpenAI představila GPT-4o: Nastává nová éra interakce člověka s počítačem

16. 5. 2024. (redaktor: Michala Benešovská, zdroj: OpenAI )
Společnost OpenAI uvedla nový model umělé inteligence GPT-4o, který značí významný posun k přirozenější interakci mezi člověkem a počítačem. Tento model je schopen přijímat a generovat výstupy v kombinaci textu, zvuku a obrazu, čímž rozšiřuje možnosti využití AI v praxi. Čtěte více

Copilot for Microsoft 365 zamířil do ArrowSphere Cloudu

16. 5. 2024. (redaktor: František Doupal, zdroj: Arrow ECS)
Společnost Arrow Electronics umožňuje prodej produktu Copilot for Microsoft 365 prostřednictvím cloudové platformy ArrowSphere Cloud. Současně společnost nabízí specializovaný podpůrný program, který umožní partnerům akcelerovat obchodní příležitosti na bázi produktu Copilot. Čtěte více