Red Hat AI zjednodušuje nasazení podnikové umělé inteligence v hybridním cloudu

16. 4. 2025. (redaktor: František Doupal, zdroj: Red Hat)
Red Hat oznámil vylepšení svého portfolia produktů a služeb Red Hat AI, která mají pomoci urychlit vývoj a nasazování umělé inteligence (AI) v hybridním cloudu. Red Hat AI poskytuje podnikovou platformu AI pro trénování a odvozování modelů, která přináší vyšší efektivitu, zjednodušené prostředí a flexibilitu při nasazení kdekoli v prostředí hybridního cloudu.

I když podniky hledají způsoby, jak snižovat náklady na nasazování velkých jazykových modelů (LLM) při rostoucích možnostech jejich využití, stále čelí výzvě, jak tyto modely integrovat s vlastními daty a zároveň mít k těmto datům přístup, ať už se nacházejí v datovém centru, ve veřejných cloudech nebo dokonce na okraji sítě.

Red Hat AI, která je součástí platforem Red Hat OpenShift AI a Red Hat Enterprise Linux AI (RHEL AI), reaguje na tyto problémy tím, že poskytuje podnikovou platformu pro AI, která uživatelům umožňuje implementovat efektivnější, více optimalizované a na základě specifických podnikových dat vyladěné modely, které lze následně nasadit v hybridním cloudu pro trénování i odvozování na široké škále akcelerovaných výpočetních architektur.

Red Hat OpenShift AI

Red Hat OpenShift AI poskytuje kompletní platformu AI pro správu prediktivních a generativních AI (gen AI) životních cyklů v hybridním cloudu, včetně možností pro správu modelů strojového učení (MLOps) a LLMOps. Platforma nabízí funkce pro vytváření prediktivních modelů a ladění modelů gen AI spolu s nástroji pro zjednodušení jejich správy, od datové vědy, modelových pipelines a monitorování modelů až po jejich řízení.

Nejnovější verze platformy Red Hat OpenShift AI 2.18 přidává aktualizace a možnosti, které podporují záměr Red Hat AI přinést lépe optimalizované a efektivnější modely AI do hybridního cloudu. Mezi hlavní funkce patří:

  • Distribuovaná obsluha modelů poskytovaná prostřednictvím inferenčního serveru vLLM, která umožňuje týmům IT rozdělit obsluhu modelů mezi více grafických procesorů (GPU). To pomáhá snížit zatížení jednotlivých serverů, zrychlit trénink a dolaďování i efektivněji využívat výpočetní zdroje. Zároveň jsou služby lépe distribuovány mezi jednotlivé uzly pro modely AI.
  • Komplexní ladění modelu, nová funkce využívající InstructLab a pipelines datové vědy v Red Hat OpenShift AI, která pomáhá zjednodušit jemné doladění LLM, jež budou i ve velkých produkčních prostředích škálovatelnější, efektivnější a auditovatelnější. Zároveň poskytuje možnost správy prostřednictvím ovládacího panelu Red Hat OpenShift AI.
  • Funkce AI Guardrails, která ve své předběžné verzi monitoruje a lépe zabezpečuje interakce s uživatelskými vstupy i výstupy modelu, což pomáhá zlepšit přesnost, výkon, latenci a transparentnost LLM. AI Guardrails nabízí další detekční body, které pomáhají týmům IT identifikovat a zmírňovat potenciálně nenávistné, urážlivé nebo vulgární projevy a kontrolovat osobní údaje, konkurenční informace nebo jiné údaje omezené firemními zásadami.
  • Komponenta Hodnocení jazykového modelu (lm-eval), která poskytuje důležité informace o celkové kvalitě modelu a umožňuje datovým vědcům porovnávat výkonnost jejich LLM v různých úlohách, od logického a matematického uvažování až po adverzní přirozený jazyk. V konečném důsledku to pomáhá vytvářet efektivnější, citlivější a na míru upravené modely AI.


RHEL AI

RHEL AI je součástí portfolia Red Hat AI a představuje modelovou platformu pro konzistentnější vývoj, testování a provozování LLM pro podporu podnikových aplikací. RHEL AI poskytuje zákazníkům nástroje Granite LLM a InstructLab pro nastavení modelů, které jsou připraveny jako zaváděcí obraz serveru s Red Hat Enterprise Linuxem a mohou být nasazeny v hybridním cloudu.

RHEL 1.4, který byl uveden v únoru 2025, přinesl několik nových vylepšení, včetně:

  • Podpory modelu Granite 3.1 8B, nejnovějšího přírůstku do rodiny open source modelů Granite. Model přidává vícejazyčnou podporu pro odvozování a přizpůsobení taxonomie či znalostí (v předběžné verzi pro vývojáře), spolu s kontextovým oknem pro 128 tisíc tokenů, pro lepší výsledky sumarizace a generativní úlohy rozšířené o vyhledávání (RAG).
  • Nového grafického uživatelského rozhraní pro vkládání dovedností a znalostí, které je k dispozici v předběžné verzi pro vývojáře a které zjednodušuje přijímání a třídění dat i způsob, jakým uživatelé přidávají své vlastní dovednosti a příspěvky do modelu AI.
  • Document Knowledge-bench (DK-bench) pro snadnější porovnání modelů AI vyladěných na relevantních soukromých datech s výkonem stejných, ale nevyladěných základních modelů.


Red Hat AI InstructLab v IBM Cloudu

Podniky stále častěji hledají řešení AI, která upřednostňují přesnost a bezpečnost dat a zároveň udržují náklady a složitost na co nejnižší úrovni. Red Hat AI InstructLab nasazený jako služba v IBM Cloudu je navržen tak, aby zjednodušil, škáloval a pomohl zlepšit bezpečnost tréninku a nasazování modelů AI. Zjednodušením ladění modelů pomocí InstructLab mohou organizace vytvářet efektivnější modely přizpůsobené jejich jedinečným potřebám a zároveň si zachovat kontrolu nad svými daty.

Bezplatné školení AI Foundations

AI představuje transformační příležitost, která nově definuje fungování podniků a jejich konkurenceschopnost. Aby Red Hat podniky v tomto dynamickém prostředí podpořil, nabízí nově bezplatné online školení AI Foundations. Red Hat poskytuje dva certifikované kurzy v oblasti AI, které jsou určeny jak pro zkušené vedoucí pracovníky, tak pro nováčky v oblasti AI a pomáhají vzdělávat uživatele všech úrovní v tom, jak může AI pomoci transformovat podnikové operace, zefektivnit rozhodování a podpořit inovace. Školení AI Foundations vede uživatele k aplikování těchto znalostí při používání Red Hat AI.

Dostupnost

Red Hat OpenShift AI 2.18 a Red Hat Enterprise Linux AI 1.4 jsou nyní všeobecně dostupné. Další informace o nových funkcích, vylepšeních, opravách chyb i o tom, jak přejít na nejnovější verzi Red Hat OpenShift AI lze nalézt zde a nejnovější verzi RHEL AI zde.

Podobné články

Jan Bureš, country leader CZ/SK ve Fujitsu

Jan Bureš (Fujitsu): Na éru AI jsme dobře připraveni

5. 9. 2024. (redaktor: František Doupal, zdroj: DCD Publishing)
S Janem Burešem, country leaderem CZ/SK ve Fujitsu, jsme hovořili o nabídce společnosti pro oblast umělé inteligence. Na následujících řádcích se tak můžete seznámit s produkty a službami Fujitsu pro tento segment, ale i s přístupem společnosti k bezpečnosti dat nebo kooperací s dalšími dodavateli, a hlavně s partnery. Čtěte více

HPE přináší nové možnosti virtuálních privátních cloudových i lokálních implementací

15. 4. 2025. (redaktor: František Doupal, zdroj: HPE)
Společnost Hewlett Packard Enterprise představila rozšíření svého řešení HPE Aruba Networking Central, které je určené pro správu sítí s využitím umělé inteligence a na první místo klade bezpečnost. Novinky reagují mimo jiné na rostoucí poptávku po datové suverenitě s regionální a místní kontrolou. Čtěte více

QNAP představuje operační systém QuTScloud c5.2 pro Cloud NAS

21. 3. 2025. (redaktor: František Doupal, zdroj: QNAP)
Společnost QNAP představila nejnovější verzi svého operačního systému Cloud NAS. Aktualizace přináší Centrum zabezpečení (proaktivní bezpečnostní aplikaci, která monitoruje souborové operace v Cloud NAS a chrání před ransomwarem) a další novinky, které zjednodušují správu a zlepšují uživatelský zážitek. Čtěte více

Pure Storage představuje úložnou platformu FlashBlade//EXA pro AI a další náročné úlohy

17. 3. 2025. (redaktor: František Doupal, zdroj: Pure Storage)
Společnost Pure Storage představila systém FlashBlade//EXA. Jde o nejvýkonnější platformu pro ukládání dat, která byla navržena pro nejnáročnější požadavky umělé inteligence (AI) a další vysoce výkonná výpočetní prostředí (clustery HPC). Čtěte více