Red Hat AI zjednodušuje nasazení podnikové umělé inteligence v hybridním cloudu
I když podniky hledají způsoby, jak snižovat náklady na nasazování velkých jazykových modelů (LLM) při rostoucích možnostech jejich využití, stále čelí výzvě, jak tyto modely integrovat s vlastními daty a zároveň mít k těmto datům přístup, ať už se nacházejí v datovém centru, ve veřejných cloudech nebo dokonce na okraji sítě.
Red Hat AI, která je součástí platforem Red Hat OpenShift AI a Red Hat Enterprise Linux AI (RHEL AI), reaguje na tyto problémy tím, že poskytuje podnikovou platformu pro AI, která uživatelům umožňuje implementovat efektivnější, více optimalizované a na základě specifických podnikových dat vyladěné modely, které lze následně nasadit v hybridním cloudu pro trénování i odvozování na široké škále akcelerovaných výpočetních architektur.
Red Hat OpenShift AI
Red Hat OpenShift AI poskytuje kompletní platformu AI pro správu prediktivních a generativních AI (gen AI) životních cyklů v hybridním cloudu, včetně možností pro správu modelů strojového učení (MLOps) a LLMOps. Platforma nabízí funkce pro vytváření prediktivních modelů a ladění modelů gen AI spolu s nástroji pro zjednodušení jejich správy, od datové vědy, modelových pipelines a monitorování modelů až po jejich řízení.
Nejnovější verze platformy Red Hat OpenShift AI 2.18 přidává aktualizace a možnosti, které podporují záměr Red Hat AI přinést lépe optimalizované a efektivnější modely AI do hybridního cloudu. Mezi hlavní funkce patří:
- Distribuovaná obsluha modelů poskytovaná prostřednictvím inferenčního serveru vLLM, která umožňuje týmům IT rozdělit obsluhu modelů mezi více grafických procesorů (GPU). To pomáhá snížit zatížení jednotlivých serverů, zrychlit trénink a dolaďování i efektivněji využívat výpočetní zdroje. Zároveň jsou služby lépe distribuovány mezi jednotlivé uzly pro modely AI.
- Komplexní ladění modelu, nová funkce využívající InstructLab a pipelines datové vědy v Red Hat OpenShift AI, která pomáhá zjednodušit jemné doladění LLM, jež budou i ve velkých produkčních prostředích škálovatelnější, efektivnější a auditovatelnější. Zároveň poskytuje možnost správy prostřednictvím ovládacího panelu Red Hat OpenShift AI.
- Funkce AI Guardrails, která ve své předběžné verzi monitoruje a lépe zabezpečuje interakce s uživatelskými vstupy i výstupy modelu, což pomáhá zlepšit přesnost, výkon, latenci a transparentnost LLM. AI Guardrails nabízí další detekční body, které pomáhají týmům IT identifikovat a zmírňovat potenciálně nenávistné, urážlivé nebo vulgární projevy a kontrolovat osobní údaje, konkurenční informace nebo jiné údaje omezené firemními zásadami.
- Komponenta Hodnocení jazykového modelu (lm-eval), která poskytuje důležité informace o celkové kvalitě modelu a umožňuje datovým vědcům porovnávat výkonnost jejich LLM v různých úlohách, od logického a matematického uvažování až po adverzní přirozený jazyk. V konečném důsledku to pomáhá vytvářet efektivnější, citlivější a na míru upravené modely AI.
RHEL AI
RHEL AI je součástí portfolia Red Hat AI a představuje modelovou platformu pro konzistentnější vývoj, testování a provozování LLM pro podporu podnikových aplikací. RHEL AI poskytuje zákazníkům nástroje Granite LLM a InstructLab pro nastavení modelů, které jsou připraveny jako zaváděcí obraz serveru s Red Hat Enterprise Linuxem a mohou být nasazeny v hybridním cloudu.
RHEL 1.4, který byl uveden v únoru 2025, přinesl několik nových vylepšení, včetně:
- Podpory modelu Granite 3.1 8B, nejnovějšího přírůstku do rodiny open source modelů Granite. Model přidává vícejazyčnou podporu pro odvozování a přizpůsobení taxonomie či znalostí (v předběžné verzi pro vývojáře), spolu s kontextovým oknem pro 128 tisíc tokenů, pro lepší výsledky sumarizace a generativní úlohy rozšířené o vyhledávání (RAG).
- Nového grafického uživatelského rozhraní pro vkládání dovedností a znalostí, které je k dispozici v předběžné verzi pro vývojáře a které zjednodušuje přijímání a třídění dat i způsob, jakým uživatelé přidávají své vlastní dovednosti a příspěvky do modelu AI.
- Document Knowledge-bench (DK-bench) pro snadnější porovnání modelů AI vyladěných na relevantních soukromých datech s výkonem stejných, ale nevyladěných základních modelů.
Red Hat AI InstructLab v IBM Cloudu
Podniky stále častěji hledají řešení AI, která upřednostňují přesnost a bezpečnost dat a zároveň udržují náklady a složitost na co nejnižší úrovni. Red Hat AI InstructLab nasazený jako služba v IBM Cloudu je navržen tak, aby zjednodušil, škáloval a pomohl zlepšit bezpečnost tréninku a nasazování modelů AI. Zjednodušením ladění modelů pomocí InstructLab mohou organizace vytvářet efektivnější modely přizpůsobené jejich jedinečným potřebám a zároveň si zachovat kontrolu nad svými daty.
Bezplatné školení AI Foundations
AI představuje transformační příležitost, která nově definuje fungování podniků a jejich konkurenceschopnost. Aby Red Hat podniky v tomto dynamickém prostředí podpořil, nabízí nově bezplatné online školení AI Foundations. Red Hat poskytuje dva certifikované kurzy v oblasti AI, které jsou určeny jak pro zkušené vedoucí pracovníky, tak pro nováčky v oblasti AI a pomáhají vzdělávat uživatele všech úrovní v tom, jak může AI pomoci transformovat podnikové operace, zefektivnit rozhodování a podpořit inovace. Školení AI Foundations vede uživatele k aplikování těchto znalostí při používání Red Hat AI.
Dostupnost
Red Hat OpenShift AI 2.18 a Red Hat Enterprise Linux AI 1.4 jsou nyní všeobecně dostupné. Další informace o nových funkcích, vylepšeních, opravách chyb i o tom, jak přejít na nejnovější verzi Red Hat OpenShift AI lze nalézt zde a nejnovější verzi RHEL AI zde.