Google Cloud Next 2023: Novinky z oblasti AI, cloudu i bezpečnosti

4. 9. 2023. (redaktor: František Doupal, zdroj: Google, www.crn.com, www.indianexpress.com)
Letošní vývojářská konference společnosti Google, která proběhla (poprvé od roku 2019) naživo v sanfranciském Moscone Center, přinesla mnoho zajímavých novinek a trendů, s nimiž se budeme setkávat v blízké budoucnosti. Pojďme si proto vybrané inovace z oblastí, jako jsou generativní AI, cloudová infrastruktura, bezpečnost a mnohé další zrekapitulovat.
Thomas Kurian, CEO Googlu, a Jen-Hsun Huang, prezident Nvidie, během keynote

Třídenní událost byla odstartována keynote CEO Googlu Thomase Kuriana. Jako obvykle šlo o informačně nabitou prezentaci s tím, že většině z vybraných témat byl následně věnován prostor i během workshopů a seminářů v následujících dnech.

Google je aktuálně třetím největším poskytovatelem veřejných cloudových služeb (za Amazonem a Microsoftem) a zahajovací keynote přinesla několik velkých oznámení, pomocí kterých chce společnost drže se svými většími konkurenty. Letošní summit byl také hodně zaměřený na předvedení snabídek Googlu v segmentu infrastruktury optimalizované pro provozování AI modelů.

Ústředním tématem konference Cloud Next 2023 byla generativní umělá inteligence, což je dnes jedna z klíčových oblastí konkurenčního boje. Google je zde navíc pod výrazným tlakem řady dalších firem, které mají (alespoň na první pohled) v mnoha ohledech aktuálně navrch.

Zajímavou informací, která během akce rovněž zazněla, je skutečnost, že 70 % jednorožců (tedy firem s kapitalizací přes miliardu dolarů) působících v oblasti umělé inteligence a více než polovina takovýchto startupů jsou zákazníky Google Cloudu.

Vertex AI se zlepšuje

Před dvěma lety Google představil Vertex AI, jednotnou platformu umělé inteligence, která nabízí všechny cloudové služby Googlu pod jednou střechou. Pomocí Vertex AI mohou zákazníci snadno vytvářet ML modely nebo je nasazovat a škálovat pomocí předtrénovaných nebo vlastních nástrojů. Následovala Vertex AI Vision, platforma strojového učení jako služba (ML PaaS) nabízená službou Google Cloud. Letos byla tato platforma veřejně zpřístupněna všem zájemcům, a to včetně různých nástrojů a modelů, například modelu doplňování slov řízeného PaLM 2, textovým rozhraní API Embeddings a dalšími základní modely. Nyní Google informoval také o přidání modelu Llama 2 společnosti Meta a Falcon společnosti TII. Google Cloud se tak stává jediným poskytovatelem cloudu, který podporuje modely prvních stran, open source i modely třetích stran. Rozhraní API těchto modelů budou přístupná prostřednictvím nového nástroje Model Garden.

Google představil i nová rozšíření Vertex AI Extensions, což je sada plně spravovaných nástrojů, které pomáhají vývojářům připojit modely k vlastním datům nebo datům třetích stran. Tato rozšíření mohou získávat informace v reálném čase a jednat jménem uživatelů v aplikacích Google a třetích stran, jako jsou Datastax, MongoDB a Redis. To otevírá nové možnosti pro aplikací s generativní umělou inteligencí, které tak mohou provádět i akce na platformách třetích stran včetně CRM systémů nebo e-mailových služeb.

S platformou Vertex AI souvisí také nová spravovaná služba Colab Enterprise, která kombinuje Google Colab notebooky s možnostmi zabezpečení a dodržování předpisů na podnikové úrovni. Novinka umožňuje uživatelům spustit zápisník v BigQuery pro zkoumání a přípravu dat a poté otevřít tentýž zápisník ve Vertex AI a pokračovat v práci se specializovanou AI infrastrukturou a nástroji. Týmy tak mají přímý přístup k datům, ať už pracují kdekoli. Colab Enterprise bude všeobecně dostupný v září.

Vylepšení se dočkal i jazykový model PaLM2: zvládá zpracovat až 4× větší množství dat (a pracuje tak i s podstatně širším kontextem informací, tedy si během interakce více pamatuje) a podporuje 38 nových jazyků (celkově jich tak je již přes sto). Z modelu PaLM2 pak vychází i nová verze programátorského asistenta Codey, která by měla v nejdůležitějších kódovacích jazycích přinést až 25% zlepšení kvality.

Duet AI For Google Workspace

Již na konferenci I/O 2023 Google pod názvem Duet AI představil umělou inteligenci pro sadu Workspace. Z počátku byla funkce dostupná pouze pro vybrané uživatele, nyní si ji mohou bezplatně vyzkoušet všichni, následně by však měla být zpoplatněna (spekuluje se o částce 30 USD za uživatele).

Duet AI je všestranný pomocník zahrnující řadu nástrojů založených na generativní AI pro produktivitu, včetně Gmailu, Disku, Prezentací, Dokumentů a dalších (Google se tak v podstatě pouští do boje s Copilotem od Microsoftu). Již dříve byly představeny např. funkce pro automatické generování odpovědí na e-maily, třídění a organizaci dat v tabulkách nebo pro generování obrázků. Zároveň jsme věděli, že jde i o nástroj pro vývojáře schopný asistovat při kódování a odpovídat na související dotazy.

Google však postupně rozšiřuje Duet AI i do dalších aplikací, naposledy Meet a Chat. Mezi nové funkce v aplikaci Meet patří možnost pořizovat si poznámky v reálném čase (aplikace pořídí shrnutí a akční body z průběhu schůzky, a to i průběžně před jejím skončením). Další novinka umožňuje aplikaci Duet zastupovat uživatele na schůzce. Na pozvánce na schůzku by mělo stačit kliknout na tlačítko „Zúčastnit se za mě“, načež může být automaticky vygenerován text o tom, o čem by chtěl uživatel na meetingu diskutovat. Tyto poznámky pak budou zobrazeny ostatním účastníkům a bude o nich možné hovořit.

Mezi další nové funkce patří tzv. dynamické dlaždice a detekce obličeje, které umožňují uživatelům v zasedací místnosti mít vlastní video dlaždici se jménem. Dále je k dispozici funkce automatického překladu titulků, která rozpozná, když se mluví jiným jazykem, a zobrazí překlad v reálném jazyce (aktuálně to funguje v 18 jazycích).

V aplikaci Google Chat lze nyní chatovat přímo s Duet AI a klást otázky týkající se zpracovávaného obsahu, získat přehled o dokumentech nebo dohnat zmeškané konverzace. Google Chat potěší také novým rozhraním a novými zkratkami a také možností přidat do jedné místnosti až 50 000 členů (místo původních 8 000 členů). Další novinkou je funkce Huddles, díky které se místo přeskakování z konverzace do schůzky schůzka integruje přímo do chatu. Google uvádí, že Huddles bude k dispozici ve veřejném náhledu do konce roku. V příštích týdnech Google navíc přidá do Chatu i podporu aplikací třetích stran (hovoří se např. o Zoho, Workday a Loom).

Další novinky

Distribuovaný cloud společnosti Google (Google Distributed Cloud with AlloyDB) nyní umožní zákazníkům provozovat pracovní zátěže z oblasti umělé inteligence a databází kdekoli díky integraci několika služeb Vertex AI a AlloyDB Omni. Google k tomu uvedl, že tento krok je umožní odpovídat na jedinečné požadavky organizací, které chtějí provozovat pracovní zátěže „na okraji“ nebo ve svém datovém centru. Nová AlloyDB AI nabízí integrovanou sadu funkcí pro snadné vytváření aplikací s generativní AI včetně vektorových dotazů, které jsou až desetkrát rychlejší než standardní PostgreSQL. S AlloyDB Omni pak mohou uživatelé provozovat také AlloyDB prakticky kdekoli, například on-premis, v AWS, Microsoft Azure nebo prostřednictvím GDC.

Nová síťová infrastruktura Cross-Cloud Network Platform pomůže zákazníkům propojit a zabezpečit aplikace v různých cloudech. Jde o otevřené prostředí optimalizované pro pracovní zátěže, které nabízí podporu zabezpečení na bázi strojového učení a konceptu zero trust. Síť Cross-Cloud Network zároveň umožní snadnější přístup ke službám Google z jakéhokoli cloudu a sníží latenci sítě až o 35 %.

Nové BigQuery Studio společnosti Google (aktuálně je dostupné v testovací verzi) představuje jednotné rozhraní pro datové inženýrství, analytiku a ML, které umožňuje bezproblémovou práci s těmito třemi technologiemi. Cílem je usnadnit zákazníkům objevování, zkoumání, analýzu a predikci dat v BigQuery. Výhodou je také integrace s platformou Vertex AI.

Virtuální stroje Google Compute Engine A3 nabídnou grafické procesory Nvidia H100 určené k trénování a obsluze náročných AI výpočtů a velkých jazykových modelů. Oproti generaci A2 by mělo být při trénování dosaženo až třikrát vyššího výkonu.

Nový cloudový akcelerátor umělé inteligence (TPU) v5e je považován za doposud nejvýhodnější a nejdostupnější řešení společnosti Google pro středně velké tréninkové i inferenční úlohy. TPU v5e se škáluje na desítky tisíc čipů a je optimalizován pro efektivitu. Ve srovnání s Cloud TPU v4 poskytuje až dvojnásobné zlepšení tréninkového výkonu na dolar a až 2,5násobné zlepšení inferenčního výkonu na dolar.

Nová prémiová „Enterprise“ edice Google Kubernetes Engine (GKE) umožňuje víceclusterové horizontální škálování potřebné pro náročné pracovní zátěže AI a ML. Výhody, které přináší GKE včetně automatického škálování, orchestrace pracovních zátěží a automatických upgradů jsou tak nyní k dispozici i s cloudovými TPU.

Novinky z oblasti bezpečnosti

A službě Duet AI jsme již hovořili, nyní se však na její možnosti podíváme také z hlediska kybernetické bezpečnosti, protože právě tato technologie byla zařazena také do funkcí Google Cloud Security Operations. Duet AI tak může bezpečnostním profesionálům pomáhat předcházet hrozbám, snížit pracnost jejich bezpečnostních pracovních postupů a celkově zvýšit úroveň bezpečnostních pracovníků.

Duet AI je nyní integrován do bezpečnostních produktů společnosti Google jako Chronicle Security Operations, Mandiant Threat Intelligence a Security Command Center. Služba může pomáhat při programování (třeba jako druhý kodér) a pomáhat uživatelům s kontextovým doplňováním kódu, nabízet návrhy syntaxe vyladěné podle předchozího kódu zákazníka, generovat celé funkce v reálném čase a pomáhat s revizemi a kontrolami kódu. Duet AI dokáže rychle shrnout a klasifikovat informace o hrozbách, překládat vyhledávání v přirozeném jazyce do dotazů a poskytovat návrhy dalších kroků k nápravě problémů, což může zkrátit dobu detekce a reakce a zvýšit produktivitu přepracovaných bezpečnostních specialistů.

V oblasti síťového zabezpečení Google spustil službu Cloud Firewall Plus, která přidává pokročilou ochranu před hrozbami a funkce firewallu nové generace (kterou poskytuje společnost Palo Alto Networks). Navíc obsahuje správce integrace síťových služeb, který správcům sítě umožňuje snadno integrovat důvěryhodné aplikační firewally třetích stran pro kontrolu provozu. Do nástroje Security Command Center Google přidal funkci skenování zranitelností bez použití agenta, což umožňuje detekovat zranitelnosti operačního systému, softwaru a sítí ve virtuálních počítačích Compute Engine.

Video : 

Podobné články

ArrowSphere Cloud rozšířil nabídku řízených služeb o řešení Cloud Object Storage for Backup

25. 4. 2024. (redaktor: František Doupal, zdroj: Arrow ECS)
Společnost Arrow Electronics spustila řešení Arrow Cloud Object Storage for Backup. Nová služba založená na IBM Cloud je vytvořena tak, aby podporovala rostoucí potřeby na ochranu dat zejména u podniků fungujících digitálně. Čtěte více

Výhled IT prodejního kanálu na rok 2024 a dále

11. 4. 2024. (redaktor: František Doupal, zdroj: Eaton)
Navzdory přetrvávajícím problémům vykazuje světový trh s IT po třech letech nepříznivých okolností známky oživení. Předpokládá se, že v roce 2024 vzrostou celosvětové dodávky osobních počítačů o osm procent a o stejné procento se zvýší i výdaje na IT oproti předchozímu roku. Co tedy bude toto oživení trhu znamenat pro IT prodejní kanál v nadcházejících měsících? Čtěte více

CNAPP aneb řízení kybernetické bezpečnosti v době multicloudové

11. 4. 2024. (redaktor: František Doupal, zdroj: Anect)
Většina firem v Česku již alespoň část svých systémů či aplikací provozuje v cloudu. Ať už jde o kombinaci privátního a veřejného cloudu, nebo více komerčních dodavatelů. Tento trend bude nadále posilovat, vedle mnoha výhod ale zároveň zvyšuje i nároky na komplexní zabezpečení firemního provozu. Proto se v poslední době stále častěji skloňuje zkratka CNAPP. Čtěte více

Hewlett Packard Enterprise integruje GenAI do platformy Aruba Networking Central

4. 4. 2024. (redaktor: František Doupal, zdroj: Hewlett Packard Enterprise)
Hostované řešení na cloudové platformě HPE GreenLake získává nové funkce využívající velké jazykové modely (LLM) přinášející optimalizaci a predikci síťového provozu, čímž posouvá správu sítí na novou úroveň. O službu HPE Aruba Networking Central již rozšířila svou nabídku např. společnost Verizon Business. Čtěte více