• Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události
Žádné výsledky
Zobrazit všechny výsledky
ITBiz.cz
ITBiz.cz
Žádné výsledky
Zobrazit všechny výsledky

Potřebuje AI training speciálně navržená řešení pro Data Storage?

Kamil Pittner
2. 7. 2025
| Články
Rudolf Hruška, CTO pro Datacenter Solutions společnosti Huawei Technologies Czech
Rudolf Hruška, CTO pro Datacenter Solutions společnosti Huawei Technologies Czech

Bez umělé inteligence (AI) se dnes, zdá se, neobejde nic, od ledničky přes infotainment v autě po mobilní sítě či bankovní služby. Většina z nás si pravděpodobně vyzkoušela aplikace jako ChatGPT, Copilot, Gemini – prostě některý z tzv. velkých jazykových modelů. S každou generací jsou „chytřejší“, ale jejich vytváření znamená především potřebu obrovského množství dat a vysoce výkonného hardwaru. Klíčovou roli rovněž hrají datová úložiště a o tom, co nejen pro LLM mohou nabídnout výrobci, jsme si povídali s Rudolfem Hruškou, CTO pro Datacenter Solutions společnosti Huawei Technologies Czech.

Začněme zeširoka – co všechno obnáší vytvoření LLM z pohledu dodavatelů hardwaru. Stále slýcháme o čipech pro AI, ale jen na těch vývoj LLM nestojí. Co jsou kritické body?

Velké modely umělé inteligence se skládají ze tří kritických elementů: algoritmy, data a výkonná infrastruktura pro computing. Přičemž data jsou skutečně klíčovým prvkem a jejich vstupní kvalita a výběr determinují i vlastnosti výsledných modelů. Z hlediska evoluce AI modelů probíhá přechod od singlemodálních modelů k multimodálním modelům. Multimodální modely umělé inteligence, některé z nich jsou zmíněny v úvodu, jsou modely strojového učení schopné zpracovávat a chápat informace z různých datových modalit, jako je text, obrázky, zvuk a video. To jim umožňuje provádět úkoly, které vyžadují všeobecnější chápání světa a napodobují, jak lidé využívají a integrují různé smysly. Zároveň se AI posouvá od vnímání a porozumění směrem k poznání, generaci a tvorbě, a v budoucnosti k tzv. všeobecné umělé inteligenci, něčemu jako centrální mozek lidstva. Samozřejmě, potřeba uložení velkých objemů dat a jejich rychlého zpracování ve storage systémech roste řádově.

Zmínil jste storage – je to z důvodu nedostatečné kapacity, energetické náročnosti…

Data Storage je dnes obecně jedno z velkých témat, i když je pro širokou veřejnost jaksi skryté za atraktivnějšími předměty debat a diskusí o AI. Technických výzev je zde dost. Dají se shrnout do několika oblastí: za prvé, velká kapacita s tzv. single namespace, tj. souvislý jmenný prostor, který si lze představit jako jeden neuvěřitelně velký souborový disk, kam se vejdou desítky či stovky petabajtů dat. Samozřejmě, takto velké single disky neexistují a je potřeba skládat potřebný masivní prostor z jejich velkého počtu. Vlastní propojení mezi disky a softwarovou vrstvou, která z nich tvoří souborový systém musí být dostatečně škálovatelná jak z hlediska kapacity, tak z hlediska výkonnosti. Ta se zde měří pomocí parametrů datové propustnosti, typicky kolik gigabajtů za sekundu nových dat lze na daný systém kontinuálně zapisovat či kolik gigabajtů za sekundu lze ze systému načíst. No a protože trénování AI modelů je dlouhý a náročný proces, je tento parametr propustnosti klíčovým indikátorem vhodnosti daného úložiště. Platí: čím větší propustnost, tím se celková doba trénování zkrátí – a může se překvapivě jednat až o týdny.

Další výzvy jsou spolehlivost, ochrana dat, energetická náročnost a fyzický prostor. Díky velkému počtu disků, kontrolérů, propojení a dalších hardwarových prvků je šance na defekt a tudíž přerušení procesu trénování modelu značná.

No a v neposlední řadě je to cena za uložení a cena za výkon. Nejrychlejší datová úložiště používají NVMe Flash disky a pořízení multipetabajtového All Flash úložiště stále ještě není úplně levná záležitost.

Je zkrácení doby klíčové pouze z hlediska času a urychlení uvedení na trh?

Zkrácení doby výpočtu nového modelu je samozřejmě klíčové pro time-to-market, a to v situaci, kdy se různé velké modely doslova perou o přízeň uživatelů v nelítostném konkurenčním boji. Každý si může vyzkoušet stejné otázky či úlohy na různých modelech a rozhodnout se, co je pro něj preferovaná platforma. Dopad do trhu je pak obrovský, a to i díky tomu, že jsou modely dostupné miliardám uživatelů přímo na mobilních telefonech nebo jako součást běžných internetových vyhledávačů. Poskytovatelé velkých modelů AI se proto musí držet neustále na špici.

Další spíše technický a finanční dopad spočívá v utilizaci celého výpočetního ekosystému určeného pro trénování AI. Postavit takový funkční systém je extrémně finančně náročné. Ty největší a nejvýkonnější AI clustery jsou osazeny až desítkami tisíc specializovaných AI akceleračních procesorů GPU, ale podle dostupných zdrojů mají relativně nízkou utilizaci, pouze mezi 30 až 50 procenty. A to má i obrovský dopad jednak do finanční bilance a jednak i na délku AI trainingu, která může být typicky v řádu týdnů. Nízká utilizace je způsobena tím, že nejdříve je potřeba provést datově náročné operace jako dataset preparation a loading a dále je nutné v průběhu trénování provádět periodické checkpointy, tj. zálohy, ke kterým je možné se vrátit, pokud dojde k havárii či defektu. Zálohy a případné obnovy jsou rovněž datově náročné operace a přímo závisí na propustnosti použitého úložiště. A tímto jsme se dostali k odpovědi na otázku, proč mají datová úložiště rovněž klíčovou roli v procesu trénování LLM. Zkrátka výpočetní část AI clusteru předběhla možnosti datové části, tudíž výkonné GPU „musejí čekat“ na data, se kterými mohou pracovat. A to je potřeba změnit.

Předpokládám, že výrobci jsou si toho vědomi a chtějí GPU náskok stáhnout? Má Huawei nějakého žolíka v rukávu?

Vývoj velkých a výkonných datových úložišť samozřejmě probíhá, a i zde je velký konkurenční boj mezi výrobci. Jedná se o specializovaná řešení, která vyžadují velké investice do R&D a velké zázemí pro globální distribuci a podporu. Optimalizace pro AI storage se zaměřuje na několik technických aspektů. Jednak vlastní datová média, kde dochází k pravidelnému uvádění na trh čím dál tím větších SSD NVMe disků za účelem miniaturizace a snižování celkové energetické náročnosti. Největší SSD disky komerčně dostupné na trhu již mají jednotkové kapacity přes 100 terabajtů ve standardním 2.5palcovém formátu. Další aspekt spočívá ve vývoji hardwarových storage kontrolérů, které na backendu spravují velké množství SSD disků a zároveň musí mít frontendová síťová rozhraní pro připojení do ultrarychlých AI datacentrových sítí. A v neposlední řadě probíhá vývoj v oblasti škálovatelných paralelních filesystémů, které jsou nasazeny napříč celým prostředím mezi storage nody a compute nody AI clusteru. Huawei jako jeden z technologických globálních leaderů uvádí letos novou generaci specializovaného AI storage systému pro AI training a AI inference. Jedná se o model OceanStor A800 AI Storage.

Huawei Oceanstor A800

Můžete popsat základní technické parametry OceanStor A800 AI Storage?

OceanStor A800 AI Storage patří k nové generaci storage systémů speciálně vyvinutých a určených pro high-performance, AI a machine learning workload. Splňuje požadavky na vysoký výkon a škálovatelnost v hybridních prostředích a efektivní management obrovského množství dat potřebných v celém procesu AI. Zajišťuje rychlé čtení, zápis a zpracování dat a vylepšuje efektivitu provozu v AI Clusterech. Od běžných diskových polí se liší především svou inovativní architekturou, která obsahuje specializované DPU (Data Processing Unit) procesory. DPU slouží jako specializovaný procesor a má za úkol odlehčit a spravovat síťové, bezpečnostní a úložné funkce, které tradičně zatěžují centrální procesorovou jednotku (CPU). Tedy obdobně jako výpočetní nody v AI clusteru obsahují masivní počet GPU s vlastní pamětí pro akceleraci výpočetních operací, tak i storage nody obsahují DPU pro akceleraci datových operací. V případě OceanStor A800 jsou DPU nasazeny přímo v I/O adaptérech jednotlivých kontrolérů. Pracují paralelně na frontendu úložného systému, před CPU a pamětí řadičů úložiště. Rolí DPU je přijímat datové toky a řídit je v rámci data plane a control plane separation. Vlastní aplikační data jsou směřována přímo na NVMe SSD média na backendu. Datový tok tedy nezatěžuje CPU, které zpracovává pouze kontrolní data. To je principiální rozdíl proti klasickým diskovým polím, kde jsou jak aplikační, tak kontrolní data zpracovávána vždy v CPU, a pro high-performance data úlohy se naráží na úzké hrdlo komunikace mezi CPU a RAM. OceanStor A800 je distribuovaná souborová storage se schopností rozšiřování scale-out, má zabudovaný paralelní filesystém a podporuje vysokorychlostní připojení do výpočetních sítí. Základní stavební jednotka storage clusteru – controller enclosure se dvěma nody, má výkonnost 24 milionů IOPS a 500 GB/s bandwidth. To je řádově více než běžná souborová Enterprise All Flash disková pole se dvěma řadiči. Tato extrémní výkonnost byla prokázána i prakticky v celosvětově uznávaném benchmarkovém testu MLPERF™, kde se OceanStor A800 umístil na prvním místě ve výkonu v rámci načítání trénovací sady dat, pro checkpoint zálohy a pro obnovení training procesu z checkpointů (viz. https://mlcommons.org/benchmarks/storage/).

Další informace o Huawei OceanStor AI Storage je možné získat na stránkách výrobce: https://e.huawei.com/en/products/storage/ai-storage

Rubriky: Technologie

Související příspěvky

Články

Investice do infrastruktury AI měly zpomalit, ale IDC nyní svou prognózu mění

12. 11. 2025
Enterprise AI 2025: ambice vs. realita
Články

Enterprise AI 2025: ambice vs. realita

11. 11. 2025
Zprávičky

Čína motivuje firmy k přechodu na domácí čipy pro AI levnější elektřinou

7. 11. 2025
Huawei AI ilustracni
Články

HPE představuje inovace v AI s využitím technologií NVIDIA

7. 11. 2025

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Souhlasím se Zásadami ochrany osobních údajů .

Zprávičky

Meta lákala zaměstnance OpenAI na bonus ve výši 100 milionů dolarů

Umělá inteligence se stává klíčovým prvkem bezpečnostních strategií

Pavel Houser
12. 11. 2025

Ve světle narůstajících kybernetických hrozeb stále více organizací přistupuje k umělé inteligenci (AI) jako

EK zvažuje, jak vyloučit čínské dodavatele z komunikačních sítí v EU

ČTK
12. 11. 2025

Evropská komise zkoumá možnosti, jak přinutit členské státy Evropské unie, aby ze svých telekomunikačních

Google investuje v příštích 4 letech v Německu 5,5 miliard eur

ČTK
12. 11. 2025

Americký internetový gigant Google investuje v příštích čtyřech letech v Německu 5,5 miliard eur

NÚKIB nařizuje aktualizovat MS Exchange Server

Podvodníci zneužívají zranitelnost ve službě Windows Server Update Services

Pavel Houser
11. 11. 2025

Experti ze Sophos Counter Threat Unit (CTU) odhalili, že kybernetičtí útočníci zneužívají zranitelnost ve

AWS oznamuje Fastnet, specializovaný vysokorychlostní transatlantický kabel spojující USA a Evropu

Pavel Houser
11. 11. 2025

Amazon Web Services (AWS) oznámil výstavbu Fastnetu – strategického transatlantického optického kabelu, který propojí

Fujitsu má novou platformu pro partnerskou spolupráci

SoftBank prodala za téměř 6 miliard dolarů celý svůj podíl v Nvidii

ČTK
11. 11. 2025

Japonský technologický konglomerát SoftBank prodal za 5,83 miliardy dolarů (zhruba 122,5 miliardy Kč) celý

IDC: Globální trh s tablety ve třetím čtvrtletí klesl, jedničkou zůstal Apple

ČTK
11. 11. 2025

Celosvětový trh s počítačovými tablety po šesti čtvrtletích nepřetržitého růstu ve třetím čtvrtletí klesl.

Čína osvobodí od cla vývoz čipů Nexperia pro civilní použití

ČTK
11. 11. 2025

Čína zavedla opatření, která osvobozují od vývozních omezení čipy Nexperia určené pro civilní použití.

Tiskové zprávy

Sandisk uvádí na trh nejmenší 1TB USB-C flash disk na světě

ZEBRA SYSTEMS: Omezené rozpočty a podceňování rizik jsou hlavní překážky k lepší kybernetické bezpečnosti

Red Hat podporuje digitální suverenitu Evropské unie

ČSÚ: Umělou inteligenci používá třetina populace

Společnosti Pure Storage a Cisco dodávají AI továrny pro podniky ve spolupráci s NVIDIA

Praha 6 získala od Letiště Praha 1200 licencí pro školení žáků ZŠ v otázkách kyberbezpečnosti

Zpráva dne

Neděste se upgradu: Windows 11 Pro na Halloween jen za €20.00 na Goodoffer24

Neděste se upgradu: Windows 11 Pro na Halloween jen za €20.00 na Goodoffer24

Redakce
15. 10. 2025

Halloween je tady a s ním i strašidelné ceny za software! Tak neváhejte a...

Komentujeme

Christian Klein, generální ředitel SAP

Digitální suverenita nestojí na ideálech, ale na konkrétních výsledcích

Christian Klein
23. 10. 2025

Diskuse o digitální suverenitě nabývá na celém světě na intenzitě. V dnešní době geopolitické nejistoty a...

Slovník

Index nákladů práce

FDMA

Google Analytics

Kategorie

  • Články
  • Komentujeme
  • Slovník
  • Tiskové zprávy
  • Zprávičky

Portál ITbiz.cz přináší informace z IT a byznysu již od roku 2006. Provozuje jej internetové vydavatelství Nitemedia.  Mezi další naše projekty patří například ABClinuxu.cz a Sciencemag.cz. Na stránce Redakce naleznete informace o redakci a možnostech inzerce.

Rubriky

Akce a události Byznys Cloud Ekomerce Hardware Internet Operační systémy Podnikový software Právo Science Security Technologie Telekomunikace veře Veřejná správa Vývoj a HTML Zpráva dne České IT
Žádné výsledky
Zobrazit všechny výsledky
  • Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události

© 2019 Vydává Nitemedia s.r.o. Hosting zajišťuje Greenhousing.cz.

Tento web používá cookies. Pokračováním dáváte souhlas s jejich používáním. Více na itbiz.cz/soukromi.