• Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události
Žádné výsledky
Zobrazit všechny výsledky
ITBiz.cz
ITBiz.cz
Žádné výsledky
Zobrazit všechny výsledky

Malé modely AI mají být velkým trendem

Pavel Houser
3. 1. 2025
| Komentujeme
Chvála černých skřínek

V záplavě prognóz technologického vývoje (nejen) v roce 2025 zde prozatím trochu zapadlo jedno téma, které se v souvislosti s umělou inteligencí na zahraničních vědeckých i technologických webech zmiňuje poměrně často: „zmenšení“ AI. Namísto velkých jazykových modelů LLM můžeme očekávat důraz na modely menší, respektive kompozitní architekturu.
Důvodů je hned několik: menší modely jde snáze provozovat přímo na koncových zařízeních, což snižuje rizika spojená s přesouváním dat (do firemního datového centra) nebo přímo s jejich předáváním třetí straně (při používání „veřejných“ služeb AI na serverech poskytovatele, při trénování modelů speciálně pro potřeby firmy…). Na koncových zařízeních se může provádět nejenom provoz, ale i trénování modelů.
Za druhé, méně robustní modely šetří energii a mohou ulevit těžce zkoušeným datovým centrům (tento problém se bude, jak se předpokládá, dále zvyšovat) – i když samozřejmě málokdo stojí o to, aby mu umělá inteligence vybíjela mobil. (Jinak úzkým hrdlem pro provoz i menšího modelu AI v koncovém zařízení bude nejspíš grafický procesor.)
Za třetí určitý typ aplikací potřebuje rychlé zpracování dat přímo u jejich zdrojů, tedy v edge prostředí. Okrajem infrastruktury přitom může být leccos.
A nakonec, menší, navzájem spolupracující modely mohou dávat i lepší výsledky. „Obecný“ model se může například spojovat se specializovaným, pokud usoudí, že otázka je na něj příliš odborná. V aplikaci pro daný obor si zase vystačíme přednostně se znalostmi určitého typu a důležité je opět hlavně to, aby model zjistil, kdy se má zeptat dál.
Viz také: Jak naučit modely umělé inteligence efektivně spolupracovat

Prakticky všechny podnikové aplikace jsou zaměřené „oborově“, prakticky žádná nepotřebuje znát informace (např.) o historii nebo zoologii.
Vědci z Princetonu a Stanfordu navrhli i provoz původně stejného LLM tak, že lokálně v zařízení poběží nějaká ořezaná verze (doslova se mluví o kompresi LLM). Takových algoritmů ovšem existuje více.
O budoucnosti menších modelů svědčí i to, že už je nabízejí také poskytovatelé těch velkých: Google, Microsoft, Meta a OpenAI a Amazon. A pokud menší modely fungují v režimu pro více uživatelů, pak jsou při stejné zátěži zdrojů pochopitelně rychlejší a zvládnou obsloužit současně více uživatelů.
A co se týče kompozitní architektury, Nicolas de Bellefonds z Boston Consulting Group dokonce navrhl následující uspořádání: vstupní interakci s uživatelem povede pouze velmi malý model, jehož jediným úkolem bude posoudit složitost otázky (takže porozumět jí ale bude muset dost přesně) a rozhodnout, který konkrétní, respektive jak velký model bude potřeba k jejímu zodpovězení; kdy „jak velký“ znamená „jaký nejmenší možný“…

Rubriky: Technologie

Související příspěvky

Zprávičky

Čína motivuje firmy k přechodu na domácí čipy pro AI levnější elektřinou

7. 11. 2025
Huawei AI ilustracni
Články

HPE představuje inovace v AI s využitím technologií NVIDIA

7. 11. 2025
Zákony informatiky: Když Brooksův zákon neplatí
Články

SAP zpřístupňuje vývojářům nové AI nástroje

6. 11. 2025
Zprávičky

Evropská centrální banka zahajuje další fázi projektu digitálního eura

5. 11. 2025

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Souhlasím se Zásadami ochrany osobních údajů .

Zprávičky

Anthropic rozšíří působení v Evropě, otevře kanceláře v Paříži a Mnichově

ČTK
9. 11. 2025

Americká společnost zabývající se umělou inteligencí Anthropic rozšíří své působení v Evropě a otevře

Zisk antivirové firmy Gen Digital ve čtvrtletí stoupl o 9 %

ČTK
7. 11. 2025

Antivirová společnost Gen Digital, která vznikla spojením americké NortonLifeLock a českého Avastu, vykázala ve

Gordic a Cybrela přinášejí komplexní řešení kybernetické bezpečnosti

Evropská komise navrhuje pozastavit část zákonů o umělé inteligenci

ČTK
7. 11. 2025

Evropská komise navrhuje pozastavit část svých přelomových zákonů o umělé inteligenci (AI) pod silným

Čína porazí USA v závodě o AI díky energii a pravidlům, varoval šéf Nvidie

ČTK
7. 11. 2025

Čína porazí Spojené státy v závodě o umělou inteligenci (AI), a to díky nižším

Čína motivuje firmy k přechodu na domácí čipy pro AI levnější elektřinou

ČTK
7. 11. 2025

Čína zavedla dotace, které sníží pro některá z největších datových center v zemi účty

750 zaměstnanců ČSOB se díky Atosu zvládlo rychle přesunout do domácích kanceláří

Skupina CSG založila dvě nové firmy se zaměřením na AI – JATISmro a Tendrio

ČTK
6. 11. 2025

Holding Czechoslovak Group (CSG) podnikatele Michala Strnada založil dvě nové akciové firmy JATISmro a

Průzkum: S portálem stavebníka se podle většiny úřadů stále pracuje s obtížemi

ČTK
6. 11. 2025

S portálem stavebníka, přes který stavebníci a projektanti posílají žádosti o stavební povolení, se

Německo zvažuje, že zaplatí operátorům, aby nahradili zařízení Huawei

ČTK
6. 11. 2025

Německo zvažuje, že zaplatí místním telekomunikačním operátorům včetně Deutsche Telekom, aby nahradili zařízení od

Tiskové zprávy

Praha 6 získala od Letiště Praha 1200 licencí pro školení žáků ZŠ v otázkách kyberbezpečnosti

ABSL ocenila nejvýznamnější inovace v oboru IT a podnikových služeb roku 2025

QNAP uvádí na trh TS-h2477AXU-RP

Banky zachránily svým klientům 7,5 miliardy korun, průměrná škoda na klienta stoupla na 21 903 Kč

Zyxel Networks představuje přihlašování bez hesla a zabezpečení pomocí umělé inteligence

Konecta a CrewAI spojují síly, aby přinesly revoluci do provozních modelů prostřednictvím agentické umělé inteligence

Zpráva dne

Neděste se upgradu: Windows 11 Pro na Halloween jen za €20.00 na Goodoffer24

Neděste se upgradu: Windows 11 Pro na Halloween jen za €20.00 na Goodoffer24

Redakce
15. 10. 2025

Halloween je tady a s ním i strašidelné ceny za software! Tak neváhejte a...

Kalendář

Lis 11
Celý den

Umělá inteligence v IT infrastruktuře

Zobrazit kalendář

Komentujeme

Christian Klein, generální ředitel SAP

Digitální suverenita nestojí na ideálech, ale na konkrétních výsledcích

Christian Klein
23. 10. 2025

Diskuse o digitální suverenitě nabývá na celém světě na intenzitě. V dnešní době geopolitické nejistoty a...

Slovník

PSTN

Emitent

Marketingová komunikace

Kategorie

  • Články
  • Komentujeme
  • Slovník
  • Tiskové zprávy
  • Zprávičky

Portál ITbiz.cz přináší informace z IT a byznysu již od roku 2006. Provozuje jej internetové vydavatelství Nitemedia.  Mezi další naše projekty patří například ABClinuxu.cz a Sciencemag.cz. Na stránce Redakce naleznete informace o redakci a možnostech inzerce.

Rubriky

Akce a události Byznys Cloud Ekomerce Hardware Internet Operační systémy Podnikový software Právo Science Security Technologie Telekomunikace veře Veřejná správa Vývoj a HTML Zpráva dne České IT
Žádné výsledky
Zobrazit všechny výsledky
  • Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události

© 2019 Vydává Nitemedia s.r.o. Hosting zajišťuje Greenhousing.cz.

Tento web používá cookies. Pokračováním dáváte souhlas s jejich používáním. Více na itbiz.cz/soukromi.