• Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události
Žádné výsledky
Zobrazit všechny výsledky
ITBiz.cz
ITBiz.cz
Žádné výsledky
Zobrazit všechny výsledky

Malé modely AI mají být velkým trendem

Pavel Houser
3. 1. 2025
| Komentujeme
Chvála černých skřínek

V záplavě prognóz technologického vývoje (nejen) v roce 2025 zde prozatím trochu zapadlo jedno téma, které se v souvislosti s umělou inteligencí na zahraničních vědeckých i technologických webech zmiňuje poměrně často: „zmenšení“ AI. Namísto velkých jazykových modelů LLM můžeme očekávat důraz na modely menší, respektive kompozitní architekturu.
Důvodů je hned několik: menší modely jde snáze provozovat přímo na koncových zařízeních, což snižuje rizika spojená s přesouváním dat (do firemního datového centra) nebo přímo s jejich předáváním třetí straně (při používání „veřejných“ služeb AI na serverech poskytovatele, při trénování modelů speciálně pro potřeby firmy…). Na koncových zařízeních se může provádět nejenom provoz, ale i trénování modelů.
Za druhé, méně robustní modely šetří energii a mohou ulevit těžce zkoušeným datovým centrům (tento problém se bude, jak se předpokládá, dále zvyšovat) – i když samozřejmě málokdo stojí o to, aby mu umělá inteligence vybíjela mobil. (Jinak úzkým hrdlem pro provoz i menšího modelu AI v koncovém zařízení bude nejspíš grafický procesor.)
Za třetí určitý typ aplikací potřebuje rychlé zpracování dat přímo u jejich zdrojů, tedy v edge prostředí. Okrajem infrastruktury přitom může být leccos.
A nakonec, menší, navzájem spolupracující modely mohou dávat i lepší výsledky. „Obecný“ model se může například spojovat se specializovaným, pokud usoudí, že otázka je na něj příliš odborná. V aplikaci pro daný obor si zase vystačíme přednostně se znalostmi určitého typu a důležité je opět hlavně to, aby model zjistil, kdy se má zeptat dál.
Viz také: Jak naučit modely umělé inteligence efektivně spolupracovat

Prakticky všechny podnikové aplikace jsou zaměřené „oborově“, prakticky žádná nepotřebuje znát informace (např.) o historii nebo zoologii.
Vědci z Princetonu a Stanfordu navrhli i provoz původně stejného LLM tak, že lokálně v zařízení poběží nějaká ořezaná verze (doslova se mluví o kompresi LLM). Takových algoritmů ovšem existuje více.
O budoucnosti menších modelů svědčí i to, že už je nabízejí také poskytovatelé těch velkých: Google, Microsoft, Meta a OpenAI a Amazon. A pokud menší modely fungují v režimu pro více uživatelů, pak jsou při stejné zátěži zdrojů pochopitelně rychlejší a zvládnou obsloužit současně více uživatelů.
A co se týče kompozitní architektury, Nicolas de Bellefonds z Boston Consulting Group dokonce navrhl následující uspořádání: vstupní interakci s uživatelem povede pouze velmi malý model, jehož jediným úkolem bude posoudit složitost otázky (takže porozumět jí ale bude muset dost přesně) a rozhodnout, který konkrétní, respektive jak velký model bude potřeba k jejímu zodpovězení; kdy „jak velký“ znamená „jaký nejmenší možný“…

Rubriky: Technologie

Související příspěvky

Drony vytvářejí digitální dvojče kostela v Mostě
Zprávičky

Drony vytvářejí digitální dvojče kostela v Mostě

19. 5. 2026
Novinky v Red Hat AI: jednotný rámec pro vývojáře i provoz
Články

Novinky v Red Hat AI: jednotný rámec pro vývojáře i provoz

19. 5. 2026
Zprávičky

Švédská kavárna Andon je plně v rukou AI

18. 5. 2026
Hosting v karanténě – zájem o služby a nárůst datového provozu
Články

HPE realizuje vizi autonomně řízených počítačových sítí

18. 5. 2026

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Zprávičky

Vláda projedná novelu, která zpřesní pravomoci NÚKIB

NSS: Krajský soud musí znovu rozhodnout o digitalizaci stavebního řízení

ČTK
19. 5. 2026

Krajský soud v Brně musí znovu posoudit rozhodnutí Úřadu pro ochranu hospodářské soutěže (ÚOHS),

Drony vytvářejí digitální dvojče kostela v Mostě

Drony vytvářejí digitální dvojče kostela v Mostě

Redakce
19. 5. 2026

Nad přesunutým kostelem Nanebevzetí Panny Marie v Mostě létal dron v autonomním režimu a

Jeden z prvních počítačů Apple se v USA vydražil za více než 223 000 dolarů

Musk prohrál soudní spor s firmou OpenAI

ČTK
19. 5. 2026

Americký miliardář Elon Musk prohrál soudní spor se společností OpenAI, která se podle jeho

Švédská kavárna Andon je plně v rukou AI

ČTK
18. 5. 2026

Kávu sice nalévá lidská ruka, ale za pultem v experimentální kavárně ve Stockholmu tahá

Novinky v MSP platformě Acronis: přístup k Cyber Frame, snazší nasazení Synology a umělá inteligence v RMM službách

Novinky v MSP platformě Acronis: přístup k Cyber Frame, snazší nasazení Synology a umělá inteligence v RMM službách

itbiz
17. 5. 2026

Podpora Windows Server 2025 rozšiřuje možnosti obnovy po havárii i na novější serverová prostředí.

Muskova SpaceX rozštěpí akcie, snížit tak cenu před vstupem na burzu

ČTK
16. 5. 2026

Vesmírná společnost SpaceX miliardáře Elona Muska rozštěpí své akcie v poměru 5:1. Podle agentury

Foxconn díky zájmu o umělou inteligenci zvýšil čtvrtletní zisk téměř o pětinu

ČTK
15. 5. 2026

Tchajwanská společnost Foxconn, která je největším smluvním výrobcem elektroniky na světě, zvýšila v prvním

Světový trh s polovodiči do roku 2030 přesáhne 1,5 bilionu dolarů, odhaduje TSMC

ČTK
15. 5. 2026

Světový trh s polovodiči přesáhne do roku 2030 hodnotu 1,5 bilionu dolarů (přes 31

Tiskové zprávy

HP představuje nové velkoformátové tiskárny pro malé a střední firmy

ViewSonic podpořil Halu roku 2026

Q1 výsledky společnosti T-Mobile

SAP Business One řídí distribuci klimatizací a tepelných čerpadel Midea

Laboratoř ComSource je nově vybavena technologií OPSWAT Smart Touch

Společnost Zyxel Networks představuje řešení GenAI Protection na ochranu před riziky spojenými se stínovou AI

Zpráva dne

Nedávejte svým milovaným na Mikuláše sladkosti, radši Windows 11 CDkey od Goodoffer24.com!

Nedávejte svým milovaným na Mikuláše sladkosti, radši Windows 11 CDkey od Goodoffer24.com!

Redakce
5. 12. 2025

Na Mikuláše ani sladkosti, už vůbec ne uhlí ani brambory, ale radši nový software,...

Kalendář

Kvě 19
Doporučené 19. května - 21. května

TechEd 2026

Kvě 26
Celý den

Umelá inteligencia v IT infraštruktúre

Zář 23
Celý den

Cyber Attacks

Zobrazit kalendář

Odebírat newsletter

Zásady ochrany osobních údajů.

Zkontrolujte svoji doručenou poštu a potvrďte odběr.

Slovník

Freeware

Joomla!

3G

Komentujeme

itbiz kamil pittner

Znamená pomalost přemýšlivost? A co u AI?

Kamil Pittner
8. 5. 2026

Dodavatelé modelů AI soupeří o to, aby jejich systémy poskytovaly nejen lepší odpovědi, ale také pracovaly...

Kategorie

  • Články
  • Komentujeme
  • Slovník
  • Tiskové zprávy
  • Zprávičky

Portál ITbiz.cz přináší informace z IT a byznysu již od roku 2006. Provozuje jej internetové vydavatelství Nitemedia.  Mezi další naše projekty patří například ABClinuxu.cz a Sciencemag.cz. Na stránce Redakce naleznete informace o redakci a možnostech inzerce.

Rubriky

Akce a události Byznys Cloud Ekomerce Hardware Internet Operační systémy Podnikový software Právo Science Security Technologie Telekomunikace veře Veřejná správa Vývoj a HTML Zpráva dne České IT
Žádné výsledky
Zobrazit všechny výsledky
  • Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události

© 2019 Vydává Nitemedia s.r.o. Hosting zajišťuje Greenhousing.cz.