• Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události
Žádné výsledky
Zobrazit všechny výsledky
ITBiz.cz
ITBiz.cz
Žádné výsledky
Zobrazit všechny výsledky

Malé modely AI mají být velkým trendem

Pavel Houser
3. 1. 2025
| Komentujeme
Chvála černých skřínek

V záplavě prognóz technologického vývoje (nejen) v roce 2025 zde prozatím trochu zapadlo jedno téma, které se v souvislosti s umělou inteligencí na zahraničních vědeckých i technologických webech zmiňuje poměrně často: „zmenšení“ AI. Namísto velkých jazykových modelů LLM můžeme očekávat důraz na modely menší, respektive kompozitní architekturu.
Důvodů je hned několik: menší modely jde snáze provozovat přímo na koncových zařízeních, což snižuje rizika spojená s přesouváním dat (do firemního datového centra) nebo přímo s jejich předáváním třetí straně (při používání „veřejných“ služeb AI na serverech poskytovatele, při trénování modelů speciálně pro potřeby firmy…). Na koncových zařízeních se může provádět nejenom provoz, ale i trénování modelů.
Za druhé, méně robustní modely šetří energii a mohou ulevit těžce zkoušeným datovým centrům (tento problém se bude, jak se předpokládá, dále zvyšovat) – i když samozřejmě málokdo stojí o to, aby mu umělá inteligence vybíjela mobil. (Jinak úzkým hrdlem pro provoz i menšího modelu AI v koncovém zařízení bude nejspíš grafický procesor.)
Za třetí určitý typ aplikací potřebuje rychlé zpracování dat přímo u jejich zdrojů, tedy v edge prostředí. Okrajem infrastruktury přitom může být leccos.
A nakonec, menší, navzájem spolupracující modely mohou dávat i lepší výsledky. „Obecný“ model se může například spojovat se specializovaným, pokud usoudí, že otázka je na něj příliš odborná. V aplikaci pro daný obor si zase vystačíme přednostně se znalostmi určitého typu a důležité je opět hlavně to, aby model zjistil, kdy se má zeptat dál.
Viz také: Jak naučit modely umělé inteligence efektivně spolupracovat

Prakticky všechny podnikové aplikace jsou zaměřené „oborově“, prakticky žádná nepotřebuje znát informace (např.) o historii nebo zoologii.
Vědci z Princetonu a Stanfordu navrhli i provoz původně stejného LLM tak, že lokálně v zařízení poběží nějaká ořezaná verze (doslova se mluví o kompresi LLM). Takových algoritmů ovšem existuje více.
O budoucnosti menších modelů svědčí i to, že už je nabízejí také poskytovatelé těch velkých: Google, Microsoft, Meta a OpenAI a Amazon. A pokud menší modely fungují v režimu pro více uživatelů, pak jsou při stejné zátěži zdrojů pochopitelně rychlejší a zvládnou obsloužit současně více uživatelů.
A co se týče kompozitní architektury, Nicolas de Bellefonds z Boston Consulting Group dokonce navrhl následující uspořádání: vstupní interakci s uživatelem povede pouze velmi malý model, jehož jediným úkolem bude posoudit složitost otázky (takže porozumět jí ale bude muset dost přesně) a rozhodnout, který konkrétní, respektive jak velký model bude potřeba k jejímu zodpovězení; kdy „jak velký“ znamená „jaký nejmenší možný“…

Rubriky: Technologie

Související příspěvky

Zprávičky

Čínské firmy trénují modely AI v cizině, aby měly přístup k čipům od Nvidie

28. 11. 2025
Huawei AI ilustracni
Zprávičky

Meta jedná o investici miliard dolarů do čipů Googlu

26. 11. 2025
Nové varianty WormGPT pohání AI modely Grok a Mixtral
Články

Legitimní webové stránky lze zneužít k manipulaci webových prohlížečů v režimu AI

25. 11. 2025
Huawei potřetí za sebou mezi lídry podnikových sítí
Články

Huawei potřetí za sebou mezi lídry podnikových sítí

25. 11. 2025

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Souhlasím se Zásadami ochrany osobních údajů .

Zprávičky

Česko začalo jednat s Polskem o společné přihlášce do projektu AI Gigafactory

ČTK
28. 11. 2025

Česko začalo jednat s Polskem o společné přihlášce do projektu evropské AI Gigafactory. Součástí

Komise: Služby Apple Ads a Apple Maps by měly v EU podléhat přísnějším pravidlům

ČTK
28. 11. 2025

Služby Apple Ads a Apple Maps americké technologické společnosti Apple jsou v prostředí internetu

NKÚ kontroloval bezpečnostní výzkum financovaný Ministerstvem vnitra

Kriminalistický ústav bude využívat robotické zařízení pro zkoumání předmětů

ČTK
28. 11. 2025

Kriminalistický ústav bude od příštího roku využívat nové robotické zařízení Erbium, které umožní bezpečně

Čínské firmy trénují modely AI v cizině, aby měly přístup k čipům od Nvidie

ČTK
28. 11. 2025

Čínské technologické společnosti trénují modely umělé inteligence (AI) v zahraničí. Daří se jim tak

Riziko prolamování šifrované komunikace: Státy EU se shodly na návrhu proti dětské pornografii, Česko hlasovalo proti (aktualizace)

ČTK
27. 11. 2025

Zástupci členských států EU se včera shodli na návrhu, který má bojovat proti šíření

ČR si letos v žebříčku zemí podle digitálního prostředí polepšila na 24. místo

ČTK
27. 11. 2025

Česká republika si v celosvětovém hodnocení kvality digitálního prostředí letos polepšila o tři příčky

Counterpoint: Apple se letos vrátí do čela světového trhu s chytrými telefony

ČTK
27. 11. 2025

Americká technologická společnost Apple se v letošním roce poprvé za více než deset let

Centra služeb míří do ČR kvůli lidem a poloze

Průzkum Acronis: téměř 50 % českých organizací si nemůže dovolit ztratit data za více než 4 hodiny

Pavel Houser
27. 11. 2025

17 % respondentů vyžaduje od systémů obnovy po havárii, aby garantovaly zálohu starou maximálně

Tiskové zprávy

Huawei uvedla na trh nové konvergované systémy úložišť OceanStor Dorado

Společnost Hewlett Packard Enterprise ocenila v Česku Partnery roku 2025

Spisová služba GINIS společnosti Gordic získala jako první atest

Zyxel Networks představuje první průmyslový WiFi 7 přístupový bod pro rychlejší přechod na průmysl 4.0

Nové skenery Canon imageFORMULA: Maximální výkon na minimálním prostoru

Když cloud nestačí: proč se firmám vyplatí trvalé licence Microsoft

Zpráva dne

Neděste se upgradu: Windows 11 Pro na Halloween jen za €20.00 na Goodoffer24

Neděste se upgradu: Windows 11 Pro na Halloween jen za €20.00 na Goodoffer24

Redakce
15. 10. 2025

Halloween je tady a s ním i strašidelné ceny za software! Tak neváhejte a...

Komentujeme

Chvála černých skřínek

Neocloudy – nové slovo, prudký růst?

Pavel Houser
24. 11. 2025

Opět se vše točí kolem GPU a AI. Poskytovatelé cloudových služeb nového typu („neoclouds“) mají v...

Slovník

Browser cache

Autofire

Fluktuace

Kategorie

  • Články
  • Komentujeme
  • Slovník
  • Tiskové zprávy
  • Zprávičky

Portál ITbiz.cz přináší informace z IT a byznysu již od roku 2006. Provozuje jej internetové vydavatelství Nitemedia.  Mezi další naše projekty patří například ABClinuxu.cz a Sciencemag.cz. Na stránce Redakce naleznete informace o redakci a možnostech inzerce.

Rubriky

Akce a události Byznys Cloud Ekomerce Hardware Internet Operační systémy Podnikový software Právo Science Security Technologie Telekomunikace veře Veřejná správa Vývoj a HTML Zpráva dne České IT
Žádné výsledky
Zobrazit všechny výsledky
  • Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události

© 2019 Vydává Nitemedia s.r.o. Hosting zajišťuje Greenhousing.cz.

Tento web používá cookies. Pokračováním dáváte souhlas s jejich používáním. Více na itbiz.cz/soukromi.