• Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události
Žádné výsledky
Zobrazit všechny výsledky
ITBiz.cz
ITBiz.cz
Žádné výsledky
Zobrazit všechny výsledky

Malé modely AI mají být velkým trendem

Pavel Houser
3. 1. 2025
| Komentujeme
Chvála černých skřínek

V záplavě prognóz technologického vývoje (nejen) v roce 2025 zde prozatím trochu zapadlo jedno téma, které se v souvislosti s umělou inteligencí na zahraničních vědeckých i technologických webech zmiňuje poměrně často: „zmenšení“ AI. Namísto velkých jazykových modelů LLM můžeme očekávat důraz na modely menší, respektive kompozitní architekturu.
Důvodů je hned několik: menší modely jde snáze provozovat přímo na koncových zařízeních, což snižuje rizika spojená s přesouváním dat (do firemního datového centra) nebo přímo s jejich předáváním třetí straně (při používání „veřejných“ služeb AI na serverech poskytovatele, při trénování modelů speciálně pro potřeby firmy…). Na koncových zařízeních se může provádět nejenom provoz, ale i trénování modelů.
Za druhé, méně robustní modely šetří energii a mohou ulevit těžce zkoušeným datovým centrům (tento problém se bude, jak se předpokládá, dále zvyšovat) – i když samozřejmě málokdo stojí o to, aby mu umělá inteligence vybíjela mobil. (Jinak úzkým hrdlem pro provoz i menšího modelu AI v koncovém zařízení bude nejspíš grafický procesor.)
Za třetí určitý typ aplikací potřebuje rychlé zpracování dat přímo u jejich zdrojů, tedy v edge prostředí. Okrajem infrastruktury přitom může být leccos.
A nakonec, menší, navzájem spolupracující modely mohou dávat i lepší výsledky. „Obecný“ model se může například spojovat se specializovaným, pokud usoudí, že otázka je na něj příliš odborná. V aplikaci pro daný obor si zase vystačíme přednostně se znalostmi určitého typu a důležité je opět hlavně to, aby model zjistil, kdy se má zeptat dál.
Viz také: Jak naučit modely umělé inteligence efektivně spolupracovat

Prakticky všechny podnikové aplikace jsou zaměřené „oborově“, prakticky žádná nepotřebuje znát informace (např.) o historii nebo zoologii.
Vědci z Princetonu a Stanfordu navrhli i provoz původně stejného LLM tak, že lokálně v zařízení poběží nějaká ořezaná verze (doslova se mluví o kompresi LLM). Takových algoritmů ovšem existuje více.
O budoucnosti menších modelů svědčí i to, že už je nabízejí také poskytovatelé těch velkých: Google, Microsoft, Meta a OpenAI a Amazon. A pokud menší modely fungují v režimu pro více uživatelů, pak jsou při stejné zátěži zdrojů pochopitelně rychlejší a zvládnou obsloužit současně více uživatelů.
A co se týče kompozitní architektury, Nicolas de Bellefonds z Boston Consulting Group dokonce navrhl následující uspořádání: vstupní interakci s uživatelem povede pouze velmi malý model, jehož jediným úkolem bude posoudit složitost otázky (takže porozumět jí ale bude muset dost přesně) a rozhodnout, který konkrétní, respektive jak velký model bude potřeba k jejímu zodpovězení; kdy „jak velký“ znamená „jaký nejmenší možný“…

Rubriky: Technologie

Související příspěvky

Články

Huawei představuje řešení AI Data Lake pro rozvoj inteligentních technologií v průmyslu

7. 5. 2025
Na kvantovém počítači D-Wave faktorizovali číslo 8 219 999
Články

Fujitsu a Riken hlásí milník v kvantových počítačích

6. 5. 2025
Zprávičky

OpenAI zůstane pod kontrolou neziskové organizace

5. 5. 2025
Články

Umělá inteligence a budoucnost všeho: Pět způsobů, jak AI změní náš svět k nepoznání

2. 5. 2025

Zprávičky

Trump chce zrušit Bidenovo omezení na vývoz pokročilých čipů

ČTK
8. 5. 2025

Administrativa amerického prezidenta Donalda Trumpa plánuje zrušit omezení vývozu pokročilých počítačových polovodičů, které zavedl

Brusel žaluje pět zemí EU včetně Česka za nedostatečné provádění nařízení DSA (aktualizováno)

ČTK
7. 5. 2025

Evropská komise (EK) se rozhodla zažalovat Českou republiku, Španělsko, Kypr, Polsko a Portugalsko za

Antivirová společnost Gen Digital zvýšila celoroční provozní zisk o 45 %

ČTK
7. 5. 2025

Antivirová společnost Gen Digital, která vznikla spojením české firmy Avast s americkou NortonLifeLock, ve

Prodej amerického komunikačního vybavení Česku se týká kryptografických zařízení

ČTK
7. 5. 2025

Prodej vojenského komunikačního vybavení České republice v hodnotě 181 milionů dolarů (zhruba čtyři miliardy

Německo postihl rozsáhlý výpadek komunikačního systému pro policii či hasiče

ČTK
6. 5. 2025

Německo dnes podle agentury DPA postihl rozsáhlý výpadek šifrovaného komunikačního systému využívaného policií, hasiči,

Novozélandský premiér navrhuje zákazat sociální média pro osoby mladší 16 let

ČTK
6. 5. 2025

Novozélandský premiér Christopher Luxon chce zakázat dětem mladším 16 let přístup na sociální sítě.

750 zaměstnanců ČSOB se díky Atosu zvládlo rychle přesunout do domácích kanceláří

USA schválily možný prodej komunikačního vybavení České republice

ČTK
6. 5. 2025

Americké ministerstvo zahraničí schválilo možný prodej komunikačního vybavení a souvisejícího příslušenství České republice v

DevOps lze realizovat i v režimu on-premise

OpenAI plánuje rekordní akvizici nástroje Windsurf za 3 miliardy dolarů

ČTK
6. 5. 2025

Americká společnost OpenAI plánuje koupit nástroj s umělou inteligencí (AI) pro psaní kódu Windsurf

Tiskové zprávy

Partnerství společností Nutanix a Pure Storage přinese zákazníkům větší možnosti volby díky novému integrovanému řešení pro kritické pracovní úlohy

Speciální polep Ferrari pro Miami: technologie a design v podání HP

Nadace Mission 44 Lewise Hamiltona a HP podpoří dovednosti mladých v oblasti přírodních a technických věd

Během posledních 48 hodin zachytila VZP rozeslání až 100 tisíc podvodných e-mailů

S barefooty chce dobýt svět. Be Lenka proto nasazuje systém od SAP, který rok ladila s českým ACTUM Digital

Synology oznamuje DiskStation DS925+ a rozšiřující jednotku DX525

Zpráva dne

Nešlehejte vejce ale Windows 11 na Goodofer24 jen za €20.00!

Nešlehejte vejce ale Windows 11 na Goodofer24 jen za €20.00!

Redakce
15. 4. 2025

Ať už máte PC se starším systémem Windows, nebo si stavíte PC podle vašich...

Videa ITBiz.cz

Glenn Mallon, Dell Technologies

Elektronická recepční

FORXAI Mirror

Kamery pro průmysl a detekci požárů

Kamery pro vyhodnocení spokojenosti zákazníků

Kalendář

Kvě 13
Celý den

Cloud Computing Conference

Kvě 27
Celý den

Kontajnery v praxi

Říj 1
Celý den

Cyber Attacks

Zobrazit kalendář

Komentujeme

Chvála černých skřínek

Malé modely AI mají být velkým trendem

Pavel Houser
3. 1. 2025

V záplavě prognóz technologického vývoje (nejen) v roce 2025 zde prozatím trochu zapadlo jedno téma, které...

Odebírat newsletter

Zásady ochrany osobních údajů.

Zkontrolujte svoji doručenou poštu a potvrďte odběr.

Slovník

Financial analyst

ADSL

Bluetooth

Kategorie

  • Články
  • Komentujeme
  • Slovník
  • Tiskové zprávy
  • Zprávičky

Portál ITbiz.cz přináší informace z IT a byznysu již od roku 2006. Provozuje jej internetové vydavatelství Nitemedia. Hosting zajišťuje společnost Greenhousing.cz. Mezi další naše projekty patří například ABClinuxu.cz a Sciencemag.cz. Na stránce Redakce naleznete informace o redakci a možnostech inzerce.

Rubriky

Akce a události Byznys Cloud Ekomerce Hardware Internet Operační systémy Podnikový software Právo Science Security Technologie Telekomunikace Veřejná správa Vývoj a HTML Zpráva dne České IT

Píšeme jinde

RSS ScienceMag RSS

  • Alternativní verze černých děr: obejdou se bez singularity nebo i bez horizontu
  • Experiment METRO navržený českými vědci zamíří na ISS
  • Zviditelnili teorii relativity: rychlé objekty vypadají pootočeně

RSS AbcLinuxu RSS

  • Visual Studio Code a VSCodium 1.100
  • Home Assistant 2025.5
  • OpenSearch 3.0

Newsletter

Zásady ochrany osobních údajů.

Zkontrolujte svoji doručenou poštu a potvrďte odběr.

Žádné výsledky
Zobrazit všechny výsledky
  • Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události

© 2019 Vydává Nitemedia s.r.o. Hosting zajišťuje Greenhousing.cz.

Tento web používá cookies. Pokračováním dáváte souhlas s jejich používáním. Více na itbiz.cz/soukromi.