• Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události
Žádné výsledky
Zobrazit všechny výsledky
ITBiz.cz
ITBiz.cz
Žádné výsledky
Zobrazit všechny výsledky

Malý model AI pomůže velkému přepínat mezi přirozeným jazykem a kódem

Pavel Houser
3. 10. 2025
| Články
Zákony informatiky: Když Brooksův zákon neplatí

Zdroj: Pixabay

Velké jazykové modely (LLM) mají často potíže správně vyřešit i ty nejjednodušší matematické nebo logické (respektive podobně „exaktní“) problémy. Některé LLM si mohou pro zpracování symbolických dotazů generovat kód, modely ale ne vždy vědí, kdy mají kód použít nebo jaký druh kódu by fungoval nejlépe.

Proto vznikl CodeSteer: asistent pro LLM vyvinutý na MITu, který vede LLM k přepínání mezi využitím kódu a textu, dokud správně neodpoví na dotaz.
CodeSteer, který je sám o sobě menším LLM, automaticky generuje sérii pokynů k iterativnímu řízení většího LLM. Po každém kole zkontroluje aktuální a předchozí odpovědi modelu a poskytne pokyny, jak může dané řešení opravit nebo vylepšit, dokud nepovažuje odpověď za správnou.
Vědci zjistili, že doplnění většího LLM o CodeSteer zvýšilo jeho přesnost při symbolických úkolech, jako je násobení čísel, hraní Sudoku a skládání kostek, o více než 30 %. Umožnilo také méně sofistikovaným modelům překonat pokročilejší modely s vylepšenými schopnostmi uvažování.
Tento pokrok by mohl zlepšit schopnosti LLM řešit složité úkoly, které jsou zvlášť obtížné vyřešit pouze pomocí textového uvažování, jako je generování tras pro roboty v proměnlivých prostředích nebo plánování zásilek v mezinárodním dodavatelském řetězci.

Trochu podrobněji podle průvodní tiskové zprávy: Zeptáte-li se LLM, které číslo je větší, 9,11 nebo 9,9, na základě „textového uvažování“ je umělá inteligence schopna dát i na takto triviální otázku chybnou odpověď. Bude-li model na stejnou otázku odpovídat pomocí kódu, vygeneruje si spustí skript (typicky v Pythonu), který porovná obě čísla, a snadno tak vyřeší problém.
LLM, které byly původně trénovány k porozumění a předpovídání lidského jazyka, mají větší tendenci odpovídat na dotazy pomocí textu, i když by byl efektivnější kód (poznámka: míněno pro „mezipoužití“ v rámci procesu odpovídání, uživatel samotný kód vůbec uvidět nemusí). Navíc tyto modely někdy generují nesprávnou nebo méně efektivní verzi kódu. Místo toho, aby se pokoušeli přecvičit výkonný LLM jako GPT-4 nebo Claude a vylepšit jeho schopnosti, natrénovali výzkumníci z MITu menší, lehký LLM tak, aby vedl větší model k přepínání mezi textem a kódem. Doladění prostřednictvím menšího modelu nemění větší LLM, takže nehrozí riziko, že by to narušilo ostatní schopnosti většího modelu.

CodeSteer nejprve zkontroluje dotaz a určí, zda je pro tento problém vhodnější text nebo kód a jaký druh kódu by byl případně nejlepší.
Poté vygeneruje výzvu pro větší LLM a sdělí mu, aby k zodpovězení dotazu použil metodu kódu nebo textové uvažování. Větší model se řídí touto výzvou, zodpoví dotaz a odešle výsledek zpět do CodeSteer, který jej zkontroluje. Pokud odpověď není správná, CodeSteer bude LLM nadále vyzývat, aby vyzkoušel různé možnosti, které by mohly problém vyřešit, například začlenění vyhledávacího algoritmu nebo jiné úpravy kódu, dokud nebude odpověď správná. Autoři výzkumu v této souvislosti zmiňují, že větší LLM bývá často líný a používá kratší, méně efektivní kód, který třeba ani neprovede symbolický „výpočet“ správně. Uvádějí, že univerzální model doplněný o CodeSteer může dosáhnout vyšší přesnosti než nejmodernější modely zaměřené na komplexní uvažování a plánování, přičemž vyžaduje mnohem méně výpočetního výkonu.

Yongchao Chen et al, CodeSteer: Symbolic-Augmented Language Models via Code/Text Guidance, arXiv (2025). DOI: 10.48550/arxiv.2502.04350
Zdroj: Massachusetts Institute of Technology / MIT News / TechXplore.com

Rubriky: TechnologieVývoj a HTML

Související příspěvky

Zprávičky

Brusel hodlá vyloučit čínské technologie z kritické infrastruktury

18. 1. 2026
Články

AWS spouští první evropský suverénní cloud

16. 1. 2026
Zprávičky

TSMC má díky poptávce po čipech pro umělou inteligenci rekordní zisk

15. 1. 2026
HP má novou generaci firemních notebooků pro práci s AI
Články

HP má novou generaci firemních notebooků pro práci s AI

15. 1. 2026

Zprávičky

Brusel hodlá vyloučit čínské technologie z kritické infrastruktury

ČTK
18. 1. 2026

Evropská komise plánuje postupné vyloučení čínských technologií z kritické infrastruktury v Evropské unii. Dotknout

Seznam.cz už nesídlí na Kypru, ale ve Švýcarsku

ČTK
17. 1. 2026

Největší internetová firma v Česku Seznam.cz, kterou vlastní Ivo Lukačovič, už nesídlí na Kypru,

Umělá inteligence v IT infrastruktuře

Trump zavádí 25procentní clo na některé čipy, umožní poplatky za prodej v Číně

ČTK
16. 1. 2026

Americký prezident Donald Trump zavedl 25procentní poplatek na prodej pokročilých čipů Nvidia H200 a

NKÚ: Na digitalizaci 50 mld. nestačilo, pouze 18 procent služeb státu je online

ČTK
16. 1. 2026

Miliardy korun na digitalizaci služeb státu nestačily. Stát do ní v letech 2020 až

Wikipedia se dohodla s několika firmami na využívání obsahu pro trénování AI

ČTK
16. 1. 2026

Nadace Wikimedia, která je provozovatelem internetové encyklopedie Wikipedia, oznámila u příležitosti 25. výročí vzniku

TSMC má díky poptávce po čipech pro umělou inteligenci rekordní zisk

ČTK
15. 1. 2026

Tchajwanská společnost Taiwan Semiconductor Manufacturing (TSMC) ve čtvrtém čtvrtletí zvýšila čistý zisk o 35

Obraty e-shopů rostly v ČR meziročně o 6 %, v roce 2025 dosáhly 206 miliard korun

itbiz
15. 1. 2026

České e-commerce se v roce 2025 dařilo a dosáhla meziročního růstu 6 %. On-line

České Radiokomunikace začaly nabízet kapacitu svých center pro AI služby

ČTK
15. 1. 2026

České Radiokomunikace začaly nabízet kapacitu svých datových center pro služby umělé inteligence (AI). Letos

Tiskové zprávy

FEL ČVUT otevírá dva nové magisterské programy. Reaguje na strategickou potřebu odborníků na čipy i moderní elektroniku

HPE rozšiřuje portfolio síťových řešení a serverů pro maloobchod

Jan-Jaap Jager novým generálním ředitelem Acronis

Vláda rozhodla, že Česko bude mít nového zmocněnce pro umělou inteligenci

Cato Networks rozšiřuje pražský tým v nových kancelářích a nechává zazářit své kolegy v náborové kampani

Dell vrací na trh ikonickou značku XPS s přepracovaným designem

Zpráva dne

Nedávejte svým milovaným na Mikuláše sladkosti, radši Windows 11 CDkey od Goodoffer24.com!

Nedávejte svým milovaným na Mikuláše sladkosti, radši Windows 11 CDkey od Goodoffer24.com!

Redakce
5. 12. 2025

Na Mikuláše ani sladkosti, už vůbec ne uhlí ani brambory, ale radši nový software,...

Komentujeme

itbiz kamil pittner

Platformové inženýrství: popularita termínu může vést ke zmatení

Kamil Pittner
2. 1. 2026

Podobně jako v případě DevOps se i termín platformové inženýrství stal natolik oblíbeným, až se začal...

Slovník

Handsfree

.MP4

Loajalita

Kategorie

  • Články
  • Komentujeme
  • Slovník
  • Tiskové zprávy
  • Zprávičky

Portál ITbiz.cz přináší informace z IT a byznysu již od roku 2006. Provozuje jej internetové vydavatelství Nitemedia.  Mezi další naše projekty patří například ABClinuxu.cz a Sciencemag.cz. Na stránce Redakce naleznete informace o redakci a možnostech inzerce.

Rubriky

Akce a události Byznys Cloud Ekomerce Hardware Internet Operační systémy Podnikový software Právo Science Security Technologie Telekomunikace veře Veřejná správa Vývoj a HTML Zpráva dne České IT
Žádné výsledky
Zobrazit všechny výsledky
  • Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události

© 2019 Vydává Nitemedia s.r.o. Hosting zajišťuje Greenhousing.cz.

Tento web používá cookies. Pokračováním dáváte souhlas s jejich používáním. Více na itbiz.cz/soukromi.