• Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události
Žádné výsledky
Zobrazit všechny výsledky
ITBiz.cz
ITBiz.cz
Žádné výsledky
Zobrazit všechny výsledky

Halucinace balíčků při programování AI: Nejlépe vyšly modely GPT, Python je méně náchylný než JavaScript

Pavel Houser
25. 4. 2025
| Články
DevOps lze realizovat i v režimu on-premise

Zdroj: PIxabay

Halucinace balíčků při vývoji softwaru pomocí modelů LLM vytváří nejen chyby, ale může vést i k bezpečnostním zranitelnostem. Komplexní studii na toto téma nyní provedli výzkumníci z University of Texas (San Antonio) a dalších akademických institucí.
Halucinace umělé inteligence budí největší pozornost, když velké jazykové modely produkují obsah v přirozeném jazyce. LLM se ale stále častěji používají k tvorbě kódu. Zde pak tzv. package hallucinations znamená generování programu odkazující se na neexistující softwarovou knihovnu třetí strany. Samo o sobě není na takovém odkazu nic podezřelého, knihovny třetích stran využívá drtivá většina programů. Navíc mnoho populárních programovacích jazyků, jako je PyPI pro Python a npm pro JavaScript, spoléhá na používání centralizovaného úložiště balíčků. Protože jsou tato úložiště často otevřená, mohou podvodníci nahrávat škodlivý kód maskovaný jako legitimní balíčky (tzv. package confusion attack).
Odtud se pak odvozuje i metoda zneužití halucinací LLM. Podvodník si všimne, že model vytváří odkazy na určitou knihovnu, a takto nazvaný balíček s podvodným obsahem nahraje do otevřeného repozitáře. Až příště LLM doporučí ve vygenerovaném kódu stejný balíček, bude už odkaz „funkční“ – tj. fungovat dle představ útočníka.
Co se týče nově provedené studie o těchto rizicích, vedla k následujícím výsledkům: v rámci 30 různých testů se 440 445 z 2,23 milionu vzorků kódu, které vygenerovali v jazycích Python a JavaScript pomocí modelů LLM, odkazovalo na halucinované balíčky. Modely řady GPT čtyřikrát méně často generovaly halucinované balíčky ve srovnání s modely open source, přičemž míra halucinací byla 5,2 % oproti 21,7 %, uvádí studie. Výzkumníci zjistili, že kód v jazyce Python byl méně náchylný k halucinacím než kód v JavaScriptu.
Podle studie až 97 % vývojářů softwaru začleňuje generativní AI do svých pracovních postupů a 30 % kódu, který je dnes napsán, je generováno AI. Toto procento dále poroste a s tím i závažnost daného problému. Vývojáři jsou si vědomi, že halucinace balíčků může být zdrojem chyb (s tím má zkušenost téměř každý), jen výjimečně to ale vnímají i jako problém zabezpečení.
Existují způsoby, jak tato rizika zmírnit (křížové porovnávání generovaných balíčků s hlavním seznamem apod., větší kontrola na straně správců repozitářů…), podle autorů výzkumu by se nicméně riziko mělo ideálně řešit už na úrovni fungování velkých jazykových modelů – tedy jejich tvůrců.

Joseph Spracklen et al, We Have a Package for You! A Comprehensive Analysis of Package Hallucinations by Code Generating LLMs, arXiv (2024). DOI: 10.48550/arxiv.2406.10279

Zdroj: University of Texas (San Antonio) / TechXplore.com

Rubriky: TechnologieVývoj a HTML

Související příspěvky

Články

Investice do datových center se v roce 2024 meziročně zdvojnásobily a přiblížily se hodnotě 50 miliard dolarů

16. 5. 2025
Zprávičky

Umělá inteligence může zahltit spravedlnost generovanými texty, míní náměstek

14. 5. 2025
Mobilní síť bude inteligentní: od 5G k 6G
Články

Mobilní síť bude inteligentní: od 5G k 6G

13. 5. 2025
Zprávičky

Turnovský výrobce elektroniky Crytur vybudoval za 400 mil. Kč nový čistý provoz

12. 5. 2025

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Souhlasím se Zásadami ochrany osobních údajů .

Zprávičky

Polský premiér obvinil ruské hackery z útoku na weby vládních stran před volbami

ČTK
16. 5. 2025

Polský premiér Donald Tusk dnes obvinil ruské hackery z útoku na internetové stránky své

Sophos představil XDR řešení pro synchronizované zabezpečení

Největší americkou kryptoměnovou burzu Coinbase napadli hackeři

ČTK
16. 5. 2025

Na největší americkou kryptoměnovou burzu Coinbase zaútočili hackeři. Získali data k omezenému počtu účtů,

Trump nechce, aby Apple vyráběl v Indii; pře se kvůli tomu s šéfem podniku

ČTK
16. 5. 2025

Americký prezident Donald Trump si nepřeje, aby americká společnost Apple vyráběla své produkty v

Informační systémy státní správy asi bude nově monitorovat vládní centrum

ČTK
16. 5. 2025

Komunikační a informační systémy státní správy asi bude do budoucna místo ministerstva vnitra monitorovat

Brusel obvinil provozovatele TikToku z porušování pravidel EU, hrozí mu pokutou

ČTK
15. 5. 2025

Evropská komise (EK) obvinila provozovatele čínské platformy TikTok z porušování pravidel EU kvůli netransparentnosti

ÚOHS začal posuzovat převzetí Dotykačky softwarovou skupinou Seyfor

ČTK
15. 5. 2025

Úřad pro ochranu hospodářské soutěže (ÚOHS) začal posuzovat převzetí společnosti Dotykačka, která poskytuje pokladní

T-Mobile v prvním čtvrtletí zvýšil provozní zisk o 5 % na 3,44 miliardy

ČTK
15. 5. 2025

Operátor T-Mobile zvýšil v prvním čtvrtletí provozní zisk EBITDA o 4,8 procenta na 3,438

Siemens potvrdil výhled poté, co výsledky za druhý kvartál překonaly odhady

ČTK
15. 5. 2025

Německý průmyslový koncern Siemens zvýšil ve druhém čtvrtletí čistý zisk meziročně o 11 procent

Tiskové zprávy

Nové monitory Predator posouvají hranice díky obnovovací frekvenci 500 Hz a 4K QD-OLED panelům

Acer představuje Swift X Duo – notebook pro tvůrce s grafickými kartami NVIDIA GeForce RTX řady 50 pro notebooky

Huawei představuje řešení pro datová centra na bázi AI

Květen je měsícem růstu, můžete růst s Windows 11 jen za €20.00!

MPO: Zrušení amerického omezení vývozu AI čipů nechává prostor pro rozvoj českého průmyslu a mezinárodní spolupráce

Místní šetření ÚOHS ve společnosti Seznam.cz bylo nezákonné, konstatoval soud

Zpráva dne

Květen je měsícem růstu, můžete růst s Windows 11 jen za €20.00!

Květen je měsícem růstu, můžete růst s Windows 11 jen za €20.00!

Redakce
15. 5. 2025

Kupte Windows 11 CDkey od Goodoffer24.com a můžete růst s tímto OS jak při...

Videa ITBiz.cz

Glenn Mallon, Dell Technologies

Elektronická recepční

FORXAI Mirror

Kamery pro průmysl a detekci požárů

Kamery pro vyhodnocení spokojenosti zákazníků

Kalendář

Kvě 27
Celý den

Kontajnery v praxi

Říj 1
Celý den

Cyber Attacks

Říj 21
Celý den

Bezpečnosť a dostupnosť dát

Zobrazit kalendář

Komentujeme

Chvála černých skřínek

Malé modely AI mají být velkým trendem

Pavel Houser
3. 1. 2025

V záplavě prognóz technologického vývoje (nejen) v roce 2025 zde prozatím trochu zapadlo jedno téma, které...

Odebírat newsletter

Zásady ochrany osobních údajů.

Zkontrolujte svoji doručenou poštu a potvrďte odběr.

Slovník

Internetový vyhledávač

SKU

WOMM

Kategorie

  • Články
  • Komentujeme
  • Slovník
  • Tiskové zprávy
  • Zprávičky

Portál ITbiz.cz přináší informace z IT a byznysu již od roku 2006. Provozuje jej internetové vydavatelství Nitemedia. Hosting zajišťuje společnost Greenhousing.cz. Mezi další naše projekty patří například ABClinuxu.cz a Sciencemag.cz. Na stránce Redakce naleznete informace o redakci a možnostech inzerce.

Rubriky

Akce a události Byznys Cloud Ekomerce Hardware Internet Operační systémy Podnikový software Právo Science Security Technologie Telekomunikace Veřejná správa Vývoj a HTML Zpráva dne České IT

Píšeme jinde

RSS ScienceMag RSS

  • Tajemná velekrysa měří 85 cm
  • Čeští vědci popsali mechanismus Fabryho choroby
  • Produktivní války: Běh na dlouhou trať

RSS AbcLinuxu RSS

  • Novinky z vývoje Asahi Linuxu – květen 2025 / Linux 6.15
  • Rust slaví 10 let od vydání verze 1.0. Vydána verze 1.87.0
  • Brusel obvinil provozovatele TikToku z porušování pravidel EU

Newsletter

Zásady ochrany osobních údajů.

Zkontrolujte svoji doručenou poštu a potvrďte odběr.

Žádné výsledky
Zobrazit všechny výsledky
  • Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události

© 2019 Vydává Nitemedia s.r.o. Hosting zajišťuje Greenhousing.cz.

Tento web používá cookies. Pokračováním dáváte souhlas s jejich používáním. Více na itbiz.cz/soukromi.