• Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události
Žádné výsledky
Zobrazit všechny výsledky
ITBiz.cz
ITBiz.cz
Žádné výsledky
Zobrazit všechny výsledky

Halucinace balíčků při programování AI: Nejlépe vyšly modely GPT, Python je méně náchylný než JavaScript

Pavel Houser
25. 4. 2025
| Články
DevOps lze realizovat i v režimu on-premise

Zdroj: PIxabay

Halucinace balíčků při vývoji softwaru pomocí modelů LLM vytváří nejen chyby, ale může vést i k bezpečnostním zranitelnostem. Komplexní studii na toto téma nyní provedli výzkumníci z University of Texas (San Antonio) a dalších akademických institucí.
Halucinace umělé inteligence budí největší pozornost, když velké jazykové modely produkují obsah v přirozeném jazyce. LLM se ale stále častěji používají k tvorbě kódu. Zde pak tzv. package hallucinations znamená generování programu odkazující se na neexistující softwarovou knihovnu třetí strany. Samo o sobě není na takovém odkazu nic podezřelého, knihovny třetích stran využívá drtivá většina programů. Navíc mnoho populárních programovacích jazyků, jako je PyPI pro Python a npm pro JavaScript, spoléhá na používání centralizovaného úložiště balíčků. Protože jsou tato úložiště často otevřená, mohou podvodníci nahrávat škodlivý kód maskovaný jako legitimní balíčky (tzv. package confusion attack).
Odtud se pak odvozuje i metoda zneužití halucinací LLM. Podvodník si všimne, že model vytváří odkazy na určitou knihovnu, a takto nazvaný balíček s podvodným obsahem nahraje do otevřeného repozitáře. Až příště LLM doporučí ve vygenerovaném kódu stejný balíček, bude už odkaz „funkční“ – tj. fungovat dle představ útočníka.
Co se týče nově provedené studie o těchto rizicích, vedla k následujícím výsledkům: v rámci 30 různých testů se 440 445 z 2,23 milionu vzorků kódu, které vygenerovali v jazycích Python a JavaScript pomocí modelů LLM, odkazovalo na halucinované balíčky. Modely řady GPT čtyřikrát méně často generovaly halucinované balíčky ve srovnání s modely open source, přičemž míra halucinací byla 5,2 % oproti 21,7 %, uvádí studie. Výzkumníci zjistili, že kód v jazyce Python byl méně náchylný k halucinacím než kód v JavaScriptu.
Podle studie až 97 % vývojářů softwaru začleňuje generativní AI do svých pracovních postupů a 30 % kódu, který je dnes napsán, je generováno AI. Toto procento dále poroste a s tím i závažnost daného problému. Vývojáři jsou si vědomi, že halucinace balíčků může být zdrojem chyb (s tím má zkušenost téměř každý), jen výjimečně to ale vnímají i jako problém zabezpečení.
Existují způsoby, jak tato rizika zmírnit (křížové porovnávání generovaných balíčků s hlavním seznamem apod., větší kontrola na straně správců repozitářů…), podle autorů výzkumu by se nicméně riziko mělo ideálně řešit už na úrovni fungování velkých jazykových modelů – tedy jejich tvůrců.

Joseph Spracklen et al, We Have a Package for You! A Comprehensive Analysis of Package Hallucinations by Code Generating LLMs, arXiv (2024). DOI: 10.48550/arxiv.2406.10279

Zdroj: University of Texas (San Antonio) / TechXplore.com

Rubriky: TechnologieVývoj a HTML

Související příspěvky

HP Dimension s Google Beam posouvají virtuální spolupráci na vyšší úroveň
Zprávičky

HP Dimension s Google Beam posouvají virtuální spolupráci na vyšší úroveň

17. 6. 2025
Zprávičky

ČR by si v AI měla najít silné stránky, potenciál je ve zdravotnictví

12. 6. 2025
Zprávičky

Studia Disney a Universal žalují firmu Midjourney kvůli autorským právům

11. 6. 2025
Zprávičky

České firmy se na Akt o AI nestihnou do příštího roku připravit

11. 6. 2025

Zprávičky

Výrobce čipů Texas Instruments investuje v USA 60 miliard dolarů a vytvoří místa

ČTK
19. 6. 2025

Americký výrobce počítačových čipů Texas Instruments (TI) investuje ve Spojených státech více než 60

Meta lákala zaměstnance OpenAI na bonus ve výši 100 milionů dolarů

Meta lákala zaměstnance OpenAI na bonus ve výši 100 milionů dolarů

Redakce
19. 6. 2025

Boj technologických gigantů o AI odborníky dosáhl nebývalých rozměrů. Generální ředitel OpenAI Sam Altman

Kryptoměny a jejich ekonomika

Senát USA schválil zákon o stablecoinech označovaný za milník pro kryptoměny

ČTK
19. 6. 2025

Americký Senát schválil zákon, který vytváří regulační rámec pro kryptoměny vázané na americký dolar

Český T-Mobile vyčleňuje vysílače do samostatné firmy

Operátoři musí do roku 2030 pokrýt 600 bílých míst bez signálu, rozhodl ČTÚ

ČTK
19. 6. 2025

Mobilní operátoři by měli do konce roku 2030 pokrýt 600 tzv. bílých míst, kde

Flexibilní elektronika naráží na polovodiče typu n

Investice onsemi v Rožnově by měla být největší zahraniční investicí v ČR

ČTK
19. 6. 2025

Výběr informací o plánované investici společnosti onsemi v Rožnově pod Radhoštěm (k prvnímu výročí

Trump opět prodlouží lhůtu pro prodej TikToku v USA, tentokrát o 90 dní

ČTK
18. 6. 2025

Americký prezident Donald Trump opět prodlouží lhůtu pro prodej populární aplikace pro krátká videa

Trumpův chystaný chytrý telefon se podle expertů bude vyrábět v Číně

ČTK
18. 6. 2025

Chystaný chytrý telefon firmy The Trump Organization se podle expertů oslovených serverem CNBC bude

Sociální sítě se poprvé staly nejčastějším zdrojem informací v USA

ČTK
18. 6. 2025

Sociální sítě se poprvé staly komunikačním kanálem, odkud čerpalo zprávy nejvíce Američanů. Uvádí to

Tiskové zprávy

Česká obchodní inspekce uskutečnila v prvním čtvrtletí 174 kontrol internetových obchodů, porušení předpisů zjistila ve 151 kontrolách

Denní používání AI v kancelářích za půl roku vzrostlo o 233 %, ukazuje nový výzkum společnosti Slack

Pure Storage představuje cloud pro podniková data. Zákazníkům umožní spravovat data namísto úložišť

Falešní bankéři způsobili meziročně o 41 % vyšší škody

ELLIOT: Vlajková iniciativa pro vývoj otevřených multimodálních základních modelů pro robustní umělou inteligenci v reálném světě

GFI KerioControl 9.5: integrace VPN technologií a silnější ochrana proti zero day útokům

Zpráva dne

Květen je měsícem růstu, můžete růst s Windows 11 jen za €20.00!

Květen je měsícem růstu, můžete růst s Windows 11 jen za €20.00!

Redakce
15. 5. 2025

Kupte Windows 11 CDkey od Goodoffer24.com a můžete růst s tímto OS jak při...

Videa ITBiz.cz

Glenn Mallon, Dell Technologies

Elektronická recepční

FORXAI Mirror

Kamery pro průmysl a detekci požárů

Kamery pro vyhodnocení spokojenosti zákazníků

Kalendář

Zář 22
22. září @ 8:00 - 26. září @ 17:00

EMO Hannover 2025

Říj 1
Celý den

Cyber Attacks

Říj 21
Celý den

Bezpečnosť a dostupnosť dát

Zobrazit kalendář

Komentujeme

Chvála černých skřínek

Malé modely AI mají být velkým trendem

Pavel Houser
3. 1. 2025

V záplavě prognóz technologického vývoje (nejen) v roce 2025 zde prozatím trochu zapadlo jedno téma, které...

Odebírat newsletter

Zásady ochrany osobních údajů.

Zkontrolujte svoji doručenou poštu a potvrďte odběr.

Slovník

Logo

Metoda 360-ti stupňové zpětné vazby

Media projekt

Kategorie

  • Články
  • Komentujeme
  • Slovník
  • Tiskové zprávy
  • Zprávičky

Portál ITbiz.cz přináší informace z IT a byznysu již od roku 2006. Provozuje jej internetové vydavatelství Nitemedia. Hosting zajišťuje společnost Greenhousing.cz. Mezi další naše projekty patří například ABClinuxu.cz a Sciencemag.cz. Na stránce Redakce naleznete informace o redakci a možnostech inzerce.

Rubriky

Akce a události Byznys Cloud Ekomerce Hardware int Internet Operační systémy Podnikový software Právo Science Security Technologie Telekomunikace Veřejná správa Vývoj a HTML Zpráva dne České IT

Píšeme jinde

RSS ScienceMag RSS

  • Astrofoto: galaxie NGC 3718
  • Vědci z ÚOCHB krotí houbu, která je smrtelně nebezpečná pro pacienty s oslabenou imunitou
  • Astronomové našli chybějící baryonovou hmotu – nachází se mezi galaxiemi

RSS AbcLinuxu RSS

  • Zed má nově v sobě integrovaný debugger
  • Vývoj renderovacího jádra Servo (06/2025)
  • X.Org X server 21.1.18 a Xwayland 24.1.8 řeší další bezpečnostní chybu

Newsletter

Zásady ochrany osobních údajů.

Zkontrolujte svoji doručenou poštu a potvrďte odběr.

Žádné výsledky
Zobrazit všechny výsledky
  • Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události

© 2019 Vydává Nitemedia s.r.o. Hosting zajišťuje Greenhousing.cz.

Tento web používá cookies. Pokračováním dáváte souhlas s jejich používáním. Více na itbiz.cz/soukromi.