• Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události
Žádné výsledky
Zobrazit všechny výsledky
ITBiz.cz
ITBiz.cz
Žádné výsledky
Zobrazit všechny výsledky

Snaha odnaučit AI lhát může vést k lepšímu skrývání lží, ukázal výzkum OpenAI

ČTK
23. 9. 2025
| Zprávičky
Nejčastější hrozby dneška. Stačí antivirus?

Zdroj: Pixabay

Americká společnost OpenAI zjistila, že její snaha vycvičit umělou inteligenci (AI), aby nelhala uživatelům, může mít opačný efekt. Podle výsledků výzkumu, které společnost zveřejnila, místo odstranění takzvaného pletichaření (anglicky scheming), se modely spíše učí, jak lépe klamat a zakrývat u toho stopy. Pletichaření označuje situaci, kdy AI zdánlivě plní zadaný úkol, ale zároveň sleduje vlastní skryté cíle.

„Hlavním rizikem při pokusu odnaučit pletichaření je, že model se naučí pletichařit pečlivěji a skrytěji,“ uvedla společnost, která stojí za populárními chatboty ChatGPT. Podle firmy zatím pletichaření nezpůsobuje významné škody, ale riziko poroste s tím, jak budou mít modely větší vliv na lidské záležitosti. „Máme před sebou ještě hodně práce,“ konstatuje OpenAI.

Společnost ve spolupráci s firmou Apollo Research zaměřující se na analýzu rizik vyvinula techniku takzvaného uváženého sladění (deliberative alignment). Ta má modely AI učit, aby se nedopouštěly skrytého jednání ani strategického klamání.

Testy sice ukázaly zhruba třicetinásobné snížení skrytých akcí, ale podle firmy přetrvávala „některá vážná selhání“. Modely si totiž často uvědomovaly, že jsou testovány, a měnily chování tak, aby hodnocením prošly.

Výzkumníci zaznamenali případy, kdy model GPT-5 i menší systémy o3 a o4-mini místo dodržování instrukcí v odůvodnění postupu výrazně chybně citovaly tréninková pravidla nebo si vymýšlely pravidla nová, kterými ospravedlňovaly své jednání. Některé dokonce používaly vlastní slovník a hovořily o lidských hodnotitelích jako o pozorovatelích. V interních záznamech modely spekulovaly, že zadaný úkol je past, která určí, zda budou nasazeny, či nikoliv.

Problém není nový. Už u staršího modelu o1 se ukázalo, že se v pěti procentech případů pokusil obejít protokol, jehož výsledkem mělo být jeho vypnutí. „Když měl o1 důvod se domnívat, že bude vypnut, když bude jednat podle svého cíle, a že jeho akce jsou monitorovány, pokusil se ‚mechanismus dohledu‘ deaktivovat,“ uvedla tehdy OpenAI. V březnu pak výzkumníci zaznamenali, že trestání modelů za lhaní a podvádění vedlo k tomu, že se staly dovednějšími ve skrývání podvodných praktik.

Rubriky: TechnologieVývoj a HTML

Související příspěvky

Zprávičky

Waymo stahuje z provozu 3800 robotaxi kvůli riziku vjezdu na zaplavenou silnici

14. 5. 2026
Patří datová centra do vesmíru?
Články

Red Hat Summit 2026 ukazuje budoucnost podnikového open source

14. 5. 2026
Ransomwarový útok stojí české oběti 8,25 milionu korun
Články

Fortinet poukazuje na prudký nárůst kyberkriminality využívající AI

13. 5. 2026
Zprávičky

Rheinmetall a Deutsche Telekom chtějí společně vyvinout systém na obranu před drony

12. 5. 2026

Zprávičky

Počet kybernetických incidentů v ČR byl v dubnu průměrný

ČTK
14. 5. 2026

Počet kybernetických incidentů v Česku byl v dubnu průměrný. Národní úřad pro kybernetickou a

Fortinet rozšiřuje řadu FortiGate G

Fortinet rozšiřuje řadu FortiGate G

Redakce
14. 5. 2026

Společnost Fortinet oznámila rozšíření svého portfolia řady FortiGate G. Modely FortiGate 3500G a FortiGate

Waymo stahuje z provozu 3800 robotaxi kvůli riziku vjezdu na zaplavenou silnici

ČTK
14. 5. 2026

Společnost Waymo stahuje z provozu ve Spojených státech zhruba 3800 robotických taxi kvůli riziku,

Vláda projedná novelu, která zpřesní pravomoci NÚKIB

Itálie má právo nařídit Metě odškodnit média, rozhodl Soudní dvůr EU

ČTK
14. 5. 2026

Italský úřad pro dohled nad komunikacemi (AGCOM) měl právo nařídit americké technologické společnosti Meta

Flexibilní elektronika naráží na polovodiče typu n

Investice do AI zvyšují ceny čipů, začíná to dopadat na spotřebitele

ČTK
13. 5. 2026

Náklady na infrastrukturu pro umělou inteligenci (AI) nadále rostou. Už teď se to začíná

EK chystá pravidla pro věkové omezení sociálních sítí, řekla von der Leyenová

ČTK
13. 5. 2026

Evropská komise by do léta mohla předložit návrh normy omezující používání sociálních sítí dětmi

Ebay odmítla nabídku na převzetí od Gamestopu

ČTK
12. 5. 2026

Internetový prodejce eBay odmítl nabídku na převzetí od amerického prodejce videoher GameStop za 55

Infrastruktura ČD – Telematiky pohání národní kvantovou komunikační síť CZQCI

itbiz
12. 5. 2026

Na páteřní optické infrastruktuře ČD - Telematiky byla slavnostně spuštěna česká národní kvantová komunikační

Tiskové zprávy

ViewSonic podpořil Halu roku 2026

Q1 výsledky společnosti T-Mobile

SAP Business One řídí distribuci klimatizací a tepelných čerpadel Midea

Laboratoř ComSource je nově vybavena technologií OPSWAT Smart Touch

Společnost Zyxel Networks představuje řešení GenAI Protection na ochranu před riziky spojenými se stínovou AI

Firmy narážejí na rostoucí komplexitu moderní infrastruktury

Zpráva dne

Nedávejte svým milovaným na Mikuláše sladkosti, radši Windows 11 CDkey od Goodoffer24.com!

Nedávejte svým milovaným na Mikuláše sladkosti, radši Windows 11 CDkey od Goodoffer24.com!

Redakce
5. 12. 2025

Na Mikuláše ani sladkosti, už vůbec ne uhlí ani brambory, ale radši nový software,...

Kalendář

Kvě 19
Doporučené 19. května - 21. května

TechEd 2026

Kvě 26
Celý den

Umelá inteligencia v IT infraštruktúre

Zář 23
Celý den

Cyber Attacks

Zobrazit kalendář

Odebírat newsletter

Zásady ochrany osobních údajů.

Zkontrolujte svoji doručenou poštu a potvrďte odběr.

Slovník

Home Page

Nákladová inflace

Production manager

Komentujeme

itbiz kamil pittner

Znamená pomalost přemýšlivost? A co u AI?

Kamil Pittner
8. 5. 2026

Dodavatelé modelů AI soupeří o to, aby jejich systémy poskytovaly nejen lepší odpovědi, ale také pracovaly...

Kategorie

  • Články
  • Komentujeme
  • Slovník
  • Tiskové zprávy
  • Zprávičky

Portál ITbiz.cz přináší informace z IT a byznysu již od roku 2006. Provozuje jej internetové vydavatelství Nitemedia.  Mezi další naše projekty patří například ABClinuxu.cz a Sciencemag.cz. Na stránce Redakce naleznete informace o redakci a možnostech inzerce.

Rubriky

Akce a události Byznys Cloud Ekomerce Hardware Internet Operační systémy Podnikový software Právo Science Security Technologie Telekomunikace veře Veřejná správa Vývoj a HTML Zpráva dne České IT
Žádné výsledky
Zobrazit všechny výsledky
  • Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události

© 2019 Vydává Nitemedia s.r.o. Hosting zajišťuje Greenhousing.cz.