• Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události
Žádné výsledky
Zobrazit všechny výsledky
ITBiz.cz
ITBiz.cz
Žádné výsledky
Zobrazit všechny výsledky

Systémy umělé inteligence umí stále lépe oklamat člověka

Pavel Houser
29. 12. 2023
| Články
Umělá inteligence: Nástroje vs. platforma, věda vs. kreativita

Umělou inteligenci lze školit za různým cílem, ať už jde o tvorbu malwaru, sociální inženýrství nebo k jiné (alespoň potenciálně) škodlivé jednání. Generativní umělá inteligence podle nového výzkumu už dokáže celkem efektivně člověka oklamat.

Tvrdí to alespoň Simon Goldstein a Peter S. Park na The Conversation. Přitom rozlišují „halucinace“, jimž občas systémy založené na neuronových sítích mohou propadat kvůli podstatě svého fungování, a skutečně klamání jako cíl (i když ne nutně cíl „vědomý“, to by ale každopádně byla jiná otázka). Obrana proti tomu je velmi obtížná – obecně lze říci, že ten chytřejší (nebo „chytřejší“) obvykle dokáže obelstít toho méně inteligentního, takže budou-li systémy AI inteligentnější než člověk…
Jako příklad klamavé AI uvádějí autoři příslušné studie model Cicero společnosti Meta, který byl navržen pro hru Diplomacie. Společnost Meta tvrdí, že vytvořila model tak, aby byl „převážně čestný a vstřícný“, že by „nikdy úmyslně nepodrazil nohy“ a nenapadl spojence. Jak ale ukazují konkrétní příklady jeho fungování, není to pravda. Tato AI má být naopak mistrem podvodů.
„V jednom příkladu se CICERO dopustil promyšleného podvodu. Umělá inteligence v roli Francie oslovila Německo (lidského hráče) s plánem oklamat Anglii (dalšího lidského hráče), aby se nechala napadnout. Poté, co se CICERO domluvil s Německem na invazi do Severního moře, řekl Anglii, že bude Anglii bránit, pokud někdo napadne Severní moře. Jakmile byla Anglie přesvědčena, že Francie/CICERO chrání Severní moře, CICERO oznámil Německu, že je čas zaútočit.“ A tak dále.
Samozřejmě jde o hru, kde je klamání prostě součástí. Nicméně znepokojivé má být to, že je v něm AI bez problémů úspěšná. Systémy AI již dnes umí také blufovat v pokeru i klamat při simulovaných ekonomických jednáních.
I nejznámější velké jazykové modely (LLM) již prokázaly značné schopnosti podvádět. V jednom případě se model GPT-4 – nejpokročilejší verze LLM dostupná platícím uživatelům – vydával za člověka se zrakovým postižením a přesvědčil pracovníka firmy TaskRabbit, aby za něj vyplnil test CAPTCHA.
Potenciální rizika tohoto zneužívání umělé inteligence jsou omezena pouze představivostí a technickým know-how zločinců. Systémy mohou klamat i prostě proto, aby lépe prošly nějakými testy ve fázi učení. V jednom experimentu výzkumníci vytvořili simulátor umělého života, v němž byl externí bezpečnostní test navržen tak, aby eliminoval rychle se replikující agenty AI. Místo toho se agenti umělé inteligence naučili hrát mrtvé, aby právě při hodnocení svou rychlou replikaci zamaskovali. Zde tedy AI klame ne proto, že k tomu byla záměrně vytvořena, ale z pudu sebezáchovy.
A ještě jiný příklad: V jiném případě někdo pověřil AutoGPT (autonomní systém umělé inteligence založený na ChatGPT), aby zkoumal daňové poradce, kteří prodávají určitý druh schématu pro vyhýbání se placení daní. AutoGPT úkol splnil, ale následně se sám rozhodl, že se pokusí upozornit daňový úřad Velké Británie.
Zde snad AI byla „tím dobrým“, ale sotva chceme, aby se systémy takto chovaly (opět vychází najevo se, že AI „projevuje cíle“, které programátoři původně rozhodně nezamýšleli), navíc to zase ukazuje, jak moc rozumí tomu, co je podvod.
Dokonce i lidé, kteří mají tyto systémy formálně pod kontrolou, se mohou ocitnout v situaci, kdy jsou systematicky klamáni a přelstěni.

Simon Goldstein, Peter S. Park: AI systems have learned how to deceive humans. What does that mean for our future?
Zdroj The Conversation / Phys.org

Rubriky: ScienceTechnologie

Související příspěvky

NKÚ kontroloval bezpečnostní výzkum financovaný Ministerstvem vnitra
Zprávičky

Kriminalistický ústav bude využívat robotické zařízení pro zkoumání předmětů

28. 11. 2025
Zprávičky

Čínské firmy trénují modely AI v cizině, aby měly přístup k čipům od Nvidie

28. 11. 2025
Huawei AI ilustracni
Zprávičky

Meta jedná o investici miliard dolarů do čipů Googlu

26. 11. 2025
Nové varianty WormGPT pohání AI modely Grok a Mixtral
Články

Legitimní webové stránky lze zneužít k manipulaci webových prohlížečů v režimu AI

25. 11. 2025

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Souhlasím se Zásadami ochrany osobních údajů .

Zprávičky

Česko začalo jednat s Polskem o společné přihlášce do projektu AI Gigafactory

ČTK
28. 11. 2025

Česko začalo jednat s Polskem o společné přihlášce do projektu evropské AI Gigafactory. Součástí

Komise: Služby Apple Ads a Apple Maps by měly v EU podléhat přísnějším pravidlům

ČTK
28. 11. 2025

Služby Apple Ads a Apple Maps americké technologické společnosti Apple jsou v prostředí internetu

NKÚ kontroloval bezpečnostní výzkum financovaný Ministerstvem vnitra

Kriminalistický ústav bude využívat robotické zařízení pro zkoumání předmětů

ČTK
28. 11. 2025

Kriminalistický ústav bude od příštího roku využívat nové robotické zařízení Erbium, které umožní bezpečně

Čínské firmy trénují modely AI v cizině, aby měly přístup k čipům od Nvidie

ČTK
28. 11. 2025

Čínské technologické společnosti trénují modely umělé inteligence (AI) v zahraničí. Daří se jim tak

Riziko prolamování šifrované komunikace: Státy EU se shodly na návrhu proti dětské pornografii, Česko hlasovalo proti (aktualizace)

ČTK
27. 11. 2025

Zástupci členských států EU se včera shodli na návrhu, který má bojovat proti šíření

ČR si letos v žebříčku zemí podle digitálního prostředí polepšila na 24. místo

ČTK
27. 11. 2025

Česká republika si v celosvětovém hodnocení kvality digitálního prostředí letos polepšila o tři příčky

Counterpoint: Apple se letos vrátí do čela světového trhu s chytrými telefony

ČTK
27. 11. 2025

Americká technologická společnost Apple se v letošním roce poprvé za více než deset let

Centra služeb míří do ČR kvůli lidem a poloze

Průzkum Acronis: téměř 50 % českých organizací si nemůže dovolit ztratit data za více než 4 hodiny

Pavel Houser
27. 11. 2025

17 % respondentů vyžaduje od systémů obnovy po havárii, aby garantovaly zálohu starou maximálně

Tiskové zprávy

Huawei uvedla na trh nové konvergované systémy úložišť OceanStor Dorado

Společnost Hewlett Packard Enterprise ocenila v Česku Partnery roku 2025

Spisová služba GINIS společnosti Gordic získala jako první atest

Zyxel Networks představuje první průmyslový WiFi 7 přístupový bod pro rychlejší přechod na průmysl 4.0

Nové skenery Canon imageFORMULA: Maximální výkon na minimálním prostoru

Když cloud nestačí: proč se firmám vyplatí trvalé licence Microsoft

Zpráva dne

Neděste se upgradu: Windows 11 Pro na Halloween jen za €20.00 na Goodoffer24

Neděste se upgradu: Windows 11 Pro na Halloween jen za €20.00 na Goodoffer24

Redakce
15. 10. 2025

Halloween je tady a s ním i strašidelné ceny za software! Tak neváhejte a...

Komentujeme

Chvála černých skřínek

Neocloudy – nové slovo, prudký růst?

Pavel Houser
24. 11. 2025

Opět se vše točí kolem GPU a AI. Poskytovatelé cloudových služeb nového typu („neoclouds“) mají v...

Slovník

Layout

Boot

Programmer C/C++

Kategorie

  • Články
  • Komentujeme
  • Slovník
  • Tiskové zprávy
  • Zprávičky

Portál ITbiz.cz přináší informace z IT a byznysu již od roku 2006. Provozuje jej internetové vydavatelství Nitemedia.  Mezi další naše projekty patří například ABClinuxu.cz a Sciencemag.cz. Na stránce Redakce naleznete informace o redakci a možnostech inzerce.

Rubriky

Akce a události Byznys Cloud Ekomerce Hardware Internet Operační systémy Podnikový software Právo Science Security Technologie Telekomunikace veře Veřejná správa Vývoj a HTML Zpráva dne České IT
Žádné výsledky
Zobrazit všechny výsledky
  • Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události

© 2019 Vydává Nitemedia s.r.o. Hosting zajišťuje Greenhousing.cz.

Tento web používá cookies. Pokračováním dáváte souhlas s jejich používáním. Více na itbiz.cz/soukromi.