• Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události
Žádné výsledky
Zobrazit všechny výsledky
ITBiz.cz
ITBiz.cz
Žádné výsledky
Zobrazit všechny výsledky

ChatGPT 4 se už blíží splnění Turingova testu

Pavel Houser
29. 2. 2024
| Komentujeme
Chvála černých skřínek

Turingův test v různých podobách přes veškerá omezení a nejednoznačné konkrétní implementace zůstává stále relevantní pro posuzování schopností umělé inteligence. Cameron Jones a Benjamin Bergen z Kalifornské univerzity v San Diegu se nyní soustředili na otázku, jak si v tomto ohledu stojí nová verze ChatGPT 4. Výsledek: ještě to není zcela ono, ale už moc nechybí.
Zde je třeba říct, že dnešní chatboty nejsou vůbec designovány, aby se vydávaly za člověka, předstíraly nějaké emoce, vědomí apod. (respektive i kdyby je měly, tak to popírají). Na druhé straně ale projevují smysl pro humor, dokážou si i vymýšlet („halucinovat“). Test v podobě „imitační hry“ je proto třeba speciálně navrhnout s ohledem na současnou situaci.
Oba autoři proto vytvořili 1 400 krátkých konverzačních situací, k nimž pak proběhly krátké rozhovory mezi dobrovolníky a jiným člověkem vs. modelem GPT. Účastníci testu pak měli určit, zda šlo o člověka nebo program. Ukázalo se, že modely GPT 4 oklamaly účastníky ve 41 % případů, zatímco GPT 3.5 pouze v 5 až 14 % případů. Potvrdil se tím tedy i jindy uváděny velký pokrok ve verzi 4. A samozřejmě klíčový údaj – falešně pozitivní detekce umělé inteligence: lidé pouze v 63 % pokusů identifikovali správně člověka, v 37 % případů ho naopak pokládali za umělou inteligenci. Chybovost tedy není ani v jednom případě příliš daleko od náhodného výsledku (50 %), i když se k této hranici obě čísla blíží z opačných (a „správných“) stran.
Shrnutí z toho má být, že model GPT 4 Turingovým testem stále neprojde. Nemá k tomu ale daleko. (Co další verze? Viz také: Má, nebo nemá (současná umělá inteligence vědomí)? https://sciencemag.cz/ma-nebo-nema-soucasna-umela-inteligence-vedomi/ Zde se rovněž předpokládá, že se nacházíme těsně před zlomem.) A za další, v řadě situací už dnes chatboty komunikují dostatečně přesvědčivě…
Za pozornost stojí také to, jak vlastně lidé člověka od stroje v testu rozpoznávali. Ukázalo se, že za „nelidskou“ se považuje stejně tak špatná jako příliš dobrá gramatika, příliš formální nebo naopak neformální styl komunikace, odpovědi příliš stručné nebo příliš obsáhlé nebo příliš obecné, snažící se vyhýbat kontroverzím. Dále nebyly specifické, lidští jednotlivci mají své libůstky a výstřednosti.
Nebyl by asi problém, kdyby modely AI tyto schopnosti získaly, eventuálně naopak někdy chyby a odchylky od normy „předstíraly“. Lidé také své výstřednosti a kontroverzní názory nesdělují nutně každému na potkání, nechávají si leccos pro sebe. A pokud máme umělou inteligenci poznat podle toho, že prakticky nedělá gramatické chyby či překlepy nebo jich dělá méně než průměrný uživatel, pak je i jasné, proč bylo tolik lidí pokládáno za AI…
Výše uvedené výsledky bych proto hodnotil opačně – spíše tak, že model GPT 4 už Turingův test složil víceméně úspěšně.

Cameron Jones et al, Does GPT-4 Pass the Turing Test?, arXiv (2023). DOI: 10.48550/arxiv.2310.20216
Zdroj: arXiv/TechXplore.com a další

Rubriky: ScienceTechnologie

Související příspěvky

HPE představuje nové routery Juniper PTX
Články

HPE představuje nové routery Juniper PTX

27. 2. 2026
Zákony informatiky: Když Brooksův zákon neplatí
Články

Umělá inteligence pomáhá řešit i problémy, kterým sama nerozumí

27. 2. 2026
Huawei AI ilustracni
Zprávičky

Výsledky a výhled Nvidie překonaly odhady, vzrostly příjmy z datových center

26. 2. 2026
Umělá inteligence nemá člověka nahradit, ale doplnit
Články

Umělá inteligence nemá člověka nahradit, ale doplnit

26. 2. 2026

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Souhlasím se Zásadami ochrany osobních údajů .

Zprávičky

750 zaměstnanců ČSOB se díky Atosu zvládlo rychle přesunout do domácích kanceláří

Netflix ustoupil v bitvě o Warner Bros, slavná studia tak může převzít Paramount

ČTK
27. 2. 2026

Americký provozovatel streamovací platformy Netflix odmítl zvýšit nabídku na převzetí filmových studií a streamovací

Ruské úřady se rozhodly Telegram zablokovat na začátku dubna

ČTK
27. 2. 2026

Ruské úřady rozhodly, že začátkem dubna zablokují komunikační platformu Telegram, uvádí ruský server RBC

750 zaměstnanců ČSOB se díky Atosu zvládlo rychle přesunout do domácích kanceláří

GFI Software ustanovila Zebra Systems výhradním distribučním partnerem pro Severní Ameriku

itbiz
26. 2. 2026

Společnost GFI Software oznámila konsolidaci své severoamerické distribuce pod Zebra Systems LLC, která je

Huawei AI ilustracni

Výsledky a výhled Nvidie překonaly odhady, vzrostly příjmy z datových center

ČTK
26. 2. 2026

Americký výrobce čipů Nvidia zvýšil ve čtvrtém čtvrtletí tržby meziročně o 73 procent na

Apple přesune část výroby svého malého počítače Mac mini z Asie do Houstonu

ČTK
26. 2. 2026

Americká společnosti Apple přesune část výroby svého malého stolního počítače Mac mini z Asie

Revolut zvažuje, že letos prodá investorům nové akcie

ČTK
26. 2. 2026

Britská internetová finanční společnost Revolut zvažuje, že ve druhé polovině letošního roku prodá investorům

Nová nabídka od Paramountu může být lepší než ta od Netflixu, připustil Warner

ČTK
25. 2. 2026

Aktualizovaná nabídka mediálního konglomerátu Paramount Discovery na převzetí skupiny Warner Bros. Discovery (WBD) zahrnuje

Platební společnost Stripe má zájem o převzetí PayPalu

ČTK
25. 2. 2026

Platební společnost Stripe zvažuje převzetí celé nebo alespoň části americké firmy PayPal. S odvoláním

Tiskové zprávy

Společnost Epson představila speciální edici Lifestudio Flex Lux

AI pomáhá odhalit vzácná onemocnění včas. Vývoj podporuje AWS

T-Mobile v roce 2025 – hospodářské výsledky

Operátoři zachytí 3 miliony podvržených hovorů každý měsíc

Mobilní svět a rostoucí náklady kyberútoků

Česká obchodní inspekce uskutečnila v minulém roce 751 kontrol internetových obchodů, porušení předpisů zjistila v 639 kontrolách

Zpráva dne

Nedávejte svým milovaným na Mikuláše sladkosti, radši Windows 11 CDkey od Goodoffer24.com!

Nedávejte svým milovaným na Mikuláše sladkosti, radši Windows 11 CDkey od Goodoffer24.com!

Redakce
5. 12. 2025

Na Mikuláše ani sladkosti, už vůbec ne uhlí ani brambory, ale radši nový software,...

Kalendář

Bře 12
Celý den

IT Security Worshop

Dub 15
Celý den

Energy Vision

Zobrazit kalendář

Komentujeme

itbiz kamil pittner

Platformové inženýrství: popularita termínu může vést ke zmatení

Kamil Pittner
2. 1. 2026

Podobně jako v případě DevOps se i termín platformové inženýrství stal natolik oblíbeným, až se začal...

Slovník

Produktová komunikace

Elektronické (přímé) bankovnictví

Zajištěný (garantovaný) fond

Kategorie

  • Články
  • Komentujeme
  • Slovník
  • Tiskové zprávy
  • Zprávičky

Portál ITbiz.cz přináší informace z IT a byznysu již od roku 2006. Provozuje jej internetové vydavatelství Nitemedia.  Mezi další naše projekty patří například ABClinuxu.cz a Sciencemag.cz. Na stránce Redakce naleznete informace o redakci a možnostech inzerce.

Rubriky

Akce a události Byznys Cloud Ekomerce Hardware Internet Operační systémy Podnikový software Právo Science Security Technologie Telekomunikace veře Veřejná správa Vývoj a HTML Zpráva dne České IT
Žádné výsledky
Zobrazit všechny výsledky
  • Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události

© 2019 Vydává Nitemedia s.r.o. Hosting zajišťuje Greenhousing.cz.

Tento web používá cookies. Pokračováním dáváte souhlas s jejich používáním. Více na itbiz.cz/soukromi.