• Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události
Žádné výsledky
Zobrazit všechny výsledky
ITBiz.cz
ITBiz.cz
Žádné výsledky
Zobrazit všechny výsledky

ChatGPT 4 se už blíží splnění Turingova testu

Pavel Houser
29. 2. 2024
| Komentujeme
Chvála černých skřínek

Turingův test v různých podobách přes veškerá omezení a nejednoznačné konkrétní implementace zůstává stále relevantní pro posuzování schopností umělé inteligence. Cameron Jones a Benjamin Bergen z Kalifornské univerzity v San Diegu se nyní soustředili na otázku, jak si v tomto ohledu stojí nová verze ChatGPT 4. Výsledek: ještě to není zcela ono, ale už moc nechybí.
Zde je třeba říct, že dnešní chatboty nejsou vůbec designovány, aby se vydávaly za člověka, předstíraly nějaké emoce, vědomí apod. (respektive i kdyby je měly, tak to popírají). Na druhé straně ale projevují smysl pro humor, dokážou si i vymýšlet („halucinovat“). Test v podobě „imitační hry“ je proto třeba speciálně navrhnout s ohledem na současnou situaci.
Oba autoři proto vytvořili 1 400 krátkých konverzačních situací, k nimž pak proběhly krátké rozhovory mezi dobrovolníky a jiným člověkem vs. modelem GPT. Účastníci testu pak měli určit, zda šlo o člověka nebo program. Ukázalo se, že modely GPT 4 oklamaly účastníky ve 41 % případů, zatímco GPT 3.5 pouze v 5 až 14 % případů. Potvrdil se tím tedy i jindy uváděny velký pokrok ve verzi 4. A samozřejmě klíčový údaj – falešně pozitivní detekce umělé inteligence: lidé pouze v 63 % pokusů identifikovali správně člověka, v 37 % případů ho naopak pokládali za umělou inteligenci. Chybovost tedy není ani v jednom případě příliš daleko od náhodného výsledku (50 %), i když se k této hranici obě čísla blíží z opačných (a „správných“) stran.
Shrnutí z toho má být, že model GPT 4 Turingovým testem stále neprojde. Nemá k tomu ale daleko. (Co další verze? Viz také: Má, nebo nemá (současná umělá inteligence vědomí)? https://sciencemag.cz/ma-nebo-nema-soucasna-umela-inteligence-vedomi/ Zde se rovněž předpokládá, že se nacházíme těsně před zlomem.) A za další, v řadě situací už dnes chatboty komunikují dostatečně přesvědčivě…
Za pozornost stojí také to, jak vlastně lidé člověka od stroje v testu rozpoznávali. Ukázalo se, že za „nelidskou“ se považuje stejně tak špatná jako příliš dobrá gramatika, příliš formální nebo naopak neformální styl komunikace, odpovědi příliš stručné nebo příliš obsáhlé nebo příliš obecné, snažící se vyhýbat kontroverzím. Dále nebyly specifické, lidští jednotlivci mají své libůstky a výstřednosti.
Nebyl by asi problém, kdyby modely AI tyto schopnosti získaly, eventuálně naopak někdy chyby a odchylky od normy „předstíraly“. Lidé také své výstřednosti a kontroverzní názory nesdělují nutně každému na potkání, nechávají si leccos pro sebe. A pokud máme umělou inteligenci poznat podle toho, že prakticky nedělá gramatické chyby či překlepy nebo jich dělá méně než průměrný uživatel, pak je i jasné, proč bylo tolik lidí pokládáno za AI…
Výše uvedené výsledky bych proto hodnotil opačně – spíše tak, že model GPT 4 už Turingův test složil víceméně úspěšně.

Cameron Jones et al, Does GPT-4 Pass the Turing Test?, arXiv (2023). DOI: 10.48550/arxiv.2310.20216
Zdroj: arXiv/TechXplore.com a další

Rubriky: ScienceTechnologie

Související příspěvky

NKÚ kontroloval bezpečnostní výzkum financovaný Ministerstvem vnitra
Zprávičky

Kriminalistický ústav bude využívat robotické zařízení pro zkoumání předmětů

28. 11. 2025
Zprávičky

Čínské firmy trénují modely AI v cizině, aby měly přístup k čipům od Nvidie

28. 11. 2025
Huawei AI ilustracni
Zprávičky

Meta jedná o investici miliard dolarů do čipů Googlu

26. 11. 2025
Nové varianty WormGPT pohání AI modely Grok a Mixtral
Články

Legitimní webové stránky lze zneužít k manipulaci webových prohlížečů v režimu AI

25. 11. 2025

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Souhlasím se Zásadami ochrany osobních údajů .

Zprávičky

Česko začalo jednat s Polskem o společné přihlášce do projektu AI Gigafactory

ČTK
28. 11. 2025

Česko začalo jednat s Polskem o společné přihlášce do projektu evropské AI Gigafactory. Součástí

Komise: Služby Apple Ads a Apple Maps by měly v EU podléhat přísnějším pravidlům

ČTK
28. 11. 2025

Služby Apple Ads a Apple Maps americké technologické společnosti Apple jsou v prostředí internetu

NKÚ kontroloval bezpečnostní výzkum financovaný Ministerstvem vnitra

Kriminalistický ústav bude využívat robotické zařízení pro zkoumání předmětů

ČTK
28. 11. 2025

Kriminalistický ústav bude od příštího roku využívat nové robotické zařízení Erbium, které umožní bezpečně

Čínské firmy trénují modely AI v cizině, aby měly přístup k čipům od Nvidie

ČTK
28. 11. 2025

Čínské technologické společnosti trénují modely umělé inteligence (AI) v zahraničí. Daří se jim tak

Riziko prolamování šifrované komunikace: Státy EU se shodly na návrhu proti dětské pornografii, Česko hlasovalo proti (aktualizace)

ČTK
27. 11. 2025

Zástupci členských států EU se včera shodli na návrhu, který má bojovat proti šíření

ČR si letos v žebříčku zemí podle digitálního prostředí polepšila na 24. místo

ČTK
27. 11. 2025

Česká republika si v celosvětovém hodnocení kvality digitálního prostředí letos polepšila o tři příčky

Counterpoint: Apple se letos vrátí do čela světového trhu s chytrými telefony

ČTK
27. 11. 2025

Americká technologická společnost Apple se v letošním roce poprvé za více než deset let

Centra služeb míří do ČR kvůli lidem a poloze

Průzkum Acronis: téměř 50 % českých organizací si nemůže dovolit ztratit data za více než 4 hodiny

Pavel Houser
27. 11. 2025

17 % respondentů vyžaduje od systémů obnovy po havárii, aby garantovaly zálohu starou maximálně

Tiskové zprávy

Huawei uvedla na trh nové konvergované systémy úložišť OceanStor Dorado

Společnost Hewlett Packard Enterprise ocenila v Česku Partnery roku 2025

Spisová služba GINIS společnosti Gordic získala jako první atest

Zyxel Networks představuje první průmyslový WiFi 7 přístupový bod pro rychlejší přechod na průmysl 4.0

Nové skenery Canon imageFORMULA: Maximální výkon na minimálním prostoru

Když cloud nestačí: proč se firmám vyplatí trvalé licence Microsoft

Zpráva dne

Neděste se upgradu: Windows 11 Pro na Halloween jen za €20.00 na Goodoffer24

Neděste se upgradu: Windows 11 Pro na Halloween jen za €20.00 na Goodoffer24

Redakce
15. 10. 2025

Halloween je tady a s ním i strašidelné ceny za software! Tak neváhejte a...

Komentujeme

Chvála černých skřínek

Neocloudy – nové slovo, prudký růst?

Pavel Houser
24. 11. 2025

Opět se vše točí kolem GPU a AI. Poskytovatelé cloudových služeb nového typu („neoclouds“) mají v...

Slovník

Augmentovaná realita

Nekalá soutěž v reklamě

ICO

Kategorie

  • Články
  • Komentujeme
  • Slovník
  • Tiskové zprávy
  • Zprávičky

Portál ITbiz.cz přináší informace z IT a byznysu již od roku 2006. Provozuje jej internetové vydavatelství Nitemedia.  Mezi další naše projekty patří například ABClinuxu.cz a Sciencemag.cz. Na stránce Redakce naleznete informace o redakci a možnostech inzerce.

Rubriky

Akce a události Byznys Cloud Ekomerce Hardware Internet Operační systémy Podnikový software Právo Science Security Technologie Telekomunikace veře Veřejná správa Vývoj a HTML Zpráva dne České IT
Žádné výsledky
Zobrazit všechny výsledky
  • Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události

© 2019 Vydává Nitemedia s.r.o. Hosting zajišťuje Greenhousing.cz.

Tento web používá cookies. Pokračováním dáváte souhlas s jejich používáním. Více na itbiz.cz/soukromi.