• Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události
Žádné výsledky
Zobrazit všechny výsledky
ITBiz.cz
ITBiz.cz
Žádné výsledky
Zobrazit všechny výsledky

ChatGPT 4 se už blíží splnění Turingova testu

Pavel Houser
29. 2. 2024
| Komentujeme
Chvála černých skřínek

Turingův test v různých podobách přes veškerá omezení a nejednoznačné konkrétní implementace zůstává stále relevantní pro posuzování schopností umělé inteligence. Cameron Jones a Benjamin Bergen z Kalifornské univerzity v San Diegu se nyní soustředili na otázku, jak si v tomto ohledu stojí nová verze ChatGPT 4. Výsledek: ještě to není zcela ono, ale už moc nechybí.
Zde je třeba říct, že dnešní chatboty nejsou vůbec designovány, aby se vydávaly za člověka, předstíraly nějaké emoce, vědomí apod. (respektive i kdyby je měly, tak to popírají). Na druhé straně ale projevují smysl pro humor, dokážou si i vymýšlet („halucinovat“). Test v podobě „imitační hry“ je proto třeba speciálně navrhnout s ohledem na současnou situaci.
Oba autoři proto vytvořili 1 400 krátkých konverzačních situací, k nimž pak proběhly krátké rozhovory mezi dobrovolníky a jiným člověkem vs. modelem GPT. Účastníci testu pak měli určit, zda šlo o člověka nebo program. Ukázalo se, že modely GPT 4 oklamaly účastníky ve 41 % případů, zatímco GPT 3.5 pouze v 5 až 14 % případů. Potvrdil se tím tedy i jindy uváděny velký pokrok ve verzi 4. A samozřejmě klíčový údaj – falešně pozitivní detekce umělé inteligence: lidé pouze v 63 % pokusů identifikovali správně člověka, v 37 % případů ho naopak pokládali za umělou inteligenci. Chybovost tedy není ani v jednom případě příliš daleko od náhodného výsledku (50 %), i když se k této hranici obě čísla blíží z opačných (a „správných“) stran.
Shrnutí z toho má být, že model GPT 4 Turingovým testem stále neprojde. Nemá k tomu ale daleko. (Co další verze? Viz také: Má, nebo nemá (současná umělá inteligence vědomí)? https://sciencemag.cz/ma-nebo-nema-soucasna-umela-inteligence-vedomi/ Zde se rovněž předpokládá, že se nacházíme těsně před zlomem.) A za další, v řadě situací už dnes chatboty komunikují dostatečně přesvědčivě…
Za pozornost stojí také to, jak vlastně lidé člověka od stroje v testu rozpoznávali. Ukázalo se, že za „nelidskou“ se považuje stejně tak špatná jako příliš dobrá gramatika, příliš formální nebo naopak neformální styl komunikace, odpovědi příliš stručné nebo příliš obsáhlé nebo příliš obecné, snažící se vyhýbat kontroverzím. Dále nebyly specifické, lidští jednotlivci mají své libůstky a výstřednosti.
Nebyl by asi problém, kdyby modely AI tyto schopnosti získaly, eventuálně naopak někdy chyby a odchylky od normy „předstíraly“. Lidé také své výstřednosti a kontroverzní názory nesdělují nutně každému na potkání, nechávají si leccos pro sebe. A pokud máme umělou inteligenci poznat podle toho, že prakticky nedělá gramatické chyby či překlepy nebo jich dělá méně než průměrný uživatel, pak je i jasné, proč bylo tolik lidí pokládáno za AI…
Výše uvedené výsledky bych proto hodnotil opačně – spíše tak, že model GPT 4 už Turingův test složil víceméně úspěšně.

Cameron Jones et al, Does GPT-4 Pass the Turing Test?, arXiv (2023). DOI: 10.48550/arxiv.2310.20216
Zdroj: arXiv/TechXplore.com a další

Rubriky: ScienceTechnologie

Související příspěvky

Meta lákala zaměstnance OpenAI na bonus ve výši 100 milionů dolarů
Zprávičky

Muskova společnost xAI představila novou verzi chatbota Grok 4

11. 7. 2025
Nebojte se hlásit na seniornější pozice, radí IT pracovní portál
Články

NÚKIB vydal oficiální varování před některými produkty společnosti DeepSeek

10. 7. 2025
Z 2D materiálů dokázali poprvé postavit celý počítač
Články

Z 2D materiálů dokázali poprvé postavit celý počítač

10. 7. 2025
Budoucnost open source modelů AI je nejistá
Články

Budoucnost open source modelů AI je nejistá

9. 7. 2025

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Souhlasím se Zásadami ochrany osobních údajů .

Zprávičky

750 zaměstnanců ČSOB se díky Atosu zvládlo rychle přesunout do domácích kanceláří

Google investuje 2,4 miliardy dolarů do technologie AI od start-upu Windsurf

ČTK
12. 7. 2025

Společnost Google ze skupiny Alphabet zaplatí asi 2,4 miliardy USD (50,64 miliardy Kč) za

Muskova xAI chce další peníze od investorů při ohodnocení na 200 miliard dolarů

ČTK
12. 7. 2025

Americká společnost xAI miliardáře Elona Muska plánuje vybrat peníze od investorů v novém kole

Kryptoměny a jejich ekonomika

Bitcoin pokračuje v růstu na další rekordy, překonal hranici 118 000 dolarů

ČTK
11. 7. 2025

Cena bitcoinu dnes pokračuje v prudkém růstu. Kolem 8:30 SELČ se vyšplhala na další

Hackeři ukradli data 5,7 milionu zákazníků australských aerolinek Qantas

ČTK
11. 7. 2025

Hackeři v rámci rozsáhlého kybernetického útoku z minulého týdne ukradli data 5,7 milionu zákazníků

Meta lákala zaměstnance OpenAI na bonus ve výši 100 milionů dolarů

Muskova společnost xAI představila novou verzi chatbota Grok 4

ČTK
11. 7. 2025

Americká společnost xAI miliardáře Elona Muska představila nový model chatbota Grok 4. Ten má

Sophos představil XDR řešení pro synchronizované zabezpečení

Ministerstvo vnitra odhalilo kybernetický útok, údaje občanů neunikly

ČTK
10. 7. 2025

Ministerstvo vnitra odhalilo kybernetický útok na jeden ze systémů úřadu, oznámil dnes na tiskové

Český T-Mobile vyčleňuje vysílače do samostatné firmy

Na Slovensku skončila největší elektronická aukce mobilních frekvencí

ČTK
10. 7. 2025

Na Slovensku včera skončila největší elektronická aukce mobilních frekvencí v historii země. Vynesla rekordní

Vláda zakázala používat ve státní správě produkty čínské společnosti DeepSeek

ČTK
9. 7. 2025

Vláda zakázala používat ve státní správě jakékoli produkty čínské společnosti DeepSeek. Rozhodla tak na

Tiskové zprávy

Společnost QNAP představuje myQNAPcloud One Beta

Acer slaví několikanásobné ocenění cenou Red Dot Product Design Awards 2025

Acer for Business EMEA překonává růst trhu

Nejnovější modely Acer Chromebook Plus nyní s 12měsíčním balíčkem Google AI Pro včetně služby NotebookLM zdarma

ANECT mění vedení společnosti a posiluje management

Optimize by Acer: nejnovější evoluce v oblasti podnikových záručních podmínek

Zpráva dne

Květen je měsícem růstu, můžete růst s Windows 11 jen za €20.00!

Květen je měsícem růstu, můžete růst s Windows 11 jen za €20.00!

Redakce
15. 5. 2025

Kupte Windows 11 CDkey od Goodoffer24.com a můžete růst s tímto OS jak při...

Komentujeme

Chvála černých skřínek

Malé modely AI mají být velkým trendem

Pavel Houser
3. 1. 2025

V záplavě prognóz technologického vývoje (nejen) v roce 2025 zde prozatím trochu zapadlo jedno téma, které...

Slovník

Connectionsless

SMO – Social Media Optimization

Kword

Nejpopulárnější články

Žádný obsah není dostupný

Kategorie

  • Články
  • Komentujeme
  • Slovník
  • Tiskové zprávy
  • Zprávičky

Portál ITbiz.cz přináší informace z IT a byznysu již od roku 2006. Provozuje jej internetové vydavatelství Nitemedia. Hosting zajišťuje společnost Greenhousing.cz. Mezi další naše projekty patří například ABClinuxu.cz a Sciencemag.cz. Na stránce Redakce naleznete informace o redakci a možnostech inzerce.

Rubriky

Akce a události Byznys Cloud Ekomerce Hardware Internet Operační systémy Podnikový software Právo Science Security Technologie Telekomunikace Veřejná správa Vývoj a HTML Zpráva dne České IT
Žádné výsledky
Zobrazit všechny výsledky
  • Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události

© 2019 Vydává Nitemedia s.r.o. Hosting zajišťuje Greenhousing.cz.

Tento web používá cookies. Pokračováním dáváte souhlas s jejich používáním. Více na itbiz.cz/soukromi.