Umělá inteligence se sama naučila složit Rubikovu kostku

ITBiz.cz , 26. August 2018 11:30 0 komentářů
Umělá inteligence se sama naučila složit Rubikovu kostku

Algoritmy pro složení Rubikovy kostky jsou známy už dávno, jeden univerzální postup umožňující uspět v každé pozici už ostatně měl sám vynálezce hlavolamu. Posléze se podařilo dokázat, že z každé pozice lze kostku složit maximálně 26 tahy.

Nicméně všechny tyto programy byly lidským dílem. V případě šachů a Go se podařilo nejen napsat algoritmy, které hrají úspěšněji než člověk, ale nedávno také tyto programy nechat vyvinout samy metodami strojového učení – tak, že hrály proti sobě. Tento postup ale u Rubikovy kostky naráží na mnohé překážky. I zde sice programy mohou hrát „proti sobě“ (vyhrává, kdo složí rychleji), potíž je však v tom, jak různé postupy odměňovat. V šachách nebo Go mají tahy různou sílu a zlepšují nebo zhoršují pozici různým způsobem. U Rubikovy kostky ale existuje pouze nejrychlejší postup, ostatní tahy jsou nejen chybné, ale navíc chybné vlastně všechny stejně (nakonec každý tah lze vrátit, takže žádný, ani ten nejhorší, nemůže řešení prodloužit více než o 2 tahy). Také lze těžko z nějaké pozice na první poznat, zda má blíže k řešení než jiná (u šachů hraje roli třeba materiální výhoda) – a především příslušná pravidla/odhady nemůžeme zadat předem, ale systém si je musí umět vyvinout sám.

Stephen McAleer a jeho spolupracovníci z University of California v Irvine nakonec problém rozlouskli. Museli ovšem k tomu navrhnout novou metodu hlubokého učení, kterou nazvali autodidaktická interace. Systém si tímto způsobem dokáže právě vyvinout odhad, jaké pozice jsou nadějnější než jiné, a z toho pak začne hodnotit relativní sílu různých možných tahů (autoři výzkumu mluví o „čistém posilování“). Přitom se vychází z konečného stavu složené kostky a program se ptá, kolika „rozházeními“ lze dospět do pozice, která je podobná té posuzované – pracuje se přitom s obecnými vzory, nikoliv hrubou silou. Výsledně si neuronová síť vyvinula algoritmus DeepCube, který není nejrychlejší, ale vyřeší 100 % zadání s mediánem 30 tahů. Což je lepší nebo cca stejné jako výsledek nejlepších lidských řešitelů, kteří využívají své vlastní obecné vzory (doménové znalosti).

Autoři výzkumu uvádějí, že jejich přístup mohl být využitelný v řadě úloh – autodidaktická iterace by se kromě řešení jiných her (uvádí se Sokoban, Montezuma's Revenge…) třeba mohla naučit odhadovat terciální strukturu proteinů ze zadané sekvence aminokyselin.

Zdroj: TechnologyReview.com a další


Komentáře

RSS 

Komentujeme

Počítačové hry v hlavě – a to dokonce multiplayer

Pavel Houser , 03. August 2019 06:30
Pavel Houser

Tetris v podání vědců z University of Washington připomíná málem telepatii – jeden z hráčů vidí pada...

Více



Kalendář

25. 08.

29. 08.
VMworld US 2019
05. 09.

06. 09.
Technical Computing Camp 2019
06. 09.

11. 09.
IFA 2019
RSS 

Zprávičky

Většina uživatelů sociálních sítí v USA by za ně byla ochotna platit

ČTK , 18. August 2019 08:00

Autoři dále spočítali, kolik by platformy vydělaly, pokud by vycházely pouze s příjmy od předplatite...

Více 0 komentářů

Larry Ellison má 75 let

ČTK , 17. August 2019 08:00

Larry Ellison stál u zrodu softwarového gigantu Oracle. Bývá popisován jako extravagantní multimilia...

Více 0 komentářů

ICT odborníků je v ČR stále nedostatek, medián mzdy je přes 52 tisíc Kč

Pavel Houser , 16. August 2019 10:00

Nejvíce si vydělají ICT odborníci v peněžnictví a pojišťovnictví, ať už se jedná o specialisty nebo ...

Více 0 komentářů

Starší zprávičky

T-Mobile letos vyplatil dividendu 5,6 miliardy Kč

ČTK , 16. August 2019 09:01

Konkurenční O2 za loňský rok vyplatila akcionářům celkem 6,5 miliardy Kč....

Více 0 komentářů

Avast v pololetí zvýšil tržby o 9 % na 422 milionů USD

ČTK , 16. August 2019 09:00

Důležitou událostí první poloviny roku bylo vydání řešení pro Internet věcí....

Více 0 komentářů

Fiskální rok 2019/2020 začal pro Lenovo úspěšně

Pavel Houser , 16. August 2019 08:00

Čtvrtina sestavených počítačů na světě je značky Lenovo, firma má podíl na trhu 24,9 %....

Více 0 komentářů

Hlasové zprávy uživatelů pro Facebook přepisovali lidé

ČTK , 15. August 2019 10:00

Zásady Facebooku ohledně užívání dat se konkrétně o nahrávkách nezmiňují....

Více 0 komentářů