Umělá inteligence se sama naučila složit Rubikovu kostku

ITBiz.cz , 26. srpen 2018 11:30 0 komentářů
Umělá inteligence se sama naučila složit Rubikovu kostku

Algoritmy pro složení Rubikovy kostky jsou známy už dávno, jeden univerzální postup umožňující uspět v každé pozici už ostatně měl sám vynálezce hlavolamu. Posléze se podařilo dokázat, že z každé pozice lze kostku složit maximálně 26 tahy.

Nicméně všechny tyto programy byly lidským dílem. V případě šachů a Go se podařilo nejen napsat algoritmy, které hrají úspěšněji než člověk, ale nedávno také tyto programy nechat vyvinout samy metodami strojového učení – tak, že hrály proti sobě. Tento postup ale u Rubikovy kostky naráží na mnohé překážky. I zde sice programy mohou hrát „proti sobě“ (vyhrává, kdo složí rychleji), potíž je však v tom, jak různé postupy odměňovat. V šachách nebo Go mají tahy různou sílu a zlepšují nebo zhoršují pozici různým způsobem. U Rubikovy kostky ale existuje pouze nejrychlejší postup, ostatní tahy jsou nejen chybné, ale navíc chybné vlastně všechny stejně (nakonec každý tah lze vrátit, takže žádný, ani ten nejhorší, nemůže řešení prodloužit více než o 2 tahy). Také lze těžko z nějaké pozice na první poznat, zda má blíže k řešení než jiná (u šachů hraje roli třeba materiální výhoda) – a především příslušná pravidla/odhady nemůžeme zadat předem, ale systém si je musí umět vyvinout sám.

Stephen McAleer a jeho spolupracovníci z University of California v Irvine nakonec problém rozlouskli. Museli ovšem k tomu navrhnout novou metodu hlubokého učení, kterou nazvali autodidaktická interace. Systém si tímto způsobem dokáže právě vyvinout odhad, jaké pozice jsou nadějnější než jiné, a z toho pak začne hodnotit relativní sílu různých možných tahů (autoři výzkumu mluví o „čistém posilování“). Přitom se vychází z konečného stavu složené kostky a program se ptá, kolika „rozházeními“ lze dospět do pozice, která je podobná té posuzované – pracuje se přitom s obecnými vzory, nikoliv hrubou silou. Výsledně si neuronová síť vyvinula algoritmus DeepCube, který není nejrychlejší, ale vyřeší 100 % zadání s mediánem 30 tahů. Což je lepší nebo cca stejné jako výsledek nejlepších lidských řešitelů, kteří využívají své vlastní obecné vzory (doménové znalosti).

Autoři výzkumu uvádějí, že jejich přístup mohl být využitelný v řadě úloh – autodidaktická iterace by se kromě řešení jiných her (uvádí se Sokoban, Montezuma's Revenge…) třeba mohla naučit odhadovat terciální strukturu proteinů ze zadané sekvence aminokyselin.

Zdroj: TechnologyReview.com a další


Komentáře

RSS 

Komentujeme

Brexit a osobní data

Tomáš Jirásko , 17. únor 2019 06:30
Tomáš Jirásko

Blížící se Brexit přináší společnostem řadu komplikací a nejasností ohledně budoucnosti. Ať již dojd...

Více







RSS 

Zprávičky

Lenovo se ve čtvrtém čtvrtletí vrací k zisku

ČTK , 21. únor 2019 10:17

Příjmy z prodeje osobních počítačů a chytrých přístrojů se zvýšily o 12 % na rekordních 10,7 miliard...

Více 0 komentářů

Zástupci zemí EU schválili dohodu o autorských právech na internetu

ČTK , 21. únor 2019 09:00

článek 13 pak dává internetovým platformám povinnost řešit, zda uživateli nahrávaný obsah neporušuje...

Více 0 komentářů

Nový fond má pomoci rozšířit platební terminály mezi živnostníky

ČTK , 21. únor 2019 08:00

Na tisíc obyvatel je v ČR 15 platebních terminálů, evropský průměr je přitom 23....

Více 0 komentářů

Starší zprávičky

Německo je nakloněno účasti Huawei při budování sítí 5G

ČTK , 20. únor 2019 10:00

Německá vláda nyní nezávisle na kauze Huawei připravuje změny telekomunikačních zákonů. ...

Více 1 komentářů

Generální finanční ředitelství zrušilo tendr na daňový portál

ČTK , 20. únor 2019 09:00

Generální finanční ředitelství nyní pracuje na řešení, které neponese rizika soudních průtahů....

Více 0 komentářů

Aukce kmitočtů pro mobilní sítě láká investory z USA i Koreje

ČTK , 20. únor 2019 08:00

Češi platí podle analýzy Point Topic za 1 GB stažených dat přes mobilní sítě LTE nejvíce v Evropě....

Více 0 komentářů

Představenstvo Seznam.cz opouští majitel a zakladatel firmy

Pavel Houser , 19. únor 2019 13:24

Ivo Lukačovič, majitel a zakladatel společnosti Seznam.cz, opouští pozici předsedy představenstva na...

Více 0 komentářů