Umělá inteligence se sama naučila složit Rubikovu kostku

ITBiz.cz , 26. srpen 2018 11:30 0 komentářů
Umělá inteligence se sama naučila složit Rubikovu kostku

Algoritmy pro složení Rubikovy kostky jsou známy už dávno, jeden univerzální postup umožňující uspět v každé pozici už ostatně měl sám vynálezce hlavolamu. Posléze se podařilo dokázat, že z každé pozice lze kostku složit maximálně 26 tahy.

Nicméně všechny tyto programy byly lidským dílem. V případě šachů a Go se podařilo nejen napsat algoritmy, které hrají úspěšněji než člověk, ale nedávno také tyto programy nechat vyvinout samy metodami strojového učení – tak, že hrály proti sobě. Tento postup ale u Rubikovy kostky naráží na mnohé překážky. I zde sice programy mohou hrát „proti sobě“ (vyhrává, kdo složí rychleji), potíž je však v tom, jak různé postupy odměňovat. V šachách nebo Go mají tahy různou sílu a zlepšují nebo zhoršují pozici různým způsobem. U Rubikovy kostky ale existuje pouze nejrychlejší postup, ostatní tahy jsou nejen chybné, ale navíc chybné vlastně všechny stejně (nakonec každý tah lze vrátit, takže žádný, ani ten nejhorší, nemůže řešení prodloužit více než o 2 tahy). Také lze těžko z nějaké pozice na první poznat, zda má blíže k řešení než jiná (u šachů hraje roli třeba materiální výhoda) – a především příslušná pravidla/odhady nemůžeme zadat předem, ale systém si je musí umět vyvinout sám.

Stephen McAleer a jeho spolupracovníci z University of California v Irvine nakonec problém rozlouskli. Museli ovšem k tomu navrhnout novou metodu hlubokého učení, kterou nazvali autodidaktická interace. Systém si tímto způsobem dokáže právě vyvinout odhad, jaké pozice jsou nadějnější než jiné, a z toho pak začne hodnotit relativní sílu různých možných tahů (autoři výzkumu mluví o „čistém posilování“). Přitom se vychází z konečného stavu složené kostky a program se ptá, kolika „rozházeními“ lze dospět do pozice, která je podobná té posuzované – pracuje se přitom s obecnými vzory, nikoliv hrubou silou. Výsledně si neuronová síť vyvinula algoritmus DeepCube, který není nejrychlejší, ale vyřeší 100 % zadání s mediánem 30 tahů. Což je lepší nebo cca stejné jako výsledek nejlepších lidských řešitelů, kteří využívají své vlastní obecné vzory (doménové znalosti).

Autoři výzkumu uvádějí, že jejich přístup mohl být využitelný v řadě úloh – autodidaktická iterace by se kromě řešení jiných her (uvádí se Sokoban, Montezuma's Revenge…) třeba mohla naučit odhadovat terciální strukturu proteinů ze zadané sekvence aminokyselin.

Zdroj: TechnologyReview.com a další


Komentáře

RSS 

Komentujeme

Kacířství. Internet prý nepřispěl k ekonomickému růstu

Pavel Houser , 15. prosinec 2018 06:30
Pavel Houser

To, že prorůstání ICT prakticky do všech oblastí našeho života podporuje ekonomický růst, je zdánliv...

Více

Kalendář

29. 01. Reshoper 2019
29. 03.

30. 03.
Czech On-line Expo 2019
01. 04.

05. 04.
SuSEcon 2019







RSS 

Zprávičky

Bezpečnostní chyba Facebooku mohla ohrozit 6,8 milionu uživatelů

ČTK , 15. prosinec 2018 10:00

Podle sdělení Facebooku se problém týkal až 1500 aplikací provozovaných 876 vývojáři....

Více 0 komentářů

Katastr nemovitostí na Portálu občana

ČTK , 15. prosinec 2018 08:00

Současně bylo modernizováno prostředí datových schránek....

Více 0 komentářů

Příští rok spustí sítě 5G prvních 25 operátorů

ČTK , 14. prosinec 2018 10:25

Trh hlasových asistentů s umělou inteligencí vzroste příští rok na 250 milionů instalovaných zařízen...

Více 0 komentářů

Starší zprávičky

Český fintech trh má potenciál až 15 miliard Kč

Pavel Houser , 14. prosinec 2018 09:00

Zahraniční fintech firmy již úspěšně vstoupily na český trh. Stejně tak najdeme příklady úspěšných č...

Více 0 komentářů

Soud EU částečně zmírnil pokuty pro Slovak a Deutsche Telekom

ČTK , 14. prosinec 2018 08:00

Slovak Telekom svými vysokými velkoobchodními cenami měl znemožňovat alternativním operátorům ziskov...

Více 0 komentářů

Poslanci napříč stranami podporují právo občanů na digitální služby

Pavel Houser , 13. prosinec 2018 11:00

Do pěti let by mělo stačit prokázání totožnosti elektronickou občankou nebo identitními prostředky b...

Více 0 komentářů

Pondělní nákupy na českém internetu překonaly miliardu

Pavel Houser , 13. prosinec 2018 10:00

Zákazníci si pro zboží stále raději chodí osobně....

Více 0 komentářů