Zvídavá umělá inteligence?

Pavel Houser , 29. listopad 2017 06:30 2 komentářů

Při vývoji umělé inteligence formou učení se nejčastěji využívá metody odměn – pozitivního posilování.

Vědci University of California v Berkeley ve studii publikované na arXiv (preprint, tj. články, které dosud neprošly oponenturou) navrhují novou metodu posilování při strojovém učení. Algoritmus se prý při něm má vyvíjet i bez toho, aby dostával silnou zpětnou vazbu v podobě odměn, na základě zvědavosti/zvídavosti (curiosity). Do systému měla být zvědavost implantována jako jeho vnitřní vlastnost.

Tímto způsobem by prý mělo být možné optimalizovat fungování umělé inteligence v mnohých situacích reálného světa včetně robotiky. Učení na základě posilování po provedení úspěšných kroků je nejjednodušší cestou vývoje, ale tradiční metody mnohdy selhávají, protože vstupů z prostředí může být málo; úkol se třeba nepodaří dokončit, takže v tradičním hodnocení se žádné body nezískají o chování není posíleno/odměněno. Systém by měl ale i tak zkoumat okolní prostředí a vytvářet si nové reakce či zkoušet řešit části úkolů, třeba i s tím, že takto získané dovednosti použije později.

Jak si takový obecný popis představit konkrétněji? Autoři výzkumu uvádějí, že jejich softwarový agent se takto „bez odměn“ naučil pohybovat chodbami herních prostředí typu Doom a Super Mario Bros. Zvědavý systém nebavilo stále tlouct do zdi a místo toho raději zkoumal své okolí, což ho nutilo naučit se pohybovat „správně“ (i bez toho, že by za samotné vyhýbání zdem bylo pozitivně posilováno).

Po pravdě řečeno, pro člověka, který není specialistou na strojové učení, to stejně celé nezní zrovna srozumitelně; takto bude systém zřejmě odměňován také, ale spíš za projev zvídavosti než přímo za výsledky, jak se to ale liší? Navíc, nemůže toto vést naopak k tomu, že se už jednou vytvořená optimalizace v dalším kroku rozbije, protože systém puzen zvědavostí zkusí něco jiného? Nebo je to prostě metoda, jak alespoň nějak využít strojový čas (či zařízení ve fyzickém světě), pokud systém/robot jinak nemá co dělat?

Zdroj: TechXplore.com


Komentáře

Petr Tomášek #0
Petr Tomášek 04. prosinec 2017 20:16

V praxi by to především muselo znamenat, že učící se stroj bude muset mít naimplementované emoce. Tj. přinejmenším pozitivní emoce, které u živých bytostí spouštějí "turbo-učení".

Dr. Zdeněk Moravčík #1
Dr. Zdeněk Moravčík 09. prosinec 2017 15:53

Prosím vás, když technologie kompletní simulace lidského mozku tu již je od roku 2016 připravena (www.moravcik.ingo), děláte ze sebe jen blázny. Takové ptákoviny z Ameriky jsou jen záměrně vypouštěné dezinformace, tj. fake news. Cíl je přeci jasný. Lhaním v médiích oddalovat moji technologii simulace mozku jak jen to nejdále půjde.
Ten zakopaný pes je v politice. Když politici nechtějí moji technologii zrealizovat, tak nebude.

RSS 

Komentujeme

Když obrázek není tím, čím se zdá být

Pavel Houser , 10. listopad 2018 06:30
Pavel Houser

Problematika falešných zpráva je dnes módní záležitostí. Následující výzkum se zaměřuje na jeden spe...

Více







RSS 

Zprávičky

Novým generálním ředitelem Autocontu je bývalý šéf Oracle Sameš

ČTK , 15. listopad 2018 12:44

Autocont se zaměřuje na poskytování komplexních IT řešení a služeb pro firmy a státní správu....

Více 0 komentářů

Lagardeová: Centrální banky by měly vydávat digitální měny

ČTK , 15. listopad 2018 08:00

Některé centrální banky, včetně švédské, kanadské a čínské, již uvažují o emisích digitálních měn ve...

Více 0 komentářů

Rostly ceny smartphonů, počítačů i tiskáren

Pavel Houser , 14. listopad 2018 11:53

Trh s technickým spotřebním zbožím zaznamenal podle statistik GfK v České republice ve 3. čtvrtletí ...

Více 0 komentářů

Starší zprávičky

Zisk Foxconnu ve čtvrtletí stoupl o 18 %

ČTK , 14. listopad 2018 10:22

Apple varoval, že jeho předvánoční tržby budou horší, dodavatelům součástek Applu také hrozí slabší ...

Více 0 komentářů

Macronova dohoda o zabezpečení kyberprostoru nemá podporu velmocí

ČTK , 14. listopad 2018 09:00

MIT: Bylo by lepší začít s užším projektem ve snaze zakázat kyberútoky na klíčovou infrastrukturu....

Více 0 komentářů

Vodafone se v pololetí kvůli odpisům a Indii propadl do ztráty

ČTK , 14. listopad 2018 08:00

Akcie firmy od začátku letošního roku klesly zhruba o 39 procent. ...

Více 0 komentářů

EY představila prototyp blockchainu pro privátní transakce v platformě Ethereum

Pavel Houser , 13. listopad 2018 10:41

Společnosti budou moci bezpečně provádět transakce díky sadě nástrojů a služeb EY Ops Chain Public E...

Více 0 komentářů