Watson od IBM se naučil mluvit sprostě

Pavel Kolář, 14. January 2013 03:11 2 komentářů

Superpočítač Watson navržený k provádění komplexních analýz, který je výsledkem spojení paralelně zapojených procesorů Power7 a odpovídacího softwaru DeepQA, se při pokusu naučit jej slangový jazyk naučil hovořit sprostě.

DeepQA
DeepQA
K problému došlo kvůli tomu, že systém nedokáže rozlišit pragmatické nuance v řeči a klidně použije vulgární výraz, tam, kde jej má zařazený jako synonymum pro nějaký neutrální termín.

Aby Watson lépe porozuměl slangovému jazyku, naučili jej inženýři z IBM databázi výrazů z internetového slovníku Urban Dictionary, tyto výrazy si systém sám doplnil některými pojmy, které nalezl na Wikipedii.

Databáze Urban Dictionary nakonec musela být z Watsona úplně odstraněna a navíc byl doprogramován filtr, který brání tomu, aby systém používal vulgarity naučené na Wikipedii, která slouží jako jedna z hlavních zásobáren obecných vědomostí systému. Informaci médiím prozradil Eric Brown, jeden z vědců, kteří dohlížejí na vývoj DeepQA.

Watson umí pracovat s přirozeným jazykem, analyzovat a znázorňovat informace, argumentovat, učit se a odpovídat na otázky. V americké soutěži Jeopardy!, kde se systém poprvé vyznamenal před veřejností, byl Watson vybavený předem nahranou databází a postaven před dva nejlepší dosavadní hráče v soutěži. Jeho úkolem bylo odpovídat na otázky s otevřeným obsahem (situace, kdy není omezené téma otázky) položené v přirozeném jazyce.

Systém nejprve rozložil otázku, následně analyzoval nápovědu v přirozeném jazyce a na základě sémantického porovnání s uloženými informacemi vygeneroval kandidáty na správnou odpověď (hypotézy). Další bod spočíval v sebekontrole, systém odpovídal pouze tehdy, když měl dostatečnou míru jistoty. Samotným otázkám Watson nerozuměl, což se v soutěži dobře ukázalo na příkladu s Torontem. Watson během své práce využívá strojové učení, zpracování přirozeného jazyka, vybavování a reprezentaci znalostí a uvažování o nich.


Komentáře

dd #1
dd 14. January 2013 16:04

lol, urban dictionary, super volba

pavlix #2
pavlix 15. January 2013 07:20

ty pičo

RSS 

Komentujeme

Všeumělové nejdou na odbyt

Pavel Houser , 13. June 2019 10:30
Pavel Houser

Stále méně se prý na trhu cení IT dovednosti typu „práce všeho druhu“, kde je příčina?...

Více



Kalendář

22. 06.

23. 06.
Maker Faire Prague 2019
03. 08.

08. 08.
Black Hat USA 2019
25. 08.

29. 08.
VMworld US 2019
RSS 

Zprávičky

Hodnota bitcoinu poprvé za více než rok překročila 9000 dolarů

ČTK , 17. June 2019 14:56

Od začátku letošního roku si bitcoin připisuje zhruba 140 %....

Více 0 komentářů

Samořiditelné vozy BMW se budou testovat i v ČR

Pavel Houser , 17. June 2019 12:34

BMW chystá velký krok k samořiditelným vozům. Pomohou technologie DXC....

Více 0 komentářů

Tržby Huwaei podle zakladatele výrazně zaostanou za očekáváním (aktualizováno)

ČTK , 17. June 2019 11:21

Huawei se v důsledku amerických restrikcí připravuje na propad dodávek svých chytrých telefonů v zah...

Více 0 komentářů

Starší zprávičky

PREmobil v létě skončí, zákazníky předá T-Mobilu

ČTK , 17. June 2019 08:00

Virtuální mobilní operátoři mají se 14,5 milionu aktivních SIM karet podíl okolo 7 %. ...

Více 0 komentářů

ČTÚ: ČR má vyšší ceny za mobilní data kvůli malé konkurenci

ČTK , 15. June 2019 16:38

Samotný vysoký počet virtuálních operátorů je pouze zdánlivým znakem konkurenčního prostředí....

Více 0 komentářů

Kryptoměnu Facebooku finančně podpoří řada velkých firem

ČTK , 15. June 2019 08:00

Mince bude vázána na koš státních měn, aby se vyhnula divokým výkyvům....

Více 0 komentářů

UPC loni vykázala dvoumiliardový zisk proti ztrátě 223 milionů

ČTK , 14. June 2019 15:11

Růst počtu objednaných služeb podpořily investice do expanze optické giga-ready sítě....

Více 0 komentářů