Watson od IBM se naučil mluvit sprostě

Pavel Kolář, 14. January 2013 03:11 2 komentářů

Superpočítač Watson navržený k provádění komplexních analýz, který je výsledkem spojení paralelně zapojených procesorů Power7 a odpovídacího softwaru DeepQA, se při pokusu naučit jej slangový jazyk naučil hovořit sprostě.

DeepQA
DeepQA
K problému došlo kvůli tomu, že systém nedokáže rozlišit pragmatické nuance v řeči a klidně použije vulgární výraz, tam, kde jej má zařazený jako synonymum pro nějaký neutrální termín.

Aby Watson lépe porozuměl slangovému jazyku, naučili jej inženýři z IBM databázi výrazů z internetového slovníku Urban Dictionary, tyto výrazy si systém sám doplnil některými pojmy, které nalezl na Wikipedii.

Databáze Urban Dictionary nakonec musela být z Watsona úplně odstraněna a navíc byl doprogramován filtr, který brání tomu, aby systém používal vulgarity naučené na Wikipedii, která slouží jako jedna z hlavních zásobáren obecných vědomostí systému. Informaci médiím prozradil Eric Brown, jeden z vědců, kteří dohlížejí na vývoj DeepQA.

Watson umí pracovat s přirozeným jazykem, analyzovat a znázorňovat informace, argumentovat, učit se a odpovídat na otázky. V americké soutěži Jeopardy!, kde se systém poprvé vyznamenal před veřejností, byl Watson vybavený předem nahranou databází a postaven před dva nejlepší dosavadní hráče v soutěži. Jeho úkolem bylo odpovídat na otázky s otevřeným obsahem (situace, kdy není omezené téma otázky) položené v přirozeném jazyce.

Systém nejprve rozložil otázku, následně analyzoval nápovědu v přirozeném jazyce a na základě sémantického porovnání s uloženými informacemi vygeneroval kandidáty na správnou odpověď (hypotézy). Další bod spočíval v sebekontrole, systém odpovídal pouze tehdy, když měl dostatečnou míru jistoty. Samotným otázkám Watson nerozuměl, což se v soutěži dobře ukázalo na příkladu s Torontem. Watson během své práce využívá strojové učení, zpracování přirozeného jazyka, vybavování a reprezentaci znalostí a uvažování o nich.


Komentáře

dd #1
dd 14. January 2013 16:04

lol, urban dictionary, super volba

pavlix #2
pavlix 15. January 2013 07:20

ty pičo

RSS 

Komentujeme

Počítačové hry v hlavě – a to dokonce multiplayer

Pavel Houser , 03. August 2019 06:30
Pavel Houser

Tetris v podání vědců z University of Washington připomíná málem telepatii – jeden z hráčů vidí pada...

Více



Kalendář

25. 08.

29. 08.
VMworld US 2019
05. 09.

06. 09.
Technical Computing Camp 2019
06. 09.

11. 09.
IFA 2019
RSS 

Zprávičky

Larry Ellison má 75 let

ČTK , 17. August 2019 08:00

Larry Ellison stál u zrodu softwarového gigantu Oracle. Bývá popisován jako extravagantní multimilia...

Více 0 komentářů

ICT odborníků je v ČR stále nedostatek, medián mzdy je přes 52 tisíc Kč

Pavel Houser , 16. August 2019 10:00

Nejvíce si vydělají ICT odborníci v peněžnictví a pojišťovnictví, ať už se jedná o specialisty nebo ...

Více 0 komentářů

T-Mobile letos vyplatil dividendu 5,6 miliardy Kč

ČTK , 16. August 2019 09:01

Konkurenční O2 za loňský rok vyplatila akcionářům celkem 6,5 miliardy Kč....

Více 0 komentářů

Starší zprávičky

Avast v pololetí zvýšil tržby o 9 % na 422 milionů USD

ČTK , 16. August 2019 09:00

Důležitou událostí první poloviny roku bylo vydání řešení pro Internet věcí....

Více 0 komentářů

Fiskální rok 2019/2020 začal pro Lenovo úspěšně

Pavel Houser , 16. August 2019 08:00

Čtvrtina sestavených počítačů na světě je značky Lenovo, firma má podíl na trhu 24,9 %....

Více 0 komentářů

Hlasové zprávy uživatelů pro Facebook přepisovali lidé

ČTK , 15. August 2019 10:00

Zásady Facebooku ohledně užívání dat se konkrétně o nahrávkách nezmiňují....

Více 0 komentářů

Čínská centrální banka je téměř připravena na vlastní kryptoměnu

ČTK , 15. August 2019 09:00

Chystaná digitální měna se kvůli objemu transakcí nebude spoléhat na blockchain....

Více 0 komentářů