margin-top: 125px; border: 1px solid gray; } -->

Watson od IBM se naučil mluvit sprostě

Pavel Kolář, 14. leden 2013 03:11 2 komentářů

Superpočítač Watson navržený k provádění komplexních analýz, který je výsledkem spojení paralelně zapojených procesorů Power7 a odpovídacího softwaru DeepQA, se při pokusu naučit jej slangový jazyk naučil hovořit sprostě.

DeepQA
DeepQA
K problému došlo kvůli tomu, že systém nedokáže rozlišit pragmatické nuance v řeči a klidně použije vulgární výraz, tam, kde jej má zařazený jako synonymum pro nějaký neutrální termín.

Aby Watson lépe porozuměl slangovému jazyku, naučili jej inženýři z IBM databázi výrazů z internetového slovníku Urban Dictionary, tyto výrazy si systém sám doplnil některými pojmy, které nalezl na Wikipedii.

Databáze Urban Dictionary nakonec musela být z Watsona úplně odstraněna a navíc byl doprogramován filtr, který brání tomu, aby systém používal vulgarity naučené na Wikipedii, která slouží jako jedna z hlavních zásobáren obecných vědomostí systému. Informaci médiím prozradil Eric Brown, jeden z vědců, kteří dohlížejí na vývoj DeepQA.

Watson umí pracovat s přirozeným jazykem, analyzovat a znázorňovat informace, argumentovat, učit se a odpovídat na otázky. V americké soutěži Jeopardy!, kde se systém poprvé vyznamenal před veřejností, byl Watson vybavený předem nahranou databází a postaven před dva nejlepší dosavadní hráče v soutěži. Jeho úkolem bylo odpovídat na otázky s otevřeným obsahem (situace, kdy není omezené téma otázky) položené v přirozeném jazyce.

Systém nejprve rozložil otázku, následně analyzoval nápovědu v přirozeném jazyce a na základě sémantického porovnání s uloženými informacemi vygeneroval kandidáty na správnou odpověď (hypotézy). Další bod spočíval v sebekontrole, systém odpovídal pouze tehdy, když měl dostatečnou míru jistoty. Samotným otázkám Watson nerozuměl, což se v soutěži dobře ukázalo na příkladu s Torontem. Watson během své práce využívá strojové učení, zpracování přirozeného jazyka, vybavování a reprezentaci znalostí a uvažování o nich.


Komentáře

dd #1
dd 14. leden 2013 16:04

lol, urban dictionary, super volba

pavlix #2
pavlix 15. leden 2013 07:20

ty pičo

RSS 

Komentujeme

Telefony vodní i podvodní

Pavel Houser , 16. červen 2017 13:00
Pavel Houser

Jako zajímavou technickou kuriozitu lze uvést, že všech 28 států NATO schválilo protokol Janus, kter...

Více






Kalendář

25. 06.

29. 06.
Cisco Live 2017
22. 07.

27. 07.
Black Hat 2017
27. 07.

30. 07.
Defcon 2017
RSS 

Zprávičky

Do sporu ruských úřadů se sítí Telegram se vložila i tajná služba

ČTK , 27. červen 2017 09:00

Podle provozovatele majitel sítě žádný "šifrovací klíč" nemá, ty si vytváří zařízení uživatele....

Více 0 komentářů

NSZ zrušilo kvůli vadám stíhání šesti lidí v kauze IT zakázek

ČTK , 27. červen 2017 08:00

Případ se týká tendrů Integrovaného operačního programu ministerstva vnitra. ...

Více 0 komentářů

Konica Minolta umožňuje skenovat dokumenty mobilním telefonem

Pavel Houser , 26. červen 2017 16:04

Nová aplikace podle dodavatele zrychlí ve firmách zpracování dokumentů. Uživatelé mohou s každým dok...

Více 0 komentářů

Starší zprávičky

Toshiba vypadne z hlavního indexu tokijské burzy Nikkei 225

ČTK , 26. červen 2017 10:00

Společnost dosud nezveřejnila auditované výsledky za uplynulý finanční rok, protože auditoři jí výsl...

Více 0 komentářů

Britský parlament se stal terčem kybernetického útoku

ČTK , 25. červen 2017 09:00

Mluvčí Dolní sněmovny potvrdila, že parlament odhalil neoprávněné pokusy o přístup....

Více 0 komentářů

VZLUSAT-1, první česká nanodružice

ČTK , 24. červen 2017 18:13

V pátek indická raketa PSLV-C38 vynesla na oběžnou dráhu českou technologickou nanodružici VZLUSAT-1...

Více 0 komentářů

BlackBerry se vrací k zisku, tržby však zaostaly za očekáváním

ČTK , 24. červen 2017 09:46

Kanadský výrobce chytrých telefonů BlackBerry v prvním finančním čtvrtletí vydělal 671 milionů dolar...

Více 0 komentářů