margin-top: 125px; border: 1px solid gray; } -->

Watson od IBM se naučil mluvit sprostě

Pavel Kolář, 14. leden 2013 03:11 2 komentářů

Superpočítač Watson navržený k provádění komplexních analýz, který je výsledkem spojení paralelně zapojených procesorů Power7 a odpovídacího softwaru DeepQA, se při pokusu naučit jej slangový jazyk naučil hovořit sprostě.

DeepQA
DeepQA
K problému došlo kvůli tomu, že systém nedokáže rozlišit pragmatické nuance v řeči a klidně použije vulgární výraz, tam, kde jej má zařazený jako synonymum pro nějaký neutrální termín.

Aby Watson lépe porozuměl slangovému jazyku, naučili jej inženýři z IBM databázi výrazů z internetového slovníku Urban Dictionary, tyto výrazy si systém sám doplnil některými pojmy, které nalezl na Wikipedii.

Databáze Urban Dictionary nakonec musela být z Watsona úplně odstraněna a navíc byl doprogramován filtr, který brání tomu, aby systém používal vulgarity naučené na Wikipedii, která slouží jako jedna z hlavních zásobáren obecných vědomostí systému. Informaci médiím prozradil Eric Brown, jeden z vědců, kteří dohlížejí na vývoj DeepQA.

Watson umí pracovat s přirozeným jazykem, analyzovat a znázorňovat informace, argumentovat, učit se a odpovídat na otázky. V americké soutěži Jeopardy!, kde se systém poprvé vyznamenal před veřejností, byl Watson vybavený předem nahranou databází a postaven před dva nejlepší dosavadní hráče v soutěži. Jeho úkolem bylo odpovídat na otázky s otevřeným obsahem (situace, kdy není omezené téma otázky) položené v přirozeném jazyce.

Systém nejprve rozložil otázku, následně analyzoval nápovědu v přirozeném jazyce a na základě sémantického porovnání s uloženými informacemi vygeneroval kandidáty na správnou odpověď (hypotézy). Další bod spočíval v sebekontrole, systém odpovídal pouze tehdy, když měl dostatečnou míru jistoty. Samotným otázkám Watson nerozuměl, což se v soutěži dobře ukázalo na příkladu s Torontem. Watson během své práce využívá strojové učení, zpracování přirozeného jazyka, vybavování a reprezentaci znalostí a uvažování o nich.


Komentáře

dd #1
dd 14. leden 2013 16:04

lol, urban dictionary, super volba

pavlix #2
pavlix 15. leden 2013 07:20

ty pičo

RSS 

Komentujeme

Kradená auta: Další úkol pro bezpečnostní kamery

Pavel Houser , 16. srpen 2017 06:30
Pavel Houser

Bezpečnostní kamery, které hledají ukradená vozidla nebo mají za úkol vozidlo jednoznačně identifiko...

Více






Kalendář

24. 08. Webinář Synology - DSM 6.1 - Virtual Machine Manager
27. 08.

31. 08.
VMworld 2017
01. 09.

06. 09.
IFA 2017
RSS 

Zprávičky

Útočníci si oblíbili sadu exploitů Lost in Translation

Pavel Houser , 22. srpen 2017 10:21

Studie mapuje vývoj malwaru v České republice a ve světě ve druhém čtvrtletí. ...

Více 0 komentářů

České Radiokomunikace nabízejí i privátní cloud

Pavel Houser , 22. srpen 2017 08:00

Řešení je podle CRA vhodné pro provoz citlivých, náročných a exponovaných aplikací a ukládání citliv...

Více 0 komentářů

LG V30 bude mít displej OLED FullVision

Pavel Houser , 21. srpen 2017 11:42

P-OLED vzniká umísťováním pixelů na plastový substrát, který je mnohem pevnější než skleněná základn...

Více 0 komentářů

Starší zprávičky

Jak funguje byznys na tuzemském YouTube

ČTK , 21. srpen 2017 09:47

Zájem Čechů o sledování videí na YouTube vzrostl letos meziročně o 35 procent. Poptávka se přesouvá ...

Více 0 komentářů

9 z 10 e-shopů nesplnilo zákonné povinnosti

ITBiz.cz , 20. srpen 2017 14:00

Česká obchodní inspekce pravidelně monitoruje dodržování zákonů v oblasti prodeje zboží v e-shopech....

Více 0 komentářů

Lenovo ve ztrátě, k zisku se má vrátit do 2 let

ČTK , 19. srpen 2017 10:12

Firma nevylučuje zdražení svých výrobků, aby udržela ziskové marže....

Více 0 komentářů

Generální ředitel Infosysu nečekaně rezignoval

ČTK , 19. srpen 2017 09:30

Od doby, co Sikka nastoupil do čela firmy, akcie stouply o více než pětinu....

Více 0 komentářů