Watson od IBM se naučil mluvit sprostě

Pavel Kolář, 14. leden 2013 03:11 2 komentářů

Superpočítač Watson navržený k provádění komplexních analýz, který je výsledkem spojení paralelně zapojených procesorů Power7 a odpovídacího softwaru DeepQA, se při pokusu naučit jej slangový jazyk naučil hovořit sprostě.

DeepQA
DeepQA
K problému došlo kvůli tomu, že systém nedokáže rozlišit pragmatické nuance v řeči a klidně použije vulgární výraz, tam, kde jej má zařazený jako synonymum pro nějaký neutrální termín.

Aby Watson lépe porozuměl slangovému jazyku, naučili jej inženýři z IBM databázi výrazů z internetového slovníku Urban Dictionary, tyto výrazy si systém sám doplnil některými pojmy, které nalezl na Wikipedii.

Databáze Urban Dictionary nakonec musela být z Watsona úplně odstraněna a navíc byl doprogramován filtr, který brání tomu, aby systém používal vulgarity naučené na Wikipedii, která slouží jako jedna z hlavních zásobáren obecných vědomostí systému. Informaci médiím prozradil Eric Brown, jeden z vědců, kteří dohlížejí na vývoj DeepQA.

Watson umí pracovat s přirozeným jazykem, analyzovat a znázorňovat informace, argumentovat, učit se a odpovídat na otázky. V americké soutěži Jeopardy!, kde se systém poprvé vyznamenal před veřejností, byl Watson vybavený předem nahranou databází a postaven před dva nejlepší dosavadní hráče v soutěži. Jeho úkolem bylo odpovídat na otázky s otevřeným obsahem (situace, kdy není omezené téma otázky) položené v přirozeném jazyce.

Systém nejprve rozložil otázku, následně analyzoval nápovědu v přirozeném jazyce a na základě sémantického porovnání s uloženými informacemi vygeneroval kandidáty na správnou odpověď (hypotézy). Další bod spočíval v sebekontrole, systém odpovídal pouze tehdy, když měl dostatečnou míru jistoty. Samotným otázkám Watson nerozuměl, což se v soutěži dobře ukázalo na příkladu s Torontem. Watson během své práce využívá strojové učení, zpracování přirozeného jazyka, vybavování a reprezentaci znalostí a uvažování o nich.


Komentáře

dd #1
dd 14. leden 2013 16:04

lol, urban dictionary, super volba

pavlix #2
pavlix 15. leden 2013 07:20

ty pičo

RSS 

Komentujeme

Další na řadě je bezpečnost

Richard Jan Voigts , 09. říjen 2017 00:00
Richard Jan Voigts

Co všechno lze automatizovat pomocí strojového učení? Larry Ellison, technologický ředitel společnos...

Více







RSS 

Zprávičky

Státní ústav pro kontrolu léčiv hájí elektronické recepty

ČTK , 19. říjen 2017 10:00

V ČR se vydá 60-70 milionů papírových receptů ročně. Podle ministerstva je elektronizace zdravotnict...

Více 0 komentářů

Ransomware Locky v září masivně útočil ve světě i v ČR

Pavel Houser , 19. říjen 2017 09:30

Locky se neobjevil v Top 10 škodlivých kódů od listopadu 2016....

Více 0 komentářů

Podnikové služby tvoří už 5 % českého HDP

Pavel Houser , 19. říjen 2017 09:00

Podnikové služby v ČR rostly o 19 %, největší boom zažívají centra poskytující IT služby....

Více 0 komentářů

Starší zprávičky

Komárkova KKCG koupila 70 % firmy AutoCont

ČTK , 19. říjen 2017 08:00

Důvodem k prodeji byla možnost expanze AutoContu na další trhy....

Více 0 komentářů

Seznam loni zvýšil čistý zisk o 9 % na 1,1 miliardy Kč

ČTK , 18. říjen 2017 10:00

Největší podíl na tržbách měly příjmy z reklamy ve vyhledávání, tedy z reklamního systému Sklik. ...

Více 0 komentářů

Dopravní podnik spustil v 6 stanicích metra wi-fi připojení k internetu

ČTK , 18. říjen 2017 08:00

Ve stanicích je rozmístěno 75 vysílačů a dodavatelská firma musela vybudovat veškerou infrastrukturu...

Více 0 komentářů

Digitální kancelář

Intexx, 18. říjen 2017 08:00

Ať už na intranetu, extranetu nebo na sociální platformě – vytvořte si s Intrexxem snadno a na míru ...

Více