Učíme počítače poznat ironii

Pavel Houser , 06. září 2016 09:00 0 komentářů

Poznat vtip, nadsázku či ironii je považováno za velmi výjimečnou lidskou vlastnost. Šimpanzi ani psi to, zdá se, neumí, pochybujeme o tom, že by to zvládla umělá inteligence. Proč by ale nemohla?

Trochu to připomíná ukázky, které mají demonstrovat nepoužitelnost počítačových překladačů; určitě najdeme dost příkladů jejich fatálních omylů a podobně objevíme dost ukázek, jak se systémy pro porozumění jazyku v ironii dokonale ztratily. Jenomže občas se ztrácíme i my sami a vtip nám unikne. Zejména když je k dispozici velké množství dat, není problém v nich najít důkaz, že něco nefunguje nebo někdo něco nezvládá. Ve skutečnosti systém umělé inteligence, který rozpoznává ironii, vůbec nemusí být bezchybný – jistě se najdou příklady, kdy mu něco nedošlo, jako každému. Rozumět ironii znamená prostě určitou procentuální úspěšnost v interpretaci sdělení. (Příslušný program vysloveně neanalyzuje, „co kdo jak myslel“, ale prostě dokáže určit, že význam výroku není doslovný, ale opačný nebo jinak posunutý.)

Jak ale v praxi rozpoznávání ironie software naučit? Silvio Amir z Lisabonské univerzity se k tomu rozhodl využít příspěvky na Twitteru (v těchto lakonických poznámkách bude ironie určitě zastoupena víc než v delší komunikaci). Použije se prostě strojové učení (vícevrstvé neuronové sítě, deep learnig a další moderní technologie...) vycházející z analýzy předešlých příspěvků. Výsledkem je, že software prý dokáže identifikovat ironii s přesností na 87 % - což je o pár bodů víc než jiná umělá konkurence. Možná spíš než těch pár procent by bylo zajímavější zjistit, s jakou úspěšností dokáží systémy najít ironii v delším sdělení, kde se oboje míchá. Na Twitteru možná stačí označit výrok za ano/ne.

Amir uvádí, že pro strojové učení je ironie docela dobře zvládnutelná hlavně tehdy, máme-li k dispozici dost výroků od jednoho člověka – každý ji používá trochu jinak, ironický bude podobně jako v minulosti, „konzistentně“. Sarkasmus navíc u člověka často provázejí konkrétní signály, třeba tón řeči a doprovodná gesta, jenže totéž platí i v psaném projevu, byť to nemusí být tak patrné (dejme tomu se používají určité konkrétní fráze „hm, takže...“). Tudíž nový model má být chytrý tím, že je současně jednoduchý.

Stejně tak se ale věci dají komplikovat, třeba řadit uživatele do různých skupin a pak ironii zkoumat s přihlédnutím k tomu, jaké zájmy a hodnoty bude pravděpodobně zastávat celá skupina. Pokud je význam výroku v rozporu s tím, jak obvykle reaguje skupina, představuje to signál, že by mohlo jít o sarkasmus. Což tak nějak asi funguje, ale stejně tak je jasné, že má-li systém pracovat s „významem výroku“ nebo „hodnotami skupiny“, model se krajně komplikuje a ztrácí se původní elegance.

Každopádně extrahovat informace z Twitteru je velký byznys a motivace pro vývojáře (i když v ČR zrovna Twitter díru do světa neudělal; v téhle souvislosti je také zajímavé, nakolik systémy pro rozpoznávání sarkasmu budou přenosné mezi různými jazyky). Firmy nebo třeba politické strany při sledování svého mediálního obrazu a reakcích na konkrétní kroky jsou za podobnou analýzu jistě ochotné zaplatit. Nemají-li se třeba jenom počítat zmínky, ale i nějak inteligentně vyhodnocovat, bez rozpoznání ironie to moc nejde.

Mimochodem na celém přístupu je zajímavá ještě jedna věc – Amir nedělal žádný obecný model, ale model pro Twitter. Tak si lze představit, že třeba vzniknou speciální systémy, které toto rozpoznají při konverzaci na Facebooku, při záznamech komunikace na úřadech, na sportovních stadionech. Což ale zase odpovídá tomu, jak fungují lidé – nejsme-li filatelisty, asi sotva pochopíme jakési jemné ironické narážky na hrubé zoubky známek, ironii v pivnici pozná spíše pravidelný návštěvník těchto zařízení.

To neznamená, že pak nepřijde i nějaký univerzálnější nástroj, který zkusí kombinovat ty jednodušší programy (téměř utility). Tak alespoň vypadá vývoj umělé inteligence, považujeme-li za účinný přístup zdola nahoru. Možná ale velkou praktickou využitelnost získáme i bez složitějších modelů. Dá se z toho něco vyvodit o fungování nás samých nebo pro vývoj jiných oborů umělé inteligence?

Zdroj: New Scientist, TechCrunch, Techxplore.com


Komentáře

RSS 

Komentujeme

Microsoft a GitHub

Pavel Houser , 13. červen 2018 13:30
Pavel Houser

Transakce v hodnotě 7,5 miliardy dolarů je dost velká i na poměry Microsoftu, takže se prodejem GitH...

Více







RSS 

Zprávičky

Musk: Favoritem pro evropskou továrnu na baterie Tesly je Německo

ČTK , 21. červen 2018 10:00

Revoluce elektrických aut zvýší do roku 2025 hodnotu evropského trhu s bateriemi na zhruba 250 milia...

Více 0 komentářů

Česko testuje komunikaci mezi auty, vlaky a MHD

ČTK , 21. červen 2018 09:00

Vozidla si budou vyměňovat informace například o tom, jak je vlak daleko od závor, nebo že tramvaj v...

Více 0 komentářů

Xiaomi chce při vstupu na burzu získat až 6,1 miliardy dolarů

ČTK , 21. červen 2018 08:00

Půjde o jednu z největších primárních nabídek akcií v technologickém sektoru za posledních několik l...

Více 0 komentářů

Kalendář

19. 06.

22. 06.
Automatica 2018
23. 06.

24. 06.
Maker Faire Prague 2018
04. 08.

09. 08.
Black Hat USA 2018

Starší zprávičky

Kryptoměnovou burzu Bithumb napadli hackeři

ČTK , 20. červen 2018 10:16

Za poslední týden jde již o druhý útok na kryptoměnové burzy v Jižní Koreji. Bitcoin opět klesl....

Více 0 komentářů

Největší australská telekomunikační firma masivně propouští

ČTK , 20. červen 2018 09:52

Telstra dominuje australskému trhu mobilních telefonů a širokopásmových sítí, zisky z pevných sítí a...

Více 0 komentářů

Dotace EU na bezplatné wifi se kvůli chybě systému odkládají

ČTK , 20. červen 2018 08:00

Obce mohly získat poukázku v hodnotě 15 000 eur. Nová výzva bude zveřejněna na podzim....

Více 0 komentářů

E-shopy českých řetězců: Lidl, Globus, DM drogerie

ČTK , 19. červen 2018 16:32

Loni stouply tržby českých e-shopů o 18 % na 115 miliard Kč. On-line nakupuje potraviny již 26 % Čec...

Více 0 komentářů