• Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události
Žádné výsledky
Zobrazit všechny výsledky
ITBiz.cz
ITBiz.cz
Žádné výsledky
Zobrazit všechny výsledky

Pohled na AI a chatboty pro byznys (2. díl)

itbiz
31. 3. 2018
| Články

Pojem AI (artificial intelligence, umělá inteligence) je v současné době asi nejfrekventovanějším výrazem posledních let v oblasti internetu nebo IT vůbec. V třídílném seriálu se podíváme, jak využít AI pro tvorbu chatbota. Druhý díl se věnuje především úspěšnost chatbotů, problematice historických dat, kvalitě chatbota a datových vědcům.

Ne-úspěšnost chatbotů a její příčiny

Lze tvrdit, že platí jedno univerzální pravidlo tří kontrolních otázek nového uživatele či zákazníka chatbota. Tyto tři první otázky, většinou rozhodují o tom, zda bude mít uživatel v chatbot důvěru, nebo bude odsouzen k tupému dovedení na řešení technického problému s pořízeným zařízením, výpadku služby nebo doporučení zimní bundy k nákupu.

Filip Korbel

Filip Korbel

Myslím, že velká část uživatelů nějaký nově vzniklý chatbot podrobila podobnému testu. Ti největší pionýři, kteří sledují nově vznikající chatboty, zahájí kontrolní salvu otázek na obecná konverzační témata. Provádějí vlastně test, jak se autoři chatbota popasovali s návrhem dialogu a jak jsou připraveni na to, že uživatel bude chatovat na jiné téma, než byl chatbot natrénován. Pokládáme otázky typu: „Jak se jmenuješ?“, „Jsi kluk nebo holka?“, „Kolik ti je?“ A podobná genderově nevyvážená témata. Většina chatbotů selže, protože se tvůrci soustředili pouze na jejich specializaci, ve které mohou odvádět perfektní práci.

Aby uživatel získal důvěru a měl pocit, že „hovoří“ s podporou nebo zástupcem shopu, očekává od chatbota jakýsi „lidský dotek“, nebo chcete-li osobnost.

Největším prohřeškem je syndrom gramofonové desky, který zákazníka také nejvíce odradí. Ta se zapíná na vysoké otáčky, pokud chatbot nerozumí otázce nebo formulaci uživatele. Do skonání světa pak opakuje jednu větu: „Rád bych ti pomohl, ale nerozumím zadání. Zkus se zeptat na něco jiného.“ Je to standardní chyba většiny botů, které nedokáží porozumět záměru uživatele, nepočítají s jiným tématem, než pro který byl bot natrénován. Jednoduše řečeno, chatbot jede v první třídě rychlíku a strojvůdce ztratí uživatelskou příručku a chatbot nemá nikde ve vagónu záchranou brzdu. Selže nejen syntaktická analýza (word embeddings), ale i předmět, který není součástí předtrénovaného datasetu, a nakonec bot není schopen identifikovat ani záměr. Tedy to, co vlastně uživatel zamýšlel. Poslední záchranou by mohla být analýza sentimentu a bot mohl usoudit, že mu začíná běžet čas, aby se dopídil nějaké reakce, kterou uživatel očekává a přepojil uživatele na své lidské kolegy za klávesnicí.

Uživatel se pokusí přeformulovat větu. Učiní tak jednou dvakrát a když pokaždé obdrží stejnou odpověď: „Rád bych ti pomohl, ale nerozumím zadání. Zkus se zeptat na něco jiného.”, tak dialogové okno zavře. Statisticky je velmi malá pravděpodobnost, že se někdy k výrobci nebo poskytovateli a jeho chatbotu někdy vůbec vrátí.

Kdo nemá historická data, nemá nic

Jednoduše řečeno, základem je co nejvíce dat, ještě více dat a pak ještě více dat. Nejlépe je to jejich celá historie, přepisy rozhovorů podpory a e-mailové konverzace, nebo množství obrazového materiálu na jedno téma. Definicí bohatství doby umělé inteligence je, že kdo má historická data, ten má to největší bohatství. Může se jednat o data sbíraná ve výrobě, finančních operacích, fotky, emaily a chaty. Je tedy evidentní, které konglomeráty mají dnes největší truhly plné pokladů.

Pro trénování strojového překladu s úrovní úspěšnosti 60 % je například zapotřebí mít alespoň slovník obsahující 30 000 frází. Pokud firma nebo startup plánuje opravdový deep learning v oblasti konverzace mezi dvěma jedinci, lze odhadnout jako nutné minimum alespoň 100 000 řádků chatu. To je dobré doplnit o jazykové datasety na dané odborné téma – slovníky, 50 knížek a například 500 narativních (výkladových) článků.

Kvalita chatbota

Kvalita chatbota se následně řídí kromě množství a kvality dat jeho trénováním, precizností, použitou platformou a modely. Chaty jedinců často obsahují zkratky a výrazy, které nejsou zcela běžné, vložené kusy kódu a hlášení, které celý trénovací proces mohou velmi komplikovat. Obecným pravidlem je, že řešení open source mají k dispozici více obecných datasetů, nebo již předtrénovaných modelů, které se dají do celého projektu lehce zapojit.

Čištění dat je také třeba věnovat velkou pozornost. Pomůckou můžou být metody word to vector, elastic search, IBM Watson Cognos apod. Bohužel to nefunguje tak, že se do IBM Watson, Google MLP nebo open source Tensorflow pošle PDF z koupené knížky na Amazonu. To je zcela mylná představa. Na druhou stranu lze ale také říci, že pokud stavíte chatbota na sice starších, ale ověřených bayessovských modelech a hobbsovských metodách, tak jsou dětské knihy s elementární jazykovou skladbou dobrým startem.

Nutné dovednosti ve firmě – data scientist

Pokud firma hledá rychlé nasazení chatbota se stávajícími lidskými zdroji, tak je IBM Watson Converstation Services tou nejrychlejší cestou. Pokud má k dispozici dostatek dat, produktových katalogů, nasbíraných údajů z měření nebo obrazového materiálu, tak je reálně použitelný chatbot na světě za nějaké tři měsíce. Kombinace více znalostních domén v jeden dialog, bude to stát více času a příprava a zejména hledáni datasetů celý projekt protáhne.

Pokud však chce organizace vytvořit chatbota, který se bude snažit simulovat lidskou konverzaci a bude schopen reagovat na banální otázky, které nemusejí zcela souviset s původním účelem chatbota, tak je třeba se připravit na šest měsíců intenzivnější práce. Potřebovat bude dnes velmi oblíbenou roli „data scientist“, která je dnes až trochu přeceňovaná. Prostě někoho, kdo se dokáže podívat na hromadu dat, setřídit je, vyčistit a zajisti jejich obsah, které se v dané problematice očekává. Dále bude potřebovat někoho, kdo si rozumí s Google NLP a ML, nebo variantně s open source Tensorflow a frameworky Keras nebo Cafee. Dva lidé jsou ideální sestava. Práci si mohou rozdělit na základní byznysový účel chatbota a obecnou konverzační část. Vedlejší konverzační větev chatbota může čerpat svoje znalosti pro trénování z volně dostupných zdrojů Wiki, reddit.com, počasí, zpravodajských webů apod.

V závěrečné části seriálu se podrobněji podíváme mimo jiné na příklady postavení chatbota a typickou technologickou výbavu pro chatbota.

Filip Korbel donedávna zastával pozici obchodního ředitele IBM pro segment Commercial a CSP v Čechách a na Slovensku.

Viz také Pohled na AI a chatboty pro byznys (1. díl)

Rubriky: ByznysCloudEkomerceInternetMarketingPodnikový softwareTechnologieVývoj a HTML

Související příspěvky

Zprávičky

Češi jsou ohledně svých dat největší tajnůstkáři v Evropě

26. 1. 2021
Články

Výchozí nastavení a bezpečnost: 6 tipů, co by firmy měly zkontrolovat

25. 1. 2021
Huawei zkouší, zda chytré telefony Mate 30 mohou uspět i bez Googlu
Zprávičky

Huawei prý jedná o prodeji značek luxusních smartphonů, firma to však popírá

25. 1. 2021
Zprávičky

Europoslanci chtějí zaručit zaměstnancům právo na odpojení

25. 1. 2021

Zprávičky

Vláda rozšířila počet členů výboru pro kyberbezpečnost

ČTK
27. 1. 2021

Výbor Bezpečnostní rady státu (BRS) pro kybernetickou bezpečnost bude mít nově 14 místo dosavadních

Nejčastěji zneužívanou značkou při phishingu byl Microsoft

Pavel Houser
27. 1. 2021

Nejčastěji jsou při phishingových útocích zneužívané značky technologických společností, následují dopravci a maloobchodní organizace.

Aplikace eRouška má citlivější algoritmus, upozornění budou častější

ČTK
26. 1. 2021

Aplikace odhaduje vzdálenost na základě útlumu signálu Bluetooth v závislosti na vzdálenosti mezi telefony

Češi jsou ohledně svých dat největší tajnůstkáři v Evropě

ČTK
26. 1. 2021

61 % Čechů nemá se sdílením dat třetím stranám špatné zkušenosti. Češi jsou ohledně

Huawei zkouší, zda chytré telefony Mate 30 mohou uspět i bez Googlu

Huawei prý jedná o prodeji značek luxusních smartphonů, firma to však popírá

ČTK
25. 1. 2021

Čínský výrobce telekomunikačních zařízení Huawei Technologies jedná o prodeji svých značek luxusních chytrých telefonů

Europoslanci chtějí zaručit zaměstnancům právo na odpojení

ČTK
25. 1. 2021

Všichni zaměstnanci v zemích Evropské unie by měli mít možnost odpojit se mimo pracovní

Trojan Triada umí modifikovat verifikační SMS

Pavel Houser
23. 1. 2021

Podle expertů lze očekávat, že stalkeware v roce 2021 vymizí z předních příček detekčních statistik. Počty

Alphabet končí s projektem internetových balónů Loon

ČTK
23. 1. 2021

Operátoři potřebují několik balónů najednou, každý z nich stojí desítky tisíc dolarů a má

Vláda projedná novelu, která zpřesní pravomoci NÚKIB

Google hrozí Austrálii zablokováním vyhledávače

ČTK
22. 1. 2021

Austrálie se chystá schválit zákon, který by donutil technologické giganty domluvit se s místními

Tiskové zprávy

Cirkulární ekonomika v kanceláři díky repasovaným multifunkcím od Canonu

Průzkum Randstad Workmonitor: Strach o místo způsobil růst zájmu o vzdělávání v technologiích

Western Digital a Qumulo umožnily institutu IHME masivní navýšení kapacity a škálování pro zdravotnickou analytiku COVID-19 a zavádění vakcíny

Dell představuje odolné notebooky pro aktivní studenty

SolarWinds MSP: důvodů k migraci na RMM řešení rychle přibývá

AEC nově poskytuje školení v kybernetické bezpečnosti

Zpráva dne

Vánoční slevy pokračují i v novém roce

Vánoční slevy pokračují i v novém roce

Redakce
20. 1. 2021

Vánoční slevy na software produktivity od Microsoftu pokračují na tržišti i v novém roce, opět...

Odebírat newsletter

Zásady ochrany osobních údajů.

Zkontrolujte svoji doručenou poštu a potvrďte odběr.

Komentujeme

Chvála černých skřínek

Největší rizika umělé inteligence

Pavel Houser
26. 12. 2020

Tak jako dosud skoro každá technologie, i umělá inteligence se dostane do rukou zločincům. Jak s...

Slovník

Index zapomínání

Nero Burning Rom

Renta

Nejpopulárnější články

Pohled na AI a chatboty pro byznys (2. díl)

itbiz
31. 3. 2018

Analytici: Cena bitcoinu dál poroste, může ale přijít korekce

ČTK
17. 12. 2020

Operátoři musí nově uvádět přesnou rychlost internetu

ČTK
3. 1. 2021

Server Ulož.to prohrál spor o stahování šesti českých filmů

ČTK
21. 1. 2021

Za bezpečnostní incidenty v cloudu mohou hlavně samotní zákazníci

Německá policie odhalila zřejmě největší obchod na darknetu

ČTK
12. 1. 2021

Kategorie

  • Články
  • Komentujeme
  • Slovník
  • Tiskové zprávy
  • Zprávičky

Portál ITbiz.cz přináší informace z IT a byznysu již od roku 2006. Provozuje jej internetové vydavatelství Nitemedia. Hosting zajišťuje společnost Greenhousing.cz. Mezi další naše projekty patří například ABClinuxu.cz a Sciencemag.cz. Na stránce Redakce naleznete informace o redakci a možnostech inzerce.

Rubriky

Akce a události Byznys Cloud Ekomerce Hardware Internet Marketing Operační systémy Podnikový software Právo Rozhovory Science Security Technologie Telekomunikace Veřejná správa Vývoj a HTML Zajímavosti Zpráva dne České IT

RSS abclinuxu – čerstvé zprávičky

  • Vážná bezpečnostní chyba v utilitě sudo (CVE-2021-3156)
  • Brian Exelbierd z Red Hatu o ukončení vydávání CentOS
  • Společnost Backblaze zveřejnila statistiky spolehlivosti pevných disků za rok 2020

RSS Sciencemag.cz

  • Nejchytřejší psi se zvládnou naučit slovo už po 4 opakováních
  • Kolem flerovia nenašli žádný ostrov stability
  • Dvojitá protilátka na covid-19 funguje jako lék i prevence

Newsletter

Zásady ochrany osobních údajů.

Zkontrolujte svoji doručenou poštu a potvrďte odběr.

Žádné výsledky
Zobrazit všechny výsledky
  • Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události

© 2019 Vydává Nitemedia s.r.o. Hosting zajišťuje Greenhousing.cz.

Tento web používá cookies. Pokračováním dáváte souhlas s jejich používáním. Více na itbiz.cz/soukromi.