• Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události
Žádné výsledky
Zobrazit všechny výsledky
ITBiz.cz
ITBiz.cz
Žádné výsledky
Zobrazit všechny výsledky

Pohled na AI a chatboty pro byznys (2. díl)

itbiz
31. 3. 2018
| Články

Pojem AI (artificial intelligence, umělá inteligence) je v současné době asi nejfrekventovanějším výrazem posledních let v oblasti internetu nebo IT vůbec. V třídílném seriálu se podíváme, jak využít AI pro tvorbu chatbota. Druhý díl se věnuje především úspěšnost chatbotů, problematice historických dat, kvalitě chatbota a datových vědcům.

Ne-úspěšnost chatbotů a její příčiny

Lze tvrdit, že platí jedno univerzální pravidlo tří kontrolních otázek nového uživatele či zákazníka chatbota. Tyto tři první otázky, většinou rozhodují o tom, zda bude mít uživatel v chatbot důvěru, nebo bude odsouzen k tupému dovedení na řešení technického problému s pořízeným zařízením, výpadku služby nebo doporučení zimní bundy k nákupu.

Filip Korbel

Filip Korbel

Myslím, že velká část uživatelů nějaký nově vzniklý chatbot podrobila podobnému testu. Ti největší pionýři, kteří sledují nově vznikající chatboty, zahájí kontrolní salvu otázek na obecná konverzační témata. Provádějí vlastně test, jak se autoři chatbota popasovali s návrhem dialogu a jak jsou připraveni na to, že uživatel bude chatovat na jiné téma, než byl chatbot natrénován. Pokládáme otázky typu: „Jak se jmenuješ?“, „Jsi kluk nebo holka?“, „Kolik ti je?“ A podobná genderově nevyvážená témata. Většina chatbotů selže, protože se tvůrci soustředili pouze na jejich specializaci, ve které mohou odvádět perfektní práci.

Aby uživatel získal důvěru a měl pocit, že „hovoří“ s podporou nebo zástupcem shopu, očekává od chatbota jakýsi „lidský dotek“, nebo chcete-li osobnost.

Největším prohřeškem je syndrom gramofonové desky, který zákazníka také nejvíce odradí. Ta se zapíná na vysoké otáčky, pokud chatbot nerozumí otázce nebo formulaci uživatele. Do skonání světa pak opakuje jednu větu: „Rád bych ti pomohl, ale nerozumím zadání. Zkus se zeptat na něco jiného.“ Je to standardní chyba většiny botů, které nedokáží porozumět záměru uživatele, nepočítají s jiným tématem, než pro který byl bot natrénován. Jednoduše řečeno, chatbot jede v první třídě rychlíku a strojvůdce ztratí uživatelskou příručku a chatbot nemá nikde ve vagónu záchranou brzdu. Selže nejen syntaktická analýza (word embeddings), ale i předmět, který není součástí předtrénovaného datasetu, a nakonec bot není schopen identifikovat ani záměr. Tedy to, co vlastně uživatel zamýšlel. Poslední záchranou by mohla být analýza sentimentu a bot mohl usoudit, že mu začíná běžet čas, aby se dopídil nějaké reakce, kterou uživatel očekává a přepojil uživatele na své lidské kolegy za klávesnicí.

Uživatel se pokusí přeformulovat větu. Učiní tak jednou dvakrát a když pokaždé obdrží stejnou odpověď: „Rád bych ti pomohl, ale nerozumím zadání. Zkus se zeptat na něco jiného.”, tak dialogové okno zavře. Statisticky je velmi malá pravděpodobnost, že se někdy k výrobci nebo poskytovateli a jeho chatbotu někdy vůbec vrátí.

Kdo nemá historická data, nemá nic

Jednoduše řečeno, základem je co nejvíce dat, ještě více dat a pak ještě více dat. Nejlépe je to jejich celá historie, přepisy rozhovorů podpory a e-mailové konverzace, nebo množství obrazového materiálu na jedno téma. Definicí bohatství doby umělé inteligence je, že kdo má historická data, ten má to největší bohatství. Může se jednat o data sbíraná ve výrobě, finančních operacích, fotky, emaily a chaty. Je tedy evidentní, které konglomeráty mají dnes největší truhly plné pokladů.

Pro trénování strojového překladu s úrovní úspěšnosti 60 % je například zapotřebí mít alespoň slovník obsahující 30 000 frází. Pokud firma nebo startup plánuje opravdový deep learning v oblasti konverzace mezi dvěma jedinci, lze odhadnout jako nutné minimum alespoň 100 000 řádků chatu. To je dobré doplnit o jazykové datasety na dané odborné téma – slovníky, 50 knížek a například 500 narativních (výkladových) článků.

Kvalita chatbota

Kvalita chatbota se následně řídí kromě množství a kvality dat jeho trénováním, precizností, použitou platformou a modely. Chaty jedinců často obsahují zkratky a výrazy, které nejsou zcela běžné, vložené kusy kódu a hlášení, které celý trénovací proces mohou velmi komplikovat. Obecným pravidlem je, že řešení open source mají k dispozici více obecných datasetů, nebo již předtrénovaných modelů, které se dají do celého projektu lehce zapojit.

Čištění dat je také třeba věnovat velkou pozornost. Pomůckou můžou být metody word to vector, elastic search, IBM Watson Cognos apod. Bohužel to nefunguje tak, že se do IBM Watson, Google MLP nebo open source Tensorflow pošle PDF z koupené knížky na Amazonu. To je zcela mylná představa. Na druhou stranu lze ale také říci, že pokud stavíte chatbota na sice starších, ale ověřených bayessovských modelech a hobbsovských metodách, tak jsou dětské knihy s elementární jazykovou skladbou dobrým startem.

Nutné dovednosti ve firmě – data scientist

Pokud firma hledá rychlé nasazení chatbota se stávajícími lidskými zdroji, tak je IBM Watson Converstation Services tou nejrychlejší cestou. Pokud má k dispozici dostatek dat, produktových katalogů, nasbíraných údajů z měření nebo obrazového materiálu, tak je reálně použitelný chatbot na světě za nějaké tři měsíce. Kombinace více znalostních domén v jeden dialog, bude to stát více času a příprava a zejména hledáni datasetů celý projekt protáhne.

Pokud však chce organizace vytvořit chatbota, který se bude snažit simulovat lidskou konverzaci a bude schopen reagovat na banální otázky, které nemusejí zcela souviset s původním účelem chatbota, tak je třeba se připravit na šest měsíců intenzivnější práce. Potřebovat bude dnes velmi oblíbenou roli „data scientist“, která je dnes až trochu přeceňovaná. Prostě někoho, kdo se dokáže podívat na hromadu dat, setřídit je, vyčistit a zajisti jejich obsah, které se v dané problematice očekává. Dále bude potřebovat někoho, kdo si rozumí s Google NLP a ML, nebo variantně s open source Tensorflow a frameworky Keras nebo Cafee. Dva lidé jsou ideální sestava. Práci si mohou rozdělit na základní byznysový účel chatbota a obecnou konverzační část. Vedlejší konverzační větev chatbota může čerpat svoje znalosti pro trénování z volně dostupných zdrojů Wiki, reddit.com, počasí, zpravodajských webů apod.

V závěrečné části seriálu se podrobněji podíváme mimo jiné na příklady postavení chatbota a typickou technologickou výbavu pro chatbota.

Filip Korbel donedávna zastával pozici obchodního ředitele IBM pro segment Commercial a CSP v Čechách a na Slovensku.

Viz také Pohled na AI a chatboty pro byznys (1. díl)

Rubriky: ByznysCloudEkomerceInternetPodnikový softwareTechnologieVývoj a HTML

Související příspěvky

Zprávičky

Trump opět prodlouží lhůtu pro prodej TikToku v USA, tentokrát o 90 dní

18. 6. 2025
Zprávičky

Sociální sítě se poprvé staly nejčastějším zdrojem informací v USA

18. 6. 2025
HP Dimension s Google Beam posouvají virtuální spolupráci na vyšší úroveň
Zprávičky

HP Dimension s Google Beam posouvají virtuální spolupráci na vyšší úroveň

17. 6. 2025
Zprávičky

Německá policie vyřadila z provozu obří prodejnu drog na darknetu

17. 6. 2025

Zprávičky

Trump opět prodlouží lhůtu pro prodej TikToku v USA, tentokrát o 90 dní

ČTK
18. 6. 2025

Americký prezident Donald Trump opět prodlouží lhůtu pro prodej populární aplikace pro krátká videa

Trumpův chystaný chytrý telefon se podle expertů bude vyrábět v Číně

ČTK
18. 6. 2025

Chystaný chytrý telefon firmy The Trump Organization se podle expertů oslovených serverem CNBC bude

Sociální sítě se poprvé staly nejčastějším zdrojem informací v USA

ČTK
18. 6. 2025

Sociální sítě se poprvé staly komunikačním kanálem, odkud čerpalo zprávy nejvíce Američanů. Uvádí to

Evropská komise chce Ukrajinu v unijní roamingové zóně bez poplatků

ČTK
18. 6. 2025

Evropská komise (EK) navrhla, aby se Ukrajina od ledna 2026 připojila k unijní zóně

Sophos představil XDR řešení pro synchronizované zabezpečení

Hackerská skupina zaútočila na banku íránských revolučních gard

ČTK
17. 6. 2025

Kybernetický útok dnes omezil provoz banky Sepah íránských revolučních gard. Systémy banky jsou spojené

HP Dimension s Google Beam posouvají virtuální spolupráci na vyšší úroveň

HP Dimension s Google Beam posouvají virtuální spolupráci na vyšší úroveň

Pavel Houser
17. 6. 2025

Společnost HP Inc. na veletrhu InfoComm 2025 představila HP Dimension with Google Beam (dříve

Vodafone pokryl sítí 5G část pražského metra

Policie odložila případ zakázek pražského magistrátu pro Operátora ICT

ČTK
17. 6. 2025

Policie odložila případ zakázek pražského magistrátu pro jím vlastněnou firmu Operátor ICT (OICT). ČTK

Německá policie vyřadila z provozu obří prodejnu drog na darknetu

ČTK
17. 6. 2025

Německá policie vyřadila z provozu velkou platformu na takzvaném darknetu, na které se prodávaly

Tiskové zprávy

Denní používání AI v kancelářích za půl roku vzrostlo o 233 %, ukazuje nový výzkum společnosti Slack

Pure Storage představuje cloud pro podniková data. Zákazníkům umožní spravovat data namísto úložišť

Falešní bankéři způsobili meziročně o 41 % vyšší škody

ELLIOT: Vlajková iniciativa pro vývoj otevřených multimodálních základních modelů pro robustní umělou inteligenci v reálném světě

GFI KerioControl 9.5: integrace VPN technologií a silnější ochrana proti zero day útokům

Novinky v Acronis Cyber Protect Cloud: přímé zálohování a archivace e-mailů v Microsoft 365

Zpráva dne

Květen je měsícem růstu, můžete růst s Windows 11 jen za €20.00!

Květen je měsícem růstu, můžete růst s Windows 11 jen za €20.00!

Redakce
15. 5. 2025

Kupte Windows 11 CDkey od Goodoffer24.com a můžete růst s tímto OS jak při...

Videa ITBiz.cz

Glenn Mallon, Dell Technologies

Elektronická recepční

FORXAI Mirror

Kamery pro průmysl a detekci požárů

Kamery pro vyhodnocení spokojenosti zákazníků

Kalendář

Zář 22
22. září @ 8:00 - 26. září @ 17:00

EMO Hannover 2025

Říj 1
Celý den

Cyber Attacks

Říj 21
Celý den

Bezpečnosť a dostupnosť dát

Zobrazit kalendář

Komentujeme

Chvála černých skřínek

Malé modely AI mají být velkým trendem

Pavel Houser
3. 1. 2025

V záplavě prognóz technologického vývoje (nejen) v roce 2025 zde prozatím trochu zapadlo jedno téma, které...

Odebírat newsletter

Zásady ochrany osobních údajů.

Zkontrolujte svoji doručenou poštu a potvrďte odběr.

Slovník

Lombardní sazba

Ekonomická efektivnost

Operation shift manager

Kategorie

  • Články
  • Komentujeme
  • Slovník
  • Tiskové zprávy
  • Zprávičky

Portál ITbiz.cz přináší informace z IT a byznysu již od roku 2006. Provozuje jej internetové vydavatelství Nitemedia. Hosting zajišťuje společnost Greenhousing.cz. Mezi další naše projekty patří například ABClinuxu.cz a Sciencemag.cz. Na stránce Redakce naleznete informace o redakci a možnostech inzerce.

Rubriky

Akce a události Byznys Cloud Ekomerce Hardware int Internet Operační systémy Podnikový software Právo Science Security Technologie Telekomunikace Veřejná správa Vývoj a HTML Zpráva dne České IT

Píšeme jinde

RSS ScienceMag RSS

  • Astrofoto: galaxie NGC 3718
  • Vědci z ÚOCHB krotí houbu, která je smrtelně nebezpečná pro pacienty s oslabenou imunitou
  • Astronomové našli chybějící baryonovou hmotu – nachází se mezi galaxiemi

RSS AbcLinuxu RSS

  • Open 3D Engine (O3DE) 25.05.0
  • X.Org X server 21.1.17 a Xwayland 24.1.7 řeší 6 bezpečnostních chyb
  • KDE Plasma 6.4

Newsletter

Zásady ochrany osobních údajů.

Zkontrolujte svoji doručenou poštu a potvrďte odběr.

Žádné výsledky
Zobrazit všechny výsledky
  • Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události

© 2019 Vydává Nitemedia s.r.o. Hosting zajišťuje Greenhousing.cz.

Tento web používá cookies. Pokračováním dáváte souhlas s jejich používáním. Více na itbiz.cz/soukromi.