• Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události
Žádné výsledky
Zobrazit všechny výsledky
ITBiz.cz
ITBiz.cz
Žádné výsledky
Zobrazit všechny výsledky

Pohled na AI a chatboty pro byznys (2. díl)

itbiz
31. 3. 2018
| Články

Pojem AI (artificial intelligence, umělá inteligence) je v současné době asi nejfrekventovanějším výrazem posledních let v oblasti internetu nebo IT vůbec. V třídílném seriálu se podíváme, jak využít AI pro tvorbu chatbota. Druhý díl se věnuje především úspěšnost chatbotů, problematice historických dat, kvalitě chatbota a datových vědcům.

Ne-úspěšnost chatbotů a její příčiny

Lze tvrdit, že platí jedno univerzální pravidlo tří kontrolních otázek nového uživatele či zákazníka chatbota. Tyto tři první otázky, většinou rozhodují o tom, zda bude mít uživatel v chatbot důvěru, nebo bude odsouzen k tupému dovedení na řešení technického problému s pořízeným zařízením, výpadku služby nebo doporučení zimní bundy k nákupu.

Filip Korbel

Filip Korbel

Myslím, že velká část uživatelů nějaký nově vzniklý chatbot podrobila podobnému testu. Ti největší pionýři, kteří sledují nově vznikající chatboty, zahájí kontrolní salvu otázek na obecná konverzační témata. Provádějí vlastně test, jak se autoři chatbota popasovali s návrhem dialogu a jak jsou připraveni na to, že uživatel bude chatovat na jiné téma, než byl chatbot natrénován. Pokládáme otázky typu: „Jak se jmenuješ?“, „Jsi kluk nebo holka?“, „Kolik ti je?“ A podobná genderově nevyvážená témata. Většina chatbotů selže, protože se tvůrci soustředili pouze na jejich specializaci, ve které mohou odvádět perfektní práci.

Aby uživatel získal důvěru a měl pocit, že „hovoří“ s podporou nebo zástupcem shopu, očekává od chatbota jakýsi „lidský dotek“, nebo chcete-li osobnost.

Největším prohřeškem je syndrom gramofonové desky, který zákazníka také nejvíce odradí. Ta se zapíná na vysoké otáčky, pokud chatbot nerozumí otázce nebo formulaci uživatele. Do skonání světa pak opakuje jednu větu: „Rád bych ti pomohl, ale nerozumím zadání. Zkus se zeptat na něco jiného.“ Je to standardní chyba většiny botů, které nedokáží porozumět záměru uživatele, nepočítají s jiným tématem, než pro který byl bot natrénován. Jednoduše řečeno, chatbot jede v první třídě rychlíku a strojvůdce ztratí uživatelskou příručku a chatbot nemá nikde ve vagónu záchranou brzdu. Selže nejen syntaktická analýza (word embeddings), ale i předmět, který není součástí předtrénovaného datasetu, a nakonec bot není schopen identifikovat ani záměr. Tedy to, co vlastně uživatel zamýšlel. Poslední záchranou by mohla být analýza sentimentu a bot mohl usoudit, že mu začíná běžet čas, aby se dopídil nějaké reakce, kterou uživatel očekává a přepojil uživatele na své lidské kolegy za klávesnicí.

Uživatel se pokusí přeformulovat větu. Učiní tak jednou dvakrát a když pokaždé obdrží stejnou odpověď: „Rád bych ti pomohl, ale nerozumím zadání. Zkus se zeptat na něco jiného.”, tak dialogové okno zavře. Statisticky je velmi malá pravděpodobnost, že se někdy k výrobci nebo poskytovateli a jeho chatbotu někdy vůbec vrátí.

Kdo nemá historická data, nemá nic

Jednoduše řečeno, základem je co nejvíce dat, ještě více dat a pak ještě více dat. Nejlépe je to jejich celá historie, přepisy rozhovorů podpory a e-mailové konverzace, nebo množství obrazového materiálu na jedno téma. Definicí bohatství doby umělé inteligence je, že kdo má historická data, ten má to největší bohatství. Může se jednat o data sbíraná ve výrobě, finančních operacích, fotky, emaily a chaty. Je tedy evidentní, které konglomeráty mají dnes největší truhly plné pokladů.

Pro trénování strojového překladu s úrovní úspěšnosti 60 % je například zapotřebí mít alespoň slovník obsahující 30 000 frází. Pokud firma nebo startup plánuje opravdový deep learning v oblasti konverzace mezi dvěma jedinci, lze odhadnout jako nutné minimum alespoň 100 000 řádků chatu. To je dobré doplnit o jazykové datasety na dané odborné téma – slovníky, 50 knížek a například 500 narativních (výkladových) článků.

Kvalita chatbota

Kvalita chatbota se následně řídí kromě množství a kvality dat jeho trénováním, precizností, použitou platformou a modely. Chaty jedinců často obsahují zkratky a výrazy, které nejsou zcela běžné, vložené kusy kódu a hlášení, které celý trénovací proces mohou velmi komplikovat. Obecným pravidlem je, že řešení open source mají k dispozici více obecných datasetů, nebo již předtrénovaných modelů, které se dají do celého projektu lehce zapojit.

Čištění dat je také třeba věnovat velkou pozornost. Pomůckou můžou být metody word to vector, elastic search, IBM Watson Cognos apod. Bohužel to nefunguje tak, že se do IBM Watson, Google MLP nebo open source Tensorflow pošle PDF z koupené knížky na Amazonu. To je zcela mylná představa. Na druhou stranu lze ale také říci, že pokud stavíte chatbota na sice starších, ale ověřených bayessovských modelech a hobbsovských metodách, tak jsou dětské knihy s elementární jazykovou skladbou dobrým startem.

Nutné dovednosti ve firmě – data scientist

Pokud firma hledá rychlé nasazení chatbota se stávajícími lidskými zdroji, tak je IBM Watson Converstation Services tou nejrychlejší cestou. Pokud má k dispozici dostatek dat, produktových katalogů, nasbíraných údajů z měření nebo obrazového materiálu, tak je reálně použitelný chatbot na světě za nějaké tři měsíce. Kombinace více znalostních domén v jeden dialog, bude to stát více času a příprava a zejména hledáni datasetů celý projekt protáhne.

Pokud však chce organizace vytvořit chatbota, který se bude snažit simulovat lidskou konverzaci a bude schopen reagovat na banální otázky, které nemusejí zcela souviset s původním účelem chatbota, tak je třeba se připravit na šest měsíců intenzivnější práce. Potřebovat bude dnes velmi oblíbenou roli „data scientist“, která je dnes až trochu přeceňovaná. Prostě někoho, kdo se dokáže podívat na hromadu dat, setřídit je, vyčistit a zajisti jejich obsah, které se v dané problematice očekává. Dále bude potřebovat někoho, kdo si rozumí s Google NLP a ML, nebo variantně s open source Tensorflow a frameworky Keras nebo Cafee. Dva lidé jsou ideální sestava. Práci si mohou rozdělit na základní byznysový účel chatbota a obecnou konverzační část. Vedlejší konverzační větev chatbota může čerpat svoje znalosti pro trénování z volně dostupných zdrojů Wiki, reddit.com, počasí, zpravodajských webů apod.

V závěrečné části seriálu se podrobněji podíváme mimo jiné na příklady postavení chatbota a typickou technologickou výbavu pro chatbota.

Filip Korbel donedávna zastával pozici obchodního ředitele IBM pro segment Commercial a CSP v Čechách a na Slovensku.

Viz také Pohled na AI a chatboty pro byznys (1. díl)

Rubriky: ByznysCloudEkomerceInternetPodnikový softwareTechnologieVývoj a HTML

Související příspěvky

Huawei AI ilustracni
Zprávičky

Firma OpenAI začala v USA testovat reklamy v základní verzi ChatGPT

11. 2. 2026
Články

Gartner předpovídá, že celosvětové výdaje na IT letos vzrostou o 10,8 %

11. 2. 2026
Zprávičky

Služba Spotify zvýšila čtvrtletní zisk o polovinu, vzrostl i počet uživatelů

11. 2. 2026
Zprávičky

Alphabet poprvé nabízí dluhopisy v britské a švýcarské měně, i splatnost 100 let

11. 2. 2026

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Souhlasím se Zásadami ochrany osobních údajů .

Zprávičky

Bitcoinová aféra otřásá Českem

Jihokorejská burza Bithumb omylem rozeslala bitcoiny za 40 miliard dolarů

ČTK
11. 2. 2026

Jihokorejská kryptoměnová burza Bithumb přiznala vážné selhání interních systémů, které ji vystavilo riziku sabotáže

Huawei AI ilustracni

Firma OpenAI začala v USA testovat reklamy v základní verzi ChatGPT

ČTK
11. 2. 2026

Společnost OpenAI začala ve Spojených státech umisťovat reklamy do základních verzí svého chatbota ChatGPT.

Služba Spotify zvýšila čtvrtletní zisk o polovinu, vzrostl i počet uživatelů

ČTK
11. 2. 2026

Švédská společnost Spotify, která provozuje největší streamovací platformu pro hudbu, podcasty a další audio

Alphabet poprvé nabízí dluhopisy v britské a švýcarské měně, i splatnost 100 let

ČTK
11. 2. 2026

Americká technologická společnost Alphabet poprvé prodává dluhopisy denominované v britských librách a švýcarských francích,

Plaga: Zákaz přístupu dětí na sociální sítě by bylo nejlíp vyjednat na úrovni EU

ČTK
11. 2. 2026

Zákaz přístupu dětí na sociální sítě by měl být podle ministra školství Roberta Plagy

Sophos představil XDR řešení pro synchronizované zabezpečení

Počet kybernetických incidentů v ČR byl v lednu nejvyšší za poslední rok

ČTK
10. 2. 2026

Počet kybernetických incidentů v Česku byl v lednu nejvyšší za poslední rok. Národní úřad

Výrobce čipů TSMC v lednu zvýšil tržby meziročně o 37 %, i díky AI

ČTK
10. 2. 2026

Tchajwanská společnost Taiwan Semiconductor Manufacturing (TSMC) v lednu zvýšila čisté tržby meziročně o 36,8

Evropská komise obvinila Metu z blokování konkurence v oblasti AI na WhatsAppu

ČTK
10. 2. 2026

Evropská komise (EK) obvinila americkou technologickou společnost Meta Platforms z porušení pravidel hospodářské soutěže.

Tiskové zprávy

Jednotná správa tisíců kamer: Konica Minolta umožní propojení všech značek do jednoho systému

Ohlášení podle nového zákona o kybernetické bezpečnosti provedlo přes 4800 organizací

Společnost QNAP oficiálně představuje myQNAPcloud One: Sdílené cloudové úložiště pro zálohy NAS a škálovatelné objektové úložiště

E-šmejdi se loni pokusili ukrást přes 14 miliard korun, 12 miliard banky svým klientům zachránily

Den otevřených dveří FEL ČVUT: Projděte se studiem i výzkumem špičkových robotů, AI, energetiky, elektroniky a bioinformatiky

Společnost Fortinet oznámila silné hospodářské výsledky za 4. čtvrtletí a celý rok 2025

Zpráva dne

Nedávejte svým milovaným na Mikuláše sladkosti, radši Windows 11 CDkey od Goodoffer24.com!

Nedávejte svým milovaným na Mikuláše sladkosti, radši Windows 11 CDkey od Goodoffer24.com!

Redakce
5. 12. 2025

Na Mikuláše ani sladkosti, už vůbec ne uhlí ani brambory, ale radši nový software,...

Kalendář

Úno 12
Celý den

Kontejnery v praxi

Úno 26
Celý den

IT ve zdravotnictví

Bře 12
Celý den

IT Security Worshop

Zobrazit kalendář

Komentujeme

itbiz kamil pittner

Platformové inženýrství: popularita termínu může vést ke zmatení

Kamil Pittner
2. 1. 2026

Podobně jako v případě DevOps se i termín platformové inženýrství stal natolik oblíbeným, až se začal...

Slovník

Ranking stránek, PR, PageRank, S-rank

Agregovaná data

Tiskový mluvčí

Kategorie

  • Články
  • Komentujeme
  • Slovník
  • Tiskové zprávy
  • Zprávičky

Portál ITbiz.cz přináší informace z IT a byznysu již od roku 2006. Provozuje jej internetové vydavatelství Nitemedia.  Mezi další naše projekty patří například ABClinuxu.cz a Sciencemag.cz. Na stránce Redakce naleznete informace o redakci a možnostech inzerce.

Rubriky

Akce a události Byznys Cloud Ekomerce Hardware Internet Operační systémy Podnikový software Právo Science Security Technologie Telekomunikace veře Veřejná správa Vývoj a HTML Zpráva dne České IT
Žádné výsledky
Zobrazit všechny výsledky
  • Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události

© 2019 Vydává Nitemedia s.r.o. Hosting zajišťuje Greenhousing.cz.

Tento web používá cookies. Pokračováním dáváte souhlas s jejich používáním. Více na itbiz.cz/soukromi.