• Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události
Žádné výsledky
Zobrazit všechny výsledky
ITBiz.cz
ITBiz.cz
Žádné výsledky
Zobrazit všechny výsledky

I ty nejpokročilejší AI modely dnes zvládnou uspět jen ve 44 % reálných byznysových situací

Redakce
2. 9. 2025
| Články
Umělá inteligence v IT infrastruktuře

Salesforce představuje nové nástroje pro přípravu firem na éru AI agentů: Vylepšené čištění dat, testovací prostředí a benchmark pro AI agenty.

Tým Salesforce AI Research představil tři nové nástroje pro firmy, které chtějí nasadit umělou inteligenci. Jde o vylepšenou technologii pro čištění dat, nástroje pro bezpečné testování AI agentů a nový systém pro měření jejich výkonu.
Account Matching, poháněný malými i velkými jazykovými modely, již pomáhá podnikům sjednocovat miliony roztříštěných záznamů. Tým také uveřejnil rozšířený výzkum CRMArena-Pro, který umožňuje firmám simulovat podniková prostředí pro lepší testování AI agentů. Představil veřejně dostupný benchmarkový nástroj pro porovnávání různých AI řešení v reálných obchodních situacích.
Zatímco velká část technologického průmyslu stále spekuluje o příchodu obecné umělé inteligence (AGI), tým Salesforce AI Research se místo teoretické vzdálené budoucnosti zaměřuje na praktický výzkum, který pomáhá řešit problémy, kterým IT ředitelé čelí už dnes. 
Cílem těchto nástrojů je připravit firmy na to, co Salesforce nazývá Enterprise General Intelligence (EGI). Jednotliví AI agenti zde pracují s kvalitními daty, lze je hodnotit podle podnikových výsledků a autonomně pomáhají zaměstnancům. Firmy tak mohou nasadit AI agenty s důvěrou, že budou pracovat spolehlivě a přinášet konkrétní obchodní výsledky.

Vylepšení konsolidace dat
Salesforce AI Research a Data Cloud týmy vylepšily technologii Account Matching, která pomocí AI agentů rozpoznává a sjednocuje duplicitní záznamy v podnikových databázích. Během prvního měsíce použití dosáhl jeden zákazník prostřednictvím své firemní implementace sjednocení více než milionu účtů s 95% úspěšností při párování a zkrátil průměrný čas zpracování o 30 minut.
Automatizací 95 % pracovního zatížení a směrováním pouze nejsložitějších 5 % případů k lidským expertům firma zjednodušila spolupráci mezi odděleními a urychlila spolehlivé sdílení dat. Celé řešení bylo implementováno bez nutnosti složitého programování, což snížilo náklady a výrazně zlepšilo efektivitu.
Vylepšený Account Matching využívá malé i velké jazykové modely k autonomnímu identifikování a sjednocování účtů napříč rozptýlenými a nekonzistentními datovými sadami. Systém používá pokročilá pravidla pro rozlišení identity založená na kombinaci názvu společnosti, webových stránek, adresy nebo telefonního čísla. Místo zacházení s „Příklad Společnosti, s.r.o.“ a „Příklad Spol.“ jako se samostatnými entitami nyní může systém pomocí AI proaktivně rozpoznat, že jde o stejnou společnost, a konsolidovat je do jediného autoritativního záznamu. Na rozdíl od statických systémů založených na pravidlech, které vyžadují náročnou manuální konfiguraci, Account Matching sjednocuje miliony záznamů v reálném čase s měřitelnými vylepšeními přesnosti.
Tato technologie řeší častý problém podniků. Jejich data jsou totiž zřídka čistá. Zákaznické záznamy jsou duplikovány napříč odděleními, kritická pole zůstávají prázdná a stejná společnost se může objevit půl tuctu různých způsobů. Tyto nesrovnalosti nutí týmy pracovat s protichůdnými informacemi a zpomalují přijetí umělé inteligence.
Díky Account Matching získávají firmy čistá, sjednocená data, která napájí AI agenty a tím umožňují chytřejší automatizaci, bohatší personalizaci a rychlejší rozhodování ve velkém měřítku.

Testování v simulovaném prostředí
Salesforce AI Research představil rozšířenou verzi svého testovacího systému pro AI agenty, CRMArena-Pro. Na rozdíl od původní verze CRMArena, kde byly testovány pouze jednoduché dotazy zákazníků, nová verze simuluje dlouhé konverzace, B2B procesy a testuje, zda AI prozradí citlivé údaje. Metodologie je veřejně dostupná a lze ji využít pro vytvoření vlastního testovacího prostředí.
Použitím syntetických dat, bezpečnými spojeními k relevantním systémům a přísnými ochranami osobních údajů vytváří CRMArena-Pro bezpečné simulované prostředí, které měří nejen základní funkčnost AI agentů, ale i jejich spolehlivost a konzistenci v reálných podnikových situacích. Simulované prostředí funguje jako digitální kopie firmy, kde lze každý proces, od plánování prodeje po vyřizování reklamací, bezpečně testovat před ostrým nasazením.
Potřeba takových nástrojů vychází z výzev, kterým čelí IT ředitelé. Silný a konzistentní datový základ umožňuje podnikům důvěřovat svým AI agentům, že budou jednat správně, ale další výzvou je porozumět tomu, jak tito agenti budou fungovat v reálných obchodních scénářích. Nasazení agenta na podnikové úrovni nese významná rizika. V sázce jsou zákaznické vztahy, příjmy a provozní efektivita. Simulovaná testovací prostředí se proto stávají zásadním nástrojem pro firmy, které chtějí tato rizika zmírnit.

Hodnocení firemních AI agentů
Společnost Salesforce také vyvinula první veřejně dostupný benchmark, který pomáhá vedoucím pracovníkům porovnat výkon různých AI řešení a učinit informovaná rozhodnutí o nasazení AI agentů ve svých firmách, CRM Agentic Benchmark.
Na základě původního LLM Benchmark pro CRM nyní aktualizovaný CRM Agentic Benchmark hodnotí jak výkon velkých jazykových modelů, tak výkon podnikových agentů postavených na těchto modelech. Tento nový porovnávač nově přidal i klíčovou metriku udržitelnosti, která se stává důležitým faktorem při rozhodování o zavedení AI.
Salesforce AI Research také představil dva pokročilé testovací systémy MCP-Eval a MCP-Universe, které odhalují skutečné schopnosti AI agentů v praktických obchodních situacích. MCP-Eval umožňuje firmám rychle testovat mnoho agentů najednou na tisících automaticky vygenerovaných scénářích, zatímco MCP-Universe prověřuje agenty na složitějších, ručně navržených úkolech s reálnými daty z Google Maps, GitHubu či finančních trhů. Testy odhalily překvapivé výsledky. I nejpokročilejší AI modely jako GPT-5 uspějí pouze ve 44 % případů, což ukazuje značné mezery mezi obecnými schopnostmi AI a jejich praktickým nasazením v podnicích.
Mezi hlavní problémy patří obtíže s dlouhým kontextem, kdy modely ztrácejí přehled o informacích ve složitých vstupech, a problémy s neznámými nástroji, kdy se nedokážou plynule přizpůsobit neznámým systémům. Tyto nástroje tak firmám pomáhají zjistit, kde agenti selhávají, a realisticky posoudit, kdy jsou jejich AI agenti skutečně připraveni na ostré nasazení.
Potřeba takovýchto nástrojů vychází z nedostatků současných řešení. Většina existujících benchmarků je navržena pro akademické nebo spotřebitelské případy použití, nikoli pro složité potřeby podniků, a zřídka hodnotí AI agenty vytvořené speciálně pro podnikání. Také přehlížejí více rozhodovacích faktorů, které musí IT ředitelé a vedoucí technologií zvažovat, kde úspěch závisí na více než jedné schopnosti nebo funkci.
Jakmile jsou simulovaná prostředí na místě a agenty lze spolehlivě testovat, je zásadní nejen je hodnotit, ale také používat benchmarky, které průběžně sledují výkon agentů a aktualizují své hodnocení, aby agenti fungovali stále lépe. Podniky potřebují jasné, objektivní způsoby, jak určit, zda agenti pracují přesně, efektivně, nákladově efektivně, bezpečně a udržitelně v reálných obchodních kontextech.

Rubriky: Podnikový softwareTechnologieVývoj a HTML

Související příspěvky

6G sítě jsou klíčem k budoucnosti s robotizovaným průmyslem
Články

Čip využívající spinové vlny funguje poprvé bez externích magnetů

13. 2. 2026
Články

Gartner předpovídá, že celosvětové výdaje na IT letos vzrostou o 10,8 %

11. 2. 2026
Umělá inteligence: Nástroje vs. platforma, věda vs. kreativita
Články

Velké jazykové modely překonávají člověka i v emoční inteligenci

10. 2. 2026
Zprávičky

Evropská komise obvinila Metu z blokování konkurence v oblasti AI na WhatsAppu

10. 2. 2026

Zprávičky

ČNB vydala prvních šest povolení poskytovatelům služeb s kryptoaktivy

Redakce
13. 2. 2026

Česká národní banka (ČNB) vydala prvních šest povolení poskytovatelům služeb souvisejících s kryptoaktivy podle

Zákony informatiky: Když Brooksův zákon neplatí

OpenAI znovu obvinila DeepSeek z neoprávněného využívání svých modelů

ČTK
13. 2. 2026

Americká společnost OpenAI znovu obvinila čínský start-up zabývající se umělou inteligencí (AI) DeepSeek z

750 zaměstnanců ČSOB se díky Atosu zvládlo rychle přesunout do domácích kanceláří

Hodnota Anthropicu se díky nové investici více než zdvojnásobila na 380 mld. dolarů

ČTK
13. 2. 2026

Americký start-up zaměřený na umělou inteligenci (AI) Anthropic získal v nejnovějším investičním kole 30

Umělá inteligence v IT infrastruktuře

SoftBank dosáhla čtvrté čtvrtletí za sebou zisku, sází na investici do OpenAI

ČTK
13. 2. 2026

Japonská skupina SoftBank ve třetím finančním čtvrtletí vykázala čistý zisk 248,6 miliardy jenů (zhruba

Rusko zcela zablokovalo aplikaci WhatsApp, lidem doporučuje domácí platformu MAX

ČTK
13. 2. 2026

Rusko zcela zablokovalo komunikační platformu WhatsApp, řekl včera mluvčí Kremlu Dmitrij Peskov. Aplikace, jejímž

750 zaměstnanců ČSOB se díky Atosu zvládlo rychle přesunout do domácích kanceláří

Google získal od EU povolení pro převzetí společnosti Wiz za 32 miliard dolarů

ČTK
12. 2. 2026

Americká internetová společnost Google získala od unijních úřadů povolení převzít za 32 miliard dolarů

Evropská rada vydavatelů podala stížnost na Google kvůli AI souhrnům

ČTK
12. 2. 2026

Evropská rada vydavatelů (EPC) předložila Evropské komisi stížnost na americkou internetovou společnost Google kvůli

Paramount vylepšil svou nepřátelskou nabídku na převzetí Warner Bros

ČTK
12. 2. 2026

Společnost Paramount Skydance vylepšila nabídku na převzetí firmy Warner Bros. Discovery (WBD) ve snaze

Tiskové zprávy

Chytré technologie chrání přírodu: drony, senzory a AI pomáhají v místech, kde lidské síly nestačí

IBM představuje autonomní úložiště s novým portfoliem FlashSystem poháněným agentní AI

Jednotná správa tisíců kamer: Konica Minolta umožní propojení všech značek do jednoho systému

Společnost QNAP oficiálně představuje myQNAPcloud One: Sdílené cloudové úložiště pro zálohy NAS a škálovatelné objektové úložiště

E-šmejdi se loni pokusili ukrást přes 14 miliard korun, 12 miliard banky svým klientům zachránily

Den otevřených dveří FEL ČVUT: Projděte se studiem i výzkumem špičkových robotů, AI, energetiky, elektroniky a bioinformatiky

Zpráva dne

Nedávejte svým milovaným na Mikuláše sladkosti, radši Windows 11 CDkey od Goodoffer24.com!

Nedávejte svým milovaným na Mikuláše sladkosti, radši Windows 11 CDkey od Goodoffer24.com!

Redakce
5. 12. 2025

Na Mikuláše ani sladkosti, už vůbec ne uhlí ani brambory, ale radši nový software,...

Kalendář

Úno 26
Celý den

IT ve zdravotnictví

Bře 12
Celý den

IT Security Worshop

Zobrazit kalendář

Komentujeme

itbiz kamil pittner

Platformové inženýrství: popularita termínu může vést ke zmatení

Kamil Pittner
2. 1. 2026

Podobně jako v případě DevOps se i termín platformové inženýrství stal natolik oblíbeným, až se začal...

Slovník

Meta Tags

Mobilní marketing

SWOT analýza

Kategorie

  • Články
  • Komentujeme
  • Slovník
  • Tiskové zprávy
  • Zprávičky

Portál ITbiz.cz přináší informace z IT a byznysu již od roku 2006. Provozuje jej internetové vydavatelství Nitemedia.  Mezi další naše projekty patří například ABClinuxu.cz a Sciencemag.cz. Na stránce Redakce naleznete informace o redakci a možnostech inzerce.

Rubriky

Akce a události Byznys Cloud Ekomerce Hardware Internet Operační systémy Podnikový software Právo Science Security Technologie Telekomunikace veře Veřejná správa Vývoj a HTML Zpráva dne České IT
Žádné výsledky
Zobrazit všechny výsledky
  • Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události

© 2019 Vydává Nitemedia s.r.o. Hosting zajišťuje Greenhousing.cz.

Tento web používá cookies. Pokračováním dáváte souhlas s jejich používáním. Více na itbiz.cz/soukromi.