• Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události
Žádné výsledky
Zobrazit všechny výsledky
ITBiz.cz
ITBiz.cz
Žádné výsledky
Zobrazit všechny výsledky

Výzkumníci navrhují, jak modely AI zbavit falešných korelací. Aniž bychom museli vědět, o jaké konkrétně jde

Pavel Houser
15. 7. 2025
| Články

Modely umělé inteligence si při svém tréninku často vytvářejí falešné korelace – tedy vazbu na typyinformací, které jsou irelevantní (nebo alespoň nikoliv klíčové) a potenciálně zavádějící. Vědci nyní zjistili, že tyto naučené falešné korelace lze vysledovat už na velmi malé podmnožině tréninkových dat, a přišli s technikou pro řešení problému. Jak uvedla hlavní autorka práce Jung-Eun Kim z North Carolina State University, tato technika je přitom použitelná bez toho, aby byly známy konkrétní falešné korelace, které si AI osvojila. Stačí, když si uživatelé AI (ve fázi testů nebo i ostrého provozu) všimnou, že model jim servíruje neuspokojivé výsledky.
Příklad: model AI byl natrénován k identifikaci fotografií psů. Tréninková datová sada zahrnovala fotografie psů, u kterých je umělé inteligenci řečeno, že na fotografii je pes.
Během tréninku začne umělá inteligence identifikovat specifické znaky, které bude používat k identifikaci psů. Pokud však mnoho psů na fotografiích nosí obojky a protože obojky jsou obecně méně složitými znaky psa než uši nebo srst, může pak AI začít pokládat obojky za jednoduchý způsob identifikace psů. Takto mohou vzniknout falešné korelace (zde jde o tzv. simplicity bias). Následně začne AI považovat za psy třeba kočky nebo jiná zvířata s obojkem.
Běžné techniky řešení problémů způsobených falešnými korelacemi se spoléhají na to, že odborníci z praxe jsou schopni identifikovat falešné rysy, které problém způsobují. Ten pak mohou řešit úpravou souborů dat používaných k trénování modelu umělé inteligence. V souboru dat lze například zvýšit relativní váhu fotografií, na nichž jsou psi bez obojku.
Jenže identifikovat tímto způsobem (pomocí lidských expertů v oboru) původ vzniku falešných korelací není vždy možné nebo je to náročné. Nová technika se proto snaží o odstranění falešných korelací i bez toho, aby se je podařilo konkrétně odhalit. Postup spočívá v odstranění malé části dat použitých k trénování modelu umělé inteligence.
„Ve vzorcích dat zahrnutých do tréninkových datových sad mohou být značné rozdíly,“ říká J. Kim. „Některé vzorky mohou být velmi jednoduché, zatímco jiné velmi složité. A my můžeme měřit, jak ‚složitý‘ je každý vzorek, na základě toho, jak se model choval během tréninku. … Naše hypotéza byla, že nejsložitější vzorky v datové sadě mohou být zašuměné a nejednoznačné a s největší pravděpodobností nutí síť spoléhat se na irelevantní informace, které poškozují přesnost modelu … Tím, že eliminujete malou část tréninkových dat, která je obtížně srozumitelná, eliminujete také obtížné vzorky dat obsahující s největší pravděpodobností zdroj falešných korelací.“
Výzkumníci rovněž prokázali účinnost této metody ve srovnání s předběžných odhalováním konkrétních falešných korelací.

Varun Mulchandani et al, Severing Spurious Correlations with Data Pruning, arXiv (2025). DOI: 10.48550/arxiv.2503.18258
Zdroj: North Carolina State University / TechXplore.com

Rubriky: ScienceTechnologie

Související příspěvky

Zprávičky

Brněnská Spacemanic spolupracuje na družici, která otestuje kyberbezpečnost

29. 4. 2026
Zákony informatiky: Když Brooksův zákon neplatí
Zprávičky

DeepSeek představil zkušební verzi nového modelu umělé inteligence

28. 4. 2026
Zprávičky

Partnerství OpenAI s Microsoftem nebude exkluzivní, ChatGPT může na jiné cloudy

28. 4. 2026
Zprávičky

Google čelí tlaku EU, aby otevřel Android pro konkurenty Gemini

27. 4. 2026

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Zprávičky

Apple navýšil tržby o 17 % na 111,2 miliardy dolarů, překonal očekávání

ČTK
1. 5. 2026

Americká technologická společnost Apple ve druhém čtvrtletí svého finančního roku navýšila tržby meziročně o

Elektronická zdravotní dokumentace bude dál uložená pouze u lékaře

ČTK
1. 5. 2026

Elektronická zdravotní dokumentace pacienta bude dál uložená pouze u jeho lékaře, stát ji nebude

Microsoft zvýšil zisk o 23 %, tržby překonaly očekávání analytiků

ČTK
1. 5. 2026

Americká softwarová společnost Microsoft navýšila čistý zisk ve třetím čtvrtletí svého finančního roku meziročně

Meta zvýšila zisk o 61 % na 27 mld. dolarů, zisk i tržby překonaly očekávání

ČTK
1. 5. 2026

Americká internetová společnost Meta Platforms v prvním čtvrtletí zvýšila čistý zisk meziročně o 61

EK vyzvala státy EU k rychlému zavedení aplikace pro ověřování věku

ČTK
1. 5. 2026

Evropská komise dnes naléhavě vyzvala členské státy EU, aby kvůli ochraně nezletilých na internetu

Jak nakupovat – nebo prodávat – data

Prezident podepsal zákonné zakotvení principů správy dat veřejného sektoru

ČTK
1. 5. 2026

Principy správy dat veřejného sektoru zákonné zakotvení. Zavede je vládní předloha o správě dat,

Meta potvrdila, že propustí 10 % zaměstnanců, asi 8 000 lidí

ČTK
1. 5. 2026

Americká internetová společnost Meta se rozhodla propustit deset procent zaměstnanců, tedy zhruba 8 000

Zisk Alphabetu ve čtvrtletí stoupl o 81 %, dařilo se cloudové divizi

ČTK
1. 5. 2026

Americké technologické společnosti Alphabet, která je mimo jiné vlastníkem vyhledávače Google, vzrostl v prvním

Tiskové zprávy

QNAP představuje QAI-h1290FX: průlomový Edge AI úložný server pro privátní LLM a generativní AI pracovní úlohy

Umělá inteligence od Konica Minolta dohlíží na bezpečnost i v mrazu, dešti a prachu

Virtuální výcvik pyrotechniků i holografické velení: FEL ČVUT vyvíjí technologie, které mění přípravu i řízení operací

FEL ČVUT ukázala technologie pro moderní obranu: od autonomních robotů přes AI až po rozšířenou realitu a zabezpečení sítí

Cloud Computing Conference 2026 ukáže, co dnes rozhoduje o úspěchu digitální transformace

Autonomní síť HPE umožňuje zlepšit zážitky fanoušků na madridském stadionu Riyadh Air Metropolitano

Zpráva dne

Nedávejte svým milovaným na Mikuláše sladkosti, radši Windows 11 CDkey od Goodoffer24.com!

Nedávejte svým milovaným na Mikuláše sladkosti, radši Windows 11 CDkey od Goodoffer24.com!

Redakce
5. 12. 2025

Na Mikuláše ani sladkosti, už vůbec ne uhlí ani brambory, ale radši nový software,...

Kalendář

Kvě 12
Celý den

Cloud Computing Conference

Kvě 19
Doporučené 19. května - 21. května

TechEd 2026

Kvě 26
Celý den

Umelá inteligencia v IT infraštruktúre

Zobrazit kalendář

Odebírat newsletter

Zásady ochrany osobních údajů.

Zkontrolujte svoji doručenou poštu a potvrďte odběr.

Slovník

.A01

Binární vyhledávací strom

Financial analyst

Komentujeme

itbiz kamil pittner

Platformové inženýrství: popularita termínu může vést ke zmatení

Kamil Pittner
2. 1. 2026

Podobně jako v případě DevOps se i termín platformové inženýrství stal natolik oblíbeným, až se začal...

Kategorie

  • Články
  • Komentujeme
  • Slovník
  • Tiskové zprávy
  • Zprávičky

Portál ITbiz.cz přináší informace z IT a byznysu již od roku 2006. Provozuje jej internetové vydavatelství Nitemedia.  Mezi další naše projekty patří například ABClinuxu.cz a Sciencemag.cz. Na stránce Redakce naleznete informace o redakci a možnostech inzerce.

Rubriky

Akce a události Byznys Cloud Ekomerce Hardware Internet Operační systémy Podnikový software Právo Science Security Technologie Telekomunikace veře Veřejná správa Vývoj a HTML Zpráva dne České IT
Spravovat Souhlas
Abychom poskytli co nejlepší služby, používáme k ukládání a/nebo přístupu k informacím o zařízení, technologie jako jsou soubory cookies. Souhlas s těmito technologiemi nám umožní zpracovávat údaje, jako je chování při procházení nebo jedinečná ID na tomto webu. Nesouhlas nebo odvolání souhlasu může nepříznivě ovlivnit určité vlastnosti a funkce.
Funkční Vždy aktivní
Technické uložení nebo přístup je nezbytně nutný pro legitimní účel umožnění použití konkrétní služby, kterou si odběratel nebo uživatel výslovně vyžádal, nebo pouze za účelem provedení přenosu sdělení prostřednictvím sítě elektronických komunikací.
Předvolby
Technické uložení nebo přístup je nezbytný pro legitimní účel ukládání preferencí, které nejsou požadovány odběratelem nebo uživatelem.
Statistiky
Technické uložení nebo přístup, který se používá výhradně pro statistické účely. Technické uložení nebo přístup, který se používá výhradně pro anonymní statistické účely. Bez předvolání, dobrovolného plnění ze strany vašeho Poskytovatele internetových služeb nebo dalších záznamů od třetí strany nelze informace, uložené nebo získané pouze pro tento účel, obvykle použít k vaší identifikaci.
Marketing
Technické uložení nebo přístup je nutný k vytvoření uživatelských profilů za účelem zasílání reklamy nebo sledování uživatele na webových stránkách nebo několika webových stránkách pro podobné marketingové účely.
  • Spravovat možnosti
  • Spravovat služby
  • Správa {vendor_count} prodejců
  • Přečtěte si více o těchto účelech
Zobrazit předvolby
  • {title}
  • {title}
  • {title}
Žádné výsledky
Zobrazit všechny výsledky
  • Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události

© 2019 Vydává Nitemedia s.r.o. Hosting zajišťuje Greenhousing.cz.