• Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události
Žádné výsledky
Zobrazit všechny výsledky
ITBiz.cz
ITBiz.cz
Žádné výsledky
Zobrazit všechny výsledky

Kvantita dat nestačí

Redakce
3. 2. 2022
| Články
Python nepoužívají jen datoví vědci

Zdroj: Pixabay

„Paradox velkých dat“ ve své nejnovější verzi formuloval harvardský statistik Xiao-Li Meng v roce 2018. Dostupnost dat svádí k přesvědčení, že čím víc, tím líp, a současně že tím více se na výsledky získané z těchto dat můžeme spolehnout. Do jisté míry je to samozřejmě pravda, nicméně tento přístup může vést i k řadě omylů. Následující studie srovnává více průzkumů a to, jak výsledně korespondovaly s realitou.

Seth Flaxman, Unrepresentative big surveys significantly overestimate US vaccine uptake, Nature (2021). DOI: 10.1038/s41586-021-04198-4. www.nature.com/articles/s41586-021-04198-4
Zdroj: Harvard University / Phys.org

Samotné téma studie je specifické, týká se očkování proti koronaviru. Jak se ukázalo, průzkumy zahrnující větší množství lidí vůbec nedávaly přesnější výsledky (v průzkumech vycházelo větší podpora očkování). Podobně selhávají předvolební odhady (americké prezidentské volby 2016). Zčásti jde o výsledek situace, kdy hlavní média mají nějaký názor a prohlašují ho za celkový „společenský konsensus“. Jeho odpůrci pak raději v průzkumech volí neutrální formulace, prohlašují se za „nepřesvědčené“, vůbec se odmítnou účastnit apod.
V této souvislosti by se samozřejmě dalo začít lamentovat nad tím, jak se vlastně i ve svobodné společnosti lidé mnohdy cítí zastrašeni a zdráhají se otevřeně se přihlásit ke svým názorům. To je ale jen část pravdy, paradox velkých dat funguje mnohem univerzálněji. Hlavní je, že průzkum vždy zachytí pouze určitým způsobem vybraný vzorek. Technicky vzato třeba předvolební průzkumy se s výsledkem voleb míjely často. Oslovena byla např. specifická skupina obyvatel (ve 30. letech v USA telefonický průzkum k prezidentským volbám – to ovšem už znamenalo určitou skupinu respondentů, ty, kdo měli telefon). Dnes si ale mnoho lidí myslí, že více respondentů znamená automaticky vyšší shodu se skutečností a vzorek je nutně reprezentativní („Internet/sociální sítě používá přece skoro každý“). To ale není pravda, jak ukázala právě výše zmíněná selhání.
Závěr zní, že např. firma jako prodejce potřebuje znát názor relevantního vzorku zákazníků. Nějaká data se dají sebrat snadno i velkém množství, jenže ta právě reprezentativní nejsou skoro nikdy. A už vůbec nejsou relevantní/relevantnější jen proto, že jich je relativně hodně. Článek (viz výše) vysvětluje, že vzorek zahrnující 5 % populace může být klidně cennější než vzorek 90 %, ovšem s neznámými zkresleními.

Rubriky: ScienceTechnologie

Související příspěvky

Umělá inteligence v IT infrastruktuře
Zprávičky

Agenti AI od Googlu budou pomáhat Pentagonu, zprvu s neutajovanými úkoly

11. 3. 2026
Meta lákala zaměstnance OpenAI na bonus ve výši 100 milionů dolarů
Zprávičky

Meta převezme sociální síť pro umělou inteligenci Moltbook

10. 3. 2026
6G sítě jsou klíčem k budoucnosti s robotizovaným průmyslem
Články

Huawei uvádí komplexní portfolio, které otevírá cestu k 6G

9. 3. 2026
Nebojte se hlásit na seniornější pozice, radí IT pracovní portál
Zprávičky

Před 10 lety vyhrál počítač poprvé nad mistrem světa ve hře go

9. 3. 2026

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Souhlasím se Zásadami ochrany osobních údajů .

Zprávičky

Hackeři získali citlivá data ze Slavia pojišťovny, například zdravotní dokumenty

ČTK
11. 3. 2026

Ze systému Slavia pojišťovny uniklo přibližně 150 gigabajtů citlivých dat. Jedná se například o

Finanční správa zrušila tendr na nový daňový informační systém

ČTK
11. 3. 2026

Finanční správa zrušila tendr na dodání nového daňového informačního systému. Důvodem bylo, že v

Umělá inteligence v IT infrastruktuře

Agenti AI od Googlu budou pomáhat Pentagonu, zprvu s neutajovanými úkoly

ČTK
11. 3. 2026

Agenti umělé inteligence (AI) vyvinutí společností Google budou pomáhat s rutinními úkoly třem milionům

Gordic a Cybrela přinášejí komplexní řešení kybernetické bezpečnosti

Sněmovna posunula zákon o digitální ekonomice do dalšího kola projednávání (aktualizováno)

ČTK
10. 3. 2026

Sněmovna dnes propustila do dalšího kola projednávání vládní návrh zákona o digitální ekonomice, který

Meta lákala zaměstnance OpenAI na bonus ve výši 100 milionů dolarů

Meta převezme sociální síť pro umělou inteligenci Moltbook

ČTK
10. 3. 2026

Americká internetová společnost Meta převezme sociální síť pro umělou inteligenci (AI) Moltbook. Informoval o

Británie zatím sociální sítě osobám mladším 16 let nezakáže

ČTK
10. 3. 2026

Británie zatím sociální sítě osobám mladším 16 let nezakáže. Návrh na zavedení zákazu v

Vláda nesouhlasí s novelou o zákazu používání mobilů ve školách

ČTK
9. 3. 2026

Nesouhlasné stanovisko k novele o zákazu či omezení používání mobilních telefonů a dalších elektronických

750 zaměstnanců ČSOB se díky Atosu zvládlo rychle přesunout do domácích kanceláří

Vláda jmenovala ředitelem Digitální informační agentury Bohdana Urbana

ČTK
9. 3. 2026

Vláda dnes odvolala ředitele Digitální informační agentury (DIA) Petra Kuchaře. Nahradí ho dosavadní ředitel

Tiskové zprávy

QNAP mění NAS na NDR: ADRA NDR Standalone snižuje bariéry v oblasti vnitřní síťové bezpečnosti

ČSÚ: Digitální dovednosti v Česku jsou nad průměrem EU

Acer EMEA představuje Acer Channel Partner Portal

Epson uvádí na trh plochou tiskárnu SC-V4000 A1+ pro UV tisk

Women in Tech 2026: Program pro podnikatelky v technologiích otevírá přihlášky do pátého ročníku

Acer EMEA slaví 50 let: od hardwaru k diverzifikaci

Zpráva dne

Nedávejte svým milovaným na Mikuláše sladkosti, radši Windows 11 CDkey od Goodoffer24.com!

Nedávejte svým milovaným na Mikuláše sladkosti, radši Windows 11 CDkey od Goodoffer24.com!

Redakce
5. 12. 2025

Na Mikuláše ani sladkosti, už vůbec ne uhlí ani brambory, ale radši nový software,...

Kalendář

Bře 17
Celý den

IT Security Worshop

Dub 15
Celý den

Energy Vision

Kvě 12
Celý den

Cloud Computing Conference

Zobrazit kalendář

Komentujeme

itbiz kamil pittner

Platformové inženýrství: popularita termínu může vést ke zmatení

Kamil Pittner
2. 1. 2026

Podobně jako v případě DevOps se i termín platformové inženýrství stal natolik oblíbeným, až se začal...

Slovník

EBIT

Federal Fund Rate

Public Domain

Kategorie

  • Články
  • Komentujeme
  • Slovník
  • Tiskové zprávy
  • Zprávičky

Portál ITbiz.cz přináší informace z IT a byznysu již od roku 2006. Provozuje jej internetové vydavatelství Nitemedia.  Mezi další naše projekty patří například ABClinuxu.cz a Sciencemag.cz. Na stránce Redakce naleznete informace o redakci a možnostech inzerce.

Rubriky

Akce a události Byznys Cloud Ekomerce Hardware Internet Operační systémy Podnikový software Právo Science Security Technologie Telekomunikace veře Veřejná správa Vývoj a HTML Zpráva dne České IT
Žádné výsledky
Zobrazit všechny výsledky
  • Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události

© 2019 Vydává Nitemedia s.r.o. Hosting zajišťuje Greenhousing.cz.

Tento web používá cookies. Pokračováním dáváte souhlas s jejich používáním. Více na itbiz.cz/soukromi.