• Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události
Žádné výsledky
Zobrazit všechny výsledky
ITBiz.cz
ITBiz.cz
Žádné výsledky
Zobrazit všechny výsledky

Big data: Nejde jen o množství, ale nové přístupy k využití dat

itbiz
2. 9. 2015
| Články

Často diskutované téma představuje otázka, kdy vlastně jde o big data. Tedy kdy se „láme“ tradiční práce s poměrně rozsáhlými objemy dat ve firmách a jak vznikají „velká data“? Jakými klišé je daný pojem zatížen a pro která odvětví jsou big data obzvlášť zajímavá? Odpovědi se snaží nalézt první ze série článků zaměřených právě na tuto oblast.

Nejde jen o objem dat – VVVV znamená i více faktorů

V případě big data nemusí jít zrovna o situaci, kdy dat je velké množství, ale třeba o případy, kdy data přicházejí rychle, nebo se dynamicky mění, či mají extrémně nestejnou formu a dosud nebylo možné je zpracovávat jinou metodou. Z oněch známých čtyř V charakterizujících oblast big data – tedy volume (objem), velocity (rychlost), variety (různorodost) a veracity (věrohodnost) – se obvykle zdůrazňuje pouze objem, tedy že dat je hodně. Avšak nástroje na zpracování dat, kterých je „jen“ hodně, již existují a do značné míry poskytují organizacím kvalitní službu.

Určité klišé, které je na trhu v souvislosti s big data vytvářeno, předpokládá, že dat musíte mít extrémní množství – tak velké, že vám tradiční data warehouse nestačí. Ale není tomu tak.

O big data je totiž možné mluvit tehdy, kdy se řádově mění některý z dalších parametrů ve zpracování. Tedy pokud se například k tradičnímu zpracování dat, pro které organizace dosud využívají data warehouse a data mining, přidá rychlostní parametr. To samé se pak místo v řádu hodin může udát v řádu vteřin a díky rychlosti zpracování lze přispět ke změně v obchodním modelu organizace. Potřebná informace totiž může být k dispozici okamžitě.

Například v Česku neexistuje mnoho firem, které by měly takové množství dat, že by je nebyly schopny standardními technologiemi zpracovávat. Firmy dostatečně nezohledňují skutečnost, kdyby k datům přistupovaly jinak (a rychleji), mohly by změnit způsob jejich zpracování a získávání informací, jež takto vytěžují.

Konkurenční výhodu přináší spojování dat z různých oblastí

Řada organizací v Česku disponuje daty, která „přirozeným způsobem“ sbírají, ale využívají je v zásadě na něco jiného, než jim nové sofistikované technologie umožňují. Typickým příkladem jsou telekomunikační operátoři, kteří mají vybudovanou samostatnou robustní technologii na analýzu informací o zákaznících – tedy kdo jim kdy platí, jaké faktury, za které služby, jak jsou tyto firmy velké apod. Zcela samostatně mají k dispozici i relativně rozsáhlou technologii, která analyzuje data ze sítě – kdo se kdy komu dovolal, jak dlouho trval hovor, jestli to síť unesla/neunesla atd.

Ve většině případů se rozvoj sítě mobilního operátora plánuje jen podle dat z druhé oblasti. Dosud žádný tuzemský telekomunikační operátor nedospěl k tomu, že by uměl tyto dvě oblasti korelovat mezi sebou a rozšiřovat síť nejen na základě toho, jak je využívaná a jestli „stíhá“, ale zda ji v daném regionu či místě využívají zákazníci, kteří operátorovi přinášejí nejvíc byznysu.

Luděk Šafář | EMC

Luděk Šafář | EMC

Propojení obou samostatně propracovaných oblastí není technologicky jednoduché. Platí jedno z výše zmíněných V, v tomto případě „variety“. Data jsou ve formátu, který je standardními mechanismy nekorelovatelný. K tomu jsou potřeba technologické mechanismy – a někteří telekomunikační operátoři v zahraničí je již využívají – umožňující dělat mnohem efektivnější rozhodnutí ohledně investic a účinně obsloužit zákazníky právě díky tomu, že nasadili technologii, která je schopna data spojovat dohromady. Není to tedy opět jen záležitostí množství, ale o jiném vhledu, jak stávající data využívat.

Big data a sociální sítě – přeceňovaná souvislost

Dalším ustáleným klišé je jednoznačné spojování problematiky big data se sociálními sítěmi. Česká republika je v tomto ohledu relativně malá a čeština je extrémně složitý jazyk na sémantickou analýzu, který vytěžování informací ze sociálních sítí komplikuje. Valná většina technologií pro analýzu sociálních sítí vychází z „trendování“, tedy ze sledování nálady, odhadování emocí uživatelů… Čeština je však gramaticky složitá, má různé pády a časy, navíc je v ní často používána ironie a podobné vyšší úrovně jazykového vyjádření. Ty je pro strojové zpracování velmi složité rozpoznat.

Aby bylo možné získat například informaci o určitém trendu, je potřeba mít velké množství informací – extrapolace z malého vzorku je nebezpečná. Jasně nejpoužívanější sociální sítí v Česku je Facebook, ale málokterá firma z něj dokáže vytěžit obchodně hodnotné informace. Valná většina zahraničních firem má analýzu sociálních sítí navázánu na Twitter, ten v českém prostředí ale nepatří k nejpopulárnějším platformám, i když je pro analýzu z různých důvodů jednodušší než Facebook. Lze shrnout, že firmy v tuzemsku zatím data ze sociálních sítí ve velkém rozsahu a smysluplně téměř nevyužívají. Přitom jako příklad v souvislosti s big data se používá právě zejména vytěžování dat ze sociálních sítí, což je ale na Českou republiku obtížně aplikovatelné.

Pro které segmenty jsou big data atraktivní

Z hlediska jednotlivých obchodních či průmyslových odvětví jsou k využívání velkých dat obecně nejblíže firmy, které pracují se zákazníky-jednotlivci, tj. jde o oblast B2C. Je možné analyzovat vztah s člověkem, který sám rozhoduje o tom, co udělá. Čím větší množství lidí, tím lépe. A nikoli analyzovat jejich projevy na sociálních sítích, ale spíše provádět analýzu jejich nákupního chování či jednání v rámci dané organizace. Nejtypičtějším příkladem v tomto směru jsou banky. Přetrvává však velká mezera v tom, jaké veškeré obchodní informace by mohly vytěžit z tak kvalitního zdroje dat, jako je souvislá řada transakcí jedince na jeho osobním účtu. Banky jsou relativně nejdál v přemýšlení o tom, jakým způsobem budou data vytěžovat. Stále využívají především tradiční technologie, postupně zavádějí například vysokovýkonné analýzy, avšak kvalitativní přerod v tom, aby to dělaly významně jinak, zatím nenastal.

Druhou důležitou oblast představují firmy, které sbírají data z výroby, tj. z výrobních linek (strojů, senzorů) například ve strojírenství. Kromě automobilek, jež mají propracované kvalitativní mechanismy, tato data firmy hromadně nevyužívají. Zabývají se převážně zákaznickými daty, ale s velkým množstvím dat z výroby cíleně nepracují. Přitom existuje značný potenciál mimo jiné v propojování s externími datovými zdroji, například o počasí. To by mohlo mít přínosy i „menším“ firmám nebo těm společnostem, které mají primárně korporátní zákazníky, a tudíž nemůžou používat klasické scénáře pro big data, jakými jsou analýza sociálních sítí nebo nákupního chování, clickstream apod.

Třetí oblastí, která má či měla by mít k problematice big data blízko, je veřejný sektor. Stát disponuje extrémním množstvím dat, ale až na bezpečnostní složky, jež v tomto směru experimentují, zatím s těmito daty souvisle nepracuje. Například podobně, jako je tomu v komerční sféře za účelem nalezení lepších „obchodních“ mechanismů vůči „zákazníkům“, v tomto případě občanům.

Luděk Šafář pracuje u společnosti EMC Czech Republic jako Senior Manager Systems Engineer

Rubriky: CloudPodnikový softwareTechnologie

Související příspěvky

HP Dimension s Google Beam posouvají virtuální spolupráci na vyšší úroveň
Zprávičky

HP Dimension s Google Beam posouvají virtuální spolupráci na vyšší úroveň

17. 6. 2025
CzechDreamin 2025 přilákal administrátory, vývojáře i konzultanty Salesforce z celé Evropy
Články

CzechDreamin 2025 přilákal administrátory, vývojáře i konzultanty Salesforce z celé Evropy

17. 6. 2025
Digitální revoluce v českých firmách: AI a cloud mění pravidla hry pro ERP systémy
Články

Digitální revoluce v českých firmách: AI a cloud mění pravidla hry pro ERP systémy

12. 6. 2025
Zprávičky

ČR by si v AI měla najít silné stránky, potenciál je ve zdravotnictví

12. 6. 2025

Zprávičky

Vláda projedná novelu, která zpřesní pravomoci NÚKIB

Česku hrozí soud s EU, protože nemá vyhlášky k zákonu o kyberbezpečnosti

ČTK
21. 6. 2025

Česku hrozí soud s Evropskou unií kvůli tomu, že dosud nepřijalo vyhlášky a další

Akcie Eutelsatu prudce zpevňují po zprávě, že francouzská vláda poskytne peníze

ČTK
20. 6. 2025

Akcie telekomunikační společnosti Eutelsat dnes výrazně zpevňují, po poledni vykazovaly růst přes 25 procent.

Generální advokátka soudu EU podpořila pokutu přes čtyři miliardy eur pro Google

ČTK
20. 6. 2025

Generální advokátka nejvyššího soudu Evropské unie potvrdila rekordní pokutu přes čtyři miliardy eur, kterou

Dopad amerických cel na sektor IT: boj o softwarovou nezávislost

Trump podepsal nařízení prodlužující lhůtu pro prodej TikToku v USA

ČTK
20. 6. 2025

Americký prezident Donald Trump podepsal exekutivní příkaz, který prodlužuje lhůtu pro prodej amerických aktiv

Microsoft hodlá zrušit další tisíce pracovních míst

ČTK
20. 6. 2025

Americký softwarový gigant Microsoft hodlá zrušit další tisíce pracovních míst, a to především v

Výrobce čipů Texas Instruments investuje v USA 60 miliard dolarů a vytvoří místa

ČTK
19. 6. 2025

Americký výrobce počítačových čipů Texas Instruments (TI) investuje ve Spojených státech více než 60

Meta lákala zaměstnance OpenAI na bonus ve výši 100 milionů dolarů

Meta lákala zaměstnance OpenAI na bonus ve výši 100 milionů dolarů

Redakce
19. 6. 2025

Boj technologických gigantů o AI odborníky dosáhl nebývalých rozměrů. Generální ředitel OpenAI Sam Altman

Kryptoměny a jejich ekonomika

Senát USA schválil zákon o stablecoinech označovaný za milník pro kryptoměny

ČTK
19. 6. 2025

Americký Senát schválil zákon, který vytváří regulační rámec pro kryptoměny vázané na americký dolar

Tiskové zprávy

MPO podpořilo přelomový projekt: Česko podává žádost o výstavbu AI Gigafactory

Česká obchodní inspekce uskutečnila v prvním čtvrtletí 174 kontrol internetových obchodů, porušení předpisů zjistila ve 151 kontrolách

Denní používání AI v kancelářích za půl roku vzrostlo o 233 %, ukazuje nový výzkum společnosti Slack

Pure Storage představuje cloud pro podniková data. Zákazníkům umožní spravovat data namísto úložišť

Falešní bankéři způsobili meziročně o 41 % vyšší škody

ELLIOT: Vlajková iniciativa pro vývoj otevřených multimodálních základních modelů pro robustní umělou inteligenci v reálném světě

Zpráva dne

Květen je měsícem růstu, můžete růst s Windows 11 jen za €20.00!

Květen je měsícem růstu, můžete růst s Windows 11 jen za €20.00!

Redakce
15. 5. 2025

Kupte Windows 11 CDkey od Goodoffer24.com a můžete růst s tímto OS jak při...

Videa ITBiz.cz

Glenn Mallon, Dell Technologies

Elektronická recepční

FORXAI Mirror

Kamery pro průmysl a detekci požárů

Kamery pro vyhodnocení spokojenosti zákazníků

Kalendář

Zář 22
22. září @ 8:00 - 26. září @ 17:00

EMO Hannover 2025

Říj 1
Celý den

Cyber Attacks

Říj 21
Celý den

Bezpečnosť a dostupnosť dát

Zobrazit kalendář

Komentujeme

Chvála černých skřínek

Malé modely AI mají být velkým trendem

Pavel Houser
3. 1. 2025

V záplavě prognóz technologického vývoje (nejen) v roce 2025 zde prozatím trochu zapadlo jedno téma, které...

Odebírat newsletter

Zásady ochrany osobních údajů.

Zkontrolujte svoji doručenou poštu a potvrďte odběr.

Slovník

IS–95

Gray Hat Seo

QIP

Kategorie

  • Články
  • Komentujeme
  • Slovník
  • Tiskové zprávy
  • Zprávičky

Portál ITbiz.cz přináší informace z IT a byznysu již od roku 2006. Provozuje jej internetové vydavatelství Nitemedia. Hosting zajišťuje společnost Greenhousing.cz. Mezi další naše projekty patří například ABClinuxu.cz a Sciencemag.cz. Na stránce Redakce naleznete informace o redakci a možnostech inzerce.

Rubriky

Akce a události Byznys Cloud Ekomerce Hardware int Internet Operační systémy Podnikový software Právo Science Security Technologie Telekomunikace Veřejná správa Vývoj a HTML Zpráva dne České IT

Píšeme jinde

RSS ScienceMag RSS

  • Homo juluensis: pokus o nové uspořádání druhů člověka z východní Asie
  • Superpočítačové simulace pomáhají objasnit, jak stabilizovat jednoatomové katalyzátory
  • Sonda Solar Orbiter poskytla unikátní záběry jižního slunečního pólu

RSS AbcLinuxu RSS

  • Oakley Meta Glasses
  • Česko podává žádost o výstavbu AI Gigafactory
  • Raspberry Pi Official Magazine 154

Newsletter

Zásady ochrany osobních údajů.

Zkontrolujte svoji doručenou poštu a potvrďte odběr.

Žádné výsledky
Zobrazit všechny výsledky
  • Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události

© 2019 Vydává Nitemedia s.r.o. Hosting zajišťuje Greenhousing.cz.

Tento web používá cookies. Pokračováním dáváte souhlas s jejich používáním. Více na itbiz.cz/soukromi.