Mýty o big data a analytice

Pavel Houser , 26. říjen 2017 06:30 0 komentářů
Mýty o big data a analytice

Nejdůležitější jsou často odpovědi získané mimochodem. Platformy různých dodavatelů prý dávají odlišné výsledky. A velké objemy dat neznamenají „veškerá data“.

Například podle studie IDC roste trh s nástroji pro big data sice v dvojciferných číslech, jenže na to, kolik se o technologiích mluví, to vlastně není tak mnoho. Mnohé projekty přitom nepřinášejí očekávanou návratnost investic. Přijde celková deziluze?

Andrew Froehlich se společnosti West Gate Networks se na InformationWeek pokouší podrobněji analyzovat nejčastěji opakovaná tvrzení, která se k příslušným technologiím vážou. Celkově mu ovšem nejde ani tak o varování před riziky, ale spíše chce rozptýlit nepříliš opodstatněné obavy, které vedou k tomu, že podniková IT oddělení jsou paralyzována a nasazování inovací vázne.

Jedním z omylů je snaha ukládat opravdu všechno, „protože by se to mohlo jednou hodit“. Ve skutečnosti mnohá data mají smysl pouze pro analýzu v reálném čase (nebo v časovém horizontu, který se tomu alespoň blíží) a nemá smysl je archivovat. A když už se všechno archivuje, je vhodné si uvědomit, že řešení vhodná k zálohování (pro obnovu pro havárii) a pro dodržení předpisů se vůbec nemusí hodit pro předpokládanou práci s daty (analýzu).

Big data nejsou jen pro ty největší

Mnoho organizací přeceňuje náklady. Pod velkými objemy dat si představí něco, s čím pracuje Google, Facebook nebo Microsoft. Přitom řešení pro big data a jejich analýzu v cloudu je dnes již dostupná i menším organizacím a hlavně: řešení – včetně ceny – bývá dobře škálovatelné podle potřeb a možností zákazníka. Podobně jako u jiných cloudových nástrojů nemusí být nijak vysoká ani vstupní investice. Viz i předešlý bod – v big data nemá smysl uvažovat způsobem „všechno, nebo nic“. Nemá ani smysl si říkat, že „získat konkurenční výhodu už je pozdě“, ani trend prozatím přeskočit a čekat na nějaký další zásadnější zlom. Big data stejně jako umělá inteligence a automatizace se bude do podnikového IT a podnikových procesů vůbec implementovat mnoho příštích let, s postupnými dalšími inovacemi.

Další tipy podle A. Froehlicha:

Stojí za to si nedefinovat veškeré otázky předem a příliš si nezúžit práci. Výhodou analýz nad big data může být i získání neplánovaných poznatků. Stojí za to si s výstupy hrát a zkoumat, zda se kromě odpovědí neobjeví také nové otázky (dozvíme se o tom, co ani nevíme, že nevíme). Pokud si management myslí, že podnikání plně rozumí a chce si jen „exaktně“ potvrdit, co už ví předem, přínosy z technologie budou samozřejmě velmi omezené.

A co lidský faktor? Specialistů na „data science“ je dnes nedostatek, nicméně není nutné čekat na někoho s příslušným univerzitním vzděláním. Kdo má příslušné myšlení (i třeba včetně psychického nastavení – určitá introverze apod.) a pracuje v podnikovém IT, může se přeškolit. Není to i nic zásadnější posun, než když se z databázového správce stane správce virtuálních strojů.

Často se říká, že platformy pro big data od různých dodavatelů jsou prakticky stejné (dejme tomu až na rychlost, náklady na vlastnictví apod.), důležitější je umět nástroje účelně využívat. Andrew Froehlich důrazně nesouhlasí. Pokud různé problémy řešíme na produktech různých dodavatelů, můžeme podle něj klidně dostávat odlišné závěry (nejde o kalkulačku, která musí vždy dát stejný výsledek). Volbě konkrétního řešení je proto třeba věnovat velkou pozornost.

A nakonec, big data nejsou velké datové sklady. Existují zde podstatné rozdíly, v technologiích, nástrojích i požadovaném know-how. Hlavní odlišnost spočívá v tom, zda zpracováváme spíše strukturovaná nebo nestrukturovaná data.


Komentáře

RSS 

Komentujeme

Když obrázek není tím, čím se zdá být

Pavel Houser , 10. listopad 2018 06:30
Pavel Houser

Problematika falešných zpráva je dnes módní záležitostí. Následující výzkum se zaměřuje na jeden spe...

Více







RSS 

Zprávičky

Rovio zvyšuje zisk, potřebuje ale nové hry

ČTK , 18. listopad 2018 08:00

Letos v únoru cena akcií firmy klesla o 50 % pod cenu stanovenou pro primární nabídku akcií....

Více 0 komentářů

Podle Check Pointu malware těžící kryptoměny dominuje dál

Pavel Houser , 17. listopad 2018 08:00

Objevena byla rozsáhlá kampaň šířící RAT malware FlawedAmmyy....

Více 0 komentářů

Samsung Exynos 9 řady 9820 pro umělou inteligenci v mobilech

Pavel Houser , 16. listopad 2018 12:46

Jádro čtvrté generace a modem LTE Advanced Pro s rychlostí 2,0 Gb/s mají vylepšit rozšířenou a virtu...

Více 0 komentářů

Starší zprávičky

BlackBerry koupí za 1,4 miliardy USD Cylance

ČTK , 16. listopad 2018 12:40

Cylance vyvíjí produkty na bázi umělé inteligence, které mají zabránit kybernetickým útokům....

Více 0 komentářů

Uber ve čtvrtletí prohloubil ztrátu na 1,07 miliardy USD

ČTK , 16. listopad 2018 08:00

Uber zvažuje, že posune primární nabídku akcií z druhé poloviny příštího roku na první polovinu....

Více 0 komentářů

Novým generálním ředitelem Autocontu je bývalý šéf Oracle Sameš

ČTK , 15. listopad 2018 12:44

Autocont se zaměřuje na poskytování komplexních IT řešení a služeb pro firmy a státní správu....

Více 0 komentářů

Lagardeová: Centrální banky by měly vydávat digitální měny

ČTK , 15. listopad 2018 08:00

Některé centrální banky, včetně švédské, kanadské a čínské, již uvažují o emisích digitálních měn ve...

Více 0 komentářů