Mýty o big data a analytice

Pavel Houser , 26. říjen 2017 06:30 0 komentářů
Mýty o big data a analytice

Nejdůležitější jsou často odpovědi získané mimochodem. Platformy různých dodavatelů prý dávají odlišné výsledky. A velké objemy dat neznamenají „veškerá data“.

Například podle studie IDC roste trh s nástroji pro big data sice v dvojciferných číslech, jenže na to, kolik se o technologiích mluví, to vlastně není tak mnoho. Mnohé projekty přitom nepřinášejí očekávanou návratnost investic. Přijde celková deziluze?

Andrew Froehlich se společnosti West Gate Networks se na InformationWeek pokouší podrobněji analyzovat nejčastěji opakovaná tvrzení, která se k příslušným technologiím vážou. Celkově mu ovšem nejde ani tak o varování před riziky, ale spíše chce rozptýlit nepříliš opodstatněné obavy, které vedou k tomu, že podniková IT oddělení jsou paralyzována a nasazování inovací vázne.

Jedním z omylů je snaha ukládat opravdu všechno, „protože by se to mohlo jednou hodit“. Ve skutečnosti mnohá data mají smysl pouze pro analýzu v reálném čase (nebo v časovém horizontu, který se tomu alespoň blíží) a nemá smysl je archivovat. A když už se všechno archivuje, je vhodné si uvědomit, že řešení vhodná k zálohování (pro obnovu pro havárii) a pro dodržení předpisů se vůbec nemusí hodit pro předpokládanou práci s daty (analýzu).

Big data nejsou jen pro ty největší

Mnoho organizací přeceňuje náklady. Pod velkými objemy dat si představí něco, s čím pracuje Google, Facebook nebo Microsoft. Přitom řešení pro big data a jejich analýzu v cloudu je dnes již dostupná i menším organizacím a hlavně: řešení – včetně ceny – bývá dobře škálovatelné podle potřeb a možností zákazníka. Podobně jako u jiných cloudových nástrojů nemusí být nijak vysoká ani vstupní investice. Viz i předešlý bod – v big data nemá smysl uvažovat způsobem „všechno, nebo nic“. Nemá ani smysl si říkat, že „získat konkurenční výhodu už je pozdě“, ani trend prozatím přeskočit a čekat na nějaký další zásadnější zlom. Big data stejně jako umělá inteligence a automatizace se bude do podnikového IT a podnikových procesů vůbec implementovat mnoho příštích let, s postupnými dalšími inovacemi.

Další tipy podle A. Froehlicha:

Stojí za to si nedefinovat veškeré otázky předem a příliš si nezúžit práci. Výhodou analýz nad big data může být i získání neplánovaných poznatků. Stojí za to si s výstupy hrát a zkoumat, zda se kromě odpovědí neobjeví také nové otázky (dozvíme se o tom, co ani nevíme, že nevíme). Pokud si management myslí, že podnikání plně rozumí a chce si jen „exaktně“ potvrdit, co už ví předem, přínosy z technologie budou samozřejmě velmi omezené.

A co lidský faktor? Specialistů na „data science“ je dnes nedostatek, nicméně není nutné čekat na někoho s příslušným univerzitním vzděláním. Kdo má příslušné myšlení (i třeba včetně psychického nastavení – určitá introverze apod.) a pracuje v podnikovém IT, může se přeškolit. Není to i nic zásadnější posun, než když se z databázového správce stane správce virtuálních strojů.

Často se říká, že platformy pro big data od různých dodavatelů jsou prakticky stejné (dejme tomu až na rychlost, náklady na vlastnictví apod.), důležitější je umět nástroje účelně využívat. Andrew Froehlich důrazně nesouhlasí. Pokud různé problémy řešíme na produktech různých dodavatelů, můžeme podle něj klidně dostávat odlišné závěry (nejde o kalkulačku, která musí vždy dát stejný výsledek). Volbě konkrétního řešení je proto třeba věnovat velkou pozornost.

A nakonec, big data nejsou velké datové sklady. Existují zde podstatné rozdíly, v technologiích, nástrojích i požadovaném know-how. Hlavní odlišnost spočívá v tom, zda zpracováváme spíše strukturovaná nebo nestrukturovaná data.


Komentáře

RSS 

Komentujeme

Deset minut s Einsteinem

Richard Jan Voigts , 18. listopad 2017 10:45
Richard Jan Voigts

Při návštěvě Švýcarska jsme strávili den na Eidgenoessiche Technische Hochschule Zurich – Swiss Fede...

Více







RSS 

Zprávičky

V zóně u Žatce by mohlo stát datové centrum za 15 miliard

ČTK , 23. listopad 2017 12:26

V průmyslové zóně Triangle u Žatce může vzniknout datové centrum pro společnosti a instituce z celé ...

Více 0 komentářů

ÚOHS schválil změnu vlastníka většiny v AutoContu

ČTK , 23. listopad 2017 09:00

Spojení AutoContu a KKCG nemá mít za následek podstatné narušení hospodářské soutěže...

Více 0 komentářů

Česká hra o atentátu na Heydricha se dostala do světové distribuce Steam

ČTK , 23. listopad 2017 08:30

Do distribuce českou hru dostali hlasováním sami hráči....

Více 0 komentářů

Starší zprávičky

Čína vyvíjí vlastní digitální měnu

ČTK , 23. listopad 2017 08:00

Čínské vedení vyvíjí vlastní kryptoměnu. Chce tak oslabit vliv bitcoinu a dalších virtuálních měn, n...

Více 0 komentářů

Hackeři ukradli Uberu data 57 milionů zákazníků a řidičů

ČTK , 22. listopad 2017 09:15

Incident společnost rok tajila a hackerům zaplatila....

Více 0 komentářů

Tuzemské banky útok trojského koně nezaznamenaly

ČTK , 22. listopad 2017 09:00

Banky ČSOB, Sberbank a Air Bank nezaznamenaly útok trojského koně BankBot na své aplikace mobilního ...

Více 0 komentářů

ODS chce otevřít diskusi o zavedení elektronických voleb

ČTK , 22. listopad 2017 08:00

Komisaři by také např. už při vkládání výsledků měli kontrolovat, zda na lístcích není nějaký abnorm...

Více 0 komentářů