• Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události
Žádné výsledky
Zobrazit všechny výsledky
ITBiz.cz
ITBiz.cz
Žádné výsledky
Zobrazit všechny výsledky

Nekvalitní data mohou způsobovat ekonomické ztráty

itbiz
5. 1. 2009
| Články
SAS

Dnešní doba klade na firemní IT stále větší požadavky na kvalitu a hlavně množství informací, které je třeba doručit stále většímu počtu uživatelů. Dnešní článek je pokračováním miniseriálu o Business Intelligence. Podíváme se na problematiku datové kvality, obohacování, slučování dat, reporting a také na pojem BI v podání SAS Institute.

SAS

První díl definoval současné problémy firem s daty, představil Business Intelligence systémy atd.

Kvalita dat je klíčem Business Intelligence

Z povahy zpracování hromadných dat vyplývá prakticky ve všech datech výskyt řady defektů, nekonzistencí, neúplností atd., jež jsou souhrnně chápány jako prvky (ne)kvality dat.

Jejich existence má větší či menší vliv na používání dat a informací, a v důsledku může způsobovat ekonomické ztráty (procesy pracující s daty poskytují nekorektní výsledky, snižuje se účinnost marketinkových nástrojů, jsou vynakládány náklady na zpracování nepotřebných a nekvalitních dat, nákladné jsou také podnikové procesy řešící nekvality dat). Obecně do sféry řešení problematiky datové kvality patří i „informační kvalita“, která se zabývá tím, jak jsou v podniku data používána, interpretována, popsána, nakolik je jejich obsah srozumitelný a relevantní.

Vlastní proces realizace technického řešení sestává z řady standardních kroků, představujících jednotlivé dílčí úlohy. Tyto úlohy jsou na sobě závislé a jejich realizace je rovněž navzájem podmíněná.

Zkoumání kvality dat (Data Quality Assessment)

Cílem této úlohy je zjistit stav kvality dat jako základ pro další rozhodování o vlastním řešení zlepšování a údržby kvality dat. Pro zvolenou business entitu jsou zkoumány pomocí specializovaného nástroje veličiny, které měří stav dat a jejich dílčí atributy z pohledu základních obecných charakteristik a z pohledu různých typů datových defektů. Výsledkem tohoto zpracování je (relativně) objektivní pohled na stav dat. Zjištění takového měření jsou pak interpretována v kontextu podnikových procesů tak, aby:

  • byly identifikovány zjevné i možné dopady na business podniku (eliminace ztrát, případně realizace potenciálních přínosů)
  • byly nalezeny zdroje identifikovaných defektů (konkrétní systémy, úlohy či procesy)

Výsledky úlohy zkoumání kvality dat jsou pak využity jak pro nastavení konkrétních parametrů dalších úloh řešení kvality dat, tak pro případnou úpravu podnikových standardů a business procesů.

Automatické čištění dat (Data Cleansing)

Během této úlohy se s daty provádějí operace zlepšující jejich kvalitu. Identifikované defekty jsou dle možností opravovány na základě business pravidel, standardů, registrů a číselníků včetně registrů obvyklých chyb. Opravené hodnoty ve standardizovaném tvaru jsou v tomto procesu přidány jako nové informace k původním datům a na základě metodiky a dalších návazných procesů jsou (mohou být) promítány jako změny do vlastních podnikových dat.

Obohacení dat (Data Enrichment)

V tomto kroku jsou doplněny chybějící hodnoty, pokud to je možné. Hodnoty jsou doplňovány buď z kontextu dalších informací (např. pohlaví …) nebo z datových zdrojů dodaných zvenku (veřejně nebo komerčně dostupné registry).

Slučování dat (Match & Merge)

Vrcholem zpracování dat v rámci řešení datové kvality a zároveň nejsložitější úlohou je slučování dat. V tomto procesu jsou rozpoznávány záznamy, jež náležejí jednotlivým konkrétním fyzickým subjektům (duplicity dat). Složitost spočívá především v tom, že jednotlivé záznamy mohou být uloženy v různých formátech, na různých místech, v různých systémech, s různou syntaxí a v různé kvalitě. Úkolem je nalézt všechna tato synonyma, vytvořit pro ně jeden referenční (master) záznam, a případné další nové záznamy vůči němu identifikovat.

Reporting, Monitoring

Na základě metrik kvality dat jsou sestavovány reporty, jež mají dva hlavní úkoly:

  • sledovat celkovou úroveň kvality dat a její trendy, případně monitorovat účinnost čistících procesů
  • sledováním anomálií ve výskytu datových defektů upozorňovat na možné systémové problémy v oblasti zacházení s daty

Business Intelligence v podání SAS Institute

Think

SAS Institute přišel ve své poslední verzi SAS 9 s jednotnou platformou, která je postavena na výhodách homogenní BI architektury. Tato platforma se nazývá SAS Enterprise Intelligence Platform a snaží se co nejlépe integrovat jednotlivé technologické komponenty ve stávajících zákaznických infrastrukturách v sourodý systém.

SAS Enterprise Intelligence Platform stojí na těchto základních pilířích:

  1. Datová integrace – Nástroje pro datovou integraci se starají o výkonné napojení na datové zdroje, o datovou kvalitu, ETL (extrakce, transformace, nahrávání), migraci a synchronizaci dat.
  2. Analýzy
    Aplikace pro pokročilé analýzy umožňují připravovat nejen běžné reporty, ale poskytují i pokročilé analytické funkce jako např. modelování, scoring dat, text mining, předpovědi časových řad, optimalizace a další.

  3. Business Intelligence
    Business Intelligence dodává uživatelům nástroje a postupy, které jim umožňují zpracovávat informace. Pro různé skupiny uživatelů jsou určeny různé nástroje. V produktové terminologii se jedná o SAS Enterprise BI Server.

  4. Datová úložiště
    SAS umožňuje ukládání jak v relačních tak i OLAP databázových strukturách. Další možností je využití datových struktur jiných databázových dodavatelů.

  5. Společná metadata
    Všechny výše uvedené části ale nelze brát odděleně. Vzájemně se prolínají a doplňují. Jakožto součást platformy jsou všechny komponenty a služby řízeny a nastavovány z jednoho centrálního místa. Platforma samozřejmě podporuje celou řadu otevřených standardů a má rozhraní pro další rozšiřování (COM, Web services, .NET, ADO, JAVA).

Autorem článku je Pavel Mašek, Business Intelligence consultant SAS ČR

Více informací o BI a kvalitě dat se můžete dozvědět na SAS Foru 2010, které proběhne za účasti významných hostů a zakladatele SAS Jima Goodnighta v Praze 20.1.2010.

Přečtěte si také

Jana Žižková: SAS je jediným dodavatelem komplexních analytických řešení
Business Intelligence: nový pohled na zpracování podnikových informací

Rubriky: Byznys

Související příspěvky

Zprávičky

InPost spouští nabídku na převzetí za 7,8 mld. eur, odkup potrvá do července

25. 5. 2026
Hosting v koronaviru – jak ulovit zákazníka
Články

Servery a další komponenty zdražily za rok podle IT firem až desetinásobně

25. 5. 2026
Zprávičky

Čtvrtletní zisk výrobce počítačů Lenovo se více než zdvojnásobil, tržby rekordní

22. 5. 2026
SpaceX vynesla další sérii 60 družic sítě Starlink
Zprávičky

Muskova SpaceX v prvním čtvrtletí vykázala ztrátu 4,3 miliardy dolarů

21. 5. 2026

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Zprávičky

Vláda vybrala 55 strategických projektů v rámci digitalizace agend (aktualizováno)

ČTK
25. 5. 2026

Vláda vybrala 55 strategických projektů v digitalizaci, ke každému určila odpovědného manažera. Vychází přitom

InPost spouští nabídku na převzetí za 7,8 mld. eur, odkup potrvá do července

ČTK
25. 5. 2026

Nabídka na převzetí polské společnosti InPost za 7,8 miliardy eur (189,4 miliardy Kč) potrvá

Google, Meta a TikTok čelí v EU stížnosti kvůli podvodným inzerátům

ČTK
25. 5. 2026

Internetové společnosti Google, Meta Platforms a TikTok čelí v Evropské unii stížnosti ze strany

Umělá inteligence: Nástroje vs. platforma, věda vs. kreativita

Papež v encyklice o AI varoval před dezinformacemi a dopady umělé inteligence

ČTK
25. 5. 2026

Papež Lev XIV. ve své první encyklice Magnifica Humanitas (Skvělé lidství), která se věnuje

ECB svolává banky k jednání o rizicích odhalených umělou inteligencí

ČTK
24. 5. 2026

Evropská centrální banka (ECB) vyzve finanční instituce, aby urychlily práce na zabezpečení svých počítačových

Soud se bude znovu zabývat pokutou 125 milionů korun pro MPSV

ČTK
23. 5. 2026

Pražský městský soud se bude muset znovu zabývat žalobou, kterou se ministerstvo práce a

Čtvrtletní zisk výrobce počítačů Lenovo se více než zdvojnásobil, tržby rekordní

ČTK
22. 5. 2026

Očištěný čistý zisk čínského výrobce počítačů Lenovo se ve fiskálním čtvrtém čtvrtletí více než

SpaceX vynesla další sérii 60 družic sítě Starlink

Muskova SpaceX v prvním čtvrtletí vykázala ztrátu 4,3 miliardy dolarů

ČTK
21. 5. 2026

Americká vesmírná společnost SpaceX miliardáře Elona Muska v prvním čtvrtletí letošního roku hospodařila s

Tiskové zprávy

eDoklady mají milion uživatelů

Synology uvádí PAS7700, active-active NVMe platformu pro kritická podniková prostředí

Průměrná měsíční spotřeba dat na jednu datovou SIM kartu vzrostla na 15,1 GB

HP představuje nové velkoformátové tiskárny pro malé a střední firmy

ViewSonic podpořil Halu roku 2026

Q1 výsledky společnosti T-Mobile

Zpráva dne

Nedávejte svým milovaným na Mikuláše sladkosti, radši Windows 11 CDkey od Goodoffer24.com!

Nedávejte svým milovaným na Mikuláše sladkosti, radši Windows 11 CDkey od Goodoffer24.com!

Redakce
5. 12. 2025

Na Mikuláše ani sladkosti, už vůbec ne uhlí ani brambory, ale radši nový software,...

Kalendář

Zář 23
Celý den

Cyber Attacks

Zobrazit kalendář

Odebírat newsletter

Zásady ochrany osobních údajů.

Zkontrolujte svoji doručenou poštu a potvrďte odběr.

Slovník

Korporátní komunikace

GMP (Good Manufacture Practise)

Quality inspector

Komentujeme

itbiz kamil pittner

Znamená pomalost přemýšlivost? A co u AI?

Kamil Pittner
8. 5. 2026

Dodavatelé modelů AI soupeří o to, aby jejich systémy poskytovaly nejen lepší odpovědi, ale také pracovaly...

Kategorie

  • Články
  • Komentujeme
  • Slovník
  • Tiskové zprávy
  • Zprávičky

Portál ITbiz.cz přináší informace z IT a byznysu již od roku 2006. Provozuje jej internetové vydavatelství Nitemedia.  Mezi další naše projekty patří například ABClinuxu.cz a Sciencemag.cz. Na stránce Redakce naleznete informace o redakci a možnostech inzerce.

Rubriky

Akce a události Byznys Cloud Ekomerce Hardware Internet Operační systémy Podnikový software Právo Science Security Technologie Telekomunikace veře Veřejná správa Vývoj a HTML Zpráva dne České IT
Žádné výsledky
Zobrazit všechny výsledky
  • Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události

© 2019 Vydává Nitemedia s.r.o. Hosting zajišťuje Greenhousing.cz.