facebook LinkedIN LinkedIN - follow
IT SYSTEMS 11/2015 , AI a Business Intelligence

Jsou čistá data nutnost nebo zbytečný luxus?

V cestě za kvalitnějšími daty nejčastěji stojí management firem



AdastraData hýbou nejen světem IT. Stoupající vliv mobilní komunikace a příchod nových technologií přinesl v roce 2014 nárůst objemu spravovaných dat o 25–50 %. Užitek z jejich správy pomalu objevuje státní správa, marketingové firmy, pojišťovny, banky i telekomunikační společnosti. Přesto segment velkých dat stále halí nejasnosti. Platí i zde, že kvalita vítězí nad kvantitou? Jak tak obrovské množství dat vůbec korigovat a efektivně využívat? A vyplatí se vůbec investice do kvality informací?


Informace vládne světu. Stejně tak i řídí podniky a firmy, neboť na jejich základě management činí rozhodnutí. Ovšem přístup k datům ještě sám o sobě není výhrou. S rostoucím objemem a počtem zdrojů úměrně roste i riziko výskytu chybných dat a chaosu jejich správy. Vyskytují se duplicity, systém je nastaven na jeden formát informací, data se v rámci více zdrojů nepárují, jak by měla.

Nastává tak otázka, zda-li je v takovém případě daný objem dat vůbec užitečný. Podle všeho není. Respektive jeho potenciál jednoduše není naplněn. Máte ve firmě k dispozici přesné a úplné informace přesně v okamžiku, kdy je potřebujete? Ne? Pak je to jasná známka, že aktuálně svá často těžce nabytá data spravujete zbytečně. S vlastnictvím smysl dat nekončí, ale naopak začíná. O data je nutné pečovat, udržovat a ideálně zvyšovat jejich kvalitu, a to prostřednictvím čištění dat, tedy Data Governance.

Mějme ovšem na paměti, že při porovnání nákladů na Data Governance a přínosů z pohledu datové kvality je relevantní jen ta část dat, kterou je možné nalézt a ohodnotit pomocí identifikace klíčových procesů společnosti. Neboli první rovinou práce s daty je, znalost klíčového procesu. Známe-li jej, můžeme ho analyzovat, identifikovat požadavky na data i pojmenovat nesprávné pořizování těchto dat. Druhou rovinou pak je optimalizace procesu samotného, kdy sice jsou k dispozici správná data, ale protože se s nimi v rámci procesu nepracuje správně (nebo nejsou k dispozici doplňující data), tak i celý proces funguje špatně.

Vše je otázka potřeby…

V segmentu Data Governance nejde tak ani o odpověď na otázku, zda se Vám vyplatí do kvality dat investovat či nikoliv. Tak jako ve výrobě či obchodu, odpověď je jednoznačně ano. Kvalita výrobku, prodeje i informace by měla být naprostým standardem. Daleko zajímavější je naopak dopad nekvalitních informací. Kvalifikované odhady hovoří o nákladu ve výši 22 % - 35 % provozního zisku.

Právě i vyčíslení toho, kolik danou společnost nekvalitní informace reálně stojí, je součástí služeb poskytovatelů systémů Data Governance. Úspora peněz tkví nejen v efektivnější práci firmy a rozhodování managementu, ale i plánování marketingových kampaní a všeobecném snížení chybných úkonů, kdy odpadají náročné opravy. Například kvůli zdánlivě marginální nejednoznačnosti v údajích o klientech se v jedné firmě včas neodhalila vazba mezi konkrétními klienty a pojistnými událostmi. Mnoho podvodů se tak této společnosti vůbec nepodařilo odhalit, ačkoliv daná data k dispozici měla. Jen je neměla vhodně zorganizovaná.

Centrálně řízený chaos Jiný, dobře známý příklad, jak dalece může nesprávná správa dat velmi citelně ovlivnit koncového uživatele, je nedávné selhání Centrálního registru vozidel, který obsahuje informace o 7,5 milionu provozovaných vozidel. Vinou nevhodně nastaveného systému řízení dat se celá databáze zhroutila. A výsledek? Několikahodinové fronty rozčílených klientů, nenávratně poškozená reputace firmy a vyplacené horentní sumy za odškodnění poškozeným klientům.

Nekvalita informace může tkvět v nevhodně formě jejího zápisu, ale může to být i obyčejný překlep ve jménu či adrese, kvůli které se například bance nespáruje informace o tom, jaké produkty daný klient využívá a tím pádem jej může opomenout marketingová kampaň. Nebo je naopak součástí kampaně zbytečně. Dobře známý je příklad, kdy jistá společnost kvůli chybám v databázi oslovovala i dávno zesnulé klienty. V těchto případech má pak taková chyba nejen ekonomický, ale také dopad morální, etický a někdy i právní.

Jak a kdy začít s datovým úklidem? Po systémech Data Governance nejčastěji sahají informačně založené organizace, které disponují velkým objemem dat a zároveň jsou data pro jejich podnikání stěžejní. V prvé řadě je nutné stanovit konkrétní zodpovědnost za kvalitu informací. Nestačí ve firmě přijmout usnesení, že „odteď budeme čistit data“. Důležitost kvality dat si musí plně uvědomit nejvyšší management i zaměstnanci na nejnižších postech, a to stejnou měrou.

Například jistá nejmenovaná banka při zavádění Data Governance dlouho bojovala s nešvarem, kdy se odpovědnost za data postupně přelévala z managementu až na zaměstnance na pobočkách. Místo koncentrování se na prodej produktů by tak bankéř měl u každého jednání s klientem aktualizovat jeho data (adresa bydliště, věk, rodinný stav, apod.). Nakonec řešením bylo školení zaměstnanců, vydání směrnice a změna organizačního řádu tak, aby bylo jasné, kdo a jak data sbírá.

Data Dictionary Naprosto elementární součástí zavádění Data Governance je kromě nařízení a všech potřebných metrik, také sestavení definice a popisu všech dostupných dat, tzv. datového slovníku. Jde nejen o popis dat v databázi, ale také o obchodní kontext jednotlivých položek.

Nejcennější (a také nejpracnější z pohledu shody napříč společností) je právě definice „business“ významu, se kterým budou uživatelé pracovat. Jinými slovy know-how firmy.

Následuje mapování obchodního významu na zmíněný popis datových struktur v jednotlivých systémech (někdy je dokonce nutné jít až na úroveň procesů, které data pořizují). Až tímto krokem zjistíme, zda data odpovídají tomu, co se od nich ve výstupech očekává. Dojde k přesné definici, co který pojem, název políčka v databázi obsahuje nebo naopak obsahovat nemá. Podle všeho nesmírně náročný, ale o to důležitější úkol. Díky datovému slovníku je know-how firmy celistvé a srozumitelné a jednotné pro všechny zaměstnance. A srozumitelné bude i pro zaměstnance příští.

Výše zmíněné sice bezpochyby stojí čas, úsilí i peníze na pořízení systému. Společnost si ale uleví od řady chyb a tím pádem i jejich opravy, povinností na odškodné, snížení reputace firmy.

V cestě čistým datům stojí nerozhodný management Ani organizační změny, zavádění metodik, určování zodpovědnosti a sestavování slovníků o tisících položkách, ani pořizování nástrojů a technologií se ovšem v náročnosti nevyrovnají jedinému – rozhodnutí managementu. V mnoha firmách je to i několikaměsíční proces.

Proč se do čištění tedy vůbec pouštět? Tradiční custom-development řešení v prvé řadě nemají potřebnou kapacitu, nemají monitoring datové kvality. Tudíž nevznikají žádné zdroje potencionálních klientů. Data Governance má naopak na marketing a tím pádem i obchod významný efekt. Nejen management ale i zaměstnanci, včetně plánovačů kampaní, díky němu jasně vidí, jestli klienti například mají či nemají určité produkty, snadněji detekují podvody.

Data Governance ex post Úsloví lepší později než nikdy v segmentu velkých neplatí bezpodmínečně. Pokud při pořizování nebo zpracování dat firma kvalitu dat neřeší, téměř jistě se tato chyba projeví později, a to v konečném procesu, který data používá. Management pak často sahá po nejrychlejším a zdánlivě nejsnadnějším řešení - pořízená data se opraví až těsně před použitím v konečném procesu. Problémem ovšem je, že takzvaná datová nekvalita vzniká dále. Do systému proudí stále nová a nová chybná data. Pokud tedy už se pro nápravu rozhodnete, vždy tak čiňte tam, kde datová nekvalita primárně vzniká.

Kvalita dat by měla být v zájmu víceméně všech firem. Na vědomí jí musí brát alespoň na úrovni návrhu, jak se data pořizují a jak se s nimi pracuje. Automatické řešení bude zbytečné především u větších firem. U nich data generuje zpravidla více systémů, čímž vzniká větší prostor pro případné nekonzistence. Problém tak nastává ve chvíli, kdy data z těchto systémů vnímáme jako jednotnou verzi pravdy.

Jaroslav Tykal Jaroslav Tykal
Autor článku je konzultantem společnosti Adastra, s.r.o. pro oblast Master Data Management.
Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.

Inzerce

Microsoft Fabric umožňuje analýzu dat založenou na AI

GOPASEfektivní řízení a analýza dat je klíčovým faktorem úspěchu každé organizace. Společnost Microsoft představila platformu Microsoft Fabric, která nabízí revoluční možnosti v oblasti sběru, ukládání a analýzy dat.