facebook LinkedIN LinkedIN - follow
IT SYSTEMS 5/2011 , AI a Business Intelligence

Bohatství ukryté v datech (1. díl)

Jak se rodí firemní data mining



Většina firem začne přemýšlet o data miningu ve chvíli, kdy se zastaví růst daný plošnými metodami marketingové komunikace, nazývanými jinak přiléhavě kobercový nálet. Manažeři, jejichž zisky nestoupají tak jako v minulosti, se poohlížejí po řešení. Data mining posouvá myšlení firmy od cíle zasáhnout komunikačně co nejvíce zákazníků k cíli zasáhnout ty nejsprávnější zákazníky relevantním sdělením, ušitým na míru pro ně.


K rozvoji metod data miningu dochází prakticky od devadesátých let, kdy se rozšířily větší databáze zaznamenávající nákupy klientů. Prvními adepty na vytěžování znalostí z databází byly banky, telekomunikační operátoři a utility. Jejich podnikání je totiž založeno na zaznamenávání transakcí, a tak k datům nikdy neměly příliš daleko. Spolu s masivním sběrem firemních dat a zlevněním velkých databází se data mining po roce 2000 prosazuje jako stále důležitější součást řízení moderního businessu. V poslední době přichází data mining i do sféry středních firem. V roce 2011 je běžné, že ze svých dat těží e-shopy střední velikosti, retailoví obchodníci a i ty nejmenší pojišťovny.

Data mining jako obor

Data mining je obecně celkem mladý obor, který využívá možností statistiky a umělé inteligence ve spojení s velkými databázemi. V češtině se občas označuje jako „dobývání znalostí z databází“ z anglického knowledge discovery, méně často i jako dolování dat. Oba české termíny mají však jen málo zastánců, většinou z akademické obce. V anglicky mluvících zemích se naopak termín často zaměňuje se sběrem dat z internetových stránek. Sběr dat však do data miningu nepatří a je správněji označován jako data harvesting (sklízení dat) nebo scraping.
Data mining je ve firmách nejčastěji používán k výběru zákazníků, kteří mají vysokou pravděpodobnost nějaké aktivity. Zejména se jedná o pravděpodobnost:

  • nákupu konkrétního produktu,
  • odchodu ke konkurenci,
  • podvodu.

S tím se pojí termíny jako afinita (pravděpodobnost koupit produkt), churn management (zadržení zákazníků, kteří by jinak odešli ke konkurenci) nebo fraud management (ošetření podvodů).
Velmi populární technikou je segmentace zákazníků. Jejím účelem je nalézt skupiny klientů, které mají společné potřeby. Mezi segmenty jsou v ideálním případě velké rozdíly a uvnitř segmentů jsou rozdíly malé. Data mining používají kromě firem i státní instituce, obvykle k detekci daňových úniků nebo při určování podezřelých.

Cíle data miningu

Cílem data miningu je ve firemním prostředí jednoznačně zvyšování zisku. Toho lze dosáhnout několika aplikacemi dataminingových technik:

  • Segmentované nabídky – nabízíme relevantní zboží relevantnímu segmentu. Zvýšíme tím návratnost kampaně díky vyššímu podílu oslovených, kteří přijmou nabídku. Zároveň snížíme informační zátěž segmentů, kterých se nabídka netýká. Jim nabídku nepošleme, a tím výrazně snížíme i náklady na oslovení.
  • Retenční kampaně – možnost zachránit část zákazníků, kteří mají vysokou pravděpodobnost dát nám výpověď. Dosáhneme udržení zisku na zákaznících, kteří by jinak odešli.
  • Detekce podvodů – systém detekce podvodu obvykle vyčlení skupinu s podezřelým chováním. Tu pak můžeme prošetřit s menšími náklady a vyšší účinností, než kdybychom dělali namátkové kontroly.
  • Cross- sell – prodej souvisejícího zboží. Prodej relevantního zboží zákazníkům s vysokou pravděpodobností nákupu výrazně zvyšuje úspěšnost nabídek. Zvyšuje tak účinnost komunikace a zisk z dodatečných nákupů.

Všechna firemní použití data miningu mají za cíl relevantní komunikaci. Při troše zjednodušení pomocí data miningu nabízíme vždy správnou věc správným zákazníkům, což zvyšuje šanci na prodej. Bohatým nabízíme luxusní věci, chudým levné věci a podvodníky odstřihneme od zdroje peněz. V segmentaci bereme v úvahu i životní styl, demografii a nákupní chování zákazníka. Pokud zákazníkovi nabídneme to, co mu skutečně chybí, marketingový i prodejní úspěch je nasnadě.

Řízení dataminingového projektu

Pro řízení dataminingového projektu je zcela klíčových několik předpokladů. Když si je shrneme, jedná se o:

  • podporu nejvyššího vedení,
  • připravenost marketingu,
  • podporu nezbytných IT oddělení.

Žádný z těchto předpokladů nelze v praxi přeskočit nebo obejít. Bez podpory nevyššího vedení se projekt obvykle zastaví v nějaké realizační fázi na „nízké prioritě“, což se rovná ortelu smrti v prostředí, kde vždy existuje dostatek urgentních projektů.
Klíčová je také marketingová vyzrálost na straně společnosti, která data mining implementuje. Pro společnost je nutné přehodnocení plošného marketingu. Pověření zaměstnanci musí chápat, že data mining přinese daleko přesnější oslovení cílových skupin. Od realizátorů komunikace to vyžaduje změnu optiky a v důsledku souběžné řízení několika komunikačních strategií.
Výsledky data miningu je třeba důsledně vyhodnocovat. Obsah musí být šitý na míru konkrétní skupině, například zákazníkům s rizikem přechodu ke konkreci. Komunikaci proto doporučujeme důsledně podřídit tomu, jakou populaci oslovujeme s jakým cílem. Zásadní je proto velmi dobrá představa marketingu o motivaci konkrétní skupiny klientů. V případě odcházejících zákazníků musí znát marketing důvod, proč zákazníci dávají společnosti „košem“, a vymyslet dostatečně silné motivátory, jak získat své zákazníky zpět v hodině dvanácté.
Podpora IT oddělení je nutná z hlediska bezproblémové implementace do stávajících systémů. Vhodné je tedy budovat v průběhu projektu přátelský a kolegiální vztah s budoucími implementátory našeho řešení. Prioritu implementace ovšem zajišťuje nejvyšší vedení spolu s vedením IT.

V ideálním případě, kdy je dostatek lidských a časových zdrojů, je vhodné složit tým klíčového dataminingového projektu ze zástupců těchto rolí:

  • sponzor a decission maker,
  • data miner,
  • marketing,
  • IT.

Takovýto smíšený tým, který má vhled do běžné komunikace, do dat i do systémů, může projekt nejlépe usměrňovat. Schází se v okamžicích „milníků“, kde se rozhoduje o podobě dataminingového modelu, o jeho implementaci a použití.

Tvorba dataminingových modelů

V data miningu jsou používány metody statistické analýzy, například regrese, a metody umělé inteligence, mezi které patří například neuronové sítě. Fáze učení modelu nastává nad konečnou podobou dat, když jsou všechna data již připravena. Vytvořený model se poté aplikuje na nová data, aby vytvořil předpověď chování zákazníků.
V průběhu modelování je nesmírně důležitá fáze výběru proměnných, kdy vybíráme například, které charakteristiky vedou zákazníky k odchodu. V této fázi se díváme, co má zásadní vliv na předpovídanou skutečnost (například tendenci k výpovědi), a které proměnné mohou být naopak vynechány. Mnohdy je výběr proměnných automatizován pomocí statistických procedur. Někteří data-mineři dávají přednost ručnímu výběru proměnných, při kterém se dá lépe zohlednit obchodní pohled na danou problematiku. I zastánci ručního výběru proměnných používají ovšem statistických metod k určení, které proměnné jsou redundantní a mohou být z modelů odebrány.
V konečné fázi modelování se optimalizují váhy jednotlivých proměnných pro model. Toto probíhá obvykle plně automaticky, v několika krocích.

Data mining – je pro vás?

Data mining je cesta k zisku postavená na vašich datech. Na začátku cesty si musíte odpovědět na otázku, zda jste na ni připraveni. Pokud ano, můžete s data miningem velmi vydělat. Je však třeba důsledně řídit projekty a zajistit si, nejlépe předem, podporu všech zúčastněných. Přeji vám mnoho štěstí při využívání bohatství ve vašich datech.

Jan Matoušek
Autor článku je ředitelem společnosti Data Mind.

Partnerem seriálu o data miningu je společnost Data Mind s.r.o., specialista na data mining, více viz www.datamind.cz

Využití data miningu proti výpovědím zákazníků (2.díl)

Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.

Inzerce

Microsoft Fabric umožňuje analýzu dat založenou na AI

GOPASEfektivní řízení a analýza dat je klíčovým faktorem úspěchu každé organizace. Společnost Microsoft představila platformu Microsoft Fabric, která nabízí revoluční možnosti v oblasti sběru, ukládání a analýzy dat.