Upravit stránku

Možná jste už pojem Data Factory slyšeli - jmenuje se tak dokonce jedna ze služeb Microsoft cloudu Azure pro integraci dat z různých zdrojů.

My si dnes ale budeme povídat o obecném významu Data factory - tedy továrny na data.

Ty paradoxy ...

Představme si výrobní podnik - třeba náš národní klenot, automobilku ŠKODA. Výroba musí šlapat jako hodinky, je maximálně automatizovaná, robotizovaná, výrobní haly jsou čisté, plné nejmodernější techniky a skvěle organizované. Každá hodina výpadku výroby stojí miliony EUR.

Práce profesionálů - čistá, přesná, automatizovaná výrobní linka.

A s daty to je (mělo by být) úplně stejně! Také pro ně je třeba postavit plně automatizovanou fabriku. Z jedné strany tečou suroviny - data ze zdrojových systémů ... a na straně druhé sjíždějí z pomyslné výrobní linky hotové výrobky - datové produkty.

Také u zpracování dat je nutný profesionální přístup, jasná pravidla, vysoký stupeň automatizace a důvěryhodnosti celého procesu. Dokonce více než u fyzického výrobku. Na ten si mohu sáhnout, mohu jasně změřit odchylky od ideálu. Výsledky datové analýzy jsou ale virtuální - kdekdo je může zpochybnit, napadnout. Proto musíme zcela přesně vědět, jak jsme k finálnímu výstupu došli. Od zdroje, přes různé transformace, až k číslu někde v manažerském reportu.

Řada firem bohužel stále oblast dat podceňuje. Jejich práce s daty, namísto moderní výrobní haly, připomíná spíše zaprášenou garáž, kde se pár zapálených fachmanů s rukama od oleje pokouší kladivy a kombinačkami ohnout plech nebo štětcem nanést barvu.

Analogie s automobilkou ukazuje, jak se bohužel často stavíme k práci s daty.

Tyhle paradoxy a zásadní rozdíly v přístupu ke zpracování primárního výrobku či služby a jejich datové stopy můžeme pozorovat u řady společností. Většinou se tuší, že i data by měla být zpracovávána nějak lépe, přehledněji, ale málokdo takovému procesu rozumí a často chybí odvaha a motivace se pustit do tak náročného úkolu.

Jak by tedy měla datová fabrika vypadat?

Pokud to firma s daty a plným využitím jejich potenciálu myslí opravdu vážně, musí investovat do vytvoření plně automatizované datové fabriky. Nestačí si s daty jen hrát, tamhle a onde je trochu využívat, pracovat s nimi nahodile.

Suroviny

Surovinami v datové fabrice jsou nepřekvapivě - data. Ta mohou být

  • interní - vznikající přímo v podniku - zdrojem je např. účetní, obchodní, výrobní, marketinkový nebo jiný systém),
  • externí - získaná z prostředí mimo firmu - např. různé statistiky, predikce trhu, předpovědi počasí, apod.

Některá připravená data mohu dokonce nakupovat od třetích stran.

Podobně jako suroviny - např. železná ruda, mohou být data plná nečistot, chyb a často chybějících informací, s nimiž se musí naše Data Factory vypořádat. Otázka kvality dat bude bezesporu jednou z dalších kapitol našeho seriálu.

Výrobní linka

Datová výrobní linka data vyčistí, transformuje do jednotného modelu, který by měl reflektovat podnikání firmy, obsahovat entity a jejich vazby tak, jak to náš byznys očekává.

Běžným srdcem datové fabriky bývá komponenta, které se říká datový sklad (data warehouse - DWH) - nebo nějak podobně (datová platforma, slyšel jsem i "datový svět"). V něm se koncentrují informace o různým firemních procesech a vhodným způsobem se vzájemně propojují. To proto, abychom mohli v případě zájmu nebo potřeby klást dotazy i napříč organizačními jednotkami - např. jak ovlivnila marketinková kampaň zákaznickou spokojenost a jak se to následně odrazilo ve finančních ukazatelích společnosti.


Výrobky

Výrobky datové fabriky jsou tzv. datové produkty. Ty mohou mít různou formu. Jde např. o manažerský report nebo dashboard pro dispečery v logistice. Může ale také jít o celou řadu prediktivních AI modelů - např. predikce spokojenosti zákazníka, predikce poruchy stroje, apod. Často se jedná o vstupní informace pro další aplikace a systémy - např. pro mobilní aplikaci nebo nějaký prodejní či komunikační kanál (call centrum, e-shop, web, apod.).

Variabilita "datových výrobků" je veliká - jde v podstatě o cokoli, co se dá z připravených dat na "výrobní lince" vytvořit.

Výzkum a vývoj

Klíčovou součástí analýzy dat je zkoumání, bádání, ověřování hypotéz:

  • Co když se na chování zákazníků podívám novou optikou - např. jak se chovají na sociálních sítích poté, co si koupí náš výrobek nebo službu?
  • Jak ovlivňuje reklamace kvalita výroby? Umím "vystopovat" konkrétní výrobek až na výrobní linku? Zjistím kdy a kdo jej vyrobil, kdo dodal jednotlivé komponenty?
  • Umím nějak predikovat spokojenost zákazníka když znám jeho chování v digitálních i fyzických kanálech za poslední rok?

Datová továrna musí kromě rutinní výroby jasně zadaných datových produktů umožňovat také co nejširší obci byznys uživatelů zkoušet a objevovat. Podpořit tak inovační potenciál firmy.
 
Nesmyslné nápady (nepodložené hypotézy) budeme rychle zahazovat. Ale jakmile se správnost mých myšlenek potvrdí, musím být schopen rychle vytvořit datový produkt, který se bude pravidelně občerstvovat a já zase o něco vylepším svůj byznys proces.

Co dál?

Koncept Data Factory je nám tedy v hrubých rysech známý. Otevírá nám však vějíř zajímavých témat k další diskusi. 

Např. jak hlídat kvalitu dat, jak data vhodně a efektivně zpracovávat/analyzovat, co to je datový model a jak s ním pracovat, jak umožnit "self-service data analytics" pro výzkumnou a inovační činnost byznys uživatelů ... a řada dalších oblastí.

Na některé z nich se zaměříme v dalších kapitolách našeho seriálu Data zVesela. Tak zase příště!

Tento web využívá cookies

Tento web používá k poskytování služeb, personalizaci reklam a analýze návštěvnosti soubory cookie. Používáním tohoto webu s tím souhlasíte. Zobrazit podrobnosti