Vissza

Miért építsünk adatpiacokat?

  Zsolt Hajnalka

  2018.04.18. 12:37

Az üzleti intelligencia megoldások egyik klasszikus kérdése: miért építsünk adatpiacokat? Nézzünk egy tipikus esetet!

Az ügyfél...

  • tudatában van, hogy a céges adatkincs több elszórt helyen keletkezik, és különféle formátumokban
  • érzi, hogy automatizálni szeretné a riportok készítését
  • esetleg önkiszolgáló megoldást is szeretne, az adatok “böngészésének” lehetőségét, az előre definiált riportokon túlmenő adatkinyeréshez, ötleteléshez, új típusú kimutatásokhoz

Az ügyfél a fenti okokból szakértők bevonásával adattárházat építtet ki. Az ügyfél ezek után riportok készítését rendeli meg, hiszen van profi adattárháza, pénzbe is került, lássa immár hasznát: a következő lépés az adatok riportolása, valamint a “felfedező jellegű” adatkinyerés, böngészés.

Az ügyfélnek mindig igaza van -- ám most csak részben. A legjobb minőségű, leginkább átgondolt adattárház esetén is szükség van bizonyos mértékű zsonglőrködésre, előkészítő lépésekre a riportokhoz.

  • Származtatott (kalkulált) mutatószámokat kell készíteni az alapadatokból?
  • Hierarchiákat kell kialakítani az adatok között?
  • Összesített (aggregált) adatokat kell számolni az elemi adatokból?
  • Az adattárház nem teljesen átfogó, bizonyos adatok nincsenek benne, drága vagy elég rugalmatlan lenne beleintegrálni azokat is, ám “hozzá kéne őket rakni” egy bizonyos riporthoz?
  • El kell rejteni bizonyos mezőket a kíváncsi szemek elől, mert félreérthetően vannak elnevezve, vagy csak röviden, a pontos értelmezéshez szükséges “apró betűs rész” nélkül inkább ne legyen elérhető az adatfelfedezés során?
  • Kategóriákba kell sorolni bizonyos adatokat, csökkentendő az adatok sokszínűségét a riportban?
  • “Lyukaktól mentes” dimenziókra van szükség bizonyos kimutatásokban, minden nap jelenjen meg (akkor is, ha nincs aznapra vonatkozó adat), vagy minden régió szerepeljen (ha nincs vonatkozó adat, akkor nullával)?
  • Stb...

Ezek rutinszerűen megoldandó feladatok, és a kollégák ügyesek, tehát meg is oldják.

Az ördög a részletekben rejlik. Miként oldják meg a kollégák? Barkácsolással. Az ügyfél vezetése számára mindez láthatatlan...

  • Bizonyos feladatokat az adattárház üzemeltetőjével egyeztetve oda delegálnak a szakértők; úgyis ott az összes terv- és tényadat, legyenek szívesek megfelelő módon összekapcsolni őket a szükséges termékkörökre, és terv-tény teljesülési arányszámot kalkulálni! A 6. ilyen változtatás után esetleg elfelejtik a dokumentációt frissíteni, további 15 változtatás után részleges reform történik az adattárház szintjén, ami esetleg elrontja a fölé épült, nem dokumentált számítások egy részét.
  • Más feladatokat, pl. hirtelen szükségessé váló hierarchiák készítését a riporteszköz szintjén kezelnek, persze profi módon, az adott riport szempontjából remekül, de mindez mégis sérülékeny: a következő riport megvalósításakor egy másik kolléga egy másik részlegnél esetleg más módszertannal oldja majd meg, “nem mindig érnek össze a számok”, és nyomozni kell, miért nem...
  • Az adattárházba nem integrált adatok beemelése során mindenféle transzformáció szükséges (szűrés, aggregálás, stb.), erről lehet ugyan beszélni, milyen eszközzel és pontosan hogyan célszerű, de valahol mindenképp el kell végezni.
  • Lehet még sorolni a hasonló forgatókönyveket.

Azért építünk adatpiacokat, hogy áttekinthető és egységes formába öntsük az adattárház fölé, de még a riportok alá szükségképpen fölhúzott barkács-réteget -- szebben fogalmazva: a számos előkészítő lépést. Azért tesszük, hogy minden szereplő biztos lehessen benne: az igazságot látja (“single source of truth”), és a rengeteg kimutatás nem csupán egységes adatokra épül, de a származtatott mutatókat és az előkészítő lépéseket is egységes módszertan jellemzi. Egyetlen adattárházra több adatpiac is építhető, például üzletáganként vagy tágabb adatkörönként fölosztva - a végén pedig minden mindennel összeér, és mindenki boldog.


   

Megjegyzések
Még nincsenek hozzászólások. Légy első!

Blog kategória

Címkefelhő

Legutóbbi bloggerek

Kálmán Bohus
Bejegyzések: 3
Csillagok: 0
Dátum: 2019.04.26.
Tamás Molnár
Bejegyzések: 7
Csillagok: 11
Dátum: 2019.03.18.
Tibor Sánta
Bejegyzések: 4
Csillagok: 2
Dátum: 2019.03.04.
Márta Molnár
Bejegyzések: 3
Csillagok: 1
Dátum: 2019.02.18.
Zsolt Berentey
Bejegyzések: 4
Csillagok: 1
Dátum: 2019.02.04.

Kapcsolat