Toto je objekt systému MBI.

MBI (Management Byznys Informatiky) je portál obsahující zobecněná řešení v řízení provozu a rozvoje IT, resp. podnikové informatiky.

Pokud máte zájem získat více informací o tomto objektu (vazby na další objekty, přílohy, apod.), ale i získat mnoho dalších užitečných materiálů, můžete tak učinit ZDE / (registrace je bezplatná).

Faktor : BI: Datový sklad
BI: Datový sklad
Kód faktoru

Standardní kód faktoru v MBI.

:
F405
Autor

Jméno a příjmení autora

:
MBI tým, Šindelář, R. (KIT, VŠE)
Podstatné charakteristik faktoru

Obsahové vymezení faktoru

1. Obsahové vymezení datového skladu

Technologie datových skladů (Data Warehouse, DWH) představuje v současné době již běžnou součást podnikových IT. Dle [INMON, B.: Building the Data Warehouse. Indianopolis, John Wiley and Sons 2002] je datový sklad vymezen takto:

Datový sklad je integrovaný, konsolidovaný, subjektově orientovaný, stálý a časově rozlišený souhrn dat, uspořádaný pro podporu potřeb managementu. Tyto pojmy lze interpretovat takto:

  • subjektově orientovaný – data jsou rozdělována podle jejich typu, ne podle aplikací, ve kterých vznikla,
  • konsolidovaný – data jsou konsolidována z různých zdrojů, struktur a forem do jedné výsledné formy (do jedné verze pravdy),
  • integrovaný – data jsou ukládána v rámci celého podniku a ne pouze v rámci jednotlivých útvarů,
  • stálý – datové sklady jsou koncipovány převážně jako pouze pro čtení (read only), až na výjimky se zde žádná nová data nevytvářejí ani neaktualizují,
  • časově rozlišený – do datového skladu je uložena i historie dat, tedy obsahují dimenzi času.

Otázky a problémy spojené s nasazením datových skladů jsou formulovány ve scénáři (S453).

2. Realizace datových skladů

V současné době datové sklady obvykle obsahují normalizovaná data, zatímco denormalizace, např. na bázi STAR schémat se realizuje až na úrovni datových tržišť. Datové sklady (obdobně datová tržiště) jsou realizována v prostředí relačních databázových systémů, např. MS SQL Server, Oracle, DB/2 a další.

3. Požadavky na datový sklad

Požadavky na datový sklad lze formulovat do těchto bodů:

  • Informace z DWH musí být jednoduše dostupné - DWH musí poskytovat informace jednoduše, obsah DWH musí být pochopitelný pro uživatele, musí nabízet informace v nejrůznějších kombinacích (slicing and dicing), zajišťovat co nejkratší dobu odezvy,
  • Informace z DWH musí být presentovány konsistentně - musí poskytovat věrohodné informace, tj. data musí být shromážděny z různých zdrojů, pečlivě kontrolovány a čištěny a poskytovány až tehdy, pokud jsou v pořádku.
  • Data musí být postavena na jasném vymezení obsahu a jasném odlišení jejich identifikátory, resp. názvy,
  • DWH musí být flexibilní vzhledem ke změnám - musí být adaptabilní ke změnám v uživatelských požadavcích, podnikovému prostředí, datovým zdrojům, technologiím,
  • DWH musí zajišťovat bezpečnost dat - DWH obsahuje kompletní a často citlivé informace, musí být zajištěno řízení přístupů k jednotlivým částem DWH,
  • DWH musí tvořit základ pro zkvalitňování řídících a rozhodovacích procesů - pro DWH musí být deklarovány efekty, které přinese (i když nemusí být vždy exaktně vyjádřeny a ve finančních ukazatelích),
  • Podniková komunita musí DWH akceptovat adekvátním způsobem - využití DWH (a BI) není, na rozdíl od transakčních systémů, nezbytné a je závislé na ochotě a invenci uživatelů. Proto je také nezbytné naplnit všechny předchozí požadavky.

4. Příklady dotazů do datového skladu

5. Efekty a přínosy faktoru pro kvalitu řízení podniku a IT
  1. Disponuje konsolidovanými, konsistentními, subjektově orientovanými a historizovanými daty,
  2. DWH poskytuje optimální informace podporující manažerské rozhodování na strategické, taktické a operativní úrovni řízení,
  3. Umožňuje získat strukturovaný přehled z velkého množství dat uchovávaných v různorodých databázích,
  4. Nabízí rychlý a komplexní přístup k velkému množství dat,
  5. Disponuje schopnostmi pro modelování a prognózy podle potřeb řízení firmy,
  6. Funguje na principu „read only“,
  7. Data jsou do DWH nahrávána obvykle v definovaném časovém úseku, méně často průběžně (on line),
  8. Disponuje schopností aktivního využití externích datových zdrojů třetích stran (např. dlouhodobé zachycení vývoje produktu),
  9. Disponuje operativními dotazy, analýzami časových řad, multidimenzionální analýzou a finančními analýzami,
  10. Disponuje informacemi uloženými v metadatech,
  11. DWH představuje datový zdroj pro analytické aplikace a reportingové nástroje.

6. Otázky, roblémy a omezení spojené s faktorem
  1. Vysoká technologická a finanční náročnost plynoucí z možných kombinací zdrojových systémů a zákaznických požadavků nutných pro realizaci DWH,
  2. Více než 50% DWH projektu překročí rozpočet, nebo není dokončena,
  3. Při zavádění nového podnikového informačního systému je ve valné většině případů nutné realizovat nový DWH,
  4. Pří zásahu do DWH je v případě změn dimenzí nutné provést opětovnou agregaci dat,
  5. Oproti klasickým relačním databázím je paměťově náročnější a dochází k delší doby odezvy,
  6. Řešení představují komplikované načítací procedury,
  7. Obecná neznalost funkcionality a možností datových skladů ze strany podnikových manažerů.