Toto je objekt systému MBI.

MBI (Management Byznys Informatiky) je portál obsahující zobecněná řešení v řízení provozu a rozvoje IT, resp. podnikové informatiky.

Pokud máte zájem získat více informací o tomto objektu (vazby na další objekty, přílohy, apod.), ale i získat mnoho dalších užitečných materiálů, můžete tak učinit ZDE / (registrace je bezplatná).

Úloha : Řízení kvality datových zdrojů
Řízení kvality datových zdrojů
Kód úlohy

Standardní kód úlohy v MBI.

:
U204A
Autor návrhu úlohy

Jméno a příjmení autora úlohy

:
MBI tým
Datum poslední úpravy

Datum poslední úpravy úlohy ve tvaru rrrr.mm.dd.

:
2012-12-19
Předpokládaná pravděpodobnost užití v praxi

Předpokládaná pravděpodobnost užití úlohy v praxi, hodnoty 0 - 1. Např. 0,7 - úlohu lze využít v 7 z 10 podniků. Hodnoty jsou průběžně testovány a upřesňovány na základě anket a průzkumů.

:
0.8
Charakteristiky úlohy

Charakteristiky úlohy

1. “Řízení kvality datových zdrojů“ – cíl, účel
  • Cílem úlohy je průběžně hodnotit kvalitu datových zdrojů z hlediska úplnosti, přesnosti, aktuálnosti. Definovat pravidla řízení kvality dat a realizovat operace čištění dat.
2. Obsah úlohy
  • Vlastnosti kvality dat, zejména správnost, dostupnost, úplnost, integrita atd. vyjadřují jejich podstatné kvalitativní parametry a tedy i hlavní předmět úlohy řízení kvality dat.
  • Procesy řízení se vztahují zejména k analýzám kvality dat na úrovni produkčních databází, na které pak navazují další transformační a opravné procedury a operace.
3. Vstupy úlohy:
  • Analýzy a plán rozvoje datových zdrojů (D212A ),
  • Datová architektura (D055A ),
  • Procesní dokumentace podniku (DQ003A ),
  • Katalog datových zdrojů (D211A ),
  • Katalog IT služeb (D111A ),
  • Analýza IT dodavatelů (D121A ),
  • Katalog požadavků na IT (D042A ),
  • Plán projektů (D123A ),
  • Organizační a řídící dokumenty podniku (DQ002A ),
  • Evidence pracovních míst (DQ251A),
  • Provozní dokumentace (D711A ),
  • Rozpočet IT (D325A ).
4. Výstupy úlohy:
  • Plán zajištění kvality dat (D213A ),
  • Datová architektura, aktualizovaná (D055A ),
  • Katalog datových zdrojů, aktualizovaný (D211A ).
5. Podmínky úspěšnosti úlohy
  • Definování jasných pravidel pro kontroly kvality dat a řešení problémů,
  • Vyhodnocení reálných ekonomických ztrát z nekvalitních dat,
  • Určení konkrétních míst v procesech řízení informatiky, kdy je nutné kontrolovat a řešit kvalitu dat (např. při výběru a transformaci dat do datového skladu, nebo datových tržišť).
6. Doporučené praktiky
  • Pro kvalifikované řízení kvality dat je účelné stanovit specialistu, nebo u větších organizací dokonce i specializované útvary,
  • Úpravy a opravy dat v souvislosti se zvyšováním jejich kvality, je nutné přesně dokumentovat,
  • Je nezbytné nastavit procesy pro řešení situací, které mohou mít vliv na struktury a kvalitu dat (např. je třeba včas a přesně informovat specialisty pro ETL o uskutečněných změnách ve strukturách zdrojových databází apod.).
7. “Řízení kvality datových zdrojů“ - klíčové aktivity

7.1. Analýza stavu a kvality dat v podnikových databázích
  • Správnost , která zahrnuje:
    • obsah dat, tj. přesnost – sleduje, zda všechna data odpovídají realitě a jsou ve správném kontextu, úplnost - do jaké míry jsou k dispozici všechny informace, vyrovnání– agregovaná data souhlasí s celkovými hodnotami, konzistence – problémy v porušení standardů nebo vazeb,
    • úroveň detailu, tj. preciznost, granularita,
    • časové charakteristiky dat, tj. validita, resp. aktuálnost dat, kontinuita v historických datech,
  • Integrita – strukturální správnost, zahrnuje:
    • pravidla identity - znamenají omezení hodnot primárních klíčů,
    • referenční pravidla - vyjadřují referenční integritu,
    • základní pravidla - omezení řídící počty výskytů dat,
    • pravidla pro sady hodnot - přípustné hodnoty,
  • Psychologické charakteristiky zahrnují
    • presentace - jak jsou data poskytnuta v použitelné a pochopitelné formě,
    • využití - reálné využití dat v praxi,
  • Další charakteristiky :
    • dostupnost - v čase, v místě, v požadované struktuře, v požadovaném formátu,
    • srozumitelnost - úroveň pochopení vzhledem ke konkrétní skupině jejich uživatelů,
    • relevance - použitelnost dat v rozhodovacím procesu,
    • důvěryhodnost – je dána ochotou s danými daty pracovat a využívat je.
7.2. Specifikace hlavních zdrojů chyb a příčin nekvality dat
  • K hlavním zdrojům chyb v datech, které musí být identifikovány , patří:
    • chyby při manuálních vstupech dat, např. prohození číslic, pravopisné chyby, špatně zadané kódy, hodnoty zapsané do nesprávného pole,
    • data pocházejí z různých zdrojů a související problémy konsolidace dat, tj. sjednocení číselníků, dodržení formálních standardů v datech apod.,
    • rozdíly v interpretaci dat, kdy různí uživatelé chápou sémantiku datové položky různě,
    • chyby při migracích a konverzích dat, např. v důsledku špatně interpretované logiky a struktur dat na vstupu a výstupu migračních a konverzních operací,
    • chyby přicházející z existujících externích datových zdrojů, obsažené přímo v těchto zdrojích, nebo vznikajících v důsledku špatně nastavených vazeb k externím datům v interních datových zdrojích,
    • chyby vznikající v důsledku přímých vstupů do databází externími partnery (zákazníky, dodavateli atd.) v rámci sdílených nebo otevřených aplikací pro vnější subjekty, například přes webová rozhraní,
    • chyby v návrhu databází, zejména nedodržovanou doménovou nebo referenční integritou, kdy jsou povoleny nekorektní vstupy, aniž by to uživatel věděl nebo mu takové operace byly odmítnuty.
7.3. Vyhodnocení aktuálních ekonomických a obchodních ztrát z nekvalitních dat
  • Ekonomické dopady nekvalitních dat jsou např. v marketingu (ztráty na kampaních - poštovné, letáky, práce, ušlý zisk z neoslovených zákazníků), v řízení prodeje (nerealizovaný cross-selling, kdy obchodník nemá k dispozici informace o dalších produktech, které by zákazník mohl koupit) a obdobně i v realizaci dalších podnikových procesů.
7.4. Operativní opravy chyb
  • Operativní opravy chyb a jiných nedostatků v datech hlášených podniku uživateli, zákazníky a jinými subjekty.
7.5. Periodické čištění datových zdrojů a databází
  • Kontroly podnikových datových bází podle stanoveného harmonogramu, testování dat na možné chyby, dokumentace chyb, realizace opravných procedur, případně následné manuální opravy chyb v datech.
7.6. Zajištění prevence proti chybám
  • Zajištění prevence proti chybám v datech zahrnuje:
    • správný návrh datových struktur,
    • normalizaci záznamů dat,
    • kontrolu stávajících a nastavení nových kontrolních funkcí při pořizování dat v transakčních systémech,
    • nastavení pravidel pro řešení změn v datových strukturách databáze a jejich dopadů do ostatních databází (např. datového skladu a datových tržišť.
8. Poznámky, reference