Úloha
: Řízení kvality datových zdrojů
|
|
|
|
Kód úlohy
Standardní kód úlohy v MBI.
:
|
Autor návrhu úlohy
Jméno a příjmení autora úlohy
:
|
Datum poslední úpravy
Datum poslední úpravy úlohy ve tvaru rrrr.mm.dd.
:
|
Předpokládaná pravděpodobnost užití v praxi
Předpokládaná pravděpodobnost užití úlohy v praxi, hodnoty 0 - 1. Např. 0,7 - úlohu lze využít v 7 z 10 podniků. Hodnoty jsou průběžně testovány a upřesňovány na základě anket a průzkumů.
:
|
|
|
Charakteristiky úlohy
1. “Řízení kvality datových zdrojů“ – cíl, účel
-
Cílem
úlohy je
průběžně hodnotit kvalitu datových zdrojů
z hlediska úplnosti, přesnosti, aktuálnosti. Definovat pravidla řízení kvality dat a realizovat operace čištění dat.
2. Obsah úlohy
-
Vlastnosti kvality dat,
zejména správnost, dostupnost, úplnost, integrita atd. vyjadřují jejich podstatné kvalitativní parametry a tedy i hlavní předmět úlohy řízení kvality dat.
- Procesy řízení se vztahují zejména
k analýzám kvality dat na úrovni produkčních databází,
na které pak navazují další transformační a opravné procedury a operace.
3. Vstupy úlohy:
- Analýzy a plán rozvoje datových zdrojů (D212A
),
- Datová architektura (D055A
),
- Procesní dokumentace podniku (DQ003A
),
- Katalog datových zdrojů (D211A
),
- Katalog IT služeb (D111A
),
- Analýza IT dodavatelů (D121A
),
- Katalog požadavků na IT (D042A
),
- Plán projektů (D123A
),
- Organizační a řídící dokumenty podniku (DQ002A
),
- Evidence pracovních míst (DQ251A),
- Provozní dokumentace (D711A
),
- Rozpočet IT (D325A
).
5. Podmínky úspěšnosti úlohy
- Definování jasných pravidel pro kontroly kvality dat a řešení problémů,
- Vyhodnocení reálných ekonomických ztrát z nekvalitních dat,
- Určení konkrétních míst v procesech řízení informatiky, kdy je nutné kontrolovat a řešit kvalitu dat (např. při výběru a transformaci dat do datového skladu, nebo datových tržišť).
6. Doporučené praktiky
- Pro kvalifikované řízení kvality dat je účelné stanovit specialistu, nebo u větších organizací dokonce i specializované útvary,
- Úpravy a opravy dat v souvislosti se zvyšováním jejich kvality, je nutné přesně dokumentovat,
- Je nezbytné nastavit procesy pro řešení situací, které mohou mít vliv na struktury a kvalitu dat (např. je třeba včas a přesně informovat specialisty pro ETL o uskutečněných změnách ve strukturách zdrojových databází apod.).
7. “Řízení kvality datových zdrojů“ - klíčové aktivity
7.1. Analýza stavu a kvality dat v podnikových databázích
-
Správnost
, která zahrnuje:
- obsah dat, tj. přesnost – sleduje, zda všechna data odpovídají realitě a jsou ve správném kontextu, úplnost - do jaké míry jsou k dispozici všechny informace, vyrovnání– agregovaná data souhlasí s celkovými hodnotami, konzistence – problémy v porušení standardů nebo vazeb,
- úroveň detailu, tj. preciznost, granularita,
- časové charakteristiky dat, tj. validita, resp. aktuálnost dat, kontinuita v historických datech,
-
Integrita
– strukturální správnost, zahrnuje:
- pravidla identity - znamenají omezení hodnot primárních klíčů,
- referenční pravidla - vyjadřují referenční integritu,
- základní pravidla - omezení řídící počty výskytů dat,
- pravidla pro sady hodnot - přípustné hodnoty,
-
Psychologické charakteristiky
zahrnují
- presentace - jak jsou data poskytnuta v použitelné a pochopitelné formě,
- využití - reálné využití dat v praxi,
-
Další charakteristiky
:
- dostupnost - v čase, v místě, v požadované struktuře, v požadovaném formátu,
- srozumitelnost - úroveň pochopení vzhledem ke konkrétní skupině jejich uživatelů,
- relevance - použitelnost dat v rozhodovacím procesu,
- důvěryhodnost – je dána ochotou s danými daty pracovat a využívat je.
7.2. Specifikace hlavních zdrojů chyb a příčin nekvality dat
- K hlavním zdrojům chyb v datech,
které musí být identifikovány
, patří:
- chyby při manuálních vstupech dat, např. prohození číslic, pravopisné chyby, špatně zadané kódy, hodnoty zapsané do nesprávného pole,
- data pocházejí z různých zdrojů a související problémy konsolidace dat, tj. sjednocení číselníků, dodržení formálních standardů v datech apod.,
- rozdíly v interpretaci dat, kdy různí uživatelé chápou sémantiku datové položky různě,
- chyby při migracích a konverzích dat, např. v důsledku špatně interpretované logiky a struktur dat na vstupu a výstupu migračních a konverzních operací,
- chyby přicházející z existujících externích datových zdrojů, obsažené přímo v těchto zdrojích, nebo vznikajících v důsledku špatně nastavených vazeb k externím datům v interních datových zdrojích,
- chyby vznikající v důsledku přímých vstupů do databází externími partnery (zákazníky, dodavateli atd.) v rámci sdílených nebo otevřených aplikací pro vnější subjekty, například přes webová rozhraní,
- chyby v návrhu databází, zejména nedodržovanou doménovou nebo referenční integritou, kdy jsou povoleny nekorektní vstupy, aniž by to uživatel věděl nebo mu takové operace byly odmítnuty.
7.3. Vyhodnocení aktuálních ekonomických a obchodních ztrát z nekvalitních dat
-
Ekonomické dopady nekvalitních dat jsou např. v marketingu
(ztráty na kampaních - poštovné, letáky, práce, ušlý zisk z neoslovených zákazníků),
v řízení prodeje
(nerealizovaný cross-selling, kdy obchodník nemá k dispozici informace o dalších produktech, které by zákazník mohl koupit) a obdobně i v realizaci dalších podnikových procesů.
7.4. Operativní opravy chyb
- Operativní opravy chyb a jiných nedostatků v datech hlášených podniku uživateli, zákazníky a jinými subjekty.
7.5. Periodické čištění datových zdrojů a databází
- Kontroly podnikových datových bází podle stanoveného harmonogramu, testování dat na možné chyby, dokumentace chyb, realizace opravných procedur, případně následné manuální opravy chyb v datech.
7.6. Zajištění prevence proti chybám
- Zajištění
prevence proti chybám
v datech zahrnuje:
- správný návrh datových struktur,
- normalizaci záznamů dat,
- kontrolu stávajících a nastavení nových kontrolních funkcí při pořizování dat v transakčních systémech,
- nastavení pravidel pro řešení změn v datových strukturách databáze a jejich dopadů do ostatních databází (např. datového skladu a datových tržišť.
8. Poznámky, reference
|
|
|
|