|
|
|
Kód faktoru
Standardní kód faktoru v MBI.
:
|
Klapač, M., Krčma, M. (KIT, VŠE)
|
|
Datum poslední úpravy
Datum poslední úpravy ve tvaru rrrr.mm.dd.
:
|
Podstatné charakteristik faktoru
Obsahové vymezení faktoru
1. Obsahové vymezení Big Data
- Big Data je koncept, který
definuje vlastnosti samotných dat
, resp. technologie pro jejich efektivní zpracování a analýzu.
- Zahrnuje v sobě
nástroje a postupy
pro práci
s datovými objemy tak rozsáhlými
a komplexními, že je při jejich ukládání, zpracování a analýze
nemožné používat tradiční databázové a analytické nástroje
.
- Základní
vymezení
Big Data stojí
na čtyřech hlavních charakteristikách:
-
Objem (Volume)
- exponenciálně rostoucí, může být vyjádřen jak v datové jednotce (MB, GB, PB), tak v počtu souborů,
-
Rychlost (Velocity)
- vyjadřuje rychlost streamování, ukládání a hlavně zpracování dat,
-
Různorodost (Variety)
- je možnost více ukládaných a zpracovávaných datových formátů, a to jak strukturovaných, tak zejména nestrukturovaných či polostrukturovaných dat,
-
Komplexnost (Complexity)
- představuje více standardů v rámci jednoho datového formátu (například různé typy videa) a navíc správa takových objemů dat, často z různých zdrojů trvale zvyšuje komplexnost řešení,
-
Důvěryhodnost (Veracity)
- dosahování důvěry uživatelů v obsah a analytické výstupy z obrovských objemů dat. Zahrnuje i etické problémy spojenými s velkými objemy dat,
-
Hodnota (Value)
- vyhodnocení použitelnosti a dodávané hodnoty ze analyzovaných dat.
2. Efekty a přínosy faktoru pro kvalitu řízení podniku a IT
-
Otevření dosud nevyužitých informačních kanálů
- sociální sítě, multimediální data či senzory výrobních zařízení, které mohou v kombinaci s původními datovými zdroji poskytovat prostor pro analýzy dosud nedosahovaného rozsahu,
- Využití tzv.
Dark Data,
tedy dat, která společnost shromažďovala, ale bylo nákladově neefektivní tato data analyzovat, a které na základě současných technologií mohou přinést transparentní informace využít je při rozhodovacích procesech,
- Uložená transakční data obsahují
přesné a detailní informace o výkonnosti
podnikových procesů. Tyto informace mohou sloužit pro zlepšování výkonnosti procesů a podávají více informací managementu při rozhodování za nejistoty. Toto platí pro všechny stupně managementu: strategický, taktický, operativní,
-
Optimalizace výkonnosti organizace
- ve vztahu k podnikovým procesům lze lépe monitorovat vliv změn na výkonnost, zjišťovat příčiny výkyvů ve výkonnosti a efektivně rozdělovat podnikové zdroje,
-
Transparentnost
- snadnější a rychlejší přístup k relevantním datům, dostupným napříč odloučenými odděleními,
-
Využití analytických nástrojů
- mohou výrazně zlepšit proces rozhodování, minimalizovat riziko nebo odhalit cenné informace v rozsáhlých objemech dat, které by jinak zůstaly skryté,
-
Úzká segmentace zákazníků
a vytvoření produktu, služby přesně podle jejich požadavků,
-
Inovativní postupy pro modelování experimentů
- možnost testovat hypotézy a analyzovat jejich výsledky pro důležitá investiční rozhodnutí, komplexní podpora vývoje nových produktů a služeb, jejichž vlastnosti a funkce pomáhá přesněji definovat analýza velkých objemů různorodých dat.
- In memory Analytics umožňuje snižovat nároky na vytváření vrstvy předagregovaných dat, neboť zde jsou detailní data uložena do paměti a kalkulace jsou vykonávány v nejvyšší rychlosti v okamžiku dotazu na ně.
3. Otázky, roblémy a omezení spojené s faktorem
- Jestliže společnost
zanedbala správu dat
v rámci databází a BI výstupy tak byly nekvalitní, Big Data není okamžitým a spásným řešením,
- Big Data nesou s sebou nové a podstatně
vyšší nároky na kvalifikaci
odborníků, a to jak na straně managementu nebo business analytiků (ti, co budou klást otázky – hypothesis-driven), tak na straně lidí, kteří budou data zkoumat,
- Data i ve velkých objemech a různorodosti dostávají smysl až ve chvíli, kdy jsou
konfrontovány s nějakým modelem nebo hypotézou
. Pokud hypotéza nebo model nejsou relevantní (business požadavky jsou špatně interpretovány), potom Big Data nepřináší přidanou hodnotu, naopak, spotřebovávají čas, prostředky a náklady,
- Nutnost
využití clusterů
(množin zařízení) ke správě a zpracování dat, což může (ale ne nutně) znamenat vyšší pořizovací náklady na HW (platí jen v případě on-premises řešení),
- Big Data, která jsou získávána prostřednictvím sociálních sítí, vyhledávání atd., mohou přinést cenné informace jedině za předpokladu
reálně nastavených hypotéz
(hypothesis-driven analytics) a k nim relevantních dat,
- K problémům Big Data patří především
hrozby související se soukromím, bezpečností a vlastnictvím
dat,
- Big Data
není náhradou relačních databází
– spíše se odhaduje, že technologie budou jedna od druhé přebírat best-practices až se nakonec sloučí.
4. Poznámky, reference
- Slánský, D.: Data and Analytics for the 21st Century: Architecture and Governance, Professional Publishing, 2018. ISBN 978-80-88260-16-5,
- Fowleruk, A. - Thoughts on NoSQL & Big Data Architecture. - (Marklogic [online]. 2013).
|
|
|
|