Toto je objekt systému MBI.

MBI (Management Byznys Informatiky) je portál obsahující zobecněná řešení v řízení provozu a rozvoje IT, resp. podnikové informatiky.

Pokud máte zájem získat více informací o tomto objektu (vazby na další objekty, přílohy, apod.), ale i získat mnoho dalších užitečných materiálů, můžete tak učinit ZDE / (registrace je bezplatná).

Aplikace : Tableau
Tableau
Kód aplikace, nástroje

Standardní kód aplikace v MBI.

:
AQ006A
Autor

Jméno a příjmení autora

:
Heřmanský, M. (KIT, VŠE)
Tvůrce, řešitel, aplikace, resp. nástroje

Tvůrce, řešitel, aplikace, resp. nástroje

:
Tableau
Popis, obsahové vymezení

Účel a základní obsahové vymezení aplikace, k jakým manažerským rozhodnutím aplikace slouží.

1. Tableau - obsahové vymezení
  • Tableau je self-service nástroj společnosti Tableau Foundation . Výhodou Tableau je snadná ovladatelnost, pro uživatele není obtížné naučit s nástrojem během několika hodin pracovat.
  • Nabízí interaktivní analytický nástroj pro uživatele , bez potřeby učit se programování.
1.1. Distribuce Tableau
  • Platforma Tableau se skládá ze dvou hlavních komponent - Tableau Desktop, Tableau Server . Komponenty mohou být v organizaci nasazeny samostatně , plného potenciálu se ale dosáhne jejich propojením.
  • Mezi další produkty Tableau patří Tableau Mobile a Tableau Reader, speciálním případem Tableu serveru je Tableau Online . Je to server nasazený a hostovaný v cloudovém prostředí.
  • Tableau Reader a Tableau Mobile jsou v podstatě prohlížeče výstupů připravených v Tableau Desktop. Jsou zdarma a jejich využití je u uživatelů, kteří nepotřebují tvořit reporty, ale pouze je prohlížet. Reporty neztrácejí svoji interaktivnost a jsou proto vhodnější než exporty do PDF.
2. Funkcionalita - desktop
  • Tableau Desktop je nástroj pro připojování dat a tvorbu obsahu. Tato aplikace je klient, který je instalován na běžném počítači uživatele. Pro instalaci jsou podporovány platformy Windows a OS X .
  • Zde se tvoří reporty a analytické dashboardy . Uživateli nabízí možnosti propojování datových zdrojů, práci s metrikami a dimenzemi, vytváření nových kalkulací a využívání statistických modelů.
  • Cílem Tableau Desktop je být velmi vizuální a uživatelsky přívětivý nástroj. Proto se míra psaní kódu a funkcí omezuje na minimum.
  • Většina akcí se provádí přetahováním prvků do určitého místa, případně vybráním požadované operace v menu. To s sebou přináší výhody v intuitivnějším ovládání, na druhou stranu takové ovládání může zkomplikovat složitější analytické úkony nebo přípravu dat.
2.1. Připojení k datům a příprava dat
  • Aby bylo možné začít pracovat s daty v Tableau, musí uživatel nejprve připojit svoje data a nastavit datové zdroje . Tableau disponuje množstvím konektorů na datové zdroje.
  • Data mohou být uložena na lokálním počítači u uživatele jako textový soubor, Excel soubor, nebo na vzdáleném serveru v relační databázi, OLAP kostce.
  • Další možností je připojit se na databázi služeb v cloudu jako je Google Analytics, AmazonRedshift nebo Salesforce. Seznam všech podporovaných datových zdrojů se v každé verzi notně rozšiřuje.
  • Samotný proces napojení dat je velmi jednoduchý. Tableau nevyžaduje striktně žádný specifický datový model. Připojení na datové zdroje je flexibilní a lze tedy pracovat se star schématem, stejně jako lze namodelovat snowflake . Jen je potřeba u tohoto modelu dávat pozor na výkon databáze a vhodně použít indexaci. U větších datových objemů by mohlo dojít ke ztrátě výkonu.
  • Data nemusí být uložena ani v jedné databázi . Tableau podporuje tzv. Cross Database Join a je tedy možné propojit do jednoho datového zdroje tabulky z různých databází na různých serverech.
  • V prvním kroku uživatel vybere v seznamu požadovaný datový zdroj a zadá jeho umístění. V případě lokálních souborů stačí přetáhnout tento soubor do Tableau, pokud se uživatel připojuje na databázový server , zadá adresu a přihlašovací údaje. Tableau v obou případech zobrazí vzorek připojených dat a datové tabulky.
  • Propojování dat probíhá v Tableau opět přes grafické rozhraní. Uživatel přetáhne na pracovní plochu tabulky, které potřebuje propojit. Tableau se nejprve samo pokusí najít stejně pojmenované sloupce s odpovídajícími datovými typy v obou tabulkách (např. Order ID). Pokud uspěje, navrhne uživateli nejvhodnější způsob propojení. V případě, že se sloupce nejmenují stejně, uživatel ručně vybere sloupce, které si přeje spojit a následně zvolí nejvhodnější join.
  • Propojením vybraných tabulek vznikne view , které Tableau bude následně využívat jako datový zdroj. Uživatel má na této obrazovce možnost přejmenovat sloupce ve view, změnit datové typy nebo vytvořit pomocí kalkulací nové sloupce.
  • Zároveň má možnost zvolit způsob, jakým má Tableau přistupovat k datovým zdrojům . Podporovány jsou dva přístupy - Live connection a Extract:
    • Live Connection – připojení přímo na datový zdroj (soubor nebo databázi), rychlost přenosu dat poté může být ovlivněna rychlostí připojení, nebo úzkými hrdly na cestě,
    • Extract – toto nastavení nahraje celý data set do Tableau in-memory databáze a optimalizuje data pro následné zpracování v aplikaci.
2.2. Ukládání dat
  • Tableau data extract funguje na principu ukládání dat do sloupců . Zatímco v klasických databázích jsou data ukládána transakčně do řádků, Tableau extract ukládá data v podobě sloupců. Každý sloupec je dále uložen jako samostatný objekt .
  • Tento přístup k ukládání dat umožňuje zkrátit počet operací nad daty potřebných pro výpočet agregované hodnoty, například součtu. V transakčním uložení dat musí výpočet projít každý řádek, nalézt požadovaný sloupec a získat z něj hodnotu. Ve sloupcovém uložení jsou data získána přímočarým průchodem .
  • Existuje několik případů, kdy je vhodnější upřednostnit extract před live connection:
    • Výkonnost – způsob ukládání dat do extractu umožňuje zrychlit analytické operace nad datovým zdrojem.
    • Práce offline – Při použití extractu jsou data uložená lokálně, lze tedy pracovat bez připojení k síti,
    • Ukládání a distribuce analýz v balíčcích – Tableau podporuje ukládání hotových analytických workbooků v balíčcích. Ty obsahují samotný report a pokud jsou data uložena jako extract, lze je distribuovat společně.
    • Bezpečnost – Pokud uživatel připravuje report nad potenciálně citlivými daty může nevyužitá data snadno odfiltrovat a report bezpečně sdílet (The Information Lab, 2011)
  • Nevýhodou tohoto přístupu je případ, kdy pracujeme s opravdu velkým množstvím dat. V takovém případě je výhodnější data předpřipravit v databázi, například využitím view na straně databázového serveru.
  • Ve chvíli, kdy je datový zdroj vytvořen, nabídne Tableau uložení celého projektu . Projekt lze uložit ve dvou formátech:
    • .twbx – Tableau Packaged Workbook . Tyto soubory si lze představit jako “zazipované” balíčky, které obsahují informace o reportech, jejich vizualizaci a všechny potřebné datové zdroje.
    • .twb – Tableau Workbook. Na rozdíl od prvně jmenovaného, tento neobsahuje datový extrakt, ale pouze metadata a vizualizace. Pro zobrazení reportu je nutné se připojit k originálnímu datovému zdroji.
2.3. Vizualizace dat
  • Aby bylo možné data v Tableau vizualizovat, musí být napojena na datový zdroj . Poté je možné vytvořit nové worksheety a na nich tvořit vizualizace pomocí dostupných metrik a dimenzí. Prostor na worksheetu je rozdělen na několik částí.
  • Nejvíce prostoru zabírá pracovní plocha , která představuje místo pro vkládání dimenzí, metrik a tvorbu vizualizací. Zde se odehrává tvorba interaktivního reportu.
  • V levém postranním panelu se nachází záložka Data , která obsahuje aktuálně připojené datové zdroje . Dále jsou zde přítomny dimenze (modré) a metriky (zelené) .
  • Tableau automaticky rozezná , které sloupce ve zdrojových datech představují kategoriální hodnoty nebo datum a identifikuje je jako dimenze a které obsahují číselné hodnoty a uloží je do sloupce metriky .
  • Zároveň identifikuje datové typy . V případě, že data obsahují časovou složku, datum a roky, jsou automaticky přiřazeny odpovídající datové typy.
  • Stejně tak Tableau rozpozná sloupce obsahující geolokační údaje jako jsou názvy měst, okresů či států. Tyto údaje jsou poté dostupné při tvorbě map .
  • Napravo od panelu dimenzí a metrik se nachází tzv. Marks . Tato záložka obsahuje položky, které lze využít pro úpravu vytvořených vizualizací . Přesunutím metriky nebo dimenze do těchto položek lze měnit barvu nebo rozměry vizualizovaných objektů, vkládat textové popisky nebo vytvářet tooltipy.
  • Tooltipy jsou karty, které se zobrazí při interakci s položkou reportu, například při najetí myši.
  • Nad pracovní plochou jsou viditelné právě použité dimenze a metriky . Pokud dimenze obsahuje hierarchii, je možné jednoduchým kliknutím na metriku drillovat na požadovanou úroveň detailu. Na pravé straně plochy se nachází záložka Show Me . Zde jsou vyobrazeny všechny vizualizace , které jsou dostupné pro právě použitý soubor metrik a dimenzí.
  • Obsahuje všechny nejrozšířenější typy vizuálních komponent počínaje tabulkou a podmíněným formátováním, přes koláčové grafy a sloupcové grafy po mapové prvky, svíčkové grafy a korelační diagramy. U každého návrhu vizualizace jsou uvedeny požadavky na metriky a dimenze, které jsou nezbytné pro jeho použití. To usnadňuje používání pokročilých vizualizací i méně zkušeným uživatelům.
2.4. Analytické funkce
  • Vedle datové záložky na levé straně pracovní plochy se nachází záložka Analytics . Zde jsou k dispozici analytické funkce Tableau. Nabízí nejrůznější varianty statistických a data miningových metod. Mezi nejčastěji používané funkce patří:
    • Constant Line - Proloží zvolenou metriku nebo datumovou dimenzi přímkou s předem zvolenou metrikou. To je vhodné například pro vkládání referenčních hodnot nebo cílů.
    • Average Line - Vloží do vizualizace průměr vybrané metriky, případně všech aktuálně použitých metrik.
    • Median with Quartiles - Vloží do vizualizace medián vybraných metrik a jejich kvartily.
    • Cluster - Z uživatelského hlediska nejzajímavější funkce je tzv. clustering – data miningová funkce, která hledá mezi zvolenými metrikami podobnosti a na jejich základě seskupí položky do skupin. Algoritmus, který řeší úlohu clusteringu se jmenuje k-mean. Tableau opět od uživatele nevyžaduje znalost datamingových principů, pro používání této funkce. (Tableau, 2016).
2.5. Kalkulace
  • Kalkulace nabízí způsob, jakým lze vytvořit chybějící metriku nebo dimenzi v datovém zdroji. Umožňují pomocí standardních funkcí vytvořit kalkulaci na základě existujících metrik nebo dimenzí a uložit ji jako další sloupec do datového zdroje. Lze takto provádět matematické operace mezi metrikami, třídit prvky v dimenzi podle zvolené podmínky nebo parsovat text v dimenzi pomocí regulárních výrazů.
2.6. Dashboardy
  • V momentě, kdy uživatel vytvoří reporty ve worksheetech, má možnost sdružit je do dashboardu. Dashboard je plocha, na kterou lze aranžovat worsheety a přidávat další doprovodné informace a poskytnout tak širší pohled na prezentovaná data.
  • Zároveň reflektuje nejnovější trendy v prezentaci dat a umožňuje dashboardy optimalizovat pro zobrazení na nejrůznějších typech mobilních zařízení. Není proto problém navrhnout speciální dashboard pro stolní počítač, tablet a další pro mobilní telefon.
  • Worsheety uložené na dashboardu jsou stále propojené s datovými zdroji a automaticky se aktualizují. Pokud worksheety sdílí stejný datový zdroj, lze je snadno propojit do tzv. akcí.
  • Akce jsou drobné scénáře , které lze v dashboardu sestavit a umožňují například použít prvek ve vizualizaci jako filtr, odkázat z dashboardu na určitou URL adresu, nebo přejít na další dashboard.
  • Obrázek zobrazuje dashboard popisující prodeje v jednotlivých městech . Worksheety jsou propojeny akcí, která využívá prvky na dashboardu jako filtry. Pokud uživatel klikne na lokaci na mapě, automaticky vyfiltruje hodnoty v ostatních worksheetech pro zvolený obchod.
  • Do dashboardu lze vložit i další obsah , například textové popisky, obrázky nebo náhledy webových stránek. Dashboard tak může integrovat mnoho informačních zdrojů a doplňovat tak portfolio informací.
3. Funkcionalita - Tableau server
  • Tableau server je komponenta, která pomocí specializovaných služeb zajišťuje ukládání, publikování a aktualizaci uživatelských reportů . Zároveň komunikuje s klientským nástrojem Tableau Desktop a může uchovávat datové zdroje pro sdílení napříč organizací.
3.1. Architektura
  • Architektura Tableau Serveru je velmi flexibilní . V základní licenci obsahuje jeden node , tedy uzel. Pokud je potřeba navýšit počet uživatelů a server již kapacitně nevyhovuje, stačí pouze doinstalovat další uzel (server) a zaregistrovat ho. Takto lze snadno škálovat server s tím, jak se zvyšuje jeho zatížení.
  • Tableau server lze nainstalovat do nejrůznějších prostředí . Podporováno je nasazení na firemních serverech tzv. on-premise, na privátních cloudových platformách, v datacentrech, na Amazon, Google, nebo Microsoft Azure cloudových prostředích.
  • Komponenta Data Services obsahuje služby, které zajišťují aktualizaci dat, řízení metadat a datových zdrojů a obsluhují nahrávání dat do paměti pro in-memory operace. Obsahuje také konektory k databázím. Služby, které ji podporují jsou Backgrouder , který spouští nezbytné podprocesy a řadí úkoly do fronty. Dále Data Server, kde jsou uložena data a Data Engine, který je přesouvá data podle potřeby do paměti .
  • Další komponentou je Analytics Service . Obsahuje VizQL server , který vykresluje obsah reportů uložených na serveru a Cache Server . Jak z názvu vypovídá, tento server je zodpovědný za cachování obsahu na nezbytně nutnou dobu.
  • Sharing and Collaboration a Content Management Service využívají pro svou činnosti Aplication Server . Tento server vykonává nejzákladnější funkce potřebné pro běh serveru. Zde jsou spravováni uživatelé a jejich přístupové údaje, ukládány projekty a řízena administrace celého Tableau serveru. Pod těmito službami běží Repository proces , který ukládá Tableau worksheety, přístupová práva, datové zdroje, informace o uživatelích a další data.
  • File Store proces je dostupný v případě distribuovaného, víceuzlového serveru . Řídí přístup k uloženým datům a v případě velmi vysokého zatížení serveru rozprostírá datové zdroje mezi jednotlivé uzly redundatně. Tak aby byly maximálně dostupné tam, kde je uživatel vyžaduje.
3.2. Datové zdroje
  • Jednou z funkcionalit Tableau serveru je možnost ukládat datové zdroje jako extrakty do vlastní databáze . Na rozdíl od podnikového datového skladu, kde jsou data ukládána celopodnikově, Tableau server je uzpůsoben pro ukládání a sdílení užších datových extraktů pro specializované analytické operace. Je tak možné tvořit ohraničené výřezy dat pro následné využití v Tableau.
3.3. Bezpečnost
  • Tableau server je obvykle umístěn uvnitř podnikové sítě . Je to především z důvodu bezpečnosti. Na Tableau server lze ukládat datové zdroje, tedy data, která mají být sdílena v rámci organizace pro analýzy. Proto je server obvykle držen uvnitř vnitropodnikové sítě a přístup na něj zvenčí je umožněn pomocí VPN sítě. Takto je možné kontrolovat, kdo má k serveru přístup.
  • Bezpečnost při práci s podnikovými daty je u nástrojů pro analýzu dat vždy na prvním místě. V souvislosti s přístupy k serveru mluvíme především o autentifikaci a autorizaci.
  • Autentifikace je proces ověřování identity uživatele . Každý uživatel, který se chce přihlásit k serveru, musí být uložen v Tableau Server repozitáři. Ten je řízen pomocí repository procesu popsaném v předchozí části.
  • Existují dva způsoby, jak řídit autentifikaci uživatelů :
    • První způsob , využívaný především v menších organizacích, je ponechání autentifikace na straně serveru . To znamená vytvoření uživatelských přihlašovacích jmen a hesel. Uživatelům jsou posléze přiřazeny role. Rizikem, které je třeba v tomto případě vnímat, je řízení uživatelských účtů. Uživatelé se v čase mění, některé je třeba mazat, jiné přidávat. Udržení seznamu užiivatelů v aktuálním stavu je zodopovědností správce serveru.
    • Druhý způsob počítá s využitím služeb Active Directory . Tato služba umožňuje centralizované řízení uživatelských účtů v organizaci . Představuje centrálně spravovaný seznam uživatelů a jejich rolí. Připojením serveru na Active Directory se tento seznam synchronizuje s repozitářem a Tableau Server ho nadále používá jako zdroj informací. Administrátor v tomto případě pouze přiřazuje role.
  • Autorizace určuje, co může uživatel vidět a k čemu přistupovat ve chvíli, kdy je autentifikován a přihlášen k serveru. To zahrnuje práci s obsahem, složkami, dasboardy a datovými zdroji uloženými na serveru, změny nastavení serveru a přidělování uživatelských rolí.
3.4. Administrace Role
  • Přidělování uživatelských rolí je důležitou aktivitou při správě serveru. Za správnou distribuci práv je zodpovědný administrátor. Ten má neomezený přístup do všech částí serveru a kontrolu nad všemi funkcemi.
  • Může udělit uživatelům následující role:*
  • Administrátor ,
    • Publisher - Může se přihlásit k serveru z Tableau Desktop, publikovat dasboardy a datové zdroje a stahovat je, nemůže udělovat uživatelská práva,
    • Interactor - Může prohlížet dashboardy na serveru, ale nemá právu publikovat – Viewer - Má právo se přihlásit k serveru a prohlížet dashboardy, ale nemá povolenou manipulaci s nimi. Nemůže filtrovat nebo třídit data.
  • Alokace uživatelských práv probíhá na server v sekci Users . Administrátor zde má přehled o uživatelích a jejich rolích. Přepnutí role je zde otázkou jednoho kliknutí. Každý uživatel může mít pouze jednu roli . Uživatelé, kteří nemají administrátorkou roli se do sekce Users nedostanou.
  • Související položkou je sekce Groups . Zde jsou spravovány skupiny uživatelů. Adminstrátor může přidělit uživatelům přístup do složek globálně , místo aby je musel přidělovat jednotlivě.
  • Schedules - V této sekci je řízeno plánování operací s datovými zdroji a rozesílání reportů uživatelům . Pro datové zdroje uložené na Tableau serveru lze nastavit, jak často a kdy se mají aktualizovat. To je nutné při velkém objemu dat, která by se měli při aktualizace přenášet po síti. Zároveň taková operace vytěžuje zdrojové systémy a je vhodné ji naplánovat na noční hodiny.
  • Rozesílání aktualizovaných reportů uživatelům je služba, která v určený okamžik rozešle na vybrané uživatele aktualizovaný report. Akci lze naplánovat v návaznosti na aktualizování datových zdrojů. Aby uživatel nemusel sledovat, zda je jeho report aktuální, lze naplánovat rozesílání emailů s odkazem na report. Uživatel tak může dostat pravidelně aktualizované inforamce například do emailové schránky.
  • Status - Sekce status je důležitá pro administrátora Tableau serveru. Sleduje všechny operace na serveru a v přehledných interaktivních reportech informauje o stavu služeb a aktivitách uživatelů. Adminstrátor má tak na jednom místě například informace o počtech přístupů do složek, provozu na síti, objemu datových zdrojů nebo neúspěšných pokusech o přihlášení. Může zde sledovat také výkon vizualizací reportů , tedy jak dlouho trvá, než se vizualizace načte, kolik zpotřebuje paměti a jak dlouho trvá odezva na uživatelskou akci.
3.5. Publikování na server
  • Z uživatelského pohledu nejdůležitější funkcionalitou Tableau Serveru je publikování dashboardů. Je to proces, který začíná vytvořením dashboardů v Tableau Desktop. Poté co je uživatel s výsledkem spokojený, má možnost ho publikovat na server.
  • Publikování přináší do organizace prvek sdílení . Uživatelé, kteří mají právo přístupu na server a k dashboardu, ho mohou otevřít, na serveru zobrazit a interagovat s ním, případně si ho stáhnout i s datovým extraktem a pracovat offline.
  • Publikování má několik kroků :
    • V prvním kroku uživatel v Tableau Desktop klikne na Publish Workbook to Tableau Server . Nabídne se přihlašovací okno, kde zadá adresu serveru a přihlásí se. Uživatel se přihlásí svým uživatelským jménem a heslem, případně pomocí Active Directory.
  • Následně se zobrazí dialog pro uložení dashboardu na server . Zde uživatel vybere, do jakého projektu dashboard patří. Projektem je myšlena složka, do které je dashboard pro přehlednost umístěn. Zvolí vhodné jméno pro dashboard a má možnost přidat tagy . Tagy jsou vhodné například při velkém počtu publikovaných dashboardů. Další uživatelé mohou podle nich vyhledávat a třídit již publikované reporty.
  • Řízení přístupu k publikovanému dashboardu je řešeno přes dialog View Permissions . Zde uživatel specifikuje, kteří uživatelé, nebo skupiny uživatelů mohu interagovat s publikovaným dashboardem a jakým způsobem. Lze zvolit, že pro určitou skupinu bude report pouze ke čtení, zatímco jiná skupina uživatelů bude moci komentovat, stahovat a editovat report, případně ho smazat.
  • Ve vedlejším okně uživatel vybere worsheety , které si přeje zobrazit v publikovaném workbooku. Pokud nějaké worksheety do výběru nezahrne, neznamená to, že se nepublikují na server, ale pouze se schovají pro prohlížení uživatelům.
  • Stažením ze serveru získá uživatel i zde nevybrané worksheety. Je to z toho důvodu, že publikovaný dashboard by mohl využívat obsah worksheetu a takto by byl o ifnormace v něm ochuzen.
  • Poslední volbou je Scheduling & Authentification . Tato volba umožňuje nastavit pravidelné aktualizace datových zdrojů na serveru a jejich propojení se zdrojovými databázemi.
  • Poté stačí kliknout na Publish . Tableau odešle dashboard na server, který ho zpracuje a zobrazí ve webovém prohlížeči.
  • Publikovaný report ukazuje obrázek . Obrazovka je rozdělena na administrátorskou lištu s logem Tableau a obrazovku dashboardu. Pro dashboard jsou přítomné prvky pro manuální aktualizaci datových zdrojů a funkce pro editaci , stažení a sdílení dashboardu. Záložky slouží pro přepínaní mezi worsheety. V závislosti na uživatelských právech je report interaktivní a umožňuje s daty pracovat stejně jako v Tableau Designeru .
4. Odkazy na demo a další zdroje
  • Oficiální stránky/
  • Zkušební verze http://www.tableausoftware.com/products/trial?os=windows ,
  • Instruktážní videa ,
  • Tableau Extracts–What / Why / How etc. The Information Lab [online]. London: The Information Lab, 2011 [cit. 2017-04-01]. Dostupné z: https://www.theinformationlab.co.uk/2011/01/20/tableau-extracts-what-why-how-etc/ ,
  • Uncover patterns in your data with Tableau 10’s clustering feature. Tableau.com [online]. London: Tableau, 2016 [cit. 2017-04-02]. Dostupné z: https://www.tableau.com/about/blog/2016/7/uncover-patterns-your-data-tableau-10s-clustering-feature-5637