Toto je objekt systému MBI.

MBI (Management Byznys Informatiky) je portál obsahující zobecněná řešení v řízení provozu a rozvoje IT, resp. podnikové informatiky.

Pokud máte zájem získat více informací o tomto objektu (vazby na další objekty, přílohy, apod.), ale i získat mnoho dalších užitečných materiálů, můžete tak učinit ZDE / (registrace je bezplatná).

Aplikace : Tableau
Tableau
Kód aplikace, nástroje

Standardní kód aplikace v MBI.

:
AQ006A
Autor

Jméno a příjmení autora

:
Heřmanský, M. (KIT, VŠE)
Tvůrce, řešitel, aplikace, resp. nástroje

Tvůrce, řešitel, aplikace, resp. nástroje

:
Tableau
Popis, obsahové vymezení

Účel a základní obsahové vymezení aplikace, k jakým manažerským rozhodnutím aplikace slouží.

1. Tableau - obsahové vymezení

Tableau je self-service nástroj společnosti Tableau Foundation. Výhodou Tableau je snadná ovladatelnost, pro uživatele není obtížné naučit s nástrojem během několika hodin pracovat. Strmá učící křivka spolu se silnou a otevřenou komunitou dělá z Tableau atraktivní produkt na trhu. Nabízí interaktivní analytický nástroj pro uživatele, bez potřeby učit se programování.

1.1. Distribuce Tableau

Platforma Tableau se skládá ze dvou hlavních komponent. Tableau Desktop, Tableau Server. Komponenty mohou být v organizaci nasazeny samostatně, plného potenciálu ale dosáhneme jejich propojením. Mezi další produkty Tableau patří Tableau Mobile a Tableau Reader, speciálním případem Tableu serveru je Tableau Online. Je to server nasazený a hostovaný v cloudovém prostředí. Tableau Reader a Tableau Mobile jsou v podstatě prohlížeče výstupů připravených v Tableau Desktop. Jsou zdarma a jejich využití je u uživatelů, kteří nepotřebují tvořit reporty, ale pouze je prohlížet. Reporty neztrácejí svoji interaktivnost a jsou proto vhodnější než exporty do PDF.

2. Funkcionalita - desktop

Tableau Desktop je nástroj pro připojování dat a tvorbu obsahu. Tato aplikace je klient, který je instalován na běžném počítači uživatele. Pro instalaci jsou podporovány platformy Windows a OS X. Zde se tvoří reporty a analytické dashboardy. Uživateli nabízí možnosti propojování datových zdrojů, práci s metrikami a dimenzemi, vytváření nových kalkulací a využívání statistických modelů. Cílem Tableau Desktop je být velmi vizuální a uživatelsky přívětivý nástroj. Proto se míra psaní kódu a funkcí omezuje na minimum. Většina akcí se provádí přetahováním prvků do určitého místa, případně vybráním požadované operace v menu. To s sebou přináší výhody v intuitivnějším ovládání, na druhou stranu takové ovládání může zkomplikovat složitější analytické úkony nebo přípravu dat.

2.1. Připojení k datům a příprava dat

Aby bylo možné začít pracovat s daty v Tableau, musí uživatel nejprve připojit svoje data a nastavit datové zdroje. Tableau disponuje množstvím konektorů na datové zdroje. Data mohou být uložena na lokálním počítači u uživatele jako textový soubor, Excel soubor, nebo na vzdáleném serveru v relační databázi, OLAP kostce. Další možností je připojit se na databázi služeb v cloudu jako je Google Analytics, AmazonRedshift nebo Salesforce. Seznam všech podporovaných datových zdrojů se v každé verzi notně rozšiřuje.

Samotný proces napojení dat je velmi jednoduchý. Tableau nevyžaduje striktně žádný specifický datový model. Připojení na datové zdroje je flexibilní a lze tedy pracovat se star schématem, stejně jako lze namodelovat snowflake. Jen je potřeba u tohoto modelu dávat pozor na výkon databáze a vhodně použít indexaci. U větších datových objemů by mohlo dojít ke ztrátě výkonu. Data nemusí být uložena ani v jedné databázi. Tableau podporuje tzv. Cross Database Join a je tedy možné propojit do jednoho datového zdroje tabulky z různých databází na různých serverech.

V prvním kroku uživatel vybere v seznamu požadovaný datový zdroj a zadá jeho umístění. V případě lokálních souborů stačí přetáhnout tento soubor do Tableau, pokud se uživatel připojuje na databázový server, zadá adresu a přihlašovací údaje. Tableau v obou případech zobrazí vzorek připojených dat a datové tabulky.

Propojování dat probíhá v Tableau opět přes grafické rozhraní. Uživatel přetáhne na pracovní plochu tabulky, které potřebuje propojit. Tableau se nejprve samo pokusí najít stejně pojmenované sloupce s odpovídajícími datovými typy v obou tabulkách (např. Order ID). Pokud uspěje, navrhne uživateli nejvhodnější způsob propojení. V případě, že se sloupce nejmenují stejně, uživatel ručně vybere sloupce, které si přeje spojit a následně zvolí nejvhodnější join. Propojením vybraných tabulek vznikne view, které Tableau bude následně využívat jako datový zdroj. Uživatel má na této obrazovce možnost přejmenovat sloupce ve view, změnit datové typy nebo vytvořit pomocí kalkulací nové sloupce.

Zároveň má možnost zvolit způsob, jakým má Tableau přistupovat k datovým zdrojům. Podporovány jsou dva přístupy. Live connection a Extract:

  • Live Connection – Připojení přímo na datový zdroj (soubor nebo databázi), rychlost přenosu dat poté může být ovlivněna rychlostí připojení, nebo úzkými hrdly na cestě,
  • Extract – Toto nastavení nahraje celý data set do Tableau in-memory databáze a optimalizuje data pro následné zpracování v aplikaci.

2.2. Ukládání dat

Tableau data extract funguje na principu ukládání dat do sloupců. Zatímco v klasických databázích jsou data ukládána transakčně do řádků, Tableau extract ukládá data v podobě sloupců. Každý sloupec je dále uložen jako samostatný objekt.

Tento přístup k ukládání dat umožňuje zkrátit počet operací nad daty potřebných pro výpočet agregované hodnoty, například součtu. V transakčním uložení dat musí výpočet projít každý řádek, nalézt požadovaný sloupec a získat z něj hodnotu. Ve sloupcovém uložení jsou data získána přímočarým průchodem.

Existuje několik případů, kdy je vhodnější upřednostnit extract před live connection:

  • Výkonnost – způsob ukládání dat do extractu umožňuje zrychlit analytické operace nad datovým zdrojem.
  • Práce offline – Při použití extractu jsou data uložená lokálně, lze tedy pracovat bez připojení k síti,
  • Ukládání a distribuce analýz v balíčcích – Tableau podporuje ukládání hotových analytických workbooků v balíčcích. Ty obsahují samotný report a pokud jsou data uložena jako extract, lze je distribuovat společně.
  • Bezpečnost – Pokud uživatel připravuje report nad potenciálně citlivými daty může nevyužitá data snadno odfiltrovat a report bezpečně sdílet (The Information Lab, 2011)

Nevýhodou tohoto přístupu je případ, kdy pracujeme s opravdu velkým množstvím dat. V takovém případě je výhodnější data předpřipravit v databázi, například využitím view na straně databázového serveru.

Ve chvíli, kdy je datový zdroj vytvořen, nabídne Tableau uložení celého projektu. Projekt lze uložit ve dvou formátech. Prvním je. twbx – Tableau Packaged Workbook. Tyto soubory si lze představit jako “zazipované” balíčky, které obsahují informace o reportech, jejich vizualizaci a všechny potřebné datové zdroje.

Druhou možností je .twb – Tableau Workbook. Na rozdíl od prvně jmenovaného, tento neobsahuje datový extrakt, ale pouze metadata a vizualizace. Pro zobrazení reportu je nutné se připojit k originálnímu datovému zdroji.

2.3. Vizualizace dat

Aby bylo možné data v Tableau vizualizovat, musí být napojena na datový zdroj. Poté je možné vytvořit nové worksheety a na nich tvořit vizualizace pomocí dostupných metrik a dimenzí. Prostor na worksheetu je rozdělen na několik částí. Nejvíce prostoru zabírá pracovní plocha, která představuje místo pro vkládání dimenzí, metrik a tvorbu vizualizací. Zde se odehrává tvorba interaktivního reportu.

V levém postranním panelu se nachází záložka Data, která obsahuje aktuálně připojené datové zdroje. Dále jsou zde přítomny dimenze (modré) a metriky (zelené). Tableau automaticky rozezná, které sloupce ve zdrojových datech představují kategoriální hodnoty nebo datum a identifikuje je jako dimenze a které obsahují číselné hodnoty a uloží je do sloupce metriky . Zároveň identifikuje datové typy. V případě, že data obsahují časovou složku, datum a roky, jsou automaticky přiřazeny odpovídající datové typy. Stejně tak Tableau rozpozná sloupce obsahující geolokační údaje jako jsou názvy měst, okresů či států. Tyto údaje jsou poté dostupné při tvorbě map.

Napravo od panelu dimenzí a metrik se nachází tzv. Marks. Tato záložka obsahuje položky, které lze využít pro úpravu vytvořených vizualizací. Přesunutím metriky nebo dimenze do těchto položek lze měnit barvu nebo rozměry vizualizovaných objektů, vkládat textové popisky nebo vytvářet tooltipy. Tooltipy jsou karty, které se zobrazí při interakci s položkou reportu, například při najetí myši.

Nad pracovní plochou jsou viditelné právě použité dimenze a metriky. Pokud dimenze obsahuje hierarchii, je možné jednoduchým kliknutím na metriku drillovat na požadovanou úroveň detailu. Na pravé straně plochy se nachází záložka Show Me. Zde jsou vyobrazeny všechny vizualizace, které jsou dostupné pro právě použitý soubor metrik a dimenzí. Obsahuje všechny nejrozšířenější typy vizuálních komponent počínaje tabulkou a podmíněným formátováním, přes koláčové grafy a sloupcové grafy po mapové prvky, svíčkové grafy a korelační diagramy. U každého návrhu vizualizace jsou uvedeny požadavky na metriky a dimenze, které jsou nezbytné pro jeho použití. To usnadňuje používání pokročilých vizualizací i méně zkušeným uživatelům.

2.4. Analytické funkce

Vedle datové záložky na levé straně pracovní plochy se nachází záložka Analytics. Zde jsou k dispozici analytické funkce Tableau. Nabízí nejrůznější varianty statistických a data miningových metod. Mezi nejčastěji používané funkce patří:

  • Constant Line - Proloží zvolenou metriku nebo datumovou dimenzi přímkou s předem zvolenou metrikou. To je vhodné například pro vkládání referenčních hodnot nebo cílů.
  • Average Line - Vloží do vizualizace průměr vybrané metriky, případně všech aktuálně použitých metrik.
  • Median with Quartiles - Vloží do vizualizace medián vybraných metrik a jejich kvartily.
  • Cluster - Z uživatelského hlediska nejzajímavější funkce je tzv. clustering – data miningová funkce, která hledá mezi zvolenými metrikami podobnosti a na jejich základě seskupí položky do skupin. Algoritmus, který řeší úlohu clusteringu se jmenuje k-mean. Tableau opět od uživatele nevyžaduje znalost datamingových principů, pro používání této funkce. (Tableau, 2016).

2.5. Kalkulace

Kalkulace nabízí způsob, jakým lze vytvořit chybějící metriku nebo dimenzi v datovém zdroji. Umožňují pomocí standardních funkcí vytvořit kalkulaci na základě existujících metrik nebo dimenzí a uložit ji jako další sloupec do datového zdroje. Lze takto provádět matematické operace mezi metrikami, třídit prvky v dimenzi podle zvolené podmínky nebo parsovat text v dimenzi pomocí regulárních výrazů.

2.6. Dashboardy

V momentě, kdy uživatel vytvoří reporty ve worksheetech, má možnost sdružit je do dashboardu. Dashboard je plocha, na kterou lze aranžovat worsheety a přidávat další doprovodné informace a poskytnout tak širší pohled na prezentovaná data. Zároveň reflektuje nejnovější trendy v prezentaci dat a umožňuje dashboardy optimalizovat pro zobrazení na nejrůznějších typech mobilních zařízení. Není proto problém navrhnout speciální dashboard pro stolní počítač, tablet a další pro mobilní telefon. Worsheety uložené na dashboardu jsou stále propojené s datovými zdroji a automaticky se aktualizují. Pokud worksheety sdílí stejný datový zdroj, lze je snadno propojit do tzv. akcí. Akce jsou drobné scénáře, které lze v dashboardu sestavit a umožňují například použít prvek ve vizualizaci jako filtr, odkázat z dashboardu na určitou URL adresu, nebo přejít na další dashboard.

Obrázek zobrazuje dashboard popisující prodeje v jednotlivých městech. Worksheety jsou propojeny akcí, která využívá prvky na dashboardu jako filtry. Pokud uživatel klikne na lokaci na mapě, automaticky vyfiltruje hodnoty v ostatních worksheetech pro zvolený obchod. Do dashboardu lze vložit i další obsah, například textové popisky, obrázky nebo náhledy webových stránek. Dashboard tak může integrovat mnoho informačních zdrojů a doplňovat tak portfolio informací.

3. Funkcionalita - Tableau server

Tableau server je komponenta, která pomocí specializovaných služeb zajišťuje ukládání, publikování a aktualizaci uživatelských reportů. Zároveň komunikuje s klientským nástrojem Tableau Desktop a může uchovávat datové zdroje pro sdílení napříč organizací.

3.1. Architektura

Architektura Tableau Serveru je velmi flexibilní. V základní licenci obsahuje jeden node, tedy uzel. Pokud je potřeba navýšit počet uživatelů a server již kapacitně nevyhovuje, stačí pouze doinstalovat další uzel (server) a zaregistrovat ho. Takto lze snadno škálovat server s tím, jak se zvyšuje jeho zatížení.

Tableau server lze nainstalovat do nejrůznějších prostředí. Podporováno je nasazení na firemních serverech tzv. on-premise, na privátních cloudových platformách, v datacentrech, na Amazon, Google, nebo Microsoft Azure cloudových prostředích.

Komponenta Data Services obsahuje služby, které zajišťují aktualizaci dat, řízení metadat a datových zdrojů a obsluhují nahrávání dat do paměti pro in-memory operace. Obsahuje také konektory k databázím. Služby, které ji podporují jsou Backgrouder, který spouští nezbytné podprocesy a řadí úkoly do fronty. Dále Data Server, kde jsou uložena data a Data Engine, který je přesouvá data podle potřeby do paměti.

Další komponentou je Analytics Service. Obsahuje VizQL server, který vykresluje obsah reportů uložených na serveru a Cache Server. Jak z názvu vypovídá, tento server je zodpovědný za cachování obsahu na nezbytně nutnou dobu. Sharing and Collaboration a Content Management Service využívají pro svou činnosti Aplication Server. Tento server vykonává nejzákladnější funkce potřebné pro běh serveru. Zde jsou spravováni uživatelé a jejich přístupové údaje, ukládány projekty a řízena administrace celého Tableau serveru. Pod těmito službami běží Repository proces, který ukládá Tableau worksheety, přístupová práva, datové zdroje, informace o uživatelích a další data.

File Store proces je dostupný v případě distribuovaného, víceuzlového serveru. Řídí přístup k uloženým datům a v případě velmi vysokého zatížení serveru rozprostírá datové zdroje mezi jednotlivé uzly redundatně. Tak aby byly maximálně dostupné tam, kde je uživatel vyžaduje.

3.2. Datové zdroje

Jednou z funkcionalit Tableau serveru je možnost ukládat datové zdroje jako extrakty do vlastní databáze. Na rozdíl od podnikového datového skladu, kde jsou data ukládána celopodnikově, Tableau server je uzpůsoben pro ukládání a sdílení užších datových extraktů pro specializované analytické operace. Je tak možné tvořit ohraničené výřezy dat pro následné využití v Tableau.

3.3. Bezpečnost

Autentifikace je proces ověřování identity uživatele. Každý uživatel, který se chce přihlásit k serveru, musí být uložen v Tableau Server repozitáři. Ten je řízen pomocí repository procesu popsaném v předchozí části. Existují dva způsoby, jak řídit autentifikaci uživatelů. První způsob, využívaný především v maneších organizacích, je ponechání autentifikace na straně serveru. To znamená vytvoření uživatelských přihlašovacích jmen a hesel. Uživatelům jsou posléze přiřazeny role. Rizikem, které je třeba v tomto případě vnímat, je řízení uživatelských účtů. Uživatelé s v čase mění, některé je třeba mazat, jiné přidávat. Udržení seznamu užiivatelů v aktuálním stavu je zodopovědností správce serveru. Druhý způsob počítá s využitím služeb Active Directory. Tato služba umožňuje centralizované řízení uživatelských účtů v organizaci. Představuje centrálně spravovaný seznam uživatelů a jejich rolí. Připojením serveru na Active Directory se tento seznam synchronizuje s repozitářem a Tableau Server ho nadále používá jako zdroj informací. Administrátor v tomto případě pouze přiřazuje role.

Autorizace určuje, co může uživatel vidět a k čemu přistupovat ve chvíli, kdy je autentifikován a přihlášen k serveru. To zahrnuje práci s obsahem, složkami, dasboardy a datovými zdroji uloženými na serveru, změny nastavení serveru a přidělování uživatelských rolí.

3.4. Administrace

Role

Přidělování uživatelských rolí je důležitou aktivitou při správě serveru. Za správnou distribuci práv je zodpovědný administrátor. Ten má neomezený přístup do všech částí serveru a kontrolu nad všemi funkcemi. Může udělit uživatelům následující role:

  • Administrátor ,
  • Publisher - Může se přihlásit k serveru z Tableau Desktop, publikovat dasboardy a datové zdroje a stahovat je, nemůže udělovat uživatelská práva,
  • Interactor - Může prohlížet dashboardy na serveru, ale nemá právu publikovat – Viewer - Má právo se přihlásit k serveru a prohlížet dashboardy, ale nemá povolenou manipulaci s nimi. Nemůže filtrovat nebo třídit data.

Alokace uživatelských práv probíhá na server v sekci Users. Administrátor zde má přehled o uživatelích a jejich rolích. Přepnutí role je zde otázkou jednoho kliknutí. Každý uživatel může mít pouze jednu roli. Uživatelé, kteří nemají administrátorkou roli se do sekce Users nedostanou. Související položkou je sekce Groups. Zde jsou spravovány skupiny uživatelů. Adminstrátor může přidělit uživatelům přístup do složek globálně, místo aby je musel přidělovat jednotlivě.

Schedules

V této sekci je řízeno plánování operací s datovými zdroji a rozesílání reportů uživatelů. Pro datové zdroje uložené na Tableau serveru lze nastavit, jak často a kdy se mají aktualizovat. To je nutné při velkém objemu dat, která by se měli při aktualizace přenášet po síti. Zároveň taková operace vytěžuje zdrojové systémy a je vhodné ji naplánovat na noční hodiny.

Rozesílání aktualizovaných reportů uživatelům je služba, která v určený okamžik rozešle na vybrané uživatele aktualizovaný report. Akci lze naplánovat v návaznosti na aktualizování datových zdrojů. Aby uživatel nemusel sledovat, zda je jeho report aktuální, lze naplánovat rozesílání emailů s odkazem na report. Uživatel tak může dostat pravidelně aktualizované inforamce například do emailové schránky.

Status

Sekce status je důležitá pro administrátora Tableau serveru. Sleduje všechny operace na serveru a v přehledných interaktivních reportech informauje o stavu služeb a aktivitách uživatelů. Adminstrátor má tak na jednom místě například informace o počtech přístupů do složek, provozu na síti, objemu datových zdrojů nebo neúspěšných pokusech o přihlášení. Může zde sledovat také výkon vizualizací reportů, tedy jak dlouho trvá, než se vizualizace načte, kolik zpotřebuje paměti a jak dlouho trvá odezva na uživatelskou akci.

3.5. Publikování na server

Z uživatelského pohledu nejdůležitější funkcionalitou Tableau Serveru je publikování dashboardů. Je to proces, který začíná vytvořením dashboardů v Tableau Desktop. Poté co je uživatel s výsledkem spokojený, má možnost ho publikovat na server. Publikování přináší do organizace prvek sdílení. Uživatelé, kteří mají právo přístupu na server a k dashboardu, ho mohou otevřít, na serveru zobrazit a interagovat s ním, případně si ho stáhnout i s datovým extraktem a pracovat offline. Publikování má několik kroků. V prvním kroku uživatel v Tableau Desktop klikne na Publish Workbook to Tableau Server. Nabídne se přihlašovací okno, kde zadá adresu serveru a přihlásí se.

Uživatel se přihlásí svým uživatelským jménem a heslem, případně pomocí Active Directory. Následně se zobrazí dialog pro uložení dashboardu na server. Zde uživatel vybere, do jakého projektu dashboard patří. Projektem je myšlena složka, do které je dashboard pro přehlednost umístěn. Zvolí vhodné jméno pro dashboard a má možnost přidat tagy. Tagy jsou vhodné například při velkém počtu publikovaných dashboardů. Další uživatelé mohou podle nich vyhledávat a třídit již publikované reporty.

Řízení přístupu k publikovanému dashboardu je řešeno skrz dialog View Permissions. Zde uživatel specifikuje, kteří uživatelé, nebo skupiny uživatelů mohu interagovat s publikovaným dashboardem a jakým způsobem. Lze zvolit, že pro určitou skupinu bude report pouze ke čtení, zatímco jiná skupina uživatelů bude moci komentovat, stahovat a editovat report, případně ho smazat.

Ve vedlejším okně uživatel vybere worsheety, které si přeje zobrazit v publikovaném workbooku. Pokud nějaké worksheety do výběru nezahrne, neznamená to, že se nepublikují na server, ale pouze se schovají pro prohlížení uživatelům. Stažením ze serveru získá uživatel i zde nevybrané worksheety. Je to z toho důvodu, že publikovaný dashboard by mohl využívat obsah worksheetu a takto by byl o ifnormace v něm ochuzen.

Poslední volbou je Scheduling & Authentification. Tato volba umožňuje nastavit pravidelné aktualizace datových zdrojů na serveru a jejich propojení se zdrojovými databázemi. Poté stačí kliknout na Publish. Tableau odešle dashboard na server, který ho zpracuje a zobrazí ve webovém prohlížeči.

Publikovaný report ukazuje obrázek . Obrazovka je rozdělena na administrátorskou lištu s logem Tableau a obrazovku dashboardu. Pro dashboard jsou přítomné prvky pro manuální aktualizaci datových zdrojů a funkce pro editaci, stažení a sdílení dashboardu. Záložky slouží pro přepínaní mezi worsheety. V závislosti na uživatelských právech je report interaktivní a umožňuje s daty pracovat stejně jako v Tableau Designeru.

4. Odkazy na demo a další zdroje

Zkušební verze http://www.tableausoftware.com/products/trial?os=windows ,*/Instruktážní videa ,*/ Tableau Extracts–What / Why / How etc. The Information Lab [online]. London: The Information Lab, 2011 [cit. 2017-04-01]. Dostupné z: https://www.theinformationlab.co.uk/2011/01/20/tableau-extracts-what-why-how-etc/ ,*/ Uncover patterns in your data with Tableau 10’s clustering feature. Tableau.com [online]. London: Tableau, 2016 [cit. 2017-04-02]. Dostupné z: https://www.tableau.com/about/blog/2016/7/uncover-patterns-your-data-tableau-10s-clustering-feature-5637