VIZUALIZACE DAT V GRAFECH ZÁSADY PRO TVORBU GRAFŮ ZALOŽENÉ NA VLASTNOSTECH LIDSKÉHO VNÍMÁNÍ Vizualizaci dat lze definovat jako způsob vizuální grafické reprezentace dat, který je maximálně uzpůsoben schopnostem našeho zraku. Vizualizace hodnotových dat je široká disciplína zabývající se srozumitelnými a efektivními způsoby vizuální prezentace dat pomocí tabulek a grafů. Pro dosažení dobrých výsledků je nezbytné umět správně čísla graficky interpretovat, vybrat pro ně vhodný typ grafu a vytvořit funkční vizuální grafický design, který bude data prezentovat srozumitelně, pravdivě a v logickém kontextu. Dnes víme, že senzorické podněty v zorném poli náš zrakový systém zpracovává dvojím způsobem: v rané fázi vnímání jsou některé podněty zpracovány současně rychlým paralelním procesem bez vědomého zapojení naší pozornosti v pozdějších fázích vnímání jsou jiné podněty zpracovány jeden za druhým pomalým sériovým procesem, na který musíme vědomě zaměřit naši pozornost. ZPRACOVÁNÍ PRVKŮ ZORNÉHO POLE V RANÉ FÁZI VNÍMÁNÍ Díky vědeckým výzkumům posledních desetiletí dnes chápeme poměrně dobře, co se při zachycení, zpracování a vyhodnocení zrakových informací děje v oku a mozku. Některé vjemy v zorném poli jsou již v rané fázi vnímání (RFV) přednostně zaznamenány a velmi rychle zpracovány v oku a primárním korovém zrakovém centru mozku. Výběr elementů, které náš zrak zpracovává v RFV, probíhá zcela automaticky a nezávisle na naší vůli ještě předtím, než na tyto objekty zaměříme pozornost. Tento výběr neprobíhá náhodně, ale závisí na určitých vlastnostech elementů, tzv. vlastnostech RFV: 321354684984365168465165 968165168961616816816816 816886168465013656984036 849843651654896465168401 Abychom zjistili, kolik pětek se nachází v souboru čísel nahoře, museli bychom procházet jedno číslo za druhým, protože žádné z čísel nemá vlastnost RFV a není tedy zaznamenáno a zpracováno v rané fázi vnímání. 321354684984365168465165 968165168961616816816816 816886168465013656984036 849843651654896465168401 Na obrázku nahoře zaznamenáme pětky zřetelně, i když se na něj podíváme jenom letmo. Nemusíme procházet jedno číslo za druhým, všechny pětky nacházející se v souboru čísel vidíme najednou a okamžitě. Pětkám jsme vědomě přiřadili vlastnost RFV, v tomto případě červenou barvu. Vliv vlastností RFV na vyčleňování částí z celku si vysvětlíme na následujících obrázcích. V prvním případě jsme v souboru prvků vybraný bod barevně odlišili a ve druhém jsme zachovali barevnou homogenitu objektů, ale změnili jsme tvar jednoho čtverce na bod. Barva a tvar zde plní funkci vlastností RFV, proto se oba prvky zřetelně vyčlenily z celku a jsou viditelné bez ohledu na počet nevýrazných prvků neztratí se mezi nimi. červený bod (barva) bod (tvar) V okamžiku, kdy počet rušivých elementů ovlivňuje vizuální vyčlenění sledovaného objektu (odvádí od něj naši pozornost), nejedná se o vlastnost RFV. Naše vnímání neumí u jednoho prvku zaznamenat zároveň více vlastností RFV, proto objekt, který měl původně vlastnost RFV, ji ztratí v okamžiku, kdy u něj dojde ke kombinaci více vlastností RFV. Pokud budeme chtít zjistit, zda se ve skupině prvků na obrázku níže nachází červený bod, let-
mým pohledem to nezjistíme. Pro splnění tohoto úkolu musíme zaměřit pozornost na soubor prvků a postupně je prozkoumat jeden za druhým. (Červená) barva a tvar (bod) kombinace dvou vlastností RFV Pokud by se červený bod vyskytoval pouze ve skupině červených čtverců nebo modrých bodů, vždy by měl vlastnost RFV a vizuálně by se vyčlenil ze souboru. Pokud dochází u alespoň části prvků v zorném poli ke kombinaci alespoň dvou jejich vlastností RFV, jejich vlastnosti RFV ztratí svůj původní charakter a žádný prvek se z celku nevyčlení. Všechny prvky zorného pole se stanou vizuálně rovnocennou součástí celku. Dnes víme, že z hlediska práce s grafy a tabulkami mezi důležité vlastnosti RFV patří: forma (délka, šíře, orientace, tvar, velikost a ohraničení) barva (tón, jas a saturace) prostorové umístění mezi dvěma osami Výběr proběhne nezávisle na naší vůli a pozornosti. Tuto vlastnost jiné sloupce nemají, a tak vidíme výrazný modrý sloupec bez ohledu na počet šedých sloupců. K prohlížení šedých sloupců musíme zapojit naši vědomou pozornost. Tento proces již není automatický, ale probíhá sériově, což znamená, že prohlížíme jeden sloupec za druhým. Pokud však v grafu budou všechny sloupce mít různou nebo stejnou barvu, žádný ze sloupců nebude vizuálně vyčleněn z celku. Při pohledu na graf uvidíme pouze vizuálně neutrální soubor určitých grafických objektů. Problém srozumitelnosti grafické prezentace dat v grafech spočívá v tom, že vlastnostmi RFV mohou být opatřeny všechny objekty v grafu. V případě, že graf obsahuje dekorativní prvky s vlastnostmi RFV, data automaticky ustupují do pozadí a naše pozornost se v prvním okamžiku zaměří na ozdobné elementy. Na obrázku níže je červená spojnice zcela nezřetelná a na první pohled si vůbec nemusíme neuvědomit, že tento grafický prvek reprezentuje data. a některé další. Při pohledu na graf, aniž bychom to mohli nějak ovlivnit, zaregistrujeme nejdříve všechny objekty s vlastnostmi RFV. Pokud budou všechny sloupce šedé, ale jeden z nich modrý, při pohledu na graf okamžitě vizuálně znamenáme výjimečnost modrého sloupce. Tento přednostní výběr sloupce provede oko, protože sloupec má vlastnost RFV, kterou je v tomto konkrétním případě (jedinečná) modrá barva. Cestou k vytváření efektivních grafů je tedy zcela vědomé přiřazování vlastností RFV datovým informacím. Ostatní nedatové elementy grafu musíme zatlačit do pozadí tím, že jim vědomě vlastnosti RFV nepřiřadíme, popř. odejmeme. Při neznalosti těchto specifik lidského vnímání můžeme do grafu chybně: zařadit příliš mnoho elementů s vlastnostmi rané fáze vnímání, čímž vznikne pro náš zrak na ploše zmatek a ve změti jednotlivých elementů nejsme schopni se ani vyznat přiřadit vlastnosti RFV nedatovým elementům, zatímco datové elementy, kvůli absenci vlastností RFV, budou zatlačeny do pozadí a graf se stane nepřehledným a nesrozumitelným zahrnout do grafu obrázky, kliparty a další dekorativní objekty, které snižují jeho informační hodnotu.
VIZUÁLNÍ PRACOVNÍ PAMĚŤ A JEJÍ KAPACITA Naše zrakové vnímání má i další vlastnosti, které jsou pro srozumitelnost vizuální komunikace zcela zásadní. Jedná se zejména o kapacitu naší krátkodobé vizuální pracovní paměti. Tato paměť slouží k dočasnému ukládání informací o objektech, se kterými momentálně pracujeme. Kapacita krátkodobé pracovní paměti je velmi malá a pojme najednou maximálně 5-7 jednoduchých objektů, z čehož efektivně umíme pracovat maximálně se čtyřmi objekty. Například neumíme porovnávat mezi sebou dvourozměrné plochy (obdélníky, čtverce, kruhy, kruhové výseče), protože je neumíme bezprostředně převádět na čísla. Zpravidla k provedení takového převodu musíme provést složitější matematický výpočet pomocí vzorce. Při pohledu na tři čtverce a dva kruhy nedokážeme identifikovat poměr jejich vzájemné velikosti. Abychom to spolehlivě dokázali určit, museli bychom spočítat objemy ploch jednotlivých objektů, a pak výsledky vyjádřené čísly vzájemně porovnat. Pokud v jednom grafu použijeme více než 7 objektů (barevné výseče), naše pracovní paměť tyto informace neumí udržet v celistvosti. Graf na první pohled působí nekomfortně a čtenáře odrazuje od dalšího prozkoumání. Lépe nám to jde u objektů se stejným tvarem, ale čím menší rozdíl je ve velikostech objektů, tím hůře je umíme dle velikosti seřadit. V případě dalšího příkladu by byl požadavek na vizuální seřazení jednotlivých barevných bodů podle velikostí prakticky nesplnitelný, protože se body od sebe rozměry příliš neliší: Graf s více položkami obsahuje zpravidla legendu, která identifikuje jednotlivé kategorie podle barev. Tyto informace si neumíme zapamatovat a dochází k tomu, že střídavě musíme přeskakovat zrakem z grafu na legendu a zpět, čímž si obnovujeme informace v pracovní paměti. Tento proces odvádí naši pozornost (soustředění) od vnímání dat a je velmi únavný. Tento nedostatek našeho vnímání způsobuje to, že koláčové grafy nejsou vhodné pro reprezentaci číselných hodnot. Pokud se v koláčovém grafu nachází výseče obdobné velikosti, nejsme schopni je setřídit podle velikosti. Pokud půjde o větší počet výsečí než 4-5, pracujeme už za hranicí kapacity naší pracovní paměti. V takovém případě koláčový graf nemůže efektivně přenášet datové informace a stává se pouze dekorativním objektem. SPECIFIKA ZPRACOVÁNÍ PODNĚTŮ VE VYŠŠÍCH ZRAKOVÝCH CENTRECH Kromě rané fáze vnímání existuje ještě další fáze lidské percepce, která je spojená s vyhodnocováním získaných informací ve vyšších korových zrakových centrech. Pokud bychom měli efektivně zvolit jiný typ grafu, který lépe vyhovuje typu dat, a uplatnit i další pravidla pro vizualizaci hodnotových dat, místo
koláčového grafu bychom použili pruhový graf v tomto designu: Při nižší hustotě dat musíme informační úroveň grafu dohánět jejich množstvím, což způsobuje vizuální nepřehlednost. GRAFICKÝ BALAST A RUŠIVÉ ELEMENTY Z hlediska tvorby grafů je důležité, že náš zrak sice dokáže některé vlastnosti RFV převádět na hodnoty přímo bez matematických výpočtů, ale toto převádění vizuálních vjemů na čísla provádí s různou kvalitou. Nejlépe to umí s délkou objektů (například sloupců nebo čar) a prostorovým umístěním bodu, např. bod mezi souřadnicemi grafu: V omezené míře umíme hodnotově seřadit šířku a velikost objektů a intenzitu odstínu barvy. Neumíme však např. převádět na hodnotu barevný tón. Modrá, bílá ani jakákoli jiná barva nemají pro nás žádný hodnotový význam. I když např. červená barva je spojena s negativními čísly (ztráta) a zelená s kladnými hodnotami (zisk), nevyjadřují ani tyto barvy konkrétní hodnoty, pouze určité rozmezí. Výraz grafický balast (Chart Junk) zavedl do praxe Edward Tufte, americký statistik, který je považován za otce moderního pojetí vizualizace hodnotových dat. Jako grafický balast označujeme takové formátování a vizuální úpravy grafických objektů, které působí velmi rušivě, odvádí pozornost od cílových objektů a snižují vypovídací schopnost grafické prezentace dat (grafu). Mezi grafický balast řadíme například: Veškeré 3D efekty na grafických objektech 3D grafy Stínování a přechodové barvy Ohraničení oblastí v tabulkách Zbytečné mřížky na pozadí grafu Veškeré obrázky a klipart na ploše grafu Nahrazování grafických tvarů objekty Prvky infografiky v grafech a mnoho dalších ozdobných prvků grafů a tabulek. CO V GRAFU ZVÝRAZNIT A CO POTLAČIT? U tabulek a grafů je tedy nutné uzpůsobit design tak, aby docházelo k vizuálnímu zvýraznění těch grafických prvků, které reprezentují data a k potlačení všech prvků, které nejsou nositeli datových informací. Budou-li v grafu převažovat nedatové elementy s vlastnostmi RFV nad datovými elementy bez vlastností RFV, náš zrak nejdříve zaznamená nedatové objekty a teprve potom budeme moci pozornost zaměřit na data. Tento proces si při čtení grafu neuvědomujeme. Tak se stává, že vnímáme graf jako zmatečný objekt, jehož obsah na první pohled neumíme vyhodnotit. Grafický balast zpravidla buď přiřazuje formátovanému objektu vlastnosti RFV, nebo působí jako rušivý element, který způsobuje horší přehlednost grafické prezentace dat. Jednoznačně však lze konstatovat, že grafický balast do grafů a tabulek nepatří a při jejich tvorbě je třeba se těmto formátům zdaleka vyhnout. Grafy by měly obsahovat tzv. zahuštěná data. Hustotou dat nerozumíme jejich množství, ale kontext a vypovídací hodnotu. I málo dat může mít vysokou informační hodnotu. Vyšší informační hodnota dat určuje jejich vyšší hustotu.
PRAVIDLA PRO VIZUALIZACI HODNOTOVÝCH DAT Vědecké poznatky posledních desetiletí umožnily vznik pravidel pro tvorbu tabulek a grafů, jejichž dodržování umožňuje přizpůsobovat vizuální grafický design hodnotových dat vlastnostem zrakového vnímání. Pravidla pro vizualizaci hodnotových dat ovlivňují: špatně správně volbu grafické interpretace dat v závislosti na jejich typu rozmístění a seskupení grafických elementů grafu v prostoru tak, aby popisovaly hodnotové vztahy pravdivě a nezkresleně dodržování vizuální střídmosti a barevnosti grafických elementů v tabulkách nebo grafech tak, aby byla zaručena jejich přehlednost. Respektování těchto postupů zaručuje, že grafy a tabulky budou reprezentovat data srozumitelně, přehledně, pravdivě a ve správném kontextu. VISUAL DATA S.R.O. KDO JSME? NAŠE ŘEŠENÍ Společnost specializovaná na profesionální vizualizaci hodnotových dat Školení pro řídící pracovníky využívání vizualizace dat při rozhodování a analýze Experti pracující s poznatky psychologie, ekonomie, statistiky a programování Tým nadšených analytiků, grafiků, programátorů a lektorů, kteří usilují o to, aby vaše data byla vždy srozumitelná, nezkreslená, konzistentní a elegantně vyjádřená Workshopy pro analytické týmy aplikace zásad vizualizace dat při tvorbě reportingových podkladů Tvorba vizuální datové identity grafů a tabulek na klíč dle typu dat, korporátní identity a požadavků klienta Výuka pokročilé práce s MS EXCEL tvorba přehledných grafů a tabulek s ohledem na specifika klienta Softwarové řešení VIZCHART pro rychlou a intuitivní tvorbu sebesložitějších grafů v MS EXCEL Audit stávající úrovně vizualizace dat klienta, konzultační servis při tvorbě nového vizuálního grafického designu grafů a tabulek Visual Data s.r.o. Školicí středisko: Krakovská 583/9, 110 00 Praha 1 tel.: 420 731 177 920 e-mail: info@visualdata.cz www.visualdata.cz