ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE. Vizualizace a ozvučení komplexních dynamických dat

Podobné dokumenty

Počítačová grafika. Studijní text. Karel Novotný

Světlo, které vnímáme, představuje viditelnou část elektromagnetického spektra. V

Práce na počítači. Bc. Veronika Tomsová

Název DUM: VY_32_INOVACE_2B_16_ Tvorba_grafů_v_MS_Excel_2007

Barevné modely, práce s barvou. Martin Klíma

Kartodiagramy. Přednáška z předmětu Tematická kartografie (KMA/TKA) Otakar Čerba Západočeská univerzita

Fázorové diagramy pro ideální rezistor, skutečná cívka, ideální cívka, skutečný kondenzátor, ideální kondenzátor.

Barvy a barevné modely. Počítačová grafika

Popisná statistika kvantitativní veličiny

Diagnostika regrese pomocí grafu 7krát jinak

Kde se používá počítačová grafika

Rozšíření bakalářské práce

Kontingenční tabulky v MS Excel 2010

GIS Geografické informační systémy

U Úvod do modelování a simulace systémů

ZÁKLADY PROGRAMOVÁNÍ. Mgr. Vladislav BEDNÁŘ /14

11 Zobrazování objektů 3D grafiky

Kartogramy. Přednáška z předmětu Tematická kartografie (KMA/TKA) Otakar Čerba Západočeská univerzita

GIS Geografické informační systémy

Obsah. Funkce grafu Zdrojová data pro graf Typ grafu Formátování prvků grafu Doporučení pro tvorbu grafů Zdroje

Pracovní celky 3.2, 3.3 a 3.4 Sémantická harmonizace - Srovnání a přiřazení datových modelů

VOLBA BAREVNÝCH SEPARACÍ

Příručka k měsíčním zprávám ING fondů

Ukázka knihy z internetového knihkupectví

Grafika na počítači. Bc. Veronika Tomsová

zdroj světla). Z metod transformace obrázku uvedeme warping a morfing, které se

Webové stránky. 6. Grafické formáty pro web. Datum vytvoření: str ánk y. Vytvořil: Petr Lerch.

Tabulkový procesor. Základní rysy

Chyby měření 210DPSM

Volba zobrazení (Direct Current, Scaling) - FFT 1D, FFT 2D

Zobrazování barev Josef Pelikán CGG MFF UK Praha.

Úvod do počítačové grafiky

13 Měření na sériovém rezonančním obvodu

Příručka k měsíčním zprávám ING fondů

MBI - technologická realizace modelu

PRODUKTY. Tovek Tools

You created this PDF from an application that is not licensed to print to novapdf printer (

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

2. Numerické výpočty. 1. Numerická derivace funkce

Excel 2007 praktická práce

2. Kinematika bodu a tělesa

Přehled matematického aparátu

Popis funkcí tlačítek jednotlivých modulů programu OGAMA

Vzdělávací obsah vyučovacího předmětu

ANALÝZA LIDSKÉHO HLASU

Dynamika tekutin popisuje kinematiku (pohyb částice v času a prostoru) a silové působení v tekutině.

Ilustrační příklad odhadu LRM v SW Gretl

VIZUALIZACE 2D VEKTOROVÝCH DAT. Tomáš Stolín Katedra informatiky, Ostravská Univerzita v Ostravě

ČESKÁ TECHNICKÁ NORMA

Statistika pro geografy

Digitální fotografie. Mgr. Milana Soukupová Gymnázium Česká Třebová

Přednáška 3: Limita a spojitost

PRODUKTY. Tovek Tools

CVIČNÝ TEST 17. OBSAH I. Cvičný test 2. Mgr. Tomáš Kotler. II. Autorské řešení 6 III. Klíč 13 IV. Záznamový list 15

Barvy. Radek Fiala. Podpořeno z projektu FRVŠ 584/2011

Umění a kultura. Výtvarná výchova. Základní škola a Mateřská škola Havlíčkův Brod, Wolkerova 2941 Školní vzdělávací program. Oblast.

PŘÍMKA A JEJÍ VYJÁDŘENÍ V ANALYTICKÉ GEOMETRII

Funkce, elementární funkce.

2. přednáška z předmětu GIS1 Data a datové modely

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

ZÁKLADNÍ TERMINOLOGIE V COLOR MANAGEMENTU

9 Prostorová grafika a modelování těles

Jednofaktorová analýza rozptylu

Statistické vyhodnocení průzkumu funkční gramotnosti žáků 4. ročníku ZŠ

Moderní technologie ve studiu aplikované fyziky CZ.1.07/2.2.00/ Množiny, funkce

Hodnocení map. Přednáška z předmětu Tematická kartografie (KMA/TKA) Otakar Čerba Západočeská univerzita

Grafy. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 13.

Světlo. Podstata světla. Elektromagnetické záření Korpuskulární charakter. Rychlost světla. Vlnová délka. Vlnění, foton. c = ,8 km/h

Multimediální systémy. 02 Reprezentace barev v počítači

Grafické systémy. Obrázek 1. Znázornění elektromagnetického spektra.

2.3 Prezentace statistických dat (statistické vyjadřovací prostředky)

Elektronická technická dokumentace Bc. Lukáš Procházka

České vysoké učení technické v Praze Fakulta biomedicínského inženýrství

Náhodné (statistické) chyby přímých měření

1. Úvod 2. Ekonomický kalendář 3. Přizpůsobení kalendáře 4. Důležité ekonomické zprávy 5. Výhody používání kalendáře

01 ZÁKLADNÍ VARIANTA - HORIZONTÁLNÍ

Pojmové mapy ve výuce fyziky

Příklad 1. Řešení 1a. Řešení 1b ŘEŠENÉ PŘÍKLADY Z M1B ČÁST 5

13 Barvy a úpravy rastrového

12 DYNAMIKA SOUSTAVY HMOTNÝCH BODŮ

7. Funkce jedné reálné proměnné, základní pojmy

Přístupnost webů knihoven příklady dobré a špatné praxe. Radek PAVLÍČEK, TyfloCentrum Brno, o. p. s., projekt Blind Friendly Web

Statistické zpracování naměřených experimentálních dat za rok 2012

Přednáška kurzu MPOV. Barevné modely

4. Statika základní pojmy a základy rovnováhy sil

Osnova. Koncept a použití prezentací. Seznámení s pracovním prostředím MS Word Režimy zobrazení. Užitečná nastavení. Základní práce s dokumenty

i=1 Přímka a úsečka. Body, které leží na přímce procházející body a a b můžeme zapsat pomocí parametrické rovnice

Tabulka 1. Výběr z datové tabulky

Regresní a korelační analýza

4. ROZMÍSTĚNÍ OBYVATELSTVA

Analýza a zpracování digitálního obrazu

OBRAZOVÁ ANALÝZA. Speciální technika a měření v oděvní výrobě

Dynamika. Dynamis = řecké slovo síla

DUM 01 téma: Úvod do počítačové grafiky

Automatická detekce anomálií při geofyzikálním průzkumu. Lenka Kosková Třísková NTI TUL Doktorandský seminář,

Experimentální realizace Buquoyovy úlohy

7. Rozdělení pravděpodobnosti ve statistice

Inovace studia obecné jazykovědy a teorie komunikace ve spolupráci s přírodními vědami

Transkript:

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKUTLA ELEKTROTECHNICKÁ KATEDRA POČÍTAČŮ Pavel Němec Prezenční studium Vizualizace a ozvučení komplexních dynamických dat Visualization and sonification of complex dynamic data.

Anotace Tato diplomová práce si za cíl vytyčila prozkoumání jednoho z možných způsobů vizualizace komplexních dat. Vizualizace velkého množství dat vytváří problém, jak přehledně, srozumitelně a efektivně zobrazovat informaci a zároveň ji nezkreslit a příliš nezredukovat. Těžiště práce leží ve zmapování dosavadního vývoje výzkumu Podvědomé vizualizace a použití zvuku při zobrazení dat. Získané informace použijeme k vytvoření aplikace, která některé poznatky ověří na vzorových datech.

Annotation Aim of this thesis is to explore of of possible approach to visualization of complex data. Visualization of huge set of data present us problem: how to present information clearly, understandably and defectively without distortion and too far reduction. This thesis focus on mapping of existing research in Preatenative visualization and sonification for data representation. We create application which verify acquired information on sample data.

Prohlášení Prohlašuji, že jsem svou diplomovou práci vypracoval samostatně a použil jsem pouze podklady uvedené v přiloženém seznamu. Nemám závažný důvod proti užití tohoto školního díla ve smyslu 60 Zákona č.121/2000 Sb., o právu autorském, o právech souvisejících s právem autorským a o změně některých zákonů (autorský zákon). V Praze dne podpis diplomanta

5

Obsah 1 Slovník pojmů...8 2 Úvod...9 2.1 Komplexní data...9 2.2 Ozvučení...9 2.3 Proč se zabývat vizualizací komplexních dat...9 3 Vizualizace vícerozměrných dat...11 3.1 Barva...13 3.2 Glyf...13 3.3 Ozvučení...14 3.3.1 Co zvuk nabízí...15 3.3.2 Zobrazování pomocí zvuku...15 3.4 Pohyb...16 4 Kvalita vizualizace...17 4.1 Příklad...17 5 Podvědomá vizualizace...18 5.1 Grafické rysy - features...18 5.1.1 Příklad detekce barev...18 5.2 Tabulka podvědomých rysů...19 5.3 Rušení v podvědomé vizualizaci...20 5.3.1 Rušení přítomností jiného rysu...20 5.3.2 Rušení v rámci jednoho rysu...21 5.4 Hierarchie grafických rysů...22 5.5 Barva...24 5.5.1 CIE 1976 Luv...24 5.5.2 Vzorec vzdálenosti v CUE-Luv...25 5.5.3 Lineární separace...26 5.5.4 Barevné kategorie...26 5.5.5 Závěr...27 5.6 Pohyb...27 5.6.1 Kmitání...28 5.6.2 Směrový pohyb...28 6 Burza...29 6.1 Úvod...29 6.2 Současná řešení...29 6.2.1 Příklad ProClarity...30 6.2.2 Příklad Market Map...31 6.2.3 Příklad Stock Market Planetarium...31 6.3 Data...33 6.3.1 Tabulka VOLUME...34 6.3.2 Tabulka PRICE...34 6.3.3 Tabulka CHANGE...35 6.3.4 Tabulka %CHANGE...35 6.4 Koule...35 6.4.1 Velikost sféry...36 6.4.2 Poloha sféry v prostoru...37 6.4.3 Vzorec poloha...38 6.4.4 Barva...39 6

6.4.5 Tabulka barevné vzdálenosti...40 6.4.6 Frekvence pulsování...40 6.4.7 Zvuk...41 6.4.8 Galerie...41 6.4.9 Závěr...42 6.5 Plocha...44 6.5.1 Poloha deformace...44 6.5.2 Deformace...45 6.5.3 Druhy vizualizace...47 6.5.4 Zvuk...48 6.5.5 Závěr...48 7 Ovládání vizualizačního programu...49 7.1 Pohyb ve scéně...50 7.2 Výběr vizualizace a výběr dat...50 7.3 Koule...53 7.4 Plocha...54 8 Závěr...55 9 Seznam použité literatury...56 7

1 Slovník pojmů 1 Slovník pojmů CMY / CMYK Barevný prostor definovaný třemi/čtyřmi intenzitami barevných složek Cyan Magenta Yallow / black. DOM Detail On Demand - detail na vyžádání. Ekvipotenciála Plocha nebo přímka, na které má silové pole stejnou velikost. ET Eastern Time - označuje časové pásmo používané v některých částech Ameriky, například v New Yorku. Čas je posunut o -5 hodin oproti UTC. RGB Barevný prostor definovaný trojicí hodnot intenzit R - červená (red), G - zelená (green), B -modrá (blue). Tyto hodnoty jsou velikosti intenzit tří základních barev: červené, zelené, modré. HSV, HLS Barevný prostor definovaný parametry H - hue, S - saturation / L - lighteness, V - value. Java Objektový interpretovaný jazyk vyvýjený firmou Sun Microsystems. Adresa http://java.sun.com Java3D Rozšíření jazyka javy, dovolující používat hardwarovou akceleraci grafických karet. LOD Level Of Detail - úroveň detailů. Termín, který se používá v počítačové grafice. Jeden objekt je reprezentován několika různě složitými strukturami. Podle vzdálenosti se používá buď složitější, nebo jednodušší model. Multiplatformní Ve smyslu multiplatformní program, vyjadřuje tento termín schopnost programu pracovat na více platformách. Platforma může být softwarová, pak se rozumí operační systém, nebo hardwarová, kterou se rozumí použítý počítač. NYSE New Your Stock Exchange- zkratka new yorské burzy cenných papírů. http://www.nyse.com SPAD Jedná se o termín z oblasti finančního trhu. SPAD je název pro burzovní systém, ve kterém se obchodují nejlepší akcie na trhu a ve kterém se pohybují tvůrci trhu - Market Makeři (název přejatý z angličtiny - ). Trackpad Vstupní počítačové ukazovací zařízení. Pohyb je realizován kuličkou, kterou uživatel otáčí prsty. Touchpad Vstupní počítačové ukazovací zařízení. Pohyb je realizován snímáním polohy prstů na citlivé podložce. Toto zařízení se často používá u přenosných počítačů jako náhrada za počítačovou myš. UTC Zkratka centrálního času Spojených Států Amerických. Volatilita Míra průměrné intenzity kolísání kurzů cenných papírů a deviz i úrokových sazeb během určitého časového období. 8

2 Úvod 2 Úvod Vizualizování informací je nedílnou a důležitou součástí zpracovávání dat. Také proto vizualizace byla a je oblast intenzivního vědeckého výzkumu, jehož výsledky se uplatňují ve všech oblastech lidské činnosti. Zejména zpracování vědeckých, ekonomických a medicínských dat nachází významné uplatnění v komerční sféře. Ve této práci se pokusíme ukázat některé obecné přístupy k vizualizaci složitých dat. Vysvětlíme význam podvědomé vizualizace. Objasníme metody použití podvědomé vizualizace a omezení, která tyto metody přinášejí. Ukážeme informační hodnotu zvuku použitého jako vizualizačního prostředku. Na závěr budeme použití těchto metod demonstrovat vytvořením programu, který vizualizuje burzovní data. 2.1 Komplexní data Přívlastek komplexní charakterizuje především kontext dat. Naznačuje velkou složitost a velké množství informací o jedné entitě. Často se pro vyjádření počtu používá slovo rozměrovost (dimensionalita). Například poloha bodu v prostoru je trojrozměrná informace. Další vlastností, kterou vyjadřuje výraz komplexní, je že popisuje celý systém (jeho stav). Všechna data dohromady obsahují ještě další informaci, která nemusí být v jednotlivých datových entitách explicitně obsažená. Tento pojem celistvosti se pokusíme vysvětlit na jednoduchém příkladu. Stroj se skládá z X částí. Soubor dat obsahuje váhu každé z těchto X částí. Pokud o datech víme, že popisují části jen jednoho určitého stroje, můžeme určit váhu celého stroje, přestože tato informace v datech obsažená není. 2.2 Ozvučení Ozvučení (sonifikace) není úplně běžným způsobem zobrazování dat. Umožňuje ale rozšířit vizualizaci o další rozměr využitelný pro vyjádření informace, navíc velmi bezprostředním způsobem. O vnímání zvuku z hlediska přenosu a vnímání informace se zmíníme v samostatné kapitole. 2.3 Proč se zabývat vizualizací komplexních dat Naše schopnost získávat, zpracovávat a ukládat data se v poslední době velice rychle vyvíjí. Umíme s daty pracovat mnohem větší rychlostí a s rostoucími technickými prostředky se i oblasti, o kterých můžeme data získávat, rozšiřují. Naše schopnost data analyzovat a pochopit však zůstává stejná. Ve většině oblastí vědy dochází k výraznému nárůstu množství analyzovaných dat, která je navíc často potřeba analyzovat, zobrazovat, ale hlavně chápat v kontextu dat ostatních. Ztrácíme možnost porozumět takovým datům běžným způsobem, tj. detailní analýzou všech hodnot. Potřebujeme vytvořit metody, které umožní získat potřebnou informaci jiným způsobem. V takových případech je právě nutné aplikovat prostředky počítačové vizualizace. Je to způsob, kterým je možné přiblížit člověku jevy odehrávající se mimo jeho možnosti představivosti. Často jde o vědecký experiment, jehož výsledek není předem jakkoliv předvídatelný, a je tedy nejistý, může však přinést 9

2 Úvod překvapivé výsledky a informace o charakteru a vlastnostech komplexního systému jako celku. Takový systém velmi často vykazuje vlastnosti, které jsou zcela odlišné od vlastností jeho jednotlivých částí a které z nich nejsou ani odvoditelné, nebo na ně redukovatelné. Jako motivaci uvedeme příklad z genetiky [1]. Ještě před několika desítkami let jsme znali analýzu DNA jen pro několik organismů. Řádově tedy 1000 písmen popisujících několik genů. Dnes známe biliony písmen reprezentujících tisíce genů v mnoha organismech. Při výzkumu vlivu jednotlivých genů se ale ukazuje, že jejich funkce (často se hovoří také o vlastnosti) vyplývá z prostředí (sousedních genů) v němž jsou zasazeny. Potřebujeme tedy analyzovat (a také zobrazovat) velké množství genů (tzn. dat) v souvislosti genů ostatních (ve struktuře DNA). Proč ale data vůbec vizualizovat? Počítač si s nimi přece poradí mnohem lépe! Důležitost vizualizace vyplývá z vlastností daných člověku. Textovou informaci lidé zpracovávají jen sekvenčně. Člověk může najednou uchovat maximálně cca 7 rozdílných informací [58]. Z toho vyplývá, že takový způsob nabízí jen velice omezený pohled, jakýsi malý výřez skutečného obrazu. Člověk je ale schopen přijímat informace paralelně a to buď pomocí obrazu, nebo pomocí zvuku. A právě proto je nutné použít pro komplexní data sofistikované metody, které umožní zobrazit informaci na pozadí kontextu, ze kterého vychází. 10

3 Vizualizace vícerozměrných dat 3 Vizualizace vícerozměrných dat Vizualizace dat je jedna z částí v procesu práce s daty, který začíná u souboru dat a končí porozuměním potřebné informaci. Tento proces je možné rozčlenit na několik částí (viz následující seznam). Členění zavádí Ben Fry [2] Členění procesu práce s daty 1 1. Získání dat: z jakého zdroje jsou data získána. 2. Definice struktury: číslům a hodnotám je přiřazen význam, smysl. 3. Filtrace: pracujeme jen s relevantními daty. 4. Výpočet: provádíme nad daty potřebné výpočty, statistiky, operace. 5. Reprezentace: výsledky jsou interpretovány jako graf, animace nebo jakékoliv jiné vhodné sdělení. 6. Refine : vylepšení zobrazení výsledků za účelem dosažení větší přitažlivosti. 7. Interakce: další filtrování zobrazených výsledků, úroveň detailů - LOD, detaily na vyžádání - DOM. Vizualizace se týká především bodů 5-7. V těchto bodech předáváme informaci uživateli. Výraz vícerozměrná data znamená, že o každé entitě2 ze souboru dat, se kterým pracujeme v bodech 1-7, máme více než jednu informaci. Pokud v bodech 1-4 počet těchto informací zredukujeme, nemusíme řešit problém, který vzniká při vizualizaci komplexních dat. Pokud je ale nutné vizualizovat (body 5-7) mnoho informací o každé entitě, vzniká problém, jak zobrazit všechny informace a zároveň zachovat přehlednost a srozumitelnost sdělení. Základními prostředky pro vizualizaci jsou grafy. Nejběžnější jsou dvourozměrné (dvoudimenzionální) grafy, které ukazují vztah mezi dvěma veličinami. Trojrozměrné varianty se většinou zaměřují na bod 6, tedy na poskytnutí stejné informace v přitažlivější formě. Dvourozměrný graf má jednu velikou výhodu, která spočívá v jeho jednoduchosti a tím i ve velké srozumitelnosti. Zobrazení mnohodimenzionální informace dosáhneme např: zobrazením více závislostí v jednom grafu, rozlišením pomocí barev, tloušťky a druhu čáry, vložením popisů atd. (obrázek 1). I v dvourozměrném grafu jsme tak schopni vizualizovat mnohodimenzionální informaci. Děje se tak vždy na úkor přehlednosti a srozumitelnosti, kterou se můžeme pokusit zlepšit použitím některých technik, jež uvádíme v bodě 7. 1 2 V dalším textu budeme na tento seznam odkazovat, např. viz bod 1 nebo jako: viz bod 1 Členění procesu práce s daty. Souborem dat rozumíme množinu entit. Entita je objekt, o kterém máme informace. Příkladem entity může být akcie na burze. Informace o ní pak jsou například změna ceny a její hodnota. Souborem dat by byl seznam všech obchodovatelných akcií. 11

3 Vizualizace vícerozměrných dat Obrázek 1. Použití dvourozměrného grafu pro vizualizaci vektorového pole. Pro zvýšení počtu zobrazených informací je použita barva jako intenzita pole, šipky zobrazující směr a plné čáry jako ekvipotenciály. Další možností jak zvýšit množství informace je zobrazovat vizualizaci v trojdimenzionálním prostoru. Tato technika je navíc velmi vhodná u dat, která se k takovému prostoru vztahují (např. prostorové rozložení silového pole na obrázku 2). Přestože je možné zobrazovat skutečný trojrozměrný obraz, většinou se používá zobrazení na dvourozměrném zařízení (výtisk, obrazovka, plátno atd.). Techniky, které umožňují zobrazit 3D obraz na dvourozměrném zařízení, jsou velice dobře zvládnuty jak po stránce matematické, tak i technické. Obrázek 2. Trojrozměrný graf zobrazující vektorové prostorové pole. Barva zobrazuje intenzitu pole, šipka zobrazuje směr pole ( v = x, y, z ) v daném bodě ( X =[ x, y, z ] ). Dohromady je tedy vizualizováno 7 různých údajů. Dimensionalitu ale dále rozšiřovat nemůžeme, neexistují totiž rozumné techniky, které by umožňovaly přehledně zobrazovat čtyř a vícerozměrné prostory. Pokud si tedy 12

3 Vizualizace vícerozměrných dat nevystačíme s dvěma hodnotami u dvojrozměrného grafu, nebo třemi u trojrozměrného, používáme prostředky jako jsou barvy, glyfy, ozvučení, pohyb. 3.1 Barva Barvu je možné použít při vizualizaci dvěma způsoby. V prvním případě slouží jen jako odlišení různých druhů entit, jako například dvě různé křivky v jednom grafu. V druhém případě se využívá toho, že barvy je možné seřadit (například podle intenzity). Hodnoty pak zobrazíme jako barevnou škálu (viz obrázek 2). Hodnoty barev jsou běžně chápány tak, že červená je nejvyšší a modrá nejnižší, mnohem vhodnější je ale uvést legendu, tzn. jaká hodnota se přiřadí které barvě. 3.2 Glyf Na obrázku 2 je zobrazeno 7 různých informací o každé entitě. Entitou je v tomto případě bod v prostoru. Tyto informace jsou zobrazovány pomocí šipky. Šipka je konkrétním případem objektu, který se obecně nazývá glyf. Glyfy (anglicky Glyphs) jsou objekty, jejichž grafická reprezentace vyjadřuje informaci. Zpravidla se jedná o složitější objekty, které umožňují zobrazit mnohodimenzionální informaci o každé entitě. Na obrázku 2 je glyfem barevná šipka, která je schopna zobrazit 6-ti dimenzionální informaci pomocí polohy, barvy a délky šipky. Na obrázku 3 je glyf podobný šipce, který umožňuje zobrazení až 10 hodnot. Obrázek 4 ukazuje glyf, který na dvourozměrném grafu zobrazuje 9 různých informací. Netypický glyf usměvavý obličej na obrázku 5 dokáže zobrazit až 11 hodnot. Obrázek 6 zobrazuje glyf použitý při vizualizaci počítačových dat v [3]. Pomocí glyfů lze zobrazit velké množství hodnot. Jediným omezením je přehlednost vizualizace. Obrázek 3. Glyf šipka která zobrazuje 7 různých informací. Obrázek je převzat z [4]. Obrázek 4. Dvojrozměrný graf, který používá glyfy pro zobrazení devíti dílčích informací na ploše. 13

3 Vizualizace vícerozměrných dat Obrázek 5. Glyf ve tvaru veselého obličeje. Jeden glyf je schopen zobrazit cca 11 údajů. 3.3 Obrázek 6. Použití glyfů v [3] Glyfy jsou zobrazovány na ploše, po které se pohybují po spirále. Ozvučení Jak bylo výše uvedeno, ozvučení není úplně běžný způsob zobrazení3 dat. Metody ozvučení jsou také mnohem méně prozkoumané než metody grafické vizualizace. Ozvučení má ale mnoho vlastností, které lze velmi dobře využít pro řešení problémů vizualizace komplexních dat. 3.3.1 Co zvuk nabízí Často se zvuk používá pro zobrazování dat z detekčních přístrojů. Jedním z nejznámějších je Geigerův počítač, který počet částic (fotonů, alfa, beta a gama) převádí na přerušovaný zvuk. Zvukový signál umožňuje velice snadno určit změnu hodnoty, navíc při vysokých (a nebezpečných) hodnotách má zvuk tendenci upoutávat pozornost. Poslední zmíněná vlastnost se často používá jako doplněk klasického zobrazování informace, kdy grafické zobrazování vysokých/nízkých hodnot je doprovázeno zvukem. Zvuk tedy můžeme použít pro upoutání pozornosti, případně pro vymezení oblasti zájmu (viz bod 7 Členění procesu práce s daty). Další vlastností, kterou lze s úspěchem použít pro zobrazení informace je, že člověk automaticky rozpoznává ve zvuku opakující se sekvence (melodie). Zvukové sekvence se také mnohem snadněji zapamatují, než stejné sekvence vyjádřené v grafické podobě. Příklad využití této vlastnosti najdeme například v [5]. Program umožňuje zrakově postiženým chemikům prozkoumávat pomocí zvuku spektrografická infračervená data. Zvuk má taktéž velmi silné fyziologicko-psychické účinky. Umožňuje bezprostředně navodit příjemnou náladu stejně jako působit velice rušivým dojmem. Zvukového (hudebního) doprovodu se proto často využívá pro umocnění dojmu z uměleckých instalací. Přestože zvuk je zde popisován z úplně jiných hledisek, je důležité si tuto vlastnost uvědomit. Pokud bychom totiž použili ozvučení, které by rušilo nebo působilo na uživatele příliš silně, omezovali bychom pozornost na vizualizaci, případně bychom znemožňovali uživateli efektivně zpracovávat zobrazované údaje. 3 Zobrazení ve smyslu vyjádření informace. 14

3 Vizualizace vícerozměrných dat 3.3.2 Zobrazování pomocí zvuku Při použití zvuku je rovněž velice důležitá otázka mapování hodnot na parametry zvuku. S tímto problémem také souvisí otázka, zda použít reálný ( přírodní ) zvuk, nebo syntetizovaný ( umělý ). Přestože pro některé případy se zdá být použití reálného zvuku výhodnější (působí známějším, méně rušivějším dojmem), pro komplexní data se ukazuje [5], že umělý zvuk umožňuje lepší rozlišení různých parametrů zvuku (na které jsou namapována zobrazovaná data). Parametry zvuku, které se nejčastěji pro mapování používají jsou: frekvence tónu, amplituda, odchylka od základního tónu, frekvence tichých míst. Takto parametrizované zvuky lze navíc skládat do stop, které je možné paralelně zobrazovat bez ztráty možnosti rozlišení jednotlivých parametrů. Při použití zvuku je nutné vyhnout se některým vlastnostem uvedených v [6]. Jedná se zejména o fyziologicko-psychické účinky zvuku na člověka. Například vysoké tóny působí rušivě a zabraňují koncentraci, monotónní (neměnný) zvuk zase vyvolává otupělost. V mnoha případech použití složitého ozvučení vzniká problém, že jeho efektivní použití vyžaduje zkušeného uživatele4. Je tedy nutné zvolit kompromis mezi velkým množstvím informací, které lze pomocí zvuku zobrazit, a mezi jednoduchostí a srozumitelností výsledného ozvučení. 3.4 Pohyb Nejčastějším použití pohybu při vizualizaci je zobrazení změny veličiny v čase. Toto použití je pro lidské chápání velmi blízké. Dobrým příkladem je pohybující se meteorologická mapa v televizním zpravodajství o počasí. Pohybující se objekt také automaticky strhává pozornost (pokud se nepohybuje celá scéna). Tohoto fyziologicky podmíněného jevu se využívá, chceme-li upoutat pozornost na důležitou část ve vizualizaci. 4 [7] uvádí příklad operátorů sonaru. Schopnost operátorů rozpoznat objekty pomocí zvuku je u zkušených operátorů mnohem větší. [8] ukazuje použití zvuku jako asistované technologie pro slepé uživatele. Uvádí, že efektivita práce zkušeného uživatele je mnohem větší, než efektivita uživatele, který tuto technologii používá poprvé. 15

4 Kvalita vizualizace 4 Kvalita vizualizace Posoudit, zda je vizualizace kvalitní, je velice nelehký úkol. Často je to obtížné i pro konkrétní případ. Obecně lze říci snad jen to, že dobrá vizualizace umožňuje uživateli rychle a bez velké námahy získat potřebnou informaci. Důležitá informace by tedy měla by vyniknout, neměla by být zastíněna ostatními a neměla by být ani vytržena z kontextu. Pokud pracujeme s mnoharozměrnými daty, snažíme se zobrazovat mnoho informací, vizualizovat vztahy mezi nimi. Mnoharozměrná data také často pocházejí z obrovských datových souborů, a pokud chceme zachovat kontext při vizualizaci, jsme nuceni zobrazovat tyto soubory celé. Ve výsledku se snažíme zachovat vizualizaci co nejjednodušší, nejpřehlednější a zároveň zobrazit co největší množství údajů. Je zřejmé, že tyto dva požadavky jsou protichůdné. Jedním z přístupů k řešení obou požadavků je podvědomá vizualizace. Na následujícím příkladu ukážeme, jakým způsobem tato technika pracuje. 4.1 Příklad Na obrázku 2 je intenzita pole znázorněna pomocí barevné škály. Pokud budeme chtít najít na tomto obrázku místo, kde je intenzita pole největší, dokonce i bez nepřítomné legendy intuitivně odhadneme, že červené šipky právě tuto oblast znázorňují. Tuto oblast jsme schopni najít velice rychle. Na obrázku 7 je intenzita vyjádřena délkou šipky. Oblast s největší intenzitou je mnohem méně patrná. Musíme podrobně prozkoumat obrázek a porovnávat délku šipek, abychom dosáhli stejného výsledku jako v předchozím případě. Vynaložíme větší čas a námahu. Obrázek 7. Vektorové pole, stejné jako v obrázku 2. Intenzita je ale zobrazována jako délka šipky. 16

5 Podvědomá vizualizace 5 Podvědomá vizualizace Výzkum5 vnímání grafických objektů ukázal, že některé základní grafické rysy zobrazených objektů jsou vnímány podvědomě Přesněji řečeno, lidský vizuální systém je schopen rozpoznat a zpracovat některé rysy na nízké úrovni bez vědomé vůle. Toto zpracování můžeme nazvat podvědomé (případně intuitivní, bezděké, automatické). O podvědomé zpracování se jedná v případech, kdy je možné provést úlohu v čase menším než 200-250 milisekund. Tato hodnota vychází z rychlosti přeostřování lidského oka [59]. Oko potřebuje přibližně 200 milisekund při přeostření z jedné části obrazu na druhou. Pokud je tedy úloha zpracována rychleji než tato mezní hodnota, není možné aby, jednotlivé části obrazu byly zpracovány sekvenčně, tj. podrobným prozkoumáním všech detailů. Pokud je obraz zpracován intuitivně, rychlost není závislá na počtu elementů, ani na velikosti obrazu. V opačném případě je tomu právě naopak, rychlost je přímoúměrná jak velikosti obrazu, tak počtu elementů. Obrázky 2 a 7 se liší v mapování intenzity pole. V jednom případě je mapována na barvu a v druhém případě na délku úsečky. V prvním případě je ale možné nalézt oblast s největší intenzitou mnohem rychleji než v druhém. Znamená to snad, že barva jako vizualizační prostředek je vhodná a délka úseček nikoliv? Které rysy mají schopnost vytvářet podvědomou vizualizaci? Pokud je navíc některý prostředek vhodnější, existuje mezi nimi hierarchie? Na první otázku odpovíme v kapitole 5.1, na druhou pak v kapitole 5.4. 5.1 Grafické rysy - features 6 Za posledních dvacet let výzkum v oblasti podvědomé vizualizace vymezil základní7 rysy, které mají tu vlastnost být vnímány podvědomě. Jedná se například o barvu, délku, chvění a pohyb. Výčet některých těchto rysů uvádíme v kapitole 5.2. Experimentálně bylo prokázáno, že je možné tyto rysy použít pro detekci přítomnosti objektů, detekci hranic (hran), sledování pohybujících se objektů a počítání objektů. 5.1.1 Příklad detekce barev Ukažme si pro názornost detekci přítomnosti objektu pomocí rysu barvy. Experiment je uveden v [3]. Účastníci experimentu mají za úkol zjistit, zda se v zobrazované datové sadě nachází, nebo nenachází objekt s danou barvou (nebo-li cílový objekt). Měří se rychlost v závislosti na velikosti datové sady a počtu barev. 5 6 7 Viz tabulka 5.2. Anglické slovo features nemá vhodný český překlad. Podle souvislostí jej v češtině můžeme chápat jako rys, vlastnost, schopnost. Abych tento termín v textu odlišil od jiného významu, vhodný překlad takto zvýrazním. Základní ve smyslu elementární. 17

5 Podvědomá vizualizace Na obrázcích 8 a 9 je uveden soubor dat se 64 objekty a s jednou necílovou barvou. Pro rys barvy se prokázalo, že je podvědomý [10, 11, 12, 13, 14, 15, 16]. Dále se ukázalo, že maximální možný počet necílových barev je cca 7 (podrobněji tento závěr rozebereme v 5.5). Pro větší počet barev docházelo k růstu potřebného času. Tato závislost na počtu barev vedla k zavedení a vymezení pojmu rušení (viz 5.3). Obrázek 8. Soubor objektů sloužící k testování detekce barevného objektu. 5.2 Obrázek 9. Soubor objektů sloužící k testování detekce barevného objektu. Objekt je přítomen. Tabulka podvědomých rysů Tabulka obsahuje jméno rysu s odkazem na literaturu, ve které byla daná vlastnost prokázána. orientace úseček [17, 18, 19, 20] délka [21] šířka [22] velikost [23] zakřivenost [24] počet [25, 26] terminátor [18] křížení [18] blízkost [42, 43] barva (sytost) [9, 10, 11, 12, 13, 14, 15, 16] 18

5 Podvědomá vizualizace 5.3 intenzita [24, 27] chvění [28] směr pohybu [29, 30] binokulání třpyt [31] stereoskopická hloubka [29] 3D depth cues [32] 3D orientace [33, 34, 35] směr světla [36] vlastnosti textury [37, 38] umělecké vlastnosti [39, 40, 41] Rušení v podvědomé vizualizaci V kapitole 4.1 jsme pro vyjádření hodnoty intenzity použili v jednom případě barvu a v druhém délku šipek. Ukázali jsme, že barva8 se chová intuitivně, zatímco délka šipky nikoliv. Nahlédneme-li ale do tabulky 5.2 zjistíme, že obě tyto vlastnosti mohou být vnímány intuitivně. Tento zdánlivý rozpor objasňuje Healey [3] a zavádí termín rušení. Rušení: jednotlivé vlastnosti (velikost, barva, tvar atd.) ztrácejí svou schopnost být vnímány podvědomě, pokud dochází k interferenci s ostatními vlastnostmi nebo se sebou samými. V případě rušení dochází ke snížení rychlosti intuitivního vnímání a pozorovatel je nucen zpracovávat informaci postupně. 5.3.1 Rušení přítomností jiného rysu Vysvětleme toto rušení pomocí následujícího experimentu [15]. Máme množinu objektů, ve které jsou dvě skupiny odlišeny rysem (v našem případě je to rys barvy a tvaru). Na základě těchto rysů se účastník testu snaží rozhodnout, jestli skupiny tvoří v množině vertikální nebo horizontální rozdělení (viz obrázek 10 a 12). Při experimentu se měří čas, za který účastník určí, zda se jedná o vertikální či horizontální rozdělení. Testujeme, jak je čas ovlivněn počtem elementů a rušením v podobě přítomnosti dalšího rysu (viz obrázek 11 a 13). 8 Barva jako podvědomá vlastnost. 19

5 Podvědomá vizualizace 5.3.2 Obrázek 10. Dvě skupiny objektů tvoří. horizontální hranici promocí rysu barvy. Obrázek 11. Dvě skupiny objektů tvoří. vertikální hranici promocí rysu barvy. V obrázku je přítomné rušení rysem tvaru. Obrázek 12. Dvě skupiny objektů tvoří vertikální hranici promocí rysu tvaru. Obrázek 13. Dvě skupiny objektů tvoří horizontální hranici promocí rysu tvaru. V obrázku je přítomné rušení rysem barvy. Rušení v rámci jednoho rysu K rušení dochází i v rámci jednoho rysu. Pro rys barvy je toto rušení vysvětleno v kapitole 5.5. Uveďme jednoduchý příklad pro rys délky [24]. Mějme množinu objektů, které jsou rozlišitelné na základně vlastnosti délky. Tyto objekty mají stejnou délku. Pokud budeme určovat, zda je v této skupině objekt, který má délku jinou (viz obrázek 14 a 15), zjistíme, že k rušení nedochází právě tehdy, když jsou délky dostatečně rozdílné. Nezáleží, zda má hledaný objekt délku větší nebo menší oproti okolním objektům. Pokud budou ale délky podobné, bude čas potřebný k rozhodnutí o přítomnosti či nepřítomnosti přímoúměrný počtu objektů. 20

5 Podvědomá vizualizace Obrázek 14. Množina objektů rozlišitelných na základě vlastnosti délky. Obrázek 15. Množina objektů rozlišitelných na základě vlastnosti délky. Velikost rušení (a tedy míra nutnosti postupného vyhledávání informace v zobrazené vizualizaci) silně závisí na podobnosti rušivého elementu a dané vlastnosti. Rušení vzniká jak mezi různými vlastnostmi (jak je uvedeno výše), tak v rámci jediné vlastnosti. 5.4 Hierarchie grafických rysů Výzkum rušení přinesl dva důležité poznatky. Rušení má postupný charakter, tzn. zvyšuje čas potřebný k prohledání obrazu postupně. Mezi jednotlivými rysy existuje hierarchie, která určuje, která z vlastností bude při rušení více ovlivněna. Podvědomé vnímání je fyziologicky9 podmíněno, a už proto je obtížné určit jeho přesné chování. Z tohoto důvodu vzniklo dokonce několik teorií, které se podvědomé vnímání snaží popsat. Nejznámější z nich jsou: Feature integration theory - teorie obsažených vlastností [23, 24, 44, 45]. Texton theory - teorie skupin vlastností textonů [47, 48]. Guided search - podporované hledání [48]. Similarity theory - teorie podobností [48, 49, 50]. Podrobný popis těchto teorií je nad rámec tohoto textu. Zájemce odkazujeme na uvedenou literaturu. Hierarchie vlastností je nejčastěji vysvětlována pomocí hierarchických map vlastností (viz obrázek 16 a 17). Mapy představují jednotlivé vlastnosti a vyhodnocení na nich probíhá paralelně. Hierarchické modely také definují interakci mezi vlastnostmi, a tím 9 Výzkum v této oblasti provádí již řadu let Grossberg viz [51]. 21

5 Podvědomá vizualizace také určují jejich hierarchii. Výše uvedené teorie se také shodují na tom, že hierarchie jednotlivých vlastností je ovlivněna okolním prostředím (tzn. je závislá na přítomných vlastnostech). Obrázek 16. Hierarchická mapa vlastností podle [23]. Obrázek převzat z [3]. Pro každou vlastnost existuje individuální mapa. Při pozorování scény se obraz zpracovává paralelně na všech mapách. V rámci jedné mapy může zpracování probíhat sériově. Pozorovatel může zkontrolovat tyto mapy během pozorování a zjistit, zda daná vlastnost neupoutala jeho pozornost. Obrázek 17. Hierarchická mapa vlastností podle Wolfa [52]. Obrázek převzat z [52]. Každá vlastnost je představována individuální mapou. Při intiutivním prohledávání se vybere ta mapa, která nejvíce zdůrazňuje rozdíly ve vizualizaci. Výběr mapy je často neintuitivní a Wolf tím vysvětluje zrychlení prohledávání u zkušeného pozorovatele. Wolf vteorii podobností [48] také mimo jiné experimentálně dokazuje, že velikost rušení v rámci jedné vlastnosti je ovlivněna dvěma parametry: podobností T-N a N-N. 22

5 Podvědomá vizualizace T-N znamená podobnost mezi cílovým a necílovým objektem, zatímco N-N vyjadřuje podobnost mezi necílovými objekty. Ukažme si tyto podobnosti na následujícím příkladu. Mějme soubor objektů, které mají různou barvu. Cílový objekt je objekt s předem danou barvou. Ostatní objekty jsou necílové. Podobnost T-N bude podobnost barvy cílového objektu a necílových. Pokud by například necílové objekty měly odstíny šedé a cílový objekt měl barvu červenou, T-N podobnost bude malá. Podobnost N-N je podobností mezi necílovými objekty. Pokud bude jejich barva opět šedá, bude N-N podobnost velká. Pro vizualizaci komplexních dat je důležité respektovat následující poznatky. Jednotlivé rysy nejsou rovnocenné, existuje mezi nimi hierarchie10, která vyjadřuje, který rys bude výraznější. Dále by měl být každý rys použit tak, aby ve vizualizaci byly podobnosti T-N a N-N minimální. 5.5 Barva Jedním z výsledků experimentu zmíněného v kapitole 5.3.1 je počet barev, které je možné ve vizualizaci použít, aby bylo stále ještě možné vnímat barevnou informaci podvědomě (experiment ukázal, že pro větší počet barev než 7 čas potřebný k nalezení cílového objektu mezi necílovými roste přímoúměrně počtu barev). Healay [3] experimentálně prokázal, že počet barev je silně závislý na jejich výběru. Jak tedy efektivně zvolit barvy? V počítačové grafice je definováno mnoho barevných prostorů11 (RGB, CMY, CMYK, HSV, HLS atd.). Tyto prostory byly vytvořené pro určité použití. Například RGB je technický prostor vhodný pro monitory a displaye, CMY-K je vhodný pro tisková zařízení. Prostory HSV a HLS jsou navrženy tak, aby umožňovaly intuitivní a snadný výběr barvy. Proto, abychom mohli zvolit soubor barev vhodný pro podvědomou vizualizaci, potřebujeme barevný prostor, ve kterém platí, že dvě vzdálené barvy (vzdálenost je definována metrikou v daném prostoru) jsou dobře rozlišitelné pro lidský vizuální systém a nebude docházet k rušení. Všechny barevné prostory uvedené v předchozím odstavci jsou tedy nevhodné, protože jejich metriky tuto podmínku nesplňují. Prostor, který byl navržen pro tento účel, se jmenuje CIE-Luv. 5.5.1 CIE 1976 Luv V roce 1976 mezinárodní komise de L`Eclairge (Commission Internationale de L`Eclairge -CIE) navrhla barevný model CIE-Luv. Tento barevný prostor je určen třemi proměnnými: L (luminance) - obsahuje informaci o světlosti, u a v - dohromady obsahují informaci o barevnosti (chrominanci). Tento prostor má rozložení barev takové, aby lépe odpovídalo subjektivnímu vnímání barev a to tak, že čím jsou dvě barvy prostoru vzdálenější, tím více jsou vnímány jako rozdílné. 10 11 Nutno dodat, že žádná z uvedených teorií vysvětlující podvědomou vizualizaci neposkytuje úplnou hierarchii pro všechny vlastnosti uvedé v kaptiole 5.2. Podrobněji o barevných prostorech viz [53]. 23

5 Podvědomá vizualizace Obrázek 18. Uniformní barevný prostor CIE 1976 Luv. V prostoru CIE Luv platí metrika definována vzorcem 1. Tato metrika umožňuje určit vizuální rozdíl, barevný kontrast mezi dvěma barvami. O prostor CIE Luv se opírají dvě teorie, které umožňují vybrat barvy vhodné pro podvědomou vizualizaci. Těmito teoriemi jsou lineární separace a barevné kategorie. 5.5.2 Vzorec vzdálenosti v CUE-Luv E = L 1 L2 u 1 u 2 v 1 v 2 2 2 2 (1) v 1=13L 1 u 1 u 0, u 1=13L1 u 1 u 0 (2) v 2=13L2 u 2 u 0, u 2=13L 2 u 2 u 0 (3) 24

5 Podvědomá vizualizace Vzdálenost dvou bodů E definovaných hodnotami [L1, u 1, v 1 ] a [L 2, u 2, v 2 ] je dána jejich relativními souřadnicemi v 1, v 2, u 1, u 2, které jsou vztaženy k bílému bodu [L 0, u 0, v 0 ]. Vzdálenost je dána vzorcem 1. 5.5.3 Lineární separace Teorie lineární separace (LS) byla poprvé uvedena v [11] a později potvrzena a posílena v [13]. LS říká, že pokud je možné v diagramu CIE-Luv (obrázek 18) barvy úsečkou, je jejich vnímaná rozdílnost větší, než když tomu tak není. LS dokumentuje obrázek 19. Obrázek zobrazuje 4 barvy (A, B, C, T) v dvourozměrném diagramu CIE-Luv (viz obrázek 18). Obrázek 19. Obrázek znázorňující lineární separaci. Barvy C, T, A jsou lineárně spearabilní, zatímco T, B, A nejsou. Písmeno T označuje barvu hledaného (cílového) objektu, zatímco písmena A, B, C představují barvy ostatních (necílových) objektů. Čas nalezení cílového objektu s barvou T je konstantní, pokud je možné oddělit tuto barvu od barev necílových objektů přímkou (body T, C, A na obrázku 19). V opačném případě (pokud není možné barvy oddělit) čas konstantní není (barvy A, B a T). 5.5.4 Barevné kategorie Další výzkum zabývající se výběrem barev vhodných z hlediska podvědomého zpracování provedl Kawai [12]. Nalezl nelinearitu ve vnímání barev z prostoru CIE-Luv. Kawai provedl experiment podobný příkladu 5.1.1. Vybral pět sad se 3, 5, 7, 9 a 11 barvami. Barvy byly vybrány z prostoru CIE-Luv. Pro tyto sady provedl následující test. Zvolil jednu barvu jako cílovou (barva cílového objektu) a ostatní jako necílové (barvy ostatních objektů). Jako cílovou barvu postupně volil všechny barvy v dané sadě. Pro dvoubarevnou sadu se jedná o stejný příklad uvedený v kapitole 5.1.1. Účastník experimentu měl za úkol určit, zda se objekt s cílovou barvou nachází v zobrazené skupině objektů. Výsledkem experimentu byl čas, za který účastník zjistil, zda se objekt ve skupině nachází nebo nenachází. 25

5 Podvědomá vizualizace Kawai dále provedl zajímavý krok. Vyznačil do grafu podprostoru CIE-Luv hranice subjektivně vnímané konstantní barevnosti a zakreslil body použité v testech. Při porovnání časů zjistil, že pokud je barva cílového objektu oddělena hranicí barevnosti (obrázek 20 body T a A), doba potřebná k rozlišení je výrazně menší, než když tomu tak není (obrázek 20 body T a B). Díky tomuto zjištění byl schopen nalézt cca 9 barev, mezi kterými nevznikalo rušení12. Obrázek 20. Barevný podprostor CIE-Luv s vyznačenými subjektivně vnímanými hranicemi barevnosti. Osy g a j jsou osy u a v obrázku 18 při zvolené hodnotě L. 5.5.5 Závěr Maximálního početu barev, které se nebudou navzájem vizuálně rušit. můžeme dosáhnout, pokud vybereme barvy pomocí některých z následujících pravidel: barevná vzdálenost: eukleidovská vzdálenost definovaná 1, lineární separace: možnost oddělit cílové a necílové barvy v barevném prostoru přímkou, barevné kategorie: barvy cílových i necílových objektů jsou rovnoměrně rozmístěny v oblastech vymezených barevnými hranicemi. Pokud by bylo větší množství barev umístěno jen do některé oblasti, objekty s těmito barvami by bylo možné hůře odlišit. 5.6 Pohyb Pohyb je po barvě další výrazně vnímatelnou vlastností. Jak už jsme uvedli v úvodu, pohyb se nejčastěji ve vizualizaci používá pro zobrazení časově proměnných systémů nebo pro zvýraznění změn v datech. Rysy spojené s pohybem jsou kmitání (chvění, pulsování) a směr pohybu. 12 Rušení je popsáno v kapitole 5.3.1. 26

5 Podvědomá vizualizace 5.6.1 Kmitání Výzkum kmitání jako podvědomý rys provedl Brown [65]. Zjistil, že lidský vizuální systém reaguje na kmitání velice citlivě. Pokud je na objekt zaostřeno oko, vnímatelná změna frekvence kmitání je 2-5 %. V případě že je kmitající objekt v oblasti periferního vidění, vnímatelná změna frekvence je 100 % a více. 5.6.2 Směrový pohyb Vnímání směrovosti pohybu je dobře rozpracováno v [3] a [54]. Uvedeme zde jen závěry. Ve skupině zobrazovaných objektů lze pomocí směrového pohybu snadno vymezit podskupiny, ve kterých je vyhledávání pomocí jiných rysů rychlejší [55]. Rychlost a výraznost vnímání je silně závislá na rychlosti pohybu. Pro rychleji pohybující se objekty je doba potřebná pro detekci menší [56, 57]. 27

6 Burza 6 Burza Obchodování na burze je jedna z oblastí lidské činnosti, která produkuje velké objemy dat. Protože se navíc o každém obchodu eviduje velmi mnoho údajů, jsou záznamy o obchodech na burze typickým příkladem komplexních informací. Vytvořme tedy program, který bude vizualizovat burzovní data pomocí postupů uvedených v kapitole 5. V kapitole 6.1 vysvětlíme účel a cíle této vizualizace. V další kapitole uvedeme pro srovnání vizualizační programy, které se také zabývají burzovními daty. V kapitole 6.3 vysvětlíme, s jakými daty pracujeme, definujeme jejich strukturu a význam. Kapitoly 6.4 a 6.5 podrobně popíšeme dvě vizualizace, které jsme pomocí metod podvědomé vizualizace vytvořili. 6.1 Úvod Cílem této vizualizace je zobrazit aktuální obchodování na burze. Pomocí vhodných vizualizačních metod se snažíme zobrazit dynamiku vývoje, objem obchodu a volatilitu13 celé burzy. Vizualizace si klade za cíl umožnit analýzu stavu celé burzy a umožnit uživateli získat konkrétní statistické informace o burze. Cílem není poskytnou analytický nástroj pro konkrétní akcie nebo části trhu, ale analytický nástroj zaměřený na stav Burzy14. Přestože je možné výše uvedené informace vyjádřit i pomocí statisticky získaných čísel, věříme, že stejná informace získaná pozorováním celé burzy má díky zobrazovanému kontextu větší informační hodnotu. 6.2 Současná řešení Vizualizace burzovních dat je jednou z velice běžných vizualizací. S některým druhem vizualizace se můžeme setkat na každé stránce burz cenných papírů15, případně při každé televizní relaci s informacemi o finančním trhu. Nejčastěji se jedná o formu dvourozměrného grafu, který zobrazuje časový vývoj několika16 akcií, nebo časový vývoj indexu(ů)17. Kromě těchto jednoduchých vizualizací je dostupná celá řada specializovaných řešení a to nejen z oblasti finančnictví, ale i z oblasti umění. Finanční programy, se snaží přehledně zobrazit informaci o velkém počtu objektů (tj. akcií, komodit, případně i celých průmyslových odvětví). Jejich cílem je prezentovat informaci, která usnadní manažerská a finanční rozhodnutí. Programy z umělecké sféry se většinou zaměřují na prezentaci burzovních domů, které sponzorují jejich vývoj. 13 14 15 16 17 Viz Slovník pojmů. Slovo burza je zde myšleno jako konkrétní burzovní dům (např. burza NYSE, London Stock Exchange nebo Burza cenných papírů Praha). Viz např http://www.bcpp.cz/ nebo http://www.nyse.com/. Často jedné jediné akcie. Index je číslo, které se snaží charakterizovat burzu (nebo její část) jako celek. Například pro Burzu cenný papírů Praha je to index PX50. 28

6 Burza 6.2.1 Příklad ProClarity Domovská stránka projektu: http://www.proclarity.com/ Řešení z oblasti finanční analýzy, které je určeno jako efektivní pomůcka pro finanční analytiky. Jedná se o velice komplexní řešení v tzv. enterprise 18 sféře. Aplikace nabízí komplexní analýzu dat, výstupy ve formě grafů (obrázek 22), tabulek, případně dvoudimenzionálních vizualizací (obrázek 21). Vizuální výstup aplikace je demonstrován na obrázku 21 a 22. Obrázek 21. Výstup z programu ProClarity - přehled sledovaných odvětví pro finanční analýzu. Obrázek 22. Výstup z programu ProClarity - detailnější přehled několika akcí s informacemi o pohybu jejich cen. 18 Jedná se o marketingový termín, který se používá ve smyslu velký případně významný (např. enterprise zákazník, enterprise řešení atd.). 29

6 Burza 6.2.2 Příklad Market Map Domovská stránka projektu: http://www.smartmoney.com/marketmap/ Opět se jedná o řešení z oblasti finančního trhu. Program Market Map zobrazuje na běžné webové stránce informace o vývoji akcií a segmentech trhu. Vizuální výstup demonstruje obrázek 23. Obrázek 23. Program Market Map. Přehled vývoje trhu akcií je zobrazen jako dvojrozměrný strom. Uzly stromu jsou kategorie, listy jednotlivé akcie. V pravé části obrázku vidíme ovládací panel sloužící k přizpůsobení vizualizace. 6.2.3 Příklad Stock Market Planetarium Domovská stránka projektu: http://www.blackshoals.net/ Projekt Stock Market Planetarium vznikl jako umělecký projekt pro London Stock Exchange19. Akcie jsou zobrazovány jako hvězdy na noční obloze. Podle vývoje cen (respektive dle podobnosti tohoto vývoje) se akcie sdružují do souhvězdí. Součástí vizualizace jsou také objekty s umělou inteligencí, které vznikají, vyvíjejí se a zanikají vlivem cenových změn. Tento projekt nemá svou velikostí obdoby, podílely se na něm stovky odborníků a vědců z oborů finančnictví, počítačové grafiky a umělé inteligence. Více viz domovská stránka projektu. Vizuální výstup aplikace demonstrují obrázky 24, 25 a 26. 19 Volný překlad: Londýnská burza cenných papírů. 30

6 Burza Obrázek 24. Obrázek z projektu Stock Market Planetarium. Akcie tvoří souhvězdí podle podobnosti vývoje cen. Obrázek 25. Obrázek z projektu Stock Market Planetarium. Kolem akcií, které se aktivně vyvíjí, vznikají objekty s umělou inteligencí - AI (z anglického Artificial Inteligence). 31

6 Burza Obr. 26. Obrázek z projektu Stock Market Planetarium. Celkový pohled na vizualizaci, která je promítána na sférickou plochu (strop planetária). Jasně zářící objekty (hvězdy) jsou aktivní akcie. Změny stavu akcií na burze jsou promítány v reálném čase. 6.3 Data Jako zdroj dat jsme použili burzu NYSE20. Jedná se o velmi velkou burzu a její data jsou pro nekomerční účely dostupná zdarma. Data získaná z NYSE obsahují 4-rozměrný vektor informací o pohybu každé z cca 3000 akcí. Jedná se o rozsáhlý soubor dat, například Burza cenných papírů Praha21 eviduje jen cca 8 akcí22 v systému SPAD23. NYSE poskytuje informace o akciích v následujícím tvaru: Name A. O. Smith Corporation Symbol Last Trade AOS 52.77 Volume Change [$] % Change [%] [$] 183 600 0.21-0.40 Name - jméno společnosti. Symbol - jméno pod kterým je akcie evidována, je jedinečné v rámci NYSE burzy. 20 21 22 23 Viz Slovník pojmů. http://www.bcpp.cz/ Jsou to všechny aktivní akcie na českém trhu. Viz Slovník pojmů. 32

6 Burza Last Trade - nebo-li Price. Jedná se o cenu posledního obchodu dané akcie v bodech (které jsou vázány na dolar). Vyjadřuje virtuální zájem o danou akcii. Volume - množství (objem) uzavřených obchodů s danou akcií. Vyjadřuje skutečný zájem o danou akcii. Tento objem je vztažen k průměrné hodnotě za jeden den, která je vypočtena z dlouhodobého průměru. Change - změna hodnoty akcie. Zachycuje pohyb ceny, dynamiku akcie. Je to změna vůči hodnotě price v době zavření burzy předešlý den. Hodnota je v bodech, které jsou vázány na dolar. %Change - procentuální změna hodnoty Change oproti hodnotě Change v době uzavření burzy předchozí den. Vyjadřuje poměrnou změnu, dynamiku růstu/poklesu akcie. V dalším textu budeme na tyto položky často odkazovat a pro přehlednost je budeme psát velkými písmeny: VOLUME, PRICE, CHANGE, %CHANGE. Data jsou poskytována s 20-ti minutovým zpožděním oproti místnímu času24 na webových stránkách NYSE. Součástí projektu je aplikace, která v pravidelných intervalech stahuje tyto data a ukládá je do textového souboru. Další program pak tyto informace filtruje a převádí do formátu, se kterým pracuje samotná vizualizace. Ideálním (a vizualizačním programem podporovaným) řešením by byl přímý25 přístup k datům a jejich vizualizace v reálném čase. Takový přístup by vyžadoval smlouvu s NYSE, která je nad rámec tohoto projektu. Pro představu o rozložení hodnot jsme provedli statistickou analýzu26 dat27. Výsledky této analýzy jsou uvedeny v 6.3.1, 6.3.2, 6.3.3 a 6.3.4. 6.3.1 Tabulka VOLUME Průměrná hodnota: 81,026 bodů Maximální hodnota: 89 900 bodů Procentuální zastoupení hodnoty VOLUME v datech z NYSE ve vybraných intervalech: 6.3.2 Interval [počet] <0-5> <0-10> <0-50> <0-100> Četnost [%] 6,13 11,70 80,90 97,40 Tabulka PRICE Průměrná hodnota: 524 119 bodů Maximální hodnota: 21 257 800 bodů 24 25 26 27 Čas je udáván v ET časovému pásmu (viz slovník pojmů). Přímý ve smyslu on-line. Skriptový program provádějící tuto analýzu je součástí CDROM spolu s programem. Analýza byla provedena na datech v souboru 060328_Sorted.bur, tento soubor obsahuje záznam 6-ti hodinového vývoje cen akcií ze dne 28.3. 2006. Interval aktualizace byl 5 minut. Jedná se o cca 250 000 položek. Soubor se nalézá na CDROM spolu s programem. 33

6 Burza Procentuální zastoupení hodnoty PRICE v datech z NYSE ve vybraných intervalech: Interval [počet] Četnost [%] 6.3.3 <0-100> <0-500> <0-1000> <0-5000> <0-10000> <0-50000> <0-100000> 4,46 8,30 10,66 19,3 24,6 40,46 87,21 Tabulka CHANGE Hodnoty CHANGE nabývají kladných i záporných hodnot, protože ale tyto hodnoty používáme buď v absolutní hodnotě, nebo symetricky podle 0, je statistika vytvořena pomocí absolutních hodnot CHANGE. Průměrná hodnota: 0,000170887 bodu Maximální hodnota: 100 bodů Procentuální zastoupení hodnoty CHANGE v datech z NYSE ve vybraných intervalech: Interval [počet] Četnost [%] 6.3.4 <0-0,01> <0-0.05> <0-0,07> <0-0.1> <0-0,2> <0-0,4> <0-1> <0-5> 8,63 26,23 33,99 42,59 60,95 79,43 94,71 99,55 Tabulka %CHANGE Hodnoty %CHANGE nabývají kladných i záporných hodnot, protože ale tyto hodnoty používáme buď v absolutní hodnotě, nebo symetricky podle 0, je statistika vytvořena pomocí absolutních hodnot %CHANGE. Průměrná hodnota: 0,03622851 Maximální hodnota: 21,895% Procentuální zastoupení hodnoty %CHANGE v datech z NYSE ve vybraných intervalech: Interval [počet] Četnost [%] 6.4 <0-0,01> <0-0.05> <0-0,1> <0-0.2> <0-0,5> <0-1> <0-2> <0-5> 8,58 12,35 17,77 50,2 60,95 72,74 91,29 99,24 Koule První ze dvou vizualizací pracujících s daty z NYSE jsme pojmenovali Koule. Rozhodli jsme se zobrazovat každou akcii jako samostatný grafický element a globální hodnoty burzy (celkový objem obchodu, volatilita apod.) vyjádříme díky vhodným grafickým vlastnostem těchto elementů. Akcie je v této vizualizaci představována sférou umístěnou v trojrozměrném prostoru, na kterou jsou mapovány informace o akcii. Sféry tvoří 26-ti ramennou hvězdu, jejíž ramena jsou spirálovitě zakřivena (obrázek 27). 34

6 Burza Sféra, jako základní grafická primitiva, byla vybrána proto, že ani při velkém počtu zobrazovaných prvků28 nepůsobí rušivě a v trojrozměrném prostoru nabízí z každého směru stejný pohled (a poskytuje tedy stejnou informaci). Jednotlivé hodnoty akcií (VOLUME, PRICE, CHANGE %CHANGE) jsou mapovány na vizuální a zvukové vlastnosti jako poloha v prostoru, velikost, barva, pulsování a zvuk. Tato mapování popíšeme v samostatných kapitolách. Obrázek 27. Vizualizace Koule. Akcie obchodované v NYSE jsou zobrazovány jako koule v trojrozměrném prostoru, umístěné na spirálovitě zakřivené hvězdici. 6.4.1 Velikost sféry Velikost sféry vyjadřuje hodnotu PRICE, která představuje virtuální29 zájem o akcii. Velikost sféry je možné pouhým pohledem porovnat s ostatními, a získat tak hrubou informaci o velikosti akcie vzhledem k ostatním. Velké množství sfér tvoří ve vizualizaci masu, která zobrazuje celkový zájem o akcie obchodované na burze. Velikost sféry je dána vzorcem 4 d= k PRICE 1000 (4) d průměr (diametr) k uživatelsky nastavitelná konstanta Hodnota 1000 je experimentální konstanta odvozená ze statistické analýzy dat (viz 6.3.2.) Velikostní poměr hodnot PRICE demonstruje obrázek 28. 28 29 Vizualizujeme řádově tisíce akcií. Finanční termín je: spekulativní. 35

6 Burza Obrázek 28. Vizualizace Koule. Tento obrázek demonstruje škálu hodnot PRICE, které jsou mapovány jako velikost sféry. 6.4.2 Poloha sféry v prostoru Polohu určuje hodnota VOLUME, ta představuje skutečný zájem o danou akcii, proto je tato hodnota vyjádřena jako vzdálenost od středu spirály. A to takovým způsobem, že čím větší hodnota VOLUME, tím blíže ke středu je sféra umístěna. Díky tomuto mapování30 jsou akcie, které se hodně obchodují a jsou důležité, umístěny ve středu vizualizace, a tedy v centru pozornosti. Data jsou zobrazena jako 26-ti ramenná hvězdice. Rozdělení do jednotlivých ramen je prováděno dle počátečního písmena akcie (jedno z 26 písmen abecedy). Toto rozdělení je motivováno několika důvody: Jména firem jsou někdy volena s ohledem na psychologický efekt. Jméno by mělo být snadno zapamatovatelné a mělo by utkvět. S rozvojem internetu a různých vyhledávacích seznamů nabývá na důležitosti jiný psychologický efekt, a sice pořadí v seznamu. Motivace je následující, firma která, je na předním místě v seznamu (které jsou v drtivé většině řazeny dle abecedy), má výhodu, protože klient procházející tímto seznamem narazí na její jméno dříve než na jména případné konkurence. Ve vizualizaci jsme se tedy rozhodli poslední jmenovanou skutečnost znázornit, jednotlivá ramena spirály jsou tvořena akciemi se stejným počátečním písmenem. Rozdělení do několika ramen umožňuje vytvořit ve velkém množství zobrazovaných dat oblasti, jejichž vývoj je snazší sledovat. Prostor scény je efektivněji využit a zároveň je vizualizace přehlednější. Data jsou získávána po dávkách. Jedna dávka obsahuje aktualizaci dat pro akcie se společným prvním písmenem. Přesný matematický vztah pro výpočet polohy akcie dle hodnoty VOLUME je uveden v 6.4.3. 30 Mapováním se rozumí vyjádření hodnoty VOLUME jako vzdálenosti. 36

6 Burza 6.4.3 Vzorec poloha K VOLUME (5) x =K u cos J u (6) y =0 (7) y= log x 2 +y 2 (8) z =K u sin J u (9) u= Poloha sféry v prostoru je dána bodem X =[x, y, z ], který je středem této sféry. Konstanty K a J vycházejí ze statistické analýzy zpracovávaných dat31. Tyto konstanty je možné měnit, umožňují nastavit šířku a zakřivení spirály, a tím dle velikosti zobrazované oblasti měnit úroveň detailů. Maximální hodnota VOLUME se v testovacích datech pohybovala kolem 90 000, přesto ale 97 % akcií má tuto hodnotu menší než 100. Pomocí převrácené hodnoty odmocniny z VOLUME (2) dosáhneme změny škály hodnot do rozsahu vhodného pro vizualizaci. Základní hodnotou pro osu y je konstanta (7). Je to z důvodu větší přehlednosti (nedochází k vizuálnímu rušení). Velikost koule je pak díky tomu mnohem lépe vnímatelná právě v ose Y. Protože je do prostoru kolem středu soustředěno velké množství koulí (v závislosti na uživatelských parametrech K a J),vizualizace umožňuje polohu v ose y definovat jako konstantu závislou na x a z (8). Tuto funkci demonstruje obrázek 29. Obrázek 29. Vizualizace Koule. Poloha v ose Y je logaritmická funkce vzdálenosti od středu. Tak je 31 Viz 6.3.1. 37

6 Burza možné do středu vizualizace, a tedy do středu zájmu, umístit větší množství objektů bez ztráty přehlednosti. 6.4.4 Barva Barva sféry je určená hodnotou CHANGE. V této vizualizaci byla barva zvolena jako prostředek pro vizuální odlišení jednotlivých akcií. S ohledem na výsledky kapitoly 5.5 bylo nutné použít omezený počet barev. Vytvořili jsme tedy intervaly hodnoty CHANGE a každému intervalu jsme přiřadili jednu barvu. Intervaly byly určeny pomocí statistické analýzy dat provedené v 6.3.3, jsou definovány obrázkem 30. Obrázek 30. Statisticky získané intervaly hodnoty CHANGE. Číslo u každého intervalu se shoduje s číslem barev v obrázku 31. Procento u čísla intervalu vyjadřuje, kolik procent akcií měla hodnota CHANGE v daném intervalu ve zkušebních datech. Protože hodnoty CHANGE mohou nabývat i záporných hodnot, vybrali jsme pět barev pro záporné hodnoty (intervaly označené na obrázku 30 čísly 1-5), jednu barvu pro hodnoty blízké nule (interval 6) a pět barev pro kladné hodnoty (intervaly 7-11). V prvním kroku jsme intuitivně odhadli 5 záporných a 5 kladných barev. Pro ně jsme pomocí vzorce 1 sestavili tabulku barevných vzdáleností 6.4.5. Pomocí této tabulky jsme odstíny zvolených barev upravili tak, abychom maximalizovali minimální vzdálenosti mezi barvami. Výsledné barvy s číslem intervalu jsou uvedeny na obrázku 31. Obrázek 31. Barvy intervalů (viz obrázek 30) a jejich hodnoty RGB, které byly vypočteny pro vizualizaci KOULE. 38

6 Burza 6.4.5 Tabulka barevné vzdálenosti Tabulka zachycuje barevné vzdálenosti všech barev z obrázku 3132. Tabulka je symetrická podle diagonály. V prvním sloupci je číslo barvy odpovídající číslu na obrázku 31. V každém řádku jsou uvedeny vzdálenosti ke všem ostatním barvám. Posledním sloupec obsahuje nejmenší z těchto vzdáleností. 6.4.6 Frekvence pulsování Frekvence pulsování sféry zobrazuje hodnotu %CHANGE. Tato hodnota vyjadřuje dynamičnost vývoje akcie. Stejně jako hodnota CHANGE nabývá i %CHANGE záporných hodnot, my jsme se ale v naší vizualizaci rozhodli vizualizovat dynamičnost akcie bez ohledu na směr vývoje, a proto znaménko záměrně zanedbáme. Podle výsledků kapitoly 5.6.1 musí být rozdíl frekvence kmitání dvou objektů s rozdílnou hodnotou %CHANGE alespoň 100 % a více33. Pomocí tohoto závěru a statistické analýzy 6.3.4 jsme vytvořili intervaly hodnoty %CHANGE a přiřadili jim frekvence. Velká změna hodnoty %CHANGE je představována rychle pulsující sférou, tedy velkou frekvencí pulsování. Obrázek 32. Intervaly hodnoty %CHANGE a jim přiřazené frekvence pulsování. Procentuální číslo u každého intervalu znamená, kolik procent akcií spadá dle hodnoty %CHANGE do kterého intervalu. Hodnoty frekvencí pulsování byly zvoleny s ohledem na technické možnosti vizualizačních nástrojů a na základě subjektivního dojmu. Intervaly a jim přiřazené frekvence jsou uvedeny na obrázku 32. 32 33 Čísla v prvním řádku a v prvním sloupci odpovídají číslům barev z obrázku 31. V případě že se objekt nachází v oblasti vizualizace vnímané periferním viděním. V případě oblasti na kterou je oko zaostřeno je to 2-5 %. 39

6 Burza 6.4.7 Zvuk Zvuk jsme se v této vizualizaci rozhodli použít k vyjádření míry nestálosti, nebo-li volatility34. Volatilita se používá k analytickým odhadům vývoje cen akcií. Protože vizualizujeme tisíce akcií najednou, používáme zvuk k vyjádření volatilitu celé burzy a ne jednotlivých akcií. Tento přístup je také v souladu s cílem vizualizace, tedy vizualizovat vlastnosti burzy jako celku pomocí jednotlivých akcií. Celkovou volatilitu burzy získáme součtem hodnot %CHANGE všech akcií. Protože nás zajímá velikost růstu cen, záměrně zanedbáváme směr tohoto růstu. Hodnoty %CHANGE sčítáme jako absolutní hodnoty a informaci, zda akcie v ceně klesá či stoupá nebereme v potaz. Výsledkem této analýzy dat je seznam intervalů, který říká, kolik akcií s danou hodnotou %CHANGE je v daném okamžiku přítomno na burze. Tyto intervaly jsou vztaženy k celkovému počtu akcií, přičemž součet všech intervalů je samozřejmě roven 100 %. Ozvučení vizualizace je tvořena 10 zvukovými soubory (dále jen zvuky), které jsou přehrávány najednou. Každý zvuk je přiřazen jednomu intervalu a jeho hlasitost určuje právě hodnota tohoto intervalu. Zvuky byly vytvořeny pomocí FM-zvukové syntézy35 tak, aby co nejvíce odrážely velikost intervalu, který zobrazují. 6.4.8 Galerie V této kapitole uvedeme několik komentovaných obrázků z výsledné vizualizace. Obrázek 33. Vizualizace Koule. Pohled na vizualizaci shora dává představu o rozložení akcií dle abecedy (každé rameno tvoří akcie začínající stejným písmenem). 34 35 Obrázek 34. Vizualizace Koule. Velikost sfér je možné nastavit pomocí ovládacího panelu. Větší sféry jsou názornější pro porovnání velikosti akcií mezi sebou. Podle barevné škály na obrázku 31 je možné určit velikost změny ceny akcie (hodnota CHANGE). Viz Slovník pojmů. Jedná se o skládání čistých tónů. Pro použité vzorky byl použit sinusový tvar tónu s frekvencí 340-800 Hz. U zvuků představujících vysoké hodnoty volatility byly navíc použity zvukové filtry. Ty lokálně modifikují amplitudu pro dosažení zvukového efektu vyvolávajícího pozornost. 40

6 Burza 6.4.9 Obrázek 35. Vizualizace Koule. Oddálení vizualizace od pozorovatele způsobí vyniknutí velkých hodnot PRICE. Oddálení tak funguje jako filtr36 hodnoty PRICE. Obrázek 36. Vizualizace Koule. Po přiblížení (a zvětšení) vizualizace jsou výraznější jiné hodnoty PRICE. Další příklad filtrování hodnot. Obrázek 37. Vizualizace Koule. Použití logaritmické funkce pro ovlivnění polohy v ose y rozšiřuje prostor pro zobrazení v místě středu, kde je největší koncetrace zobrazených sfér. Díky tomu je možné akcie oddálit od sebe a zvýšit přehlednost vizualizace. Obrázek 38. Vizualizace Koule. Tento obrázek demonstruje situaci, kdy jedna akcie (Pfizer Inc. PFE) v použitých datech dosáhla hodnoty PRICE řádově 1000x větší než jakákoliv jiná akcie37. Ve vizualizaci se zobrazila jako sféra, uvnitř které jsou všechny ostatní akcie. Zobrazená situace je stejná jako na obrázku 28. Závěr Projekt Koule přinesl z vizualizačního hlediska mnoho zajímavých poznatků. Důsledná práce s výběrem barev způsobila, že i při zobrazení velkého počtu objektů můžeme od sebe odlišit jednotlivé objekty (sféry představující akcie), a vnímat tak i jednotlivé akcie. Přesto by bylo možné výběr barev ještě vylepšit. V současném stavu totiž nelze vizuálně odlišit dvě akcie s hodnotami CHANGE spadajícími do stejného 36 37 Ve smyslu filtrování informací zavedeného v bodě 3 Členění procesu práce s daty. Datový soubor použitý pro vytvoření galerie pochází ze dne 28.3.2006. Obsahuje cca 6 hodin (přesně od 11:49 16:11 středoevropského času) vývoje akcií na burze. Interval aktualizace je 5 minut. Akcie PFE měla hodnotu PRICE 21,257,800 po celou dobu 6 hodin. 41

6 Burza intervalu. Pokud bychom snížili počet intervalů (např na 5), mohli bychom pro výběr barev použít postup popsaný v kapitole 5.5.4, tedy Barevné kategorie. Bylo by pak možné v rámci jednoho intervalu měnit odstín barev plynule a zároveň bychom měli jistotu, že barvy v různých intervalech budou velice dobře rozlišitelné. Použití škálovaného pulsování způsobilo, že je možné při pozorování určit shluky podobně pulsujících akcií a získat tak oblasti, ve kterých jsou akcie s intenzivním vývojem ceny. Mnoho ovládacích prvku38 také umožňuje filtrovat zobrazované informace. Filtrování je pojato globálně. Znamená to, že není možné odstranit konkrétní část akcií, například podle hodnoty (což je běžný přístup finančních analytických programů), ale dovoluje ovlivnit parametry vztahující se na všechny akcie. Například velikost sféry, která představuje akcii, je uživatelsky ovlivnitelná. Při detailním zobrazení sféry (viz obrázek 34) umožníme lépe zobrazit rozdíl mezi velikostmi hodnoty PRICE jednotlivých akcií. Pro malé sféry je možné lépe odhadnout rozprostření hodnot akcií (viz obrázek 33). Přestože si vizualizace kladla za cíl poskytovat analytické informace, rozhodně není v této podobě použitelná jako analytický nástroj pro finanční odborníky. Toto je oblast pro další vývoj této aplikace. Některé nejvíce chybějící schopnosti jsou: zvýraznění a sledování vývoje konkrétních akcií v kontextu s ostatními, identifikace na požádání39. Vizualizace je také poměrně náročná, protože provádí statistické výpočty nad velkým počtem dat a zobrazuje značné množství objektů, které jsou modifikovány v reálném čase. Vyžaduje poměrně silný počítač40 ke svému běhu. Tato náročnost je zohledněna některými ovládacími prvky, které umožní zmenšit počet detailů, které je nutno zobrazovat. Vizualizace Koule rovněž odhalila problém s podobností akcií. Protože velmi mnoho akcií má podobné, nebo i shodné hodnoty, zobrazují se do stejného místa, případně i jako identicky barevné, stejně veliké sféry. Tento problém částečně řeší přeškálovaní hodnot41 a použití průhlednosti, která umožňuje zobrazit ty sféry, které se zakrývají. Navržený způsob vizualizace také nedostatečně zobrazuje historii vývoje. Vizualizace velmi dobře zobrazuje aktuální stav burzy v kontextu vývoje všech akcií. Při pozorování je ale patrný vývoj jen z předešlého stavu, hlubší minulost není vizualizace schopna zobrazit. Pokusy se zobrazením starších stavů pomocí postupného blednutí42, zamlžení, vedly k velké nepřehlednosti scény. Tento problém se pokusila vyřešit vizualizace Plocha v kapitole 6.5. 38 39 40 41 42 Viz kapitola 7.3. Tato vlastnost by mohla být implementována jako metoda DOD (detaily na požádání). Uveďme že v době tvorby této vizualizace (tj. konec roku 2005) je nově zakoupený průměrný počítač (tj počítač s taktem procesoru 2GHz, 1GB paměti a průměrnou akcelerovanou grafickou kartou) plně dostačující pro běh naší vizualizace. Například odmocnina ve vzorci 5, případně použití vzorce 8 místo 7. Běžná technika použitá pro zobrazení historie, objekt představující předešlý stav zůstane ve scéně zachován, změní se jen barva, případně se objekt stane průsvitným. 42

6 Burza 6.5 Plocha Vizualizační projekt Plocha navazuje na předchozí projekt Koule. Jeho cílem je pokusit se vyřešit některé principiální problémy vizualizace Koule. Zejména pak problém vizualizování akcií s velmi podobnými hodnotami a problém zachycení historie vývoje burzovního systému. Protože Plocha navazuje na vizualizaci Koule a záměrně zachází s některými hodnotami akcií stejně, popíšeme zde zejména rozdílné přístupy. Jedná se o kapitolu 6.5.2 Deformace a hlavně pak o kapitolu 6.5.3 Druhy vizualizace. Plocha se stejně jako vizualizace Koule zaměřuje na analýzu burzovních dat jako celku. Rozhodli jsme se v této vizualizaci více zdůraznit celkové hodnoty, a proto jsme ještě více potlačili konkrétní akcie. Akcie nejsou již představovány jednotlivými elementy, ale vytvářejí jednu plochu, která představuje celkový obchod burzy. Akcie na této ploše vytvářejí deformace jejichž výška, šířka, tvar a barva43 jsou určeny parametry akcií. Tvar povrchu plochy odpovídá aktuálnímu dění burzy. Použitím plochy ve vizualizaci chceme zdůraznit Burzu44 jako ucelený systém, jehož stav je dán jednotlivými obchody. Názornou představu o vizualizaci Plocha si čtenář může udělat z obrázků 39 a 40. Obrázek 39. Vizualizace Plocha. Velká deformace, zasahující celou scénu, je akcie popsaná v komentáři obrázku 38. 6.5.1 Obrázek 40. Vizualizace Plocha. Velikost deformací zobrazuje hodnotu CHANGE. Dobře patrné jsou kladné i záporné hodnoty. Poloha deformace Pro každou akcii program vypočítá polohu (bod) na ploše. Tato poloha je vypočítána stejným způsobem jako poloha sféry ve vizualizaci Koule (kapitola 6.4.2). Díky tomu poskytují obě vizualizace částečně porovnatelné výsledky. Polohu deformací dokládá obrázek 41. 43 44 Tvar této deformace je sinusový vrchlík. Slovo burza je zde myšleno jako konkrétní burzovní dům (např. burza NYSE, London Stock Exchange nebo Burza cenných papírů Praha). 43

6 Burza Obrázek 41. Vizualizace Plocha používá pro výpočet polohy deformací stejný postup jako vizualizace Koule kapitola 6.4.2. Proto jsou výsledky těchto vizualizací porovnatelné (viz obrázek 33). 6.5.2 Deformace Deformace plochy odpovídá hodnotám PRICE, CHANGE a %CHANGE. Tyto hodnoty modifikují tvar a barvu v určité oblasti této plochy. Předchozí odstavec popisuje jak získat bod v prostoru. V tomto bodě plochu deformujeme tak, že postupně přičítáme (nebo odečítáme) od stávající výškové hodnoty plochy, hodnotu CHANGE. Děje se tak na kruhové ploše vymezené hodnotou PRICE. Tento postup si také můžeme představit tak, že do plochy vtiskneme zespodu (kladné hodnoty CHANGE) nebo shora (záporné hodnoty CHANGE) sinusový vrchlík. Obrysem tohoto vrchlíku je křivka odpovídající funkci cosinus v intervalu,. Přesná výška vrchlíku je definována vzorcem 10. Plocha (podstava) vrchlíku je vymezena kruhem o poloměru PRICE. x x z z výška=0,02 CHANGE cos 2 0 PRICE 0 2 (10) Výška v bodě X =[ x, y ] kruhové plochy poloměru PRICE se středem v bodě X 0 =[ x 0, y 0 ]. Konstanta 0,2 byla získána analýzou hodnoty CHANGE provedenou v kapitole 6.3.3 Tvarovou deformaci znázorňuje obrázek 42. Výsledným efektem tohoto postupu je, že akcie kterým se výrazně změnila hodnota (tzn. PRICE vyvolá změnu CHANGE), vytvoří na ploše vysoké vrcholy, a akcie které se obchodovali za velkou hodnotu (PRICE), tvoří šířku základny těchto vrcholů. Podle míry deformace (šířky základny) pak můžeme určit cenu obchodů. Výška vrcholů je ovlivněna hodnotou CHANGE a proto dle výšky jednotlivých deformací můžeme určit jak aktivní akcie je (tzn. jak mění svou hodnotu). Špičatost navíc signalizuje nestálost, která odpovídá tomu, že velmi aktivní akcie mohou rychle měnit směr svého růstu. Poloha akcie je definována v předchozí kapitole tak že, akcie s velkým objemem 44

6 Burza obchodu jsou blíže ve středu. Díky tomu je možné porovnávat stejně velké deformace (hodnoty akcie), které jsou různě vzdálené od středu. Barevná deformace se aplikuje podobně jako tvarová. Kruhová oblast se ztmavuje/zesvětluje tak, že ve středu deformace je barevná změna nejvyšší a k okraji plynule klesá. Barvu každého bodu plochy definují čtyři složky barevného modelu RGBA45. Jsou to: r - (red) červená, g - (green) zelená, b - (blue) modrá, a - (alpha) průhlednost. Barevné složky r, g, b jsou modifikovány dle vzorce 11. Pokud uživatel nastaví průhlednost (kapitola.7.4), modifikuje se stejným způsobem i hodnota průhlednosti a. Ze vzorce 11 je zřejmé, že pokud je hodnota %CHANGE kladná, barva povrchu bude tmavší, v opačném případě světlejší. x x z z 2 r / g /b/ a=0,1 % CHANGE cos 0 2 (11) 0 PRICE Barva v bodě X =[ x, y ] kruhové plochy poloměru PRICE se středem v bodě X 0 =[ x 0, y 0 ]. Konstanta 0,1 byla získána analýzou hodnoty %CHANGE provedenou v kapitole 6.3.4. Hodnoty r,g,b,a znamenají čtyři složky barvy, červenou, zelenou, modrou a průhlednost. I tento postup znázorňuje obrázek 42. Obrázek 42.Vizualizace Plocha. Testovací obrázek tvarových a barevných deformací. Deformační kužele mají obrys funkce cosinus v intervalu,. Výsledný efekt postupného obarvení pomáhá efektivnímu zobrazení hodnoty %CHANGE. Oblasti s velmi velkými (vysokými i nízkými) hodnotami se ztmaví (případně zesvětlí). 45 Více o barevném modelu RGBA viz [4] kapitola 1.2 Barevné prostory. 45

6 Burza Navíc tento způsob umožní zobrazit historii vývoje hodnoty CHANGE. Pokud nějaká akcie vykazuje trvalý růst své ceny, má kladnou hodnotu CHANGE. Ve vizualizaci se tato skutečnost projeví kopečkem. Pokud ale akcie roste druhý den46 pomaleji, bude hodnota CHANGE stále kladná (může být i podobně velká), kopeček bude mít světlejší barvu, protože hodnota %CHANGE bude záporná. 6.5.3 Druhy vizualizace Vizualizaci Plocha je velmi podobná předchozí vizualizaci Koule. Mohli bychom si představit, že pokud bychom výsledek Koule potáhli gumovou blánou, dostali bychom objekt velice podobný vizualizaci Plocha. Přestože jsou si tyto vizualizace podobné, Plocha se výrazně liší ve způsobu práci s daty. Umožňuje totiž vrstvit na sebe jednotlivé akcie, a dokonce umožňuje zaznamenávat více přírůstků jedné akcie v čase. Program Plocha umí vizualizovat burzovní data ve třech různých modech. Jsou to Add, UniqAdd a Morph. Add Tento modus nezapomíná žádná data. Každá akcie deformuje plochu, i přestože tato akcie už plochu v minulosti deformovala. Změny od každé akcie se v časovém průběhu na sebe vrší. Výsledkem je, že v aktivních částech burzy vznikají velmi vysoké deformace, které jsou velmi zřetelné a výrazné. Modus Add demonstruje obrázek 43. Obrázek 43. Vizualizace plocha modus Add. Pravý obrázek je starší. Mezi pravým a levým obrázkem je jasně patrný vývoj aktivních akcií burzy. UniqAdd V tomto modu každá akcie deformuje plochu jen jednou. Deformace od různých akcií se sčítají (odčítají). V tomto módu nejsou tolik patrné přírůstky, zachycuje ale stav burzy v daném okamžiku. 46 Hodnoty %CHANGE a CHANGE jsou vztaženy k hodnotě PRICE v době uzavření burzy předchozí den. 46

6 Burza Morph Tento mód je určen k zachycení historie vývoje burzy. Program nejdřív vypočítá několik ploch v módu UniqAdd a mezi těmito plochami provádí plynulý přechod. Tento modus je určen pro prezentace a je nejvíce náročný na výpočetní prostředky. 6.5.4 Zvuk Ozvučení této vizualizace je totožné s ozvučením použitém v projektu koule (kapitola 6.4.7). 6.5.5 Závěr Vizualizace Plocha je rozšíření a pokračování předchozí vizualizace Koule. Podařilo se jí vyřešit některé problémy, které měla Koule, zejména pak zachycení historie vývoje burzy v čase a přehlednější zobrazení velikosti přírůstků akcie (hodnoty CHANGE nebo %CHANGE). Další zlepšení tento projekt dosáhl v hardwarové náročnosti, a to zejména v modech Add a UniqAdd. Nedostatky Plochy, stejně jako u vizualizace Koule, tkví v identifikaci, a to buď jednotlivých akcí, nebo celých ekonomických oblastí. Tyto vlastnosti by bylo nutné implementovat, pokud bychom od aplikace požadovali další a podrobnější analytické možnosti. 47

7 Ovládání vizualizačního programu 7 Ovládání vizualizačního programu Vizualizační program nabízí dva druhy práce47. Výběr se provádí pomocí úvodního okna programu (viz obrázek 44 a 45). První a výchozí modus, spouští vizualizaci z přednastaveného zdroje dat, s přednastavenými uživatelskými volbami. Tento modus je určen pro prezentační účely, a proto záměrně nedává uživateli možnost ovlivňovat vizualizaci. Druhý (rozšířený) modus naopak poskytuje uživateli kontrolu nad volbami vizualizace, výběrem zdroje dat a také výběrem samotné vizualizace ( Koule, Plocha ). Obrázek 44. Úvodní obrazovka vizualizačního programu umožnující výběr způsobu ovládání. Obrázek 45. Zvolení druhu ovládání je doprovázeno vysvětlujícím textem. Obou modů se týká kapitola 7.1, která vysvětluje základní používání vizualizace. Druhého modu se pak týkají ostatní kapitoly, popisující jednotlivé uživatelsky nastavitelné parametry. Používání programu je snadné. Při spuštění programu v základním modu je vizualizace již nakonfigurovaná a uživatel ji ovládá pomocí rotace, posunu a zoomu, jak je popsáno v kapitole 7.1. Pokud je program v rozšířeném módu, uživatel nejdříve vybere druh vizualizace a zdroj dat (kapitola 7.2), a poté může vizualizaci ovládat pomocí ovládacích prvků popsaných v kapitole 7.1, 7.3 a 7.4. 47 Druhy neboli mody. 48

7 Ovládání vizualizačního programu 7.1 Pohyb ve scéně Uživatel má možnost pohybovat se ve scéně pomocí myši (případně podobného ukazovacího zařízení např trackpadu, touchpadu48 ). Ve scéně jsou možné následující pohyby Rotace scény: obrázek 46 - rotace scény se ovládá pomocí levého tlačítka myši. U myší s jedním tlačítkem se ovládá právě tímto jedním tlačítkem. Po stisknutí tohoto tlačítka, rotace sleduje pohyb myši. Posun scény: obrázek 47 - posun celé scény ve vodorovném nebo horizontálním směru je ovládán pomocí pravého tlačítka. U jednotlačítkových myší je nutné stlačit modifikační klávesu command, u počítačů Apple je to klávesa jablko. Posun scény po stisknutí tlačítka sleduje pohyb myši. Zoom: obrázek 48 - zoom neboli přiblížení/oddálení scény je realizován pomocí prostředního tlačítka myši. U jednotlačítkových myší je to pomocí tlačítka mod1, u počítačů Apple tlačítko alt. Po stisknutí tlačítka je scéna přibližována / oddalována pomocí horizontálního pohybu myši. Obrázek 46. Rotace scény. 7.2 Obrázek 47. Posun scény. Obrázek 48. Přiblížení/oddálení scény. Výběr vizualizace a výběr dat Po spuštění aplikace se objeví okno se záložkami (obrázek 49). První záložka na obrázku 49 dovoluje vybrat druh vizualizace. Po výběru se v tomto okně objeví další záložka s volbami pro danou vizualizaci. Druhá záložka (obrázek 50) dovoluje ovládat datový zdroj. Některé volby na této záložce jsou ovlivněny výběrem druhu vizualizace. Popis jednotlivých ovládacích prvků49: 1. Výběr druhu vizualizace. Volba Star spustí vizualizaci Koule, volba BSurface vizualizaci Plocha. 48 49 Viz Slovník pojmů. čísla na obrázcích 49 a 50 se shodují s jednotlivými body 49

7 Ovládání vizualizačního programu 2. Tlačítko Open ovládá dialog pro výběr datových souborů (obrázek 51). Jméno vybraného souboru je zobrazeno vedle tlačítka. 3. Tlačítko Show zobrazí obsah vybraného souboru. Pokud je soubor velmi rozsáhlý (i několik set tisíc záznamů), může být zobrazení souboru pomalé. 4. Informační text ukazující stav zásobníku načtených dat. V případě získávání dat z nespolehlivého zdroje (internet, pomalé čtecí zařízení ) jsou data načtena a připravena v zásobníku pro vyrovnání rychlosti vizualizace a zdroje dat. 5. Informační text, který zobrazuje informaci o modulu, jenž čte data. Zobrazuje stavy programu jako například konec souboru dat, data nedostupná, případně ošetřené chybové stavy. 6. Tlačítko Start / Stop / Restart ovládá modul pro zobrazování dat. Pokud uživatel zvolí nový datový soubor, aplikuje změnu právě tímto tlačítkem. 7. Seznam souborů, které dialogové okno nabídne, obsahuje jen soubory obsahující data v očekávaném formátu pro daný druh vizualizace. 8. Dialogové okno obsahuje popis souboru s krátkou informací. Poloha a zobrazení této informace závisí na použitém operačním systému. Obrázek 49. Okno výběru vizualizace. Obrázek 50. Okno výběru datového zdroje. 50