Chernoffovy tváře (ikonové grafy)



Podobné dokumenty
StatSoft Jak vyzrát na datum

Příklad bezprostředně navazuje na předchozí příklad č. 17. Bez zvládnutí příkladu č. 17 není možné pokračovat

Obří prvky: jak postavit větší kostky

Tvar dat a nástroj přeskupování

Textové popisky. Typ dat

Zpracování chybějících dat a dat mimo rozsah

STATISTICA Téma 8. Regresní a korelační analýza, regrese prostá

Testování webu mojenoty.cz

StatSoft Odkud tak asi je?

Analýza rozptylu dvojného třídění

Laboratorní zdroj - 6. část

Stručný manuál k ovládání programu STATISTICA. Mgr. Petra Beranová Ing. Miloš Uldrich

Střední škola informačních technologií a sociální péče, Brno, Purkyňova 97. Vybrané části Excelu. Ing. Petr Adamec

Zobrazení zdrojových dat u krabicového grafu

Diagnostika regrese pomocí grafu 7krát jinak

StatSoft Shlukování podobných

Použití databází. Mnoho postupů, které si ukážeme pro prací s formulářů využijeme i při návrhu tiskových sestav.

1. Dříve než začneme Trocha historie nikoho nezabije Co budete potřebovat Microsoft versus zbytek světa...

MAPOVÉ APLIKACE A WEBOVÉ SLUŽBY MAWES NAŠE MAPY

Tvorba geometrického modelu a modelové sítě.

Statutární město Ostrava Archiv města Ostravy DIGITÁLNÍ BADATELNA. Uživatelská příručka

- příkaz pohybující želvou zpět a o kolik. vlevo 45 vl 45 libovolně zadáme) směrem doleva. Na obrázku jsme pro

Popis prostředí MOSAIC Programové prostředí MOSAIC nastavení prostředí. Po spuštění Mosaiku se objeví okno Výběr skupiny projektů

Standardně máme zapnutý panel nástrojů Formátování a Standardní.

[PENÍZE - MANAŽEŘI] 28. října 2007

Digitální učební materiál

Minebot manuál (v 1.2)

STATISTIKY REGISTRACÍ VOZŮ PODLE TYPU KONCOVÉHO ZÁKAZNÍKA LEDEN 2017

SEZNÁMENÍ S PROGRAMEM

Naučit se, jak co nejsnadněji přejít od verze TopoLu pro Windows k verzi TopoL xt. Cílem není vysvětlení všech možností programu.

EMMA SARGENTOVÁ TIM FEARON. Jak sebejistě. mluvit. s kýmkoli v každé situaci

Technologie počítačových sítí 5. cvičení

Rezervační systém TROJHŘIŠTĚ hriste.pist.cz

Vzdělávání v egoncentru ORP Louny

Statistická ročenka. Centra mezistátních úhrad styčného orgánu ČR v oblasti zdravotní péče

Kontrola mléčné užitkovosti krav v kontrolním roce 2006/2007 Ing. Pavel Bucek, Českomoravská společnost chovatelů, a.s.

Rozdílová dokumentace k ovládání IS KARAT.net

Příručka pro schvalovatele témat

Práce s disky a ISO soubory

IFS APPLICATIONS PRO PROJEKTOVĚ ŘÍZENOU VÝROBU

Matematika kr sy. 5. kapitola. V hoda pr ce s grupami

(Oznámení) SPRÁVNÍ ŘÍZENÍ KOMISE (2008/C 141/13) Úvod. posilovat nadnárodní mobilitu osob pracujících v odvětví kultury,

Kapitola 11. Vzdálenost v grafech Matice sousednosti a počty sledů

Rámcový manuál pro práci s programem TopoL pro Windows

Zvyšování kvality výuky technických oborů

3. Středoškolská stereometrie v anaglyfech

Studie uživatelů modelu CAF

Evropský průzkum podniků na téma nových a vznikajících rizik Shrnutí

Karnaughovy mapy. Pravdivostní tabulka pro tři vstupní proměnné by mohla vypadat například takto:

Rok 2006 v ČR; R; ehk. Nehody na pozemních komunikacích ch a jejich následky. Pplk. Ing. Josef TESAŘÍK. Policejní prezidium ČR, ŘSDP

Co je to sinus a kosinus

StatSoft Jak poznat vliv faktorů vizuálně

Pata s klínky pletená od špičky (Toe-up Gusseted Heel)

MOJE-PROJEKTY.CZ. Změny v aplikaci k Verze: 1.1

10. Editor databází dotazy a relace

28.ročník. Milý řešiteli!

Vytvoření uživatelské šablony

Uživatelský manuál Radekce-Online.cz

Aktuální vývoj bezpečnosti silničního provozu v ČR v porovnání s ostatními zeměmi EU

Žádost Benefit. Opatření 2.1 sociální služby MPSV, září 2005 soc.integrace_esf

Zdokonalování gramotnosti v oblasti ICT. Kurz MS Excel kurz 6. Inovace a modernizace studijních oborů FSpS (IMPACT) CZ.1.07/2.2.00/28.

CADKON/TZB verze

Omezení funkcionalit v softwaru STATISTICA

MEZINÁRODNÍ SROVNÁNÍ MZDOVÝCH ÚROVNÍ A STRUKTUR

Milí rodiče, Prostřednictvím knih Disney Uč se s námi můžete svým dětem pomoci vytvořit si sebejistý a nezávislý přístup k učení.

Znalecký posudek oboru očního lékařství

8 A (strana 1) Soubory a složky, procházení, orientace

Výdaje na základní výzkum

KDE ZAČÍNÁ BOHATSTVÍ?

František Hudek. květen ročník. Práce s aplikací Malování

Programujeme v softwaru Statistica - příklady

Schůzka sběratelů známkových zemí Geophila

NETYPICKÉ VYUŽITÍ INDUKČNÍHO VAŘIČE

Úroveň čtenářské, matematické a přírodovědné gramotnosti českých patnáctiletých žáků - výsledky mezinárodního výzkumu PISA 1

VY_32_INOVACE_E 13 03

Cíl: definovat zahraniční pracovní cest, vyjmenovat náhrady při zahraniční pracovní cestě a stanovit jejich výši.

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

Bakalářská práce - úvod

Restaurator. Semestrání projekt předmětu PDA

Manuál, jak pracovat s tenkým klientem

Pracovat budeme se sestavou Finanční tok. S ostatními se pracuje obdobně. Objeví se předdefinovaná sestava. Obrázek 1

Absolventi středních škol a trh práce OBCHOD. Odvětví:

Programujeme v softwaru Statistica

KGG/STG Statistika pro geografy

Měření se senzorem GPS

Hra na schovku" Naháči a naháčci

3.1 Historie MBTI. 3 VYHODNOCENÍ na základě MBTI

Slučování tabulek. Sloučení dvou tabulek

Tabulkový kalkulátor

Úloha 1A (5 bodů): vyhovuje Úloha 2A (6 bodů): Obrázek 1 Přelévání mléka

3. série 2015/2016. Termín odeslání 3. série:

VAR-NET INTEGRAL Manuál správce VNI 5.1 VAR-NET INTEGRAL. verze 0.2. Manuál správce VNI 5.1

Návod na práci s redakčním systémem webu VPŠ a SPŠ MV v Praze

Databáze v Excelu EU peníze středním školám Didaktický učební materiál

Jak neměřit Härtlovým přístrojem

STATISTICA. Vlastní menu v programu. StatSoft

OBSAH. Poděkování a doporučení 7

Hodnocení směrnice o energetických štítcích a některých aspektů směrnice o ekodesignu

Připojení systému A3600 k aplikaci DDS2000

Obsah čísla Úvodník 3 Novinka teplota ve volbě Statistika - Exporty 4 Novinka výběr délky archivace dat 6 Kapitola z WD Mobile 7 Soutěž 9

Transkript:

StatSoft Chernoffovy tváře (ikonové grafy) Jedním ze základních pomocníků pro datovou analýzu je vizualizace dat. Pokud chcete vizualizovat v jednom grafu jednu nebo dvě proměnné (jednu nebo dvě dimenze najednou), pak to není žádný problém, máte na výběr z mnoha druhů grafů a vizualizačních technik. V případě nutnosti podívat se na trojrozměrná data máme stále možnost situaci krásně analyzovat díky třírozměrným grafům s možností podívat se na rozložení bodů z více úhlů. Pokud ale pracujete ve svých datech s větším množstvím proměnných, začnete s klasickými grafy narážet. Schválně, jak bychom vykreslili čtyřrozměrný bodový graf, když jsme schopni vidět a myslet nanejvýš v našich třech rozměrech? N utnost vizualizovat takováto vícedimenzionální data vedla k vývoji jiných typů grafů. Jedním z nich zde začneme. Ukážeme si oblíbený typ vizualizace, kterou navrhl pan Herman Chernoff již v roce 1973. Jedná se o tzv. Chernoffovy tváře, v tomto grafu či vizualizaci je pro každý případ vykreslen jeden obličej, přičemž parametry obličeje jako například délka nosu, velikost uší, tvar hlavy, atd. jsou vykresleny podle hodnot jednotlivých proměnných. Nápad použít tváře pochází z myšlenky, že člověk je zvyklý a schopný jednoduše rozpoznat podobnosti nebo odlišnosti tváře. Ve STATISTICE je možné zaznamenat až 20 proměnných v jedné tváři. Pomocí těchto grafů lze identifikovat případy se stejným chováním, rozdělovat do skupin, ale také nalézt případy s chováním výrazně odlišným od ostatních. To je možná ještě důležitější, ikonovým grafem dokážeme vizuálně odhalit odlehlé případy (tj. případy s výrazně odlišnými hodnotami než má většina dat). Není nutno zmiňovat, že poznat hodnotu mimo většinu dat ve vícedimenzionálním prostoru není triviální odlehlost v jedné z dimenzí je bezproblémová, nicméně to, že je hodnota ve všech rozměrech ve správných mezích ještě neznamená, že nebude odlehlá. Dalším speciálním využitím je zkoumání trendů a vůbec jakási možnost zažít si nějakým rozumnějším způsobem mnohorozměrná data. Obecně patří Chernoffovy tváře mezi takzvané ikonové grafy. V programu STATISTICA najdete ikonové grafy jednoduše přímo v záložce Grafy. Dost teorie, teď bychom se vrhli na praktický příkládek.

Příklad (Typ zaměstnání v jednotlivých zemích Evropy) Pojďme na to. Vykreslíme si nejprve nějaké Chernoffovy obličeje na datech, která zachycují procentuální zastoupení zaměstnanců v jednotlivých sektorech v různých státech Evropy. Data můžete nalézt ke stažení zde. Máme 9 proměnných, které chceme všechny najednou vizualizovat. Otevřeme si dialog ikonových grafů a zvolíme všech 9 proměnných. Klepneme OK a máme ihned výsledek: Zdají se Vám některé ksichtíky podobné? Nebo jsou zde naopak takové, které jsou naprosto odlišné od ostatních? Pokud jste si obličeje dostatečně prohlédli, jistě máte nějaké adepty. Určitě zde jsou takové, které se liší od ostatních například tím, že se prostě tváří mnohem divněji než ostatní. Tak to Vás teď bude jistě zajímat, který obličej přísluší kterému řádku (státu). Graf Chernoffových tváří je ve STATISTICE graf jako každý jiný, když tedy vyvoláte dialog Možností grafu, najdete možnost Zobrazit popisy bodů, kterou je potřeba zaškrtnout.

Nyní již vidíme, čí je která tvář, pojďme se tedy podívat na výsledky. Tak schválně, které státy mají nejvíce odlišné obličeje? Jasným kandidátem je Turecko a Jugoslávie, případně Řecko nebo Sovětský svaz. Téměř identicky vypadají například Belgie a Francie. V legendě napravo od obličejů se poté můžete podívat, jak jsou jednotlivé proměnné do obličeje zakódovány. Chernoffovy tváře jsou samozřejmě jen jednou formou ikonových grafů, zkuste si vyzkoušet také další typy jako třeba hvězdy. Zde se každá dimenze (kterou je standardizovaná veličina) vykresluje postupně ve zvoleném pořadí dokola, délka příslušného cípu hvězdy je podle velikosti příslušné proměnné. Opět, možná dokonce více než předtím vidíme odlišnost Turecka a Jugoslávie. Pokud bychom hledali podobné hvězdy, pak lze jistě říct, že například Francie a Belgie mají podobné hvězdy, což znamená podobné rozvrstvení pracujících v jednotlivých sektorech. Taktéž například Norsko, Švédsko a Finsko mají velmi podobný charakter, což bychom čekali. Domácí úloha Pokud si chcete tento graf vyzkoušet sami na jiném datovém souboru, pak můžeme doporučit například soubor Proteins.sta (je k dispozici v příkladech programu STATISTICA, tedy Soubor- Otevřít příklady-datasets-proteins.sta). V tomto případě se jedná o odhady přísunu proteinů z 9 různých zdrojů pro obyvatele 25 zemí Evropy. Data pocházejí ze studie z roku 1973. Vpravo je k dispozici náhled výsledků. Pokud jste zvědaví a chcete zjistit, které tváře patří ke kterým státům, nezbyde Vám nic jiného než si tento příklad sami vyzkoušet

Další typy ikonových grafů Poznámka: Pokud se zeptáte na rozdíl mezi Chernofovými tvářemi a ostatními ikonovými grafy, pak takový rozdíl tady opravdu je. Když nebudeme mluvit o faktu, že tváře jsou jistě vizuálně nejatraktivnější, máme zde další odlišnosti - tvářím se občas vytýká, že mohou být hodnoceny subjektivně podle toho, kdo zrovna obrázky posuzuje a které atributy obličeje považuje za důležité, které ne, a jak dokáže vyhodnotit odlišnosti. Na druhou stranu, tím, že jednotlivé části obličeje nemají řekněme stejnou důležitost (jako je tomu například u hvězdic), je možné vytvořit obličej tak, aby ty nejdůležitější znaky korespondovaly s tím, co považujeme ve tváři jako nejvýraznější (obecně se v této souvislosti zmiňuje jako velmi důležitá velikost očí a sklon obočí).

Příklad 2 (Auta) Ukažme si ještě jeden zajímavý příklad na datech o autech, kde se měřily jízdní i jiné vlastnosti aut (tato data jsou v příkladech programu STATISTICA pod názvem Cars.sta. Abychom si ukázali ještě další možnosti ikonových grafů, vytvořme si k pěti stávajícím proměnným s vlastnostmi novou proměnnou s příslušností auta k danému státu. Vytvoříme ikonový graf, ale navíc v záložce detaily nastavíme podmínky pod tlačítkem Označit ikony následujícím způsobem: Ikony, které přísluší daným kategoriím, budou nyní navíc orámovány podle toho, jestli splňují danou podmínku nebo nikoli, což může posloužit pro lepší orientaci. Vidíme, že nejvíce odlišnými od ostatních aut jsou Porsche, Eagle a Isuzu, ty se vymykají, při pohledu do dat zjistíme, že například u Porsche je to kvůli ceně a zrychlení. K sobě velmi podobná jsou auta Mercedes, BMW a Audi nebo například Honda a Volkswagen. Závěrem Tímto příkladem bychom ukončili exkurz do ikonových grafů, doufáme, že pro Vás bude tato vizualizační technika přínosná a současně přejeme hodně krásných tváří, nejen Chernoffových.