Mendelova univerzita v Brně Provozně ekonomická fakulta. Analýza dat sleep Semestrální práce do předmětu Informační systémy pro rozhodování



Podobné dokumenty
U Úvod do modelování a simulace systémů

Statistické zpracování naměřených experimentálních dat za rok 2012

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ

xrays optimalizační nástroj

13 Barvy a úpravy rastrového

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

4EK311 Operační výzkum. 5. Teorie grafů

Algoritmy a struktury neuropočítačů ASN - P11

Essity Engagement Survey 2018

Chyby měření 210DPSM

Vnější faktory. Vnitřní faktory. Sociální zázemí Vztah U Ž Historie pobytu ve skupině

PARAMETRICKÁ STUDIE VÝPOČTU KOMBINACE JEDNOKOMPONENTNÍCH ÚČINKŮ ZATÍŽENÍ

Název DUM: VY_32_INOVACE_2B_16_ Tvorba_grafů_v_MS_Excel_2007

Soukromá střední odborná škola Frýdek-Místek, s.r.o.

Experiment P-10 OHMŮV ZÁKON. Sledování vztahu mezi napětím a proudem procházejícím obvodem s rezistorem známého odporu.

Dvouvýběrové a párové testy. Komentované řešení pomocí MS Excel

Operační výzkum. Vícekriteriální hodnocení variant. Grafická metoda. Metoda váženého součtu.

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie

Učíme se maturitní otázku Organizování z výkladové prezentace. Zpracoval Ing. Jan Weiser

Přizpůsobení rostlin a živočichů prostředí

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA. Semestrální práce

Fakulta chemicko-technologická Katedra analytické chemie. Licenční studium Statistické zpracování dat při managementu jakosti. Semestrální práce:

POZNÁMKY K HODNOCENÍ SOUBORŮ ILUSTRAČNÍ TEST 2012

Automatické rozpoznávání dopravních značek

3. úloha - problém batohu metodami branch & bound, dynamické programování, heuristika s testem

Tabulka 1 Rizikové online zážitky v závislosti na místě přístupu k internetu N M SD Min Max. Přístup ve vlastním pokoji ,61 1,61 0,00 5,00

Statistika pro geografy

Informační systémy 2006/2007

Možnosti využití sluneční energie v soustavách CZT. 2. Sluneční podmínky v ČR a možnosti jejich využití

Středoškolská technika SCI-Lab

Nastavení parametrů PID a PSD regulátorů

Příprava na hodinu přírodovědy

materiál č. šablony/č. sady/č. materiálu: Autor: Karel Dvořák Vzdělávací oblast předmět: Informatika Ročník, cílová skupina: 7.

SERIOVÉ A PARALELNÍ ZAPOJENÍ PRUŽIN

Dyson s Coulomb gas on a circle and intermediate eigenvalue statistics

Souhrnné výsledky za školu

Úvod do zpracování signálů

ANALYTICKÁ GEOMETRIE V ROVINĚ

Algoritmizace prostorových úloh

5. Umělé neuronové sítě. Neuronové sítě

Popisná statistika - úvod

Charakteristiky kategoriálních veličin. Absolutní četnosti (FREQUENCY)

Automatizovaný sběr dat Online stav skladů

Mnohorozměrná statistická data

Inovace bakalářského studijního oboru Aplikovaná chemie

IS pro podporu BOZP na FIT ČVUT

Automatizované metody výběru podmnožiny vysvětlujících proměnných v regresním modelu a problémy s nimi spojené

Příloha č. 3. Obchodních podmínek OTE, a.s. pro elektroenergetiku. Revize 19 srpen 2015

Jasové transformace. Karel Horák. Rozvrh přednášky:

Algoritmy a datové struktury

NESTABILITY VYBRANÝCH SYSTÉMŮ. Úvod. Vzpěr prutu. Petr Frantík 1

Mgr. Martin Škopek, Ph.D., katedra tělesné výchovy, PF UJEP

20. května Abstrakt V následujícím dokumentu je popsán způsob jakým analyzovat problém. výstřelu zasáhnout bod na zemi v definované vzdálenosti.

Vyhodnocení průměrných denních analýz kalcinátu ananasového typu. ( Metoda hlavních komponent )

BALISTICKÝ MĚŘICÍ SYSTÉM

Nové výsledky o zlomkových kuželosečkách v rovině a prostoru

VÝSTUPNÍ ZPRÁVA Ukázka nové 360 zpětné vazby

Rozvoj tepla v betonových konstrukcích

Regulační funkce. v aplikaci pro řízení vzduchotechniky. WILKOP, spol. s r.o., Zubří, Hlavní 823, tel. / fax :

GIS Geografické informační systémy

Univerzita Pardubice 8. licenční studium chemometrie

Vytěžování znalostí z dat

FAKULTA INFORMATIKY A MANAGEMENTU UNIVERZITA HRADEC KRÁLOVÉ VOLBA TECHNOLOGIE. Semestrální práce MIE2

Státnice odborné č. 20

Semestrální práce 2 znakový strom

časovém horizontu na rozdíl od experimentu lépe odhalit chybné poznání reality.

Neuronové časové řady (ANN-TS)

ÚVOD DO PROBLEMATIKY CROSS COMPLIANCE

OPTIMALIZACE PŘIJÍMACÍHO ŘÍZENÍ 2008/09

Centrální registr administrativních budov. 24. května 2013

11 Zobrazování objektů 3D grafiky

WORD 2007 grafický manuál

================================================================================ =====

8 ANALÝZA ČASOVÝCH ŘAD SEZÓNNÍ SLOŽKA

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Analytické znaky laboratorní metody Interní kontrola kvality Externí kontrola kvality

TECHNICKÁ UNIVERZITA V LIBERCI. Statistický rozbor dat z dotazníkového šetření

vzorek vzorek

TABULKA 1. k sešitovým jízdním řádům

Grafický informační systém Hasičského záchranného sboru České republiky

Petra Mihalová Oddělení lékařské fyziky Nemocnice Na Homolce

Software laktát technická a funkční specifikace

Inovace a zkvalitnění výuky prostřednictvím ICT Databázové systémy MS Access formuláře a sestavy - vytváření Ing. Kotásek Jaroslav

Stupnice geomagnetické aktivity

Pojem a úkoly statistiky

Jednostranné intervaly spolehlivosti

Animace a geoprostor. První etapa: Animace 2. přednáško-cvičení. Jaromír Landa. jaromir.landa@mendelu.cz Ústav informatiky PEF MENDELU v Brně

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA STAVEBNÍ ROZPTYL GEOMETRICKÝCH PARAMETRŮ OTEVŘENÝCH VÁLCOVANÝCH PROFILŮ SVOČ 2002

Stručný souhrn rozdílů nových spínacích přístrojů DRIBO Flc GB oproti konvenčním přístrojům

Autor: Veronika Dvorská

Statistické vyhodnocení průzkumu funkční gramotnosti žáků 4. ročníku ZŠ

Algoritmizace prostorových úloh

Fakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody

Dokazování je procesním právem (též normy EU, mezinárodní úmluvy apod.) upravený postup, jehož prostřednictvím soud zjišťuje skutečnosti významné pro

3.4 Určení vnitřní struktury analýzou vícerozměrných dat

Spánek. kurz Neurobiologie chování a paměti. RNDr. Eduard Kelemen, Ph.D. Národní ústav duševního zdraví Fyziologický ústav AVČR

Transkript:

Mendelova univerzita v Brně Provozně ekonomická fakulta Analýza dat sleep Semestrální práce do předmětu Informační systémy pro rozhodování Jan Grmela, EI Brno 2011

Popis zdrojových dat Zdrojová data souboru sleep.csv popisují spánek živočichů a jeho veličiny. Taktéž zde jsou uvedeny základní parametry toho kterého živočicha jako je například hmotnost či délka života. Data jako celek obsahují tyto parametry: název druhu hmotnost živočicha hmotnost mozku délka spánku s pomalým vlněním (části 3 a 4 non-rem fáze spánku) délka REM fáze spánku celková délka spánku maximální délka života délka březosti index dravosti index klidu při spánku (např. 1 = v noře, zcela v klidu; 5 = v nebezpečném prostředí) index nebezpečí pro živočicha (1 = nejnižší; 5 = nejvyšší) Provedené analýzy Nad zdrojovými daty bylo provedeno několik analýz, které umožnily zjistit, zda a případně jakým způsobem na sobě veličiny navzájem závisí. Vzhledem k tomu, že ve většině sloupců jsou data spojitá, bylo možné využít jen analýzy programu SPSS Modeler, které dokáží se spojitými daty pracovat. 1

Náhled realizace analýz v aplikaci Ilustrace 1: Propojení bloků analýz v Modeleru Při realizaci práce bylo použito analytických bloků zobrazené na Ilustraci 1. Analýza vztahu délky života k délce spánku Ilustrace 2: Naximální délka života versus celková délka spánku Toto grafické znázornění zobrazuje poměr délky života (osa X) a délky spánku (osa Y). Z průběhu histogramu je zřejmé, že z prodlužující se délkou života se zkracuje délka spánku. Jisté prokázání této závislosti by však vyžadovalo další analýzy. 2

Analýza závislosti délky života pomocí algoritmu CR&T Délka života byla analyzována i pomocí stromového algoritmu CR&T. Analýzou tímto nástrojem bylo prokázáno, že na délku života má z dostupných hodnot nejvyšší vliv hmotnost těla zvířete (důležitost 0,31), délka non-rem fáze spánku (důležitost 0,17) a hmotnost mozku (0,14). Ilustrace 3: Závislost délky života na dalších proměnných (CR&T) Analýza závislosti délky života pomocí neuronové sítě Pro porovnání výsledků s algoritmem CR&T byla využita analýza stejné proměnné neuronovou sítí. Je zajímavé, že výsledky (tedy závislost proměnných) v tomto případě vyšly téměř opačné než v případě CR&T. Tento fakt přičítám tomu, že obě analytické metody mají mnoho možností nastavení. Jejich správným výběrem v souladu se společným cílem by zřejmě bylo možné dosáhnout stejných výsledků a tak potvrdit domněnky o závislosti proměnných. Ilustrace 4: Závislost délky života na dalších proměnných (CR&T) Analýzou pomocí neuronové sítě byly jako nejdůležitější vybrány proměnné popisující délku březosti (0,25), hmotnost mozku (0,14), celkovou délku spánku (0,14) a index dravosti (0,13). 3

Analýza délky spánku pomocí algoritmu CR&T Délka spánku byla analyzována i stromovým algoritmem CR&T. Byla zde zjištěna závislost zejména na délce non-rem fáze spánku (což je třeba ignorovat neboť celková délka spánku je hodnotou této proměnné částečně tvořena), indexu klidu při spánku (0,16), délce březosti (0,14) a hmotnosti těla (0,13). Ilustrace 5: Závislost délky spánku na ostatních proměnných (CR&T) Z této analýzy tedy plyne, že živočich, který má při spánku větší klid má sklon spát déle. 4

Analýza příbuznosti druhů metodou K-nearest neighbor Pro zjistění, zda se zde uplatní vztahy příbuznosti mezi druhy v závislosti na dostupných proměnných byla použita analýza KNN, která toto ve velkém počtu případů prokázala. Jeden takový příklad je zobrazen na Ilustraci 6, kde je graficky ukázána příbuznost ovce (54), koně (29), kozy (22) a krávy (12). Tato příbuznost je zobrazena na základě podobné délky non-rem fáze spánku, celkové doby spánku, maximální délky života a doby březosti. Index dravosti je u uvedených druhů stejný. Ilustrace 6: 3D projekce příbuznosti mezi druhy Ilustrace 7: Hodnoty popisující příbuznost mezi druhy 5

Závěr Provedenými analýzami bylo zjištěno několik závislostí. Dvě provedené analýzy maximální délky života si však odporují a tak by nebylo odpovědné jejich výsledky užít dokud nebude zjištěna příčina této neshody. Jako jasná se zde projevila závislost délky života na délce spánku déle žijící živočich spí kratší dobu. Dalším zjištěným závěrem je skutečnost, že živočich, který není při spánku vystaven takovému rozruchu (má tedy klid), spí taktéž déle. Dále bylo zjištěna možnost úspěšného využití procesu KNN pro zjištění příbuznosti mezi druhy na základě vstupních proměnných. Ty jsou tedy zřejmě dostatečné pro provedení takové analýzy. Na základě zjištěných skutečností zde vidím jasnou možnost rozšíření na další analýzy, pro které by však bylo nutné buď provést zhodnocení funkce dříve použitých algoritmů nebo určitým způsobem (například rozřazením do tříd) připravit data pro další výpočty, tentokrát už algoritmy, které pracují s daty diskrétními. Další analýzy by bylo možné provést například po rozřazení druhů na jednotlivé čeledi, přičemž by se provedlo srovnání z agregátních dat napříč čeleděmi. 6