Analýza rozptylu dvojného třídění



Podobné dokumenty
Diagnostika regrese pomocí grafu 7krát jinak

StatSoft Jak poznat vliv faktorů vizuálně

STATISTICA Téma 7. Testy na základě více než 2 výběrů

STATISTICA Téma 8. Regresní a korelační analýza, regrese prostá

a) Základní informace o souboru Statistika: Základní statistika a tabulky: Popisné statistiky: Detaily

Manuál k ovládání programu STATISTICA

LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

VŠB Technická univerzita Ostrava

Stručný manuál k ovládání programu STATISTICA. Mgr. Petra Beranová Ing. Miloš Uldrich

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Hledání závislostí technologických a nákladových charakteristik při tavení oceli na elektrických obloukových pecích

TVORBA VÝROBNÍ DOKUMENTACE CV

Poznámky k předmětu Aplikovaná statistika, 9.téma

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Lineární regrese. Komentované řešení pomocí MS Excel

Tabulka 1 Rizikové online zážitky v závislosti na místě přístupu k internetu N M SD Min Max. Přístup ve vlastním pokoji ,61 1,61 0,00 5,00

2. Mechanika - kinematika

V praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více

POPIS PROSTŘEDÍ PROGRAMU GIMP 2. Barvy 2. Okno obrázku 4 ZÁKLADNÍ ÚPRAVA FOTOGRAFIÍ V GRAFICKÉM EDITORU 6. Změna velikosti fotografie 6

2 Spojité modely rozhodování

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA. Semestrální práce

Použití databází. Mnoho postupů, které si ukážeme pro prací s formulářů využijeme i při návrhu tiskových sestav.

Regresní a korelační analýza

Použití programu LTspice IV pro analýzu a simulaci elektronických obvodů III.

6. T e s t o v á n í h y p o t é z

Statutární město Ostrava Archiv města Ostravy DIGITÁLNÍ BADATELNA. Uživatelská příručka

Přírodopis v očích žáků II. stupně základních škol

Word 2007 Word 2007 egon. Spuštění, vzhled, zobrazení dokumentu

František Hudek. duben Informační a komunikační technologie MS Excel Úvod do Excelu I. Seznámení s pracovním prostředím aplikace MS Excel.

S E M E S T R Á L N Í

Návod na práci s redakčním systémem webu VPŠ a SPŠ MV v Praze

VŠB Technická univerzita Ostrava BIOSTATISTIKA

Zobrazení zdrojových dat u krabicového grafu

Střední škola informačních technologií a sociální péče, Brno, Purkyňova 97. Vybrané části Excelu. Ing. Petr Adamec

Ilustrační příklad odhadu LRM v SW Gretl

KORELACE. Komentované řešení pomocí programu Statistica

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie

Odhady parametrů základního souboru. Cvičení 6 Statistické metody a zpracování dat 1 (podzim 2016) Brno, říjen listopad 2016 Ambrožová Klára

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Standardně máme zapnutý panel nástrojů Formátování a Standardní.

Popisná statistika kvantitativní veličiny

Zobecněná analýza rozptylu, více faktorů a proměnných

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

Analýza přežití čertic a čertů

Protokol č. 3. Morfologie ležícího kmene

Národníinformačnístředisko pro podporu jakosti

Plánování experimentu

Uživatelský manuál na obsluhu mobilní aplikace CMOB

Gravitační pole manuál Jan Hrnčíř, Martin Klejch, Gravitační pole. Využití multimédií při výuce fyziky. Manuál k multimediální prezentaci

Zadání Máme data hdp.wf1, která najdete zde: Bodová předpověď: Intervalová předpověď:

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

Ilustrační příklad odhadu SM v SW Gretl

Chernoffovy tváře (ikonové grafy)

Návrhy dalších možností statistického zpracování aktualizovaných dat

ŘÍZENÍ FYZIKÁLNÍHO PROCESU POČÍTAČEM

UNIVERSITA PALACKÉHO V OLOMOUCI PŘÍRODOVĚDECKÁ FAKULTA. KATEDRA MATEMATICKÉ ANALÝZY A APLIKACÍ MATEMATIKY školní rok 2009/2010 BAKALÁŘSKÁ PRÁCE

NEPARAMETRICKÉ TESTY

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

TESTOVÁNÍ KVALITATIVNÍCH ZNAKŮ V PROGRAMU

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)

MapleCloud a jeho použ ití. Vladimír Žák

Program MediaLib. Program MediaLib slouží pro automatické skládání reklamních spotů do delších smyček.

KGG/STG Statistika pro geografy

Analýza rozptylu. Statistika II. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Matice se v některých publikacích uvádějí v hranatých závorkách, v jiných v kulatých závorkách. My se budeme držet zápisu s kulatými závorkami.

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

LuxRiot uživatelský manuál verze Uživatelský manuál Verze , Stasa s.r.o.,pokorného 14, , PRAHA

Příklad bezprostředně navazuje na předchozí příklad č. 17. Bez zvládnutí příkladu č. 17 není možné pokračovat

(Auto)korelační funkce Statistické vyhodnocování exp. dat M. Čada ~ cada

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Tomáš Karel LS 2012/2013

Funkce zadané implicitně

Ovládání a základy statistiky v softwaru STATISTICA

CAD Studio. Vypracoval: Ing. Lukáš Hrubý Strana 1 (celkem 11)

Programujeme v softwaru Statistica

SYSTÉM TECHNICKO-EKONOMICKÉ ANALÝZY VÝROBY TEKUTÉHO KOVU - CESTA KE SNIŽOVÁNÍ NÁKLADŮ

Dynamické metody pro predikci rizika

Když už má vykopané cesty, může postavit domyr opět přesně podle obrázku. Domy se objeví najednou. Program opět čeká.

MSI LS 2006/2007 Ing. Pavla Hošková, Ph.D., 2. test

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

Uživatelská doumentace

Analýza rozptylu. Přednáška STATISTIKA II - EKONOMETRIE. Jiří Neubauer

Analýza rozptylu ANOVA

1b. Ztráta tepla v závislosti na povrchu a objemu tělesa a na chladícím mediu

Okno Editoru nabízí v panelu nástrojů

Tvar dat a nástroj přeskupování

Zpracování chybějících dat a dat mimo rozsah

Jednofaktorová analýza rozptylu

Bezdrátová meteorologická stanice Focus Plus

Jestliže vše proběhlo tak, jak mělo, měl by výsledný materiál vypadat nějak takto:

N-trophy. kvalifikace KVÍK! Soòa Dvoøáèková - Kristýna Fousková - Martin Hanžl. Gymnázium, Brno-Øeèkovice.

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Transkript:

StatSoft Analýza rozptylu dvojného třídění V tomto příspěvku si ukážeme konkrétní práci v softwaru STATISTICA a to sice při detekci vlivu jednotlivých faktorů na chování laboratorních krys v bludišti. Tentokrát se nebude jednat o teoretický výklad, spíše půjde jen o postup v softwaru. Data Máme tři kmeny krys, jejichž obecná schopnost úspěšně se pohybovat v bludišti by se dala popsat jako dobrá, nestálá, nebo špatná. Čtyři krysy z každého kmenu byly vychovávány ve stimulujícím prostředí, čtyři v prostředí omezeném. Cílem je určit, zda kmen, prostředí nebo obojí má vliv na počet chyb, které krysa v bludišti udělá. Data k tomuto příkladu jsou v anglické podobě tohoto výukového příkladu v Soubor -> Otevřít příklady -> Datasets -> Rats.sta. Analýza - postup Neváhejte a pojďte si tento příklad krok za krokem naklikat s námi. Po načtení dat v softwaru STATISTICA volíme: Statistiky -> ANOVA -> dialog Obecná ANOVA/MANOVA -> Vícefaktorová ANOVA (jako Typ analýzy), v poli Metoda specifikace ponecháme Rychlé nastavení. Klikneme na OK. Zobrazí se dialog ANOVA/MANOVA Vícefaktorová ANOVA. Klikneme na tlačítko Proměnné a zvolíme Chyby jako závislou proměnnou a Kmen a Prostředí jako kategoriální prediktory. Klikneme dvakrát na OK a dostaneme se tak do dialogu ANOVA Výsledky. Tento dialog poskytuje spoustu možností pro volbu nejrůznějších výsledků. Jsou uspořádány na osmi záložkách. Pokud je vám tento počet záložek málo, tak je možné přepnout do ještě obsáhlejšího výsledkového dialogu stiskem tlačítka Více výsledků. Zpět do původního výsledkového dialogu se vrátíte stiskem tlačítka Méně. Nyní kliknutím na tlačítko Všechny efekty/grafy na záložce Základ zobrazíme dialog Tabulka všech efektů. Oba efekty (Prostředí i Kmen) jsou označeny jako významné (jsou označeny hvězdičkou *), ale efekt interakce (Prostředí*Kmen) významný není.

Poznámka: V praxi bychom model po těchto zjištěních pravděpodobně nadefinovali znova bez interakcí, tedy v menu dialog Obecná ANOVA/MANOVA nezvolíme Vícefaktorová ANOVA, ale ANOVA hlavních efektů. Nicméně protože je vliv interakcí na výsledek nepatrný a navíc si budeme moct ukázat, jak nevýznamné interakce poznat z grafu, budeme proto pokračovat v modelu s interakcemi. U analýzy rozptylu jsou marginální průměry jednou z hlavních charakteristik, které nám o souboru něco řeknou. Je možné je jednoduše vypočítat a zobrazit, například po vybrání (kliknutím) efektu interakce (Prostředí*Kmen) v tabulce výše (Tabulka všech efektů) a klikneme na OK. Zobrazí se dialog Uspořádání faktorů, v němž určíme, jak bude vypadat vytvořený graf. Pro účely tohoto příkladu nastavíme Kmen v seznamu Osa x, horní a Prostředí v seznamu Vzor čáry: Kliknutím na OK vytvoříme příslušný graf. Jasně vidíme, že krysy vychované v omezeném prostředí, dělaly více chyb než krysy vychované ve stimulujícím prostředí nezávisle na kmeni. Současně krysy se špatnou schopností orientovat se v bludišti dělaly nejvíc chyb, nejméně jich dělaly chytré krysy.

Z grafu je také vidět nevýznamnost interakcí, neboť obě křivky jsou rovnoběžné. Poznámka: Uveďme pro ilustraci i případy, jak by měl vypadat graf, který by významnost interakcí naopak prozrazoval. Tím by mohl být graf, kde by se jednotlivé spojnice průměrů faktorů křížily, nebo by se střední hodnota závisle proměnné v určité kombinaci faktorů významně odlišovala. V těchto případech by pravděpodobně šlo o statisticky významnou interakci. Druhý popisovaný případ ilustruje graf vlevo. Výsledky ANOVA lze zobrazit také ve formě tabulky kliknutím na tlačítko Všechny efekty na záložce Základ. Významné efekty jsou zvýrazněny červeně. Post-hoc testy Jak již bylo řečeno, v této analýze se projevil významný efekt faktorů Prostředí a Kmen. Zdůrazněme ovšem, že test významnosti nám neříká nic o tom, která (nebo které) ze skupin krys se od ostatních v počtu chyb významně liší. Abychom to zjistili, můžeme provést Post-hoc testy. Klikneme na tlačítko Více výsledků a následně na záložku Post-hoc: V poli Efekt zvolíme Kmen, abychom mohli provést porovnání marginálních průměrů pro tento efekt. Kliknutím na tlačítko Schefféův se v tabulce zobrazí výsledky Schefféova testu: Tato tabulka zobrazuje statistickou významnost rozdílů průměrů pro všechny páry skupin krys. Jak je vidět, pouze rozdíl mezi 1. a 3. skupinou, tj. mezi hloupými a chytrými krysami, je statisticky významný na hladině významnosti 0,05. Lze tedy utvořit závěr, že pouze hloupé krysy dělaly významně více chyb než krysy chytré, zatímco průměrné krysy se od zbývajících dvou skupin nijak významně neliší.

Předpoklady Výsledky samotné analýzy rozptylu máme. Ale jak naznačuje obrázek elektronické sestřičky našich zkoumaných krys, čeká nás ještě další klikání. Samozřejmě je třeba otestovat předpoklady, za kterých lze metodu ANOVA uplatňovat. Přepneme se proto na záložku Předpoklady: Normalita Prvním předpokladem analýzy rozptylu, který si ověříme, je normalita sledovaných vzorků. Musíme tedy ověřit předpoklad, že rozdělení závislé proměnné v jednotlivých skupinách je normální. Pro posouzení typu rozdělení závislé proměnné lze využít například normální pravděpodobnostní grafy, které jsou dostupné přímo na kartě Předpoklady. Nebo přes menu Grafy -> 2D Grafy > Normální pravděpodobnostní grafy Přes záložku grafy lze však zaškrtnout jako doplněk výstupu Shapiro Wilkův test, pomocí kterého lze otestovat nulovou hypotézu o normalitě konkrétního vzorku a tím podpořit vizuální odhad průběhu. Poznámka: Normální pravděpodobnostní grafy slouží jako vizuální pomůcka při testování předpokladu normality čím blíže jsou body v grafu okolo vykreslené přímky, tím blíže jsme normálnímu rozdělení. Pozor bychom si měli dávat především na nějaké systematické odchýlení od přímky, například esovitý průběh.

V případě, že by se jednalo o posouzení normality z hlediska úrovně jednoho faktoru, potom je jednoduché si přes záložku Anal. skup. vzorek rozgrupovat : V případě více faktorů a interakcí již není úplně jednoduché postihnout všechny možnosti, resp. v jednotlivých skupinách je následně velmi malé množství dat, bude proto lepší předpoklad normality otestovat po samotném odhadu parametrů modelu přímo na jeho reziduích. Přepneme na záložku Rezidua, ve které máme bohaté možnosti, jak se na tento vektor dívat. Buď se podíváme na normalitu reziduí přímo kliknutím na P-graf reziduí nebo to můžeme udělat ve dvou krocích, nejdříve si vygenerujeme rezidua do pracovního sešitu STATISTICA, to uděláme klepnutím na tlačítko Předpovědi a rezidua. V sešitu STATISTICA poté označíme tabulku reziduí jako aktivní vstup:

A zobrazíme si opět Normální pravděpodobnostní graf (přes menu grafy) a výsledky Shapiro-Wilkova testu, ze kterého si potvrdíme (p = 0,3810) vizuální odhad průběhu dat, tedy že nezamítáme nulovou hypotézu o reziduích. Dále je možné využít celé řady grafů, které jsou na kartě Rezidua přímo v analýze ANOVA. Homogenita rozptylů Dalším z předpokladů je homogenita rozptylů mezi skupinami. STATISTICA poskytuje několik testů tohoto předpokladu ve skupině Homogenita rozptylů/kovariancí na záložce Předpoklady. Vzhledem k normalitě dat použijeme pro účely tohoto příkladu Leveneův test (ANOVA).

Níže uvedená tabulka s výsledky tohoto testu nevykazuje žádné údaje indikující, že by rozptyl v jednotlivých skupinách byl statisticky významně odlišný (tj. podmínka homogenity rozptylů je splněna). Tím jsme ověřili předpoklady pro použití metod analýzy rozptylu na data s krysami. Více informací o možnostech v dialogu ANOVA výsledky se můžete dozvědět v odborném kurzu Analýza rozptylu. Závěr Jak se zdá z výsledků analýzy, můžeme s velkou pravděpodobností říci, že faktory genetických dispozic i prostředí výchovy mají významný efekt na schopnost krys pohybovat se v bludišti.