ANOVA PSY252 Statistická analýza dat II

Podobné dokumenty
Analýza rozptylu. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Srovnávání více než dvou průměrů

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

Statistické testování hypotéz II

ADDS cviceni. Pavlina Kuranova

Analýza rozptylu. opakovaná měření faktoriální analýza rozptylu analýza kovariance vícerozměrná analýza rozptylu

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Statistika, Biostatistika pro kombinované studium. Jan Kracík

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Design Experimentu a Statistika - AGA46E

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

Vymezení důležitých pojmů. nulová hypotéza, alternativní hypotéza testování hypotézy hladina významnosti (alfa) chyba I. druhu, chyba II.

VÝUKA: Biostatistika základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Tabulka 1 Rizikové online zážitky v závislosti na místě přístupu k internetu N M SD Min Max. Přístup ve vlastním pokoji ,61 1,61 0,00 5,00

Seminář 6 statistické testy

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

Přednáška IX. Analýza rozptylu (ANOVA)

Úvod do analýzy rozptylu

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

5EN306 Aplikované kvantitativní metody I

Jednofaktorová analýza rozptylu

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

4ST201 STATISTIKA CVIČENÍ Č. 10

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Statistická analýza jednorozměrných dat

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

ANOVA analýza rozptylu

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Aplikovaná statistika v R - cvičení 2

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Tomáš Karel LS 2012/2013

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.

Seminář 6 statistické testy

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu.

Pozn. přeskakuji zde popisnou statistiku, jinak by měla být součástí každé analýzy.

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Aplikovaná statistika v R - cvičení 3

Statistická analýza dat

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Technická univerzita v Liberci

Jednostranné intervaly spolehlivosti

Vzorová prezentace do předmětu Statistika

Cronbachův koeficient α nová adaptovaná metoda uvedení vlastností položkové analýzy deskriptivní induktivní parametrické

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination.

Jednofaktorová analýza rozptylu

KGG/STG Statistika pro geografy

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty

ANALÝZA ROZPTYLU (ANOVA)

5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

Analýza rozptylu. Statistika II. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Regresní a korelační analýza

STATISTICA Téma 7. Testy na základě více než 2 výběrů

Intervaly spolehlivosti

Testování statistických hypotéz

Inovace bakalářského studijního oboru Aplikovaná chemie

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

Korelace. Komentované řešení pomocí MS Excel

Navrhování experimentů a jejich analýza. Eva Jarošová

Národní informační středisko pro podporu jakosti

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Jste aktivní sportovec?(pravidelně sportuji alespoň 2x týdně) Jakým sportovním činnostem se pravidelně věnujete? (alespoň 1 x za dva týdny v sezóně)

Analýza rozptylu. Přednáška STATISTIKA II - EKONOMETRIE. Jiří Neubauer

Plánování experimentu

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

Normální (Gaussovo) rozdělení

Cvičení ze statistiky - 9. Filip Děchtěrenko

Vícerozměrné metody. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Schematický úvod

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

Téma 9: Vícenásobná regrese

Testy. Pavel Provinský. 19. listopadu 2013

LINEÁRNÍ MODELY. Zdeňka Veselá

= = 2368

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

Návod na vypracování semestrálního projektu

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

Cvičící Kuba Kubina Kubinčák Body u závěrečného testu

Tomáš Karel LS 2012/2013

"Competitivness in the EU Challenge for the V4 countries" Nitra, May 17-18, 2006

INDUKTIVNÍ STATISTIKA

Základy navrhování průmyslových experimentů DOE

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie

odpovídá jedna a jen jedna hodnota jiných

Zadání Máme data hdp.wf1, která najdete zde: Bodová předpověď: Intervalová předpověď:

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

KORELACE. Komentované řešení pomocí programu Statistica

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

Transkript:

ANOVA 9. 11. 2011 PSY252 Statistická analýza dat II

Program dnešní přednášky jednofaktorová (one-way) ANOVA faktoriální (two -way) ANOVA ANCOVA (ANOVA s kovariáty) MANOVA (ANOVA s více závislými)

ANOVA (analysis of variance) Liší se 2 skupiny v průměrné hodnotě nějaké proměnné? t-test Liší se 3 (a více) skupiny v průměrné hodnotě nějaké proměnné? ANOVA Liší se Češi, Romové a Ukrajinci ve své důvěře k českým institucím? Liší se průměrná tepová frekvence participantů, kteří byli vystavení podnětu A, podnětu B a žádnému podnětu (kontrolní skupina)?

ANOVA (analysis of variance) Liší se 2 skupiny v průměrné hodnotě nějaké proměnné? t-test Liší se 3 (a více) skupiny v průměrné hodnotě nějaké proměnné? ANOVA Liší se Češi, Romové a Ukrajinci ve své důvěře k českým institucím? Liší se průměrná tepová frekvence participantů, kteří byli vystavení podnětu A, podnětu B a žádnému podnětu (kontrolní skupina)? 1 nezávislá kategorická 1 závislá intervalová

ANOVA ANOVU v zásadě provádíme ve 2 krocích: KROK 1: Existuje mezi skupinami nějaká odlišnost? spočítáme statistiku F a testujeme, zda překračuje kritickou hodnotu Pokud NE konec Pokud ANO KROK 2: Mezi jakými skupinami konkrétně tato odlišnost existuje? máme o tom hypotézy plánované kontrasty nemáme o tom hypotézy post-hoc testy

ANOVA jako regrese Hodnota nezávislé proměnné člověka i Y i = μ + ε i Nevysvětlená individuální variabilita Celkový průměr

ANOVA jako regrese Hodnota nezávislé proměnné člověka i Y i = μ + ε i Nevysvětlená individuální variabilita Celkový průměr Y ij = μ + α j + ε ij Vliv toho, že je člověk členem skupiny j

ANOVA jako regrese Hodnota nezávislé proměnné člověka i Y i = μ + ε i Nevysvětlená individuální variabilita Celkový průměr Y ij = μ + α j + ε ij Podstata ANOVY Vliv toho, že je člověk Jak dobře je závislá proměnná vysvětlena modelem, který členem skupiny j předpokládá odlišnost skupin (α 0)? Nepostačí nám stejně dobře model, který předpokládá, že se skupiny neliší?

ANOVA jako regrese Členství v některých organizacích snižuje materialismus adolescentů. Nezávislá kategorická proměnná: organizace 3 hodnoty: náboženská, občanská, sportovní Závislá intervalová proměnná: materialismus Liší se členové náboženských, občanských a sportovních organizací ve svém materialismu?

ANOVA jako regrese [mater] i = *průměrný mater+ + ε i [mater] i = *průměrný mater+ + b 1 [organizace] + ε i

ANOVA jako regrese [mater] i = *průměrný mater+ + ε i [mater] i = *průměrný mater+ + b 1 [organizace] + ε i Každá kategorická proměnná o k hodnotách (úrovních) může být vyjádřena souborem k-1 binárních dummy proměnných. 3 typy organizací 2 binární proměnné nab a obc nab = 1 & obc = 0 člen náboženské organizace nab = 0 & obc = 1 člen občanské organizace nab = 0 & obc = 0 člen sportovního oddílu

ANOVA jako regrese [mater] i = *průměrný mater+ + ε i [mater] i = *průměrný mater+ + b 1 [organizace] + ε i Každá kategorická proměnná o k hodnotách (úrovních) může být vyjádřena souborem k-1 binárních dummy proměnných. 3 typy organizací 2 binární proměnné nab a obc nab = 1 & obc = 0 člen náboženské organizace nab = 0 & obc = 1 člen občanské organizace nab = 0 & obc = 0 člen sportovního oddílu [mater] i = b 0 + b 1 [nab] + b 2 [obc] + ε i

ANOVA jako regrese [mater] i = *průměrný mater+ + ε i [mater] i = *průměrný mater+ + b 1 [organizace] + ε i Každá kategorická proměnná o k hodnotách (úrovních) může být vyjádřena souborem k-1 binárních dummy proměnných. 3 typy organizací 2 binární proměnné nab a obc O kolik se liší O kolik se liší Průměrný nab = 1 & průměrný obc = 0 člen průměrný náboženské organizace mater. nab členů = 0 & mater. obc = členů 1 člen mater. občanské členů organizace sportovních nab = 0 & náboženských obc = 0 člen občanských sportovního oddílu oddílů organizací organizací [mater] i = b 0 + b 1 [nab] + b 2 [obc] + ε i

ANOVA jako regrese [mater] i = b 0 + b 1 [nab] + b 2 [obc] + ε i Jestliže b 1 = 0 a b 2 = 0, znamená to, že skupinová příslušnost nemá žádný vliv a všechny skupiny mají stejný průměrný materialismus. Potom by nám postačil základní model predikující materialismus pouze z celkového průměrného materialismu a nevysvětlitelné individuální variability. Vysvětlí nám model předpokládající nenulové b 1 a/nebo b 2 něco navíc?

Model sum of squares ANOVA statistika F SS M kolik variability závislé proměnné dokáže vysvětlit model, který předpokládá odlišnost skupin (tj. že záleží na členství ve skupině) SS M = velikost skupiny j * (průměr skupiny j celkový průměr) 2 Mean squares: MS M = SS M / df M df M = (počet skupin 1) Resudial sum of squares SS R kolik variability závislé proměnné zůstává nevysvětleno tímto modelem SS R = (hodnota člověka i ze skupiny j průměr skupiny j) 2 Mean squares: MS R = SS R / df R df R = (celkový počet lidí počet skupin).: Total sum of squares: SS T = SS M + SS R = celkový rozptyl * (celkový počet lidí 1)

ANOVA statistika F F = MS M / MS R poměr toho, co model vysvětlit dokáže, ku tomu, co vysvětlit nedokáže čím vyšší F, tím více záleží na rozdělení lidí do jednotlivých skupin, tj. tím více se skupiny od sebe liší v závislé proměnné jde o výběrovou statistiku, která má specifické rozložení, definované dvojicí stupňů volnosti (df M, df R ) můžeme určit kritickou hodnotu (na určité hladině významnosti) a testovat, zda ji hodnota F v našem výzkumu překračuje, tj. testovat statistickou významnost nalezených rozdílů mezi skupinami

ANOVA předpoklady nezávislost pozorování ( ANOVA pro opakovaná měření) normalita rozložení (v rámci každé skupiny) narušení nevadí, pokud jsou skupiny stejně velké + mají velikost alespoň okolo 30 neparametrická alternativa Kruskal-Wallisův test homogenita rozptylů (skupiny mají stejné rozptyly) Levenův test chceme, aby byl nesignifikantní s 2 max / s 2 min < 3 narušení by nemělo vadit, pokud jsou skupiny stejně velké při narušení lze použít Welchovo F

ANOVA SPSS Analyze Compare Means One-Way ANOVA Sum of Squares df Mean Square F Sig. Between Groups SS M df M MS M Within Groups SS R df R MS R Total SS T df M + df R

ANOVA Máme hypotézy o konkrétních rozdílech mezi skupinami. H1: Průměrný materialismus členů sportovních organizací je vyšší než členů organizací zaměřených na vyšší otázky. H2: Průměrný materialismus členů náboženských organizací je nižší než průměrný materialismus členů občanských organizací.

ANOVA plánované kontrasty umožňují porovnat jednotlivé skupiny v jednom kroku bez nutnosti korigovat hladinu významnosti (a snižovat tak sílu testu) jen když máme dopředu hypotézy kontrastů lze provést tolik, kolik je počet skupin 1 každý kontrast srovnává 2 průměry průměr skupiny nebo průměr více skupin dohromady např. SPORT vs. NÁB+OBČ nebo NÁB vs. OBČ ortogonální (nezávislé) kontrasty skupina použitá v jednom srovnání není použitá v dalším neortogonální kontrasty

ANOVA plánované kontrasty zkoumáme, zda daný kontrast (rozdíl mezi dvěma průměry) signifikantně přispívá k variabilitě vysvětlené modelem (SS M ) abychom to zjistili, jakoby překódujeme hodnoty dummy proměnných, aby odhadnuté parametry (b 1, b 2 atd.) odrážely požadované kontrasty [mater] i = b 0 + b 1 [nab] + b 2 [obc] + ε i [mater] i = b 0 + b 1 [kontrast1] + b 2 [kontrast2] + ε i Kategorie Kontrast 1 SPORT vs. NÁB+OBČ Kontrast 2 NÁB vs. OBČ SPORT -2 0 NÁB 1 1 OBČ 1-1

ANOVA plánované kontrasty zkoumáme, zda daný kontrast (rozdíl mezi dvěma Součet průměry) pro signifikantně přispívá k variabilitě vysvětlené modelem (SS M ) každý abychom to zjistili, jakoby překódujeme hodnoty kontrast dummy musí proměnných, aby být 0 odhadnuté parametry (b 1, b 2 atd.) odrážely požadované kontrasty [mater] i = b 0 + b 1 [nab] + b 2 [obc] + ε Srovnávané i skupiny musí mít odlišná znaménka Kategorie Kontrast 1 SPORT vs. NÁB+OBČ [mater] i = b 0 + b 1 [kontrast1] + b 2 [kontrast2] + ε i Kontrast 2 NÁB vs. OBČ Skupina, kterou nechceme zahrnout 0 SPORT -2 0 NÁB Skupiny brané dohromady 1 1 OBČ musí mít stejné číslo 1-1

ANOVA post-hoc testy používáme, pokud nemáme dopředu jasné hypotézy srovnávají vše se vším každou skupinu s každou mají v sobě mechanismy zohledňující zvýšené riziko chyby I. typu z principu jsou oboustranné je jich mnoho liší se v několika parametrech: konzervativní (ch. II. typu!) / liberální (ch. I. typu!) ne/vhodné pro rozdílně velké skupiny ne/vhodné pro rozdílné skupinové rozptyly

ANOVA post-hoc testy Doporučení podle A. Fielda: stejně velké skupiny a skupinové rozptyly (ideální situace): REGWQ nebo Tukey pokud si chceme být jistí, že neuděláme chybu I. typu: Bonferroni pokud jsou velikosti skupin trochu/hodně rozdílné: Gabriel/Hochberg GT2 pokud pochybujeme o shodnosti skupinových rozptylů: Games-Howell

ANOVA reportování F(df M, df R ) =, p =, η 2 nebo ω 2 = vždy uvádět deskriptivy pro každou skupinu alespoň velikost, průměr, směrodatnou odch. vždy dopočítat velikost účinku (interpretujeme jako R 2 v lineární regresi) η 2 = SS M / SS T ω 2 = [SS M (df M )MS R ] / [SS T + MS R ] df M a df R musejí být uváděny v tomto pořadí U kontrastů uvádíme: t(df) =, p =, d nebo r = r = odmocnina[t 2 / (t 2 + df)]

V modelu je pouze jeden faktor. Člověk je však ve skutečnosti obvykle členem více skupin najednou, což může mít vliv! Provedeme více ANOV pro různé faktory (skupiny). Tím se však vrátí známý problém s nárůstem rizika chyby I. typu. Navíc přijdeme o možnost posoudit vliv všech faktorů najednou v jednom modelu. Můžeme přidat přímo do modelu další nezávislé kategorické proměnné a spočítat tzv. faktoriální ANOVU.

Faktoriální ANOVA ANOVA s více kategorickými nezávislými (faktory) uplatnění v experimentálních designech, kde pracujeme s několika druhy experimentální manipulace nebo kde chceme zohlednit kromě experimentální manipulace i další proměnné (např. pohlaví) uplatnění v neexperimentálních designech, kde chceme posoudit vliv více kategorických prediktorů najednou

Typy faktorů ve vícefaktoriálních designech Fixed factors všechny úrovně faktoru, o které nám jde, jsou v našem výzkumu zahrnuty Liší se materialismus mezi danými třemi typy organizací? Liší se materialismus podle pohlaví? Random factors úrovně faktoru, zahrnuté v našem výzkumu, představují pouze náhodný vzorek z větší populace Liší se materialismus mezi organizacemi? Liší se materialismus podle školy, kterou adolescent navštěvuje?

One-way ANOVA Y ij = μ + α j + ε ij Faktoriální ANOVA Y ijk = μ + α j + β k + γ j x k + ε ijk

One-way ANOVA Y ij = μ + α j + ε ij Faktoriální ANOVA Y ijk = μ + α j + β k + γ j x k + ε ijk Vliv toho, že je člověk členem kombinace skupin j a k

One-way ANOVA Y ij = μ + α j + ε ij Faktoriální ANOVA Y ijk = μ + α j + β k + γ j x k + ε ijk Vliv toho, že je člověk členem kombinace skupin j a k Interakce

Faktoriální ANOVA - interakce situace, kdy vliv dvou (či více) nezávislých proměnných na závislou proměnnou není pouhým součtem jejich jednotlivých vlivů s měnící se hladinou jedné nezávislé se mění vliv druhé nezávislé na závislou proměnnou nezávislá proměnná nemusí mít žádný přímý vliv (main effect) na závislou proměnnou, ale může ji ovlivňovat tím, že ovlivňuje vliv druhé nezávislé při interpretaci interakcí je obvykle velmi užitečné znázornění formou grafu

Faktoriální ANOVA - interakce dvě kategorické proměnné (případ faktoriální ANOVY) Školní šikana (verbální, fyzická) má jiný vliv na depresivitu u dívek než u chlapců.

Depresivita Faktoriální ANOVA - interakce dvě kategorické proměnné (případ faktoriální ANOVY) Školní šikana (verbální, fyzická) má jiný vliv na depresivitu u dívek než u chlapců. žádná interakce Fyzická Verbální = Dívky Chlapci Žádná Chlapci Dívky Žádná Verbální Fyzická

Depresivita Faktoriální ANOVA - interakce dvě kategorické proměnné (případ faktoriální ANOVY) Školní šikana (verbální, fyzická) má jiný vliv na depresivitu u dívek než u chlapců. Fyzická interakce Verbální = Dívky Chlapci Žádná Chlapci Dívky Žádná Verbální Fyzická

síla tělesné reakce Faktoriální ANOVA - interakce dvě kategorické proměnné (případ faktoriální ANOVY) Školní šikana (verbální, fyzická) má jiný vliv na depresivitu u dívek než u chlapců. kategorická a intervalová proměnná Tělesná reakce na podání léku se mění s rostoucí hmotností člověka. 2 tablety 1 tableta Placebo hmotnost (kg)

Faktoriální ANOVA - interakce dvě kategorické proměnné (případ faktoriální ANOVY) Školní šikana (verbální, fyzická) má jiný vliv na depresivitu u dívek než u chlapců. kategorická a intervalová proměnná Tělesná reakce na podání léku se mění s rostoucí hmotností člověka. dvě intervalové proměnné S rostoucím příjmem se oslabuje vztah mezi spokojeností v práci a celkovou životní spokojeností.

Faktoriální ANOVA organizace: Má členství v náboženských, občanských a sportovních organizacích vliv na materialismus? pohlaví: Má pohlaví vliv na materialismus? interakce: Má členství v organizacích rozdílný vliv na chlapce a dívky co se týče materialismu? Sportovní Náboženské Občanské Chlapci Dívky

Faktoriální ANOVA - předpoklady Vše, co v případě one-way ANOVY Počet případů Sport. Nábož. Obč. Pro každou kombinaci faktorů by měl být zastoupený dostatečný počet případů. Lze posoudit na základě jednoduché kontingenční tabulky. Případnou nevyváženost lze částečně zohlednit zvoleným typem analýzy. Kluci 60 8 34 Holky 2 72 35

Faktoriální ANOVA v SPSS Analyze Generalized Linear Model Univariate celková vysvětlená variabilita (SS M ) je rozsekána zvlášť pro kovariát(y) a faktor(y) Source Type X Sum of Squares df Mean Square F Sig. Corrected Model SS M df M MS M Intercept Faktor1 SS Faktor1 df Faktor1 MS Faktor1 Faktor2 SS Faktor2 df Faktor2 MS Faktor2 Faktor1*Faktor2 SS Interakce F1*F2 df Int. F1*F2 MS Int. F1*F2 Error SS R df R MS R Total Každý faktor a interakce má vlastní statistiku F, proto lze posoudit, zda je signifikantním prediktorem závislé proměnné Corrected Total SS T df M +df R

Faktoriální ANOVA reportování Uvádíme zvlášť, jaký efekt měl každý faktor (main effect) nebo interakce faktorů: F(df Faktor, df R ) =, p =, parciální η 2 parciální η 2 = SS Faktor / (SS Faktor + SS R ) + případné kontrasty a post-hoc testy jako u ANOVY

V některých situacích má smysl předpokládat, že je závislá proměnná ovlivňována nejen faktory, ale i intervalovými nezávislými proměnnými. Potřebujeme tedy model, který bude kombinovat kategorické a intervalové nezávislé proměnné. Proč zavádět intervalové nezávislé do ANOVY: snížíme množství nevysvětlené variability v modelu kontrolujeme, zda není vliv faktorů zkreslen nějakou související intervalovou proměnnou přesnější posouzení vlivu faktorů Příklad: Materialismus může souviset s tím, co adolescenti slyší doma. Pokud budeme tuto proměnnou kontrolovat, získáme představu o vlivu organizací na materialismus adolescentů, který je očištěný od možného vlivu rodiny.

ANCOVA (analysis of covariance) ANOVA s jednou či více nezávislými intervalovými proměnnými (tzv. kovariáty) zavádět jen kovariáty, pro které existují dobré důvody (nenacpat tam vše, co jsme měřili) dobře zvolené kovariáty zvýšení síly testu kovariát odebere část nevysvětlené variability závislé proměnné, čímž se lépe projeví případný vliv faktorů špatně zvolené kovariáty snížení síly testu za každý přidaný kovariát ztrácíme jeden stupeň volnosti uplatnění v experimentálních designech, kde chceme statisticky kontrolovat nežádoucí rozdíly mezi skupinami uplatnění v neexperimentálních designech, kde chceme statisticky kontrolovat intervalové prediktory a posoudit tak nezkreslený vliv kategorických prediktorů

One-way ANOVA Y ij = μ + α j + ε ij ANCOVA Y ijk = μ + α j + βx ij + ε ijk Vliv toho, že je člověk členem skupiny j

ANCOVA - předpoklady předpoklady ANOVY + předpoklady lineární regrese kovariát a skupinová příslušnost musí být nezávislé pokud nejsou, je obtížné interpretovat výsledky obdoba požadavku nekorelovaných prediktorů u vícenásobné lineární regrese lze testovat dopředu jednoduchou ANOVOU (přičemž chceme, aby vyšla nesignifikantní) kovariát musí mít ve všech skupinách stejně silný vliv na závislou proměnnou lze testovat zavedením interakce do modelu (přičemž chceme, aby vyšla nesignifikantní)

ANCOVA v SPSS Analyze Generalized Linear Model Univariate celková vysvětlená variabilita (SS M ) je rozsekána zvlášť pro kovariát(y) a faktor(y) Source Type X Sum of Squares df Mean Square F Sig. Corrected Model SS M df M MS M Intercept Kovariát1 SS Kovariát1 df Kovariát1 MS Kovariát1 Faktor1 SS Faktor1 df Faktor1 MS Faktor1 Error SS R df R MS R Total Corrected Total SS T df M +df R můžeme si nechat zobrazit upravené skupinové průměry

ANCOVA reportování Uvádíme, jaký efekt měl každý kovariát: F(df Kovariát, df R ) =, p =, r = pro jednotlivé kovariáty vždy df Kovariát = 1 r = odmocnina[t 2 / (t 2 + df)] A uvádíme, jaký efekt měl každý faktor: F(df Faktor, df R ) =, p =, parciální η 2 = parciální η 2 = SS Faktor / (SS Faktor + SS R ) + případné kontrasty a post-hoc testy jako u ANOVY

MANOVA (multivariační ANOVA) ANOVA s více závislými intervalovými proměnnými posuzujeme vliv nezávislých proměnných na lineární kombinaci závislých proměnných pracujeme s multivariační obdobou F bereme v úvahu nejen (ne)vysvětlený rozptyl, ale i (ne)vysvětlenou kovarianci mezi závislými proměnnými výhody oproti sérii více ANOV kontrolujeme nárůst rizika chyby I. typu lze odhalit vztah ke kombinaci závislých proměnných nevýhody obtížná interpretace výsledků málokdy přinese nové informace oproti ANOVĚ vyžaduje splnění dalších předpokladů, které nelze jednoduše otestovat v SPSS (multivariační normalita)

Úkol na seminář Otestujte hypotézy předpokládající nějaké kontrasty mezi 3 či více skupinami (one-way ANOVA s následnými kontrasty) + Otestujte hypotézu předpokládající interakci mezi 2 faktory (faktoriální ANOVA) zde nemusíte dopočítávat kontrasty můžete (ale nemusíte) do modelu zahrnout i nějaký kovariát při interpretaci se neomezujte pouze na konstatování, že ne/byl nalezen signifikantní interakční efekt, ale rovněž popište (nejlépe na základě grafů), v čem konkrétně tato interakce spočívá