Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu.



Podobné dokumenty
Statistická analýza jednorozměrných dat

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Úvod do analýzy rozptylu

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

Jednofaktorová analýza rozptylu

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

4ST201 STATISTIKA CVIČENÍ Č. 7

3 ANALÝZA ROZPTYLU ANOVA

Jednofaktorová analýza rozptylu

Regresní a korelační analýza

Testování statistických hypotéz

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

STATISTICA Téma 7. Testy na základě více než 2 výběrů

Regresní a korelační analýza

= = 2368

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)

ADDS cviceni. Pavlina Kuranova

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

1.4 ANOVA. Vliv druhu plodiny na míru napadení houbami Fusarium culmorum a Fusarium graminearum v systému ekologického hospodaření

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie

PYTHAGORAS Statistické zpracování experimentálních dat

Testy statistických hypotéz

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA. Semestrální práce

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Analýza rozptylu. Statistika II. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Jana Vránová, 3. lékařská fakulta UK

Tomáš Karel LS 2012/2013

You created this PDF from an application that is not licensed to print to novapdf printer (

Stručný úvod do testování statistických hypotéz

Testování hypotéz o parametrech regresního modelu

Národní informační středisko pro podporu jakosti

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

S E M E S T R Á L N Í

Normální (Gaussovo) rozdělení

Test dobré shody v KONTINGENČNÍCH TABULKÁCH

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

INDUKTIVNÍ STATISTIKA

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

"Competitivness in the EU Challenge for the V4 countries" Nitra, May 17-18, 2006

Testování hypotéz o parametrech regresního modelu

KGG/STG Statistika pro geografy

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie

Plánování experimentu

Analýza rozptylu. Přednáška STATISTIKA II - EKONOMETRIE. Jiří Neubauer

Přednáška IX. Analýza rozptylu (ANOVA)

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Normální (Gaussovo) rozdělení

KGG/STG Statistika pro geografy

Cvičení ze statistiky - 9. Filip Děchtěrenko

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

12. cvičení z PST. 20. prosince 2017

Statistika. Testování hypotéz - statistická indukce Parametrické testy. Roman Biskup

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování statistických hypotéz. Obecný postup

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

15. T e s t o v á n í h y p o t é z

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

4ST201 STATISTIKA CVIČENÍ Č. 8

Masarykova univerzita v Brně. Analýza rozptylu. Vypracovala: Marika Dienová

Ing. Michael Rost, Ph.D.

Navrhování experimentů a jejich analýza. Eva Jarošová

, Brno Hanuš Vavrčík Základy statistiky ve vědě

Modul Analýza síly testu Váš pomocník při analýze dat.

Analýza rozptylu. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Srovnávání více než dvou průměrů

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

Analýza rozptylu. opakovaná měření faktoriální analýza rozptylu analýza kovariance vícerozměrná analýza rozptylu

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Kapitola VII. ANALYSA ROZPTYLU ANOVA.

Cvičení ze statistiky - 8. Filip Děchtěrenko

4EK211 Základy ekonometrie

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

STATISTICKÉ TESTY VÝZNAMNOSTI

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

Ilustrační příklad odhadu LRM v SW Gretl

Vzorová prezentace do předmětu Statistika

ÚVOD D OPTIMÁLNÍ PLÁNY

Testování hypotéz. 4. přednáška

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

STATISTICKÉ TESTY VÝZNAMNOSTI

Téma 9: Vícenásobná regrese

Analýza rozptylu ANOVA

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Transkript:

Analýza rozptylu Analýza rozptylu umožňuje ověřit významnost rozdílu mezi výběrovými průměry většího počtu náhodných výběrů, umožňuje posoudit vliv různých faktorů. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu. Analýza rozptylu se často označuje akronymem ANOVA ANalysis Of VAriance.

Analýza rozptylu Např. zjišťujeme vliv vzdělání (první nezávislý faktor A) a pohlaví (druhý nezávislý faktor B) na příjem (závislý kvantitativní faktor Y). Nezávislé faktory jsou zpravidla kvalitativní (pohlaví, vzdělání) ale mohou být i kvantitativní (věk). Cílem ANOVA je prokázat, že hodnoty znaků A,B - nezávislých faktorů, ovlivňují hodnoty kvantitativního znaku Y - závislého faktoru. ANOVA je lepší alternativou pro t-test v případě, že porovnáváme víc než dva průměry.

Jednofaktorová ANOVA Předpokládáme, že faktor A je pouze jeden a má k úrovní (hodnot x i ), s účinkem na znak Y, který lze vyjádřit vztahem: µ i = µ + α i kde µ i je průměr znaku Y v i-té úrovni, µ je celkový průměr znaku Y, α i je vliv faktoru A na znak Y v i-té úrovni. Předpokládáme, že hodnoty α i pocházejí z normálně rozdělené populace s nulovou střední hodnotou a konstantním rozptylem. Nulová hypotéza: H 0 : α 1 = α 2 =... = α k = 0 resp. µ 1 = µ 2 =... = µ k

Jednofaktorová ANOVA Součet čtverců odchylek od celkového průměru µ: k n i y ij 2 S c = i=1 j=1 lze rozložit na dvě složky: k S c = i=1 n i y ij i i 2 k = j=1 n i y ij i 2 i=1 j=1 kde S R je součet čtverců odchylek uvnitř jednotlivých úrovní a S A je součet čtverců odchylek mezi úrovněmi. Testuje se, zda je S A významné ve srovnání s S R. S R k n i i 2 i=1 S A =S R S A

Jednofaktorová ANOVA S c je s.č.o. od celkového průměru; S R je s.č.o. uvnitř jednotlivých úrovní; S A je s.č.o. mezi úrovněmi. S c = S R + S A Testovací kritérium: F = S A n k S R k 1 kde k je počet úrovní a n je celkový počet měření. Platí-li nulová hypotéza, má F statistika Fisherovo rozdělení F(k-1,n-k) s k-1 a n-k stupni volnosti. Je-li F > F α (k-1,n-k), můžeme nulovou hypotézu na hladině α zamítnout. Pro výpočet kritických hodnot lze využít Excelu: FINV(α;k-1;n-k ).

ANOVA v Excelu Některé varianty ANOVA lze vypočítat v Excelu. Instalace: V menu: Soubor Možnosti Doplňky, dole na kartě Spravovat: vybrat Doplňky aplikace Excel, zmáčknout tlačítko Přejít, zaškrtnout Analytické nástroje a zmáčknout tlačítko OK. Spuštění: V menu: Data Analýza dat Podle potřeby vybrat Anova: Jeden faktor Anova: Dva faktory s opakováním Anova: Dva faktory bez opakování

Jednofaktorová ANOVA v Excelu Po písemce z Fyziky II bylo vybráno podle abecedy po 12 studentech studijních programů CHTM, CHTP a PI. Body těchto studentů byly zapsány do tabulky: CHTM 33 44 42 52 12 13 70 35 20 36 8 70 CHTP 48 34 38 1 50 5 44 47 15 58 35 2 PI 30 18 75 70 62 68 45 30 18 9 7 8

Jednofaktorová ANOVA v Excelu Zadání parametrů:

Výstup: Jednofaktorová ANOVA v Excelu F = S A n k S R k 1

Jednofaktorová ANOVA Zamítneme-li nulovou hypotézu, víme, že některé se liší od ostatních. Které to jsou? Scheffého metoda vícenásobného porovnání: Je-li i j k 1 n k S R F k 1, n k [ 1 n i 1 n j ] lze nulovou hypotézu µ i = µ j zamítnout.

Dvoufaktorová ANOVA Posuzujeme vliv dvou faktorů A a B na různých úrovních. Kombinace faktorů tvoří mřížkovou strukturu. Mřížka se skládá z cel. (i,j) -tá cela odpovídá kombinaci úrovně A i faktoru A a B j faktoru B. B 1 B 2 B 3 A 1 A 2 cela (2,1) A 3 Je-li v každé cele jedna hodnota, mluvíme o ANOVA bez opakování. Je-li v některé cele více než jedna hodnota, mluvíme o ANOVA s opakováním. Budeme se zabývat pouze případem, kdy je v každé cele stejný počet hodnot p (tzv. vyvážená třídění).

Dvoufaktorová ANOVA Předpokládáme, že existují dva faktory A a B, které mají k, resp. m úrovní, s účinkem na znak Y, který lze vyjádřit vztahem: µ ij = µ + α i + β j + γ ij kde µ ij je průměr znaku Y v (i,j)-té cele, µ je celkový průměr znaku Y, α i je vliv faktoru A na znak Y v i-té úrovni, β j je vliv faktoru B na znak Y v j-té úrovni, γ i,j charakterizuje interakci mezi faktory. Nulová hypotéza pro všechny skupiny (úrovně faktoru A): H 0 : α 1 = α 2 =... = α k = 0 Nulová hypotésa pro všechny bloky (úrovně faktoru B): H 0 ': β 1 = β 2 =... = β m = 0

Označme: µ i. - průměr v i-té skupině µ. j - průměr v j-tém bloku µ - celkový průměr k S c = i=1 m p r=1 j=1 k S A =mp i=1 m S B =kp k S = R i=1 j=1 m p j=1 r=1 Dvoufaktorová ANOVA y ijr 2 celkový součet čtverců i. 2 meziskupinový součet čtverců. j 2 meziblokový součet čtverců S c = S A + S B + S AB + S R y ijr i.. j 2 vnitroskupinový-blokový s. č.

Dvoufaktorová ANOVA s opakováním Pro ověření nulové hypotézy H 0 použijeme statistiku F A = n k m 1 S A k 1 S R která má při platnosti nulové hypotézy Fisherovo rozdělení F(k-1,n-k-m+1). Kritickou hodnotu vypočítáme v Excelu pomocí funkce =FINV(α;k-1;n-k-m+1). Analogicky pro ověření hypotézy H 0 ' použijeme statistiku F B = n k m 1 S A m 1 S R která má při platnosti nulové hypotézy Fisherovo rozdělení F(m-1,n-k-m+1). V obou případech nulovou hypotézu zamítneme, je-li F A resp. F B větší než příslušná hodnota Fisherova rozdělení.

Dvoufaktorová ANOVA Po písemce z Fyziky II bylo vybráno podle abecedy po 12 studentech studijních programů CHTM, CHTP a PI, vždy 6 studentů a 6 studentek. Máme 2 faktory (program a pohlaví) a 6 hodnot v každé cele (s opakováním). Poznámky: 1) Vstupní oblast musí obsahovat i záhlaví tabulky. 2) V každé cele musí být stejný počet hodnot.

Dvoufaktorová ANOVA Výběr - meziskupinový SS (faktor A) Sloupce - meziblokový SS (faktor B) Interakce - SS pro interakci nezi faktory A, B Dohromady -vnitroskupinový SS Celkem - celkový SS

Dvoufaktorová ANOVA Zjistili jsme, že není rozdíl mezi obory, ale je rozdíl mezi pohlavími. Pokusme se ověřit t-testem rozdíl mezi pohlavími: pohlaví průměr rozptyl směr. odch. studenti 43.28 405.39 20.13 studentky 30.28 270.21 16.44 t = 2.21 t krit (0.05) = 2.02 α = 0.041 Je rozdíl mezi studenty CHTP a PI? program průměr rozptyl směr. odch. CHTP 32.17 250 15.82 PI 53.83 565 23.79 t = 1.86 t krit (0.05) = 2.23 α = 0.093 t = 1 2 2 1 2 N 1 2 N 2

Dvoufaktorová ANOVA s opakováním Zamítneme-li nulovou hypotézu, víme, že některé se liší od ostatních. Které to jsou? Scheffého metoda vícenásobného porovnání: Je-li i t 2 k 1 mp n km S F R k 1, n km lze nulovou hypotézu µ i = µ t zamítnout. Je-li j t 2 m 1 kp n km S R F m 1, n km lze nulovou hypotézu µ j = µ t zamítnout.