Jednofaktorová analýza rozptylu

Podobné dokumenty
KGG/STG Statistika pro geografy

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Vzorová prezentace do předmětu Statistika

Úvod do analýzy rozptylu

7. Analýza rozptylu.

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

Statistika. Testování hypotéz - statistická indukce Parametrické testy. Roman Biskup

Statistická analýza jednorozměrných dat

Jednofaktorová analýza rozptylu

Masarykova univerzita v Brně. Analýza rozptylu. Vypracovala: Marika Dienová

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Přednáška IX. Analýza rozptylu (ANOVA)

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

STATISTICA Téma 7. Testy na základě více než 2 výběrů

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

= = 2368

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

ADDS cviceni. Pavlina Kuranova

12. cvičení z PST. 20. prosince 2017

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

Testování statistických hypotéz

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

Cvičení 9: Neparametrické úlohy o mediánech

5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu.

Charakteristika datového souboru

STATISTICKÉ TESTY VÝZNAMNOSTI

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Stručný úvod do testování statistických hypotéz

Testy statistických hypotéz

Testování statistických hypotéz

Testy. Pavel Provinský. 19. listopadu 2013

Testování statistických hypotéz

Opakování. Neparametrické testy. Pořadí. Jednovýběrový Wilcoxonův test. t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Návod na vypracování semestrálního projektu

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

NEPARAMETRICKÉ TESTY

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA. Semestrální práce

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

1.4 ANOVA. Vliv druhu plodiny na míru napadení houbami Fusarium culmorum a Fusarium graminearum v systému ekologického hospodaření

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

15. T e s t o v á n í h y p o t é z

Zápočtová práce STATISTIKA I

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

4ST201 STATISTIKA CVIČENÍ Č. 7

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

Vybrané partie z biostatistiky

Ing. Michael Rost, Ph.D.

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

15. T e s t o v á n í h y p o t é z

ANALÝZA ROZPTYLU (ANOVA)

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Regresní analýza. Eva Jarošová

KORELACE. Komentované řešení pomocí programu Statistica

Jana Vránová, 3. lékařská fakulta UK

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.

Normální (Gaussovo) rozdělení

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

, Brno Hanuš Vavrčík Základy statistiky ve vědě

Průzkumová analýza dat

You created this PDF from an application that is not licensed to print to novapdf printer (

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

Přednáška X. Testování hypotéz o kvantitativních proměnných

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

Normální (Gaussovo) rozdělení

PRAVDĚPODOBNOST A STATISTIKA

4EK211 Základy ekonometrie

TECHNICKÁ UNIVERZITA V LIBERCI

Náhodné veličiny, náhodné chyby

KGG/STG Statistika pro geografy

S E M E S T R Á L N Í

Cvičení ze statistiky - 8. Filip Děchtěrenko

Cvičení 12: Binární logistická regrese

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

STATISTICKÉ TESTY VÝZNAMNOSTI

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

Statistika. Testování hypotéz statistická indukce Neparametrické testy. Roman Biskup

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Vysoká škola ekonomická v Praze

Transkript:

Jednofaktorová analýza rozptylu David Hampel Ústav statistiky a operačního výzkumu, Mendelova univerzita v Brně Kurz pokročilých statistických metod Global Change Research Centre AS CR, 5 7 8 2015 Tato akce se koná v rámci projektu: Vybudování vědeckého týmu environmentální metabolomiky a ekofyziologie a jeho zapojení do mezinárodních sítí (ENVIMET; rč CZ107/2300/200246) realizovaného v rámci Operačního programu Vzdělávání pro konkurenceschopnost David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 1 / 46

Obsah 1 Motivace 2 Předpoklady a označení 3 Matematický model 4 Testování hypotézy o shodě středních hodnot 5 Testování hypotézy o shodě rozptylů 6 Post-hoc metody mnohonásobného porovnávání 7 Doporučený postup při provádění analýzy rozptylu David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 2 / 46

Motivace V určitých případech je máme za úkol rozhodnout o rovnosti tří a více středních hodnot Pro analýzu je třeba splnit určité předpoklady Nakonec je žádoucí zjistit, které konkrétní střední hodnoty se od sebe liší David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 3 / 46

Předpoklady a označení Jednofaktorová analýza rozptylu též analýza rozptylu jednoduchého třídění (ONEWAY, speciální případ vícefaktorové analýzy rozptylu ANOVA) zkoumá závislost intervalové či poměrové proměnné X na nominální proměnné A, která má aspoň dvě varianty Proměnná A se nazývá faktor a její varianty úrovně faktoru Závislost X na A se projeví tím, že existuje statisticky významný rozdíl v průměrech proměnné X v náhodných výběrech, které vznikly tříděním podle variant proměnné A David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 4 / 46

Předpoklady a označení Metodu ANOVA odvodil R A Fisher ve 30 letech 20 století Její podstata spočívá v tom, že celkový rozptyl sledované proměnné X se rozloží na rozptyl uvnitř jednotlivých výběrů a na rozptyl mezi výběry Pokud je rozptyl mezi výběry nepravděpodobně velký, svědčí to o významném vlivu faktoru A David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 5 / 46

Předpoklady a označení Předpokládáme, že faktor A má r 2 úrovní A 1,, A r, přičemž i-té úrovni odpovídá n i pozorování X i1,, X ini, která tvoří náhodný výběr z normálního rozložení N ( µ i, σ 2), i = 1,, r Celkový počet pozorování je n = r i=1 n i Jednotlivé náhodné výběry jsou stochasticky nezávislé David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 6 / 46

Předpoklady a označení Pomocí tečkové notace označujeme součet hodnot v i-tém výběru n i X i = X ij, j=1 výběrový průměr v i-tém výběru M i = 1 X i, n i součet hodnot všech výběrů X = a celkový průměr všech r výběrů r n i i=1 j=1 X ij M = 1 n X David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 7 / 46

Matematický model Náhodné veličiny X ij se řídí modelem X ij = µ i + ε ij = µ + α i + ε ij pro i = 1,, r, j = 1,, n i, přičemž µ je společná část střední hodnoty závisle proměnné veličiny X, α i je efekt faktoru A na úrovni A i, ε ij jsou stochasticky nezávislé náhodné veličiny s rozdělením N ( 0, σ 2) David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 8 / 46

Matematický model Parametry µ, α i neznáme Požadujeme, aby platila tzv reparametrizační rovnice r n i α i = 0 i=1 Pokud je třídění vyvážené, tj pokud mají všechny výběry stejný rozsah n 1 = n 2 = = n r, pak lze použít zjednodušenou podmínku r α i = 0 i=1 David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 9 / 46

Matematický model X 11 X 12 X 1n1 X 21 X 22 X 2n2 X r1 X r2 X rnr = 1 0 0 1 0 0 1 0 0 0 1 0 0 1 0 0 1 0 0 0 1 0 0 1 0 0 1 µ 1 µ 2 µ r + ε 11 ε 12 ε 1n1 ε 21 ε 22 ε 2n2 ε r1 ε r2 ε rnr David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 10 / 46

Matematický model X 11 X 12 X 1n1 X 21 X 22 X 2n2 X r1 X r2 X rnr = 1 1 0 0 1 1 0 0 1 1 0 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 0 1 1 0 0 1 1 0 0 1 µ α 1 α 2 α r + ε 11 ε 12 ε 1n1 ε 21 ε 22 ε 2n2 ε r1 ε r2 ε rnr David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 11 / 46

Matematický model Zavedeme celkový součet čtverců S T = r n i (X ij M ) 2, i=1 j=1 který charakterizuje variabilitu jednotlivých pozorování kolem celkového průměru, má počet stupňů volnosti f T = n 1, dále skupinový součet čtverců r S A = n i (M i M ) 2, i=1 jež charakterizuje variabilitu mezi jednotlivými náhodnými výběry, má počet stupňů volnosti f A = r 1, David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 12 / 46

Matematický model a nakonec reziduální součet čtverců S E = r n i (X ij M i ) 2, i=1 j=1 který charakterizuje variabilitu uvnitř jednotlivých výběrů, má počet stupňů volnosti f E = n r Lze dokázat, že S T = S A + S E David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 13 / 46

Testování hypotézy o shodě středních hodnot Na hladině významnosti α testujeme nulovou hypotézu, která tvrdí, že všechny střední hodnoty jsou stejné, tj H 0 : µ 1 = = µ r proti alternativní hypotéze H 1, která tvrdí, že aspoň jedna dvojice středních hodnot se liší Tato hypotéza vlastně říká, že vliv faktoru A na proměnnou X je nevýznamný David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 14 / 46

Testování hypotézy o shodě středních hodnot Testová statistika F A = S A/f A S E /f E se řídí rozložením F (r 1, n r), je-li H 0 pravdivá Nulovou hypotézu tedy zamítneme na hladině významnosti α, když F A se bude realizovat v kritickém oboru W = F 1 α (r 1, n r), ) David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 15 / 46

Testování hypotézy o shodě středních hodnot Výsledky výpočtů zapisujeme do tabulky ANOVA: Zdroj variability součet čtverců stupně volnosti prům čtverec skupiny S A f A = r 1 S A /f A S A /f A S E /f E reziduální S E f E = n r S E /f E celkový S T f T = n 1 F A David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 16 / 46

Příklad zadání Je dáno pět nezávislých náhodných výběrů o rozsazích 5, 7, 6, 8, 5, přičemž i-tý výběr pochází z rozložení N(µ i, σ 2 ), i = 1,, 5 Byl vypočten celkový součet čtverců S T = 15 a reziduální součet čtverců S E = 3 Na hladině významnosti 0,05 testujte hypotézu o shodě středních hodnot David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 17 / 46

Příklad řešení Počet výběrů je r = 5, celkový rozsah všech pěti výběrů je n = 5 + 7 + 6 + 8 + 5 = 31 Vypočteme skupinový součet čtverců: S A = S T S E = 15 3 = 12 Testovou statistiku získáme jako F A = S A/(r 1) S E /(n r) = 12/4 3/26 = 26 Kritický obor je W = (F 0,95 (4, 26), = (2,7426, Protože se testová statistika realizuje v kritickém oboru, H 0 zamítáme na hladině významnosti 0,05 David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 18 / 46

Příklad řešení Tabulka ANOVA: Zdroj variability součet čtverců stupně volnosti průměrný čtverec F A S skupiny S A = 12 f A = r 1 = 4 S A /f A = 3 A /f A S E /f E = 26 reziduální S E = 3 f E = n r = 26 S E /f E = 3/26 celkový S T = 15 f T = n 1 = 30 David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 19 / 46

Testování hypotézy o shodě rozptylů Před provedením analýzy rozptylu je zapotřebí ověřit předpoklad o shodě rozptylů v daných r výběrech, tedy je nutné provést test nulové hypotézy H 0 : σ 2 1 = = σ 2 r proti alternativní hypotéze H 1, která tvrdí, že aspoň jedna dvojice rozptylů se liší David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 20 / 46

Testování hypotézy o shodě rozptylů Levenův test Položme Z ij = X ij M i Označíme M Zi = 1 n i n i Z ij, j=1 M Z = 1 n r n i Z ij, i=1 j=1 S ZE = r n i (Z ij M Zi ) 2, S ZA = i=1 j=1 r n i (M Zi M Z ) 2 i=1 David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 21 / 46

Testování hypotézy o shodě rozptylů Platí-li hypotéza o shodě rozptylů, pak statistika F ZA = S ZA/ (r 1) S ZE / (n r) se asymptoticky řídí rozložením F (r 1, n r) Hypotézu o shodě rozptylů tedy zamítáme na asymptotické hladině významnosti α, když testová statistika F ZA W, kde W = F 1 α (r 1, n r), ) je kritický obor Levenův test je vlastně založen na analýze rozptylu absolutních hodnot centrovaných pozorování David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 22 / 46

Testování hypotézy o shodě rozptylů Brownův-Forsytheův test je modifikací Levenova testu Modifikace spočívá v tom, že místo výběrového průměru i-tého výběru se při výpočtu veličiny Z ij používá medián i-tého výběru David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 23 / 46

Testování hypotézy o shodě rozptylů Bartlettův test Platí-li hypotéza o shodě rozptylů a rozsahy všech výběrů jsou větší než 6, pak statistika [ ] B = 1 r (n r) ln S 2 (n i 1) ln Si 2 C i=1 se asymptoticky řídí rozložením χ 2 (r 1) Přitom konstanta C = 1 + ( r ) 1 1 3 (r 1) n i 1 1 n r i=1 a S 2 je vážený průměr výběrových rozptylů Si 2, i = 1,, r Hypotézu o shodě rozptylů zamítáme na asymptotické hladině významnosti α, když se B realizuje v kritickém oboru W = χ 2 1 α (r 1), ) David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 24 / 46

Post-hoc (následné) metody mnohonásobného porovnávání Zamítneme-li na hladině významnosti α hypotézu o shodě středních hodnot, chceme zjistit, které dvojice středních hodnot se liší na dané hladině významnosti α Existuje celá řada post-hoc testů, k nejznámějším patří metoda Tukeyova, Scheffého, Duncanova, Fisherova LSD, Newmanova-Keulsova a další Každá z těchto metod má svoje přednosti a nedostatky a žádná není všeobecně přijímána jako ideální Zde stručně popíšeme Tukeyovu a Scheffého metodu David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 25 / 46

Post-hoc (následné) metody mnohonásobného porovnávání Tukeyova metoda Mají-li všechny výběry týž rozsah p, pak rovnost středních hodnot µ k a µ l zamítneme na hladině významnosti α, když M k M l q 1 α (r, n r) S p, kde kvantily q 1 α (r, n r) studentizovaného rozpětí najdeme ve statistických tabulkách Existuje modifikace Tukeyovy metody pro nestejné rozsahy výběrů, Tukey HSD David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 26 / 46

Post-hoc (následné) metody mnohonásobného porovnávání Scheffého metoda Rovnost středních hodnot µ k a µ l zamítneme na hladině významnosti α, když ( 1 M k M l S (r 1) + 1 ) F 1 α (r 1, n r) n k n l David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 27 / 46

Post-hoc (následné) metody mnohonásobného porovnávání Metody mnohonásobného porovnávání mají obecně menší sílu než ANOVA Může proto nastat situace, kdy při zamítnutí H 0 nenajdeme metodami mnohonásobného porovnávání významný rozdíl u žádné dvojice středních hodnot K tomu dochází zvláště tehdy, když p-hodnota pro ANOVU je jen o málo nižší než zvolená hladina významnosti Pak slabší test patřící do skupiny metod mnohonásobného porovnávání nemusí odhalit žádný rozdíl David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 28 / 46

Doporučený postup při provádění analýzy rozptylu a) Je zapotřebí ověřit, že jednotlivé náhodné výběry pocházejí z normálních rozdělení Můžeme použít grafickou metodu (např N-P plot, Q-Q plot, histogram) nebo testy hypotéz o normálním rozložení (např Lilieforsovu variantu Kolmogorovova-Smirnovova testu nebo Shapirův-Wilkův test) Doporučuje se kombinace obou způsobů David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 29 / 46

Doporučený postup při provádění analýzy rozptylu a) Je zapotřebí ověřit, že jednotlivé náhodné výběry pocházejí z normálních rozdělení Obecně lze říci, že analýza rozptylu není příliš citlivá na porušení předpokladu normality, zvláště při větších rozsazích výběrů (nad 20) Mírné porušení normality tedy není na závadu, při větším porušení použijeme např Kruskalův-Wallisův test jako neparametrickou obdobu analýzy rozptylu jednoduchého třídění David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 30 / 46

Doporučený postup při provádění analýzy rozptylu b) Po ověření normality musíme testovat homogenitu rozptylů Graficky ověřujeme shodu rozptylů pomocí krabicových diagramů, kdy sledujeme, zda je šířka krabic přibližně stejná Numericky testujeme homogenitu rozptylů pomocí Levenova testu, Brownova-Forsytheova testu či Bartlettova testu Slabé porušení homogenity rozptylů nevadí, při větším se doporučuje mediánový test David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 31 / 46

Doporučený postup při provádění analýzy rozptylu c) Pokud jsou splněny předpoklady normality a homogenity rozptylů, můžeme přistoupit k testování shody všech středních hodnot d) Dojde-li na zvolené hladině významnosti k zamítnutí hypotézy o shodě středních hodnot, zajímá nás, které dvojice středních hodnot se od sebe liší K řešení tohoto problému slouží post-hoc metody mnohonásobného porovnávání, např Scheffého nebo Tukeyova metoda David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 32 / 46

Příklad zadání Zjišt ujeme možnou závislost výnosu na obsahu určité látky v půdě K dispozici je 68 pozorování Obsah sledované látky je rozdělen do 6 skupin (18 24, 25 31,, 53 59) proměnná A Výnos je proměnná X (viz tabulka níže) David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 33 / 46

Příklad zadání A X A X A X A X 18 24 27 39 45 34 18 24 37 25 31 29 18 24 31 39 45 34 18 24 34 46 52 28 18 24 39 39 45 43 53 59 25 53 59 26 18 24 38 39 45 44 18 24 32 39 45 31 18 24 39 39 45 40 25 31 28 39 45 28 25 31 37 39 45 47 25 31 30 46 52 26 25 31 35 39 45 45 39 45 34 53 59 28 25 31 40 46 52 35 46 52 28 18 24 28 25 31 40 46 52 34 46 52 31 18 24 27 25 31 31 46 52 34 18 24 30 46 52 26 32 38 34 46 52 41 25 31 29 46 52 27 32 38 36 53 59 35 32 38 32 46 52 21 32 38 34 53 59 37 53 59 34 53 59 29 32 38 41 25 31 25 53 59 28 25 31 25 32 38 30 32 38 32 18 24 26 46 52 20 32 38 44 32 38 31 18 24 27 53 59 18 32 38 44 53 59 28 25 31 24 53 59 26 David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 34 / 46

Příklad zadání Na hladině významnosti 0,05 máme testovat hypotézu, že rozdíly ve výnosu jsou způsobeny pouze náhodnými vlivy V případě zamítnutí nulové hypotézy je třeba identifikovat, které dvojice skupin se liší na hladině významnosti 0,05 David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 35 / 46

Příklad charakteristiky dat Skupina Průměr Medián Minimum Maximum 18 24 31,9231 31,0000 26,0000 39,0000 25 31 31,0833 29,5000 24,0000 40,0000 32 38 35,8000 34,0000 30,0000 44,0000 39 45 38,0000 37,0000 28,0000 47,0000 46 52 29,2500 28,0000 20,0000 41,0000 53 59 28,5455 28,0000 18,0000 37,0000 Skupina Odchylka CV Šikmost Četnost 18 24 4,95751 0,155296 0,312563 13,0 25 31 5,66422 0,182227 0,434070 12,0 32 38 5,30827 0,148276 0,639137 10,0 39 45 6,59966 0,173675 0,0464489 10,0 46 52 6,04716 0,206741 0,255538 12,0 53 59 5,29837 0,185612 0,151714 11,0 David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 36 / 46

Příklad charakteristiky dat 45 40 35 30 25 20 18-24 25-31 32-38 39-45 46-52 53-59 David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 37 / 46

Příklad normalita dat 098 Normal Probability Plot 098 Normal Probability Plot 098 Normal Probability Plot 095 095 095 090 090 090 075 075 075 Probability 050 Probability 050 Probability 050 025 025 025 010 010 010 005 005 005 002 26 28 30 32 34 36 38 18-24 002 25 30 35 40 25-31 002 30 32 34 36 38 40 42 44 32-38 098 Normal Probability Plot 098 Normal Probability Plot 098 Normal Probability Plot 095 095 095 090 090 090 075 075 075 Probability 050 Probability 050 Probability 050 025 025 025 010 010 010 005 005 005 002 30 35 40 45 39-45 002 20 25 30 35 40 46-52 002 20 25 30 35 53-59 David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 38 / 46

Příklad normalita dat Pro posouzení normality dále použijeme Shapirův-Wilkův test Skupina 18 24 25 31 32 38 39 45 46 52 53 59 p-hodnota 0,0653 0,1941 0,0674 0,3608 0,8088 0,4538 David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 39 / 46

Příklad shoda rozptylů Nyní se zaměříme na ověření předpokladu o homogenitě rozptylů, tj na hladině významnosti 0,05 testujeme hypotézu H 0 : σ 2 1 = = σ 2 r proti alternativní hypotéze H 1, která tvrdí, že aspoň jedna dvojice rozptylů se liší Použijeme Levenův test David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 40 / 46

Příklad shoda rozptylů Skupinový součet čtverců S ZA nabývá hodnoty 28,79949, skupinový počet stupňů volnosti f ZA je 5, reziduální součet čtverců S ZE je 729,6711, reziduální počet stupňů volnosti f ZE je 62, testová statistika F ZA se realizuje hodnotou 0,489417, odpovídající p-hodnota je 0,78290, tedy na hladině významnosti 0,05 nelze zamítnout hypotézu o homogenitě rozptylů David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 41 / 46

Příklad shoda středních hodnot Dále se budeme věnovat testování hypotézy o shodě středních hodnot normálních rozložení, z nichž pocházejí sledované náhodné výběry, tj testujeme hypotézu H 0 : µ 1 = = µ r proti alternativní hypotéze H 1, která tvrdí, že aspoň jedna dvojice středních hodnot se liší David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 42 / 46

Příklad shoda středních hodnot Vidíme, že skupinový součet čtverců S A je 733,2742, skupinový počet stupňů volnosti f A je 5, reziduální součet čtverců S E je 1976,417, reziduální počet stupňů volnosti f E je 62, testová statistika F A se realizuje hodnotou 4,600547, odpovídající p-hodnota je 0,001239 David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 43 / 46

Příklad shoda středních hodnot Na hladině významnosti 0,05 (a dokonce i na hladině významnosti 0,01) zamítáme hypotézu o rovnosti středních hodnot Znamená to, že s rizikem omylu nejvýše 0,05 jsme prokázali, že střední hodnoty výnosu se pro různé skupiny obsahu sledované látky liší David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 44 / 46

Příklad párová porovnání Vzhledem k tomu, že na hladině významnosti 0,05 jsme zamítli hypotézu o shodě středních hodnot, provedeme mnohonásobné porovnávání, abychom identifikovali, které dvojice náhodných výběrů přispěly k zamítnutí nulové hypotézy Výsledek Scheffého metody ukazuje, že na hladině významnosti 0,05 se liší skupiny 39 45 a 46 52 a dále 39 45 a 53 59 Rozdíly mezi ostatními dvojicemi skupin nejsou prokazatelné na hladině významnosti 0,05 David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 45 / 46

ANOVA příklad data ANOVA nekompletsta David Hampel (ÚSOV MENDELU) Jednofaktorová analýza rozptylu 5 7 8 2015 46 / 46