ANALÝZA ROZPTYLU (Analysis of Variance ANOVA)

Podobné dokumenty
Statistická analýza jednorozměrných dat

Přednáška č. 11 Analýza rozptylu při dvojném třídění

ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN

ANOVA. Analýza rozptylu při jednoduchém třídění. Jana Vránová, 3.lékařská fakulta UK, Praha

REGRESNÍ ANALÝZA. 13. cvičení

7. Analýza rozptylu jednoduchého třídění

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Využití logistické regrese pro hodnocení omaku

STATISTIKA (pro navazující magisterské studium)

5 ANALÝZA ROZPTYLU. 5.1 Jednofaktorová analýza rozptylu (ANOVA1)

9. cvičení 4ST201. Obsah: Jednoduchá lineární regrese Vícenásobná lineární regrese Korelační analýza. Jednoduchá lineární regrese

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie

6 LINEÁRNÍ REGRESNÍ MODELY

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu.

Regresní a korelační analýza

6. Demonstrační simulační projekt generátory vstupních proudů simulačního modelu

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

S E M E S T R Á L N Í

Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra matematiky. Bakalářská práce. Zpracování výsledků vstupních testů z matematiky

podle typu regresní funkce na lineární nebo nelineární model Jednoduchá lineární regrese se dá vyjádřit vztahem y

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

Jednofaktorová analýza rozptylu

PYTHAGORAS Statistické zpracování experimentálních dat

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Statistika, Biostatistika pro kombinované studium. Jan Kracík

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

4EK211 Základy ekonometrie

Analýza rozptylu ANOVA

2 TESTOVÁNÍ HYPOTÉZ. RYCHLÝ NÁHLED KAPITOLY Neříkej: Objevil jsem pravdu! ale raději: Objevil jsem jednu z pravd! Chalil Gibran

KGG/STG Statistika pro geografy

SÍŤOVÁ ANALÝZA. Základní pojmy síťové analýzy. u,. Sjednocením množin { u, u,..., 2. nazýváme grafem G.

Téma 5: Parametrická rozdělení pravděpodobnosti spojité náhodné veličiny

Normální (Gaussovo) rozdělení

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

1.4 ANOVA. Vliv druhu plodiny na míru napadení houbami Fusarium culmorum a Fusarium graminearum v systému ekologického hospodaření

Cvičení ze statistiky - 8. Filip Děchtěrenko

Charakteristika datového souboru

4EK211 Základy ekonometrie

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA. Semestrální práce

Regresní a korelační analýza

SEMESTRÁ LNÍ PRÁ CE. Licenč ní studium STATISTICKÉZPRACOVÁ NÍ DAT PŘ I KONTROLE A Ř ÍZENÍ JAKOSTI

Masarykova univerzita v Brně. Analýza rozptylu. Vypracovala: Marika Dienová

Přednášky část 4 Analýza provozních zatížení a hypotézy kumulace poškození, příklady. Milan Růžička

Lineární a adaptivní zpracování dat. 8. Kumulační zvýrazňování signálů v šumu 2

Testy statistických hypotéz

12. cvičení z PST. 20. prosince 2017

Zadání příkladů. Zadání:

Bodové a intervalové odhady parametrů v regresním modelu

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

PRAVDĚPODOBNOST A STATISTIKA

Testy. Pavel Provinský. 19. listopadu 2013

Vícekriteriální rozhodování. Typy kritérií

7. Analýza rozptylu.

Úvod do analýzy rozptylu

Testování statistických hypotéz. Obecný postup

= = 2368

STATISTICA Téma 7. Testy na základě více než 2 výběrů

Obsah. Příloha (celkový počet stran přílohy 13) Závěrečná zpráva o výsledcích experimentu shodnosti ZČB 2013/2

Aplikace Li-Ma metody na scintigrafické vyšetření příštítných tělísek. P. Karhan, P. Fiala, J. Ptáček

Normální (Gaussovo) rozdělení

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

Jednofaktorová analýza rozptylu

IDENTIFIKACE BIMODALITY V DATECH

Regresní a korelační analýza

Analýza závislosti veličin sledovaných v rámci TBD

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Cvičení 13 Vícekriteriální hodnocení variant a vícekriteriální programování

Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj.

VYBOČUJÍCÍ HODNOTY VE VÍCEROZMĚRNÝCH DATECH

Ing. Michael Rost, Ph.D.

PRAVDĚPODOBNOST A STATISTIKA. Testování hypotéz o rozdělení

Výstavba regresního modelu regresním tripletem

Protokol č. 1. Tloušťková struktura. Zadání:

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Statistická analýza jednorozměrných dat

ANALÝZA ROZPTYLU (ANOVA)

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

A B C D

Ranní úvahy o statistice

Regresní analýza 1. Regresní analýza

VĚROHODNOST VÝSLEDKŮ PŘI UŽITÍ EXPLORATORNÍ ANALÝZY DAT

Matematický ústav Slezské univerzity v Opavě Učební texty k přednášce ALGEBRA II, letní semestr 2000/2001 Michal Marvan

Plánování experimentu

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

KGG/STG Statistika pro geografy

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 2

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

Pružnost a plasticita II

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

Pravděpodobnost a aplikovaná statistika

LINEÁRNÍ REGRESE. Lineární regresní model

Transkript:

NLÝZ OZPYLU (nalyss of Varance NOV) Používá se buď ako samostatná technka, nebo ako postup, umožňuící analýzu zdroů varablty v lneární regres. Př. použtí: k porovnání středních hodnot (průměrů) více než souborů, určení vlvu způsobu přípravy vzorků (několka způsobů), zpracování mezlaboratorních porovnávacích zkoušek (MPZ). Porovnání shody více než dvou metod stanovení analytu, účnek více než dvou léčv na dané onemocnění, porovnání účnku více než dvou hnov na výnos, atd. PODS: rozklad celkového rozptylu na rozptyl vyvolaný vlvem ednotlvých faktorů (známé zdroe varablty) a složku náhodnou (neobasněnou), o níž se předpokládá, že e náhodná. Předmětem testování e statstcká významnost poměru mez rozptylem způsobeným faktorem ( ) náhodným rozptylem ( ). Pokud máme faktor, mluvíme o ednofaktorové NOVě, máme-l faktory, de o dvoufaktorovou NOVu, apod. Základní předpoklady pro (ednofaktorovou) analýzu rozptylu: data pocházeí z normálního rozdělení, náhodné chyby ε sou náhodné velčny s N(0, σ ), rozptyly sloupců dat (úrovní faktoru) sou stené (homoskedastcta). Jednofaktorová NOV Formulace modelu: sledue se faktor na k úrovních,, k ; na každé úrovn e provedeno n měření (celkový počet měření označueme N). Model NOV má tvar: x µ + α + ε ednotlvé parametry se odhaduí pomocí odpovídaících artmetckých průměrů, a to následovně: µ celkový artmetcký průměr všech hodnot v matc x, α efekt -té úrovně faktoru, α µ - µ, kde µ e sloupcový průměr x. Jednofaktorová NOV porovnává střední hodnoty (průměry) dvou č více úrovní faktoru čl sloupců v matc dat za účelem určt, zda alespoň edna sloupcová střední hodnota se lší od ostatních. Statstcká významnost e testována F-testem tak, že H 0 říká Všechny střední hodnoty sou stené a H lespoň edna střední hodnota se odlšue od ostatních. CH/CHEX Davd MILDE

x x + ( x x) + ( x x ) ( x x) [( x x) + ( x x ] ) sumací přes a získáme následuící rovnc, ve které e poslední člen 0 ( x x) ( x x) + ( x x ) + ( x x)( x x ), S 0 S + S S 0 součet čtverců odchylek od celkového průměru: S 0 ( x ) S + S, kde N S představue rozptyl mez ednotlvým úrovněm faktoru : k S ( ) n N S e rezduální (zbytkový) rozptyl uvntř ednotlvých úrovní a vypočte se ako rozdíl S 0 S. Odhadem rozptylu chyb σ ε e průměrný rezduální čtverec : S N k součet všech hodnot v matc sloupcové součty Formulace hypotéz: H 0 : α 0; H : α 0 estační statstka F (pro faktor ): F S S ( k ) ( N k) Př platnost H 0 má F statstka F-rozdělení s (k-, N-k) stupn volnost. Vyde-l F větší než kvantl F(krt) (-α, k-, N-k), e nutné H 0 na hladně významnost α zamítnout a vlv úrovní faktoru α e nenulový. Ilustrační příklad NOV stanovení obsahu NaCl v chpsech: CH/CHEX Davd MILDE

abulka výsledků (% Na) v chpsech: Lupínek Lupínek Lupínek 3 Lupínek 4. stanovení 0,34 0,455 0,40 0,447. stanovení 0,3 0,467 0,463 0,377 3. stanovení 0,35 0,448 0,44 0,398 rtm. průměr 0,39 0,457 0,436 0,407 Směrodatná odchylka 0,0 0,0096 0,038 0,0359 Sloupcový součet 0,987,37,307, N ; počet úrovní faktoru k 4; n 3 GFY (V QC EXPEU) GF NOV zobrazue polohu měřených dat v ednotlvých úrovních. Lze vzuálně posoudt rozdíly a rozptyl. KBICOVÝ GF zobrazí se pro každou úroveň faktoru; k dentfkac OB. Základní předpoklady (normaltu) lze ověřt: estem normalty Q-Q graf Jackknfe rezduí (odchylek od celkového průměru) v případě normálního rozdělení vznkne v grafu lneární závslost s nulovým úsekem a ednotkovou směrncí. CH/CHEX Davd MILDE 3

VÍCENÁSOBNÉ POOVNÁVÁNÍ (MULIPLE COMPSION POCEDUE MCP) Když NOV určí, že faktor e statstcky významný, e možné nalézt úrovně faktoru, které se významně lší od ostatních. SCHEFFEHO POOVNÁNÍ Vyšetřue všechna možná porovnání k sloupcových průměrů. Prncp spočívá v testování významnost rozdílů ednotlvých sloupcových průměrů. Např.: x x 0 x x3 0 a sledueme zda IS ednotlvých rozdílů obsahuí 0. estační krterum má následuící podobu: x x s + n n ( k ) F krt ( k, N k) CH/CHEX Davd MILDE 4

Dvoufaktorová NOV Provádí se expermenty na různých úrovních dvou faktorů a B. Kombnace úrovní faktoru tvoří mřížkovou strukturu eímž elementem e tzv. cela. Platí že cela [] odpovídá -té úrovní faktoru a -té úrovn faktoru B. V každé cele e obecně n opakování. Pokud e v každé cele en opakování NOV bez opakování (P). Pokud e v každé cele více než edno opakování, ale ve všech celách stený počet vyvážená dvoufaktorová NOV (B). Pokud e v každé cele více než edno opakování, a počet se v celách lší nevyvážená dvoufaktorová NOV (U). Podrobně se budeme zabývat pouze NOVou P. abulka pro NOV P: B B B m B k α vlv -té úrovně faktoru β vlv -té úrovně faktoru B x µ + α + β + ε k S ( Z m S 0 S + S B + S S0 ( x ), kde N k m N N m ) SB ( ) k N S představue rozptyl mez ednotlvým úrovněm faktoru, S B pak mez úrovněm faktoru B. Význam S 0 a S e stený ako u ednofaktorové NOVy. Z součet hodnot v -té úrovn faktoru (řádkový součet) součet hodnot v -té úrovn faktoru B (sloupcový součet) Formulace hypotéz: H 0 : α 0 a β 0 (efekty úrovní faktorů a B sou nevýznamné) H : α 0 a β 0 (efekty úrovní faktorů a B sou významné) CH/CHEX Davd MILDE 5

estovací krtéra: F S k S ( k )( m ) FB B SB m S ( k )( m ) Za předpokladu platnost H 0 má testační charakterstka F Fsher-Snedecorovo rozdělení s (k-) a (k-)(m-) stupn volnost a testační charakterstka F B s (m-) a (k-)(m-) stupn volnost. INEKCE FKOŮ ozptyl může být kromě efektu faktorů a B ovlvněn nterakčním členem τ, který e důsledkem různých kombnací řáskových a sloupcových efektů. zn., že efekty faktorů a B nesou ve svém vlvu na každý výsledek x nezávslé. x µ + α + β + τ + ε Obvykle se užívá ukeyův model nterakce τ C α β, kde C e konstanta určovaná ako směrnce přímky v grafu závslost rezduí na α β /µ. Formulace hypotéz: H 0 : τ 0; H : τ 0 CH/CHEX Davd MILDE 6

NEPMEICKÉ ESY V NOV KUSKL-WLLISŮV ES ento test e rozšířením Wlcoxonova testu pro porovnání medánů více než dvou náhodných výběrů. Je alternatvou pro ednofaktorovou NOV. Předpoklady pro použtí: o rozdělení souborů (úrovní faktoru) musí být stené, o rozptyly souborů (úrovní faktoru) musí být stené. Formulace hypotéz: H 0 : medány všech úrovní faktoru sou stené H : alespoň eden medán se lší od ostatních POSUP:. Všechny hodnoty v matc seřadíme od nemenší do nevětší a přřadíme ím pořadová čísla (včetně průměrných pořadí pro stené hodnoty).. Pro každý výběrový soubor (úroveň faktoru) vypočítáme sumu pořadí,,..., k (k e počet výběrových souborů úrovní faktoru). 3. Určíme celkový rozsah výběru N n + n +... + n k, kde n, označue počet hodnot pro každou úroveň faktoru. 4. Vypočteme testovací charakterstku χ exp pomocí následuícího vztahu: χ Kru k N + N ( ) 3( N + ) n 5. Porovnáváme s krtckou hodnotou χ krt(0,95) s k - stupn volnost. Srovnání s hodnotou χ rozdělení e možné použít, pokud e N > as 5! FIEDMNŮV ES Je neparametrckým testem pro dvoufaktorovou analýzu rozptylu (P), faktor má k úrovní a faktor B má m úrovní. POSUP: totožný s Kruskal-Wallsovým testem, sou sumy pořadí sloupců. Matce dat by měla být použta tak, aby rozptyl v řádcích byl menší než ve sloupcích (lze řešt záměnou faktorů otočením matce). χ Fr m ( ) 3k( m+ ) km( k + ) Porovnáváme s krtckou hodnotou χ krt(0,95) s m - stupn volnost, pokud e k.m > 5. CH/CHEX Davd MILDE 7