NLÝZ OZPYLU (nalyss of Varance NOV) Používá se buď ako samostatná technka, nebo ako postup, umožňuící analýzu zdroů varablty v lneární regres. Př. použtí: k porovnání středních hodnot (průměrů) více než souborů, určení vlvu způsobu přípravy vzorků (několka způsobů), zpracování mezlaboratorních porovnávacích zkoušek (MPZ). Porovnání shody více než dvou metod stanovení analytu, účnek více než dvou léčv na dané onemocnění, porovnání účnku více než dvou hnov na výnos, atd. PODS: rozklad celkového rozptylu na rozptyl vyvolaný vlvem ednotlvých faktorů (známé zdroe varablty) a složku náhodnou (neobasněnou), o níž se předpokládá, že e náhodná. Předmětem testování e statstcká významnost poměru mez rozptylem způsobeným faktorem ( ) náhodným rozptylem ( ). Pokud máme faktor, mluvíme o ednofaktorové NOVě, máme-l faktory, de o dvoufaktorovou NOVu, apod. Základní předpoklady pro (ednofaktorovou) analýzu rozptylu: data pocházeí z normálního rozdělení, náhodné chyby ε sou náhodné velčny s N(0, σ ), rozptyly sloupců dat (úrovní faktoru) sou stené (homoskedastcta). Jednofaktorová NOV Formulace modelu: sledue se faktor na k úrovních,, k ; na každé úrovn e provedeno n měření (celkový počet měření označueme N). Model NOV má tvar: x µ + α + ε ednotlvé parametry se odhaduí pomocí odpovídaících artmetckých průměrů, a to následovně: µ celkový artmetcký průměr všech hodnot v matc x, α efekt -té úrovně faktoru, α µ - µ, kde µ e sloupcový průměr x. Jednofaktorová NOV porovnává střední hodnoty (průměry) dvou č více úrovní faktoru čl sloupců v matc dat za účelem určt, zda alespoň edna sloupcová střední hodnota se lší od ostatních. Statstcká významnost e testována F-testem tak, že H 0 říká Všechny střední hodnoty sou stené a H lespoň edna střední hodnota se odlšue od ostatních. CH/CHEX Davd MILDE
x x + ( x x) + ( x x ) ( x x) [( x x) + ( x x ] ) sumací přes a získáme následuící rovnc, ve které e poslední člen 0 ( x x) ( x x) + ( x x ) + ( x x)( x x ), S 0 S + S S 0 součet čtverců odchylek od celkového průměru: S 0 ( x ) S + S, kde N S představue rozptyl mez ednotlvým úrovněm faktoru : k S ( ) n N S e rezduální (zbytkový) rozptyl uvntř ednotlvých úrovní a vypočte se ako rozdíl S 0 S. Odhadem rozptylu chyb σ ε e průměrný rezduální čtverec : S N k součet všech hodnot v matc sloupcové součty Formulace hypotéz: H 0 : α 0; H : α 0 estační statstka F (pro faktor ): F S S ( k ) ( N k) Př platnost H 0 má F statstka F-rozdělení s (k-, N-k) stupn volnost. Vyde-l F větší než kvantl F(krt) (-α, k-, N-k), e nutné H 0 na hladně významnost α zamítnout a vlv úrovní faktoru α e nenulový. Ilustrační příklad NOV stanovení obsahu NaCl v chpsech: CH/CHEX Davd MILDE
abulka výsledků (% Na) v chpsech: Lupínek Lupínek Lupínek 3 Lupínek 4. stanovení 0,34 0,455 0,40 0,447. stanovení 0,3 0,467 0,463 0,377 3. stanovení 0,35 0,448 0,44 0,398 rtm. průměr 0,39 0,457 0,436 0,407 Směrodatná odchylka 0,0 0,0096 0,038 0,0359 Sloupcový součet 0,987,37,307, N ; počet úrovní faktoru k 4; n 3 GFY (V QC EXPEU) GF NOV zobrazue polohu měřených dat v ednotlvých úrovních. Lze vzuálně posoudt rozdíly a rozptyl. KBICOVÝ GF zobrazí se pro každou úroveň faktoru; k dentfkac OB. Základní předpoklady (normaltu) lze ověřt: estem normalty Q-Q graf Jackknfe rezduí (odchylek od celkového průměru) v případě normálního rozdělení vznkne v grafu lneární závslost s nulovým úsekem a ednotkovou směrncí. CH/CHEX Davd MILDE 3
VÍCENÁSOBNÉ POOVNÁVÁNÍ (MULIPLE COMPSION POCEDUE MCP) Když NOV určí, že faktor e statstcky významný, e možné nalézt úrovně faktoru, které se významně lší od ostatních. SCHEFFEHO POOVNÁNÍ Vyšetřue všechna možná porovnání k sloupcových průměrů. Prncp spočívá v testování významnost rozdílů ednotlvých sloupcových průměrů. Např.: x x 0 x x3 0 a sledueme zda IS ednotlvých rozdílů obsahuí 0. estační krterum má následuící podobu: x x s + n n ( k ) F krt ( k, N k) CH/CHEX Davd MILDE 4
Dvoufaktorová NOV Provádí se expermenty na různých úrovních dvou faktorů a B. Kombnace úrovní faktoru tvoří mřížkovou strukturu eímž elementem e tzv. cela. Platí že cela [] odpovídá -té úrovní faktoru a -té úrovn faktoru B. V každé cele e obecně n opakování. Pokud e v každé cele en opakování NOV bez opakování (P). Pokud e v každé cele více než edno opakování, ale ve všech celách stený počet vyvážená dvoufaktorová NOV (B). Pokud e v každé cele více než edno opakování, a počet se v celách lší nevyvážená dvoufaktorová NOV (U). Podrobně se budeme zabývat pouze NOVou P. abulka pro NOV P: B B B m B k α vlv -té úrovně faktoru β vlv -té úrovně faktoru B x µ + α + β + ε k S ( Z m S 0 S + S B + S S0 ( x ), kde N k m N N m ) SB ( ) k N S představue rozptyl mez ednotlvým úrovněm faktoru, S B pak mez úrovněm faktoru B. Význam S 0 a S e stený ako u ednofaktorové NOVy. Z součet hodnot v -té úrovn faktoru (řádkový součet) součet hodnot v -té úrovn faktoru B (sloupcový součet) Formulace hypotéz: H 0 : α 0 a β 0 (efekty úrovní faktorů a B sou nevýznamné) H : α 0 a β 0 (efekty úrovní faktorů a B sou významné) CH/CHEX Davd MILDE 5
estovací krtéra: F S k S ( k )( m ) FB B SB m S ( k )( m ) Za předpokladu platnost H 0 má testační charakterstka F Fsher-Snedecorovo rozdělení s (k-) a (k-)(m-) stupn volnost a testační charakterstka F B s (m-) a (k-)(m-) stupn volnost. INEKCE FKOŮ ozptyl může být kromě efektu faktorů a B ovlvněn nterakčním členem τ, který e důsledkem různých kombnací řáskových a sloupcových efektů. zn., že efekty faktorů a B nesou ve svém vlvu na každý výsledek x nezávslé. x µ + α + β + τ + ε Obvykle se užívá ukeyův model nterakce τ C α β, kde C e konstanta určovaná ako směrnce přímky v grafu závslost rezduí na α β /µ. Formulace hypotéz: H 0 : τ 0; H : τ 0 CH/CHEX Davd MILDE 6
NEPMEICKÉ ESY V NOV KUSKL-WLLISŮV ES ento test e rozšířením Wlcoxonova testu pro porovnání medánů více než dvou náhodných výběrů. Je alternatvou pro ednofaktorovou NOV. Předpoklady pro použtí: o rozdělení souborů (úrovní faktoru) musí být stené, o rozptyly souborů (úrovní faktoru) musí být stené. Formulace hypotéz: H 0 : medány všech úrovní faktoru sou stené H : alespoň eden medán se lší od ostatních POSUP:. Všechny hodnoty v matc seřadíme od nemenší do nevětší a přřadíme ím pořadová čísla (včetně průměrných pořadí pro stené hodnoty).. Pro každý výběrový soubor (úroveň faktoru) vypočítáme sumu pořadí,,..., k (k e počet výběrových souborů úrovní faktoru). 3. Určíme celkový rozsah výběru N n + n +... + n k, kde n, označue počet hodnot pro každou úroveň faktoru. 4. Vypočteme testovací charakterstku χ exp pomocí následuícího vztahu: χ Kru k N + N ( ) 3( N + ) n 5. Porovnáváme s krtckou hodnotou χ krt(0,95) s k - stupn volnost. Srovnání s hodnotou χ rozdělení e možné použít, pokud e N > as 5! FIEDMNŮV ES Je neparametrckým testem pro dvoufaktorovou analýzu rozptylu (P), faktor má k úrovní a faktor B má m úrovní. POSUP: totožný s Kruskal-Wallsovým testem, sou sumy pořadí sloupců. Matce dat by měla být použta tak, aby rozptyl v řádcích byl menší než ve sloupcích (lze řešt záměnou faktorů otočením matce). χ Fr m ( ) 3k( m+ ) km( k + ) Porovnáváme s krtckou hodnotou χ krt(0,95) s m - stupn volnost, pokud e k.m > 5. CH/CHEX Davd MILDE 7