ANOVA analýza rozptlu CENTRUM BIOSTATISTIK A ANALÝZ
Analýza rozptlu - ANOVA Základní technika sloužící k posouzení rozdílů mezi více úrovněmi pokusného zásahu Kontrola Koncentrace Koncentrace Koncentrace 3 Koncentrace p Rostoucí koncentrace testované látk / látek Celkově významné změn v reakci biologického sstému Vzájemné rozdíl účinku jednotlivých dávek Rozdíl účinku dávek od kontrol CENTRUM BIOSTATISTIK A ANALÝZ
Analýza rozptlu - ANOVA 3 Významné krok analýz, vedoucí k efektivnímu srovnání variant Kontrola Koncentrace Koncentrace Koncentrace 3 Koncentrace p Rostoucí koncentrace testované látk / látek Splnění předpokladů analýz Transformace dat Relevantnost kontrol (vliv vlastní aplikace látek) Vhodnost modelu ANOVA pro účel testu Vlastní srovnání variant Minimalizace chb při ověřování hpotéz CENTRUM BIOSTATISTIK A ANALÝZ
Analýza rozptlu - ANOVA 4 SPLNĚNÍ PŘEDPOKLADŮ ANOVA JE NEZBTNOU PODMÍNKOU POUŽITÍ TÉTO TECHNIK Předpoklad nezávislosti opakování eperimentu ANOVA parametrická analýza dat Homogenita rozptlu v rámci pokusných variant 3 Normalita rozložení v rámci pokusných variant ALTERNATIVOU JSOU NEPARAMETRICKÉ METOD CENTRUM BIOSTATISTIK A ANALÝZ
Analýza rozptlu - ANOVA Předpoklad analýz rozptlu jsou nezbtné pro dosažení síl testu 5 Smetrické rozložení hodnot a normalita odchlek od hodnoceného modelu ANOVA Velkou část dat lze adekvátně normalizovat použitím logaritmické transformace Předpoklad lognormální transformace může pochopitelně být teoretick vloučen u mnoha datových souborů obsahujících diskrétní parametr, kde je indikována vhodnost jiného tpu transformace U asmetrick rozložených a u diskrétních dat je nutné vužít neparametrické alternativ analýz rozptlu Homogenita rozptlu je nutným předpokladem pro smsluplnost vzájemných srovnání pokusných variant U testů toicit b splnění tohoto předpokladu mělo být ověřováno (Bartlettův test), neboť vážné rozdíl (až řádové) v jednotkách testovaného parametru mohou nastat v důsledku inhibice dávkami látk Nehomogenita rozptlu je často ve vztahu k nenormalitě (asmetrii) dat a lze ji odstranit vhodnou normalizující transformací Statistická nezávislost reziduí vhodnocovaného modelu ANOVA Pokud odhad a posouzení korelačních vztahů mezi pokusnými variantami není přímo předmětem výzkumu, lze jejich vliv na vhodnocení odstranit znáhodněním dat v rámci pokusných variant - ted změnou pořadí v náhodné Rozsah vlivu těchto autokorelačních vztahů musí být ovšem primárně omezen správností eperimentálního uspořádání Aditivita jako předpoklad týkající se složitějších eperimentálních uspořádání Eaktní otestování aditivit více pokusných faktorů je procedura poměrně náročná na eperimentální design vvážený co do počtu opakování Je rovněž obtížné testovat interakci na nestandardních datech, neboť případná transformace může změnit charakter odchlek původních dat od hodnoceného modelu ANOVA CENTRUM BIOSTATISTIK A ANALÝZ
Analýza rozptlu - ANOVA Omezení aplikace ANOVA lze řešit 6 Chbějící data Vážným problémem jsou chbějící údaje o celé skupině kombinací testovaných látek, například u faktoriálních pokusů, kd je znemožněno hodnocení eperimentu jako celku Různé počt opakování Jde o tpický jev pro eperimentální datové soubor Při různých počtech opakování v eperimentálních variantách jsou test ANOVA citlivější na nenormalitu dat Pokud jsou počt opakování zcela odlišné(až na řádové rozdíl), je nutno použít neparametrické technik nebo analýzu rozptlu nevvážených pokusů Odlehlé hodnot Ojedinělé odlehlé hodnot musí být před parametrickou analýzou rozptlu vloučen Nedostatek nezávislosti mezi rezidui modelu Jde o závažný nedostatek, zkreslující výsledek F-testu Velmi často je tato skutečnost důsledkem špatného provedení nebo naplánování eperimentu Nehomogenita rozptlu Velmi častý nedostatek eperimentálních dat, často související s nenormalitou rozložení nebo s odlehlými hodnotami Nenormalita dat I v tomto případě lz situaci upravit vloučením odlehlých hodnot nebo normalizující transformací Neaditivita kombinovaného vlivu více pokusných zásahů Tuto situaci lze testovat jednak speciálními test aditivit nebo přímo F testem kontrolujícím významnost vlivu interakce pokusných zásahů Při významné interakci je nutné prozkoumat především její charakter ve vhodném eperimentálním uspořádání CENTRUM BIOSTATISTIK A ANALÝZ
7 CENTRUM BIOSTATISTIK A ANALÝZ Model analýz rozptlu Model I Pevný model Model II Náhodný model 0 3 4 A B C D E ij i ij ε α µ + + ij ij A i ε µ + + 0 3 4 A B C D E
ANOVA základní výpočet 8 Základním principem ANOV je porovnání rozptlu připadajícího na: Rozdělení dat do skupin (tzv effect, variance between groups) Variabilitu objektů uvnitř skupin (tzv error, variance within groups), předpokládá se, že jde o náhodnou variabilitu (error) Variabilita mezi skupinami Rozptl je počítán pro celkový průměr (tzv grand mean) a průměr v jednotlivých skupinách dat Stupně volnosti jsou odvozen od počtu skupin ( počet skupin -) Variabilita uvnitř skupin Rozptl je počítán pro průměr jednotlivých skupin a objekt uvnitř příslušných, celková variabilita je pak sečtena pro všechn skupin Stupně volnosti jsou odvozen od počtu hodnot ( počet hodnot - počet skupin) ν k ν n k CENTRUM BIOSTATISTIK A ANALÝZ F SSsum of squares between_ groups within _ groups Výsledný poměr (F) porovnáme s tabulkami F rozložení pro v a v stupňů volnosti
Model analýz rozptlu - základní výstup 9 Základním výstupem analýz rozptlu je Tabulka ANOVA - frakcionace komponent rozptlu Zdroj rozptlu St v SS MS F Pok zásah (mezi skupinami) a - SS B SS B /(a -) MS B /MS E Uvnitř skupin N - a SS E SS E /(N - a) Celkem N - SS T SS B /SS T MS B /MS T Kvantifikovaný podíl rozdílu mezi pokusnými zásah na celkovém rozptlu Statistická významnost rozdílu CENTRUM BIOSTATISTIK A ANALÝZ
Analýza rozptlu - obecný F test obecný F test H 0 : m m m 3 m p 0 Kontrola Koncentrace Koncentrace Koncentrace 3 F test: H 0 Koncentrace p H 0 platí Látka nepůsobí H 0 neplatí Látka působí Další analýz CENTRUM BIOSTATISTIK A ANALÝZ
Analýza rozptlu - Test kontrastů ANOVA:H 0 zamítnuta Test kontrastů Kontrola Koncentrace Koncentrace Koncentrace 3 Koncentrace p Plánované Neplánované Pro srovnání variant s kontrolou Testování kontrastů "Multiple range test" Rozdíl v smsluplných kombinacích? Parametrické Neparametrické CENTRUM BIOSTATISTIK A ANALÝZ
Příklad: Anova - One wa Dávka rostlinného stimulátoru (0, 4, 8, mg/l) A 4 ; n 8 I ANOVA Bartlett's test: P 0,9847 K-S test: P 0,48-0,655 pro jednotlivé kategorie Source D f SS MS F Between Groups 3 305,8 0,9 8,56 Within Groups 8 3,,9 Total (corr) 3 638,0 II Multiple Range Test NKS -test Level Average Homogenous Groups 0 34,8 4 4,4 4,8 8 5,6 CENTRUM BIOSTATISTIK A ANALÝZ
Příklad: Anova - One wa I Zásah: 4 klinická stadia virové chorob (napadá kr buňk) 3 H o Sledovaná veličina: aktivita enzmu v těchto krevních buňkách : µ µ µ µ 3 4 n 3 MODEL? Σ průměr I,8 9,4,5 65,7,9 MS II 6,4 7,8 9, 53,3 7,8 MS n III, 8, 5,8 45, 5, IV 4, 0,,8 37,,4 III Komponenta rozptlu: 49,6 5,9 3 ~ A e σ A SA 4,57 II Source Between groups Within groups Total (corr) IV ρ I Df 3 8 S MS 49,6 5,9 - A ~ ri S A + Se F 8,39 0,74 P 0,0075 S A,5 Se CENTRUM BIOSTATISTIK A ANALÝZ
Srovnání variant v testech Srovnáváni variant po celkovém testu ANOVA 4 Mnoho eistujících algoritmů není vhodných pro konkrétní případ Da and Quin Ecological Monographs,989 Test Vužití Poznámka Dunnett Williams ANOVA test (F) Ran Q test Srovnání s kontrolou Orthogonální kontrast Jednoduché kontrast E i modifikace pro různá n Plánovaná srovnání Vhodnocen jako nejlepší test Test pro jednoduché kontrast Scheffe Tuke LSD Bonferroni Duncan Dunn- Sidák Test nevhodné Student - Newmann-Keuls Kramer Waller-Duncan k ratio CENTRUM BIOSTATISTIK A ANALÝZ
Řada post-hoc testů v různých SW 5 CENTRUM BIOSTATISTIK A ANALÝZ
Hpotetické příklad - Multiple Range Tests 6 5 8 6 38 Level 3 4 5 Homogenous Group 5 4 9 30 Level 3 4 5 Homogenous Group 5 8 9 36 Level 3 4 5 Homogenous Group CENTRUM BIOSTATISTIK A ANALÝZ
7 Korelace a regrese CENTRUM BIOSTATISTIK A ANALÝZ
Základ korelační analýz - I Korelace - vztah (závislost) dvou znaků (parametrů) 8 ANO NE ANO a c NE b d CENTRUM BIOSTATISTIK A ANALÝZ
Základ korelační analýz - II 9 Parametrické mír korelace Kovariance Cov(, ) E( )( ) i i Pearsonův koeficient korelace 0 0 r -- -- r - 0 CENTRUM BIOSTATISTIK A ANALÝZ
Základ korelační analýz - III 0 P I (zem) 0 4 5 3 40 0 6 50 P I (rostl) 9 6 4 35 3 5 40 I,, n; n 8; v 6 r Cov (, S S ) i n n i i i ( i ) i ( i ) i n 0,776 I H 0 : ρ φ : α 0, 05 tab : r( v 6 ) 0, 7076 II H 0 : ρ φ r t n v n r t 0,776 0,6965 : t tab ( n ) 0,975 6,54,447 P 0,05 CENTRUM BIOSTATISTIK A ANALÝZ
Základ korelační analýz - IV Srovnání dvou korelačních koeficientů (r) n 58 r 0,68 n r 46 0,40 Krevní tlak koncentrace ksl radikálů ( + ri ) Z i 53 log r ( ) Z 0,833 Z 0, 46 i Test: H 0 : ρ ρ ; α 0,05 Z n Z Z + 3 n 3 0, 407 0,0545 7, 46 tabulk : Z 0,975,96 7,46 >>,96 > P << 0,0 CENTRUM BIOSTATISTIK A ANALÝZ
Základ korelační analýz - V Neparametrická korelace (rs) P I v půdě P I v rostl 3 6 7 5 4 8 4 8 6 5 3 7 d I 0 0-0 - - r s i, n; n 8 > v 6 6 n di ( n ) 0, 9048 tab : r s ( v 6 ) 0, 89 Pacient č 3 4 5 6 7 Lékař 4 6 5 3 7 Lékař 4 5 6 3 7 d I 0 - - - 0 6 8 rs 0,857 P 0,358 7 ( 49 ) CENTRUM BIOSTATISTIK A ANALÝZ
Korelace v grafech I 3 Vztah velmi často implikují funkční vztah mezi a a + b a + b + b + b 3 3 a + b + b a + b + b + b 3 CENTRUM BIOSTATISTIK A ANALÝZ
Korelace v grafech II 4 Problém rozložení hodnot Problém tpu modelu r 0,98 (p < 0,00) r 0,76 (p < 0,03) Problém velikosti vzorku r 0, (p < 0,008) r 0,89 (p < 0,4) CENTRUM BIOSTATISTIK A ANALÝZ
Základ regresní analýz 5 Regrese - funkční vztah dvou nebo více proměnných Jednorozměrná f() Vícerozměrná f(,, 3, p) Deterministický Vztah, Regresní, stochastický Pro každé eistuje pravděpodobnostní rozložení CENTRUM BIOSTATISTIK A ANALÝZ
I Příklad lineární nebo "linearizovatelné" regrese koncentrace antigenů čas 6 β + ( čas ) β ( ) 0 + β + β β 0 + β čas β β β 0 : 0,04 : 0,8 : 0,089 P 0,38 P 0,000 P 0,00 II koncentrace O ve vodě koncentrace org C ve vodě β + 0 + β β III ep a ( a + b ) b eponenciální multiplikativní a + b reciproční CENTRUM BIOSTATISTIK A ANALÝZ
Regresní analýza přímk - "Simple regression" a + b + e α + β + ε 7 α a (intercept): a b β b (sklon;slope) ε e - náhodná složka : Ν ( ) ( 0; σ N 0; σ ) e } Komponent tvořící se sčítají ε - náhodná složka modelu přímk rezidua přímk ( ) rozptl reziduí σ e σ CENTRUM BIOSTATISTIK A ANALÝZ
Základní regresní analýz: model přímk v datech 8 n n e a + b - n CENTRUM BIOSTATISTIK A ANALÝZ
Základní regresní analýz: model přímk v datech e 9 e 0 s s e s s e b > 0 b 0 s > s e CENTRUM BIOSTATISTIK A ANALÝZ
Základní regresní analýz: model přímk v datech + [;] { d } b ( ) i } 30 d ) Smsl proložení přímk d b ( ) ) d ( ) minimalizace odchlek α β i i ) i [ ] ) + b ( ) i Metoda nejmenších čtverců ) : Pevná, nestochastická proměnná ) Rozložení hodnot pro každé je normální 3) Rozložení hodnot pro každé má stejný rozptl 4) Rezidua jsou navzájem nezávislá a mají normální rozložení: Ν CENTRUM BIOSTATISTIK A ANALÝZ ( ; σ ) 0 e
3 CENTRUM BIOSTATISTIK A ANALÝZ Odhad parametrů pro lineární regresi I ( )( ) ( ) ~ b b i i i : β ( ) : ~ i b S S σ β from regression deviation standard sample from regression deviation squared mean S S ( ) n b n n d S i i i II b a a ~ α : intercept ~ a S n S S + α σ α III : modelová hodnota i i b a ) ( ) ( ) + n S S i i )
Smsl lineární regrese 3 : Množství spáleného odpadu (tun) : Koncentrace kovu ve vzduchu(ng/m3) Platí: 0; 0; 00; 50; 00; 50; 300 tun Model: a + b Výsledek : ) ) ng kov 4+ 0,3 ; 3 m 0 00 Např : Skutečná data pro 00 t: i 6; 5; 4; 8; 3; 0 > i 68 ) ) a + b + b ( ) } a b Odhadnuto z modelu pro 00 t: 4 + 0,3 00 38,6 CENTRUM BIOSTATISTIK A ANALÝZ
Regresní analýza v grafech 33 3) Graf residuí modelů (příklad) ε εε! ε 0 0 00 (i; ) (i; ) (i; )! Obecné tvar residuí modelů (schéma) a b c d e e e e i, j, i, j, i, j, i, j, CENTRUM BIOSTATISTIK A ANALÝZ
Regresní analýza v grafech 34 ) vs ) vs CENTRUM BIOSTATISTIK A ANALÝZ
Lineární regrese - příklad : Koncentrace drog: 0; ; 6; 8; 0; ; 5 mg/ml krve : Koncentrace volných metabolitů 35 Pro každé : 3 opakování Model: a + b 0, + 0,09 I H 0 : β 0; α 0,05 b 0,09 ; s P < 0,0 0,03 t b S b b 4,00 β P t ( v 9) 0,975 ( n ) : b ± t α,093 / S ( 0,044 β 0,40) 0, 95 b II H 0 : α 0; α 0,05 a 9 t 3,793 t0,975 a 0,; sa 0,09 S a ( v ),093 α ( n ) : α α / ± t S a P ( 0,049 α 0,7) 0, 95 CENTRUM BIOSTATISTIK A ANALÝZ
Analýza rozptlu jako nástroj analýz regresních modelů - příklad na modelu přímk ) Eperimentální data ) Celková ANOVA "one wa" 36 0 n 0 3 3 4 4 Zdroj rozptlu Mezi skupinami Uvnitř skupin Celkem Stv a- na-a na- SS SS B SS E SS T MS SS B /(a-) SS E /(na- a) s F MSB/MSE s 0 s s s 3 s 4 SS T na CENTRUM BIOSTATISTIK A ANALÝZ
Analýza rozptlu jako nástroj analýz regresních modelů - příklad na modelu přímk 37 3) Celková ANOVA SS B /SS T (variance ratio) MS B /MS E F 4) Analýza rozptlu regresního modelu (zde přímk) Zdroj rozptlu Model (přímka) Residuum celkem stv na - na - SS SS MOD SS R SS T MS MS MOD MS R F MS MOD / MS R (SS MOD /SS T ) 00 % rozptlu "včerpaného" přímkou koeficient determinace (R ) CENTRUM BIOSTATISTIK A ANALÝZ
Lineární regrese - příklad 38 : konccd:,,3,4,5,6 ng/ml : absorb: 0,3; 0,49; 0,7; 0,90;,6;,39 b0,8 a0,06 S b 4,990-3 S a 0,09 P 0,000 P 0,457 r 0,999 R 99,8% St Error of est: 0,0 ANOVA Source Df SS MS F P Model 0,9 0,9 086,3 0 Residual 4 0,007 0,00045 Total ( c ) 5 0,938 s 4,5 0-4 s 0,875 CENTRUM BIOSTATISTIK A ANALÝZ