χ 2 testy. Test neorelovanosti. Petr Poší Části doumentu jsou převzaty (i doslovně) z Miro Navara: Pravděpodobnost a matematicá statistia, https://cw.fel.cvut.cz/lib/exe/fetch.php/courses/a6m33ssl/pms_print.pdf s lasavým svolením autora. χ 2 testy 2 χ 2 test dobré shody................................................................................................. 4 Př: Test dobré shody................................................................................................. 5 Moˇzné problémy a jejich řešení....................................................................................... 6 Přílad: Test shody s normálním rozdělením............................................................................ 7 χ 2 test dobré shody 2 disrétních rozdělení............................................................................. 8 χ 2 test nezávislosti 2 rozdělení........................................................................................ 9 Př: χ 2 test nezávislosti.............................................................................................. 10 Př: χ 2 test nezávislosti.............................................................................................. 12 Korelace, odhad a testování 13 Korelace.......................................................................................................... 14 Test neorelovanosti dvou normálních rozdělení....................................................................... 15 Přílad: Test neorelovanosti........................................................................................ 16 1
χ 2 testy 2 / 16 Shoda očeávaných a pozorovaných četností Manaˇzer velé firmy na poradě vedení: Mám tu alarmující zprávu z poslední ontroly docházy našich zaměstnanců. Celých 40 % sic-leavů připadá na ponděly a páty! S tím musíme něco udělat! P. Poší c 2015 A6M33SSL: Statistia a spolehlivost v léařství 3 / 16 :-) χ 2 test dobré shody χ 2 test dobré shody: Slouˇzí testování hypotézy, ˇze náhodná veličina má předpoládané rozdělení (umíme hypotézy jen zamítat; nidy nepotvrdíme, ˇze toto rozdělení sutečně má). Testuje shodu s disrétním rozdělením, teré ovšem mohlo vzninout disretizací spojitého. H 0 : disrétní veličina má rozdělení do tříd s nenulovými pravděpodobnostmi p 1,..., p. Testujeme pomocí realizace náhodného výběru rozsahu n. Není důleˇzité pořadí výsledů, pouze jejich pozorované četnosti n i, i = 1,...,, teré porovnáváme s teoreticými (očeávanými) četnostmi np i. Testovací statistiou je (n T := i np i ) 2, np i=1 i jejíˇz rozdělení se pro n blíˇzí χ 2 ( 1): Dosaˇzená hladina významnosti p = 1 F χ 2 ( 1) (t). H 0 zamítáme pro t > q χ 2 ( 1) (1 α), tj. pro p = 1 F χ 2 ( 1)(t) < α. P. Poší c 2015 A6M33SSL: Statistia a spolehlivost v léařství 4 / 16 2
Přílad: Test dobré shody Zadání: Ověřte H 0, ˇze porodnost ve Švédsu není ovlivněna ročním obdobím. Na jaře, v létě, na podzim a v zimě se tam narodilo 23385, 14978, 14106 a 36519 dětí. Řešení: Roční období, ja je znají ve Švédsu, mají odlišný počet dní neˇz v ČR: jaro 91, léto 62, podzim 61 a zima 151. 300 Porodnost ve Švédsu 250 Porodů za den 200 150 100 23385 14978 14106 35804 50 0 1.4. 1.7. 1.9. 1.11. 1.4. Dny Pouˇzijme χ 2 test dobré shody pozorovaných a očeávaných četností: i Období Měsíce Dnů p i = Dnů 365 n i np i (n i np i ) (n i np i ) 2 np i 1 Jaro duben červen 91 0.24932 23385 22008 1377 86.16 2 Léto červenec srpen 62 0.16986 14978 14944-16 0.02 3 Podzim září říjen 61 0.16712 14106 14752-646 28.29 4 Zima listopad březen 151 0.41370 35804 36519-715 14.00 = 4 Celem 365 1 88273 88273 0 128.47 Realizace testovací statistiy je (n t = i np i ) 2 = 128.47. np i=1 i Dosaˇzená hladina významnosti p = 1 F χ 2 ( 1) (t) = 1 F χ 2 (3) (128.47). = 0. Zamítáme H 0. Roční období statisticy významně ovlivňuje porodnost ve Švédsu. P. Poší c 2015 A6M33SSL: Statistia a spolehlivost v léařství 5 / 16 3
Moˇzné problémy a jejich řešení Problém: Testujeme na rozdělení, terému se to sutečné jen limitně blíˇzí. Dopouštíme se blíˇze neurčené dodatečné chyby. Aby byl náš předpolad oprávněný, teoreticé četnosti tříd nesmí být příliš malé (alespoň 5). Vychází-li teoreticá četnost v nějaé třídě příliš malá, sloučíme ji s jinými třídami, poud moˇzno blízými, či podobnými. Problém: Zoumané rozdělení můˇze záviset na neznámých parametrech. Parametry odhadneme na záladě jiného náhodného výběru. Parametry odhadneme na záladě stejného náhodného výběru, terý pouˇzíváme testu dobré shody. Tím jsme ale sníˇzili počet stupňů volnosti, taˇze musíme testovat na rozdělení χ 2 ( 1 q), de q je počet odhadnutých parametrů. Problém: Chceme testovat shodu se spojitým nebo smíšeným rozdělením. Rozdělení disretizujeme, tj. všechny moˇzné výsledy rozdělíme do disjuntních tříd. Prvy v aˇzdé třídě si mají být blízé, jina sniˇzujeme sílu testu. Všechny teoreticé četnosti by měly být dostatečně velé a nejlépe zhruba stejné. Poznáma: Zásadně musíme pracovat s jednotami (objety), z nichˇz aˇzdá zvlášt (a nezávisle) je zařazena do nějaé třídy. Nelze počítat s tisíci, procenty, spojitým množstvím, atd. P. Poší c 2015 A6M33SSL: Statistia a spolehlivost v léařství 6 / 16 4
Přílad: Test shody s normálním rozdělením Zadání: Na jistém gymnáziu v vartě v předmětu Matematia byla nasbírána následující data týající se absence při výuce (X) a úspěšnosti ve zoušce (Y). Výběr obsahuje 21 studentů (2 body v grafu mají četnost 2). Ověřte hypotézy o normalitě obou proměnných. 30 Úspěšnost v přestupové zoušce [body] 25 20 15 10 5 0 10 20 30 40 Absence [%] Řešení: χ 2 test shody s disretizovaným normálním rozdělením. Poznáma: Tato se obvyle normalita netestuje, existují jiné, lepší testy shody s normálním rozdělením (např. Shapiro-Wil). Zde uvedeno jao demonstrace využítí χ 2 testu. Maximálně věrohodné odhady parametrů rozdělení: X N(x, s 2 x) = N(12.23, 115.19), Y N(y, s 2 y) = N(14.73, 49.65). Disretizace: Vzhledem tomu, ˇze rozsah výběru je 21 a ˇze teoreticá četnost v aˇzdé supině by měla být alespoň 5, nemůˇzeme si dovolit disretizaci do více neˇz 4 supin. Pouˇzijme tedy intervaly s hranicemi (, dolní vartil q( 4 1), medián q( 2 1), horní vartil q( 4 3 ), ). Test dobré shody: protoˇze jsme odhadli 2 parametry rozdělení ze stejných dat, musíme testovat na rozdělení χ 2 (4 1 2) = χ 2 (1). Četnost v intervalu t p = 1 F χ 2 (1) (t) (, q( 1 4 )) q( 1 4 ), q( 2 1)) q( 1 2 ), q( 4 3)) q( 3 4 ), ) Očeávané 5.25 5.25 5.25 5.25 X 8 4 3 6 2.81 0.094 Y 6 6 4 5 0.52 0.469 Hypotézy o normalitě X a Y nemůˇzeme zamítnout. P. Poší c 2015 A6M33SSL: Statistia a spolehlivost v léařství 7 / 16 χ 2 test dobré shody 2 disrétních rozdělení H 0 : Dvě disrétní náhodné veličiny mají stejné rozdělení p. Rozsahy výběrů jsou m a n a pozorované četnosti ve třídách i = 1,..., jsou m i a n i taové, ˇze i m i = m a i n i = n. Předpoládáme disrétní rozdělení p s neznámými parametry p i, i = 1,...,. (m i mp i ) 2 se blíˇzí χ 2 ( 1), mp i=1 i (n i np i ) 2 se blíˇzí χ 2 ( 1), np i=1 i (m T := i mp i ) 2 (n + mp i=1 i i np i ) 2 se blíˇzí χ 2 (2( 1)). np i=1 i Neznámé parametry p i odhadneme metodou maximální věrohodnosti jao p i = m i + n i m+n, z nichˇz je ale jen 1 nezávislých, taˇze výsledný počet stupňů volnosti je 2( 1) ( 1) = ( 1) a testujeme T na rozdělení χ 2 ( 1). H 0 zamítáme pro t > q χ 2 ( 1) (1 α), tj. pro p = 1 F χ 2 ( 1)(t) < α. Pratičtější evivalentní vzorec pro T: ( 1 T = m + 1 ) (m n i mp i ) 2. (POZOR! Ve vzorci je sutečně, nioli ). p i=1 i ṗ i mp i P. Poší c 2015 A6M33SSL: Statistia a spolehlivost v léařství 8 / 16 5
χ 2 test nezávislosti 2 rozdělení H 0 : Dvě disrétní náhodné veličiny (jejichˇz rozdělení neznáme) jsou nezávislé. X nabývá hodnot s pravděpodobnostmi p 1,..., p, Y nabývá m hodnot s pravděpodobnostmi q 1,..., q m. Realizace dvojrozměrného náhodného výběru ((x 1, y 1 ),...,(x n, y n )) obsahuje dvojice realizací náhodných veličin X, Y. Zajímají nás opět jen pozorované četnosti n ij, i = 1...,, j = 1..., m, teré bývají uspořádány do tzv. ontingenční tabuly s m buňami. Za předpoladu nezávislosti proměnných X, Y je pravděpodobnost výsledu ij rovna p i q j. T := m i=1 j=1 (n ij np i q j ) 2 má přibliˇzně rozdělení χ 2 (m 1). np i q j Neznámé parametry p i, q j odhadneme metodou maximální věrohodnosti jao p i = m j=1 n ij n a q j = i=1 n ij, n z nichˇz je ale jen ( 1)+(m 1) nezávislých, taˇze výsledný počet stupňů volnosti je (m 1) ( 1) (m 1) = ( 1)(m 1) a testujeme T na rozdělení χ 2 (( 1)(m 1)). H 0 zamítáme pro t > q χ 2 (( 1)(m 1)) (1 α), tj. pro p = 1 F χ 2 (( 1)(m 1))(t) < α. P. Poší c 2015 A6M33SSL: Statistia a spolehlivost v léařství 9 / 16 Př: χ 2 test nezávislosti Zadání: Zjistěte, zda má streptomycin vliv na léčbu plicní tuberulózy, z dat pro dva nezávislé výběry (viz níˇze): první supina byla léčena streptomycinem, druhá (ontrolní) supina dostávala placebo. Řešení: Pouˇzijeme χ 2 -test nezávislosti: i, X (Lé) j, Y (Změna stavu) 1, Streptomycin 2, Placebo i n ij q j = 1 n i n ij 1, Významné zlepšení 28 4 32 0.299 16.45 15.55 2, Střední / malé zlepšení 10 13 23 0.215 11.82 11.18 3, Beze změn 2 3 5 0.047 2.57 2.43 4, Střední / malé zhoršení 5 12 17 0.159 8.74 8.26 5, Významné zhoršení 6 6 12 0.112 6.17 5.83 6, Smrt 4 14 18 0.168 9.25 8.75 j n ij 55 52 107 1 p i = 1 n j n ij 0.514 0.486 1 Očeávaná četnost jevu X = Streptomycin Y = Význ. zlepšení: np 1 q 1 = n 1 n j n 1j 1 n i n i1 = 55 32 107 = 16.45 Očeávaná četnost jevu X = Placebo Y = Význ. zhoršení: np 2 q 5 = n 1 n j n 2j 1 n i n i5 = 52 12 107 = 5.83 P. Poší c 2015 A6M33SSL: Statistia a spolehlivost v léařství 10 / 16 6
Test nezávislosti (por.) Realizace testové statistiy: m (n ij np i q j ) t = 2 = 26.96. np i=1 j=1 i q j Při = 2 a m = 6 se rozdělení T blíˇzí χ 2 (( 1)(m 1)) = χ 2 (5). Dosaˇzaná hladina významnosti: p = 1 F χ 2 (5) (26.96) = 5.8 10 5. Závěr: Zamítáme H 0. Způsob léčby a stav pacienta nejsou nezávislé. V testu jsme se dopustili chyby (porušení předpoladů). Víte de? P. Poší c 2015 A6M33SSL: Statistia a spolehlivost v léařství 11 / 16 Př: χ 2 test nezávislosti Problém: Očeávané četnosti v řádu 3 jsou příliš malé (np i q j < 5) a v řádu 5 jsou blízo hranici. Řešení: Spojíme řády tabuly: (3,4) a (5,6), i dyˇz řády 5 a 6 bychom spojovat nemuseli. i, X (Lé) j, Y (Změna stavu) 1, Streptomycin 2, Placebo i n ij q j = 1 n i n ij 1, Významné zlepšení 28 4 32 0.299 16.45 15.55 2, Střední / malé zlepšení 10 13 23 0.215 11.82 11.18 3, Beze změn 2 3 5 0.047 2.57 2.43 4, Střední / malé zhoršení 5 12 17 0.159 8.74 8.26 5, Významné zhoršení 6 6 12 0.112 6.17 5.83 6, Smrt 4 14 18 0.168 9.25 8.75 j n ij 55 52 107 1 p i = 1 n j n ij 0.514 0.486 1 i, X (Lé) j, Y (Změna stavu) 1, Streptomycin 2, Placebo i n ij q j = 1 n i n ij 1, Významné zlepšení 28 4 32 0.299 16.45 15.55 2, Střední / malé zlepšení 10 13 23 0.215 11.82 11.18 3, Beze změn, Střední / malé zhoršení 7 15 22 0.206 11.31 10.69 4, Významné zhoršení, Smrt 10 20 30 0.280 15.42 14.58 j n ij 55 52 107 1 p i = 1 n j n ij 0.514 0.486 1 Realizace testové statistiy: m (n ij np i q j ) t = 2 = 24.57. np i=1 j=1 i q j Při = 2 a m = 4 se rozdělení T blíˇzí χ 2 (( 1)(m 1)) = χ 2 (3). Dosaˇzaná hladina významnosti: p = 1 F χ 2 (3) (24.57) = 1.9 10 5. Závěr: Zamítáme H 0. Způsob léčby a stav pacienta nejsou nezávislé. P. Poší c 2015 A6M33SSL: Statistia a spolehlivost v léařství 12 / 16 7
Korelace, odhad a testování 13 / 16 Korelace Korelace ρ(x, Y) náhodných veličin X, Y (s nenulovým rozptylem) je střední hodnota součinu odpovídajících normovaných veličin X E X σ a Y E Y X σ : Y ρ(x, Y) = E((X E X)(Y E Y)) σ X σ Y 1, 1 Korelace je nulová pro nezávislé náhodné veličiny, ale i pro něteré jiné, tzv. neorelované. Krajní hodnoty ±1 odpovídají lineární závislosti mezi X, Y. Na záladě dvojrozměrného náhodného výběru ((X 1, Y 1 ),...,(X n, Y n )) můˇzeme orealaci odhadnout pomocí výběrového oeficientu orelace R X,Y = n i=1 (X i X)(Y i Y) ( n i=1 (X i X) 2)( n i=1 (Y i Y) 2). Pro výpočet se často pouˇzívá evivalentní jednoprůchodový vzorec n i=1 n R X,Y = X iy i ( i=1 n X i)( i=1 n Y i) ( n i=1 n X2 i ( i=1 n X i) 2)( n i=1 n Y2 i ( i=1 n Y i) 2) P. Poší c 2015 A6M33SSL: Statistia a spolehlivost v léařství 14 / 16 Test neorelovanosti dvou normálních rozdělení Předpolad: Dvojrozměrná náhodná veličina (X, Y) má dvojrozměrné normální rozdělení, n 3. H 0 : Veličiny X a Y jsou neorelované, tj. ρ(x, Y) = 0. Testovací statistiou je T = R X,Y n 2. 1 R 2 X,Y Platí-li H 0, T má rozdělení t(n 2). Dále postupujeme stejně jao při t-testu. P. Poší c 2015 A6M33SSL: Statistia a spolehlivost v léařství 15 / 16 8
Přílad: Test neorelovanosti Zadání: Na jistém gymnáziu v vartě v předmětu Matematia byla nasbírána následující data týající se absence při výuce (X) a úspěšnosti ve zoušce (Y). Výběr obsahuje 21 studentů (2 body v grafu mají četnost 2), realizace výběrového orelačního oeficientu r = 0.521. Ověřte hypotézu, ˇze absence není orelovaná s úspěšností. 30 Úspěšnost v přestupové zoušce [body] 25 20 15 10 Řešení: Test neorelovanosti. Testová statistia 5 0 10 20 30 40 Absence [%] t = r n 2 1 r 2 = 0.521 21 2 1 0.521 2 Dosaˇzená hladina významnosti = 2.661. p = 2(1 F t(n 2) ( t )) = 2(1 F t(19) (2.661)) = 0.015. Závěr: Na hladině významnosti 5 % zamítáme H 0 (ve prospěch H A, ˇze absence a úspěšnost jsou orelované). Na hladině významnosti 1 % H 0 zamítnout nemůˇzeme. P. Poší c 2015 A6M33SSL: Statistia a spolehlivost v léařství 16 / 16 9