Přednáška X. Testování hypotéz o kvantitativních proměnných

Rozměr: px
Začít zobrazení ze stránky:

Download "Přednáška X. Testování hypotéz o kvantitativních proměnných"

Transkript

1 Přednáška X. Testování hypotéz o kvantitativních proměnných Testování hypotéz o podílech Kontingenční tabulka, čtyřpolní tabulka Testy nezávislosti, Fisherůvexaktní test, McNemarůvtest Testy dobré shody pro ověření rozdělení pravděpodobnosti

2 Opakování analýza rozptylu Proč je výhodnější provést srovnání průměrů spojité veličiny u více než dvou skupin pomocí analýzy rozptylu než pomocí testů pro všechny dostupné dvojice sledovaných skupin? Jak lze řešit situaci, kdy chceme provést více testů zároveň?

3 Opakování princip analýzy rozptylu Jaký je princip analýzy rozptylu? Jaké jsou předpoklady analýzy rozptylu?

4 Opakování normalita dat Jak můžeme seriózně ověřit normalitu dat?

5 . Motivace

6 Matematická biologie modré oči

7 Studenti matematické biologie s modrýma očima Budeme sledovat podíl studentů matematické biologie (současných i bývalých), kteří mají modré oči. Náhodná veličina A modrá barva očí alternativní náhodná veličina. A 0 když student má modré oči když student nemá modré oči P( A ) π P( A 0) π Náhodná veličina X počet studentů matematické biologie s modrýma očima binomická náhodná veličina. Je to součet n alternativních veličin. X n i Ai X ~ Bi( n, π ) Odhad parametru π: ˆ π p X / n

8 Studenti matematické biologie s modrýma očima Budeme sledovat podíl studentů matematické biologie, kteří mají modré oči. Výsledky v tabulce: Modrá barva očí Jiná barva očí Celkem Studenti matematické biologie (současní i bývalí) Odhad parametru π: ˆ π p X / n 7 / 60 0,83

9 Studenti matematické biologie s modrýma očima Budeme se zajímat o to, jestli podíl studentů matematické biologie, kteří mají modré oči, souvisí s obdobím studia. Výsledky v tabulce: Studenti BIMAT Modrá barva očí Jiná barva očí Celkem Současní 3 4 Bývalí 6 8 Celkem

10 . Testování hypotéz o podílech

11 Co nás bude zajímat? Binární data jsou v medicíně i biologii častá výskyt ano/výskyt ne, úspěch/neúspěch, Kromě bodového odhadu nás může zajímat Interval spolehlivosti pro parametr π Test o parametru π proti konstantě π 0 Test o parametru π ve dvou souborech

12 Aproximace na normální rozdělení Pravděpodobnost, že náhodná veličina X bude při své realizaci rovna hodnotě k lze přesně stanovit pomocí vzorce: n P( X k π π k k n k ) ( ) Pro větší n (a tedy větší rozsah možných hodnot k) je jednodušší použít aproximaci normálním rozdělením. Vychází z CLV součty se pro dostatečné n chovají normálně. Předpokladem aproximace na normální rozdělení je součin np i n( p) větší než 5, nebo ještě lépe součin np i n( p) větší než 0. Pak platí: X nπ Z ~ N(0,) nπ ( π )

13 Proč np i n( p) větší než 5? Souvisí s množstvím informace nutné pro dosažení tvaru normálního rozdělení nutné pro vhodnost, respektive přesnost aproximace. Pro π 0,5 je jednodušší dosáhnout tvar normálního rozdělení než pro π 0, nebo π 0,9. Pro π hodně blízká 0 nebo není aproximace vhodná.

14 Interval spolehlivosti pro podíl Máme n studentů Matematické biologie a mezi nimi x s modrýma očima. Rozdělení pravděpodobnosti odhadu parametru π: ˆ π p x / n E ( p) E( x / n) E( x) / n nπ / n π D( p) D( x / n) D( x) / n nπ ( π ) / n π ( π ) / n Při konstrukci intervalu spolehlivosti neznáme hodnotu π, proto je logické ji v odhadu rozptylu (a SE) nahradit odhadem p: SE ( p) D( p) p( p) / n Při splnění podmínek pro aproximaci normálním rozdělením má 00( α)% IS tvar: p z SE p) p ± z p( p) / n ± α / ( α /

15 Příklad s modrýma očima Máme 60 studentů Matematické biologie a mezi nimi 7 s modrýma očima. Modrá barva očí Jiná barva očí Celkem Studenti matematické biologie (současní i bývalí) Odhad parametru π: ˆ π p X / n 7 / 60 Chceme sestrojit 95% IS pro parametr π. 0,83 Splnění podmínek pro aproximaci normálním rozdělením: np 60*0,83 7 n( p) 60*( 0,83) 43 Pak SE( p) D( p) p( p) / n 0,83( 0,83) / 60 0,058 95% IS: p ± z α / SE( p) 0,83±,96*0,058 (0,69;0,397)

16 Test pro podíl u jednoho výběru Chceme testovat rovnost odhadu parametru π získaného na náhodném výběru n jedinců předem dané hodnotě π 0 : Při splnění podmínek pro aproximaci normálním rozdělením víme, že platí: Z p π SE( p) To za platnosti H 0 znamená: p π π ( π ) / n H 0 : π π 0 ~ N(0,) Z p π 0 p π 0 ~ N(0,) SE p) π ( π ) / n ( 0 0 Vypočteme hodnotu testové statistiky a nulovou hypotézu zamítáme podle toho, jakou máme alternativu a hladinu významnosti α. Pro alternativu Z > z α H : π π 0 zamítáme H 0 když /

17 Příklad s modrýma očima Chceme testovat na hladině významnosti α0,05 rovnost odhadu parametru π získaného na výběru 60 matematických biologů předem dané hodnotě π 0 0,40: H 0 : π 0,4 Splnění podmínek pro aproximaci normálním rozdělením máme ověřeno. Testová statistika: p π p π 0 Z SE( p) π 0( π 0) / n Srovnání s kvantilem: 0,83 0,400 0,4( 0,4) / 60 0 Z,85 < z α / z0, 975,96,85 Nezamítáme H 0 : π 0,40.

18 Je rozdíl mezi IS a testem? Pokud ano, v čem?

19 Je rozdíl mezi IS a testem? Ano je Konstrukce IS: Test H 0 : SE ( p) p( p) / n SE p) π ( ) / n ( 0 π 0 Binomické rozdělení má různou variabilitu pro různé hodnoty π největší je pro π 0,5, směrem k 0 a variabilita klesá. Neplatí ekvivalence mezi intervalem spolehlivosti a testem proti π 0 jako tomu bylo v případě průměru jako odhadu střední hodnoty.

20 IS pro podíl ve dvou souborech Máme n studentů Matematické biologie a mezi nimi x s modrýma očima, x je současných a x je již vystudovaných. Zajímá nás interval spolehlivosti pro rozdíl podílů studentů s modrýma očima ve skupině současných a již vystudovaných studentů: π π. Podmínky pro aproximaci normálním rozdělením musí být splněny v obou výběrech. Rozdělení pravděpodobnosti odhadu parametru π v jednotlivých souborech: x x ˆ π p ˆ π p n n Při splnění podmínek pro aproximaci normálním rozdělením má 00( α)% IS tvar: p SE p ( p p) D( p) + D( p) n + n ( p ) p ( p ) p p ± z α / SE( p p) p p ± z α / n + n ( p ) p ( p )

21 Příklad s modrýma očima Máme 60 studentů Matematické biologie a mezi nimi 7 s modrýma očima, je současných a 6 je již vystudovaných. Chceme 95% IS pro π π. Studenti BIMAT Modrá barva očí Jiná barva očí Celkem Současní 3 4 Bývalí 6 8 Celkem Splnění podmínek pro aproximaci normálním rozdělením dáno tabulkou. Odhady: π p x / n / 4 0,6 π p x / n 6 /8 0, 333 ˆ p ( p ) p ( p ) 0,6( 0,333( ( ) 0,6) SE p p n + n ˆ 0,333) 0,30 95% IS pro π π : p p ± z α / SE( p p) 0,07±,96*0,30 ( 0,36;0,84)

22 Test pro podíl ve dvou výběrech Chceme testovat rovnost odhadu parametru π získaného na dvou náhodných výběrech n a n jedinců: H 0 : π π π Nejlepším odhadem parametru π je za platnosti H 0 : ˆ π p r n + r + n Odhady pro jednotlivé výběry: Při splnění podmínek pro aproximaci normálním rozdělením (musí být splněny v obou souborech zároveň) víme, že platí: kde p( p) p( p) SE ( p p ) + p( p)( + n n n n Z p p ~ (0,) ( ) N SE p p Pro alternativu H : π π zamítáme H 0 když Z > z α / ˆ π p x / n ˆ π p x / n )

23 Příklad s modrýma očima Máme 60 studentů Matematické biologie a mezi nimi 7 s modrýma očima, je současných a 6 je již vystudovaných. Testujeme Studenti BIMAT Modrá barva očí Jiná barva očí Celkem Současní 3 4 Bývalí 6 8 Celkem Odhady: ˆ π p 0,83 H 0 : π π π π p 0,6 π p 0, 333 ˆ ˆ SE( p p) p( p)( ) 0,83( 0,83)( n ) 0,7 n Testová statistika: p p Z SE( p p ) / 0, 975 0,6 0,333 0,7 0,56 Z 0,56 < z α z,96 Nezamítáme H 0.

24 3. Analýza kontingenčních tabulek

25 Kontingenční tabulka Frekvenční sumarizace dvou nominálních nebo ordinálních veličin pomocí tabulky. Proměnné reprezentujeme diskrétními náhodnými veličinami X a Y. Speciální případ: tabulka čtyřpolní tabulka. Př.: Sumarizace pacientů diagnostikovaných s melanomem dle lokalizace onemocnění a roku diagnózy. Období Lokalizace Horní končetina Dolní končetina Trup Hlava a krk Celkem Celkem

26 Kontingenční tabulka hypotézy Kontingenční tabulky umožňují testování různých hypotéz: Nezávislost (Pearsonův chí kvadrát test) Jeden výběr, dvě charakteristiky obdoba nepárového uspořádání Př.: studenti matematické biologie modré oči období studia Shoda struktury (Pearsonův chí kvadrát test) Více výběrů, jedna charakteristika obdoba nepárového uspořádání Př.: pacienti s IM v několika nemocnicích věková struktura Symetrie (McNemarův test) Jeden výběr, opakovaně jedna charakteristika obdoba párového uspořádání Př.: stromy posouzení jejich stavu ve dvou sezónách

27 Značení Proměnné reprezentujeme diskrétními náhodnými veličinami X a Y. Označme n ij počet subjektů, pro které platí, že Xi a Yj (i,..., r; j,..., c). Marginální četnosti: Celkový počet subjektů: c r. j ij. i r c n i n n i j n ij n j n ij Relativní četnosti lze vztahovat: Vzhledem k celkovému n Vzhledem k řádkovým součtům n i. p p ij r ij n n ij ij / n / n i. Vzhledem k sloupcovým součtům n.j p c ij n ij / n. j

28 Pointa testu pro kontingenční tabulku Celkem 7 studentů s modrýma očima 8,3 %. Pokud modré oči nesouvisí s obdobím studia, mělo by stejné zastoupení modrookých platit i v rámci skupin očekávaná četnost za platnosti H 0 o nezávislosti: eij ni. n. j / n Ekvivalentně lze nezávislost vyjádřit následovně: Z toho plyne: e ij n n i.. j npi. p. j n n n Očekávané četnosti v příkladu s modrýma očima: Studenti BIMAT Modrá barva očí Jiná barva očí Celkem Současní,9 30, 4 Bývalí 5,,9 8 Celkem n i. n n p ij pi. p. j. j

29 Příklad melanomy Období veličina X Horní končetina Y Lokalizace veličina Y Dolní končetina Y Trup Y 3 Hlava a krk Y 4 Celkem X 50 n 03 n 6 n 3 7 n 4 76 n X 06 n 57 n 30 n 3 54 n 4 67 n X 3 5 n 3 4 n 3 36 n 33 5 n n 3. Celkem 7 n. 40 n. 74 n.3 3 n.4 58 n Období veličina X Horní končetina Y Lokalizace veličina Y Dolní končetina Y Trup Y 3 Hlava a krk Y 4 Celkem X 8. % 37.3 % 4.03 %.54 % 00 % X 6.9 % 5.04 % % 8.6 % 00 % X %.7 % % 8.3 % 00 % Celkem 7.74 % 6.3 % % 7.40 % 00 %

30 Pearsonův chí kvadrát test nezávislosti Založen na myšlence srovnání pozorovaných a očekávaných četností jednotlivých hodnot, kterých nabývá náhodná veličina X. Pozorované četnosti jednotlivých variant Xi a Yj nám vyjadřují n ij. Za platnosti nulové hypotézy lze očekávané četnosti jednotlivých variant Xi a Yj vypočítat pomocí: Karl Pearson odvodil, že statistika má za platnosti H 0 chí kvadrát rozdělení s (r )(c ) stupni volnosti: Nulovou hypotézu o nezávislosti X a Y zamítáme na hladině významnosti α, když Χ χ ( r )( c ) ( α) e ij ni n n n r c ( nij eij ) Χ e i j.. j n n i. ij n n. j Χ χ ~ ( r )( c )

31 Předpoklady Pearsonova chí kvadrát testu Nezávislost jednotlivých pozorování Alespoň 80 % buněk musí mít očekávanou četnost (e ij ) větší než 5 00 % buněk musí mít očekávanou četnost (e ij ) větší než

32 Příklad melanomy Období veličina X Horní končetina Y Lokalizace veličina Y Dolní končetina Y Trup Y 3 Hlava a krk Y 4 Celkem X 50 n 03 n 6 n 3 7 n 4 76 n X 06 n 57 n 30 n 3 54 n 4 67 n X 3 5 n 3 4 n 3 36 n 33 5 n n 3. Celkem 7 n. 40 n. 74 n.3 3 n.4 58 n Období veličina X Horní končetina Y Lokalizace veličina Y Dolní končetina Y Trup Y 3 Hlava a krk Y 4 Celkem X e e 7.6 e e X e.0 e e e X 3 e e e e Celkem

33 Příklad melanomy Χ Př.: Sumarizace pacientů diagnostikovaných s melanomem dle lokalizace onemocnění a roku diagnózy. Testová statistika: Výpočet: (50 48,95) 48,95 (30 304,47) + 304,47 (03 7,6) + 7,6 (54 46,37) + 46,37 r c ( nij eij ) Χ e (6 34,03) + 34,03 (5 0,85) + 0,85 i j ij (7 0,4) + 0,4 (4 64,43) + 64,43 (06,0) +,0 (36 303,50) + 303,50 (57 64,96) + 64,96 (5 46,) + 46, + 30,4 Kritická hodnota: χ( r )( c ) ( α) χ(6) (0,05),59 Χ χ (6) (0,05) Zamítáme H 0 o nezávislosti.

34 Příklad s modrýma očima Máme 60 studentů Matematické biologie a mezi nimi 7 s modrýma očima, je současných a 6 je již vystudovaných. Testujeme nezávislost. Testová statistika: Výpočet: Χ (,9),9 r c ( nij eij ) Χ e i j (3 30,) + 30, ij (6 5,) + 5, (,9) +,9 0,3 Kritická hodnota: χ( r )( c ) ( α) χ() (0,05) 3,84 Χ < χ () (0,05) Nezamítáme H 0 o nezávislosti.

35 4. Čtyřpolní tabulky

36 Co je čtyřpolní tabulka Nejjednodušší možná kontingenčí tabulka, kdy obě sledované veličiny mají pouze dvě kategorie. Příklad z. přednášky: Zajímá nás přesnost vyšetření jater ultrazvukem, tedy schopnost vyšetření UTZ identifikovat maligní ložisko v pacientových játrech. Přesnost je vztažena k histologickému ověření odebrané tkáně. Vyšetření UTZ Histologické ověření Maligní Benigní Celkem Maligní 3 34 Benigní Celkem Zde jsme závislost neověřovali, ale dokonce předpokládali!

37 Asociace ve čtyřpolní tabulce Můžeme rozhodovat o závislosti/nezávislosti dvou sledovaných veličin nyní. Můžeme rozhodovat i o míře (těsnosti) této závislosti příští přednáška. Veličina X Veličina Y Y Y Celkem X a b a +b X c d c+ d Celkem a+ c b+ d n Při rozhodování o nezávislosti můžeme použít Pearsonůvchí kvadrát test, ale pro malá n je standardem v klinických analýzách tzv. Fisherův exaktní test ( Fisher exact test ).

38 Fisherůvexaktní test Určen zejména pro čtyřpolní tabulky, je vhodný i pro tabulku s malými četnostmi pro ty, které nesplňují předpoklad Pearsonova testu. Založen na výpočtu přesné p hodnoty, která zde hraje roli testové statistiky. Pointa je ve výpočtu pravděpodobnosti, se kterou bychom získali čtyřpolní tabulky stejně nebo více odchýlené od nulové hypotézy při zachování marginálních četností. Pravděpodobnost konkrétní tabulky (s pevně zvolenou hodnotou a při zachování marginálních četností) lze získat: p a a+ c b+ d a b n a+ b Pointa spočítáme p a všech možných tabulek při zachování marginálních četností a výsledná p hodnota je součtem p a menších nebo stejných jako p a, která přísluší pozorované tabulce. ( a + b)!( a + c)!( c + d)!( b + d)! n! a! b! c! d!

39 Příklad s modrýma očima Sledujeme vztah modrých očí a období studia matematické biologie. Pomocí Fisherova exaktního testu chceme testovat H 0 o nezávislosti. Studenti BIMAT Modrá barva očí Jiná barva očí Celkem Současní 3 4 Bývalí 6 8 Celkem Pravděpodobnost pozorované tabulky: p a ( a + b)!( a + c)!( c + d)!( b + d)! n! a! b! c! d! 4!7!8!43! 60!!3!6!! 0,05 Tento výsledek sám o sobě znamená, že nezamítáme H 0, protože p a > 0,05.

40 Příklad s modrýma očima Vypočítejme pravděpodobnosti pro jednotlivé možnosti kontingenční tabulky: Studenti BIMAT Modrá barva očí Jiná barva očí Celkem Současní a b 4 Bývalí c d 8 Celkem p a a+ c b+ d a b n a+ b ( a + b)!( a + c)!( c + d)!( b + d)! n! a! b! c! d!

41 Příklad s modrýma očima Možnosti a b c d p a , , , , , , , , , , , , , , , , , ,6 0 4 p a 0,45 0,755 Nezamítáme H 0

42 Fisherův Pearsonůvtest Pearsonůvchí kvadrát test lze použít na jakoukoliv kontingenční tabulku, ALE je nutné hlídat předpoklady: 80 % e ij větších než 5 u čtyřpolní tabulky to znamená 00 %. Nedodržení předpokladů pro Pearsonůvchí kvadrát test může stejně jako u t testu a analýzy rozptylu vést k nesmyslným závěrům! Situace s malými n ij a tedy i e ij jsou ale v medicíně i biologii velmi časté Fisherůvexaktní test je klíčový pro hodnocení čtyřpolních tabulek.

43 Test hypotézy o symetrii McNemarův test Mám 0 pacientů, u každého opakovaně sleduji výskyt otoků před podáním a po podání léku. Která tabulka je správně? Před podáním léku Po podání léku Celkem Bez otoku (úspěch) 7 9 S otokem (neúspěch) 3 8 Celkem Po podání bez otoku Po podání s otokem Celkem Před podáním bez otoku 5 7 Před podáním s otokem Celkem 8 0

44 McNemarůvtest Je to obdoba párového testu (test symetrie pro čtyřpolní tabulku). Zaměřuje se pouze na pozorování, u kterých jsme při opakovaném měření zaznamenali rozdílné výsledky za platnosti H 0 by jejich četnosti (označeny b a c) měly být stejné. Testová statistika pro čtyřpolní tabulku: Za platnosti H 0 má statistika chí kvadrát rozdělení s stupněm volnosti. Nulovou hypotézu o nezávislosti X a Y zamítáme na hladině významnosti α, když Χ χ ( α) Χ ( b c b + c ) Testová statistika pro obecnou kontingenční tabulku: Χ ( nij n ji ) i< j nij + n ji

45 Příklad McNemarův test Mám 0 pacientů, u každého opakovaně sleduji ústup otoků po podání léku A aléku B. Zajímá mě rozdíl v četnosti otoků. Po podání bez otoku Po podání s otokem Celkem Před podáním bez otoku 5 7 Před podáním s otokem Celkem 8 0 Testová statistika pro čtyřpolní tabulku: Χ ( b c) b + c ( 7) + 7,78 Kritická hodnota: χ ( α) χ (0,05) ( ) () 3,84 Χ < χ () (0,05) Nezamítáme H 0 o tom, že není rozdíl ve výskytu otoků před a po podání léku.

46 5. Testy o rozdělení náhodné veličiny

47 Testy o rozdělení náhodné veličiny Kolmogorovův Smirnovovůvtest založen na srovnání výběrové distribuční funkce s teoretickou distribuční funkcí odpovídající rozdělení, které chceme testovat. K S test hodnotí maximální vzdálenost mezi těmito dvěma distribučními funkcemi. Pearsonův chí kvadrát test chí kvadrát test dobré shody i pro testování shody s teoretickým rozdělením je založen na myšlence srovnání pozorovaných a očekávaných četností jednotlivých hodnot, kterých nabývá náhodná veličina X. Q Q plot zobrazuje proti sobě kvantily pozorovaných hodnot a kvantily teoretického rozdělení pravděpodobnosti.

48 Chí kvadrát test dobré shody Předpokládejme, že náhodná veličina X může nabývat r různých hodnot B, B,,B r, každé s pravděpodobností p, p,, p r s tím, že r p i i Uvažujme n pozorování náhodné veličiny X: pokud je pravděpodobnostní model správný, měl by se počet pozorování jednotlivých variant, ν i, blížit r hodnotě np i s tím, že ν n i i

49 Chí kvadrát test dobré shody Označme pozorovanou četnost ité varianty náhodné veličiny o i ( observed ) a očekávanou četnost ité varianty náhodné veličiny e i ( expected ). Opět platí, že statistika má za platnosti H 0 chí kvadrát rozdělení s r stupni volnosti: Nulovou hypotézu o shodě rozdělení veličiny X s předpokládaným rozdělením zamítáme na hladině významnosti α, když Χ r ( oi i ) i e e i Χ Χ χ( r ) χ ~ ( r ) ( α) Když H 0 specifikuje pouze typ rozdělení, ale ne jeho parametry, pak musí být tyto parametry odhadnuty z pozorovaných hodnot. Za každý takto odhadnutý parametr se počet stupňů volnosti testové statistiky snižuje o.

50 Chí kvadrát test pro spojité veličiny Spojitá veličina samozřejmě může nabývat nespočetně mnoho hodnot v určitém intervalu. Chí kvadrát test dobré shody lze použít i pro spojité veličiny, které však musíme kategorizovat rozdělit obor možných hodnot do r disjunktních intervalů. B B B r B r

51 Příklad melanom a normální rozdělení Chceme zjistit, jestli věk u pacientů s melanomem vykazuje normální rozdělení. N( μ 56,, σ 8,4) Věk (roky) Věk i tý interval o i e i o i e i 0,0 8, ,3 6, ,7 5, ,0 33, ,3 4, ,7 50, ,0 58, ,3 66, ,7 75, ,0 83, ,3 9, ,7 00,

52 Příklad melanom a normální rozdělení Chceme zjistit, jestli věk u pacientů s melanomem vykazuje normální rozdělení. N( μ 56,, σ 8,4) Χ r i ( o i e e i 56,6 df r 9 i ) Odhad parametrů μ a σ z dat. Χ 56,6 χ p < 0,00 ( r ) ( α) χ (9) (0,05) 6,9 Věk (roky) Zamítáme H 0 o normalitě rozdělení věku pacientů s melanomem.

53 Příklad Poissonovo rozdělení Chceme ověřit, že počet pacientů, kteří přijdou ve všední den na zubní pohotovost se řídí Poissonovým rozdělením. Jednotkou času bude 30 minut. Celkem byly zaznamenány údaje za 00 půlhodinových úseků. H 0 : Počet příchodů pacientů během 30 minut má Poissonovo rozdělení. H : Počet příchodů pacientů během 30 minut nemá Poissonovo rozdělení. Neznáme parametr λ, je třeba ho odhadnout z dat: r ˆ λ x n ( K+ 0 ) i i xi n 00 S odhadem λ lze vypočítat pravděpodobnosti pro jednotlivé hodnoty X: Kvůli splnění předpokladu pro aproximaci na normální rozdělení sloučíme kategorie 8, 9, 0 a pacientů. p i P( X xi λ e xi ) x! i λ ,80

54 Příklad Poissonovo rozdělení Počet pacientů Pozorovaná četnost Očekávaná četnost x i o i e i np i , ,3 8 86, , , , , ,54 8 a více 9,75 Celkem Χ df r 9 Χ r i ( o e e ) r 7 8,50 < i i i χ( r ) 8,50 ( α) χ (7) Nezamítáme H 0 o tom, že data pochází z výběru s Poissonovým rozdělením pravděpodobnosti. (0,05) 4,07

55 Poděkování Rozvoj studijního oboru Matematická biologie PřFMU Brno je finančně podporován prostředky projektu ESF č. CZ..07/..00/ Víceoborová inovace studia Matematické biologie a státním rozpočtem České republiky

Testování hypotéz o kvalitativních proměnných

Testování hypotéz o kvalitativních proměnných Testování hypotéz o kvalitativních proměnných Předchozí kapitoly byly věnovány hodnocení kvantitativních náhodných veličin, u nichž předpokládáme, že mohou nabývat mnoha rozdílných hodnot (v případě výšky

Více

Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy

Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy Relativní riziko a poměr šancí Princip korelace dvou náhodných veličin Korelační koeficienty Pearsonůva Spearmanův Korelace a kauzalita

Více

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests) Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, např. hmotnost a pohlaví narozených dětí. Běžný statistický postup pro ověření závislosti dvou veličin je zamítnutí jejich

Více

Jana Vránová, 3. lékařská fakulta UK

Jana Vránová, 3. lékařská fakulta UK Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace

Více

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D. Ing. Michal Dorda, Ph.D. Př. : Ve vjezdové skupině kolejí byly sledovány počty přijíždějících vlaků za hodinu. Za 5 dní (tedy 360 hodin) přijelo celkem 87 vlaků. Výsledky sledování jsou uvedeny v tabulce.

Více

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 5 Jak analyzovat kategoriální a binární

Více

12. cvičení z PST. 20. prosince 2017

12. cvičení z PST. 20. prosince 2017 1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace

Více

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické

Více

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení Přednáška 9 Testy dobré shody Grafická analýza pro ověření shody empirického a teoretického rozdělení χ 2 test dobré shody ověření, zda jsou relativní četnosti jednotlivých variant rovny číslům π 01 ;

Více

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0. 11 cvičení z PSI 12-16 prosince 2016 111 (Test dobré shody - geometrické rozdělení Realizací náhodné veličiny X jsme dostali následující četnosti výsledků: hodnota 0 1 2 3 4 5 6 pozorovaná četnost 29 15

Více

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D. Statistické metody v ekonomii Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Test χ 2 v kontingenční tabulce typu 2 2 Jde vlastně o speciální případ χ 2 testu pro čtyřpolní tabulku.

Více

Testy. Pavel Provinský. 19. listopadu 2013

Testy. Pavel Provinský. 19. listopadu 2013 Testy Pavel Provinský 19. listopadu 2013 Test a intervalový odhad Testy a intervalové odhady - jsou vlastně to samé. Jiný je jen úhel pohledu. Lze přecházet od jednoho k druhému. Například: Při odvozování

Více

Přednáška IX. Analýza rozptylu (ANOVA)

Přednáška IX. Analýza rozptylu (ANOVA) Přednáška IX. Analýza rozptylu (ANOVA) Princip a metodika výpočtu Předpoklady analýzy rozptylu a jejich ověření Rozbor rozdílů jednotlivých skupin násobné testování hypotéz Analýza rozptylu jako lineární

Více

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 4. Teoretická rozdělení Mgr. David Fiedor 9. března 2015 Osnova Úvod 1 Úvod 2 3 4 5 Vybraná rozdělení náhodných proměnných normální rozdělení normované normální rozdělení

Více

y = 0, ,19716x.

y = 0, ,19716x. Grafické ověřování a testování vybraných modelů 1 Grafické ověřování empirického rozdělení Při grafické analýze empirického rozdělení vycházíme z empirické distribuční funkce F n (x) příslušné k náhodnému

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

Fisherův exaktní test

Fisherův exaktní test Katedra pravděpodobnosti a matematické statistiky Karel Kozmík Fisherův exaktní test 4. prosince 2017 Motivace Máme kontingenční tabulku 2x2 a předpokládáme, že četnosti vznikly z pozorování s multinomickým

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu Jednofaktorová analýza rozptylu David Hampel Ústav statistiky a operačního výzkumu, Mendelova univerzita v Brně Kurz pokročilých statistických metod Global Change Research Centre AS CR, 5 7 8 2015 Tato

Více

Kontingenční tabulky, korelační koeficienty

Kontingenční tabulky, korelační koeficienty Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Budeme předpokládat, že X a Y jsou kvalitativní náhodné veličiny, obor hodnot X obsahuje r hodnot (kategorií,

Více

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními

Více

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení Způsoby statistického šetření Vyčerpávající šetření prošetření všech jednotek statistického souboru (populace) Výběrové šetření ze základního souboru

Více

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D. Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít

Více

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com) Testování statistických hypotéz Testování statistických hypotéz Princip: Ověřování určitého předpokladu zjišťujeme, zda zkoumaný výběr pochází ze základního souboru, který má určité rozdělení zjišťujeme,

Více

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D. Ing. Michal Dorda, Ph.D. 1 Př. 1: Cestující na vybraném spoji linky MHD byli dotazováni za účelem zjištění spokojenosti s kvalitou MHD. Legenda 1 Velmi spokojen Spokojen 3 Nespokojen 4 Velmi nespokojen

Více

McNemarův test, Stuartův test, Test symetrie

McNemarův test, Stuartův test, Test symetrie Tereza Burgetová McNemarův test, Stuartův test, Test symetrie 11. prosince 2017 McNemarův test - motivace Analýza kontingenčních tabulek, kdy není cílem provést klasický test nezávislosti. Příklad: Před

Více

Test dobré shody v KONTINGENČNÍCH TABULKÁCH

Test dobré shody v KONTINGENČNÍCH TABULKÁCH Test dobré shody v KONTINGENČNÍCH TABULKÁCH Opakování: Mějme náhodné veličiny X a Y uspořádané do kontingenční tabulky. Řekli jsme, že nulovou hypotézu H 0 : veličiny X, Y jsou nezávislé zamítneme, když

Více

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů) VYBRANÉ TESTY NEPARAMETRICKÝCH HYPOTÉZ TESTY DOBRÉ SHODY Název testu Předpoklady testu Testová statistika Nulové rozdělení test dobré shody Očekávané četnosti, alespoň 80% očekávaných četností >5 ( ) (p

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

PSY117/454 Statistická analýza dat v psychologii Přednáška 10

PSY117/454 Statistická analýza dat v psychologii Přednáška 10 PSY117/454 Statistická analýza dat v psychologii Přednáška 10 TESTY PRO NOMINÁLNÍ A ORDINÁLNÍ PROMĚNNÉ NEPARAMETRICKÉ METODY... a to mělo, jak sám vidíte, nedozírné následky. Smrť Analýza četností hodnot

Více

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

5. T e s t o v á n í h y p o t é z

5. T e s t o v á n í h y p o t é z 5. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 3 Jak a kdy použít parametrické a

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 8. KAPITOLA STATISTICKÉ TESTOVÁNÍ HYPOTÉZ 22.11.2016 Opakování: CLV příklad 1 Zadání: Před volbami je v populaci státu 52 % příznivců

Více

Charakteristika datového souboru

Charakteristika datového souboru Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex

Více

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11 Příklad 1 Vyhláška Ministerstva zdravotnictví předpokládala, že doba dojezdu k pacientovi od nahlášení požadavku nepřekročí 17 minut. Hodnoty deseti náhodně vybraných dob příjezdu sanitky k nemocnému byly:

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013 Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika Podrobnější rozpis okruhů otázek pro třetí část SZZ Verze: 13. června 2013 1 Úvodní poznámky 6 Smyslem SZZ by nemělo být toliko

Více

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele Testování statistických hypotéz z a analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. 1 Záznam epidemiologických dat Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly

Více

2 ) 4, Φ 1 (1 0,005)

2 ) 4, Φ 1 (1 0,005) Příklad 1 Ze zásilky velkého rozsahu byl náhodně vybrán soubor obsahující 1000 kusů. V tomto souboru bylo zjištěno 26 kusů nekvalitních. Rozhodněte, zda je možné s 99% jistotou tvrdit, že zásilka obsahuje

Více

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek 10. Neparametrické y Mann-Whitney U- Wilcoxonův Znaménkový Shrnutí statistických ů Typ srovnání Nulová hypotéza Parametrický Neparametrický 1 skupina dat vs. etalon Střední hodnota je rovna hodnotě etalonu.

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

Stručný úvod do testování statistických hypotéz

Stručný úvod do testování statistických hypotéz Stručný úvod do testování statistických hypotéz 1. Formulujeme hypotézu (předpokládáme, že pozorovaný jev je pouze náhodný). 2. Zvolíme hladinu významnosti testu a, tj. riziko, s nímž jsme ochotni se smířit.

Více

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test) Jarqueův a Beryho test normality (Jarque-Bera Test, JB test) Autoři: Carlos M. Jarque and Anil K. Bera Předpoklady: - Výběrová data mohou obsahovat chybějící pozorování (chybějící hodnoty) vhodné zejména

Více

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1 PRAVDĚPODOBNOST A STATISTIKA Neparametrické testy hypotéz čast 1 Neparametrické testy hypotéz - úvod Neparametrické testy statistických hypotéz se používají v případech, kdy neznáme rozdělení pozorované

Více

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení Přednáška 9 Testy dobré shody Grafická analýza pro ověření shody empirického a teoretického rozdělení χ 2 test dobré shody ověření, zda jsou relativní četnosti jednotlivých variant rovny číslům π 01 ;

Více

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

ÚVOD DO TEORIE ODHADU. Martina Litschmannová ÚVOD DO TEORIE ODHADU Martina Litschmannová Obsah lekce Výběrové charakteristiky parametry populace vs. výběrové charakteristiky limitní věty další rozdělení pravděpodobnosti (Chí-kvadrát (Pearsonovo),

Více

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA 2018 4. dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Typy proměnných nominální (nominal) o dvou hodnotách lze říci pouze

Více

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13 Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů Na analýzu rozptylu lze pohlížet v podstatě

Více

Úkol 1.: Testování nezávislosti nominálních veličin V roce 1950 zkoumali Yule a Kendall barvu očí a vlasů u 6800 mužů.

Úkol 1.: Testování nezávislosti nominálních veličin V roce 1950 zkoumali Yule a Kendall barvu očí a vlasů u 6800 mužů. Téma 10: Analýza závislosti dvou nominálních veličin Úkol 1.: Testování nezávislosti nominálních veličin V roce 1950 zkoumali Yule a Kendall barvu očí a vlasů u 6800 mužů. barva očí barva vlasů světlá

Více

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina Testování hypotéz Analýza dat z dotazníkových šetření Kuranova Pavlina Statistická hypotéza Možné cíle výzkumu Srovnání účinnosti různých metod Srovnání výsledků různých skupin Tzn. prokázání rozdílů mezi

Více

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B TESTOVÁNÍ HYPOTÉZ Od statistického šetření neočekáváme pouze elementární informace o velikosti některých statistických ukazatelů. Používáme je i k ověřování našich očekávání o výsledcích nějakého procesu,

Více

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) 1) Význam a využití statistiky v biologických vědách a veterinárním lékařství ) Rozdělení znaků (veličin) ve statistice 3) Základní a

Více

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E Testování statistických hypotéz z a analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Epidemiologické ukazatele Rizikový faktor Populace Přítomen Nepřítomen Celkem Nemocní a b a+b Kontroly

Více

Poznámky k předmětu Aplikovaná statistika, 11. téma

Poznámky k předmětu Aplikovaná statistika, 11. téma Poznámky k předmětu Aplikovaná statistika, 11. téma Testy založené na χ 2 rozdělení V přehledu významných rozdělení jsme si uvedli, že Poissonovým rozdělením se modeluje počet událostí, které nastanou

Více

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Statistika, Biostatistika pro kombinované studium. Jan Kracík Statistika, Biostatistika pro kombinované studium Letní semestr 2014/2015 Tutoriál č. 6: ANOVA Jan Kracík jan.kracik@vsb.cz Obsah: Testování hypotéz opakování ANOVA Testování hypotéz (opakování) Testování

Více

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK. ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz PŘEHLED TESTŮ rozdělení normální spojité alternativní / diskrétní

Více

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel Analýza rozptylu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 1 / 30 Analýza

Více

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová VYBRANÉ DVOUVÝBĚROVÉ TESTY Martina Litschmannová Obsah přednášky Vybrané dvouvýběrové testy par. hypotéz test o shodě rozptylů (F-test), testy o shodě středních hodnot (t-test, Aspinové-Welchův test),

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné

Více

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz. Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Zpracování dat v edukačních vědách - Testování hypotéz Kamila Fačevicová Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Obsah seminářů 5.11. Úvod do matematické

Více

Příklad: Test nezávislosti kategoriálních znaků

Příklad: Test nezávislosti kategoriálních znaků Příklad: Test nezávislosti kategoriálních znaků Určete na hladině významnosti 5 % na základě dat zjištěných v rámci dotazníkového šetření ve Šluknově, zda existuje závislost mezi pohlavím respondenta a

Více

Náhodná veličina a rozdělení pravděpodobnosti

Náhodná veličina a rozdělení pravděpodobnosti 3.2 Náhodná veličina a rozdělení pravděpodobnosti Bůh hraje se světem hru v kostky. Jsou to ale falešné kostky. Naším hlavním úkolem je zjistit, podle jakých pravidel byly označeny, a pak toho využít pro

Více

Výběrové charakteristiky a jejich rozdělení

Výběrové charakteristiky a jejich rozdělení Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO

Více

Pravděpodobnost a matematická statistika

Pravděpodobnost a matematická statistika Pravděpodobnost a matematická statistika Příklady k přijímacím zkouškám na doktorské studium 1 Popisná statistika Určete aritmetický průměr dat, zadaných tabulkou hodnot x i a četností n i x i 1 2 3 n

Více

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal Základy navrhování průmyslových experimentů DOE II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal! Testování statistických hypotéz kvalitativní odezva kvantitativní chí-kvadrát test homogenity,

Více

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin EuroMISE Centrum I. ÚVOD vv této přednášce budeme hovořit o jednovýběrových a dvouvýběrových testech týkajících se střední hodnoty

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Cvičení ze statistiky - 8. Filip Děchtěrenko

Cvičení ze statistiky - 8. Filip Děchtěrenko Cvičení ze statistiky - 8 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Centrální limitní věta Laplaceho věta (+ korekce na spojitost) Konfidenční intervaly

Více

Příklady na testy hypotéz o parametrech normálního rozdělení

Příklady na testy hypotéz o parametrech normálního rozdělení Příklady na testy hypotéz o parametrech normálního rozdělení. O životnosti 75W žárovky (v hodinách) je známo, že má normální rozdělení s = 5h. Pro náhodný výběr 0 žárovek byla stanovena průměrná životnost

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,

Více

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) cvičení z PSI 0-4 prosince 06 Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) Z realizací náhodných veličin X a Y s normálním rozdělením) jsme z výběrů daného rozsahu obdrželi

Více

Statistické metody uţívané při ověřování platnosti hypotéz

Statistické metody uţívané při ověřování platnosti hypotéz Statistické metody uţívané při ověřování platnosti hypotéz Hypotéza Domněnka, předpoklad Nejčastěji o rozdělení, středních hodnotách, závislostech, Hypotézy ve vědeckém výzkumu pracovní, věcné hypotézy

Více

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11. UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace

Více

Analýza dat z dotazníkových šetření

Analýza dat z dotazníkových šetření Analýza dat z dotazníkových šetření Cvičení 6. Rozsah výběru Př. Určete minimální rozsah výběru pro proměnnou věk v souboru dovolena, jestliže 95% interval spolehlivost průměru proměnné nemá být širší

Více

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času Testování hypotéz 1 Jednovýběrové testy 90/ odhad času V podmínkách naprostého odloučení má voák prokázat schopnost orientace v čase. Úkolem voáka e provést odhad časového intervalu 1 hodiny bez hodinek

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 5. Odhady parametrů základního souboru Mgr. David Fiedor 16. března 2015 Vztahy mezi výběrovým a základním souborem Osnova 1 Úvod, pojmy Vztahy mezi výběrovým a základním

Více

4ST201 STATISTIKA CVIČENÍ Č. 7

4ST201 STATISTIKA CVIČENÍ Č. 7 4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické

Více

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce Statistický rozbor dat z dotazníkového šetření školní zadání Skupina: 51 Vypracovaly: Pavlína Horná, Nikola Loumová, Petra Mikešová,

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

INDUKTIVNÍ STATISTIKA

INDUKTIVNÍ STATISTIKA 10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ HODNOCENÍ ZÁVISLOSTÍ KVALITATIVNÍ VELIČINY - Vychází se z kombinační (kontingenční) tabulky, která je výsledkem třídění druhého stupně KVANTITATIVNÍ

Více

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu) Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu) Frank Wilcoxon (1892 1965): Americký statistik a chemik Nechť X 1,..., X n je náhodný výběr ze

Více

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 Opakování t- vs. neparametrické Wilcoxonův jednovýběrový test Opakování

Více

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží Zdeněk Karpíšek Jsou tři druhy lží: lži, odsouzeníhodné lži a statistiky. Statistika je logická a přesná metoda, jak nepřesně

Více