Testy pro porovnání vlastností dvou skupin

Rozměr: px
Začít zobrazení ze stránky:

Download "Testy pro porovnání vlastností dvou skupin"

Transkript

1 Testy pro porovnání vlastností dvou skupin Petr Pošík Části dokumentu jsou převzaty (i doslovně) z Mirko Navara: Pravděpodobnost a matematická statistika, s laskavým svolením autora. Porovnání dvou normálních rozdělení 3 E X vs E Y, zn E X vs E Y, nezn Př: E X vs E Y Párový pokus Párový t-test Př: párový t-test D X vs D Y F-rozdělení Př: D X vs D Y q X vs q Y Př: q X vs q Y Simpsonův paradox Alternativy 7 MW U-test ANOVA Rozklad variability Tabulka ANOVA Příklad Předpoklady

2 Porovnání dvou skupin Víte, jaký je rozdíl mezi socialismem a kapitalismem? V socialismu jeden člověk využívá druhého. V kapitalismu je to přesně naopak. P. Pošík c 205 A6M33SSL: Statistika a spolehlivost v lékařství 2 / 23 :-) Porovnání dvou normálních rozdělení 3 / 23 Test stř. hodnot dvou normálních rozdělení se známým rozptylem Předpoklad: Máme 2 nezávislé výběry (X,..., X m ) z rozdělení N(E X, ) a Postup: Platí, ˇze (Y,..., Y n ) z rozdělení N(E Y, ). ), X m má rozdělení N (E X, σ2 m ) Y n má rozdělení N (E Y, σ2, takˇze n ( ( X m Y n má rozdělení N E X E Y, m + n Za předpokladu E X E Y )). T : X m Y n má rozdělení N(0, ). σ m + n Testujeme realizaci t na rozdělení N(0, ), jako jsme to dělali v testu střední hodnoty N(µ, ) při známém. P. Pošík c 205 A6M33SSL: Statistika a spolehlivost v lékařství 4 / 23 2

3 Test stř. hodnot dvou normálních rozdělení s neznámým rozptylem Předpoklad: D X D Y. Máme-li důvod věřit, ˇze předpoklad není splněn, měli bychom pouˇzít neparametrický test. (Důvod věřit? Znalost procesu, který data generuje; zřejmá odchylka od normality v grafech; statistický test normality rozdělení;... ) Postup: Máme 2 odhady (S 2 X a S2 Y ) téhoˇz parametru σ2. Vytvoříme z nich sdruˇzený odhad S 2 parametru : pouˇzijeme jejich průměr váˇzený rozsahy výběrů ( kvůli výpočtu výběrového průměru): S 2 (m )S2 X +(n )S2 Y m+n 2 Při výpočtu testové statistiky pak místo skutečné směrodatné odchylky σ pouˇzijeme její odhad S. To ale vnáší do výpočtu další zdroj neurčitosti, je proto třeba pouˇzít místo normálního rozdělení Studentovo. Za předpokladu E X E Y T : X m Y n má rozdělení t(m+n 2). S m + n Testujeme realizaci t na rozdělení t(m+n 2), jako jsme to dělali v testu střední hodnoty N(µ, ) při neznámém. P. Pošík c 205 A6M33SSL: Statistika a spolehlivost v lékařství 5 / 23 Test stř. hodnot s neznámým rozptylem: Odvození Ukaˇzme nejprve, ˇze sdruˇzený odhad rozptylu S 2 je nestranným odhadem. Víme, ˇze (m )S 2 X má rozdělení χ 2 (m ), (n )S2 Y má rozdělení χ 2 (n ), takˇze jejich součet (m )S 2 X +(n )S2 Y (m )S 2 X +(n )S2 Y (m+n 2) má rozdělení χ 2 (m+n 2) se střední hodnotou m+n 2. Proto S2 má střední hodnotu, takˇze σ2 S 2 (m )S2 X +(n )S2 Y (m+n 2) je nestranný odhad rozptylu. Nyní ukaˇzme, ˇze testová statistika T má rozdělení t(m + n 2). Víme, ˇze X m Y n má rozdělení N(0, ) a ˇze σ m + n (m+n 2)S 2 T : X m Y n S m + n (m )S2 X +(n )S2 Y X m Y n σ m + n S 2 má rozdělení t(m+n 2). má rozdělení χ 2 (m+n 2), takˇze P. Pošík c 205 A6M33SSL: Statistika a spolehlivost v lékařství note of slide 5 3

4 Příklad: test středních hodnot při neznámém rozptylu Zadání: Vliv alkoholismu matky na inteligenci dítěte. Ověřte hypotézu, ˇze alkoholismus matek nijak nesniˇzuje IQ dětí. Skupina : matky chronické alkoholičky, m 6, x 78, m i (x i x) Skupina 2: kontrolní, normální matky, n 46, y 99, n j (y j y) Řešení: Jednostranný test středních hodnot 2 norm. rozdělení s neznámým rozptylem. Testujeme H 0 : E X E Y proti H A : E X < E Y. Sdruˇzený odhad rozptylu: s 2 (m )s2 x +(n )s 2 y m+n Realizace testové statistiky: t x y s m + n m i (x i x) 2 + n j (y j y) 2 m+n s Dosaˇzená hladina významnosti: p F t(m+n 2) (t) F t(50) ( ) Závěr: Pro α > 0.23 % můˇzeme zamítnout hypotézu, ˇze alkoholismus matky nesniˇzuje IQ dětí. P. Pošík c 205 A6M33SSL: Statistika a spolehlivost v lékařství 6 / 23 Párový pokus Příklad: Porovnání průměrných teplot na dvou místech. Teploty měříme vˇzdy současně na obou místech. Rozptyl v obou skupinách má společnou příčinu, která se projevuje v obou výběrech stejně: výběry nejsou navzájem nezávislé. Rozdíl teplot (pokud nějaký existuje) můˇze být malý v porovnání s proměnlivostí teplot (v noci 0 st. Celsia, ve dne 20 st. Celsia), proto standardní test středních hodnot můˇze být slabý kvůli velkému rozptylu. Předpoklad: Prvky náhodných výběrů X n a Y n, tj. náhodné veličiny X j, Y j, j,..., n, mají normální rozdělení N(µ j, ) s konstantním rozptylem a proměnnými středními hodnotami µ j E X j E Y j. Náhodné veličiny U j : X j µ j a V j : Y j µ j, j,..., n, jsou nezávislé a mají rozdělení N(0, ). Náhodné veličiny j : U j V j X j Y j, j,..., n, jsou nezávislé a mají rozdělení N(0, σ 2), kde σ2 2σ2. ) ( ) Výběrový průměr má rozdělení N (0, σ2 n N 0, 2σ2 n. P. Pošík c 205 A6M33SSL: Statistika a spolehlivost v lékařství 7 / 23 4

5 Testy středních hodnot: párový pokus. Pro známý rozptyl : Neznámé parametry sdruˇzeného rozdělení jsou µ,..., µ n, ale nepotřebujeme je. Testujeme T : X Y n n σ na rozdělení N(0, ). 2. Pro neznámý rozptyl: Neznámé parametry sdruˇzeného rozdělení jsou, µ,..., µ n, ale potřebujeme z nich pouze D X. Můˇzeme pracovat přímo s výběrem (,..., n ) z normálního rozdělení. Testujeme T : S n na rozdělení t(n ). P. Pošík c 205 A6M33SSL: Statistika a spolehlivost v lékařství 8 / 23 Příklad: Test středních hodnot, párový pokus Zadání: Vliv hydrochlorothiazidu na krevní tlak. Skupině hypertoniků byl nejprve změřen (systolický) tlak po podání placeba a o měsíc později po podání hydrochlorothiazidu (viz tabulka). Ověřte, ˇze hydrochlorothiazid sniˇzuje krevní tlak. Placebo (X) Hydrochlorothiazid (Y) Rozdíl ( ) Řešení: Zavedli jsme náhodnou veličinu X Y, z níˇz máme k dispozici náhodný výběr n rozsahu n, i X i Y i, i,..., n. Zkusíme vyvrátit hypotézu H 0 : E X E Y, tj. E 0. n, δ 24, s δ Realizace testové statistiky: t δ 24 n 6.08 s δ Dosaˇzená hladina významnosti: p F t(n ) (t) F t(0) (6.08) Závěr: Zamítáme H 0 a přijímáme H A, tj. hydrochlorothiazid sniˇzuje krevní tlak. Poznámka: Byl tento experiment dobře navrˇzen? P. Pošík c 205 A6M33SSL: Statistika a spolehlivost v lékařství 9 / 23 5

6 Recept: Test rozptylů dvou normálních rozdělení Předpoklad: Máme 2 nezávislé výběry (X,..., X m ) z rozdělení N(E X, D X) a (Y,..., Y n ) z rozdělení N(E Y, D Y). Je-li D X D Y, pak také S 2. X SY 2. Realizaci testové statistiky t s2 X s 2 Y porovnáme s kvantily Fisherova rozdělení F(m, n ): H 0 H A H 0 zamítáme, kdyˇz dosaˇzená významnost P D X D Y D X > D Y t > q F(m,n ) ( α) F F(m,n ) (t) D X D Y D X < D Y t < q F(m,n ) (α) F F(m,n ) (t) D X D Y D X D Y t > q F(m,n ) ( α 2 ) nebo 2 min(f F(m,n )(t), t < q F(m,n ) ( α 2 ) F F(m,n )(t)) P. Pošík c 205 A6M33SSL: Statistika a spolehlivost v lékařství 0 / 23 F-rozdělení Fisherovo-Snedecorovo rozdělení F(ξ, η) s ξ a η stupni volnosti je rozdělení náhodné veličiny F U ξ V η, kde U a V jsou nezávislé náhodné veličiny s rozdělením χ 2 (ξ), resp. χ 2 (η). V našem případě, je-li D X D Y, pak U : (m )S2 X V : (n )S2 Y ξ : m, η : n, má rozdělení χ 2 (m ), má rozdělení χ 2 (n ), F U ξ V η (m )S 2 X (m ) (n )SY 2 (n ) S 2 X SY 2 T, kde T je testová statistika testu z předchozího slidu. P. Pošík c 205 A6M33SSL: Statistika a spolehlivost v lékařství / 23 6

7 Test rozptylů: praktické poznámky Pro kaˇzdou hladinu významnosti potřebujeme 2D tabulku kvantilů indexovanou ξ a η. Obvykle je tabelována jen polovina, druhou je třeba dopočítat podle vzorce q F(ξ,η) (α) q F(η,ξ) ( α). POZOR na opačné pořadí indexů! V praxi se často pouˇzívá alternativní postup:. Pro s 2 x s 2 y testujeme t s2 x s 2 na rozdělení F(m, n ): y H 0 H A H 0 zamítáme, kdyˇz dosaˇzená významnost P D X D Y D X > D Y t > q F(m,n ) ( α) F F(m,n ) (t) D X D Y D X < D Y nezamítáme ˇzádná D X D Y D X D Y t > q F(m,n ) ( α 2 ) 2( F F(m,n )(t)) 2. Pro s 2 x s 2 y testujeme t s2 y s 2 na rozdělení F(n, m ): x H 0 H A H 0 zamítáme, kdyˇz dosaˇzená významnost P D X D Y D X > D Y nezamítáme ˇzádná D X D Y D X < D Y t > q F(n,m ) ( α) F F(n,m ) (t) D X D Y D X D Y t > q F(n,m ) ( α 2 ) 2( F F(n,m )(t)) P. Pošík c 205 A6M33SSL: Statistika a spolehlivost v lékařství 2 / 23 Příklad: test rovnosti rozptylů Zadání: Vliv alkoholismu matky na inteligenci dítěte. Otestujte hypotézu, ˇze rozptyl v obou skupinách je shodný. Skupina : matky chronické alkoholičky, m 6, x 78, m i (x i x) Skupina 2: kontrolní, normální matky, n 46, y 99, n j (y j y) Řešení: Otestujme H 0 : D X D Y. Realizace testové statistiky: t s2 x s 2 y m m i (x i x) 2 n n j (y j y) 2 Dosaˇzená hladina významnosti: p 2 min(f F(m,n ) (t), F F(m,n ) (t)) 2 min(f F(5,45) (.4), F F(5,45) (.4)) 2 min(0.76, 0.24) Rozdíl rozptylů mezi skupinami není statisticky významný, nezamítáme H 0 o rovnosti rozptylů. P. Pošík c 205 A6M33SSL: Statistika a spolehlivost v lékařství 3 / 23 7

8 Recept: Testy parametrů dvou alternativních rozdělení Předpoklad: Máme 2 nezávislé výběry X m (X,..., X m ) z rozdělení Ber(q ) a Y n (Y,..., Y n ) z rozdělení Ber(q 2 ). Platí-li q q 2 q, můˇzeme pro parametr q pouˇzít maximálně věrohodný odhad pomocí obou výběrů: R mx + ny m+n. Pro dostatečně velké rozsahy výběrů (m > 00, n > 00) lze rozdělení výběrových relativních četností X a Y aproximovat normálními rozděleními: ( ) R( R) X má přibliˇzně rozdělení N R,, m ( Y má přibliˇzně rozdělení N R, R( R) n ( R( R) X Y má přibliˇzně rozdělení N 0, + m Testovou statistiku T : X Y R( R) m + R( R) n testujeme na rozdělení N(0, ). X Y R( R)( m + n ), takˇze ) ) R( R). n P. Pošík c 205 A6M33SSL: Statistika a spolehlivost v lékařství 4 / 23 Příklad: Test rovnosti populačních pravděpodobností Zadání: Přijímací řízení na Berkeley v roce 973. Z 8300 přihlášených muˇzů bylo přijato 3700, z 4300 přihlášených ˇzen bylo přijato 500. Ověřte hypotézu, ˇze pravděpodobnost přijetí muˇzů a ˇzen je stejná. Řešení: Oboustranný test hypotézy o rovnosti pravděpodobnosti přijetí pro muˇze q m a ˇzeny q z : Počet přihlášených muˇzů je m 8300 a ˇzen n Realizace relativních výběrových četností (úspěšnost) je pro muˇze x a pro ˇzeny y Platí-li q m q z q, můˇzeme q odhadnout pomocí r mx+ny m+n Realizace testové statistiky je t x y ) r( r)( ) m + n 0.427( 0.427)( Dosaˇzená hladina významnosti p 2( Φ(t)). 0. Závěr: Zamítáme H 0, na základě těchto dat existuje jen mizivá šance, ˇze by pravděpodobnosti přijetí muˇze a ˇzeny mohly být shodné. Je to důkaz pohlavní diskriminace? P. Pošík c 205 A6M33SSL: Statistika a spolehlivost v lékařství 5 / 23 8

9 Příklad: Test rovnosti populačních pravděpodobností (pokr.) Zadání: Přijímací řízení na Berkeley v roce 973. Tentokrát zohledněme i to, na jaký směr (umění nebo věda) se zájemci hlásili. Řešení: Kromě celkových výsledků z předchozího slidu, níˇze uvedená tabulka obsahuje stejné výsledky také pro kaˇzdý směr zvlášt. Závěry: Muˇzi Ženy Celkem Test Přihl. Přij. Poměr Přihl. Přij. Poměr Poměr Stat. Dos. význ. Směr m x n y r t p Umění Věda Celkem V uměleckých směrech nelze zamítnout hypotézu o stejné pravděpodobnosti přijetí muˇzů a ˇzen. Ve vědeckých směrech tuto hypotézu zamítnout lze, dosaˇzená hladina významnosti je cca 0.5 %. Zajímavé ovšem je, ˇze na uměleckých směrech, kam se hlásí více ˇzen, mají vyšší pravděpodobnost přijetí muˇzi, zatímco na vědeckých směrech, kam se hlásí více muˇzů, mají vyšší pravděpodobnost přijetí ˇzeny. Dochází tedy spíše k pozitivní diskriminaci. Simpsonův paradox: Co platí pro části, nemusí platit pro celek. Muˇzi a ˇzeny jsou přijímáni přibliˇzně shodně. Ženy ovšem mají tendenci hlásit se na umělecké směry, kde je výběr přísnější, coˇz vysvětluje jejich celkově niˇzší úspěšnost v přijímačkách. Z celkových čísel nelze správně pochopit efekt pohlaví na přijetí kvůli matoucímu faktoru (směr), který nebyl řízen. Kdyˇz se zařadil do studie, dostali jsme mnohem přesnější obrázek. P. Pošík c 205 A6M33SSL: Statistika a spolehlivost v lékařství 6 / 23 Alternativy 7 / 23 Porovnání polohy 2 rozdělení: neparametrický test Co dělat, pokud předpoklady 2výběrového t-testu nejsou splněny? Pouˇzijte neparametrický test, např.: Mann-Whitneyův U-test: Jsou-li pozorování ordinální, testuje hypotézu H 0, ˇze rozdělení v obou skupinách jsou shodná, proti alternativní hypotéze H A, ˇze jedno z rozdělení má sklon generovat větší hodnoty neˇz druhé. Při přísnějších předpokladech (pozorování spojitá, rozdělení se mohou lišit jen v poloze), jej lze interpretovat jako test rovnosti mediánů. Testová statistika U: Přímá metoda: porovnej kaˇzdý prvek skupiny s kaˇzdým prvkem skupiny 2; kaˇzdou výhru počítej jako, remízu jako 0.5 U. Nepřímá metoda: Seřad prvky obou skupin dohromady, kaˇzdému prvku přiřad pořadí r i. R je součet pořadí prvků ve skupině. U n n 2 + n (n + )/2 R. Testujeme U min(u, n n 2 U ). Pro malé výběry spec. tabulky. Pro n > 20 a n 2 > 20 lze pouˇzít normální aproximaci a testovat na N(0, ). T U M U, kde M U n n 2 U + U 2 S U 2 2 n n S U 2 (n + n 2 + ), 2 P. Pošík c 205 A6M33SSL: Statistika a spolehlivost v lékařství 8 / 23 9

10 Test rovnosti středních hodnot ve více neˇz 2 skupinách Analýza rozptylu (Analysis of Variance, ANOVA): Máme někollik (a) skupin dat, mají rozdělení N(µ i, ) Testujeme H 0 : µ µ 2... µ a prostřednictvím testu rovnosti 2 rozptylů. Pokud H 0 platí, máme 2 moˇznosti, jak odhadnout rozptyl :. Z rozdělení výběrových průměrů: pro skupiny o stejné velikosti n S 2 A ns2 X n a a (X j X) 2, coˇz lze pro skupiny různých velikostí přepsat jako j a a n j (X j X) 2 j 2. Z rozptylů v jednotlivých skupinách (sdruˇzený odhad jako u dvouvýběrového t-testu): S 2 E n i (X,i X ) 2 + n 2 i (X 2,i X 2 ) na i (X a,i X a ) 2 (n )+(n 2 )+...+(n a ) Pokud H 0 platí, odhadují obě náhodné veličiny totéˇz, a proto poměr F S2 A S 2 by měl být roven přibliˇzně. E Pokud H 0 neplatí, S 2 A roste, S2 E zůstává přibliˇzně stejné. P. Pošík c 205 A6M33SSL: Statistika a spolehlivost v lékařství 9 / 23 Rozklad variability SS... sum of squares, součet čtverců Celková variabilita: SS T Vnitroskup. (reziduální) variabilita: SS E Meziskupinová variabilita: SS A a n j SS T (X j,i X) 2 j i x 2 x 22 x 33 x x 32 x 23 SS T SS A + SS E x 3 x 24 x 3 x 34 x 2 x 25 a n j SS E (X j,i X j ) 2 j i x 2 x 33 a SS A j x 2 n j (X j X) 2 x 33 x 22 x 22 x x 32 x x 32 x 23 x 23 x 3 x 24 x 3 x 34 x 3 x 24 x 3 x 34 x 2 x 25 x 2 x 25 P. Pošík c 205 A6M33SSL: Statistika a spolehlivost v lékařství 20 / 23 0

11 Tabulka ANOVA Typický výstup statistického softwaru: MS (Mean square): odhad rozptylu Zdroj Součet čtverců Stupně volnosti Průměrný čtverec Poměr variability SS d.f. MS d. SS f. F Faktor A SS A a j n j(x j X) 2 a MS A SS A a Zbytek SS E a j n j i (X j,i X j ) 2 a j (n j ) MS E SS E (n j ) Celkem SS T a j n j i (X j,i X) 2 a j n j F MS A MS E MS A S 2 A a MS E S 2 E jsou odhady populačního rozptylu. Pokud se průměry µ i ve skupinách liší, MS A roste, ale MS E stále odhaduje společný rozptyl. Testová statistika F má také význam F MS A MS E S2 A S 2 E vysvětlený rozptyl meziskupinový rozptyl nevysvětlený rozptyl vnitroskupinový rozptyl a má Fisherovo rozdělení s a s.v. pro čitatel a s (n j ) s.v. pro jmenovatel. P. Pošík c 205 A6M33SSL: Statistika a spolehlivost v lékařství 2 / 23 Příklad Zjistěte, zda se liší BMI pacientů pro různé druhy fyz. zátěˇze v zaměstnání (: sedí, 2: stojí, 3: chodí, 4: nosí těˇzké předměty) Values Source SS df MS F Prob>F Groups Error.3329e Total.3420e Dosaˇzená hladina významnosti (poslední sloupeček) p 2.62 % P. Pošík c 205 A6M33SSL: Statistika a spolehlivost v lékařství 22 / 23

12 Předpoklady Nezávislost jednotlivých pozorování Nezávislost jednotlivých skupin Normální rozdělení sledované veličiny ve všech skupinách (Kolmogorov-Smirnovův test, Shapiro-Wilkův test, χ 2 test dobré shody) Shoda rozptylů ve skupinách (Bartlettův test, Levenův test, Hartleyův test) Při porušení posledních dvou předpokladů je moˇzné pouˇzít neparametrickou, tzv. Kruskal-Wallisovu ANOVu. P. Pošík c 205 A6M33SSL: Statistika a spolehlivost v lékařství 23 / 23 2

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 Opakování t- vs. neparametrické Wilcoxonův jednovýběrový test Opakování

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

Testování hypotéz a jeho metodika 2 Jasnovidec?... 4 Pojmy... 6 Postup... 7 Chyby... 8

Testování hypotéz a jeho metodika 2 Jasnovidec?... 4 Pojmy... 6 Postup... 7 Chyby... 8 Testování hypotéz Petr Pošík Části dokumentu jsou převzaty (i doslovně) z Mirko Navara: Pravděpodobnost a matematická statistika, https://cw.felk.cvut.cz/lib/exe/fetch.php/courses/a6m33ssl/pms_print.pdf

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů Na analýzu rozptylu lze pohlížet v podstatě

Více

4ST201 STATISTIKA CVIČENÍ Č. 7

4ST201 STATISTIKA CVIČENÍ Č. 7 4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické

Více

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Statistika, Biostatistika pro kombinované studium. Jan Kracík Statistika, Biostatistika pro kombinované studium Letní semestr 2014/2015 Tutoriál č. 6: ANOVA Jan Kracík jan.kracik@vsb.cz Obsah: Testování hypotéz opakování ANOVA Testování hypotéz (opakování) Testování

Více

Úvod do analýzy rozptylu

Úvod do analýzy rozptylu Úvod do analýzy rozptylu Párovým t-testem se podařilo prokázat, že úprava režimu stravování a fyzické aktivity ve vybrané škole měla vliv na zlepšené hodnoty HDLcholesterolu u školáků. Pro otestování jsme

Více

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) 1) Význam a využití statistiky v biologických vědách a veterinárním lékařství ) Rozdělení znaků (veličin) ve statistice 3) Základní a

Více

ADDS cviceni. Pavlina Kuranova

ADDS cviceni. Pavlina Kuranova ADDS cviceni Pavlina Kuranova Testy pro dva nezávislé výběry Mannův Whitneyho test - Založen na Wilcoxnově statistice W - založen na pořadí jednotlivých pozorování (oba výběry spojeny do jednoho celku)

Více

χ 2 testy. Test nekorelovanosti.

χ 2 testy. Test nekorelovanosti. χ 2 testy. Test neorelovanosti. Petr Poší Části doumentu jsou převzaty (i doslovně) z Miro Navara: Pravděpodobnost a matematicá statistia, https://cw.fel.cvut.cz/lib/exe/fetch.php/courses/a6m33ssl/pms_print.pdf

Více

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina Testování hypotéz Analýza dat z dotazníkových šetření Kuranova Pavlina Statistická hypotéza Možné cíle výzkumu Srovnání účinnosti různých metod Srovnání výsledků různých skupin Tzn. prokázání rozdílů mezi

Více

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D. Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test Párový Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 motivační příklad Párový Příklad (Platová diskriminace) firma

Více

Příklady na testy hypotéz o parametrech normálního rozdělení

Příklady na testy hypotéz o parametrech normálního rozdělení Příklady na testy hypotéz o parametrech normálního rozdělení. O životnosti 75W žárovky (v hodinách) je známo, že má normální rozdělení s = 5h. Pro náhodný výběr 0 žárovek byla stanovena průměrná životnost

Více

12. cvičení z PST. 20. prosince 2017

12. cvičení z PST. 20. prosince 2017 1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace

Více

diskriminaci žen letní semestr 2012 1 = výrok, o jehož pravdivosti chceme rozhodnout tvrzení o populaci, o jehož platnosti rozhodujeme

diskriminaci žen letní semestr 2012 1 = výrok, o jehož pravdivosti chceme rozhodnout tvrzení o populaci, o jehož platnosti rozhodujeme motivační příklad Párový Párový Příklad (Platová diskriminace) firma provedla šetření s cílem zjistit, zda dochází k platové diskriminaci žen Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Jednostranné intervaly spolehlivosti

Jednostranné intervaly spolehlivosti Jednostranné intervaly spolehlivosti hledáme jen jednu z obou mezí Princip: dle zadání úlohy hledáme jen dolní či jen horní mez podle oboustranného vzorce s tou změnou, že výraz 1-α/2 ve vzorci nahradíme

Více

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal Základy navrhování průmyslových experimentů DOE II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal! Testování statistických hypotéz kvalitativní odezva kvantitativní chí-kvadrát test homogenity,

Více

Analýza rozptylu. Přednáška STATISTIKA II - EKONOMETRIE. Jiří Neubauer

Analýza rozptylu. Přednáška STATISTIKA II - EKONOMETRIE. Jiří Neubauer ANOVA Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz ANOVA ANOVA je nástroj pro zkoumání vztahu mezi vysvětlovanými a vysvětlujícími

Více

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů. Neparametricke testy (motto: Hypotézy jsou lešením, které se staví před budovu a pak se strhává, je-li budova postavena. Jsou nutné pro vědeckou práci, avšak skutečný vědec nepokládá hypotézy za předmětnou

Více

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel Analýza rozptylu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 1 / 30 Analýza

Více

Analýza rozptylu. Statistika II. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.

Analýza rozptylu. Statistika II. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob. ANOVA Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz ANOVA ANOVA je nástroj pro zkoumání vztahu mezi vysvětlovanými a vysvětlujícími proměnnými.

Více

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu) Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu) Frank Wilcoxon (1892 1965): Americký statistik a chemik Nechť X 1,..., X n je náhodný výběr ze

Více

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 3 Jak a kdy použít parametrické a

Více

Statistické testování hypotéz II

Statistické testování hypotéz II PSY117/454 Statistická analýza dat v psychologii Přednáška 9 Statistické testování hypotéz II Přehled testů, rozdíly průměrů, velikost účinku, síla testu Základní výzkumné otázky/hypotézy 1. Stanovení

Více

STATISTICKÉ TESTY VÝZNAMNOSTI

STATISTICKÉ TESTY VÝZNAMNOSTI STATISTICKÉ TESTY VÝZNAMNOSTI jsou statistické postupy, pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Pokud je výsledek šetření statisticky významný (signifikantní), znamená

Více

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu.

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu. Analýza rozptylu Analýza rozptylu umožňuje ověřit významnost rozdílu mezi výběrovými průměry většího počtu náhodných výběrů, umožňuje posoudit vliv různých faktorů. Podle počtu analyzovaných faktorů rozlišujeme

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu Jednofaktorová analýza rozptylu David Hampel Ústav statistiky a operačního výzkumu, Mendelova univerzita v Brně Kurz pokročilých statistických metod Global Change Research Centre AS CR, 5 7 8 2015 Tato

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com) Testování statistických hypotéz Testování statistických hypotéz Princip: Ověřování určitého předpokladu zjišťujeme, zda zkoumaný výběr pochází ze základního souboru, který má určité rozdělení zjišťujeme,

Více

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Obecný postup 1. Určení statistické hypotézy 2. Určení hladiny chyby 3. Výpočet

Více

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz PSY117/454 Statistická analýza dat v psychologii seminář 9 Statistické testování hypotéz Základní výzkumné otázky/hypotézy 1. Stanovení hodnoty parametru =stanovení intervalu spolehlivosti na μ, σ, ρ,

Více

Seminář 6 statistické testy

Seminář 6 statistické testy Seminář 6 statistické testy Část I. Volba správného testu Chceme zjistit, zda se Ježkovy a Širůčkovy seminární skupiny liší ve výsledcích v. průběžné písemce ze statistiky. Chceme zjistit, zda 1. průběžná

Více

STATISTICKÉ TESTY VÝZNAMNOSTI

STATISTICKÉ TESTY VÝZNAMNOSTI STATISTICKÉ TESTY VÝZNAMNOSTI jsou statistické postupy, pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Pokud je výsledek šetření statisticky významný (signifikantní), znamená

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině

Více

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1 PRAVDĚPODOBNOST A STATISTIKA Neparametrické testy hypotéz čast 1 Neparametrické testy hypotéz - úvod Neparametrické testy statistických hypotéz se používají v případech, kdy neznáme rozdělení pozorované

Více

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) cvičení z PSI 0-4 prosince 06 Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) Z realizací náhodných veličin X a Y s normálním rozdělením) jsme z výběrů daného rozsahu obdrželi

Více

Stav Svobodný Rozvedený Vdovec. Svobodná 37 10 6. Rozvedená 8 12 8. Vdova 5 8 6

Stav Svobodný Rozvedený Vdovec. Svobodná 37 10 6. Rozvedená 8 12 8. Vdova 5 8 6 1. Příklad Byly sledovány rodinné stavy nevěst a ženichů při uzavírání sňatků a byla vytvořena následující tabulka četností. Stav Svobodný Rozvedený Vdovec Svobodná 37 10 6 Rozvedená 8 12 8 Vdova 5 8 6

Více

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin EuroMISE Centrum Kontakt: Literatura: Obecné informace Zvárová, J.: Základy statistiky pro biomedicínskéobory I. Vydavatelství

Více

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica Úloha A) koncentrace glukózy v krvi V této části posoudíme pomocí párového testu, zda nový lék prokazatelně snižuje koncentraci

Více

Vzorová prezentace do předmětu Statistika

Vzorová prezentace do předmětu Statistika Vzorová prezentace do předmětu Statistika Popis situace: U 3 náhodně vybraných osob byly zjišťovány hodnoty těchto proměnných: SEX - muž, žena PUVOD Skandinávie, Středomoří, 3 západní Evropa IQ hodnota

Více

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin EuroMISE Centrum I. ÚVOD vv této přednášce budeme hovořit o jednovýběrových a dvouvýběrových testech týkajících se střední hodnoty

Více

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry Testování hypotéz Obecný postup 1. Určení statistické hypotézy 2. Určení hladiny chyby 3. Výpočet

Více

Přednáška IX. Analýza rozptylu (ANOVA)

Přednáška IX. Analýza rozptylu (ANOVA) Přednáška IX. Analýza rozptylu (ANOVA) Princip a metodika výpočtu Předpoklady analýzy rozptylu a jejich ověření Rozbor rozdílů jednotlivých skupin násobné testování hypotéz Analýza rozptylu jako lineární

Více

Vysoká škola ekonomická v Praze

Vysoká škola ekonomická v Praze Vysoká škola ekonomická v Praze Fakulta informatiky a statistiky Studijní program: Kvantitativní metody v ekonomice Studijní obor: Statistické metody v ekonomii Autor bakalářské práce: Jakub Zajíček Vedoucí

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1 Testování statistických hypotéz Ing. Michal Dorda, Ph.D. 1 Úvodní poznámky Statistickou hypotézou rozumíme hypotézu o populaci (základním souboru) např.: Střední hodnota základního souboru je rovna 100.

Více

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích Jana Vránová, 3.lékařská fakulta UK, Praha Hypotézy o populacích Příklad IQ test: Předpokládejme, že z nějakého důvodu ministerstvo školství věří, že studenti absolventi středních škol v Hradci Králové

Více

Cvičení 9: Neparametrické úlohy o mediánech

Cvičení 9: Neparametrické úlohy o mediánech Cvičení 9: Neparametrické úlohy o mediánech Úkol 1.: Párový znaménkový test a párový Wilcoxonův test Při zjišťování kvality jedné složky půdy se používají dvě metody označené A a B. Výsledky: Vzorek 1

Více

Opakování. Neparametrické testy. Pořadí. Jednovýběrový Wilcoxonův test. t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality

Opakování. Neparametrické testy. Pořadí. Jednovýběrový Wilcoxonův test. t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality Opakování Opakování: Testy o střední hodnotě normálního rozdělení 1 jednovýběrový t-test 2 párový t-test 3 dvouvýběrový t-test jednovýběrový Wilcoxonův test párový Wilcoxonův test dvouvýběrový Wilcoxonův

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Cvičení ze statistiky - 9. Filip Děchtěrenko

Cvičení ze statistiky - 9. Filip Děchtěrenko Cvičení ze statistiky - 9 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Inferenční statistika Konfidenční intervaly Z-test Postup při testování hypotéz

Více

STATISTICA Téma 7. Testy na základě více než 2 výběrů

STATISTICA Téma 7. Testy na základě více než 2 výběrů STATISTICA Téma 7. Testy na základě více než 2 výběrů 1) Test na homoskedasticitu Nalezneme jej v několika submenu. Omezme se na submenu Základní statistiky a tabulky základního menu Statistika. V něm

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10. PARAMETRICKÉ TESTY Testujeme rovnost průměru - předpokladem normální rozdělení I) Jednovýběrový t-test 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU

Více

Základní statistické metody v rizikovém inženýrství

Základní statistické metody v rizikovém inženýrství Základní statistické metody v rizikovém inženýrství Petr Misák Ústav stavebního zkušebnictví Fakulta stavební, VUT v Brně misak.p@fce.vutbr.cz Základní pojmy Jev souhrn skutečností zobrazujících ucelenou

Více

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

t-test, Studentův párový test Ing. Michael Rost, Ph.D. Testování hypotéz: dvouvýběrový t-test, Studentův párový test Ing. Michael Rost, Ph.D. Úvod do problému... Již známe jednovýběrový t-test, při kterém jsme měli k dispozici pouze jeden výběr. Můžeme se

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz Na základě náhodného výběru, který je reprezentativním vzorkem základního souboru (který přesně neznáme, k němuž se ale daná statistická hypotéza váže), potřebujeme ověřit,

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 10. Mgr. David Fiedor 27. dubna 2015 Nelineární závislost - korelační poměr užití v případě, kdy regresní čára není přímka, ale je vyjádřena složitější matematickou funkcí

Více

Ing. Michael Rost, Ph.D.

Ing. Michael Rost, Ph.D. Úvod do testování hypotéz, jednovýběrový t-test Ing. Michael Rost, Ph.D. Testovaná hypotéza Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru, např. o parametru Θ, pak takovéto tvrzení

Více

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test Testování hypotéz 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test Testování hypotéz proces, kterým rozhodujeme, zda přijmeme nebo zamítneme nulovou hypotézu

Více

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0. 11 cvičení z PSI 12-16 prosince 2016 111 (Test dobré shody - geometrické rozdělení Realizací náhodné veličiny X jsme dostali následující četnosti výsledků: hodnota 0 1 2 3 4 5 6 pozorovaná četnost 29 15

Více

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů) VYBRANÉ TESTY NEPARAMETRICKÝCH HYPOTÉZ TESTY DOBRÉ SHODY Název testu Předpoklady testu Testová statistika Nulové rozdělení test dobré shody Očekávané četnosti, alespoň 80% očekávaných četností >5 ( ) (p

Více

Matematická statistika. Testy v. v binomickém. Test pravděpodobnosti. Test homogenity dvou. Neparametrické testy. statistika. Testy v.

Matematická statistika. Testy v. v binomickém. Test pravděpodobnosti. Test homogenity dvou. Neparametrické testy. statistika. Testy v. Opakování Opakování: y o střední hodnotě normálního 1 jednovýběrový t-test 2 párový t-test 3 výběrový t-test Šárka Hudecová Katedra a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy

Více

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Zpracování dat v edukačních vědách - Testování hypotéz Kamila Fačevicová Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Obsah seminářů 5.11. Úvod do matematické

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 8. KAPITOLA STATISTICKÉ TESTOVÁNÍ HYPOTÉZ 22.11.2016 Opakování: CLV příklad 1 Zadání: Před volbami je v populaci státu 52 % příznivců

Více

Náhodné veličiny, náhodné chyby

Náhodné veličiny, náhodné chyby Náhodné veličiny, náhodné chyby Máme náhodnou veličinu X, jejíž vlastnosti zkoumáme. Pokud známe její rozložení (např. z nějaké dřívější studie) nebo alespoň předpokládáme znalost rozložení, můžeme ji

Více

Charakteristika datového souboru

Charakteristika datového souboru Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex

Více

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty Neparametrické testy (motto: Hypotézy jsou lešením, které se staví před budovu a pak se strhává, je-li budova postavena. Jsou nutné pro vědeckou práci, avšak skutečný vědec nepokládá hypotézy za předmětnou

Více

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek 10. Neparametrické y Mann-Whitney U- Wilcoxonův Znaménkový Shrnutí statistických ů Typ srovnání Nulová hypotéza Parametrický Neparametrický 1 skupina dat vs. etalon Střední hodnota je rovna hodnotě etalonu.

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO

Více

Statistika. Testování hypotéz - statistická indukce Parametrické testy. Roman Biskup

Statistika. Testování hypotéz - statistická indukce Parametrické testy. Roman Biskup Statistika Testování hypotéz - statistická indukce Parametrické testy Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 1. února 01 Statistika by Birom

Více

5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)

5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina) 5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina) Cílem tématu je správné posouzení a výběr vhodného testu v závislosti na povaze metrické a kategoriální veličiny. V následující

Více

4ST201 STATISTIKA CVIČENÍ Č. 8

4ST201 STATISTIKA CVIČENÍ Č. 8 4ST201 STATISTIKA CVIČENÍ Č. 8 analýza závislostí kontingenční tabulky test závislosti v kontingenční tabulce analýza rozptylu regresní analýza lineární regrese Analýza závislostí Budeme ověřovat existenci

Více

Testy. Pavel Provinský. 19. listopadu 2013

Testy. Pavel Provinský. 19. listopadu 2013 Testy Pavel Provinský 19. listopadu 2013 Test a intervalový odhad Testy a intervalové odhady - jsou vlastně to samé. Jiný je jen úhel pohledu. Lze přecházet od jednoho k druhému. Například: Při odvozování

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13 Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test

Více

Inovace bakalářského studijního oboru Aplikovaná chemie

Inovace bakalářského studijního oboru Aplikovaná chemie http://aplchem.upol.cz CZ.1.07/2.2.00/15.0247 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Regrese Závislostproměnných funkční y= f(x) regresní y= f(x)

Více

Vymezení důležitých pojmů. nulová hypotéza, alternativní hypotéza testování hypotézy hladina významnosti (alfa) chyba I. druhu, chyba II.

Vymezení důležitých pojmů. nulová hypotéza, alternativní hypotéza testování hypotézy hladina významnosti (alfa) chyba I. druhu, chyba II. Testování hypotéz 1. vymezení důležitých pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test 4. t-test pro nezávislé výběry 5. t-test pro závislé výběry Vymezení důležitých pojmů nulová

Více

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) . Statistika Teorie odhadu statistická indukce Intervalový odhad µ, σ 2 a π Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 21. února 2012 Statistika

Více

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu K čemu slouží statistika Popisuje velké soubory dat pomocí charakteristických čísel (popisná statistika). Hledá skryté zákonitosti v souborech

Více

31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě

31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě 31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě Motto Statistika nuda je, má však cenné údaje. strana 3 Statistické charakteristiky Charakteristiky polohy jsou kolem ní seskupeny ostatní hodnoty

Více

Analýza rozptylu. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Srovnávání více než dvou průměrů

Analýza rozptylu. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Srovnávání více než dvou průměrů PSY117/454 Statistická analýza dat v psychologii Přednáška 12 Analýza rozptylu Srovnávání více než dvou průměrů If your experiment needs statistics, you ought to have done a better experiment. Ernest Rutherford

Více

Porovnání dvou výběrů

Porovnání dvou výběrů Porovnání dvou výběrů Menu: QCExpert Porovnání dvou výběrů Tento modul je určen pro podrobnou analýzu dvou datových souborů (výběrů). Modul poskytuje dva postupy analýzy: porovnání dvou nezávislých výběrů

Více

Přednáška X. Testování hypotéz o kvantitativních proměnných

Přednáška X. Testování hypotéz o kvantitativních proměnných Přednáška X. Testování hypotéz o kvantitativních proměnných Testování hypotéz o podílech Kontingenční tabulka, čtyřpolní tabulka Testy nezávislosti, Fisherůvexaktní test, McNemarůvtest Testy dobré shody

Více

Cvičení ze statistiky - 8. Filip Děchtěrenko

Cvičení ze statistiky - 8. Filip Děchtěrenko Cvičení ze statistiky - 8 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Centrální limitní věta Laplaceho věta (+ korekce na spojitost) Konfidenční intervaly

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné

Více

Testy statistických hypotéz

Testy statistických hypotéz Testy statistických hypotéz Statistická hypotéza je jakýkoliv předpoklad o rozdělení pravděpodobnosti jedné nebo několika náhodných veličin. Na základě náhodného výběru, který je reprezentativním vzorkem

Více

Design Experimentu a Statistika - AGA46E

Design Experimentu a Statistika - AGA46E Design Experimentu a Statistika - AGA46E Czech University of Life Sciences in Prague Department of Genetics and Breeding Summer Term 2015 Matúš Maciak (@ A 211) Office Hours: T 9:00 10:30 or by appointment

Více

Testování hypotéz. 4. přednáška 6. 3. 2010

Testování hypotéz. 4. přednáška 6. 3. 2010 Testování hypotéz 4. přednáška 6. 3. 2010 Základní pojmy Statistická hypotéza Je tvrzení o vlastnostech základního souboru, o jehož pravdivosti se chceme přesvědčit. Předem nevíme, zda je pravdivé nebo

Více

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času Testování hypotéz 1 Jednovýběrové testy 90/ odhad času V podmínkách naprostého odloučení má voák prokázat schopnost orientace v čase. Úkolem voáka e provést odhad časového intervalu 1 hodiny bez hodinek

Více