VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová
|
|
- Zuzana Hájková
- před 6 lety
- Počet zobrazení:
Transkript
1 VYBRANÉ DVOUVÝBĚROVÉ TESTY Martina Litschmannová
2 Obsah přednášky Vybrané dvouvýběrové testy par. hypotéz test o shodě rozptylů (F-test), testy o shodě středních hodnot (t-test, Aspinové-Welchův test), test o shodě mediánů (Mannův-Whitneyův test), test o shodě parametrů dvou binomických rozdělení (test homogenity dvou binomických rozdělení), párové testy (párový t-test, párový znaménkový test)
3 Test o shodě rozptylů (F-test, test homoskedasticity) H 0 : σ X = σ Y, H A : σ X σ Y (resp. σ X < σ Y, σ X > σ Y ) Předpoklady testu: Mějme dva nezávislé výběry X 1, X,, X n1 a Y 1, Y,, Y n, které pocházejí z populací, které mají rozdělení N μ X ; σ X, resp. N μ Y ; σ Y. Testová statistika: T X, Y = S X σ X S Y σ Y Nulové rozdělení: Fisherovo-Snedecorovo rozdělení s n 1 1 stupni volnosti pro čitatele a n 1 stupni volnosti pro jmenovatele
4 Podnik Čoko používá dva typy strojů pro automatické balení sušenek. Vedoucí střediska je přesvědčen, že variabilita hmotností sáčků sušenek balených na těchto dvou strojích není stejná. Bylo tedy náhodně vybráno 14 balíčků sušenek balených na prvním stroji a 8 balených na druhém stroji. a) Posuďte na základě explorační analýzy názor vedoucího střediska. STROJ 1 (g) 43, 44,8 53,1 47,5 51,0 51,7 54,0 5,8 5,5 50,1 47,3 50,9 53, 5,7 STROJ (g) 50, 50,1 51,3 49,1 49,9 50,8 51,9 5, Řešení: s 1 = 11,3 s = 1,1 σ 1 σ = s 1 s = 10,06 Předpokládáme, že tvrzení vedoucího střediska je opodstatněné. Nyní je vhodné toto tvrzení exaktně ověřit.
5 Podnik Čoko používá dva typy strojů pro automatické balení sušenek. Vedoucí střediska je přesvědčen, že variabilita hmotností sáčků sušenek balených na těchto dvou strojích není stejná. Bylo tedy náhodně vybráno 14 balíčků sušenek balených na prvním stroji a 8 balených na druhém stroji. b) Posuďte názor vedoucího střediska na základě intervalového odhadu poměru rozptylů na 3% hladině významnosti. STROJ 1 (g) 43, 44,8 53,1 47,5 51,0 51,7 54,0 5,8 5,5 50,1 47,3 50,9 53, 5,7 STROJ (g) 50, 50,1 51,3 49,1 49,9 50,8 51,9 5, Řešení: s 1 = 11,3, s = 1,1 σ 1 σ = s 1 s = 10,06 P s 1 s 1 n1 1,n 1 < σ 1 σ < s 1 s f 1 α/ Ověření předpokladů normality: 1 n1 1,n 1 f α/ = 1 α H 0 : Data jsou výběrem z normálního rozdělení. H A : H 0 skupina Shapirův Wilkův test (p-hodnota) stroj 1 0,038 stroj 0,835
6 Podnik Čoko používá dva typy strojů pro automatické balení sušenek. Vedoucí střediska je přesvědčen, že variabilita hmotností sáčků sušenek balených na těchto dvou strojích není stejná. Bylo tedy náhodně vybráno 14 balíčků sušenek balených na prvním stroji a 8 balených na druhém stroji. b) Posuďte názor vedoucího střediska na základě intervalového odhadu poměru rozptylů na 3% hladině významnosti. STROJ 1 (g) 43, 44,8 53,1 47,5 51,0 51,7 54,0 5,8 5,5 50,1 47,3 50,9 53, 5,7 STROJ (g) 50, 50,1 51,3 49,1 49,9 50,8 51,9 5, Řešení: s 1 = 11,3, s = 1,1 σ 1 σ = s 1 s = 10,06 P s 1 s 1 n1 1,n 1 < σ 1 σ < s 1 s f 1 α/ 1 n1 1,n 1 f α/ = 1 α Ověření předpokladů normality: Předpoklad normality byl empiricky ověřen na základě Q-Q grafů (viz.) a exaktně pomocí Shapirova Wilkova testu (viz.).
7 Podnik Čoko používá dva typy strojů pro automatické balení sušenek. Vedoucí střediska je přesvědčen, že variabilita hmotností sáčků sušenek balených na těchto dvou strojích není stejná. Bylo tedy náhodně vybráno 14 balíčků sušenek balených na prvním stroji a 8 balených na druhém stroji. b) Posuďte názor vedoucího střediska na základě intervalového odhadu poměru rozptylů na 3% hladině významnosti. STROJ 1 (g) 43, 44,8 53,1 47,5 51,0 51,7 54,0 5,8 5,5 50,1 47,3 50,9 53, 5,7 STROJ (g) 50, 50,1 51,3 49,1 49,9 50,8 51,9 5, Řešení: s 1 = 11,3, s = 1,1 σ 1 σ = s 1 s = 10,06 P s 1 s 1 n1 1,n 1 < σ 1 σ < s 1 s f 1 α/ 1 n1 1,n 1 f α/ = 1 α α = 0,03 f 13,7 0,985 = 5,565, f 13,7 0,015 = 0,50 (např.: qf(0.985,13,7) 0,985kvantil Fisherova Snedecorova rozdělení s 13stupni volnosti v čitateli a 7stupni volnosti ve jmenovateli) P, < σ 1 σ < 35,1 = 0,97
8 (Kdyby byly rozptyly srovnatelné, museli bychom připustit, že lze očekávat poměr rozptylů roven 1, tj. 1 by musela ležet uvnitř nalezeného intervalového odhadu.) Podnik Čoko používá dva typy strojů pro automatické balení sušenek. Vedoucí střediska je přesvědčen, že variabilita hmotností sáčků sušenek balených na těchto dvou strojích není stejná. Bylo tedy náhodně vybráno 14 balíčků sušenek balených na prvním stroji a 8 balených na druhém stroji. b) Posuďte názor vedoucího střediska na základě intervalového odhadu poměru rozptylů na 3% hladině významnosti. STROJ 1 (g) 43, 44,8 53,1 47,5 51,0 51,7 54,0 5,8 5,5 50,1 47,3 50,9 53, 5,7 STROJ (g) 50, 50,1 51,3 49,1 49,9 50,8 51,9 5, Řešení: s 1 = 11,3, s = 1,1 σ 1 σ = s 1 s = 10,1 P, < σ 1 σ < 35,1 = 0,97 Rozptyl hmotnosti sáčků sušenek vyrobených na stroji 1 je cca 10,1 krát větší než rozptyl hmotnosti sáčků sušenek vyrobených na stroji. S 97% spolehlivostí je rozptyl hmotnosti sáčků sušenek vyrobených na stroji 1, až 35,1 krát větší než rozptyl hmotnosti sáčků sušenek vyrobených na stroji. Na hladině významnosti 3 % lze pozorovaný nesoulad ve variabilitě hmotností sáčků sušenek označit za statisticky významný.
9 Podnik Čoko používá dva typy strojů pro automatické balení sušenek. Vedoucí střediska je přesvědčen, že variabilita hmotností sáčků sušenek balených na těchto dvou strojích není stejná. Bylo tedy náhodně vybráno 14 balíčků sušenek balených na prvním stroji a 8 balených na druhém stroji. c) Ověřte klasickým testem na hladině významnosti 3 %, zda lze potvrdit názor vedoucího střediska. STROJ 1 (g) 43, 44,8 53,1 47,5 51,0 51,7 54,0 5,8 5,5 50,1 47,3 50,9 53, 5,7 STROJ (g) 50, 50,1 51,3 49,1 49,9 50,8 51,9 5, Řešení: 1. H 0 : σ 1 = σ, H A : σ 1 σ. Volba testové statistiky: T X, Y = S 1 σ 1 S σ ~F n1 1,n 1
10 Podnik Čoko používá dva typy strojů pro automatické balení sušenek. Vedoucí střediska je přesvědčen, že variabilita hmotností sáčků sušenek balených na těchto dvou strojích není stejná. Bylo tedy náhodně vybráno 14 balíčků sušenek balených na prvním stroji a 8 balených na druhém stroji. c) Ověřte klasickým testem na hladině významnosti 3 %, zda lze potvrdit názor vedoucího střediska. STROJ 1 (g) 43, 44,8 53,1 47,5 51,0 51,7 54,0 5,8 5,5 50,1 47,3 50,9 53, 5,7 STROJ (g) 50, 50,1 51,3 49,1 49,9 50,8 51,9 5, Řešení: 3. Ověření předpokladů: nezávislé výběry (OK každé pozorování se vztahuje k jiné statistické jednotce) normalita H 0 : Data jsou výběrem z normálního rozdělení. H A : H 0 skupina Shapirův Wilkův test (p-hodnota) stroj 1 0,038 stroj 0,835
11 Podnik Čoko používá dva typy strojů pro automatické balení sušenek. Vedoucí střediska je přesvědčen, že variabilita hmotností sáčků sušenek balených na těchto dvou strojích není stejná. Bylo tedy náhodně vybráno 14 balíčků sušenek balených na prvním stroji a 8 balených na druhém stroji. c) Ověřte klasickým testem na hladině významnosti 3 %, zda lze potvrdit názor vedoucího střediska. STROJ 1 (g) 43, 44,8 53,1 47,5 51,0 51,7 54,0 5,8 5,5 50,1 47,3 50,9 53, 5,7 STROJ (g) 50, 50,1 51,3 49,1 49,9 50,8 51,9 5, Řešení: 3. Ověření předpokladů: nezávislé výběry (OK každé pozorování se vztahuje k jiné statistické jednotce) normalita (Předpoklad normality byl empiricky ověřen na základě Q-Q grafů (viz.) a exaktně pomocí Shapirova Wilkova testu (viz.).)
12 Podnik Čoko používá dva typy strojů pro automatické balení sušenek. Vedoucí střediska je přesvědčen, že variabilita hmotností sáčků sušenek balených na těchto dvou strojích není stejná. Bylo tedy náhodně vybráno 14 balíčků sušenek balených na prvním stroji a 8 balených na druhém stroji. c) Ověřte klasickým testem na hladině významnosti 3 %, zda lze potvrdit názor vedoucího střediska. STROJ 1 (g) 43, 44,8 53,1 47,5 51,0 51,7 54,0 5,8 5,5 50,1 47,3 50,9 53, 5,7 STROJ (g) 50, 50,1 51,3 49,1 49,9 50,8 51,9 5, Řešení: 4. Určení kritického oboru: Testová statistika má Fisherovo Snedecorovo rozdělení s 13 stupni volnosti v čitateli a 7 stupni volnosti ve jmenovateli H 0 : σ 1 = σ H A : σ 1 σ
13 Podnik Čoko používá dva typy strojů pro automatické balení sušenek. Vedoucí střediska je přesvědčen, že variabilita hmotností sáčků sušenek balených na těchto dvou strojích není stejná. Bylo tedy náhodně vybráno 14 balíčků sušenek balených na prvním stroji a 8 balených na druhém stroji. c) Ověřte klasickým testem na hladině významnosti 3 %, zda lze potvrdit názor vedoucího střediska. STROJ 1 (g) 43, 44,8 53,1 47,5 51,0 51,7 54,0 5,8 5,5 50,1 47,3 50,9 53, 5,7 STROJ (g) 50, 50,1 51,3 49,1 49,9 50,8 51,9 5, Řešení: 4. Určení kritického oboru: Testová statistika má Fisherovo Snedecorovo rozdělení s 13 stupni volnosti v čitateli a 7 stupni volnosti ve jmenovateli H 0 : σ 1 = σ H A : σ 1 σ n f 1 1,n 1 α/ n f 1 1,n 1 1 α/
14 Podnik Čoko používá dva typy strojů pro automatické balení sušenek. Vedoucí střediska je přesvědčen, že variabilita hmotností sáčků sušenek balených na těchto dvou strojích není stejná. Bylo tedy náhodně vybráno 14 balíčků sušenek balených na prvním stroji a 8 balených na druhém stroji. c) Ověřte klasickým testem na hladině významnosti 3 %, zda lze potvrdit názor vedoucího střediska. STROJ 1 (g) 43, 44,8 53,1 47,5 51,0 51,7 54,0 5,8 5,5 50,1 47,3 50,9 53, 5,7 STROJ (g) 50, 50,1 51,3 49,1 49,9 50,8 51,9 5, Řešení: 4. Určení kritického oboru: W = x OBS : x OBS < 0,50 x OBS > 5,565 Testová statistika má Fisherovo Snedecorovo rozdělení s 13 stupni volnosti v čitateli a 7 stupni volnosti ve jmenovateli H 0 : σ 1 = σ H A : σ 1 σ qf 0.015,13,7 = 0,50 qf 0.985,13,7 = 5,565
15 Podnik Čoko používá dva typy strojů pro automatické balení sušenek. Vedoucí střediska je přesvědčen, že variabilita hmotností sáčků sušenek balených na těchto dvou strojích není stejná. Bylo tedy náhodně vybráno 14 balíčků sušenek balených na prvním stroji a 8 balených na druhém stroji. c) Ověřte klasickým testem na hladině významnosti 3 %, zda lze potvrdit názor vedoucího střediska. STROJ 1 (g) 43, 44,8 53,1 47,5 51,0 51,7 54,0 5,8 5,5 50,1 47,3 50,9 53, 5,7 STROJ (g) 50, 50,1 51,3 49,1 49,9 50,8 51,9 5, Řešení: 4. Určení kritického oboru: W = x OBS : x OBS < 0,50 x OBS > 5, Určení pozorované hodnoty: x OBS = T X, Y H 0 = S 1 σ 1 S σ = S 1 S σ 1 σ = S 1 S = 11,3 1,1 = 10,06 H 0 : σ 1 = σ σ 1 σ = 1
16 Podnik Čoko používá dva typy strojů pro automatické balení sušenek. Vedoucí střediska je přesvědčen, že variabilita hmotností sáčků sušenek balených na těchto dvou strojích není stejná. Bylo tedy náhodně vybráno 14 balíčků sušenek balených na prvním stroji a 8 balených na druhém stroji. c) Ověřte klasickým testem na hladině významnosti 3 %, zda lze potvrdit názor vedoucího střediska. STROJ 1 (g) 43, 44,8 53,1 47,5 51,0 51,7 54,0 5,8 5,5 50,1 47,3 50,9 53, 5,7 STROJ (g) 50, 50,1 51,3 49,1 49,9 50,8 51,9 5, Řešení: 4. Určení kritického oboru: W = x OBS : x OBS < 0,50 x OBS > 5,565 x OBS = 10, 06 W qf 0.015,13,7 = 0,50 qf 0.985,13,7 = 5,565
17 Podnik Čoko používá dva typy strojů pro automatické balení sušenek. Vedoucí střediska je přesvědčen, že variabilita hmotností sáčků sušenek balených na těchto dvou strojích není stejná. Bylo tedy náhodně vybráno 14 balíčků sušenek balených na prvním stroji a 8 balených na druhém stroji. c) Ověřte klasickým testem na hladině významnosti 3 %, zda lze potvrdit názor vedoucího střediska. STROJ 1 (g) 43, 44,8 53,1 47,5 51,0 51,7 54,0 5,8 5,5 50,1 47,3 50,9 53, 5,7 STROJ (g) 50, 50,1 51,3 49,1 49,9 50,8 51,9 5, Řešení: 4. Určení kritického oboru: W = x OBS : x OBS < 0,50 x OBS > 5, Určení pozorované hodnoty: x OBS = T X, Y H 0 = S 1 σ 1 S σ = S 1 S σ 1 σ = S 1 S = 11,3 1,1 = 10,06 6. Rozhodnutí: x OBS W Na hladině významnosti 3 % zamítáme hypotézu o shodě rozptylů, rozptyly hmotností sáčků vyrobených na daných dvou strojích se statisticky významně liší.
18 Podnik Čoko používá dva typy strojů pro automatické balení sušenek. Vedoucí střediska je přesvědčen, že variabilita hmotností sáčků sušenek balených na těchto dvou strojích není stejná. Bylo tedy náhodně vybráno 14 balíčků sušenek balených na prvním stroji a 8 balených na druhém stroji. d) Ověřte čistým testem významnosti na hl.významnosti 3 %, zda lze potvrdit názor vedoucího střediska. STROJ 1 (g) 43, 44,8 53,1 47,5 51,0 51,7 54,0 5,8 5,5 50,1 47,3 50,9 53, 5,7 STROJ (g) 50, 50,1 51,3 49,1 49,9 50,8 51,9 5, Řešení: 1. H 0 : σ 1 = σ, H A : σ 1 σ. Volba testové statistiky: T X, Y = S 1 σ 1 S σ ~F n1 1,n 1
19 Podnik Čoko používá dva typy strojů pro automatické balení sušenek. Vedoucí střediska je přesvědčen, že variabilita hmotností sáčků sušenek balených na těchto dvou strojích není stejná. Bylo tedy náhodně vybráno 14 balíčků sušenek balených na prvním stroji a 8 balených na druhém stroji. d) Ověřte čistým testem významnosti na hl.významnosti 3 %, zda lze potvrdit názor vedoucího střediska. STROJ 1 (g) 43, 44,8 53,1 47,5 51,0 51,7 54,0 5,8 5,5 50,1 47,3 50,9 53, 5,7 STROJ (g) 50, 50,1 51,3 49,1 49,9 50,8 51,9 5, Řešení: 3. Ověření předpokladů: nezávislé výběry (OK každé pozorování se vztahuje k jiné statistické jednotce) normalita (Předpoklad normality byl empiricky ověřen na základě Q-Q grafů (viz.) a exaktně pomocí Shapirova Wilkova testu (viz.).)
20 Podnik Čoko používá dva typy strojů pro automatické balení sušenek. Vedoucí střediska je přesvědčen, že variabilita hmotností sáčků sušenek balených na těchto dvou strojích není stejná. Bylo tedy náhodně vybráno 14 balíčků sušenek balených na prvním stroji a 8 balených na druhém stroji. d) Ověřte čistým testem významnosti na hl.významnosti 3 %, zda lze potvrdit názor vedoucího střediska. STROJ 1 (g) 43, 44,8 53,1 47,5 51,0 51,7 54,0 5,8 5,5 50,1 47,3 50,9 53, 5,7 STROJ (g) 50, 50,1 51,3 49,1 49,9 50,8 51,9 5, Řešení: 5. Určení pozorované hodnoty: x OBS = T X, Y H 0 = S 1 σ 1 S σ = S 1 S σ 1 σ = S 1 S = 11,3 1,1 = 10,06 5. Určení p-hodnoty: p hodnota = min F 0 x OBS, 1 F 0 x OBS, kde F 0 x je distribuční funkce Fisherova Snedecorova rozdělení s 13 stupni volnosti v čitateli a 7 stupni volnosti ve jmenovateli (pf(10.06,13,7) 0,9974) p hodnota 0,005 H 0 : σ 1 = σ H A : σ 1 σ
21 Podnik Čoko používá dva typy strojů pro automatické balení sušenek. Vedoucí střediska je přesvědčen, že variabilita hmotností sáčků sušenek balených na těchto dvou strojích není stejná. Bylo tedy náhodně vybráno 14 balíčků sušenek balených na prvním stroji a 8 balených na druhém stroji. d) Ověřte čistým testem významnosti na hl.významnosti 3 %, zda lze potvrdit názor vedoucího střediska. STROJ 1 (g) 43, 44,8 53,1 47,5 51,0 51,7 54,0 5,8 5,5 50,1 47,3 50,9 53, 5,7 STROJ (g) 50, 50,1 51,3 49,1 49,9 50,8 51,9 5, Řešení: 5. Určení pozorované hodnoty: x OBS = T X, Y H 0 = 5. Určení p-hodnoty: p hodnota 0,005 S 1 σ 1 S σ = S 1 S σ 1 σ = S 1 S = 11,3 1,1 = 10,06 H 0 : σ 1 = σ H A : σ 1 σ 6. Rozhodnutí: p hodnota < 0,03 (α) Na hladině významnosti 3 % zamítáme hypotézu o shodě rozptylů, rozptyly hmotností sáčků vyrobených na daných dvou strojích se statisticky významně liší.
22 Testy o shodě středních hodnot - dvouvýběrový t-test H 0 : μ X = μ Y, H A : μ X μ Y (resp. μ X < μ Y, μ X > μ Y ) Předpoklady testu: Mějme dva nezávislé výběry X 1, X,, X n1 a Y 1, Y,, Y n, které pochází z populace mající opět rozdělení N μ X ; σ X, resp. N μ Y ; σ Y, kde σ X = σ Y. Testová statistika: T X, Y = തX തY μ X μ Y n1 1 s X + n 1 s Y n1+n 1 n1 + 1 n Nulové rozdělení: Studentovo rozdělení s ν = n 1 + n stupni volnosti
23 Testy o shodě středních hodnot - Aspinové-Welchův test (dvouvýběrový t-test pro různé rozptyly) H 0 : μ X = μ Y, H A : μ X μ Y (resp. μ X < μ Y, μ X > μ Y ) Předpoklady testu: Mějme dva nezávislé výběry X 1, X,, X n1 a Y 1, Y,, Y n, které pochází z populace mající opět rozdělení N μ X ; σ X, resp. N μ Y ; σ Y, kde σ X σ Y. Testová statistika: T X, Y = ത X തY μ X μ Y S X n1 +S Y n Nulové rozdělení: Studentovo rozdělení s ν stupni volnosti, kde ν 1 n1 1 s X n1 +s Y n s X + 1 n1 n 1 s Y n.
24 Neparametrický test o shodě stř. hodnot test shody mediánů (Mannův-Whitneyův test) H 0 : x 0,5X = x 0,5Y, H A : x 0,5X x 0,5Y (resp. x 0,5X < x 0,5Y, x 0,5X > x 0,5Y ) Předpoklady testu: Nechť X 1, X,, X n1 a Y 1, Y,, Y n jsou dva nezávislé výběry ze spojitých rozdělení se stejným rozptylem a tvarem. Postup testování: viz Úvod do statistiky, str
25 Test o shodě parametrů dvou binomických rozdělení H 0 : π 1 = π, H A : π 1 π (resp. π 1 < π, π 1 > π ) Předpoklady testu: X a Y jsou náhodné výběry z alternativního rozdělení. Pro provedení tohoto testu musíme mít k dispozici výběry o dostatečném rozsahu n 1, resp. n. Rozsahy jednotlivých výběrů lze považovat za dostatečné, pokud jsou splněny podmínky: n 1 > 9 p 1 1 p 1 a n > 9 p 1 p. Testová statistika: T X, Y = p 1 p π 1 π p1 1 p1 n1 Nulové rozdělení: normované normální + p 1 p n V praxi raději používáme Pearsonův chí-kvadrát test (v R: prop.test).
26 Párové testy Jsou-li výsledkem zjišťování dvojice náhodných veličin X 1, Y 1, X, Y,, X n, Y n, které tvoří páry závislých pozorování (jde o veličiny zjišťované na stejné statistické jednotce), musíme při ověřování shody polohy přistoupit k párovým testům. Definujme soubor rozdílů (diferencí) D = D 1, D,, D n, kde D i = X i Y i. Lze předpokládat, že náhodné veličiny D 1, D,, D n jsou nezávislé a že mají stejné rozdělení se střední hodnotou μ = μ 1 μ. Test o shodě dvou středních hodnot prováděný na základě dvou závislých výběrů můžeme převést na jednovýběrový test o střední hodnotě aplikovaný na soubor diferencí (rozdílů) D. Názvy testů: párový t-test, párový Wilcoxonův test,
27 Jak empiricky posoudit shodu párových dat? U 6aut bylo zjištěno ojetí předních pneumatik (mm). Ojetí předních pneumatik (mm) Pravá pneumatika 1,8 1,0, 0,9 1,5 1,6 Levá pneumatika 1,5 1,1,0 1,1 1,4 1,4 Ojíždějí se pravá a levá pneumatika stejně? regresní přímka r = 0,96 (výběrový korelační koeficient) Velmi nevhodný postup!!! Proč?
28 Jak empiricky posoudit shodu párových dat? U 6aut bylo zjištěno ojetí předních pneumatik (mm). Ojetí předních pneumatik (mm) Pravá pneumatika 1,8 1,0, 0,9 1,5 1,6 Levá pneumatika 1,5 1,1,0 1,1 1,4 1,4 Ojíždějí se pravá a levá pneumatika stejně? r = 0,96 (výběrový korelační koeficient) regresní přímka Velmi nevhodný postup!!! Proč? Ve skutečnosti nechceme sledovat shodu dat s regresní přímkou, ale shodu dat s osou prvního a třetího kvadrantu.
29 Jak empiricky posoudit shodu párových dat? U 6aut bylo zjištěno ojetí předních pneumatik (mm). Ojetí předních pneumatik (mm) Pravá pneumatika 1,8 1,0, 0,9 1,5 1,6 Levá pneumatika 1,5 1,1,0 1,1 1,4 1,4 Ojíždějí se pravá a levá pneumatika stejně? p: y = x regresní přímka r = 0,96 (výběrový korelační koeficient) Velmi nevhodný postup!!! Proč? Ve skutečnosti nechceme sledovat shodu dat s regresní přímkou, ale shodu dat s osou prvního a třetího kvadrantu.
30 Jak empiricky posoudit shodu párových dat? U 6aut bylo zjištěno ojetí předních pneumatik (mm). Ojetí předních pneumatik (mm) Pravá pneumatika 1,8 1,0, 0,9 1,5 1,6 Levá pneumatika 1,5 1,1,0 1,1 1,4 1,4 Ojíždějí se pravá a levá pneumatika stejně? Na grafu nejsou vidět jednotlivé datové páry
31 Jak empiricky posoudit shodu párových dat? U 6aut bylo zjištěno ojetí předních pneumatik (mm). Ojetí předních pneumatik (mm) Pravá pneumatika 1,8 1,0, 0,9 1,5 1,6 Levá pneumatika 1,5 1,1,0 1,1 1,4 1,4 Ojíždějí se pravá a levá pneumatika stejně?
32 Jak empiricky posoudit shodu párových dat? U 6aut bylo zjištěno ojetí předních pneumatik (mm). Ojetí předních pneumatik (mm) Pravá pneumatika 1,8 1,0, 0,9 1,5 1,6 Levá pneumatika 1,5 1,1,0 1,1 1,4 1,4 Ojíždějí se pravá a levá pneumatika stejně? Červená chybová úsečka označuje výběrový medián a 95% IO mediánu Čerchovaná čára označuje nulový efekt rozdílů
33 Jak empiricky posoudit shodu párových dat? U 6aut bylo zjištěno ojetí předních pneumatik (mm). Ojetí předních pneumatik (mm) Pravá pneumatika 1,8 1,0, 0,9 1,5 1,6 Levá pneumatika 1,5 1,1,0 1,1 1,4 1,4 Ojíždějí se pravá a levá pneumatika stejně? Blandův Altmanův graf Limity shody (limits of agreements, LoA) vymezují interval, v němž lze očekávat naměřené hodnoty rozdílů párových měření v případě, že rozdíly mají normální rozdělení (nutno ověřit!!!)
34 Blandův Altmanův graf Graf pro posouzení shody párových dat Limity shody (limits of agreements, LoA) vymezují interval, v němž lze očekávat naměřené hodnoty rozdílů párových měření v případě, že rozdíly mají normální rozdělení (nutno ověřit!!!) Odvození limit shody: D diference párových měření D~N μ, σ D μ σ ~N(0,1) P z 0,05 < D μ σ < z 0,975 = 0,95
35 Blandův Altmanův graf Graf pro posouzení shody párových dat Limity shody (limits of agreements, LoA) vymezují interval, v němž lze očekávat naměřené hodnoty rozdílů párových měření v případě, že rozdíly mají normální rozdělení (nutno ověřit!!!) Odvození limit shody: D diference párových měření D~N μ, σ D μ σ ~N(0,1) P z 0,975 < D μ σ < z 0,975 = 0,95
36 Blandův Altmanův graf Graf pro posouzení shody párových dat Limity shody (limits of agreements, LoA) vymezují interval, v němž lze očekávat naměřené hodnoty rozdílů párových měření v případě, že rozdíly mají normální rozdělení (nutno ověřit!!!) Odvození limit shody: D diference párových měření D~N μ, σ P 1,96 < D μ σ D μ σ ~N(0,1) < 1,96 = 0,95
37 Blandův Altmanův graf Graf pro posouzení shody párových dat Limity shody (limits of agreements, LoA) vymezují interval, v němž lze očekávat naměřené hodnoty rozdílů párových měření v případě, že rozdíly mají normální rozdělení (nutno ověřit!!!) Odvození limit shody: D diference párových měření D~N μ, σ D μ σ ~N(0,1) P μ 1,96σ < D < μ + 1,96σ = 0,95
38 Blandův Altmanův graf Graf pro posouzení shody párových dat Limity shody (limits of agreements, LoA) vymezují interval, v němž lze očekávat naměřené hodnoty rozdílů párových měření v případě, že rozdíly mají normální rozdělení (nutno ověřit!!!) Pokud jsou limity shody v praxi akceptovatelné jako hranice přijatelného rozdílu opakovaných měření, pak je lze využít jako míru reprodukovatelnosti nebo opakovatelnosti. Pokud diference opakovaných měření dané hranice překračují, nelze měření označit za reprodukovatelná (opakovatelná).
39 Blandův Altmanův graf Graf pro posouzení shody párových dat Limity shody (limits of agreements, LoA) vymezují interval, v němž lze očekávat naměřené hodnoty rozdílů párových měření v případě, že rozdíly mají normální rozdělení (nutno ověřit!!!) Jako alternativní míra posouzení opakovatelnosti se používá koeficient opakovatelnosti (coefficient of repeatibility, CR). CR = 1,96s
40 Blandův Altmanův graf Zdroj: Dušek, L., Pavlík, T., Koptíková, J.: Analýza dat v neurologii VII. Reprodukovatelnost a opakovatelnost měření u spojitých dat. Česká a slovenská neurologie a neurochirurgie 008; 71(1):
41 Blandův Altmanův graf Zdroj: Dušek, L., Pavlík, T., Koptíková, J.: Analýza dat v neurologii VII. Reprodukovatelnost a opakovatelnost měření u spojitých dat. Česká a slovenská neurologie a neurochirurgie 008; 71(1):
42 Blandův Altmanův graf Heteroskedasticita diferencí (rozptyl diferencí měření 1 a se mění v závislosti na průměru měření, není odhalitelné pomocí t-testu)
43 Blandův Altmanův graf Zdroj: Dušek, L., Pavlík, T., Koptíková, J.: Analýza dat v neurologii VII. Reprodukovatelnost a opakovatelnost měření u spojitých dat. Česká a slovenská neurologie a neurochirurgie 008; 71(1):
44 Blandův Altmanův graf Proporcionální chyba (velikost odchylky měření 1 a se mění v závislosti na průměru měření, není odhalitelná pomocí t-testu) Vychýlení (angl. bias) (detekovatelná t-testem)
45 Blandův Altmanův graf Zdroj: BLAND, J Martin a Douglas G ALTMAN. Measuring agreement in method comparison studies. Statistical Methods in Medical Research [online]. 016, 8(), [cit ]. DOI: / ISSN Dostupné z:
46 Blandův Altmanův graf Zdroj: BLAND, J Martin a Douglas G ALTMAN. Measuring agreement in method comparison studies. Statistical Methods in Medical Research [online]. 016, 8(), [cit ]. DOI: / ISSN Dostupné z:
47 Blandův Altmanův graf Zdroj: BLAND, J Martin a Douglas G ALTMAN. Measuring agreement in method comparison studies. Statistical Methods in Medical Research [online]. 016, 8(), [cit ]. DOI: / ISSN Dostupné z:
48 Blandův Altmanův graf Jak najít limity shody pro poměr měření?
49 Blandův Altmanův graf Jak najít limity shody pro poměr měření? Nechť jsou výsledkem zjišťování dvojice náhodných veličin X 1, Y 1, X, Y,, X n, Y n, které tvoří páry závislých pozorování (jde o veličiny zjišťované na stejné statistické jednotce). Definujme soubor rozdílů (diferencí) přirozených logaritmů jednotlivých měření D LN = D 1 LN, D LN,, D n LN, kde D i LN = ln X i ln Y i. Nechť D i LN ~N μ D ; σ D, tj. D i LN μ D σ D ~N(0; 1). Pak P z 0,05 < D i LN μ D σ D < z 0,975 = 0,95.
50 Blandův Altmanův graf Jak najít limity shody pro poměr měření? Nechť jsou výsledkem zjišťování dvojice náhodných veličin X 1, Y 1, X, Y,, X n, Y n, které tvoří páry závislých pozorování (jde o veličiny zjišťované na stejné statistické jednotce). Definujme soubor rozdílů (diferencí) přirozených logaritmů jednotlivých měření D LN = D 1 LN, D LN,, D n LN, kde D i LN = ln X i ln Y i. Nechť D i LN ~N μ D ; σ D, tj. D i LN μ D σ D ~N(0; 1). Pak P 1,96 < D i LN μ D σ D < 1,96 = 0,95.
51 Blandův Altmanův graf Jak najít limity shody pro poměr měření? Nechť jsou výsledkem zjišťování dvojice náhodných veličin X 1, Y 1, X, Y,, X n, Y n, které tvoří páry závislých pozorování (jde o veličiny zjišťované na stejné statistické jednotce). Definujme soubor rozdílů (diferencí) přirozených logaritmů jednotlivých měření D LN = D 1 LN, D LN,, D n LN, kde D i LN = ln X i ln Y i. Nechť D i LN ~N μ D ; σ D, tj. D i LN μ D σ D ~N(0; 1). Pak P μ D 1,96σ D < D i LN < μ D + 1,96σ D = 0,95.
52 Blandův Altmanův graf Jak najít limity shody pro poměr měření? Nechť jsou výsledkem zjišťování dvojice náhodných veličin X 1, Y 1, X, Y,, X n, Y n, které tvoří páry závislých pozorování (jde o veličiny zjišťované na stejné statistické jednotce). Definujme soubor rozdílů (diferencí) přirozených logaritmů jednotlivých měření D LN = D 1 LN, D LN,, D n LN, kde D i LN = ln X i ln Y i. Nechť D i LN ~N μ D ; σ D, tj. D i LN μ D σ D ~N(0; 1). Pak P μ D 1,96σ D < ln X i ln Y i < μ D + 1,96σ D = 0,95.
53 Blandův Altmanův graf Jak najít limity shody pro poměr měření? Nechť jsou výsledkem zjišťování dvojice náhodných veličin X 1, Y 1, X, Y,, X n, Y n, které tvoří páry závislých pozorování (jde o veličiny zjišťované na stejné statistické jednotce). Definujme soubor rozdílů (diferencí) přirozených logaritmů jednotlivých měření D LN = D 1 LN, D LN,, D n LN, kde D i LN = ln X i ln Y i. Nechť D i LN ~N μ D ; σ D, tj. D i LN μ D σ D ~N(0; 1). Pak P μ D 1,96σ D < ln X i Y i < μ D + 1,96σ D = 0,95.
54 Blandův Altmanův graf Jak najít limity shody pro poměr měření? Nechť jsou výsledkem zjišťování dvojice náhodných veličin X 1, Y 1, X, Y,, X n, Y n, které tvoří páry závislých pozorování (jde o veličiny zjišťované na stejné statistické jednotce). Definujme soubor rozdílů (diferencí) přirozených logaritmů jednotlivých měření D LN = D 1 LN, D LN,, D n LN, kde D i LN = ln X i ln Y i. Nechť D i LN ~N μ D ; σ D, tj. D i LN μ D σ D ~N(0; 1). Pak P e μ D 1,96σ D < X i Y i < e μ D+1,96σ D = 0,95.
55 Blandův Altmanův graf Na osu x se vynáší průměr měření. Zdroj: BLAND, J Martin a Douglas G ALTMAN. Measuring agreement in method comparison studies. Statistical Methods in Medical Research [online]. 016, 8(), [cit ]. DOI: / ISSN Dostupné z:
56 Blandův Altmanův graf Poznámky: Vhodné používat společně s korelačním grafem posuzujícím shodu párových měření s přímkou p: y = x. Limity shody uvádět pouze v případě, že předpokládáme, že diference mají normální rozdělení. Vhodné ověřit, zda jsou limity shody v praxi akceptovatelné jako hranice přijatelného rozdílu (stanovuje expert v dané oblasti výzkumu). V případě, že se v párových datech projeví proporcionální chyba, pokusíme se ji ve vizualizaci eliminovat pomocí logaritmické transformace (a zároveň v původních datech hledáme její zdroj). Blandův Altmannův graf poskytuje větší možnosti využití (např. doplnění intervalových odhadů pro střední hodnotu a limity shody, stanovení limit shody jako funkce průměru diferencí, ) Zdroj: BLAND, J Martin a Douglas G ALTMAN. Measuring agreement in method comparison studies. Statistical Methods in Medical Research [online]. 016, 8(), [cit ]. DOI: / ISSN Dostupné z:
57
58 DĚKUJI ZA POZORNOST!
Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek
10. Neparametrické y Mann-Whitney U- Wilcoxonův Znaménkový Shrnutí statistických ů Typ srovnání Nulová hypotéza Parametrický Neparametrický 1 skupina dat vs. etalon Střední hodnota je rovna hodnotě etalonu.
Statistika, Biostatistika pro kombinované studium. Jan Kracík
Statistika, Biostatistika pro kombinované studium Letní semestr 2014/2015 Tutoriál č. 6: ANOVA Jan Kracík jan.kracik@vsb.cz Obsah: Testování hypotéz opakování ANOVA Testování hypotéz (opakování) Testování
Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza
Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
Jednostranné intervaly spolehlivosti
Jednostranné intervaly spolehlivosti hledáme jen jednu z obou mezí Princip: dle zadání úlohy hledáme jen dolní či jen horní mez podle oboustranného vzorce s tou změnou, že výraz 1-α/2 ve vzorci nahradíme
Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení
Přednáška 9 Testy dobré shody Grafická analýza pro ověření shody empirického a teoretického rozdělení χ 2 test dobré shody ověření, zda jsou relativní četnosti jednotlivých variant rovny číslům π 01 ;
ÚVOD DO TEORIE ODHADU. Martina Litschmannová
ÚVOD DO TEORIE ODHADU Martina Litschmannová Obsah lekce Výběrové charakteristiky parametry populace vs. výběrové charakteristiky limitní věty další rozdělení pravděpodobnosti (Chí-kvadrát (Pearsonovo),
STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)
STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) 1) Význam a využití statistiky v biologických vědách a veterinárním lékařství ) Rozdělení znaků (veličin) ve statistice 3) Základní a
RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 3 Jak a kdy použít parametrické a
Pravděpodobnost a aplikovaná statistika
Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 8. KAPITOLA STATISTICKÉ TESTOVÁNÍ HYPOTÉZ 22.11.2016 Opakování: CLV příklad 1 Zadání: Před volbami je v populaci státu 52 % příznivců
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická
1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Testy hypotéz na základě více než 2 výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů Na analýzu rozptylu lze pohlížet v podstatě
PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz
PSY117/454 Statistická analýza dat v psychologii seminář 9 Statistické testování hypotéz Základní výzkumné otázky/hypotézy 1. Stanovení hodnoty parametru =stanovení intervalu spolehlivosti na μ, σ, ρ,
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: SMAD Cvičení Ostrava, AR 2016/2017 Popis datového souboru Pro dlouhodobý
Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.
Statistické metody v ekonomii Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Proč neparametrické testy? Pokud provádíte formální analýzu či testování hypotéz (zejména provádíte-li
UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.
UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace
Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně
Testování hypotéz Nechť,, je náhodný výběr z nějakého rozdělení s neznámými parametry. Máme dvě navzájem si odporující hypotézy o parametrech daného rozdělení: Nulová hypotéza parametry (případně jediný
KGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 4. Teoretická rozdělení Mgr. David Fiedor 9. března 2015 Osnova Úvod 1 Úvod 2 3 4 5 Vybraná rozdělení náhodných proměnných normální rozdělení normované normální rozdělení
Testování statistických hypotéz
Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky PRAVDĚPODOBNOST A STATISTIKA Zadání 1 JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: DATUM ODEVZDÁNÍ DOMÁCÍ ÚKOL
Jednofaktorová analýza rozptylu
Jednofaktorová analýza rozptylu David Hampel Ústav statistiky a operačního výzkumu, Mendelova univerzita v Brně Kurz pokročilých statistických metod Global Change Research Centre AS CR, 5 7 8 2015 Tato
Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení
Přednáška 9 Testy dobré shody Grafická analýza pro ověření shody empirického a teoretického rozdělení χ 2 test dobré shody ověření, zda jsou relativní četnosti jednotlivých variant rovny číslům π 01 ;
Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.
Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít
Pracovní adresář. Nápověda. Instalování a načtení nového balíčku. Importování datového souboru. Práce s datovým souborem
Pracovní adresář getwd() # výpis pracovního adresáře setwd("c:/moje/pracovni") # nastavení pracovního adresáře setwd("c:\\moje\\pracovni") # nastavení pracovního adresáře Nápověda?funkce # nápověda pro
676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368
Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540
Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času
Testování hypotéz 1 Jednovýběrové testy 90/ odhad času V podmínkách naprostého odloučení má voák prokázat schopnost orientace v čase. Úkolem voáka e provést odhad časového intervalu 1 hodiny bez hodinek
INDUKTIVNÍ STATISTIKA
10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ HODNOCENÍ ZÁVISLOSTÍ KVALITATIVNÍ VELIČINY - Vychází se z kombinační (kontingenční) tabulky, která je výsledkem třídění druhého stupně KVANTITATIVNÍ
TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B
TESTOVÁNÍ HYPOTÉZ Od statistického šetření neočekáváme pouze elementární informace o velikosti některých statistických ukazatelů. Používáme je i k ověřování našich očekávání o výsledcích nějakého procesu,
Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy
Dichotomická proměnná (0-1) Spojitá proměnná STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA Typ proměnné Požadovaný typ analýzy Ověření variability Předpoklady Testy, resp. intervalové odhad Test o rozptylu
letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika
Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 Opakování t- vs. neparametrické Wilcoxonův jednovýběrový test Opakování
Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina
Testování hypotéz Analýza dat z dotazníkových šetření Kuranova Pavlina Statistická hypotéza Možné cíle výzkumu Srovnání účinnosti různých metod Srovnání výsledků různých skupin Tzn. prokázání rozdílů mezi
Statistika. Testování hypotéz statistická indukce Neparametrické testy. Roman Biskup
Statistika Testování hypotéz statistická indukce Neparametrické testy Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 21. února 2012 Statistika by
Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.
Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení
VŠB Technická univerzita Ostrava BIOSTATISTIKA
VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO: BIOSTATISTIKA Domácí úkoly Zadání 5 DATUM ODEVZDÁNÍ DOMÁCÍ ÚKOL 1:
JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica
JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu
15. T e s t o v á n í h y p o t é z
15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:
Testy. Pavel Provinský. 19. listopadu 2013
Testy Pavel Provinský 19. listopadu 2013 Test a intervalový odhad Testy a intervalové odhady - jsou vlastně to samé. Jiný je jen úhel pohledu. Lze přecházet od jednoho k druhému. Například: Při odvozování
15. T e s t o v á n í h y p o t é z
15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:
VŠB-TU OSTRAVA, FAKULTA ELEKTROTECHNIKY A INFORMATIKY, KATEDRA APLIKOVANÉ MATEMATIKY. Statistika. Vzorce a tabulky
VŠB-TU OSTRAVA, FAKULTA ELEKTROTECHNIKY A INFORMATIKY, KATEDRA APLIKOVANÉ MATEMATIKY Statistia Vzorce a tabuly Martina Litschmannová 3. března 05 Oficiální vzorce a tabuly KOMBINATORIKA Bez opaování Uspořádané
Přednáška IX. Analýza rozptylu (ANOVA)
Přednáška IX. Analýza rozptylu (ANOVA) Princip a metodika výpočtu Předpoklady analýzy rozptylu a jejich ověření Rozbor rozdílů jednotlivých skupin násobné testování hypotéz Analýza rozptylu jako lineární
Neparametrické metody
Neparametrické metody Dosud jsme se zabývali statistickými metodami, které zahrnovaly předpoklady o rozdělení dat. Zpravidla jsme předpokládali normální rozdělení. Např. Grubbsův test odlehlých hodnot
Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)
Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu) Frank Wilcoxon (1892 1965): Americký statistik a chemik Nechť X 1,..., X n je náhodný výběr ze
Charakteristika datového souboru
Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex
pravděpodobnosti, popisné statistiky
8. Modelová rozdělení pravděpodobnosti, popisné statistiky Rozdělení pravděpodobnosti Normální rozdělení jako statistický model Přehled a aplikace modelových rozdělení Popisné statistiky Anotace Klasickým
PRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.
ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz PŘEHLED TESTŮ rozdělení normální spojité alternativní / diskrétní
12. cvičení z PST. 20. prosince 2017
1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace
Matematika III. 3. prosince Vysoká škola báňská - Technická univerzita Ostrava. Matematika III
Vysoká škola báňská - Technická univerzita Ostrava 3. prosince 2018 Úvod do testování hypotéz Základní metody statistické indukce Intervalové odhady (angl. confidence intervals) umožňují odhadnout nejistotu
Porovnání dvou výběrů
Porovnání dvou výběrů Menu: QCExpert Porovnání dvou výběrů Tento modul je určen pro podrobnou analýzu dvou datových souborů (výběrů). Modul poskytuje dva postupy analýzy: porovnání dvou nezávislých výběrů
Základní statistické metody v rizikovém inženýrství
Základní statistické metody v rizikovém inženýrství Petr Misák Ústav stavebního zkušebnictví Fakulta stavební, VUT v Brně misak.p@fce.vutbr.cz Základní pojmy Jev souhrn skutečností zobrazujících ucelenou
Tomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
t-test, Studentův párový test Ing. Michael Rost, Ph.D.
Testování hypotéz: dvouvýběrový t-test, Studentův párový test Ing. Michael Rost, Ph.D. Úvod do problému... Již známe jednovýběrový t-test, při kterém jsme měli k dispozici pouze jeden výběr. Můžeme se
Statistické metody uţívané při ověřování platnosti hypotéz
Statistické metody uţívané při ověřování platnosti hypotéz Hypotéza Domněnka, předpoklad Nejčastěji o rozdělení, středních hodnotách, závislostech, Hypotézy ve vědeckém výzkumu pracovní, věcné hypotézy
Korelační a regresní analýza
Korelační a regresní analýza Analýza závislosti v normálním rozdělení Pearsonův (výběrový) korelační koeficient: r = s XY s X s Y, kde s XY = 1 n (x n 1 i=0 i x )(y i y ), s X (s Y ) je výběrová směrodatná
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
Průzkumová analýza dat
Průzkumová analýza dat Proč zkoumat data? Základ průzkumové analýzy dat položil John Tukey ve svém díle Exploratory Data Analysis (odtud zkratka EDA). Často se stává, že data, se kterými pracujeme, se
Tomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
Příklady na testy hypotéz o parametrech normálního rozdělení
Příklady na testy hypotéz o parametrech normálního rozdělení. O životnosti 75W žárovky (v hodinách) je známo, že má normální rozdělení s = 5h. Pro náhodný výběr 0 žárovek byla stanovena průměrná životnost
Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan
1 Úvod 1.1 Empirický výzkum a jeho etapy 1.2 Význam teorie pro výzkum 1.2.1 Konstrukty a jejich operacionalizace 1.2.2 Role teorie ve výzkumu 1.2.3 Proces ověření hypotéz a teorií 1.3 Etika vědecké práce
PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1
PRAVDĚPODOBNOST A STATISTIKA Neparametrické testy hypotéz čast 1 Neparametrické testy hypotéz - úvod Neparametrické testy statistických hypotéz se používají v případech, kdy neznáme rozdělení pozorované
Testování hypotéz o parametrech regresního modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,
Testování hypotéz o parametrech regresního modelu
Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO
Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)
VYBRANÉ TESTY NEPARAMETRICKÝCH HYPOTÉZ TESTY DOBRÉ SHODY Název testu Předpoklady testu Testová statistika Nulové rozdělení test dobré shody Očekávané četnosti, alespoň 80% očekávaných četností >5 ( ) (p
Návod na vypracování semestrálního projektu
Návod na vypracování semestrálního projektu Následující dokument má charakter doporučení. Není závazný, je pouze návodem pro studenty, kteří si nejsou jisti výběrem dat, volbou metod a formou zpracování
4EK211 Základy ekonometrie
4EK211 Základy ekonometrie ZS 2015/16 Cvičení 1: Opakování ze statistiky LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE Z čeho studovat 1) Z KNIHY Krkošková,
Normální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký
Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy
Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy Relativní riziko a poměr šancí Princip korelace dvou náhodných veličin Korelační koeficienty Pearsonůva Spearmanův Korelace a kauzalita
ÚVOD DO TESTOVÁNÍ HYPOTÉZ. Martina Litschmannová
ÚVOD DO TESTOVÁNÍ HYPOTÉZ Martina Litschmannová Základní metody statistické indukce Intervalové odhady (angl. confidence intervals) umožňují odhadnout nejistotu v odhadu parametru náhodné veličiny Testování
Inovace bakalářského studijního oboru Aplikovaná chemie
http://aplchem.upol.cz CZ.1.07/2.2.00/15.0247 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Regrese Závislostproměnných funkční y= f(x) regresní y= f(x)
Normální rozložení a odvozená rozložení
I Normální rozložení a odvozená rozložení I.I Normální rozložení Data, se kterými pracujeme, pocházejí z různých rozložení. Mohou být vychýlena (doleva popř. doprava, nebo v nich není na první pohled vidět
PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.
PARAMETRICKÉ TESTY Testujeme rovnost průměru - předpokladem normální rozdělení I) Jednovýběrový t-test 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU
Statistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
Statistické testování hypotéz II
PSY117/454 Statistická analýza dat v psychologii Přednáška 9 Statistické testování hypotéz II Přehled testů, rozdíly průměrů, velikost účinku, síla testu Základní výzkumné otázky/hypotézy 1. Stanovení
Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013
Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika Podrobnější rozpis okruhů otázek pro třetí část SZZ Verze: 13. června 2013 1 Úvodní poznámky 6 Smyslem SZZ by nemělo být toliko
Testování statistických hypotéz
Testování statistických hypotéz Na základě náhodného výběru, který je reprezentativním vzorkem základního souboru (který přesně neznáme, k němuž se ale daná statistická hypotéza váže), potřebujeme ověřit,
Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj.
Uvedeme obecný postup statistického testování:. Formulace nulové H 0a alternativní hpotéz H A.. Volba hladin významnosti α.. Volba testační statistik např... Určení kritického oboru testové charakteristik.
12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)
cvičení z PSI 0-4 prosince 06 Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) Z realizací náhodných veličin X a Y s normálním rozdělením) jsme z výběrů daného rozsahu obdrželi
Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin
Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin EuroMISE Centrum I. ÚVOD vv této přednášce budeme hovořit o jednovýběrových a dvouvýběrových testech týkajících se střední hodnoty
Stručný úvod do testování statistických hypotéz
Stručný úvod do testování statistických hypotéz 1. Formulujeme hypotézu (předpokládáme, že pozorovaný jev je pouze náhodný). 2. Zvolíme hladinu významnosti testu a, tj. riziko, s nímž jsme ochotni se smířit.
PRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Náhodný výběr Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr
Jednofaktorová analýza rozptylu
I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých
NEPARAMETRICKÉ TESTY
NEPARAMETRICKÉ TESTY Neparametrický jednovýběrový Jeden výběr jehož medián srovnáváme s nějakou hodnotou Wilcoxonův jednovýběrový test 1) Máme data z družice Hipparcos pro deklinaci (obdoba zeměpisné šířky)
PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady
PSY117/454 Statistická analýza dat v psychologii přednáška 8 Statistické usuzování, odhady Výběr od deskripce k indukci Deskripce dat, odhad parametrů Usuzování = inference = indukce Počítá se s náhodným
Normální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními
letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test
Párový Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 motivační příklad Párový Příklad (Platová diskriminace) firma
Cvičení 9: Neparametrické úlohy o mediánech
Cvičení 9: Neparametrické úlohy o mediánech Úkol 1.: Párový znaménkový test a párový Wilcoxonův test Při zjišťování kvality jedné složky půdy se používají dvě metody označené A a B. Výsledky: Vzorek 1
You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)
Testování statistických hypotéz Testování statistických hypotéz Princip: Ověřování určitého předpokladu zjišťujeme, zda zkoumaný výběr pochází ze základního souboru, který má určité rozdělení zjišťujeme,
RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 4 Jak a kdy použít parametrické a
Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel
Analýza rozptylu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 1 / 30 Analýza
Opakování. Neparametrické testy. Pořadí. Jednovýběrový Wilcoxonův test. t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality
Opakování Opakování: Testy o střední hodnotě normálního rozdělení 1 jednovýběrový t-test 2 párový t-test 3 dvouvýběrový t-test jednovýběrový Wilcoxonův test párový Wilcoxonův test dvouvýběrový Wilcoxonův
Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1
Testování statistických hypotéz Ing. Michal Dorda, Ph.D. 1 Úvodní poznámky Statistickou hypotézou rozumíme hypotézu o populaci (základním souboru) např.: Střední hodnota základního souboru je rovna 100.
S E M E S T R Á L N Í
Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie S E M E S T R Á L N Í P R Á C E Licenční studium Statistické zpracování dat při managementu jakosti Předmět ANOVA analýza rozptylu
Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,
5. T e s t o v á n í h y p o t é z
5. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:
Pravděpodobnost a matematická statistika
Pravděpodobnost a matematická statistika Příklady k přijímacím zkouškám na doktorské studium 1 Popisná statistika Určete aritmetický průměr dat, zadaných tabulkou hodnot x i a četností n i x i 1 2 3 n
KGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 7. Testování statistických hypotéz Mgr. David Fiedor 30. března 2015 Osnova 1 2 3 Dělení testů parametrické - o parametrech rozdělení základního souboru (průměr, rozptyl,