Matematická statistika. Testy v. v binomickém. Test pravděpodobnosti. Test homogenity dvou. Neparametrické testy. statistika. Testy v.

Podobné dokumenty
Opakování. Neparametrické testy. Pořadí. Jednovýběrový Wilcoxonův test. t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

diskriminaci žen letní semestr = výrok, o jehož pravdivosti chceme rozhodnout tvrzení o populaci, o jehož platnosti rozhodujeme

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Příklad datového souboru. Pravděpodobnost vs. statistika. Formální definice. Teorie odhadu

Testy nezávislosti kardinálních veličin

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Jednostranné intervaly spolehlivosti

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

Fisherův exaktní test

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Seminář 6 statistické testy

Seminář 6 statistické testy

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

15. T e s t o v á n í h y p o t é z

Mannův-Whitneyův(Wilcoxonův) test pořadová obdoba dvouvýběrového t-testu. Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

Intervalové Odhady Parametrů II Testování Hypotéz

15. T e s t o v á n í h y p o t é z

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

5. T e s t o v á n í h y p o t é z

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Plánovací diář a Google Calendar

Testování uživatelského rozhraní

Design Experimentu a Statistika - AGA46E

Pravděpodobnost a aplikovaná statistika

Přednáška X. Testování hypotéz o kvantitativních proměnných

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

2 ) 4, Φ 1 (1 0,005)

Testování hypotéz o parametrech regresního modelu

ANALÝZA DAT V R 5. ZÁKLADNÍ STATISTICKÉ TESTY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Testování hypotéz o parametrech regresního modelu

Statistika, Biostatistika pro kombinované studium. Jan Kracík

PRAVDĚPODOBNOST A STATISTIKA

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

ADDS cviceni. Pavlina Kuranova

Bootstrap - konfidenční intervaly a testy

A7B39TUR Úloha B Kvantitativní testování ZS 2013/2014 Software MS Office Word a Open Office Writer

Intervalové Odhady Parametrů

Jednofaktorová analýza rozptylu

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

7. Analýza rozptylu.

Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy

Vybraná rozdělení náhodné veličiny

Zápočtová práce STATISTIKA I

Matematická statistika Zimní semestr

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Uloha B - Kvantitativní test. Radek Kubica A7B39TUR. B1 Radek Kubica Kvantitativní testování Stránka 1

12. cvičení z PST. 20. prosince 2017

NEPARAMETRICKÉ TESTY

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Y n = I[X i > m 0 ],

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

Testování statistických hypotéz. Obecný postup

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

populace soubor jednotek, o jejichž vlastnostech bychom chtěli vypovídat letní semestr Definice subjektech.

Korelace. Komentované řešení pomocí MS Excel

Vybrané partie z biostatistiky

KORELACE. Komentované řešení pomocí programu Statistica

6. T e s t o v á n í h y p o t é z

12. prosince n pro n = n = 30 = S X

Cvičení ze statistiky - 8. Filip Děchtěrenko

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

KGG/STG Statistika pro geografy

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

prosince oboustranný symetrický 95% interval spolehlivosti pro střední hodnotu životnosti τ. X i. X = 1 n.. Podle CLV má veličina

Charakteristika datového souboru

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Cvičení ze statistiky - 7. Filip Děchtěrenko

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA ELEKTROTECHNICKÁ

Neparametrické metody

Kvantitativní testování porovnání Alza.cz a Mall.cz

Ing. Michael Rost, Ph.D.

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Intervaly spolehlivosti

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Cvičení 9: Neparametrické úlohy o mediánech

Poznámky k předmětu Aplikovaná statistika, 11. téma

Testování statistických hypotéz

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Transkript:

Opakování Opakování: y o střední hodnotě normálního 1 jednovýběrový t-test 2 párový t-test 3 výběrový t-test Šárka Hudecová Katedra a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy y jednovýběrová situace výběrová situace letní semestr 2012 jednovýběrový výběrový Poznámky Situace: Y Bi(n,p), chceme testovat na hladině α H0 : p = p0 proti H1 : p p0 (resp. proti jednostranným alternativám) ová Z = Y np0 np0(1 p0 asymptotický test na hladině α pomocí Z lze odvodit interval spolehlivosti pro p někdy korekce pro spojitost (Yatesova korekce) Z = Y np0 0.5 sgn(y np0) np0(1 p0) z CLV plyne, že za H0 má Z přibližně N(0,1) : Hypotézu H0 zamítáme ve prospěch pak za H0 má Z N(0,1) existuje i přesný postup bez použití aproximací H1 : p p0, pokud Z > z 1 α/2 H1 : p > p0, pokud Z > z1 α H1 : p < p0, pokud Z < z1 α

náboženské vyznání řešení sčítání lidu v roce 1991: 39.2 % obyvatel římskokatolické (ŘK) vyznání zajímá nás, zda je podíl vysokoškolských učitelů s tímto vyznáním stejný nebo odlišný průzkum: 62 VŠ učitelů, z nich 30 ŘK vyznání Model: Y je počet úspěchů = počet učitelů s ŘK vyznáním z n náhodně vybraných Y Bi(n,p) Chceme testovat Y = 30, n = 62, α = 0.05 bodový odhad ˆp = 30 62 = 0.484 testová 30 62 0.392 Z = = 1.482 62 0.392 (1 0.392 test: Z = 1.482 < z(0.975) = 1.960 nelze zamítnout H0 a tedy nelze prokázat, že by byl podíl ŘK mezi VŠ učiteli odlišný od celé populace korekce pro spojitost: Z = 30 62 0.392 0.5 62 0.392 (1 0.392 sgn(30 62 0.392) = 1.352 H0 : p = 0.392 proti H1 : p 0.392 opatrnější výsledek Řešení v programu R Program R: funkce prop.test počítá Z 2, resp. Z 2 > prop.test(30,62,p=0.392,correct=f) 1-sample proportions test without continuity correction data: 30 out of 62, null probability 0.392 X-squared = 2.1956, df = 1, p-value = 0.1384 alternative hypothesis: true p is not equal to 0.392 95 percent confidence interval: 0.3640986 0.6055254 sample estimates: p 0.483871 Situace: X Bi(m,p1), Y Bi(n,p2) nezávislé, chceme testovat H0 : p1 = p2 proti H1 : p1 p2 (resp. proti jednostranným alternativám) y procentuální výskyt kuřáků mezi muži a ženami volební preference určité strany mezi lidmi s VŠ a bez VŠ úspěšnost experimentálního a standardního léku

Konstrukce testové statistiky označíme x = X m a y = Y n x y odhaduje p1 p2 vezmeme-li x y (p1 p2) U = = var(x y) x y (p1 p2), p1(1 p1) m + p2(1 p2) n pak lze ukázat, že U má přibližně N(0,1) ve jmenovateli je třeba nahradit neznámé p1 a p2 jejich odhady za H0 : p1 = p2 vezmeme společný odhad z = X+Y m+n testová x y Z = ) z(1 z)( 1 m + 1 n ová x y Z = ) z(1 z)( 1 m + 1 n má za H0 přibližně N(0,1) : Hypotézu H0 : p1 = p2 zamítáme ve prospěch H1 : p1 p2, pokud Z > z 1 α/2 H1 : p1 > p2, pokud Z > z1 α H1 : p1 < p2, pokud Z < z1 α má za H0 přibližně N(0, 1) Poznámky zuby existují i jiné postupy a modifikace testové statistiky Z je možné uvažovat obecnější hypotézu H0 : p1 p2 = δ0 nebo H0 : p1 p2 = r0 lze konstruovat interval spolehlivosti pro p1 p2 nebo pro p1 p2 lze pracovat s korekcí pro spojitost Úkolem je zjistit, zda teplotní šoky poškozují zubní sklovinu a narušují tak mechanickou odolnost zubů. Studie: Model: 50 zubů teplotní šoky 21 zlomených 50 zubů kontrolní skupina 11 zlomených X = # zlomených zubů vystavených teplotním šokům, Y = # zlomených kontrolních zubů X Bi(n,p1), Y Bi(m,p2) Chceme testovat H0 : p1 = p2 proti H1 : p1 > p2

řešení Řešení v programy R n = m = 50, X = 21, Y = 11 x = 0.42, y = 0.22, z = 0.32 testová 0.42 0.22 Z = ) 0.32(1 0.32)( = 2.144 1 50 + 1 50 Z = 2.144 > z(0.95) = 1.645 zamítáme H0 a prokázali jsme, že teplotní šoky negativně ovlivňuji mechanickou odolnost zubů > prop.test(c(21,11),c(50,50),correct=f, alternative= greater ) 2-sample test for equality of proportions without continuity correction data: c(21, 11) out of c(50, 50) X-squared = 4.5956, df = 1, p-value = 0.01603 alternative hypothesis: greater 95 percent confidence interval: 0.0501106 1.0000000 sample estimates: prop 1 prop 2 0.42 0.22 Pořadí t-: hypotézy o populačním průměru (střední hodnoty) předpoklad normality není nutné specifikovat přesný typ často jsou založeny na tzv. pořadích tzv. pořadové obecnější hypotézy rovnost mediánů, shoda celých apod. v případě normálního menší síla ve srovnání s t- pozorování Y1,...,Yn ze spojitého uspořádaný výběr (varianční řada) Y (1)...Y (n) hodnoty uspořádané dle velikosti od minima po maximum pořadí: R1,...,Rn Ri kterém místě v uspořádaném výběru veličina Yi stojí (v případě shod se berou průměry z odpovídajících pořadí) máme hodnoty 7,4,5,13,2 uspořádaný výběr 2,4,5,7,13 pořadí 4,2,3,5,1

Situace: X1,... Xn výběr ze spojitého symetrického kolem bodu a (tj. a = mx medián X), chceme testovat Postup H0 : mx = m0, proti H1 : mx m0 vyloučíme případy Xi = m0 (a dle toho upravíme n) definujeme Yi = Xi m0 uspořádáme Yi dle velikosti R + i pořadí Yi za H0 by součty R + i pro kladná a záporná Yi měly být srovnatelné (je-li např. součet pro kladná Yi výrazně větší než pro záporná svědčí to pro mx > m0) W součet pořadí R + i pro Yi > 0 testová Z = W n(n+1) 4 n(n+1)(2n+1) za H0 má Z přibližně N(0, 1) Provedení testu: Hypotézu H0 : mx = m0 zamítáme ve prospěch 24 H1 : mx m0, pokud Z > z 1 α/2 H1 : mx > m0, pokud Z > z1 α H1 : mx < m0, pokud Z < z1 α Poznámky pivo k zamítnutí H0 může vést také výraznější porušení předpokladu symetrie (přestože třeba mx = m0) v případě výskytu shod Xi = m0 lze korekce ve jmenovateli lze uvažovat korekci pro spojitost existují i přesné postupy bez využití aproximací Provádíme průzkum, jaký skutečný objem piva točí v nejmenované hospodě. Zakoupeno bylo 10 piv a jejich objem byl (v litrech): 0.510, 0.462, 0.491, 0.466, 0.461, 0.503, 0.495, 0.488, 0.512, 0.505. Chceme otestovat, zda hostinský netočí pod míru. Použijeme popsaný postup: Xi 0.51 0.462 0.491 0.466 0.461 0.503 0.495 0.488 0.512 0.505 Yi 0.01-0.038-0.009-0.034-0.039 0.003-0.005-0.012 0.012 0.005 Yi 0.01 0.038 0.009 0.034 0.039 0.003 0.005 0.012 0.012 0.005 R i + 5 9 4 8 10 1 2.5 6.5 6.5 2.5 W = 5+1+6.5+2.5 = 15

řešení W = 5+1+6.5+2.5 = 15 testová : Z = 1.274, tj. Z > z(0.95) = 1.645 nelze zamítnou H0 Provedení v programu R: > wilcox.test(x,mu=0.5,alternative= less, exact=f,corr=f) Wilcoxon signed rank test data: pivo V = 15, p-value = 0.101 alternative hypothesis: true location is less than 0.5