Matematická statistika Zimní semestr Testy o proporci

Podobné dokumenty
Testy o proporci a testy v multinomickém rozdělení

Y n = I[X i > m 0 ],

Matematická statistika Zimní semestr

Kontingenční tabulky a testy shody

Matematická statistika Zimní semestr

Kontingenční tabulky, testy dobré shody a analýza rozptylu (ANOVA)

Pohlédněte si základní charakteristiky polohy jednotlivých veličin pomocí funkce summary.

Jednovýběrové testy: t-test, Kolmogorovův-Smirnovův test

Jednovýběrové testy: t-test, Kolmogorovův-Smirnovův test

Matematická statistika Zimní semestr

4ST201 STATISTIKA CVIČENÍ Č. 7

Matematická statistika Zimní semestr

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

Jednostranné intervaly spolehlivosti

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013

= = 2368

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

4EK211 Základy ekonometrie

Cvičení 10. Přednášející: Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc.

PRAVDĚPODOBNOST A STATISTIKA

15. T e s t o v á n í h y p o t é z

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

NEPARAMETRICKÉ TESTY

Testování statistických hypotéz

1. (18 bod ) Náhodná veli ina X je po et rub p i 400 nezávislých hodech mincí. a) Pomocí ƒeby²evovy nerovnosti odhadn te pravd podobnost

Cvičení ze statistiky - 8. Filip Děchtěrenko

populace soubor jednotek, o jejichž vlastnostech bychom chtěli vypovídat letní semestr Definice subjektech.

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

4EK211 Základy ekonometrie

Stavový model a Kalmanův filtr

Návrh a vyhodnocení experimentu

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

Aproximace binomického rozdělení normálním

Pravděpodobnost a matematická statistika

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Tomáš Karel LS 2012/2013

Testování statistických hypotéz. Obecný postup

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Bootstrap - konfidenční intervaly a testy

ANALÝZA DAT V R 9. VÝPOČET VELIKOSTI SOUBORU. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)

4EK211 Základy ekonometrie

Poznámky k předmětu Aplikovaná statistika, 9.téma

KGG/STG Statistika pro geografy

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Bodové odhady parametrů a výstupů

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

AKM CVIČENÍ. Opakování maticové algebry. Mějme matice A, B regulární, potom : ( AB) = B A

3 Bodové odhady a jejich vlastnosti

Testy. Pavel Provinský. 19. listopadu 2013

15. T e s t o v á n í h y p o t é z

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Zápočtová práce STATISTIKA I

2 ) 4, Φ 1 (1 0,005)

Příklady na testy hypotéz o parametrech normálního rozdělení

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

MATEMATICKÁ STATISTIKA 1 ( )

Charakteristika datového souboru

Cvičení z NSTP

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Odhady - Sdružené rozdělení pravděpodobnosti

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Statistika pro každého. Párový test Test shody dvou rozptylů Dvouvýběrový t-test Porovnání středních hodnot při nestejných rozptylech

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Lineární regrese. Komentované řešení pomocí MS Excel

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

y = 0, ,19716x.

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Reference 10. Předpokládejme stavový popis spojitého, respektive diskrétního systému

Zadání Máme data hdp.wf1, která najdete zde: Bodová předpověď: Intervalová předpověď:

HODNOCENÍ VÝKONNOSTI ATRIBUTIVNÍCH ZNAKŮ JAKOSTI. Josef Křepela, Jiří Michálek. OSSM při ČSJ

4EK211 Základy ekonometrie

Regresní a korelační analýza

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

PRAVDĚPODOBNOST A STATISTIKA

Tomáš Karel LS 2012/2013

Poznámky k předmětu Aplikovaná statistika, 11. téma

5 Parametrické testy hypotéz

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Odhad parametrů N(µ, σ 2 )

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

STATISTIKA LS Garant předmětu: Ing. Martina Litschmannová, Ph.D. Přednášející: Ing. Martina Litschmannová, Ph.D.

1 Klasická pravděpodobnost. Bayesův vzorec. Poslední změna (oprava): 11. května 2018 ( 6 4)( 43 2 ) ( 49 6 ) 3. = (a) 1 1 2! + 1 3!

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

Fisherův exaktní test

Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze

Transkript:

Testy o proporci 18.12.2018 Jednovýběrový problém pro binární data. V roce 2008 se v České republice živě narodilo 119 570 dětí, z toho 58 244 dívek a 61 326 chlapců (zdroj ČSÚ). Zajímá nás, zda je pravděpodobnost narození chlapce 1/2. 1. Jaký předpokládáme model a jaké budeme testovat hypotézy? 2. Nejprve budeme uvažovat Wilsonův test založený na testové statistice W n = p n p 0 n p0 (1 p 0 ), která má asymptoticky normální rozdělení N(0, 1). alpha=0.05 n=119570 divky=58244 chlapci=61326 #rucne: p0=1/2 W=sqrt(n)*(chlapci/n - p0)/sqrt(p0*(1-p0)) qnorm(1-alpha/2) 2*(1-pnorm(abs(W))) # pomoci funkce v R prop.test(chlapci,n,p=1/2,correct=false) Jaký je nyní náš závěr? 3. Připomeňte si vztah mezi W n a testovou statistikou uváděnou funkcí prop.test. Vypočtěte p-hodnotu pomocí rozdělení této statistiky. 4. Mohli bychom uvažovat i jinou testovou statistiku Z n, která by měla také asymptoticky N(0, 1) rozdělení? Proved te ručně test pomocí této statistiky. 5. Jak je konstruován uvedený interval spolehlivosti ve funkci prop.test? A jaký jiný intervalový odhad se spolehlivostí 95 % byste uměli zkonstruovat? 6. Nyní provedeme test téže hypotézy pomocí přesného testu binom.test(chlapci,n,p=1/2) Na jakém rozdělení je založený testo test? Jaký je nyní náš závěr? 1

7. Jelikož alternativní rozdělení splňuje předpoklady centrální limitní věty, mohli bychom použít i asymptotický t-test. Odvod te, jak vypadá v tomto případě testová statistika T n. Jak se liší od testové statistiky Z n? 8. Nyní t-test provedeme (potřebujeme ale naše data ve formě vektoru 0 a 1). Ten vyrobíme následovně: data=c(rep(1,chlapci),rep(0,divky)) t.test(data,mu=0.5) 9. Rozhodněte, zda lze tvrdit, že jsou pravděpodobnosti narození chlapce a dívky v ČR v poměru 21:20. 10. Na rozmyšlení na doma: Odhadněte intervalově, kolikrát je pravděpodobnost narození chlapce vyšší než pravděpodobnost narození dívky. Dvouvýběrový problém pro binární data. Na Slovensku se v roce 2010 narodilo 60 410 dětí, z nichž bylo 30 544 chlapců a 29 866 děvčat (zdroj pluska.cz). Zajímá nás, zda je pravděpodobnost narození chlapce stejná v ČR a na Slovensku. 11. Porovnejte procentuální zastoupení chlapců mezi narozenými dětmi pro ČR a SR. Vykreslete i vhodné obrázky. 12. Provedeme dvouvýběrový test o proporci založený na rozdílu pravděpodobností. Jaký předpokládáme model? Jak zní testované hypotézy? Testová statistika, kterou počítá R ve funkci prop.test je založená na statistice T d = p 1 p 2 p(1 p)( 1n + 1m ), kde p je odhad společné pravděpodobnosti úspěchu za nulové hypotézy. Funkce nám ve výstupu dává T 2 d. nsr=60410 chlapcisr=30544 divkysr=29866 prop.test(c(chlapci,chlapcisr),c(n,nsr),correct=false) Jaký učiníme závěr na základě tohoto testu? 13. Ještě spočítáme testovou statistiku ručně xcr=chlapci/n xsr=chlapcisr/nsr xall=(chlapci+chlapcisr)/(n+nsr) (Td=(xCR-xSR)/sqrt(xall*(1-xall)*(1/n+1/nSR))) 2*(1-pnorm(abs(Td))) 2

14. Alternativně bychom mohli odhadnout rozptyl v každém výběru zvlášt a použít tak statistiku T d = p 1 p 2 p1 (1 p 1 )/n + p 2 (1 p 2 )/m, známou z přednášky: (Td2=(xCR-xSR)/sqrt(xCR*(1-xCR)/n+xSR*(1-xSR)/nSR)) 2*(1-pnorm(abs(Td2))) 15. Pro danou situaci bychom mohli použít i dvouvýběrový asymptotický t-test (Welchův test): datasr=c(rep(1,chlapcisr),rep(0,divkysr)) t.test(data,datasr) Porovnejte výslednou p-hodnotu s výsledkem funkce prop.test. Jak se liší testové statistiky? 16. V roce 1970 se v ČSSR živě narodilo 117 137 chlapců a 111 394 děvčat. Zjistěte, zda se pravděpodobnost narození chlapce v ČR v roce 2008 liší oproti situaci v ČSSR v roce 1970. Testy pro multinomické rozdělení 17. V rámci přednášky pro studenty chemie PřF UK v letech 2006-2013 bylo zjišt ováno mimo jiné, v jakém měsíci slaví narozeniny. Naměřena byla následující data: Měsíc 1 2 3 4 5 6 7 8 9 10 11 12 Počet studentů 29 20 23 28 35 25 31 33 31 26 23 24 Data zapsaná v R formátu: x=c(29, 20, 23, 28, 35, 25, 31, 33, 31, 26, 23, 24 ) Zajímá nás, zda je pravděpodobnost narození v lednu stejná jako pravděpodobnost narození v prosinci. Budeme tedy předpokládat, že X je náhodný vektor s multinomickým rozdělením Mult 12 (n, p), kde n = 328 a p = (p 1,..., p 12 ). Odhadněte parametry tohoto multinomického rozdělení. Formulujte nulovou a alternativní hypotézu. Navrhněte vhodnou testovou statistiku. Využijte při tom, že z přednášky víte, že pro vektor c platí n(c p c p) D N(0, V c ), V c = c Vc, kde V = diag(p) pp. Pomocí R test proved te. Pro výpočet V c si bud příslušný výraz zjednodušte a vyjádřete pomocí p 1 a p 12 nebo můžeme použít násobení matic pomocí %*%. Matici V vytvoříme následovně 3

V=diag(p)-p%*%t(p) 18. Otestujte podobně, zda jsou pravděpodobnosti narození dítěte v I. a III. čtvrtletí stejné. Formulujte opět nulovou a alternativní hypotézu a proved te ručně vhodný test. 19. Studenti dále uváděli počet svých sourozenců. Z 326 studentů 50 uvedlo, že nemá žádného sourozence, 183 má jednoho a zbytek má dva a více sourozenců. Otestujte zda je pravděpodobnost jednoho sourozence 3 krát větší než pravděpodobnost žádného sourozence. Samostatná práce (i) V aplikacích (nebo např. v domácím úkolu) se nám může hodit umět převést vektor spojitých hodnot na kategoriální veličinu. Např. uvažujme vektor x, který si nagenerujeme z normálního rozdělení N(0, 1), pro který chceme vytvořit vektor s, který bude identifikátor toho, zda je x i > 0. Ten pak můžeme ještě dále převést na tzv. typ factor: (x=rnorm(20,0,1)) (s=ifelse(x>0,1,0)) # 1 priradime tam, kde x>0 a jinde bude 0 summary(s) sf=factor(s) summary(sf) Všimněte si rozdílného výstupu funkce summary. Počet úspěchů ve vektoru s pak spočteme jako sum(s) nebo sum(sf== 1 ). (ii) Ve skriptech máte kromě Wilsonova intervalu spolehlivosti a přesného intervalu spolehlivosti pro proporci uvedený také interval spolehlivosti založený na logitu a klasické asymptotické metodě (dále Waldův interval). Stáhněte si z internetu a načtěte si soubor pokryti.r, který obsahuje předem připravenou funkci, která počítá pro všechny čtyři metody skutečné pokrytí pro různé hodnoty parametru p a pro zadaný rozsah výběru n. Výsledkem je tedy graf skutečného pokrytí v závislosti na p a tabulka délky jednotlivých intervalů pro několik různých p. Vyzkoušejte tuto funkci pro několik různých voleb n: source("pokryti.r") pokryti(n=20) pokryti(n=50) pokryti(n=200) Jak je to se skutečným pokrytím přesného intervalu spolehlivosti? Který z intervalů spolehlivosti Vám připadá nejlepší? (iii) Funkce binom.test nepočítá p-hodnotu podle vzorce ze skript na str. 112. Uvažujme test hypotézy H 0 : p X = 0.14 proti oboustranné alternativě a data X n = 6 a n = 20. Podle definice ze skript bychom p-hodnotu spočetli následovně: 4

Xn=6;n=20;p0=0.14 2*min(pbinom(Xn, size = n, p = p0), 1-pbinom(Xn-1, size = n, p = p0)) binom.test(xn,n,p=p0) To ale neodpovídá p-hodnotě ve funkci binom.test. Tato funkce považuje za hodnoty, které stejně nebo ještě více svědčí proti H 0, ty hodnoty, jejichž pravděpodobnost napozorování za nulové hypotézy je stejná nebo menší, než co jsme napozorovali ve skutečnosti: qq <- as.logical(dbinom(0:n, size = n, p = p0) <= dbinom(xn, size=n, p=p0)); # p-hodnota sum(dbinom(0:n, size = n, p = p0)[qq]) (iv) Sestrojte intervalový odhad podílu pravděpodobností narození chlapce v ČR a SR. (v) Porovnání hladiny testu a síly statistik T d a T d pro dvouvýběrový problém: opak=1000 n1=20 n2=40 p.t1=numeric(opak) p.t2=numeric(opak) for(i in 1:1000){ x=rbinom(1,size=n1,prob=1/4) y=rbinom(1,size=n2,prob=1/4) p.t1[i]=prop.test(c(x,y),c(n1,n2),correct=f)$p.val } var2=(x/n1)*(1-x/n1)/n1+(y/n2)*(1-y/n2)/n2 T2=(y/n2- x/n1)/sqrt(var2) p.t2[i]=2*pnorm(-abs(t2)) mean(p.t1<=0.05) mean(p.t2<=0.05) Takto sledujeme hladiny testu. Když změníme 1/4 v předpisu pro generování jednoho z výběrů, tak dostaneme odhad síly testu. 5