Matematická statistika Zimní semestr

Podobné dokumenty
Y n = I[X i > m 0 ],

Pohlédněte si základní charakteristiky polohy jednotlivých veličin pomocí funkce summary.

Matematická statistika Zimní semestr

Testy o proporci a testy v multinomickém rozdělení

Jednovýběrové testy: t-test, Kolmogorovův-Smirnovův test

Jednovýběrové testy: t-test, Kolmogorovův-Smirnovův test

Matematická statistika Zimní semestr Testy o proporci

Matematická statistika Zimní semestr

Kontingenční tabulky, testy dobré shody a analýza rozptylu (ANOVA)

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Kontingenční tabulky a testy shody

Základní popisné statistiky a grafy

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

4ST201 STATISTIKA CVIČENÍ Č. 7

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

12. cvičení z PST. 20. prosince 2017

Opakování. Neparametrické testy. Pořadí. Jednovýběrový Wilcoxonův test. t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality

Vzorová prezentace do předmětu Statistika

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

= = 2368

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

Matematická statistika. Testy v. v binomickém. Test pravděpodobnosti. Test homogenity dvou. Neparametrické testy. statistika. Testy v.

Matematická statistika Zimní semestr

Základní popisné statistiky a grafy

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

15. T e s t o v á n í h y p o t é z

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

ANALÝZA DAT V R 5. ZÁKLADNÍ STATISTICKÉ TESTY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

KORELACE. Komentované řešení pomocí programu Statistica

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Neparametrické metody

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Jednostranné intervaly spolehlivosti

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

MATEMATICKÁ STATISTIKA 1 ( )

Tomáš Karel LS 2012/2013

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

PRAVDĚPODOBNOST A STATISTIKA

Základy počtu pravděpodobnosti a metod matematické statistiky

NEPARAMETRICKÉ TESTY

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

2 ) 4, Φ 1 (1 0,005)

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Návod na vypracování semestrálního projektu

Vybraná rozdělení náhodné veličiny

15. T e s t o v á n í h y p o t é z

Úvod do analýzy rozptylu

Normální (Gaussovo) rozdělení

Aproximace binomického rozdělení normálním

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

Normální (Gaussovo) rozdělení

Cvičení 9: Neparametrické úlohy o mediánech

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

5. T e s t o v á n í h y p o t é z

5 Parametrické testy hypotéz

STATISTICKÉ TESTY VÝZNAMNOSTI

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

České vysoké učení technické v Praze Fakulta dopravní Ústav aplikované matematiky, K611. Semestrální práce ze Statistiky (SIS)

Statistika. Testování hypotéz statistická indukce Neparametrické testy. Roman Biskup

Testy. Pavel Provinský. 19. listopadu 2013

Pravděpodobnost a aplikovaná statistika

Test dobré shody v KONTINGENČNÍCH TABULKÁCH

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Stručný úvod do testování statistických hypotéz

Přednáška X. Testování hypotéz o kvantitativních proměnných

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Návrh a vyhodnocení experimentu

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Zápočtová práce STATISTIKA I

Pravděpodobnost a matematická statistika

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení

Neparametrické testy

Základní statistické modely Statistické vyhodnocování exp. dat M. Čada ~ cada

Intervalová data a výpočet některých statistik

Testování statistických hypotéz

Pracovní adresář. Nápověda. Instalování a načtení nového balíčku. Importování datového souboru. Práce s datovým souborem

Základní statistické metody v rizikovém inženýrství

Příklady na testy hypotéz o parametrech normálního rozdělení

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Transkript:

Neparametrické jednovýběrové testy a párové testy 4.12.2018 Úvodní nastavení. Z internetové stránky www.karlin.mff.cuni.cz/~hudecova/education/ si můžete si stáhnout zdrojový kód k dnešnímu cvičení cviceni10.r. Otevřete si program R Studio, změňte si pracovní adresář a vyčistěte pracoviště setwd("h:/nmsa331") rm(list=ls()) Načtěte si data Hosi.txt a ujistěte se, že se Vám data dobře načetla. Do proměnné alpha is uložte testovací hladinu 0.05. Opět se budeme zabývat porodní hmotností a opět budeme nejprve pracovat pouze s (náhodným) podvýběrem o rozsahu n = 100 pozorování. set.seed(04122018) hmot100 = sample(hosi$por.hmot, 100) n=length(hmot100) hmot=hosi$por.hmot Jednovýběrový znaménkový test 1. Minule jsme se zabývali otázkou, zda je průměrná porodní hmotnost chlapců rovna 3,3 kg. Zopakujte tuto analýzu (pomocí t-testu) na dnešní data. Připomeňte si pravděpodobnostní model, který jsme uvažovali a nulovou i alternativní hypotézu. Zformulujte závěr. 2. Nyní se budeme snažit zodpovědět tutéž otázku pomocí znaménkového testu. Připomeňte si předpoklady tohoto testu (tj. uvažovaný model pro naše data). Formulujte nulovou a alternativní hypotézu. Testová statistika má tvar n Y n = I[X i > m 0 ], i=1 kde m 0 je námi testovaná hodnota 3300 g. Jaké má přesné a jaké asymptotické rozdělení? Asymptotický test provedeme nejprve manuálně podle návodu z přednášky. Nejprve ale vyřadíme pozorování, která jsou přesně rovna 3300, a spočítáme si hodnotu Y n sum(hmot100 == 3300) (nless <- sum(hmot100 < 3300)) (nmore <- sum(hmot100 > 3300)) (N <- nless + nmore) 1

Naše analýza tedy bude založena na N počtu pozorování, v proměnné nmore je hodnota testové statistiky Y n. Pro provedení asymptotického testu si ji příslušně znormujeme. Následně ji porovnáme s kvantilem normálního rozdělení, nebo spočítáme přímo p-hodnotu: (Z = (nmore - N/2) / sqrt(n*1/4)) qnorm(1-alpha/2) # p- hodnota (dve moznosti, jak spocitat): 2*(1-pnorm(abs(Z))) 2*pnorm(-abs(Z)) K jakému závěru jsme došli? 3. Celý výpočet můžeme provést rychleji pomocí funkce prop.test, která slouží k testování pravděpodobnosti (proporce) v alternativním rozdělení. prop.test(x=nmore, n=n,p=1/2,correct=false) # nebo kdybychom nmore a N nemeli ulozene: prop.test(x=sum(hmot100>3300),n=sum(hmot100!=3300),p=1/2,correct=f) Všimněte si, že jsme dostali opravdu stejnou p-hodnotu. Testová statistika je ale jiná. Najdete souvislost s naším výsledkem uloženým v Z? Jaké asymptotické rozdělení má tedy testová statistika funkce prop.test? Nastavení correct=false zakazuje tzv. korekci pro spojitost, která je jinak defaultně zapnutá. Více v samostatném cvičení č. (iii). Znaménkový test lze provést také jako přesný test založený na binomickém rozdělení, viz samostatná práce (vii). 4. Vyzkoušejte, co by se stalo, kdybychom celý výpočet prováděli s nless namísto nmore. 5. Jelikož znaménkový test převádí naše naměřená data na binární, podíváme se na to, jak vizualizovat kategoriální veličinu: Y <- hmot100[hmot100!= 3300]; # vybereme hmotnosti ruzne od 3300 Y <- factor(y > 3300) # udelame z nich 0-1 veliciny a chapeme je jako "faktor" levels(y) <- c("< 3300", "> 3300") # pojmenujeme kategorie summary(y) # kontrola s nless a nmore plot(y,col=2:3); # totez jako: barplot(table(y),col=2:3) # nebo barplot(c(nless, nmore), col=2:3,legend=c("< 3300", "> 3300")) #proporcionalne: pie(table(y),col=2:3) # nebo barplot(prop.table(as.matrix(c(nless, nmore))), col=2:3, legend=c("< 3300", "> 3300")) 2

Jednovýběrový Wilcoxonův test 6. Stále se budeme zabývat otázkou, zda je průměrná porodní hmotnost chlapců rovna 3,3 kg. Nyní k testu použijeme Wilcoxonův test (a) Jaký model předpokládáme pro naše data nyní? (b) Jak budeme ted formulovat testované hypotézy? Porovnejte předpoklady Wilcoxonova testu s předpoklady přesného t-testu a s předpoklady asymptotického t-testu. Porovnejte, kdy jsou testované hypotézy ekvivalentní a kdy naopak nejsou. Uved te příklad situace, pro kterou můžeme použít Wilcoxonův test a t-test by nebyl vhodný, a situace opačné. (c) Připomeňte si testovou statistiku tohoto testu: Je-li Z i = X i δ 0, kde δ 0 je pro nás 3300, pak W = R i, i I kde R i jsou pořadí Z i a I je množina indexů i takových, že Z i > 0. Test můžeme provést jak přesný (pro rozumně malé n; viz samostatné cvičení (iv).) nebo asymptotický založený na tom, že statistika W n(n+1) 4 n(n+1)(2n+1) 24 má asymptoticky N(0, 1) rozdělení. Pro provedení testu musíme opět nejprve odstranit pozorování rovné přímo δ 0. V případě výskytu shod je potřeba jmenovatel zmenšit o tzv. korekci rozptylu (viz skripta str. 89). V R se toto děje defaultně. Navíc se uvažuje ještě korekce pro spojitost, kdy se čitatel snižuje o 1/2 podobně jako u znaménkového testu (viz samostatné cvičení (iii)). Toto lze vypnout pomocí correct=false. (d) Provedeme test wilcox.test(hmot100, mu = 3300,correct=FALSE) Jaký je náš závěr? 7. Ověříme, že uvedená testová statistika je skutečně W uvedené výše x <- hmot100-3300 x <- x[x!= 0] ### nebudeme pouzivat porodni hmotnosti 3300 (R <- rank(abs(x))) (Splus <- sum(r[x > 0])) 8. Porovnáme sílu t-testu, znaménkového testu a Wilcoxonova testu pro normální rozdělení pomocí simulací. Budeme tedy generovat náhodný výběr o rozsahu n=100 z N(0.2, 1) a budeme testovat H 0 : µ = 0 proti H 1 : µ 0. Test provedeme pomocí všech tří testů a uložíme si příslušné p-hodnoty. Celý postup zopakujeme nopak=1000 krát a odhad síly spočteme jako relativní četnost případů, kdy se nám podařilo H 0 zamítnout. 3

opak=1000 n=100 p.t=numeric(opak) p.z=numeric(opak) p.w=numeric(opak) for(i in 1:opak){ x=rnorm(n,mean=0.2,sd=1) p.t[i]=t.test(x,mu=0)$p.val p.w[i]=wilcox.test(x,mu=0)$p.val p.z[i]=prop.test(sum(x>0),n,p=1/2)$p.val } mean(p.t<=0.05) mean(p.w<=0.05) mean(p.z<=0.05) Zkuste změnit velikost rozsahu n nebo alternativu, za které simulujeme, a sledujte, jak se mění síla. Lze udělat nějaký obecný závěr o síle zkoumaných tří testů? 9. Společně se podíváme na porovnání síly uvedených tří testů v závislosti na velikosti parametru polohy pro různá rozdělení, viz zdrojový kód cviceni10_obrazky.r. Párový problém 10. Některé zdroje uvádějí, že chlapci v průběhu prvního roku života přiberou v průměru více než 6,5 kg. Máme za úkol ověřit, zda jsou naše data v souladu s tímto tvrzením. (a) Jsou porodní hmotnost a hmotnost v jednom roce nezávislé veličiny? Uved te další možné příklady párového problému. (b) Spočítáme si váhový přírůstek během prvního roku: hmot<- Hosi$por.hmot hmot1 <- Hosi$hmotnost rozdil=hmot1-hmot (c) Nejprve použijeme t-test. Jaký model předpokládáme (uvažte pomocí vhodných grafů) a jak zní nulová a alternativní hypotéza? Proved te test a interpretujte výsledek. # postup, ktery jiz zname: t.test(rozdil, alternative="greater",mu=6500) # nebo pomoci volby paired: t.test(hmot1, hmot, alternative="greater",mu=6500, paired=t) # pozor na poradi! (d) Nyní na stejný problém použijeme znaménkový test. Co nyní předpokládáme? A co testujeme? Je obecně nějaká souvislost mezi testovanou kvantitou a charakteristikami původních párových veličin (porodní hmotnosti a hmotnost v 1 roce)? 4

Provedeme test n.more=sum(rozdil>6500) n=sum(rozdil!=6500) prop.test(n.more, n, alternative = "greater") Jaký je náš závěr? (e) Nakonec si na tomto problému vyzkoušíme ještě i Wilcoxonův test. Co nyní předpokládáme? Co předpokládáme navíc proti jednovýběrovému Wilcoxonovu testu? Jaké testujeme hypotézy? Proved te test. 11. Zajímá nás věkový rozdíl mezi rodiči chlapců. Konkrétně bychom rádí vědeli, zda jsou otcové v průměru o více než 2 roky starší než matky. (a) Nejprve si prohlédněte vhodné popisné statistiky a grafy, které ilustrují rozdělení věkového rozdílu. (b) Zvolte test, který Vám příjde pro tato data nejvhodnější a proved te jej. Uvědomte si, jaký uvažujete model, jaké testujete hypotézy a jak budeme interpretovat závěr. Samostatná práce (i) V rámci tohoto cvičení jsme pro test hypotézy, zda je průměrná porodní hmotnost chlapců rovna 3,3 kg, použili několik rozličných testů, které v praxi mohou vést k různým p-hodnotám a různým závěrům. Kterému výsledku tedy máme věřit? (ii) Pomocí znaménkového testu proved te test hypotézy, zda je průměrná porodní hmotnost nižší než 3,5 kg. Zformulujte řádně nulovou a alternativní hypotézu a proved te test. (iii) Vyzkoušejte si znaménkový test se zapnutou korekcí pro spojitost. Ověřte, že v tomto případě se počítá testová statistika Z C = Y n n 2 1 2 sgn(y n n 2 ) n 4 (resp. její druhá mocnina). Použijte postup analogický tomu v bodě 2. Korekce pro spojitost zde vychází z toho, že Y n má diskrétní rozdělení a P(Y n y) = P(Y n < y + 1). Tudíž při přechodu k asymptotické aproximaci spojitým normálním rozdělením s distribuční funkcí F lze P(Y n y) aproximovat jak F (y + ε) pro všechna ε [0, 1]. Jako určitý kompromis tedy vezmeme F (y + 1/2). (iv) Pro Wilcoxonův test můžeme použít i přesný test, založený na přesném rozdělení W. Je však nutné, aby v datech nebyly shody a žádné pozorování nebylo rovno přesně testované hodnotě. Pro vyšší n může být ale výpočet časově náročný. Vyzkoušejte si to na simulovaných datech z rovnoměrného rozdělení: x=runif(100,0,1) wilcox.test(x,mu=1/2,exact=true) Postupně zvyšujte počet použitých dat ze 100 na 200, 500, 1000, 2000. Pro jaký rozsah dat je ještě možné použít přesný test? 5

(v) Manuální výpočet p-hodnoty Wilcoxonova testu: Vzorec pro korekci rozptylu z důvodu výskytu shod viz skripta str. 89 (pasáž před začátkem části 5.6). ESplus <- N*(N+1)/4 # totez jako 1/2*sum(1:N) varsplus_noties <- N * (N + 1) * (2 * N + 1) / 24 #vypocet korekce: (tx <- table(r)) # Pocet jednotlivych hodnot varcorrectwithties <- sum(tx^3 - tx) / 48 # Korekce v pripade shod varsplus <- varsplus_noties - varcorrectwithties (U <- (Splus - ESplus) / sqrt(varsplus)) (U.corr <- (Splus - ESplus - 0.5) / sqrt(varsplus)) ### P-hodnoty (P <- 2*pnorm(-abs(U))) (P.corr <- 2*pnorm(-abs(U.corr))) První p-hodnota odpovídá testu bez korekce pro spojitost, druhá odpovídá korekci pro spojitost. Můžeme je srovnat s p-hodnotami: wilcox.test(hmot100, mu = 3300, correct = FALSE)$p.val wilcox.test(hmot100, mu = 3300)$p.val Výsledné p-hodnoty zkuste sami porovnat s p-hodnotou, kterou bychom dostali bez korekce jmenovatele. (vi) Porovnejte sílu jednovýběrových testů pro rovnoměrné rozdělení (stejně jako v 8.). Například simulujte data z R[0, 1.2] a testujte, zda je střední hodnota (medián) rovna 1/2. (vii) Znaménkový test má kromě asymptotické verze (kterou jsme dělali výše) i přesnou variantu založenou na binomickém rozdělení. V R můžeme použít funkce binom.test, parametry této funkce jsou pak stejné jako u prop.test. Proved te pro porovnání test hypotézy, zda je průměrná porodní hmotnost nižší než 3,5 kg, i pomocí přesného testu. Vyzkoušejte použití našich 100 vybraných hodnot i všech dostupných dat. 6