Jednovýběrové testy: t-test, Kolmogorovův-Smirnovův test

Podobné dokumenty
Jednovýběrové testy: t-test, Kolmogorovův-Smirnovův test

Pohlédněte si základní charakteristiky polohy jednotlivých veličin pomocí funkce summary.

Y n = I[X i > m 0 ],

Matematická statistika Zimní semestr

Matematická statistika Zimní semestr

Testy o proporci a testy v multinomickém rozdělení

Matematická statistika Zimní semestr

Matematická statistika Zimní semestr Testy o proporci

Základní popisné statistiky a grafy

Základní popisné statistiky a grafy

Kontingenční tabulky, testy dobré shody a analýza rozptylu (ANOVA)

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Pravděpodobnost a aplikovaná statistika

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Tomáš Karel LS 2012/2013

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Pracovní text a úkoly ke cvičením MF002

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

= = 2368

Kontingenční tabulky a testy shody

PRAVDĚPODOBNOST A STATISTIKA

Cvičení z NSTP

15. T e s t o v á n í h y p o t é z

12. cvičení z PST. 20. prosince 2017

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

4EK211 Základy ekonometrie

Tomáš Karel LS 2012/2013

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

15. T e s t o v á n í h y p o t é z

Normální (Gaussovo) rozdělení

Jednostranné intervaly spolehlivosti

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Normální (Gaussovo) rozdělení

Odhad parametrů N(µ, σ 2 )

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

Cvičení ze statistiky - 8. Filip Děchtěrenko

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Protokol č. 1. Tloušťková struktura. Zadání:

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

Matematická statistika Zimní semestr

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

STATISTICKÉ ODHADY Odhady populačních charakteristik

Aproximace binomického rozdělení normálním

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

- funkce, které integrujete aproximujte jejich Taylorovými řadami a ty následně zintegrujte. V obou případech vyzkoušejte Taylorovy řady

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Bodové odhady parametrů a výstupů

Vybraná rozdělení náhodné veličiny

Příklady na testy hypotéz o parametrech normálního rozdělení

Testování statistických hypotéz

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

4EK211 Základy ekonometrie

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

Vzorová prezentace do předmětu Statistika

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Přednáška X. Testování hypotéz o kvantitativních proměnných

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

5. T e s t o v á n í h y p o t é z

MATEMATICKÁ STATISTIKA 1 ( )

Testování statistických hypotéz

y = 0, ,19716x.

Ing. Michael Rost, Ph.D.

Základy počtu pravděpodobnosti a metod matematické statistiky

AKM CVIČENÍ. Opakování maticové algebry. Mějme matice A, B regulární, potom : ( AB) = B A

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

Poznámky k předmětu Aplikovaná statistika, 11. téma

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Odhad parametrů N(µ, σ 2 )

Náhodné veličiny, náhodné chyby

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

STATISTIKA VĚDA O USUZOVÁNÍ NA ZÁKLADĚ DAT. Patrícia Martinková Ústav informatiky AV ČR

5 Parametrické testy hypotéz

4ST201 STATISTIKA CVIČENÍ Č. 7

Návrh a vyhodnocení experimentu

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Stručný úvod do testování statistických hypotéz

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Výpočet pravděpodobností

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

Zápočtová práce STATISTIKA I

Téma 22. Ondřej Nývlt

Výběrové charakteristiky a jejich rozdělení

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

Diskrétní náhodná veličina

Transkript:

Jednovýběrové testy: t-test, Kolmogorovův-Smirnovův test 27.11.2018 Úvodní nastavení. Z internetové stránky www.karlin.mff.cuni.cz/~hudecova/education/ si stáhněte data Iq.txt a můžete si stáhnout i zdrojový kód k dnešnímu cvičení cviceni9.r. Otevřete si program R Studio. Změňte si pracovní adresář pomocí Session Set working directory Choose directory nebo napište přímo setwd("h:/nmsa331") Vyčistěte si pracoviště od starých objektů, které zůstaly uloženy: rm(list=ls()) Načtěte si data Hosi.txt. Pro jistotu se podívejte na prvních několik řádků (příkaz head) a ujistěte se, že se Vám data dobře načetla. Můžete zavolat i summary. Do proměnné alpha is uložte testovací hladinu 0.05, na které budeme provádět většinu dnešních testů. Jednovýběrový t-test 1. Opět se budeme zabývat porodní hmotností, ale tentokrát budeme pracovat pouze s (náhodným) podvýběrem o rozsahu n = 100 pozorování. set.seed(27112018); hmot100 <- sample(hosi$por.hmot, 100) Abychom měli všichni stejný podvýběr, zvolili jsme si pevné nastavení generátoru pseudonáhodných čísel pomocí set.seed. Uložte si do n rozsah výběru hmot100. 2. Na internetové stránce ČSÚ se v zásadě uvádí, že je průměrná porodní hmotnost novorozených chlapců rovna 3,3 kg. Ověřte, zda jsou naše data v souladu s tímto tvrzením. (a) Zformulujte vhodný pravděpodobnostní model a pokuste se graficky posoudit, zda je vhodný pro naše data. (b) Zformulujte nulovou a alternativní hypotézu. (c) Proved te test pomocí funkce t.test. t.test(hmot100,mu=3300) Společně si řekneme, co jednotlivé části výstupu znamenají. (d) Rozhodněte o zamítnutí/nezamítnutí nulové hypotézy. Zformulujte závěr. 3. Nyní si jednotlivé části z výstupu funkce t.test spočítáme ručně. Jak víme, testová statistika má tvar T = n X n µ 0 S n a má za nulové hypotézy t n 1 rozdělení. Spočteme ji tedy následovně: 1

(tstat=sqrt(n)*(mean(hmot100)-3300)/sd(hmot100)) a klasickým způsobem testování bychom její absolutní hodnotu porovnali s kritickou hodnotou qt(1 - alpha/2, df=n-1)) Jaký závěr dostáváme z tohoto porovnání? My ale máme ve výstupu p-hodnotu, která nám udává pravděpodobnost, s jakou bychom za nulové hypotézy dostali ještě méně příznivý výsledek než je hodnota naší testové statistiky. Spočítáme ji tedy takto: 2*(1-pt(abs(tstat), df=n-1)) Konečně, intervalový odhad µ spočítáme mean(hmot100)-qt(1 - alpha/2, df=n-1)/sqrt(n)*sd(hmot100) mean(hmot100)+qt(1 - alpha/2, df=n-1)/sqrt(n)*sd(hmot100) Vzpomeňte si na dualitu mezi intervalovým odhadem a testem hypotézy (viz přednáška). 4. Někdy se nám může hodit umět přistupovat k jednotlivým položkám výsledku funkce t.test. tt=t.test(hmot100,mu=3300) names(tt) tt$stat tt$p.val Zkuste si takto nechat vypsat interval spolehlivosti pro µ a podívejte se, jakou test uvažuje alternativu. 5. Nechejte si vypsat interval spolehlivosti s pravděpodobností pokrytí 0, 99. Ve funkce t.test nastavte conf.level = 0.99. Pouze na základě tohoto intervalu rozhodněte o zamítnutí/nezamítnutí nulové hypotézy na testovací hladině 0, 01. 6. Podobně jako v bodě 2. otestujte, zda je pravdivé tvrzení, že je střední porodní hmotnost chlapců nižší než 3,5 kg. Zformulujte nulovou a alternativní hypotézu a řádně interpretujte výsledek. Všimněte si, jaký intervalový odhad nám nyní R nabízí. 7. Jak bychom ručně spočítali p-hodnotu z 6? 8. Ve 3. jsme konstruovali interval spolehlivosti na základě t-rozdělení uvedené T statistiky. Jaké je její limitní rozdělení pro n? Spočtěte asymptotický intervalový odhad µ zkonstruovaný na základě tohoto limitního rozdělení. Porovnejte oba intervaly. Který z nich je širší? 9. Spočítejte také p-hodnotu příslušného asymptotického testu. Jaký model zde stačí předpokládat? A na základě kterého rozdělení se doporučuje počítat p-hodnotu (resp. kritickou hodnotu)? 10. Doposud jsme k testování používali jenom část dat, a to proto, abychom mohli provést následující porovnání: Proved te ještě jednou testy z 2. a 6. pro celá data a porovnejte je s výsledkem pro náš podvýběr. Co pozorujeme? Co z toho vyplývá pro praxi? 2

Kolmogorovův-Smirnovův test 10. Načtěte si data Iq.txt, která se týkají hodnot IQ a známek na ZŠ Prohlédněte si data a proměnné, které máme k dispozici. náhodně vybraných žáků. 11. Bude nás zajímat IQ žáků, proto si hodnoty uložte do proměnné IQ a do n si uložte rozsah výběru. IQ = Iq$iq; n = length(iq) Jakými popisnými statistikami byste popsali data? Jaké obrázky ilustrují rozdělení dat? 12. Na wikipedii se uvádí, že IQ má v populaci normální rozdělení se střední hodnotou 100 a směrodatnou odchylkou 15. Zajímá nás, zda naše data podporují nebo vyvracejí toto tvrzení. (a) Jaký model předpokládáme pro naše data? Formulujte nulovou a alternativní hypotézu, kterou budeme testovat. (b) Provedeme Kolmogorovův-Smirnovův test ks.test(iq, y="pnorm", mean=100, sd=15) (c) Jaký je náš závěr? 13. Z přednášky víme, že testová statistika má tvar K n = sup x F n (x) F 0 (x), ale pro výpočet se používá ( ) ( i K n + = max 1 i n n F 0(X (i) ), Kn = max F 0 (X (i) ) i 1 ), K n = max(k n +, Kn ). 1 i n n Ověříme tedy, že R počítá opravdu tuto testovou statistiku: F0 <- function(x) pnorm(x, mean=100, sd=15) IQ.sorted=sort(IQ) Knplus <- max((1:n)/n - F0(IQ.sorted)) Knminus <- max(f0(iq.sorted) - (0:(n-1))/n) (Kn <- max(knplus, Knminus)) Za nulové hypotézy má nk n asymptoticky rozdělení s distribuční funkcí G(y) = 1 2 ( 1) k+1 e 2k2 y 2. Pomocí konečné aproximace této distribuční funkce můžeme p-hodnotu testu spočíst k=1 G <- function(y){ k <- 1:10000; # aproximace nekonecne sumy 1-2*sum((-1)^(k+1)*exp(-2*k^2*y^2)) 1 - G(sqrt(n)*Kn) 3

Kdybychom chtěli znát kritickou hodnotu, tak vlastně hledáme c takové, že P( nk n > c) = α, tj. G(c) = 1 y. To musíme vyřešit numericky: fce <- function(x) G(x) - (1 - alfa) (krit <- uniroot(fce, c(0.1,10))$root) sqrt(n)*kn 14. Celou situaci si graficky znázorníme. Vzpomeňte si na odvození tzv. pásu spolehlivosti pro distribuční funkci, které jste měli na přednášce. empir.df <- ecdf(iq); plot(empir.df, ylab="", main="porovnani distribucnich funkci",do.points=f) # pas spolehlivosti xgrid <- seq(min(iq)-10, max(iq)+10, length=10000); dolni.pas <- pmax(empir.df(xgrid)-krit/sqrt(n),0) horni.pas <- pmin(empir.df(xgrid)+krit/sqrt(n),1) polygon(c(xgrid, rev(xgrid)), c(horni.pas, rev(dolni.pas)), col = "gray90", border="gray70",lty=2) plot(empir.df, verticals=false, add=t, lwd=2,do.points=false) lines(xgrid, F0(xgrid), col="blue", lwd=2); # graf F_0 # Bod nejvetsiho rozdilu k0 <- which.max(f0(iq.sorted) - (0:(n-1))/n); abline(v=iq.sorted[k0], col="red"); legend("bottomright", col=c("black", "grey70", "blue"), lty=c(1,2,1), legend=c("empiricka d.f.", "pas spolehlivosti", "d.f. za nulove hypotezy")) 15. Připomeňte si, že Kolmogorovův-Smirnovův test předpokládá, že je F 0 specifikovaná úplně, včetně hodnot všech parametrů. V případě, že tomu tak není (pokud bychom parametry odhadovali z dat), tak nám K-S test nedává správnou p-hodnotu (rozdělení testové statistiky za nulové hypotézy je jiné). Ukážeme si to na malé simulaci, kdy budeme generovat data z N(100, 15 2 ) a budeme provádět K-S test jednak se zadanými parametry a jednak s parametry odhadnutými z dat. nopak <- 10000 pval.zname <- numeric(nopak) pval.nezname <- numeric(nopak) n<-100 for(i in 1:nopak){ Y <- rnorm(n, mean=100, sd=15); pval.zname[i] <- ks.test(y, y="pnorm", mean=100, sd=15)$p.value; pval.nezname[i] <- ks.test(y, y="pnorm", mean=mean(y), sd=sd(y))$p.value; mean(pval.zname <= 0.05) mean(pval.nezname <= 0.05) 4

Poslední dvě hodnoty nám odhadují hladinu testu (měla by být 0,05). Vidíme, že dostáváme dvě velmi rozličné hodnoty. Co lze tedy říci o K-S testu v případě, že bychom ho špatně používali s parametry odhadnutými z dat? 16. Dalším důležitým předpokladem K-S testu je spojité rozdělení dat. Pomocí následující simulace se podíváme na skutečnou hladinu testu, použijeme-li nesprávně K-S test (s distribuční funkcí G) pro test shody s binomickým rozdělením Bi(N, p) na základě dat o rozsahu n. Simulace nopak=10000 pval=numeric(nopak) n=100 N=10 p=1/3 F0=function(x) pbinom(x, size=n, prob=p) set.seed(123) for(i in 1:nopak){ x = rbinom(n,size=n,prob=p) xi=unique(c(x,0:n)) Kn=max(abs(ecdf(x)(xi)-F0(xi))) pval[i]=1-g(sqrt(n)*kn) mean(pval<=0.05) Co lze na základě předchozí simulace říci o K-S testu, použijeme-li jej pro F 0 s diskrétním rozdělením? Zkuste v předchozí simulaci zvýšit N postupně na 100 a 2000 a poté naopak snížit na 5 a 1. Co sledujeme? Zamyslete se, jaké je rozdělení testové statistiky nk n pro data s alternativním rozdělením pro případ, kdy F 0 odpovídá alternativnímu rozdělení s parametrem p. Zkuste v předchozí simulaci počítat p-hodnotu pomocí funkce ks.test: pval[i]=ks.test(x,pbinom,size=n,prob=p)$p.val Dostáváme stejný výsledek? 16. Provedeme simulace z rovnoměrného a exponenciálního rozdělení a budeme zkoumat skutečnou hladinu testu při použití asymptotického testu (tj. při použití t-testu na nenormální data). n=100 opak=1000 p.rovn=numeric(opak) p.exp=numeric(opak) for(i in 1:opak){ x1=runif(n) 5

p.rovn[i]=t.test(x1,mu=1/2)$p.val x2=rexp(n,rate=1) p.exp[i]=t.test(x2,mu=1)$p.val mean(p.rovn<=0.05) mean(p.exp<=0.05) Zkuste změnit počet pozorování n (zmenšit a zvětšit). Pro jaké n je rozumné použít asymptotický test? 17. Podobné simulace provedeme za alternativy a budeme sledovat sílu testu. n=100 opak=1000 p.rovn=numeric(opak) p.exp=numeric(opak) for(i in 1:opak){ x1=runif(n,0,1.2) p.rovn[i]=t.test(x1,mu=1/2)$p.val x2=rexp(n,rate=1.2) p.exp[i]=t.test(x2,mu=1)$p.val mean(p.rovn<=0.05) mean(p.exp<=0.05) Vyzkoušejte měnit parametry rozdělení a sledovat, jak se mění síla, pokud se od nulové hypotézy vzdalujeme. Podobně, nechejte parametry rozdělení fixní a sledujte, jak se mění síla, pokud zvyšujeme počet pozorování. Učiňte nějaký obecný závěr z tohoto zkoumání. Samostatná práce 1. Po dnešním cvičená byste měli umět odpovědět na následující otázky: Můžeme použít Kolmogorův-Smirnovův test na otestování, zda se hmotnost chlapců řídí normálním rozdělením? Můžeme použít Kolmogorův-Smirnovův test k otestování, zda se věk matky řídí Gama rozdělením s parametry p = 25 a a = 1? Můžeme použít Kolmogorův-Smirnovův test k otestování, zda se počet studentů, kteří skutečně dorazí na cvičení z Matematické statistiky, řídí binomickým rozdělením s parametry n = 20 a p = 0.9? 2. Lze na základě dat uvedených v souboru Iq.txt tvrdit, že průměrná známka žáků v sedmé třídě je horší než 1,5? 6

Jaký model lze předpokládat pro tato data? Ověřte vhodným obrázkem. Zformulujte nulovou a alternativní hypotézu. Proved te test a interpretujte výsledek. 3. Na přednášce jste kromě pásu spolehlivosti uvažovali i interval spolehlivosti pro F (x) pro dané pevné x. Zkuste si vytvořit podobný obrázek jako jsme měli ve 14, ale kromě pásu spolehlivosti vykreslete i intervaly spolehlivosti. Který pás je širší? Proč? 7