Jednovýběrové testy: t-test, Kolmogorovův-Smirnovův test

Podobné dokumenty
Jednovýběrové testy: t-test, Kolmogorovův-Smirnovův test

Pohlédněte si základní charakteristiky polohy jednotlivých veličin pomocí funkce summary.

Y n = I[X i > m 0 ],

Matematická statistika Zimní semestr

Matematická statistika Zimní semestr

Testy o proporci a testy v multinomickém rozdělení

Základní popisné statistiky a grafy

Matematická statistika Zimní semestr

Základní popisné statistiky a grafy

Matematická statistika Zimní semestr Testy o proporci

Kontingenční tabulky, testy dobré shody a analýza rozptylu (ANOVA)

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

Pravděpodobnost a aplikovaná statistika

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Pracovní text a úkoly ke cvičením MF002

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

PRAVDĚPODOBNOST A STATISTIKA

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Kontingenční tabulky a testy shody

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Cvičení z NSTP

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Tomáš Karel LS 2012/2013

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Tomáš Karel LS 2012/2013

4EK211 Základy ekonometrie

Normální (Gaussovo) rozdělení

12. cvičení z PST. 20. prosince 2017

= = 2368

15. T e s t o v á n í h y p o t é z

Normální (Gaussovo) rozdělení

15. T e s t o v á n í h y p o t é z

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Odhad parametrů N(µ, σ 2 )

Příklady na testy hypotéz o parametrech normálního rozdělení

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

4EK211 Základy ekonometrie

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

- funkce, které integrujete aproximujte jejich Taylorovými řadami a ty následně zintegrujte. V obou případech vyzkoušejte Taylorovy řady

Matematická statistika Zimní semestr

Protokol č. 1. Tloušťková struktura. Zadání:

Aproximace binomického rozdělení normálním

Jednostranné intervaly spolehlivosti

Bodové odhady parametrů a výstupů

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Cvičení ze statistiky - 8. Filip Děchtěrenko

Stručný úvod do testování statistických hypotéz

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

5. T e s t o v á n í h y p o t é z

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013

STATISTICKÉ ODHADY Odhady populačních charakteristik

Ing. Michael Rost, Ph.D.

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Testování statistických hypotéz

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Odhad parametrů N(µ, σ 2 )

Testování statistických hypotéz

Testování statistických hypotéz. Obecný postup

Odhady parametrů základního souboru. Cvičení 6 Statistické metody a zpracování dat 1 (podzim 2016) Brno, říjen listopad 2016 Ambrožová Klára

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

STATISTIKA VĚDA O USUZOVÁNÍ NA ZÁKLADĚ DAT. Patrícia Martinková Ústav informatiky AV ČR

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

Náhodné veličiny, náhodné chyby

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Základy počtu pravděpodobnosti a metod matematické statistiky

AKM CVIČENÍ. Opakování maticové algebry. Mějme matice A, B regulární, potom : ( AB) = B A

Zápočtová práce STATISTIKA I

Základní statistické modely Statistické vyhodnocování exp. dat M. Čada ~ cada

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

4EK211 Základy ekonometrie

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

STATISTICKÉ TESTY VÝZNAMNOSTI

4EK211 Základy ekonometrie

4ST201 STATISTIKA CVIČENÍ Č. 7

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:

Přednáška X. Testování hypotéz o kvantitativních proměnných

Poznámky k předmětu Aplikovaná statistika, 11. téma

Vzorová prezentace do předmětu Statistika

STATISTICKÉ HYPOTÉZY

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

MATEMATICKÁ STATISTIKA 1 ( )

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

Pravděpodobnost a matematická statistika

Transkript:

Jednovýběrové testy: t-test, Kolmogorovův-Smirnovův test 30.11.2017 Úvodní nastavení. Z internetové stránky www.karlin.mff.cuni.cz/~hudecova/education/ si stáhněte data Iq.txt a můžete si stáhnout i zdrojový kód k dnešnímu cvičení cviceni9.r. Otevřete si program R Studio. Změňte si pracovní adresář pomocí Session Set working directory Choose directory nebo napište přímo setwd("h:/nmsa331") Vyčistěte si pracoviště od starých objektů, které zůstaly uloženy: rm(list=ls()) Načtěte si data Hosi.txt. Pro jistotu se podívejte na prvních několik řádků (příkaz head) a ujistěte se, že se Vám data dobře načetla. Můžete zavolat i summary. Do proměnné alpha is uložte testovací hladinu 0.05, na které budeme provádět většinu dnešních testů. Jednovýběrový t-test 1. Opět se budeme zabývat porodní hmotností, ale tentokrát budeme pracovat pouze s (náhodným) podvýběrem o rozsahu n = 100 pozorování. set.seed(30112017); hmot100 <- sample(hosi$por.hmot, 100) Abychom měli všichni stejný podvýběr, zvolili jsme si pevné nastavení generátoru pseudonáhodných čísel pomocí set.seed. Uložte si do n rozsah výběru hmot100. 2. Na jedné internetové stránce se uvádí, že je průměrná porodní hmotnost chlapců rovna 3,3 kg. Ověřte, zda jsou naše data v souladu s tímto tvrzením. (a) Zformulujte vhodný pravděpodobnostní model a pokuste se graficky posoudit, zda je vhodný pro naše data. (b) Zformulujte nulovou a alternativní hypotézu. (c) Proved te test pomocí funkce t.test. t.test(hmot100,mu=3300) Společně si řekneme, co jednotlivé části výstupu znamenají. (d) Rozhodněte o zamítnutí/nezamítnutí nulové hypotézy. Zformulujte závěr. 3. Nyní si jednotlivé části z výstupu funkce t.test spočítáme ručně. Jak víme, testová statistika má tvar T = n X n µ 0 S n a má za nulové hypotézy t n 1 rozdělení. Spočteme ji tedy následovně: 1

(tstat=sqrt(n)*(mean(hmot100)-3300)/sd(hmot100)) a klasickým způsobem testování bychom její absolutní hodnotu porovnali s kritickou hodnotou qt(1 - alpha/2, df=n-1)) Jaký závěr dostáváme z tohoto porovnání? My ale máme ve výstupu p-hodnotu, která nám udává pravděpodobnost, s jakou bychom za nulové hypotézy dostali ještě méně příznivý výsledek než je hodnota naší testové statistiky. Spočítáme ji tedy takto: 2*(1-pt(abs(tstat), df=n-1)) Konečně, intervalový odhad µ spočítáme (viz rozdělení T a klasický postup) jako mean(hmot100)-qt(1 - alpha/2, df=n-1)/sqrt(n)*sd(hmot100) mean(hmot100)+qt(1 - alpha/2, df=n-1)/sqrt(n)*sd(hmot100) Vzpomeňte si na dualitu mezi intervalovým odhadem a testem hypotézy (viz přednáška). 4. Někdy se nám může hodit umět přistupovat k jednotlivým položkám výsledku funkce t.test. tt=t.test(hmot100,mu=3300) names(tt) tt$stat tt$p.val Zkuste si takto nechat vypsat interval spolehlivosti pro µ a podívejte se, jakou test uvažuje alternativu. 5. Nechejte si vypsat interval spolehlivosti s pravděpodobností pokrytí 0, 99. Ve funkce t.test nastavte conf.level = 0.99. Pouze na základě tohoto intervalu rozhodněte o zamítnutí/nezamítnutí nulové hypotézy na testovací hladině 0, 01. 6. Podobně jako v bodě 2. otestujte, zda je pravdivé tvrzení, že je porodní hmotnost chlapců nižší než 3,5 kg. Zformulujte nulovou a alternativní hypotézu a řádně interpretujte výsledek. Všimněte si, jaký intervalový odhad nám nyní R nabízí. 7. Jak bychom ručně spočítali p-hodnotu z 6? 8. Ve 3. jsme konstruovali interval spolehlivosti na základě t-rozdělení uvedené T statistiky. Jaké je její limitní rozdělení pro n? Spočtěte asymptotický intervalový odhad µ zkonstruovaný na základě tohoto limitního rozdělení. Porovnejte oba intervaly. Který z nich je širší? 9. Spočítejte také p-hodnotu příslušného asymptotického testu. Jaký model zde stačí předpokládat? A na základě kterého rozdělení se doporučuje počítat p-hodnotu (resp. kritickou hodnotu)? 10. Doposud jsme k testování používali jenom část dat, a to proto, abychom mohli provést následující porovnání: Proved te ještě jednou testy z 2. a 6. pro celá data a porovnejte je s výsledkem pro náš podvýběr. Co pozorujeme? Co z toho vyplývá pro praxi? 2

Kolmogorovův-Smirnovův test 10. Načtěte si data Iq.txt, která se týkají hodnot IQ a známek na ZŠ Prohlédněte si data a proměnné, které máme k dispozici. náhodně vybraných žáků. 11. Bude nás zajímat IQ žáků, proto si hodnoty uložte do proměnné IQ a do n si uložte rozsah výběru. IQ = Iq$iq; n = length(iq) Jakými popisnými statistikami byste popsali data? Jaké obrázky ilustrují rozdělení dat? 12. Na wikipedii se uvádí, že IQ má v populaci normální rozdělení se střední hodnotou 100 a směrodatnou odchylkou 15. Zajímá nás, zda naše data podporují nebo vyvracejí toto tvrzení. (a) Jaký model předpokládáme pro naše data? Formulujte nulovou a alternativní hypotézu, kterou budeme testovat. (b) Provedeme Kolmogorovův-Smirnovův test ks.test(iq, y="pnorm", mean=100, sd=15) (c) Jaký je náš závěr? 13. Z přednášky víme, že testová statistika má tvar K n = sup x F n (x) F 0 (x), ale pro výpočet se používá ( ) ( i K n + = max 1 i n n F 0(X (i) ), Kn = max F 0 (X (i) ) i 1 ), K n = max(k n +, Kn ). 1 i n n Ověříme tedy, že R počítá opravdu tuto testovou statistiku: F0 <- function(x) pnorm(x, mean=100, sd=15) IQ.sorted=sort(IQ) Knplus <- max((1:n)/n - F0(IQ.sorted)) Knminus <- max(f0(iq.sorted) - (0:(n-1))/n) (Kn <- max(knplus, Knminus)) Za nulové hypotézy má nk n asymptoticky rozdělení s distribuční funkcí G(y) = 1 2 ( 1) k+1 e 2k2 y 2. Pomocí konečné aproximace této distribuční funkce můžeme p-hodnotu testu spočíst k=1 G <- function(y){ k <- 1:10000; # aproximace nekonecne sumy 1-2*sum((-1)^(k+1)*exp(-2*k^2*y^2)) 1 - G(sqrt(n)*Kn) 3

Kdybychom chtěli znát kritickou hodnotu, tak vlastně hledáme c takové, že P( nk n > c) = α, tj. G(c) = 1 y. To musíme vyřešit numericky: fce <- function(x) G(x) - (1 - alfa) (krit <- uniroot(fce, c(0.1,10))$root) sqrt(n)*kn 14. Celou situaci si graficky znázorníme. Vzpomeňte si na odvození tzv. pásu spolehlivosti pro distribuční funkci, které jste měli na přednášce. empir.df <- ecdf(iq); plot(empir.df, ylab="", main="porovnani distribucnich funkci",do.points=f) # pas spolehlivosti xgrid <- seq(min(iq)-10, max(iq)+10, length=10000); dolni.pas <- pmax(empir.df(xgrid)-krit/sqrt(n),0) horni.pas <- pmin(empir.df(xgrid)+krit/sqrt(n),1) polygon(c(xgrid, rev(xgrid)), c(horni.pas, rev(dolni.pas)), col = "gray90", border="gray70",lty=2) plot(empir.df, verticals=false, add=t, lwd=2,do.points=false) lines(xgrid, F0(xgrid), col="blue", lwd=2); # graf F_0 # Bod nejvetsiho rozdilu k0 <- which.max(f0(iq.sorted) - (0:(n-1))/n); abline(v=iq.sorted[k0], col="red"); legend("bottomright", col=c("black", "grey70", "blue"), lty=c(1,2,1), legend=c("empiricka d.f.", "pas spolehlivosti", "d.f. za nulove hypotezy")) 15. Připomeňte si, že Kolmogorovův-Smirnovův test předpokládá, že je F 0 specifikovaná úplně, včetně hodnot všech parametrů. V případě, že tomu tak není (pokud bychom parametry odhadovali z dat), tak nám K-S test nedává správnou p-hodnotu (rozdělení testové statistiky za nulové hypotézy je jiné). Ukážeme si to na malé simulaci, kdy budeme generovat data z N(100, 15 2 ) a budeme provádět K-S test jednak se zadanými parametry a jednak s parametry odhadnutými z dat. nopak <- 10000 pval.zname <- numeric(nopak); pval.nezname <- numeric(nopak); for(i in 1:nopak){ Y <- rnorm(n, mean=100, sd=15); pval.zname[i] <- ks.test(y, y="pnorm", mean=100, sd=15)$p.value; pval.nezname[i] <- ks.test(y, y="pnorm", mean=mean(y), sd=sd(y))$p.value; mean(pval.zname <= 0.05) mean(pval.nezname <= 0.05) Poslední dvě hodnoty nám odhadují hladinu testu (měla by být 0,05). Vidíme, že dostáváme dvě velmi rozličné hodnoty. Co lze tedy říci o K-S testu v případě, že bychom ho špatně používali s parametry odhadnutými z dat? 4

Simulace 16. Provedeme simulace z rovnoměrného a exponenciálního rozdělení a budeme zkoumat skutečnou hladinu testu při použití asymptotického testu (tj. při použití t-testu na nenormální data). n=100 opak=1000 p.rovn=numeric(opak) p.exp=numeric(opak) for(i in 1:opak){ x1=runif(n) p.rovn[i]=t.test(x1,mu=1/2)$p.val x2=rexp(n,rate=1) p.exp[i]=t.test(x2,mu=1)$p.val mean(p.rovn<=0.05) mean(p.exp<=0.05) Zkuste změnit počet pozorování n (zmenšit a zvětšit). Pro jaké n je rozumné použít asymptotický test? 17. Podobné simulace provedeme za alternativy a budeme sledovat sílu testu. n=100 opak=1000 p.rovn=numeric(opak) p.exp=numeric(opak) for(i in 1:opak){ x1=runif(n,0,1.2) p.rovn[i]=t.test(x1,mu=1/2)$p.val x2=rexp(n,rate=1.2) p.exp[i]=t.test(x2,mu=1)$p.val mean(p.rovn<=0.05) mean(p.exp<=0.05) Vyzkoušejte měnit parametry rozdělení a sledovat, jak se mění síla, pokud se od nulové hypotézy vzdalujeme. Podobně, nechejte parametry rozdělení fixní a sledujte, jak se mění síla, pokud zvyšujeme počet pozorování. Učiňte nějaký obecný závěr z tohoto zkoumání. 18. Porovnáme sílu K-S testu v případě správného použití (se zadanými parametry) a v případě špatného použití, kdy parametry odhadujeme z dat. Budeme simulovat z χ 2 k rozdělení, o kterém víme, že ho lze pro k velké aproximovat N(k, 2k) rozdělením. 5

n=100 k=7 opak=1000 p.ch1=numeric(opak) p.ch2=numeric(opak) for(i in 1:opak){ x=rchisq(n,df=k) p.ch1[i]=ks.test(x,"pnorm",mean=k,sd=sqrt(2*k))$p.val p.ch2[i]=ks.test(x,"pnorm",mean=mean(x),sd=sd(x))$p.val mean(p.ch1<=0.05) mean(p.ch2<=0.05) Porovnejte obě síly testu. Zkuste k zvýšit (tj. přiblížit se k nulové hypotéze) na 10 a opět porovnejte. Samostatná práce 1. Po dnešním cvičená byste měli umět odpovědět na následující otázky: Můžeme použít Kolmogorův-Smirnovův test na otestování, zda se hmotnost chlapců řídí normálním rozdělením? Můžeme použít Kolmogorův-Smirnovův test k otestování, zda se věk matky řídí Gama rozdělením s parametry p = 25 a a = 1? Můžeme použít Kolmogorův-Smirnovův test k otestování, zda se počet studentů, kteří skutečně dorazí na cvičení z Matematické statistiky, řídí Binomickým rozdělením s parametry n = 20 a p = 0.9? 2. Lze na základě dat uvedených v souboru Iq.txt tvrdit, že průměrná známka žáků v sedmé třídě je horší než 1,5? Jaký model lze předpokládat pro tato data? Ověřte vhodným obrázkem. Zformulujte nulovou a alternativní hypotézu. Proved te test a interpretujte výsledek. 3. Na přednášce jste kromě pásu spolehlivosti uvažovali i interval spolehlivosti pro F (x) pro dané pevné x. Zkuste si vytvořit podobný obrázek jako jsme měli ve 14, ale kromě pásu spolehlivosti vykreslete i intervaly spolehlivosti. Který pás je širší? Proč? 6