Matematická statistika Zimní semestr

Podobné dokumenty
Pohlédněte si základní charakteristiky polohy jednotlivých veličin pomocí funkce summary.

Y n = I[X i > m 0 ],

Matematická statistika Zimní semestr

Matematická statistika Zimní semestr

Jednovýběrové testy: t-test, Kolmogorovův-Smirnovův test

Jednovýběrové testy: t-test, Kolmogorovův-Smirnovův test

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Testy o proporci a testy v multinomickém rozdělení

Kontingenční tabulky, testy dobré shody a analýza rozptylu (ANOVA)

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

= = 2368

Matematická statistika Zimní semestr Testy o proporci

Jednostranné intervaly spolehlivosti

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

15. T e s t o v á n í h y p o t é z

Cvičení 9: Neparametrické úlohy o mediánech

Příklady na testy hypotéz o parametrech normálního rozdělení

Opakování. Neparametrické testy. Pořadí. Jednovýběrový Wilcoxonův test. t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

12. cvičení z PST. 20. prosince 2017

4ST201 STATISTIKA CVIČENÍ Č. 7

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

Protokol č. 1. Tloušťková struktura. Zadání:

Normální (Gaussovo) rozdělení

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

15. T e s t o v á n í h y p o t é z

Jednofaktorová analýza rozptylu

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Základní popisné statistiky a grafy

Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze

Normální (Gaussovo) rozdělení

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Kontingenční tabulky a testy shody

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

Vzorová prezentace do předmětu Statistika

Statistika pro každého. Párový test Test shody dvou rozptylů Dvouvýběrový t-test Porovnání středních hodnot při nestejných rozptylech

Testy. Pavel Provinský. 19. listopadu 2013

ADDS cviceni. Pavlina Kuranova

KGG/STG Statistika pro geografy

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

Testování statistických hypotéz

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Úvod do analýzy rozptylu

STATISTICKÉ TESTY VÝZNAMNOSTI

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

PRAVDĚPODOBNOST A STATISTIKA

Statistika. Testování hypotéz statistická indukce Neparametrické testy. Roman Biskup

ANALÝZA DAT V R 5. ZÁKLADNÍ STATISTICKÉ TESTY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

5. T e s t o v á n í h y p o t é z

Cvičení ze statistiky - 8. Filip Děchtěrenko

Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj.

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Základní popisné statistiky a grafy

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Stručný úvod do testování statistických hypotéz

7. Analýza rozptylu.

STATISTICA Téma 7. Testy na základě více než 2 výběrů

Aproximace binomického rozdělení normálním

Regresní analýza 1. Regresní analýza

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Přednáška X. Testování hypotéz o kvantitativních proměnných

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

PRAVDĚPODOBNOST A STATISTIKA

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

Zápočtová práce STATISTIKA I

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.

Statistika, Biostatistika pro kombinované studium. Jan Kracík

5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)

NEPARAMETRICKÉ TESTY

2 ) 4, Φ 1 (1 0,005)

Statistické metody uţívané při ověřování platnosti hypotéz

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Návod na vypracování semestrálního projektu

Testy nezávislosti kardinálních veličin

Matematická statistika Zimní semestr

5 Parametrické testy hypotéz

Pravděpodobnost a aplikovaná statistika

4EK211 Základy ekonometrie

STATISTICKÉ TESTY VÝZNAMNOSTI

Charakteristika datového souboru

Neparametrické metody

Cvičení z NSTP

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

12. prosince n pro n = n = 30 = S X

Transkript:

Dvouvýběrové testy 11.12.2018 Úvodní nastavení. Z internetové stránky www.karlin.mff.cuni.cz/~hudecova/education/ si stáhněte data Iq2.txt a zdrojové kódy cviceni11.r a figks.r, případně i cviceni11-obrazky.r. Otevřete si program R Studio, změňte si pracovní adresář a vyčistěte pracoviště setwd("h:/nmsa331") rm(list=ls()) Do proměnné alpha is uložte testovací hladinu 0.05. Data. Data Iq2.txt obsahují informace o náhodně vybraných žácích osmé třídy základní školy. Pro každého máme k dispozici jeho IQ, pohlaví (kódování 1 dívky a 0 chlapci) a dále pak průměrnou známku na vysvědčení v pololetí sedmé třídy a v pololetí osmé třídy. IQ hodnota IQ, ZN7 průměrná známka na vysvědčení v pololetí sedmé třídy, ZN7 průměrná známka na vysvědčení v pololetí osmé třídy, Pohlavi pohlaví žáka (1- žena, 0 - muž) FPohlavi jinak kódované pohlaví žáka (kategorie dívka, chlapec). Dvouvýběrový problém 1. Načtěte si data Iq2.txt a ujistěte se, že se Vám data dobře načetla. Iq = read.table("iq2.txt",header=t) summary(iq) attach(iq) Prohlédněte si základní charakteristiky polohy jednotlivých veličin pomocí funkce summary. Všimněte si rozličného výstupu pro veličiny Pohlavi a FPohlavi. Příkaz attach nám zpřístupní jednotlivé proměnné z dat, takže je budeme moci volat přímo jejich názvem (např. IQ namísto Iq$IQ). 2. Pomocí vhodného obrázku vizualizujte genderové složení našeho datového vzorku. 3. Budeme se zabývat otázkou, zda se nějak liší IQ u chlapců a dívek. Začneme nejprve prohlídkou popisných statistik. IQchlapci=IQ[FPohlavi=="chlapec"] IQdivky=IQ[FPohlavi=="divka"] #charakteristiky polohy dle pohlavi summary(iqchlapci) summary(iqdivky) 1

# nebo rychleji pomoci 1 prikazu tapply(iq,fpohlavi,summary) # podminene sd tapply(iq,fpohlavi,sd) Co usuzujete na základě těchto číselných charakteristik? 4. Problém si ještě budeme vizualizovat: boxplot(iq~fpohlavi) # totez jako boxplot(iqchlapci,iqdivky,names=c("chlapci","divky")) # muzeme vybarvit a doplnit popisky: boxplot(iq~fpohlavi,ylab="iq",col=c("lightblue","pink")) Co usuzujeme z tohoto obrázku? 5. Nyní se podíváme na to, zda je možné (resp. vhodné) předpokládat, že oba výběry pocházejí z normálního rozdělení. par(mfrow=c(1,2)) hist(iqchlapci,prob=t,xlim=c(60,150)) hist(iqdivky,prob=t,xlim=c(60,150)) par(mfrow=c(1,2)) qqnorm(iqchlapci,main="chlapci") qqline(iqchlapci) qqnorm(iqdivky,main="divky") qqline(iqdivky) par(mfrow=c(1,1)) Dvouvýběrový Kolmogorovův-Smirnovův test 6. Pomocí Kolmogorovova-Smirnovova testu budeme testovat, zda je rozdělení IQ chlapců i dívek stejné. (a) Co předpokládáme za model? (b) Jak zní nulová a alternativní hypotéza? (c) Provedeme test: ks.test(iqdivky, IQchlapci, exact = FALSE) Jaký je náš závěr? 7. Testová statistika tohoto testu má tvar 1 1 Za nulové hypotézy pro n, m platí nm ( G(z) = 1 2 k=1 ( 1)k+1 e 2k2 z 2) I[z > 0]. K n,m = sup ˆF X (x) ˆF Y (x). x R n+m K n,m 2 D Z, kde Z je náhodná veličina s distribuční funkcí

Ověříme, že R počítá podle stejného předpisu: e1=ecdf(iqchlapci) e2=ecdf(iqdivky) max(abs(e1(iq)-e2(iq))) Kdybychom chtěli zjistit, kde maximum nastává: IQ[which.max(abs(e1(IQ)-e2(IQ)))] Celou situaci si můžeme i vizualizovat pomocí následujícího obrázku: source("figks.r") figks(iq, FPohlavi) Dvouvýběrový t-test 8. Pomocí dvouvýběrového t-testu budeme testovat shodu středních hodnot IQ u chlapců a dívek. Nejprve použijeme verzi pro shodné rozptyly. (a) Jaký předpokládáme model? Jsou tyto předpoklady pro naše data reálné? (b) Napište, jaké hypotézy testujeme a porovnejte je s hypotézami K-S testu. (c) Připomeňte si tvar testové statistiky tohoto testu: T n,m = nm Y m X n, Sn,m 2 = n + m S n,m 1 ( ) (n 1)S 2 n + m 2 X + (m 1)SY 2. Jaké je její přesné rozdělení za nulové hypotézy (v předpokládaném modelu)? (d) Provedeme test: t.test(iq ~ FPohlavi, var.equal = TRUE) # nebo jiny zpusob zadani: t.test(iqdivky, IQchlapci, var.equal = TRUE) Jaký je náš závěr ohledně středních hodnot IQ? Co odhaduje uvedený interval spolehlivosti? 9. Spočítáme hodnotu testové statistiky manuálně: xmean=mean(iqdivky) ymean=mean(iqchlapci) nx=length(iqdivky) ny=length(iqchlapci) S2=1/(nx+ny-2)*((nx-1)*var(IQdivky)+(ny-1)*var(IQchlapci)) (T.stat=(ymean-xmean)/(sqrt(S2*(1/nx+1/ny)))) # kriticka hodnota qt(1-alpha/2,df=nx+ny-2) #p-hodnota 2 * pt(-abs(t.stat), df = nx+ny-2) 3

10. Který z předpokladů testu lze do určité míry ignorovat a test zůstane v platnosti alespoň asymptoticky? Nesplnění kterého předpokladu může naopak vést k nedodržení předepsané hladiny testu? 11. Nyní si vyzkoušíme jinou verzi t-testu, která předpoklad shody rozptylů neuvažuje. Jde o tzv. Welchův test. (a) Provedeme test: t.test(iq ~ FPohlavi) #nebo t.test(iqchlapci,iqdivky) Jaký je náš závěr? Jaké rozdělení má asymptoticky uvedená testová statistika? A na základě jakého rozdělení je spočtená p-hodnota? Co stačí předpokládat pro asymptotickou verzi testu? Jak vidíme, tato verze t-testu je v R nastavena defaultně. Jelikož předem většinou nevíme, zda je možné předpokládat shodu rozptylů zkoumaných dvou výběrů, je lepší rovnou použít tuto obecnější verzi testu. V případě, že rozptyly ve skutečnosti shodné jsou, má tento obecnější test jen zanedbatelně nižší sílu ve srovnání s testem odvozeným pro výběry se shodným rozptylem, viz simulace ve 13. 12. Opět provedeme manuální výpočet testové statistiky (T.W=(ymean-xmean)/(sqrt(var(IQdivky)/nx+var(IQchlapci)/ny))) 13. Na základě následujících simulací porovnáme sílu t-testu se shodou rozptylů a Welchova testu pro situaci, kdy shoda rozptylů platí opak=1000 n1=100 n2=150 p.s=numeric(opak) p.w=numeric(opak) for(i in 1:opak){ x=rnorm(n1,0.2,sd=1) y=rnorm(n2,0,sd=1) p.s[i]=t.test(x,y,var.equal=true)$p.val p.w[i]=t.test(x,y)$p.val } mean(p.s<=0.05) mean(p.w<=0.05) 14. V předchozích simulacích proved te následující změnu: simulujte x za nulové hypotézy, tj. nastavte střední hodnotu na 0, ale změňte směrodatnou odchylku na 3. Tím se podíváme na to, jaká je hladina testů za nulové hypotézy v případě neshody rozptylů. Měli bychom vidět, že varianta t-testu, která shodu předpokládá, nedodržuje předepsanou hladinu testu. 15. Celou situaci si můžeme i graficky znázornit pomocí první simulace ze souboru cviceni11- obrazky.r. Současné nastavení nám ukazuje porovnání síly při shodě rozptylů. Změňte nastavení tak, abyste viděli, jak situace vypadá, pokud (a) zvýšíme směrodatnou odchylku x, (b) zvýšíme směrodatnou odchylku y. 4

Dvouvýběrový Wilcoxonův test (Mannův-Whitneyův test) 14. Opět se vrátíme k původní otázce, a to, zda se liší IQ u chlapců a dívek. Nyní použijeme dvouvýběrový Wilcoxonův test. (a) Jaký model předpokládáme pro data? (b) Jak zní nulová a alternativní hypotéza? (c) Testová statistika má tvar W n,m = n R i, kde R i je pořadí X i ve sdruženém výběru X 1,..., X n, Y 1,..., Y m. Pro jaké její hodnoty budeme zamítat? (d) Provedeme asymptotickou verzi testu (bez korekce pro spojitost): wilcox.test(iq~fpohlavi, correct = FALSE) Jaký je náš závěr? (e) Přesnou verzi testu bychom zavolali pomocí nastavení exact=true v předchozí funkci. Zkuste. 15. Zkusíme manuální výpočet jednotlivých položek testu. Spočítáme testovou statistiku podle vzorce z přednášky: r=rank(iq) (W1=sum(r[FPohlavi=="divka"])) (W2=sum(r[FPohlavi=="chlapec"])) Dostali jsme stejný výsledek jako funkce wilcox.test? P-hodnotu Wilcoxonova testu bychom dostali pomocí aproximace normálním rozdělením, viz Samostatná práce (iii). 16. Vypočteme Mannovu-Whitneyovu statistiku, která má tvar n m Wn,m = I[X i < Y j ] a v případě, kdy máme v datech shody, tak n m ( Wn,m = I[X i < Y j ] + 1 ) 2 I[X i = Y j ]. j=1 j=1 Výpočet provedeme bud pomocí for cyklu (který je ale obecně v R mnohem pomalejší než maticové výpočty) U1=0;U2=0 for(i in 1:nx) for(j in 1:ny){ U1=U1+I(IQdivky[i]<IQchlapci[j])+1/2*I(IQdivky[i]==IQchlapci[j]) U2=U2+I(IQdivky[i]>IQchlapci[j])+1/2*I(IQdivky[i]==IQchlapci[j]) } U1; U2 5

nebo pomocí matic: x1 <- matrix(rep(iqdivky, ny), ncol = ny) # ve sloupcich IQdivky x2 <- matrix(rep(iqchlapci, nx), ncol = ny, byrow = TRUE) # v radcich IQchlapi (U1 <- sum(x1 < x2) + 0.5 * sum(x1 == x2)) (U2 <- sum(x1 > x2) + 0.5 * sum(x1 == x2)) Vidíme ted nějakou shodu s výstupem funkce wilcox.test? 17. Mezi Wilcoxonovou statistikou a M-W statistikou je jednoznačný vztah známý z přednášky: (nx * ny + 0.5 * nx * (nx + 1) - W1) (nx * ny + 0.5 * ny * (ny + 1) - W2) # U1 # U2 18. V následujících simulacích si porovnáme sílu dnes uvažovaných testů pro několik vybraných situací. Využijeme k tomu funkci simuluj, kterou jsme si načetli spolu s obrázkem K-S testu. Do této funkce zadáme rozsahy uvažovaných výběrů n a m a který z následujících scénářů chceme: normal-posun: X i N(0, 1), Y i N(1, 1), normal-hetero X i N(0, 1), Y i N(0, 3), normal-exp: X i N(0, 1) a Y i = W i 1, kde W i Exp(1), normal-exp2: X i N(0, 1) a Y i = W i log 2, kde W i Exp(1). simuluj(n=10, m=30, scenar="normal-posun") simuluj(n=10, m=30, scenar="normal-hetero") simuluj(n=100, m=300, scenar="normal-hetero") simuluj(n=10, m=30, scenar="normal-exp") simuluj(n=100, m=300, scenar="normal-exp") simuluj(n=10, m=30, scenar="normal-exp2") simuluj(n=100, m=300, scenar="normal-exp2") Spust te si jednotlivé příkazy postupně a zamyslete se, co testujeme a zda generujeme data za nulové hypotézy nebo za alternativy příslušného testu. Co testujeme u Wilcoxonova testu? Samostatná práce (i) Zjistěte, zda mají dívky v osmé třídě lepší známky než chlapci. Vyberte test vhodný pro naše data a interpretujte výsledek. (ii) Zjistěte, zda je rozdíl ve známkách z předchozího bodu větší než 0.5. (iii) V předchozí práci jsme zjistili, že funkce wilcox.test počítá Mannovu-Whitneyovu testovou statistiku a nikoliv Wilcoxonovu. Z přednášky ale víme, že Mannův-Whitneův test je ekvivalentní Wilcoxonově testu. Tudíž bychom měli dostat stejnou p-hodnotu. Spočítáme ji pomocí aproximace normálním rozdělením, kde musíme navíc přidat i korekci pro shody v datech: 6

n1=length(iqdivky) n2=length(iqchlapci) EW=n1*(n1+n2+1)/2 #vypocet korekce rozptylu: t=table(r) kor=sum(t^3-t)/((n1+n2)*(n1+n2-1)) varw.kor=n1*n2*(n1+n2+1-kor)/12 U=(W1-EW)/sqrt(varW.kor) 2*pnorm(-abs(U)) # p-hodnota Dostali jsme nyní stejnou p-hodnotu jako funkce wilcox.test? (iv) Předpokládejme, že máme dva nezávislé výběry X 1,..., X n a Y 1,..., Y n (oba výběry mají stejný počet pozorování), kde X i N(µ 1, σ 2 1) a Y i N(µ 2, σ 2 2). Chceme testovat shodu středních hodnot, tj. H 0 : µ 1 = µ 2. Co když namísto dvouvýběrového t-testu použijeme párový test? Tj. spočteme rozdíly Z i = X i Y i a pak test založíme na testové statistice T n = n Z n S (Z) n, kde S 2(Z) n = 1 n 1 a nulovou hypotézu zamítneme, pokud T n > t n 1 (1 α/2). n (Z i Z n ) 2 (v) Rozdělení testové statistiky Welchova testu je aproximováno pomocí t-rozdělení s ν stupni volnosti, kde ν se určí na základě výběrových rozptylů a počtů pozorování v jednotlivých výběrech. Ověřte, zda R využívá stejný vzorec jako je uvedený ve skriptech v kapitole 6.3. (vi) Zajímá nás, zda v osmé třídě dochází k zlepšení prospěchu oproti sedmé třídě. Jaký test je vhodný pro tuto situaci? Proved te jej a interpretujte závěr. 7