Opakování. Neparametrické testy. Pořadí. Jednovýběrový Wilcoxonův test. t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality

Podobné dokumenty
letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Matematická statistika. Testy v. v binomickém. Test pravděpodobnosti. Test homogenity dvou. Neparametrické testy. statistika. Testy v.

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

diskriminaci žen letní semestr = výrok, o jehož pravdivosti chceme rozhodnout tvrzení o populaci, o jehož platnosti rozhodujeme

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Neparametrické metody

ANALÝZA DAT V R 5. ZÁKLADNÍ STATISTICKÉ TESTY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Jednostranné intervaly spolehlivosti

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Statistika. Testování hypotéz statistická indukce Neparametrické testy. Roman Biskup

Jednofaktorová analýza rozptylu

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Cvičení 9: Neparametrické úlohy o mediánech

15. T e s t o v á n í h y p o t é z

5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Příklad datového souboru. Pravděpodobnost vs. statistika. Formální definice. Teorie odhadu

Neparametrické testy

Testování statistických hypotéz. Obecný postup

Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze

Úvod do analýzy rozptylu

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

Testy nezávislosti kardinálních veličin

Mannův-Whitneyův(Wilcoxonův) test pořadová obdoba dvouvýběrového t-testu. Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

KGG/STG Statistika pro geografy

15. T e s t o v á n í h y p o t é z

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Vzorová prezentace do předmětu Statistika

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Testování statistických hypotéz

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

STATISTICKÉ TESTY VÝZNAMNOSTI

NEPARAMETRICKÉ TESTY

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Charakteristika datového souboru

Vybrané partie z biostatistiky

ADDS cviceni. Pavlina Kuranova

Seminář 6 statistické testy

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

2 ) 4, Φ 1 (1 0,005)

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

, Brno Hanuš Vavrčík Základy statistiky ve vědě

Zápočtová práce STATISTIKA I

Testy statistických hypotéz

Pohlédněte si základní charakteristiky polohy jednotlivých veličin pomocí funkce summary.

Ing. Michael Rost, Ph.D.

Vysoká škola ekonomická v Praze

Jednofaktorová analýza rozptylu

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Pravděpodobnost a aplikovaná statistika

5. T e s t o v á n í h y p o t é z

Neparametrické metody v systému STATISTICA

Statistika. Testování hypotéz - statistická indukce Parametrické testy. Roman Biskup

Normální (Gaussovo) rozdělení

KGG/STG Statistika pro geografy

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

= = 2368

4ST201 STATISTIKA CVIČENÍ Č. 7

Stručný úvod do testování statistických hypotéz

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Přednáška IX. Analýza rozptylu (ANOVA)

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Seminář 6 statistické testy

12. cvičení z PST. 20. prosince 2017

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

STATISTICKÉ TESTY VÝZNAMNOSTI

Matematická statistika Zimní semestr

Cvičení ze statistiky - 8. Filip Děchtěrenko

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

Test dobré shody v KONTINGENČNÍCH TABULKÁCH

12. prosince n pro n = n = 30 = S X

Intervalové Odhady Parametrů II Testování Hypotéz

P-value. Alžběta Gardlo, Karel Hron Laboratoř metabolomiky Ústav molekulární a translační medicíny, UPOL a FNOL

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Jana Vránová, 3. lékařská fakulta UK

Normální (Gaussovo) rozdělení

Transkript:

Opakování Opakování: Testy o střední hodnotě normálního rozdělení 1 jednovýběrový t-test 2 párový t-test 3 dvouvýběrový t-test jednovýběrový Wilcoxonův test párový Wilcoxonův test dvouvýběrový Wilcoxonův test t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality není nutné specifikovat přesný typ rozdělení často jsou založeny na tzv. pořadích tzv. pořadové testy obecnější hypotézy rovnost mediánů, shoda celých rozdělení apod. v případě normálního rozdělení menší síla ve srovnání s t-testy Matematická statistika Šárka Hudecová 1/ 21 Matematická statistika Šárka Hudecová 2/ 21 Pořadí pozorování Y 1,..., Y n ze spojitého rozdělení uspořádaný výběr (varianční řada) Y (1)... Y (n) hodnoty uspořádané dle velikosti od minima po maximum pořadí: R 1,..., R n R i kterém místě v uspořádaném výběru veličina Y i stojí (v případě shod se berou průměry z odpovídajících pořadí) máme hodnoty 7,, 5, 13, 2 uspořádaný výběr 2,, 5, 7, 13 pořadí, 2, 3, 5, 1 Matematická statistika Šárka Hudecová 3/ 21 Situace: X 1,... X n výběr ze spojitého rozdělení symetrického kolem bodu a (tj. a = m X medián X ), chceme testovat Postup H 0 : m X = m 0, proti H 1 : m X m 0 vyloučíme případy X i = m 0 (a dle toho upravíme n) definujeme Y i = X i m 0 uspořádáme Y i dle velikosti pořadí Y i za H 0 by součty pro kladná a záporná Y i měly být srovnatelné (je-li např. součet pro kladná Y i výrazně větší než pro záporná svědčí to pro m X > m 0 ) Matematická statistika Šárka Hudecová / 21

Přesný test: testová statistika: W součet pořadí pro Y i > 0 W = i:y i >0 nulovou hypotézu zamítáme pro velké nebo malé hodnoty W kritické hodnoty statistický software Asymptotický test: testová statistika W n(n+1) n(n+1)(2n+1) za H 0 má Z přibližně N(0, 1) rozdělení H 0 zamítáme, pokud Z > u 1 α/2 Jednostranné alternativy H 0 : m X = m 0 vs. H 1 : m X > m 0 zamítáme pro velké hodnoty W, tj. pro velké Z Z > u 1 α H 0 : m X = m 0 vs. H 1 : m X < m 0 zamítáme pro malé hodnoty W, tj. pro malé Z Z < u 1 α Matematická statistika Šárka Hudecová 5/ 21 Matematická statistika Šárka Hudecová 6/ 21 Poznámky pivo k zamítnutí H 0 může vést také výraznější porušení předpokladu symetrie (přestože třeba m X = m 0 ) v případě výskytu shod X i = m 0 lze korekce ve jmenovateli pro Z řada programů počítá s korekcí pro spojitost (korekce asymptotického testu pro konečné n) Provádíme průzkum, jaký skutečný objem piva točí v nejmenované hospodě. Zakoupeno bylo 10 piv a jejich objem byl (v litrech): 0.510, 0.62, 0.91, 0.66, 0.61, 0.503, 0.95, 0.88, 0.512, 0.505. Chceme otestovat, zda hostinský netočí pod míru. Použijeme popsaný postup: X i 0.51 0.62 0.91 0.66 0.61 0.503 0.95 0.88 0.512 0.505 Y i 0.01-0.038-0.009-0.03-0.039 0.003-0.005-0.012 0.012 0.005 Y i 0.01 0.038 0.009 0.03 0.039 0.003 0.005 0.012 0.012 0.005 5 9 8 10 1 2.5 6.5 6.5 2.5 W = 5 + 1 + 6.5 + 2.5 = 15 Matematická statistika Šárka Hudecová 7/ 21 Matematická statistika Šárka Hudecová 8/ 21

řešení W = 5 + 1 + 6.5 + 2.5 = 15 testová statistika: 1.27, tj. Z > u 0.95 = 1.65 nelze zamítnou H 0 Provedení v programu R: > wilcox.test(x,mu=0.5,alternative= less, exact=f,corr=f) Wilcoxon signed rank test data: pivo V = 15, p-value = 0.101 alternative hypothesis: true location is less than 0.5 Situace: Párová pozorování (X 1, Y 1 ),..., (X n, Y n ), zajímá nás, zda jsou veličiny X a Y co do polohy stejné Postup na každém subjektu měříme dvě veličiny jejich porovnání příklady: věk rodičů, síla stisku levé a pravé ruky, hmotnost před a po dietě,... zavedeme Z i = X i Y i budeme chtít testovat, zda Z i kolísají kolem nuly, tj. zda m 0 problém převeden na jednovýběrový případ (analogie párového t-testu, ale teď bez normality) Matematická statistika Šárka Hudecová 9/ 21 Matematická statistika Šárka Hudecová 10/ 21 mají-li Z 1,..., Z n normální rozdělení t-test porušení normality jednovýběrový Wilcoxonův test předpoklad: Z 1,..., Z n spojité symetrické rozdělení Postup: vyloučíme případy Z i = 0 určíme pořadí absolutních hodnot Z i W součet pořadí, kde Z i > 0 (asymptotická) testová statistika W n(n+1) n(n+1)(2n+1) porovnání dvou metod učení nazpaměť Porovnání dvou metod učení (poslouchání vs. čtení). studie zahrnující 9 osob pozorování (X i, Y i ) chceme vědět, zda je mezi oběma způsoby rozdíl i 1 2 3 5 6 7 8 9 X i 90 86 72 65 52 6 38 3 Y i 85 87 70 62 53 2 35 6 H 0 : rozdělení X a Y je stejné za H 0 má Z přibližně N(0, 1) rozdělení Matematická statistika Šárka Hudecová 11/ 21 Matematická statistika Šárka Hudecová 12/ 21

pokrač. zavedeme rozdíly Z i = X i Y i předpoklad symetrie H 0 : m 0 i 1 2 3 5 6 7 8 9 Z i 5-1 2 3 0-1 3-3 Z i 5 1 2 3 1 3 3 8 1.5 3 5 1.5 7 5 5 W = 8 + 3 + 5 + 7 + 5 = 28 W n(n+1) n(n+1)(2n+1) = 28 8 9 8 9 17 = 1. test: Z < u 0.975 = 1.96 nelze zamítnout H 0 Matematická statistika Šárka Hudecová 13/ 21 Situace: dva nezávislé náhodné výběry X 1,..., X n a Y 1,..., Y m, oba ze spojitého rozdělení, chceme testovat (tj. i mediány se rovnají) Postup H 0 : rozdělení X a Y jsou stejná uděláme společný (tzv. sdružený) výběr X 1,..., X n, Y 1,..., Y m a uspořádáme jej podle velikosti za H 0 jsou výběry X a Y dobře promíchané určíme pořadí v rámci spojeného výběru za H 0 by se průměrná pořadí X a Y neměla velmi lišit Matematická statistika Šárka Hudecová 1/ 21 Poznámky vezmeme W součet pořadí X 1,..., X n proti H 0 svědčí velmi velké a velmi malé hodnoty W přesný test založený na W (software, tabulky) asymptotický test: testová statistika: W n(n+m+1) 2 nm(n+m+1) 12 má za H 0 přibližně N(0, 1) rozdělení Test: hypotézu H 0 o shodě rozdělení zamítneme, pokud test se někdy nazývá Mannův-Whitneyův test obecně formulovaná hypotéza: test citlivý zejména vůči posunutí, méně citlivý na nestejný rozptyl při větším počtu shod X i a Y i korekce ve jmenovateli Z (software provádí) Z > u 1 α/2 lze uvažovat i jednostranné alternativy Matematická statistika Šárka Hudecová 15/ 21 Matematická statistika Šárka Hudecová 16/ 21

výnos pšenice grafické znázornění dat Vliv nového způsobu hnojení na výnos pšenice: 13 polí stejné kvality 8 nový způsob, 5 ošetřeno standardně měřeny výnosy v tunách na hektar X i nový způsob: 5.7, 5.5,.3, 5.9, 5.2, 5.6, 5.8, 5.1 Y i standardní hnojivo: 5.0,.5,.2, 5.,. Chceme testovat: H 0 : způsob hnojení nemá vliv na výnos pšenice Vynos psenice [t/ha].5 5.0 5.5 Matematická statistika Šárka Hudecová 17/ 21 novy tradicni Matematická statistika Šárka Hudecová 18/ 21 Zpusob řešení Řešení v programu R Použijeme popsaný postup:.20.30.0.50 5.00 5.10 5.20 5.0 5.50 5.60 5.70 5.80 5.90 1 2 3 5 6 7 8 9 10 11 12 13 W = 2 + 6 + 7 + 9 + 10 + 11 + 12 + 13 = 70 testová statistika 70 8(5+8+1) 2 5 8 (5+8+1) 12 Z > z 0.975 = 1.960 zamítáme H 0 = 2.050 R počítá W pořadí Y, zde W = 21 uvádí Mannovu-Whitneyovu statistiku U = mn + 1 m(m + 1) W 2 pak U udává počet případů, kdy X i > Y j > wilcox.test(x,y,correct=f,exact=f) Wilcoxon rank sum test data: x and y W = 3, p-value = 0.002 alternative hypothesis: true location shift is not equal to 0 Matematická statistika Šárka Hudecová 19/ 21 Matematická statistika Šárka Hudecová 20/ 21

Shrnutí normální rozdělení spojité rozdělení jeden výběr jednovýběrový t-test jednovýběrový Wilcoxon párová pozorování párový t-test párový Wilcoxon dva nezávislé dvouvýběrový t-test dvouvýběrový Wilcoxon výběry Matematická statistika Šárka Hudecová 21/ 21