Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Podobné dokumenty
RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Statistika. Testování hypotéz statistická indukce Neparametrické testy. Roman Biskup

Neparametrické metody

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

Jednofaktorová analýza rozptylu

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

pravděpodobnosti, popisné statistiky

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Úvod do analýzy rozptylu

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Statistické metody uţívané při ověřování platnosti hypotéz

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

NEPARAMETRICKÉ TESTY

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Cvičení 9: Neparametrické úlohy o mediánech

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a aplikovaná statistika

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Neparametrické testy

= = 2368

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Cvičení 12: Binární logistická regrese

ANALÝZA DAT V R 5. ZÁKLADNÍ STATISTICKÉ TESTY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Pravděpodobnost a matematická statistika

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Opakování. Neparametrické testy. Pořadí. Jednovýběrový Wilcoxonův test. t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality

15. T e s t o v á n í h y p o t é z

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Jana Vránová, 3. lékařská fakulta UK

Charakteristika datového souboru

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

KGG/STG Statistika pro geografy

ADDS cviceni. Pavlina Kuranova

Návod na vypracování semestrálního projektu

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

pravděpodobnosti, popisné statistiky

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013

4ST201 STATISTIKA CVIČENÍ Č. 7

Vysoká škola ekonomická v Praze

Pohlédněte si základní charakteristiky polohy jednotlivých veličin pomocí funkce summary.

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

STATISTICKÉ TESTY VÝZNAMNOSTI

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

12. cvičení z PST. 20. prosince 2017

You created this PDF from an application that is not licensed to print to novapdf printer (

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

STATISTICA Téma 7. Testy na základě více než 2 výběrů

PSY117/454 Statistická analýza dat v psychologii Přednáška 10

15. T e s t o v á n í h y p o t é z

Seminář 6 statistické testy

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

INDUKTIVNÍ STATISTIKA

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Plánování experimentu

Testování statistických hypotéz. Obecný postup

Zápočtová práce STATISTIKA I

Testování statistických hypotéz

Aproximace binomického rozdělení normálním

Jednofaktorová analýza rozptylu

7. Analýza rozptylu.

Statistika. Testování hypotéz - statistická indukce Parametrické testy. Roman Biskup

Přednáška IX. Analýza rozptylu (ANOVA)

2 ) 4, Φ 1 (1 0,005)

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Porovnání dvou výběrů

Vybrané partie z biostatistiky

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

4EK211 Základy ekonometrie

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.

1.4 ANOVA. Vliv druhu plodiny na míru napadení houbami Fusarium culmorum a Fusarium graminearum v systému ekologického hospodaření

Kontingenční tabulky, korelační koeficienty

Přednáška X. Testování hypotéz o kvantitativních proměnných

Ing. Michael Rost, Ph.D.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

PRAVDĚPODOBNOST A STATISTIKA

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan

Statistické testování hypotéz II

Seminář 6 statistické testy

Dvouvýběrové a párové testy. Komentované řešení pomocí MS Excel

Protokol č. 1. Tloušťková struktura. Zadání:

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testování statistických hypotéz

Matematika III. 3. prosince Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Transkript:

10. Neparametrické y Mann-Whitney U- Wilcoxonův Znaménkový

Shrnutí statistických ů Typ srovnání Nulová hypotéza Parametrický Neparametrický 1 skupina dat vs. etalon Střední hodnota je rovna hodnotě etalonu. jednovýběrový t- Wilcoxonův ; znaménkový skupiny dat nepárově Obě skupiny hodnot pochází ze stejného rozdělení. nepárový t- Mann-Whitneyův skupiny dat párově Zkoumaný efekt mezi páry hodnot je nulový. Párový t- Wilcoxonův ; znaménkový shoda rozdělení rozdělení dat ve skupině odpovídá teoretickému (vybranému) rozdělení. Shapiro-Wilkův ; Kolmogorovův- Smirnovův ; Lilieforsův χ, dobré shody homoskedasticita (shoda rozptylů) rozptyl obou (všech) skupin je shodný. Levenův více skupin nepárově Zkoumaný efekt mezi skupinami hodnot je nulový. VA Kruskal- Wallisův korelace Neexistuje (příčinná, důsledková) vazba mezi skupinami hodnot. Pearsonův koeficient Spearmanův koeficient; Kendallův koeficient

Shrnutí statistických ů Jsou data normálně rozdělená 1 Kolik je skupin Kolomogorovův- Smirnovův Shapiro-Wilkův Lze použít transformaci log arcsin Parametrické y Kolik je skupin 1 Jsou data párová Jsou data párová Jsou data párová Jsou data párová korelaci Nelze Jednovýběrový t- korelaci Pearsonův kor. koef. Párový t- korelaci Nelze shody Mají skupiny stejný rozptyl Dvouvý běrový t- Levenův F Mann- Whitney U- Sada Pears. kor. koef. shody Mají skupiny stejný rozptyl VA Kruskal - Wallisů v Nelze shod dy Wilcoxonův Spearmanův/ Kendallů v k. k. k. k. shod dy Wilcoxonův korelaci Nelze Mann- Whitney U- korelaci Nelze shody Kuskal- Wallisů v korelaci Nelze

Mann-WhitneyůvU Neparametrická varianta t-u se skoro stejnou silou v případě normálně rozdělených dat. Vždy pro dvě skupiny naměřených hodnot. Předpoklad: Pravděpodobnost že X > Y = pravděpodobnosti, že Y > X. Vypočtená U statistika má přibližně normální rozdělení (pro malé počty jsou hodnoty tabelovány zvlášť). Postup: Hodnoty z obou sad měření se seřadí podle velikosti. Počítá se U statistika pro první nebo druhou sadu (obvykle pro tu s nižšími hodnotami) U 1 je součet počtů hodnot ze sady nižších než jednotlivé prvky sady 1 (postupně se sčítá pro všechny prvky ze sady 1). Alternativní výpočet: R 1 je součet pořadí skupiny 1., J. Kalina

Mann-WhitneyůvU Provede se normalizace: z je normalizovaná statistika m U je průměr statistiky U σ U je směrodatná odchylka statistiky U Vypočtená statistika z se porovná s tabelovanými hodnotami normálního rozdělení resp. pro nižší počty s tabelovanými hodnotami pro Mann- Whitneův U., J. Kalina

Neparametrickáobdoba párového t-u Wilcoxon Jsou vytvořeny diference mezi soubory, nulové jsou vyloučeny, dále je vytvořeno jejich pořadí bez ohledu na znaménko a poté je sečteno pořadí kladných a pořadí záporných rozdílů. Menší ztěchto dvou hodnot je srovnána skritickou hodnotou u a pokud je menší než kritická hodnota u, pak zamítáme hypotézu shody obou souborů hodnot. Pro existuje aproximace na normální rozložení, ale pouze pro velká n>5. t Menší _ suma _ diferencí = n n ( + 1)( n + 1) 4 ( + 1) Před zásahem Po zásahu Změna Absolutní pořadí 6 4 10 n n,5 3-0,5 1,5 4 6,3 5 1,3 6 8,1 9-0,9 5 1,5-0,5 1,5 3,4 4-0,6 3,5 1 1,5 8 1,11 0,89 4,6 4-1,4 7 1 3-9

Wilcoxonův příklad I člověk A B diference pořadí 1 14 138 4 4,5 140 136 4 4,5 3 144 147-3 3 4 144 139 5 7 5 14 143-1 1 6 146 141 5 7 7 149 143 6 9,5 8 150 145 5 7 9 14 136 6 9,5 10 148 146 A.parametr krve před podáním léku B.parametr krve po podání léku W + Σ pořadí kladných rozdílů = 51 W - = 4 W = min(w + ;W - ) = 4 počet párů = n = 10 Pokud je W menší než kritická hodnota u, pak zamítáme hypotézu shody distribučních funkcí obou skupin.

Wilcoxonův příklad II Byla ována nová dieta pro laboratorní krysy, při pokusu byl zjišťován její vliv na různých liniích krys, bylo proto zvoleno párové uspořádání kdy krysy vobou dietách jsou spojeny přes svoji linii, tj. na začátku byly dvojice krys stejné linie, jedna znich byla náhodně přiřazena kdietě, druhá zdvojice pak do druhé diety. 1. nulová hypotéza je, že váha krys není ovlivněna použitou dietou, alternativní, že ovlivnění dietou existuje. spočítáme diference tyto diference jsou nenormální a proto je vhodné využít neparametrický 3. Spočítáme sumu pořadí kladných a záporných diferencí, zde je menší suma záporných diferencí 31 4. výsledkem výpočtu je p>0,05 a tedy nemáme dostatečné důkazy pro zamítnutí nulové hypotézy, nelze říci, že by nová dieta byla efektivnější než stará 5. pro doplnění výsledků je vhodné zjistit také skutečnou velikost rozdílu hmotností ve skupinách, např. ve formě mediánu

Test dobré shody -základní teorie Testuje shodu reálné distribuce hodnot do n skupin s teoretickou distribucí. Předpokladem je, že velikost rozdílu mezi očekávaným a skutečným počtem hodnot v každé skupině je náhodně rozdělená multinomické rozdělení. Součet druhých mocnin relativních rozdílů očekávaného a skutečného počtu hodnot má přibližně χ rozdělení. χ rozdělení pro kladné hodnoty (suma čtverců) se liší podle počtu stupňů volnosti k (počtu skupin) - se zvyšujícím se k přechází v normální rozdělení. χ ( s. v.) = pozorovaná četnost - očekávaná četnost očekávaná četnost n=1 n=6 n= n=1 n=4 n=0

Test dobré shody -základní teorie χ ( s. v.) pozorovaná četnost pozorovaná očekávaná četnost - četnost - = očekávaná četnost + očekávaná četnost očekávaná četnost + 1. jev. jev

Očekávané četnosti V případěplatnosti nulové hypotézy je poměr mezi buňkami jednoho sloupce v různých řádcích nezávislý na výběru tohoto sloupce. V případě platnosti nulové hypotézy je poměr mezi buňkami jednoho řádku v různých sloupcích nezávislý na výběru tohoto řádku. Pokud tyto poměry normalizujeme, získáváme tabulku očekávaných četností. Řádkové a sloupcové součty se touto operací nemění. Pozorované četnosti Ano Ne Σ Ano 0 8 10 Ne 10 54 64 Σ 30 136 166 10 30 / 166 Očekávané četnosti Ano Ne Σ Ano 18,4 83,6 10 Ne 11,6 5,4 64 Σ 30 136 166 M. Cvanová

Test dobré shody -základní teorie Binomické jevy (1/0) χ 1) pozorovaná četnost pozorovaná očekávaná četnost - četnost - = + očekávaná četnost ( očekávaná četnost očekávaná četnost 1 0 Příklad I. jev 1 II. jev 10 000 lidí hází mincí rub: 4 000 případů (R) líc: 6 000 případů (L) Lze výsledek považovat za statisticky významně odlišný (nebo neodlišný) od očekávaného poměru R : L = 1 : 1 χ (1) = ( 4000 5000 ) ( 6000 5000 ) 5000 χ(0,95) + 5000 = 400 Tabulková hodnota: ( ν = 1) = 3,84 (0,95 = 1 α) Rozdíl je vysoce statisticky významný (p << 0,001]

Znaménkový Zjednodušení neparametrického párového Wilcoxonova u. Namísto velikosti rozdílů se počítá pouze jejich orientace (signum). Případy, kde sgn(d) = 0 se z analýzy vylučují. Sečtou se kladné a záporné rozdíly a menší ze součtů je hledaná statistika m. Statistika m se porovná s tabulkovou hodnotou pro danou hladinu pravděpodobnosti: