NEPARAMETRICKÉ TESTY

Podobné dokumenty
PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.

Cvičení 9: Neparametrické úlohy o mediánech

= = 2368

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

4ST201 STATISTIKA CVIČENÍ Č. 7

Jednostranné intervaly spolehlivosti

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Neparametrické metody

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

KGG/STG Statistika pro geografy

Jednofaktorová analýza rozptylu

Testování hypotéz. 4. přednáška

2 ) 4, Φ 1 (1 0,005)

STATISTICKÉ TESTY VÝZNAMNOSTI

STATISTICKÉ TESTY VÝZNAMNOSTI

Vybrané partie z biostatistiky

Vzorová prezentace do předmětu Statistika

STATISTICA Téma 7. Testy na základě více než 2 výběrů

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

KORELACE. Komentované řešení pomocí programu Statistica

Návod na vypracování semestrálního projektu

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

Řešení: máme diskrétní N.V. vzdělání bez maturity, s maturitou, vysokoškoláci, PhD.

Opakování. Neparametrické testy. Pořadí. Jednovýběrový Wilcoxonův test. t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality

ANALÝZA DAT V R 5. ZÁKLADNÍ STATISTICKÉ TESTY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

12. cvičení z PST. 20. prosince 2017

Neparametrické testy

ADDS cviceni. Pavlina Kuranova

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

Úvod do analýzy rozptylu

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Korelace. Komentované řešení pomocí MS Excel

, Brno Hanuš Vavrčík Základy statistiky ve vědě

Tabulka 1. Výběr z datové tabulky

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

You created this PDF from an application that is not licensed to print to novapdf printer (

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Vysoká škola ekonomická v Praze

Seminář 6 statistické testy

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

15. T e s t o v á n í h y p o t é z

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Statistika. Testování hypotéz statistická indukce Neparametrické testy. Roman Biskup

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

KGG/STG Statistika pro geografy

15. T e s t o v á n í h y p o t é z

Cvičení 12: Binární logistická regrese

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Cvičení ze statistiky - 9. Filip Děchtěrenko

5 Parametrické testy hypotéz

4. Na listu Znaménkový test ověřte účinnost pohlcovačů pachů v páchnoucích bytech. 5. Na listu Znaménkový test se pokuste zjistit, zda je některý z

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Téma 9: Vícenásobná regrese

PRAVDĚPODOBNOST A STATISTIKA

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

MATEMATIKA III V PŘÍKLADECH

Ilustrační příklad odhadu LRM v SW Gretl

Statistické testování hypotéz II

Semestrální projekt spočívá v nalezení vhodného datového souboru a jeho statistické analýze s využitím metod probíraných v rámci předmětu.

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování statistických hypotéz

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

diskriminaci žen letní semestr = výrok, o jehož pravdivosti chceme rozhodnout tvrzení o populaci, o jehož platnosti rozhodujeme

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

KONTINGENČNÍ TABULKY Komentované řešení pomocí programu Statistica

KGG/STG Statistika pro geografy

Statistické metody uţívané při ověřování platnosti hypotéz

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Testy. Pavel Provinský. 19. listopadu 2013

Jednofaktorová analýza rozptylu

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

5. T e s t o v á n í h y p o t é z

Tvar dat a nástroj přeskupování

Neparametrické metody v systému STATISTICA

Pozn. přeskakuji zde popisnou statistiku, jinak by měla být součástí každé analýzy.

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Dvouvýběrové a párové testy. Komentované řešení pomocí MS Excel

Transkript:

NEPARAMETRICKÉ TESTY Neparametrický jednovýběrový Jeden výběr jehož medián srovnáváme s nějakou hodnotou Wilcoxonův jednovýběrový test 1) Máme data z družice Hipparcos pro deklinaci (obdoba zeměpisné šířky) pro pozici 2717 hvězd. Chceme testovat na hladině statistické významnosti 0,05, střední hodnota této deklinace je -47. (dataset hip DE.sta) H0: Medián deklinace je roven -47. (x ~ =-47) H1: Medián deklinace je staticky významně odlišný -47. (x ~ -47) Krok A) Testování normality našeho výběru p menší jak 0,05 -> Neparametrický test (Jinak by se dal použít parametrický) Krok B) STATISTICA nám neumožňuje uskutečnit jednovýběrový Wilcoxonův test přímo. Ale pokud si uvědomíme, že se jedná vlastně o modifikaci párového testu, kde mediánem druhého výběru je právě číslo, s kterým srovnáváme medián našeho výběru, pak jsme schopni tento příklad vypočítat. Z H0 se tak stává ( ~ x1- ~ x 2 =0, kde ~ x 2 =-47). Druhý výběr tak vytvoříme jednoduše tak, že vypočteme novou proměnnou jejíž všechny prvky budou rovny 47.

Krok C) Výpočet testové statistiky Statistiky -> Neparametrická statistika -> Porovnání dvou závislých vzorků -> OK Jako proměnné vybereme naše dvě proměnné (Deklinace a referenční hodnota) a dáně Wilcoxonův párový test Z výsledků vidíme, že p-hodnota je menší než 0,05 nulovou hypotézu o rovnosti mediánu našeho výběru k hodnotě -47 tedy zamítáme.

2) V různých částech České republiky bylo zjištěno procentuální zastoupení kuřáků nad 60 let. Zjistěte, zda je celkem v těchto regionech České republiky zastoupení kuřáků nad 60 let rovno 12 procentům. (populace_nad_60.sta) Pokud se podíváte na normalitu těchto dat pak zjistíte, že p-hodnota S-W testu je 0,07, což sice nezamítá nulovou hypotézu o normalitě, ale z důvodu malého vzorku a téměř dosažené hranice pro zamítnutí hypotézy by bylo vhodnější použít NEPARAMETRICKÝ test. [p-hodnota 0,0499, Zamítáme nulovou hypotézu rovnosti mediánu našeho výběru a předpokládané hodnoty 12%] 3 ) Byl sledován zisk (v 1000 kč) jedné společnosti v 44 týdnech. Zjistěte zda byla střední hodnota zisku za tuto dobu rovna 175 000. (zisk.sta) Opět normalita vychází, ale těsně nad hranici zamítnutí. (Opět lepší použít NEPARAMETRICKÝ test) [p-hodnota menší jak 0,001, Zamítáme nulovou hypotézu rovnosti střední hodnoty zisku našeho výběru a předpokládané hodnoty 175]

NEPARAMETRICKÝ NEPÁROVÝ TEST Srovnáváme hodnoty mediánů dvou na sebe nezávislých výběrů. Alespoň jeden výběr nemá splněný předpoklad normality dat. 1) Testujte na hladině statistické významnosti 0,05 rovnost šířky okvětních lístků u kosatců Setosy a Versicol. (kosatce.sta) H0: Šířky okvětních lístků u Setosy a Versicolor jsou stejné. ( ~ x 1= ~ x 2) H1: Šířky okvětních lístků u Setosy a Versicolor jsou odlišné. ( ~ x1 ~ x 2) Krok A ) Data máme ve tvaru, kdy naměřené hodnoty šířky okvětních lístků máme rozděleny dle skupinové proměnné IRISTYPE. To znamená, že při testování normality jednotlivých výběrů musíme zapnout Analyzování dle skupin. (viz parametrické testy-dvouvýběrový nepárový t-test) Oba výběry nemají normální rozdělení (normalita počítána Statistiky- >základní statistiky->tabulky četností->záložka Normalita(Lilliefors a Shapiro- Wilk)) Krok B) Výpočet statistiky Statistiky->Neparametrické statistiky -> Porovnání

dvou nezávislých vzorků (skupiny)->ok V případě, že by vstupní data byla ve formátu, že hodnoty okvětních lístků pro Setosu a Versicolor byly jednotlivé proměnné, pak si je musíme upravit do podoby jakou máme zde tedy vytvořit skupinovou proměnnou Vybereme proměnné

A vybereme Mann-Whitneyův U test Výsledná tabulka: Nyní se na základě velikosti vzorku (v tomto případě n=100) rozhodneme jakou p-hodnotu použijeme. Pokud je n>30 pak používáme asymptotickou p- hodnotu, pokud je n menší jak 30 pak používáme přesnou hodnotu. Z výsledků je patrné, že zamítáme nulovou hypotézu.

2) Máme dvě odrůdy brambor a sledujeme jejich výnosnost na různých místech. Testujte na hladině významnosti 0,05, že výnosnost obou odrůd je stejná.(odrudy.sta) - potřeba si vytvořit jednu skupinovou proměnnou a všechny výnosnosti dát pod sebe vzniknou tak dvě proměnné o 18 případech [p 0,161, nezamítáme nulovou hypotézu o stejné výnosnosti jednotlivých odrůd brambor.] 3) Máme dva typy kreditních karet Visa a M/E kartu. Na hladině významnosti 0,05 testujte, zda se v různých městech provede stejný počet plateb pomocí těchto dvou typů karet (počty v 1000) (kreditni_karty.sta). Pozn. - Pokud provedeme test normality tak vyjdou oba výběry normální, nicméně u jednoho vyjde p-hodnota blízká 0,05 (0,07) a z důvodu menšího n, bych doporučil dělat neparametrický test. [p=0,252, Nezamítáme nulovou hypotézu o stejném používání M/E karty a Visa karty]

Neparametrický párový test Testujeme, že se závislé proměnné neliší před a po nějaké události, popřípadě jiným způsobem měření. Párovost lze zjistit pomocí korelací, viz. Parametrické párové testy. 1) Máme dvě měření křehkosti ocele (před zpracováním a po něm). Zjistěte, zda se statisticky významně liší. (ocel.sta) Krok A) vytvoříme proměnnou diference obou měření Zjistíme normalitu rozdílu před a po zpracování dat viz. Parametrické párové testy. (p=0,03 zamítáme normalitu diference dat)

Krok B) Testování Statistiky->Neparametrické statistiky ->OK Vybereme proměnné a zvolíme Wilcoxonův párový test (větší síla spíše na symetrická data..dá se posoudit dle tvaru histogramu) nebo Znaménkový test (menší síla testu) v podstatě je na Vás jaký použijete zde použijeme Wilcoxonův test Výsledná tabulka: Dle p-hodnoty vidíme, že zamítáme nulovou hypotézu o stejné křehkosti ocele před zpracováním a po něm.

2) Máme k dispozici nějakou hladinu jistého parametru v krvi (např. kreatininu)před operací a po operaci. Zjistěte zda se na hladině statistické významnosti 0,05 tyto dvě hladiny liší. (parametr_krve.sta) [p- 0,017, Zamítáme nulovou hypotézu o rovnosti obsahu tohoto parametru v krvi před a po operaci] 3) Naměřili jsme hodnoty diet u jednotlivých druhů krys. Testujte, zda se jednotlivé diety liší (efektivita diety pro krysy.sta) -Normalita p=0,09 (Zde se asi dají použít oba druhy testů, jak parametrický tak neparametrický ze cvičných důvodů použijeme neparametrický) [p=0,056, Nezamítáme nulovou hypotézu o rovnosti jednotlivých typů diety.]