Neparametrické testy

Podobné dokumenty
Neparametrické metody

Testy statistických hypotéz

Testování statistických hypotéz

Stručný úvod do testování statistických hypotéz

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Testování statistických hypotéz. Obecný postup

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

15. T e s t o v á n í h y p o t é z

Regresní a korelační analýza

4ST201 STATISTIKA CVIČENÍ Č. 7

STATISTICKÉ TESTY VÝZNAMNOSTI

Testování hypotéz. 4. přednáška

Statistika. Testování hypotéz statistická indukce Neparametrické testy. Roman Biskup

KGG/STG Statistika pro geografy

Charakteristika datového souboru

Opakování. Neparametrické testy. Pořadí. Jednovýběrový Wilcoxonův test. t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality

, Brno Hanuš Vavrčík Základy statistiky ve vědě

12. cvičení z PST. 20. prosince 2017

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

Regresní a korelační analýza

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Zápočtová práce STATISTIKA I

KGG/STG Statistika pro geografy

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

INDUKTIVNÍ STATISTIKA

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Průzkumová analýza dat

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Ing. Michael Rost, Ph.D.

NEPARAMETRICKÉ TESTY

STATISTICKÉ TESTY VÝZNAMNOSTI

15. T e s t o v á n í h y p o t é z

MATEMATIKA III V PŘÍKLADECH

Statistická analýza jednorozměrných dat

Testování hypotéz o parametrech regresního modelu

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Testování hypotéz o parametrech regresního modelu

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Jednostranné intervaly spolehlivosti

Úvod do analýzy rozptylu

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Pravděpodobnost a aplikovaná statistika

5. T e s t o v á n í h y p o t é z

You created this PDF from an application that is not licensed to print to novapdf printer (

Jana Vránová, 3. lékařská fakulta UK

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

Stručný úvod do vybraných zredukovaných základů statistické analýzy dat

Návrhy dalších možností statistického zpracování aktualizovaných dat

= = 2368

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Statistické metody uţívané při ověřování platnosti hypotéz

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Statistická analýza jednorozměrných dat

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Vybrané partie z biostatistiky

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

STATISTICKÉ CHARAKTERISTIKY

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Statistické vyhodnocení průzkumu funkční gramotnosti žáků 4. ročníku ZŠ

Přednáška IX. Analýza rozptylu (ANOVA)

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

2 ) 4, Φ 1 (1 0,005)

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

5 Parametrické testy hypotéz

Příklady na testy hypotéz o parametrech normálního rozdělení

Kontingenční tabulky, korelační koeficienty

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

7. Analýza rozptylu.

TECHNICKÁ UNIVERZITA V LIBERCI

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

TECHNICKÁ UNIVERZITA V LIBERCI

Testy. Pavel Provinský. 19. listopadu 2013

P-value. Alžběta Gardlo, Karel Hron Laboratoř metabolomiky Ústav molekulární a translační medicíny, UPOL a FNOL

Normální rozložení a odvozená rozložení

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

Aplikovaná statistika v R - cvičení 2

Vysoká škola ekonomická v Praze

Jednofaktorová analýza rozptylu

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

Pravděpodobnost a matematická statistika

Transkript:

Neparametrické testy Dosud jsme se zabývali statistickými metodami, které zahrnovaly předpoklady o rozdělení dat. Zpravidla jsme předpokládali normální (Gaussovo) rozdělení. Například: Grubbsův test odlehlých hodnot zjišťuje o kolik směrodatných odchylek se liší extrémní hodnota od průměru test střední hodnoty zjišťuje o kolik směrodatných odchylek se liší průměr od očekávané hodnoty Metody, které předpokládají, že známe parametry rozdělení nazýváme parametrické. Neparametrické metody nepředpokládají konkrétní typ rozdělení. Neparametrické metody nejsou tak silné jako parametrické.

Neparametrické testy m = 6,0 s = 1,0 N = 20 m = 6,0 s = 1,0 N = 20

Grubbsův test odlehlých hodnot! parametrický! Jako míra odlehlosti hodnoty slouží její vzdálenost testované hodnoty od aritmetického průměru výběru dat, vztažená ke směrodatné odchylce (NE výběrové, ale směrodatné odchylce celého uvažovaného souboru). Testovací kritérium: T = x i ^μ S N,kde S = 1 N i=1 (x i ^μ) 2 Je-li testovací kritérium T větší než kritická hodnota T N,a, vyloučíme testovanou hodnotu ze souboru. N 3 4 5 7 10 15 20 30 50 70 100 200 T N,0,05 (Budíková et al.,2010) Kritické hodnoty Grubbsova T-rozdělení (pro a = 0,05 a 0,01) 1,15 1,48 1,72 2,02 2,29 2,55 2,71 2,91 3,13 3,26 3,38 3,61 T N,0,01 1,15 1,49 1,76 2,14 2,48 2,81 3,00 3,24 3,48 3,62 3,75 3,98 Budíková, M., Králová, M., Maroš, B. (2010). Průvodce základními statstckými metodami. Praha: GRADA

Deanův-Dixonův Q-test odlehlých hodnot : Nejmenší, resp. největší hodnota z výběru není odlehlá. H 1 : Nejmenší, resp. největší hodnota z výběru je odlehlá. Testovací statistika: Q= x 2 x 1 x N x 1 pro nejmenší hodnoty Q= x N x N 1 x N x 1 pro největší hodnoty Kritický obor: Q > Q N,a Kritické hodnoty Deanova-Dixonova Q-rozdělení (a = 0,05 a 0,01) (Verna, Suarez 2014) N 5 10 15 20 25 30 40 50 60 70 100 Q N,0.05 0,642 0,412 0,339 0,300 0,276 0,259 0,236 0,221 0,210 0,202 0,185 Q N,0.01 0,781 0,526 0,438 0,392 0,363 0,342 0,314 0,296 0,282 0,272 0,250 Verna, M.P., Suarez, M. C. (2014). DixonTest.CritcalValues: A Computer Code to Calculate Critcal Values for the Dixon Statstcal Data Treatment Approach. Journal of Statstcal Softare 5a7 (2).. Dostupné z htp://www.jstatsof.org/v57/i02/paper.

Pořadí Pořadí R i udává počet čísel x 1, x 2,..., x N, která jsou menší nebo rovna číslu x i. Jsou-li všechna čísla různá a seřazená podle velikosti, odpovídá pořadí indexu. R i = i. Pokud je několik čísel x 1, x 2,..., x N stejných přiřadíme jim průměrné pořadí. Vzestupně uspořádané hodnoty -2-2 1 8 8 8 22 Index 1 2 3 4 5 6 7 Pořadí R i 1.5 1.5 3 5 5 5 7

Mediánový test Mediánový test je neparametrickou alternativou testu střední hodnoty (střední hodnota výběru se rovná nějaké konstantě). : Medián souboru je roven konstantě c. Označíme-li N rozsah výběru a m počet hodnot menších než c, testovací kritérium vypočítané podle vztahu Z= 2 m N N má normální rozdělení se střední hodnotou 0 a směrodatnou odchylkou 1, je-li počet hodnot větší než 30. Kritická hodnota: =NORM.S.INV(1 - a/2) {NORMSINV} Je-li testovací kritérium větší než kritická hodnota, nulovou hypotézu zamítáme.

Znaménkový test Znaménkový test je neparametrickou alternativou párového testu a variantou mediánového testu. Testujeme u párových rozdílů jestli je medián nulový (tj. počet kladných a záporných hodnot stejný) : Medián souboru je roven nule. resp. Počet kladných a záporných rozdílů je stejný. Označíme-li N rozsah výběru a m počet hodnot menších než 0 je testovací kritérium Z= 2 m N N Kritickou hodnotu počítáme stejně jako u mediánového testu. Poznámky: Pokud jsou některé rozdíly nulové, vyřadíme je. Je-li počet hodnot menší než 30, hledáme kritické hodnoty testu ve speciálních tabulkách.

Mann-Whitneyův pořadový test Mann-Whitneyův pořadový test je neparametrickou analogií testu rovnosti dvou středních hodnot. : Dva soubory, ze kterých jsou výběry, mají stejný medián. Seřadíme spojená data obou výběrů podle velikosti a každé hodnotě přiřadíme pořadí. Sečteme pořadí obou výběrů - ozn. W 1 a W 2. Testovací kritérium: Z= W 1 N 1 (N 1 +N 2 +1)/2 N 1 N 2 (N 1 +N 2 +1)/12 kde N 1 je počet hodnot prvního výběru a N 2 počet hodnot druhého výběru, má normální rozdělení se střední hodnotou 0 a směrodatnou odchylkou 1. Kritická hodnota: =NORM.S.INV(1 a/2) {NORMSINV} Je-li testovací kritérium větší než kritická hodnota, nulovou hypotézu zamítáme.

Spearmanův (pořadový) korelační koeficient V případě, že nejsou splněny podmínky pro Pearsonův korelační koeficient (např. když testované veličiny nemají normální rozdělení nebo obsahují odlehlé hodnoty, popř. když pracujeme s kvalitativními veličinami) používáme Spearmanův korelační koeficient. Místo hodnot x a y použijeme pořadí každé i x a i y, kde i x je pořadí dané hodnoty x mezi všemi hodnotami x, podobně i y. r s =1 : r s = 0 Testuje stejně jako u Pearsonova korelačního koeficientu pomocí testovacího kritéria t= r N 2 1 r 2 Kritický obor: t > t 1-α (N-2), kde t 1-α (N-2) jsou kvantily Studentova rozdělení, které lze spočítat pomocí funkce N 6 i=1 =T.INV.2T(α,N-2). (i x i y ) 2 N (N 2 1)