Statistické testování hypotéz II



Podobné dokumenty
PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

Seminář 6 statistické testy

PSY117/454 Statistická analýza dat v psychologii Přednáška 10

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Analýza rozptylu. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Srovnávání více než dvou průměrů

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Seminář 6 statistické testy

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Vymezení důležitých pojmů. nulová hypotéza, alternativní hypotéza testování hypotézy hladina významnosti (alfa) chyba I. druhu, chyba II.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

, Brno Hanuš Vavrčík Základy statistiky ve vědě

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

ADDS cviceni. Pavlina Kuranova

Tomáš Karel LS 2012/2013

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

Neparametrické metody

Testování statistických hypotéz

4ST201 STATISTIKA CVIČENÍ Č. 7

Jednostranné intervaly spolehlivosti

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Statistické metody uţívané při ověřování platnosti hypotéz

Testování hypotéz a měření asociace mezi proměnnými

STATISTICKÉ TESTY VÝZNAMNOSTI

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Tomáš Karel LS 2012/2013

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Stručný úvod do vybraných zredukovaných základů statistické analýzy dat

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Korelace. Komentované řešení pomocí MS Excel

Stav Svobodný Rozvedený Vdovec. Svobodná Rozvedená Vdova 5 8 6

Analýza dat z dotazníkových šetření

STATISTICKÉ TESTY VÝZNAMNOSTI

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

Úvod do analýzy rozptylu

Jednofaktorová analýza rozptylu

KGG/STG Statistika pro geografy

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

Kurz SPSS: Jednoduchá analýza dat. Jiří Šafr

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Testy statistických hypotéz

Korelační a regresní analýza

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

4EK211 Základy ekonometrie

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Jana Vránová, 3. lékařská fakulta UK

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

IBM SPSS Exact Tests. Přesné analýzy malých datových souborů. Nejdůležitější. IBM SPSS Statistics

Pravděpodobnost a aplikovaná statistika

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Cvičení ze statistiky - 9. Filip Děchtěrenko

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Testování hypotéz. 4. přednáška

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Cronbachův koeficient α nová adaptovaná metoda uvedení vlastností položkové analýzy deskriptivní induktivní parametrické

= = 2368

Návod na vypracování semestrálního projektu

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Testování statistických hypotéz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

ANALÝZA DAT V R 5. ZÁKLADNÍ STATISTICKÉ TESTY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

Aplikovaná statistika v R - cvičení 2

ZX510 Pokročilé statistické metody geografického výzkumu. Téma: Měření síly asociace mezi proměnnými (korelační analýza)

Porovnání dvou výběrů

INDUKTIVNÍ STATISTIKA

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

LINEÁRNÍ REGRESE. Lineární regresní model

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Přednáška IX. Analýza rozptylu (ANOVA)

NEPARAMETRICKÉ TESTY

Ranní úvahy o statistice

Ilustrační příklad odhadu LRM v SW Gretl

Transkript:

PSY117/454 Statistická analýza dat v psychologii Přednáška 9 Statistické testování hypotéz II Přehled testů, rozdíly průměrů, velikost účinku, síla testu

Základní výzkumné otázky/hypotézy 1. Stanovení hodnoty parametru v populaci stanovení intervalu spolehlivosti na µ, σ, ρ, b srovnání statistiky s hypotetickou hodnotou konstantou Korelace mezi proměnnými korelace, regrese, chí-kvadrát H 1 : ρ <>0 H 0 : ρ =0 např. Mezi věkem a počtem návštěv lékaře za rok existuje lineární korelace. 2. Rozdíl mezi skupinami/vzorky - populacemi mezi průměry, korelacemi, rozptyly, pravděpodobnostmi, pořadími. lze srovnávat 2 i více skupin-populací např. H 1 : µ 1 µ 2 <>0 H 0 : µ 1 µ 2 =0 např. Muži a ženy se liší v míře úzkostnosti. Rozdíl průměrů lze převést na korelaci a naopak - obecně mluvíme o velikosti efektu/účinku AJ: difference, association, effect size, two-tailed, one-tailed (directional)

Přehledy statistických testů receptář Oseckých třídění podle počtu výběrů(skupin) 1, 2, nebo více úrovně měření alternativní, nominální, pořadová, intervalová typu procedury interval spolehlivosti, test hypotézy, velikost potřebného výběru Hendl kapitola 12 a str. 235 online http://www.graphpad.com/www/book/choose.htm http://www.whichtest.info http://www.socialresearchmethods.net/selstat/ssstart.htm česky: http://meloun.upce.cz/metody/ Sheskin, D.J.: Handbook of parametric and nonparametric statistical procedures. CRC press, 2004. Kanji, G.K.: 100 statistical tests. Sage, 2006.

Co je potřeba znát? Testů v přehledech je mnoho Pro každý je třeba znát účel použití, testovaná hypotéza předpoklady použití (úroveň měření, normalita) interpretace výsledků (sjetiny z počítače) Co je třeba umět (ručně) spočítat? všechny varianty t-testu (z-testu) statistická významnost Pearsonova korelačního koeficientu chí-kvadrát testy

Př.: Testy na rozdíly 2 středních hodnot Intervalová závislá rozdíly průměrů párový test: párový t-test nezávislé skupiny: známý rozptyl v populaci: z-test neznámý rozptyl v populaci: t-test pro nezávislé skupiny varianta pro stejné a nestejné rozptyly mezi skupinami Ordinální závislá rozdíly mediánů, průměrného pořadí párový test: binomický znaménkový test, Wilcoxonovo T (int) nezávislé skupiny: Mann-Whitney U Nominální závislá shoda rozložení párový test: McNemarův test (dichotomie), Bowkerův test symetrie nezávislé skupiny: chí-kvadrát AJ: sign test, chi-square, Wilcoxon T, Mann-Whitney U, paired(-samples) t-test (dependent, repeated measures), one-sample t-test, independent samples t-test

Srovnání 2 nezávislých průměrů: t -test Předpoklady použití... jsou-li výrazně porušeny, volíme raději neparametrický test proměnná je v populaci normálně rozložená - neřeší se, pokud je n 1,n 2 >30 homogenita rozptylů (homoscedascita), pokud n 1 n 2 řeší modifikace t-testu pro nestejné rozptyly (6.2.3) testuje se Levenovým testem (od oka s 12 /s 22 <2) nezávislost pozorování - řeší párový t-test (pro závislé výběry) (6.2.4) H 0 : µ 1 µ 2 = 0 (nebo roven konstantě, nebo >/< 0 či c) a zvolíme α = 1%, 5%, nebo 10% Rozdíl průměrů d má výběrovou chybu s d = {[((n 1 1)s 12 +(n 2 1)s 22 )/(n 1 +n 2 2))]*[1/n 1 +1/n 2 ]} t-rozložení s n 1 +n 2 2 stupni volnosti (ν ) Spočítáme testovou statistiku t = (m 1 m 2 )/s d = d/s d Zjistíme jaká je p (t zjištěná hodnota ) - tabulky, TDIST(t, ν) s 2 pooled Je-li p α, pak H 0 zůstává platná, je-li p < α, H 0 zamítáme (a konstatujeme existenci statisticky významného rozdílu). Spočítáme Cohenovo d a interval spolehlivosti pro rozdíl průměrů.

Příklad: t-test pro nezávislé výběry H: Muži a ženy se liší v míře úzkostnosti. H 0 : δ = µ m µ ž = 0 nasbíraná data: m m =2; m ž = 3; s m =1,5; s ž = 1,6; n m = n ž = 20 H 0 budeme testovat na 5% hladině statistické významnosti, α = 0,05 Předpoklady splněny >> provádíme t-test pro nezávislé výběry (6.2.2) d = m ž m m = 2 3 = -1 s d = {[((20 1)1,5 2 +(20 1)1,6 2 )/(20+20 2))]*[1/20+1/20]}=0,49 rozdíl má t-rozložení s n 1 +n 2 2 = 38 stupni volnosti t = (m 1 m 2 )/s d = -1/0,49 = -2,04 p (t -2,02 ) je při ν = 38 rovna 0,048 (TDIST(2,04;38;2)=0,048) p < α, takže zamítáme H 0. Pokud by H 0 platila, zjištěný rozdíl by byl nepravděpodobný. 95% interval spolehlivosti: 0,025t(38) = TINV(0,05;38) = 2,02 d 2,02*s d < δ < d + 2,02*s d, tj. -1,98 < δ < - 0,02 Cohenovo d = -1 /1,55 =0,65, což je středně velký efekt.

Velikost účinku/efektu Možnost srovnání mezi studiemi zkoumajícími tutéž výzkumnou otázku pomocí různě operacionalizovaných proměnných Možnost srovnání velikosti efektu vyjádřeného různými koeficienty Snadnější interpretace Pro rozdíly středních hodnot Cohenovo d = m 1 m 2 /s pooled ; s pooled = [((n 1 1)s 12 +(n 2 1)s 22 )/(n 1 +n 2 2))] varianta d = m 1 m 2 /s con ; s con = s kontrolní skupiny Pro těsnost vztahu (korelace) r a r 2, R 2, η 2 (eta), ω 2 podíl vysvětleného rozptylu závislé proměnné Indikátory velikosti efektu lze mezi sebou navzájem převádět Cohenovo d na r : r = (d 2 /(d 2 + 4)) r na Cohenovo d : d = 2r / (1 r 2 ) AJ: effect size, Cohen s d, strength of association, explained variance

Síla testu Síla testu (1-β) je pravděpodobnost, že existující rozdíl bude detekován, zjištěn jako statisticky významný. Záleží na skutečné velikosti účinku (δ, ρ ) variabilitě proměnné(ých) s,σ velikosti vzorku n zvoleném riziku chyby I. typu, α : čím nižší je α tím nižší je síla zvoleném testu (parametrické mají vyšší sílu) Obvykle toužíme po co nejvyšší síle testu, cca 0,8 a výše. Bojujeme o ni především velikostí vzorku a kontrolou intervenujících proměnných (snižuje s).

Publikace výsledků testování hypotéz Primárně udáváme velikost efektu, nejlépe intervalem spolehlivosti Sekundárně udáváme výsledek statistického testování udáváme získanou hodnotu p (Sig.) uvádíme i testovou statistiku (i se stupni volnosti) r, t(ν), F (ν 1,ν 2 ), χ 2, M-W U Interpretujeme nejlépe interval spolehlivosti. Výsledek statistického testování interpretujeme vzhledem k použité nulové hypotéze.

Testy normality rozložení Kolmogorov-Smirnov s Lillieforsovou korekcí, Shapiro-Wilk, D Agostino-Pearson a jiné Testují H 0, že rozložení proměnné se neliší od normálního rozložení jsou to jedny z tzv. testů dobré shody (goodness-of-fit tests) testovaná H 0 je shoda; tj. p<α = příliš velká odchylka od normality Jejich užívání je kontroverzní! na malých vzorcích nenormalitu nedetekují (při n=20, 1-β < 0,5) na velkých vzorcích (n > 1000) jsou naopak extrémně přísné t-testy a ANOVA jsou proti narušení normality robustní, takže nám obvykle stačí konstatovat unimodalitu bez extrémního zešikmení pro rozhodování mezi použitím parametrických a neparametrických testů volíme spíše úroveň měření a velikost vzorku AJ: tests of (univariate) normality, goodness-of-fit tests Více: http://www.psy.surrey.ac.uk/cfs/p8.htm, http://www.graphpad.com/library/biostatsspecial/article_197.htm