PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

Podobné dokumenty
Statistické testování hypotéz II

Seminář 6 statistické testy

Seminář 6 statistické testy

Analýza rozptylu. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Srovnávání více než dvou průměrů

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

Jednostranné intervaly spolehlivosti

ADDS cviceni. Pavlina Kuranova

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

ANALÝZA DAT V R 5. ZÁKLADNÍ STATISTICKÉ TESTY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

STATISTICKÉ TESTY VÝZNAMNOSTI

Návod na vypracování semestrálního projektu

Vymezení důležitých pojmů. nulová hypotéza, alternativní hypotéza testování hypotézy hladina významnosti (alfa) chyba I. druhu, chyba II.

PRAVDĚPODOBNOST A STATISTIKA

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Testování statistických hypotéz

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

PSY117/454 Statistická analýza dat v psychologii Přednáška 10

15. T e s t o v á n í h y p o t é z

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Testy statistických hypotéz

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

12. cvičení z PST. 20. prosince 2017

Tomáš Karel LS 2012/2013

Testy. Pavel Provinský. 19. listopadu 2013

4ST201 STATISTIKA CVIČENÍ Č. 7

Pravděpodobnost a aplikovaná statistika

15. T e s t o v á n í h y p o t é z

KGG/STG Statistika pro geografy

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Testování statistických hypotéz

Neparametrické metody

Jednofaktorová analýza rozptylu

Přednáška IX. Analýza rozptylu (ANOVA)

Statistika, Biostatistika pro kombinované studium. Jan Kracík

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Úvod do analýzy rozptylu

Základní statistické metody v rizikovém inženýrství

Korelace. Komentované řešení pomocí MS Excel

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

Statistické metody uţívané při ověřování platnosti hypotéz

5. T e s t o v á n í h y p o t é z

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

ANOVA PSY252 Statistická analýza dat II

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.

KGG/STG Statistika pro geografy

Ing. Michael Rost, Ph.D.

Statistika. Testování hypotéz statistická indukce Neparametrické testy. Roman Biskup

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Příklady na testy hypotéz o parametrech normálního rozdělení

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

STATISTICKÉ TESTY VÝZNAMNOSTI

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Intervaly spolehlivosti

NEPARAMETRICKÉ TESTY

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Tomáš Karel LS 2012/2013

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

Přednáška X. Testování hypotéz o kvantitativních proměnných

= = 2368

4EK211 Základy ekonometrie

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

5EN306 Aplikované kvantitativní metody I

Matematika III. 3. prosince Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Tomáš Karel LS 2012/2013

5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

Cronbachův koeficient α nová adaptovaná metoda uvedení vlastností položkové analýzy deskriptivní induktivní parametrické

LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Transkript:

PSY117/454 Statistická analýza dat v psychologii seminář 9 Statistické testování hypotéz

Základní výzkumné otázky/hypotézy 1. Stanovení hodnoty parametru =stanovení intervalu spolehlivosti na μ, σ, ρ, b 2. Rozdíl mezi skupinami mezi průměry, korelacemi, rozptyly, pravděpodobnostmi, pořadími. např. Muži a ženy se liší v míře úzkostnosti. (oboustranná) např. Muži jsou úzkostnější než ženy. (jednostranná, směrová) 3. Korelace mezi proměnnými korelace, regrese, chí-kvadrát např. Mezi věkem a počtem návštěv lékaře za rok existuje lineární korelace. (oboustranná) např. Mezi věkem a počtem návštěv lékaře za rok existuje pozitivní lineární korelace. (jednostranná) 2. lze převést na 3. a naopak obecně mluvíme o velikosti efektu/účinku AJ: difference, association, effect size, two-tailed, one-tailed (directional)

Přehledy statistických testů receptář Oseckých třídění podle počtu výběrů 1 či 2 úrovně měření alternativní, nominální, intervalová typu procedury interval spolehlivosti, test hypotézy, velikost potřebného výběru Hendl kapitola 12 a str. 235 online http://www.graphpad.com/www/book/choose.htm http://www.whichtest.info/index.html http://www.socialresearchmethods.net/selstat/ssstart.htm česky: http://meloun.upce.cz/metody/

Testy na rozdíly středních hodnot nominální závislá párový test: binomický znaménkový test nezávislé skupiny: chí-kvadrát ordinální závislá párový test: Wilcoxonovo T nezávislé skupiny: Mann-Whitney U intervalová závislá párový test: párový t-test nezávislé skupiny: známý rozptyl v populaci: z-test neznámý rozptyl v populaci: t-test pro nezávislé skupiny varianta pro stejné a nestejné rozptyly mezi skupinami AJ: sign test, chi-square, Wilcoxon T, Mann-Whitney U, paired(-samples) t-test (dependent, repeated measures), onesample t-test, independent samples t-test

t-test (6.2) porovnání 2 průměrů Předpoklady použití proměnná je v populaci normálně rozložená t-testu odchylky od normality příliš nevadí neřeší se homogenita rozptylů (homoscedascita), pokud n 1 n 2 řeší modifikace t-testu pro nestejné rozptyly (6.2.3) homogenita rozptylů se testuje Levenovým testem (od oka s 12 /s 22 <2) nezávislost pozorování řeší párový t-test (pro závislé výběry) (6.2.4) Předpoklady splněny >> provádíme t-test pro nezávislé výběry (6.2.2) Testujeme, zda rozdíl m 1 m 2 = 0 (H 0 ) (nebo roven konstantě, nebo >/< 0 či c) Tento rozdíl má výběrovou chybu s d = {[((n 1 1)s 12 +(n 2 1)s 22 )/(n 1 +n 2 2))]*[1/n 1 +1/n 2 ]} Tento rozdíl má t-rozložení s n 1 +n 2 2 stupni volnosti (ν ) Vytvoříme 100(1-α)% interval spolehlivosti na m 1 m 2 Pokud je 0 (nebo c) v tomto intervalu H 0 zůstává platná, v opačném případě ji zamítáme (a konstatujeme existenci statisticky významného rozdílu). Spočítáme Cohenovo d a uvádíme je spolu výsledky.

příklad: t-test pro nezáv. výb H: Muži a ženy se liší v míře úzkostnosti. H 0 : δ = μ m μ ž =0 nasbíraná data: m m =2; m ž = 3; s m =1,5; s ž = 1,6; n m = n ž = 20 H 0 budeme testovat na 5% hladině statistické významnosti Předpoklady splněny >> provádíme t-test pro nezávislé výběry (6.2.2) d = m ž m m = 2 3 = -1 s d = {[((20 1)1,5 2 +(20 1)1,6 2 )/(20+20 2))]*[1/20+1/20]}=0,49 rozdíl má t-rozložení s n 1 +n 2 2 =38 stupňů volnosti 95% interval spolehlivosti: 0,025t(38) = TINV(0,05;38) = 2,02 d 2,02*s d < δ < d + 2,02*s d, tj. -1,98 < δ <-0,02 Stanovený interval neobsahuje 0, takže H 0 na 5% hladině statistické významnosti zamítáme. Konstatujeme, že nějaký rozdíl tu p-ně je. Alternativně: t= d-0 /s d =-1/0,49=2,04; P (t (38) 2,04)=TDIST(2,04;38;2)=0,048 což je <α Cohenovo d = -1 /1,55 =0,65, což je poměrně velký efekt.

Velikost účinku/efektu Možnost srovnání mezi studiemi zkoumajícími tutéž výzkumnou otázku pomocí různě operacionalizovaných proměnných Možnost srovnání velikosti efektu vyjádřeného různými koeficienty Snadnější interpretace Pro rozdíly středních hodnot Cohenovo d = m 1 m 2 /s pooled ; s pooled = [((n 1 1)s 12 +(n 2 1)s 22 )/(n 1 +n 2 2))] varianta d = m 1 m 2 /s con ; s con = s kontrolní skupiny Pro těsnost vztahu (korelace) r a r 2, R 2, η 2 (eta), ω 2 podíl vysvětleného rozptylu závislé p. Indikátory velikosti efektu lze mezi sebou navzájem převádět d >> r : r = (d 2 /(d 2 + 4)) r >> d : d = 2r/ (1 r 2 ) AJ: effect size, Cohen s d, strength of association, explained variance

Testy normality rozložení Kolmogorov-Smirnov s Lillieforsovou korekcí, Shapiro-Wilks a jiné Testují H, že rozložení proměnné se neliší od normálního rozložení jsou to jedny z tzv. testů dobré shody (goodness-of-fit tests) testovaná H 0 je shoda; tj. p<α znamená příliš velkou odchylku od normality Běžně se nepoužívají na malých vzorcích nenormalitu nedetekují (při n=20, 1-β < 0,5) na velkých vzorcích (n > 1000) jsou naopak extrémně přísné t-testy a ANOVA jsou proti narušení normality robustní, takže nám obvykle stačí konstatovat unimodalitu bez extrémního zešikmení pro rozhodování mezi použitím parametrických a neparametrických testů volíme spíše úroveň měření a výzkumný kontext AJ: tests of (univariate) normality, goodness-of-fit tests

Publikace výsledků testování hypotéz Primárně udáváme velikost efektu, nejlépe intervalem spolehlivosti Sekundárně udáváme výsledek statistického testování udáváme nejlépe přesnou hodnotu p (Sig.) uvádíme i testovou statistiku (i se stupni volnosti) t(df), F (df1,df2), χ 2, M-W U Interpretujeme nejlépe interval spolehlivosti. Výsledek statistického testování interpretujeme vzhledem k použité nulové hypotéze.

3. průběžná umět spočítat 4 varianty t-testu (jednovýběrový, párový, nezávislý se stejnými a s nestejnými rozptyly), práce s t-rozložením v Excelu (fce TDIST, TINV) naučit se přehledy testů: Hendl kapitola 12 a str. 235 obligátní terminologie v rozsahu přednášek 7-9a

Termíny zkoušek 5.6. (ve 14:00) 19.6. 26.6. 3.7. P21 v 16:00 limit 30 míst cca 60 min