Seminář 6 statistické testy

Podobné dokumenty
Seminář 6 statistické testy

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Vymezení důležitých pojmů. nulová hypotéza, alternativní hypotéza testování hypotézy hladina významnosti (alfa) chyba I. druhu, chyba II.

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

Jste aktivní sportovec?(pravidelně sportuji alespoň 2x týdně) Jakým sportovním činnostem se pravidelně věnujete? (alespoň 1 x za dva týdny v sezóně)

LEKCE 6 ZÁKLADY TESTOVÁNÍ HYPOTÉZ

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Analýza dat z dotazníkových šetření

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

ADDS cviceni. Pavlina Kuranova

Statistické testování hypotéz II

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Příloha 1 Úvodní text k dotazníku

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

PŘÍLOHA 2. Těším se na spolupráci, Olga Kučerová (studentka psychologie, PedF Cuni)

PSY117/454 Statistická analýza dat v psychologii Přednáška 10

Matematická statistika. Testy v. v binomickém. Test pravděpodobnosti. Test homogenity dvou. Neparametrické testy. statistika. Testy v.

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

Stav Svobodný Rozvedený Vdovec. Svobodná Rozvedená Vdova 5 8 6

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

ÚKOL ,77 5,00 5 2,531,003,056 -,869,113

Opakování: Nominální proměnná více hodnotová odpověď.

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.

diskriminaci žen letní semestr = výrok, o jehož pravdivosti chceme rozhodnout tvrzení o populaci, o jehož platnosti rozhodujeme

LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR

Opakování. Neparametrické testy. Pořadí. Jednovýběrový Wilcoxonův test. t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality

Testování uživatelského rozhraní

ANALÝZA DAT V R 5. ZÁKLADNÍ STATISTICKÉ TESTY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

You created this PDF from an application that is not licensed to print to novapdf printer (

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

NEPARAMETRICKÉ TESTY

Metodologie pro Informační studia a knihovnictví 2

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Uni- and multi-dimensional parametric tests for comparison of sample results

ADDS cvičení 7. Pavlína Kuráňová

A7B39TUR Úloha B Kvantitativní testování ZS 2013/2014 Software MS Office Word a Open Office Writer

Tomáš Karel LS 2012/2013

6 TESTY HYPOTÉZ NEPARAMETRICKÉ TESTY

4ST201 STATISTIKA CVIČENÍ Č. 7

Analýza rozptylu. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Srovnávání více než dvou průměrů

Pozn. přeskakuji zde popisnou statistiku, jinak by měla být součástí každé analýzy.

Testy. Pavel Provinský. 19. listopadu 2013

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Opakování: Nominální proměnná více hodnotová odpověď.

Jednostranné intervaly spolehlivosti

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

Testy nezávislosti kardinálních veličin

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

Příklad: Test nezávislosti kategoriálních znaků

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

= = 2368

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

Design Experimentu a Statistika - AGA46E

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Statistická analýza dat

Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze

LEKCE 7 ZÁKLADY BIVARIAČNÍ ANALÝZY

Korelace. Komentované řešení pomocí MS Excel

Úvod do analýzy rozptylu

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.

12. cvičení z PST. 20. prosince 2017

Plánovací diář a Google Calendar

Cvičení ze statistiky - 9. Filip Děchtěrenko

Uloha B - Kvantitativní test. Radek Kubica A7B39TUR. B1 Radek Kubica Kvantitativní testování Stránka 1

1. SEZNAM PŘÍLOH. Příloha 1 Vyjádření žádosti etické komise. Příloha 2. Informovaný souhlas. Příloha 3 Anamnestický dotazník

Vzorová prezentace do předmětu Statistika

Cvičení 9: Neparametrické úlohy o mediánech

TESTOVÁNÍ KVALITATIVNÍCH ZNAKŮ V PROGRAMU

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Kvantitativní testování porovnání Alza.cz a Mall.cz

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

7. cvičení 4ST201. Úvod: bodový a intervalový odhad

STATISTICA Téma 7. Testy na základě více než 2 výběrů

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

INDUKTIVNÍ STATISTIKA

4ST201 STATISTIKA CVIČENÍ Č. 10

Návod na statistický software PSPP část 2. Kontingenční tabulky

Statistické metody uţívané při ověřování platnosti hypotéz

5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Metodologie pro Informační studia a knihovnictví 2

TECHNICKÁ UNIVERZITA V LIBERCI EKONOMICKÁ FAKULTA

Jana Vránová, 3. lékařská fakulta UK

Aplikovaná statistika v R - cvičení 2

Transkript:

Seminář 6 statistické testy Část I. Volba správného testu Chceme zjistit, zda se Ježkovy a Širůčkovy seminární skupiny liší ve výsledcích v. průběžné písemce ze statistiky. Chceme zjistit, zda 1. průběžná písemka ze statistiky byla stejně těžká jako. průběžná. Chceme zjistit, zda populační rozložení skórů 1. průběžné písemky má průměr 7 (pro který byl konstruován). Chceme zjistit podle známek v ISu, jestli je statistika stejně těžká jako vývojová psychologie. Chceme zjistit podle známek v ISu, zda je statistika stejně těžká pro muže a ženy. Chceme zjistit, zda jsou v populaci všechny základní barvy (b,čr,čv,z,m,ž,o,h) stejně oblíbené. Chceme zjistit, zda se kombinovaní a prezenční studenti psychologie liší v preferenci placeného vysokoškolského studia. Chceme na vzorku 30 rodin se dvěma školou povinnými dětmi zjistit, zda mladší i starší sourozenci jsou stejně populární ve své třídě. Chceme zjistit, zda výkonnost ve statistice (1.průběžná) roste s dobou přípravy (v hodinách). Chceme zjistit, zda platí, že čím více chodí lidé do kina, tím méně jsou pro školné na VŠ. Chceme zjistit, zda se milovníci různých základních barev liší ve výkonnosti ve statistice (1. průběžná). Chceme na vzorku 30 spokojených partnerů uvěřit hypotézu, že ve spokojených vztazích se míra romantičnosti obou partnerů neliší. Úkol a) pro každou situaci najít ten správný test b) najít kód receptu Oseckých

Část II. Příklady výstupů k jednotlivým testům. 1. t-test pro nezávislé skupiny Chceme zjistit, zda se středeční a čtvrteční seminární skupiny liší ve výsledcích v 1. průběžné písemce. sem N Mean Std. Deviation Std. Error Mean P CD 8 7,07,879,544 AB 49 6,00 3,367,481 Independent Samples Test Levene's Test for Equality of Variances t-test for Equality of Means 95% Confidence Interval Sig. (- Mean Std. Error of the Difference F Sig. t df tailed) Difference Difference Lower Upper P Equal variances assumed Equal variances not assumed 1,516, 1,413 75,16 1,071,758 -,439,581 1,475 63,768,145 1,071,76 -,379,5. párový t-test Chceme zjistit, zda 1. průběžná písemka ze statistiky byla stejně těžká jako. průběžná. (loňská data) Paired Samples Statistics Mean N Std. Deviation Std. Error Mean Pair 1 P1 7,04 77,998,34 P 6,39 77 3,1,367 Paired Samples Correlations N Correlation Sig. Pair 1 P1 & P 77,358,001 Paired Samples Test Paired Differences 95% Confidence Interval of Std. Error the Difference Mean Std. Deviation Mean Lower Upper t df Sig. (-tailed) Pair 1 P1 - P,649 3,57,40 -,151 1,450 1,615 76,110

3. jednovýběrový t-test Chceme zjistit, zda populační rozložení skórů 1. průběžné písemky má průměr 7. One-Sample Statistics N Mean Std. Deviation Std. Error Mean P 77 6,39 3,1,367 One-Sample Test Test Value = 7 95% Confidence Interval of the Difference t df Sig. (-tailed) Mean Difference Lower Upper P -1,663 76,100 -,610-1,34,1 4. neparametrický test pro dva nezávislé výběry Mann-Whitney U Chceme zjistit, zda se středeční a čtvrteční seminární skupiny liší ve výsledcích v 1. průběžné písemce. a nevěříme tak úplně dobře intervalovosti svého měření Ranks sem3 N Mean Rank Sum of Ranks P 1,00 49 36, 1775,00,00 8 43,86 18,00 Total 77 Test Statistics a P Mann-Whitney U 550,000 Wilcoxon W 1775,000 Z -1,459 Asymp. Sig. (-tailed),144 a. Grouping Variable: sem3

5. neparametrický párový test Wilcoxon T Chceme zjistit, zda 1. průběžná písemka ze statistiky byla stejně těžká jako. průběžná (loňská data). a nevěříme tak úplně dobře intervalovosti svého měření Ranks p - p1 Negativ e Ranks Positiv e Ranks Ties Total a. p < p1 b. p > p1 c. p = p1 N Mean Rank Sum of Ranks 55 a 43,58 397,00 6 b 35,54 94,00 7 c 88 Test Statistics b p - p1 Z -3,48 a Asy mp. Sig. (-tailed),000 a. Based on positiv e ranks. b. Wilcoxon Signed Ranks Test 6. Chí-kvadrát test dobré shody Chceme zjistit, zda jsou v populaci studentů odpůrci a příznivci školného zastoupeni rovnoměrně. skolne pro proti Total Observed N Expected N Residual 9 41,5-1,5 54 41,5 1,5 83 Test Statistics Chi-Square a df Asy mp. Sig. skolne 7,530 1,006 a. 0 cells (,0%) hav e expected frequencies less than 5. The minimum expected cell f requency is 41,5.

7. Chí kvadrát test rozdílu rozložení mezi dvěma populacemi / nezávislosti mezi dvěma kategoriálními proměnnými. Chceme zjistit, zda je poměr příznivců/odpůrců stejný mezi prezenčními a kombinovanými studenty.

Část III. Ruční počítání statistických testů A) t-test pro nezávislé skupiny Chceme zjistit, zda se studenti, kteří připustili, že by je statistika mohla bavit (A), liší od těch, co je statistika bavit nebude (B) v míře potřeby struktury (NFS vyšší číslo je menší potřeba struktury). sk N Mean Std. Deviation Std. Error Mean NFS B 45 3,6 0,570,085 A 38 3,5 0,660,107 1. H 0 : s = č neboli = s č = 0 a hladinu významnosti zvolíme = 0,05. Rozdíl průměrů nezávislých skupin má t-rozložení s n 1 + n stupni volnosti, středem v a směrodatnou chybou s d ( n 1) s1 ( n 1) s n n 1 1 n1 n 1 1 3. Nyní spočítáme testovou statistiku, což je t, které vyjadřuje jak je zjištěný rozdíl veliký v jednotkách své směrodatné chyby. Jinými slovy, rozdíl průměrů převedeme na standardizovaný skór t, což je něco jako z. Ještě jinými slovy, abychom rozdíl průměrů v jednotkách měření mohli snadněji interpretovat, standardizujeme jej. ms mč 0 t s d 4. Jaká je pravděpodobnost, že nám při náhodném výběru z t-rozložení s 81 stupni volnosti a průměrem 0 vyjde standardizovaná hodnota t =1,95 nebo větší? TDIST(1,95;81;) = 5. Vyšla nám pravděpodobnost vyšší než je zvolená hladina statistické významnosti. To znamená, že kdyby byla nulová hypotéza platná, tak by tak velký rozdíl, jaký nám vyšel, mohl vyjít se % pravděpodobností. Nulovou hypotézu tedy na 5% hladině významnosti nezamítáme. 6. Interval spolehlivosti pro rozdíl průměrů d 0,975 t(81)s d < < d + 0,975 t(81)s d 7. Co nám SPSS nespočítalo - velikost účinku Cohenovo d d Cohenovo d s pooled

B) Párový t-test (t-test pro korelované vzorky) Chceme zjistit, zda 1. průběžná písemka ze statistiky byla stejně těžká jako. průběžná. (loňská data) Paired Samples Statistics Pair 1 p1 p Std. Error Mean N Std. Dev iation Mean 9,7045 88,6595,881 8,353 88 3,04389,3448 Paired Samples Correlations Pair 1 p1 & p N Correlation Sig. 88,95,005 1. H 0 : s = č neboli = s č = 0 a hladinu významnosti zvolíme = 0,05. Rozdíl průměrů nezávislých skupin má t-rozložení s n 1 stupni volnosti, středem v a směrodatnou 1 chybou s d ( s1 s rs1s ) n 3. Nyní spočítáme testovou statistiku, což je t, které vyjadřuje jak je zjištěný rozdíl veliký v jednotkách své směrodatné chyby (jinými slovy, rozdíl průměrů převedeme na standardizovaný skór t, což je něco jako z). m1 m t s d 4. Jaká je pravděpodobnost, že nám při náhodném výběru z t-rozložení s 87 stupni volnosti a průměrem 0 vyjde standardizovaná hodnota 3,73 nebo větší? TDIST(3,73;8;) = 0,0003 5. Vyšla nám pravděpodobnost nižší než je zvolená hladina statistické významnosti. To znamená, že kdyby byla nulová hypotéza skutečně platná, tak by tak by pravděpodobnost toho, že nám vyjde tak velký nebo větší rozdíl, než jaký nám vyšel, byla velmi nízká cca 0,03%. Nulovou hypotézu tedy na 5% hladině významnosti zamítáme. 6. Interval spolehlivosti d 0,975 t(87)s d < < d + 0,975 t(87)s d 7. Co nám SPSS nespočítalo - velikost účinku Cohenovo d d Cohenovo d s pooled

B) Chí-kvadrátový test nezávislosti proměnných (homogenity) Chceme zjistit, zda je poměr příznivců/odpůrců stejný mezi studenty píšícími levou a pravou. skolne pro proti Total Psaní leváci Observed Count (f o ) 4 11 15 7% 73% praváci Observed Count (f o ) 30 34 64 47% 53% Total Observed Count 34 45 79 1. H 0 : Kdyby bylo procento příznivců stejné mezi praváky a leváky (43% ku 57%), očekávali bychom abcd přibližně 6,5 8,5 7,5 a 36,5. Konceptuální nulová hypotéza je tedy, že mezi očekávanými četnostmi a skutečně získanými četnostmi není žádný rozdíl. Konkrétním statistickým vyjádřením těchto rozdílů je jejich speciální součet zvaný chí-kvadrát, jehož výběrové rozložení známe ( f o f e ) f e Očekávaná hodnota (průměr) chí-kvadrát rozložení je rovna jeho stupňům volnosti = (i-1)(j-1) H 0 : = ; H 1 : > (ano, jednostranný test) a hladinu významnosti zvolíme = 0,05. Spočítáme testovou statistiku 3. Jaká je pravděpodobnost této hodnoty s jedním stupněm volnosti, pokud platí H 0? CHIDIST(;1)=0,0135 4. H 0 na 5% hladině významnosti zamítáme; rozdíly jsou příliš velké na to, aby se přihodily náhodou. 5. Velikost účinku je zde např. r, nebo Cramerovo V r = n

C) Interval spolehlivosti a test hypotézy o relativních četnostech ( 1 n ). p.(1 p) p má přibližně normální rozložení s průměrem a N p n 1. činitel v čitateli zohledňuje, jak velkou část populace máme ve vzorku. Je-li populace vzhledem k vzorku obrovská(nekonečná), nemusíme ho používat.