Seminář 6 statistické testy

Podobné dokumenty
Seminář 6 statistické testy

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

Analýza dat z dotazníkových šetření

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Jste aktivní sportovec?(pravidelně sportuji alespoň 2x týdně) Jakým sportovním činnostem se pravidelně věnujete? (alespoň 1 x za dva týdny v sezóně)

Statistické testování hypotéz II

Vymezení důležitých pojmů. nulová hypotéza, alternativní hypotéza testování hypotézy hladina významnosti (alfa) chyba I. druhu, chyba II.

LEKCE 6 ZÁKLADY TESTOVÁNÍ HYPOTÉZ

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Příloha 1 Úvodní text k dotazníku

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

ADDS cviceni. Pavlina Kuranova

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Příloha č. 6 Výsledky statistického vyhodnocení dat EVALUACE PROJEKTU VZDĚLÁVEJTE SE PRO RŮST! PRACOVNÍ PŘÍLEŽITOSTI CZ.1.04/2.1.00/03.

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

Opakování: Nominální proměnná více hodnotová odpověď.

PSY117/454 Statistická analýza dat v psychologii Přednáška 10

P íloha č. 1: Dotazník Volnočasové aktivity

Matematická statistika. Testy v. v binomickém. Test pravděpodobnosti. Test homogenity dvou. Neparametrické testy. statistika. Testy v.

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

Analýza rozptylu. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Srovnávání více než dvou průměrů

Příklad: Test nezávislosti kategoriálních znaků

LEKCE 7 ZÁKLADY BIVARIAČNÍ ANALÝZY

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

PŘÍLOHA 2. Těším se na spolupráci, Olga Kučerová (studentka psychologie, PedF Cuni)

Opakování: Nominální proměnná více hodnotová odpověď.

Sociologický ústav Akademie věd ČR Jilská 1, , Praha 1

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

Stav Svobodný Rozvedený Vdovec. Svobodná Rozvedená Vdova 5 8 6

Testy. Pavel Provinský. 19. listopadu 2013

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

Design Experimentu a Statistika - AGA46E

LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR

Uni- and multi-dimensional parametric tests for comparison of sample results

Pozn. přeskakuji zde popisnou statistiku, jinak by měla být součástí každé analýzy.

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

ÚKOL ,77 5,00 5 2,531,003,056 -,869,113

LEKCE09 MĚŘENÍ (SÍLY) ASOCIACE MEZI DVĚMA SPOJITÝMI PROMĚNNÝMI: KORELAČNÍ KOEFICIENTY A GRAFY vzorový výsledek cvičení

Fisherův exaktní test

Sociálně-ekologické a psychologické dopady Jaderné elektrárny Temelín na obyvatelstvo. (Především pak) dotazníkový průzkum

Přednáška X. Testování hypotéz o kvantitativních proměnných

Opakování. Neparametrické testy. Pořadí. Jednovýběrový Wilcoxonův test. t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

Příklady na testy hypotéz o parametrech normálního rozdělení

Testování uživatelského rozhraní

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Testy nezávislosti kardinálních veličin

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Jana Zapletalová, Kateřina Langová

ANALÝZA DAT V R 5. ZÁKLADNÍ STATISTICKÉ TESTY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

ADDS cvičení 7. Pavlína Kuráňová

Jednostranné intervaly spolehlivosti

7. cvičení 4ST201. Úvod: bodový a intervalový odhad

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Charakteristika datového souboru

Testování statistických hypotéz. Obecný postup

Metodologie pro Informační studia a knihovnictví 2

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

12. cvičení z PST. 20. prosince 2017

diskriminaci žen letní semestr = výrok, o jehož pravdivosti chceme rozhodnout tvrzení o populaci, o jehož platnosti rozhodujeme

6 TESTY HYPOTÉZ NEPARAMETRICKÉ TESTY

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

You created this PDF from an application that is not licensed to print to novapdf printer (

PŘÍLOHA A. METODA NEJMENŠÍCH ČTVERCŮ PRODEJ BYTŮ. Příloha A. Metoda nejmenších čtverců Prodej bytů

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných)

TECHNICKÁ UNIVERZITA V LIBERCI

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Přednáška č. 1.: Tabulkové a grafické zpracování vícerozměrných dat

4EK211 Základy ekonometrie

A7B39TUR Úloha B Kvantitativní testování ZS 2013/2014 Software MS Office Word a Open Office Writer

Úvod do analýzy rozptylu

Plánovací diář a Google Calendar

Pracovní adresář. Nápověda. Instalování a načtení nového balíčku. Importování datového souboru. Práce s datovým souborem

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Tomáš Karel LS 2012/2013

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

TECHNICKÁ UNIVERZITA V LIBERCI EKONOMICKÁ FAKULTA

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Transkript:

Seminář 6 statistické testy

Část I. Volba správného testu Chceme zjistit, zda se středeční a čtvrteční seminární skupiny liší ve výsledcích v 1. průběžné písemce ze statistiky. Chceme zjistit, zda 1. průběžná písemka ze statistiky byla stejně těžká jako. průběžná. Chceme zjistit, zda populační rozložení skórů 1. průběžné písemky má průměr 10 (pro který byl konstruován). Chceme zjistit podle známek v ISu, jestli je statistika stejně těžká jako vývojová psychologie. Chceme zjistit podle známek v ISu, zda je statistika stejně těžká pro muže a ženy. Chceme zjistit, zda jsou v populaci všechny základní barvy (b,čr,čv,z,m,ž,o,h) stejně oblíbené. Chceme zjistit, zda se kombinovaní a prezenční studenti psychologie liší v preferenci placeného vysokoškolského studia. Chceme na vzorku 30 rodin se dvěma školou povinnými dětmi zjistit zda mladší i starší sourozenci jsou stejně populární ve své třídě. Chceme zjistit, zda výkonnost ve statistice (1.průběžná) roste s dobou přípravy (v hodinách). Chceme zjistit, zda platí, že čím více chodí lidé do kina, tím méně jsou pro školné na VŠ. Chceme zjistit, zda se milovníci různých základních barev liší ve výkonnosti ve statistice (1. průběžná). Chceme na vzorku 30 spokojených partnerů uvěřit hypotézu, že ve spokojených vztazích se míra romantičnosti obou partnerů neliší. Úkol a) pro každou situaci najít ten správný test b) najít kód receptu Oseckých

Testy na rozdíly středních hodnot Nominální závislá párový test: binomický znaménkový test nezávislé skupiny: chí-kvadrát Ordinální závislá párový test: Wilcoxonovo T nezávislé skupiny: Mann-Whitney U Intervalová závislá párový test: párový t-test nezávislé skupiny: známý rozptyl v populaci: z-test neznámý rozptyl v populaci: t-test pro nezávislé skupiny varianta pro stejné a nestejné rozptyly mezi skupinami AJ: sign test, chi-square, Wilcoxon T, Mann-Whitney U, paired(-samples) t-test (dependent, repeated measures), onesample t-test, independent samplest-test

Část II. Příklady výstupů k jednotlivým testům. 1. t-test pro nezávislé skupiny Chceme zjistit, zda se středeční a čtvrteční seminární skupiny liší ve výsledcích v 1. průběžné písemce. Group Statistics sk_num >= 3 < 3 Std. Error N Mean Std. Deviation Mean 48 8,0833 3,6055,4706 53 10,64,47014,33930 Equal variances assumed Equal variances not assumed Levene's Test for Equality of Variances F Sig. Independent Samples Test t df Sig. (-tailed) t-test for Equality of Means Mean Difference 95% Confidence Interval of the Std. Error Difference Difference Lower Upper,387,16-3,744 99,000 -,14308,5738-3,7880-1,00736-3,694 87,5,000 -,14308,58018-3,960 -,98996. párový t-test Chceme zjistit, zda 1. průběžná písemka ze statistiky byla stejně těžká jako. průběžná. Paired Samples Statistics Pair 1 p Std. Error Mean N Std. Deviation Mean 9,7045 88,6595,881 8,353 88 3,04389,3448 Paired Samples Correlations Pair 1 & p N Correlation Sig. 88,95,005 Paired Samples Test Pair 1 - p Paired Differences 95% Confidence Interval of the Std. Error Difference Mean Std. Deviation Mean Lower Upper t df Sig. (-tailed) 1,357 3,3973,3615,6347,0708 3,734 87,000 3. jednovýběrový t-test Chceme zjistit, zda populační rozložení skórů 1. průběžné písemky má průměr 10. One-Sample Statistics Std. Error N Mean Std. Deviation Mean 101 9,079 3,05391,30387 One-Sample Test Test Value = 10 95% Confidence Interval of the Mean Difference t df Sig. (-tailed) Difference Lower Upper -,607 100,011 -,7908-1,3950 -,189

4. neparametrický test pro dva nezávislé výběry Mann-Whitney U Chceme zjistit, zda se středeční a čtvrteční seminární skupiny liší ve výsledcích v 1. průběžné písemce. a nevěříme tak úplně dobře intervalovosti svého měření Ranks den seminární skupiny středa čtvrtek N Mean Rank Sum of Ranks 53 60,60 31,00 48 40,40 1939,00 101 Test Statistics a Mann-Whitney U 763,000 Wilcoxon W 1939,000 Z -3,485 Asymp. Sig. (-tailed),000 a. Grouping Variable: den seminární skupiny 5. neparametrický párový test Wilcoxon T Chceme zjistit, zda 1. průběžná písemka ze statistiky byla stejně těžká jako. průběžná. a nevěříme tak úplně dobře intervalovosti svého měření Ranks p - Negative Ranks Positive Ranks Ties a. p < b. p > c. p = N Mean Rank Sum of Ranks 55 a 43,58 397,00 6 b 35,54 94,00 7 c 88 Test Statistics b p - Z -3,48 a Asymp. Sig. (-tailed),000 a. Based on positive ranks. b. Wilcoxon Signed Ranks Test 6. Chí-kvadrát test dobré shody Chceme zjistit, zda jsou v populaci studentů odpůrci a příznivci školného zastoupeni rovnoměrně. skolne pro proti Observed N Expected N Residual 9 41,5-1,5 54 41,5 1,5 83

Test Statistics Chi-Square a df Asymp. Sig. skolne 7,530 1,006 a. 0 cells (,0%) have expected frequencies less than 5. The minimum expected cell frequency is 41,5. 7. Chí kvadrát test rozdílu rozložení mezi dvěma populacemi / nezávislosti mezi dvěma kategoriálními proměnnými. Chceme zjistit, zda je poměr příznivců/odpůrců stejný mezi prezenčními a kombinovanými studenty. typ_studia * skolne Crosstabulation typ_ studia pereznční kombinované Count Expected Count % within typ_studia % within skolne % of Residual Adjusted Residual Count Expected Count % within typ_studia % within skolne % of Residual Adjusted Residual Count Expected Count % within typ_studia % within skolne % of skolne pro proti 17 45 6 1,7 40,3 6,0 7,4% 7,6% 100,0% 58,6% 83,3% 74,7% 0,5% 54,% 74,7% -4,7 4,7 -,5,5 1 9 1 7,3 13,7 1,0 57,1% 4,9% 100,0% 41,4% 16,7% 5,3% 14,5% 10,8% 5,3% 4,7-4,7,5 -,5 9 54 83 9,0 54,0 83,0 34,9% 65,1% 100,0% 100,0% 100,0% 100,0% 34,9% 65,1% 100,0% Pearson Chi-Square Continuity Correction a Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases Chi-Square Tests Asymp. Sig. Value df (-sided) 6,097 b 1,014 4,859 1,07 5,896 1,015 6,03 1,014 83 a. Computed only for a x table Exact Sig. (-sided) Exact Sig. (1-sided),018,015 b. 0 cells (,0%) have expected count less than 5. The minimum expected count is 7,34. Symmetric Measures Nominal by Nominal N of Valid Cases Phi Cramer's V a. Not assuming the null hypothesis. Value Approx. Sig. -,71,014,71,014 b. Using the asymptotic standard error assuming the null hypothesis. 83

Část III. Ruční počítání statistických testů A) t-test pro nezávislé skupiny Chceme zjistit, zda se středeční a čtvrteční seminární skupiny liší ve výsledcích v 1. průběžné písemce. Group Statistics sk_num >= 3 < 3 Std. Error N Mean Std. Deviation Mean 48 8,0833 3,6055,4706 53 10,64,47014,33930 1. H 0 : µ s = µ č neboli δ = µ s µ č = 0 a hladinu významnosti zvolíme α = 0,05. Rozdíl průměrů nezávislých skupin má t-rozložení s n 1 + n stupni volnosti, středem v δ a směrodatnou chybou s d = ( n 1) s1 + ( n 1) s n + n 1 1 + n1 n 1 1 3. Nyní spočítáme testovou statistiku, což je t, které vyjadřuje jak je zjištěný rozdíl veliký v jednotkách své směrodatné chyby. ms mč t = s d 4. Jaká je pravděpodobnost, že nám při náhodném výběru z t-rozložení s 99 stupni volnosti, průměrem 0 a směrodatnou chybou (odchylkou) 0,57 vyjde hodnota 3,74 nebo větší? TDIST(3,74;99;) = 0,000308 5. Vyšla nám pravděpodobnost menší než je zvolená hladina statistické významnosti. To znamená, že kdyby byla nulová hypotéza skutečně platná, bylo by veeelmi nepravděpodobné, aby nám vyšel tak velký rozdíl, jaký nám vyšel. Nulovou hypotézu tedy na 5% hladině významnosti zamítáme. 6. Interval spolehlivosti d 0,975 t(99)s d < δ < d + 0,975 t(99)s d 7. Co nám SPSS nespočítalo - velikost účinku Cohenovo d d Cohenovo d = s pooled

B) Chí-kvadrátový test nezávislosti proměnných Chceme zjistit, zda je poměr příznivců/odpůrců stejný mezi prezenčními a kombinovanými studenty. typ_studia * skolne Crosstabulation typ_stu dia prezenční kombinované skolne pro proti pro Count 17 45 6 Expected Count 1,7 40,3 Count 1 9 1 Expected Count 7,3 13,7 Count 9 54 83 1. H 0 : Kdyby bylo procento příznivců stejné mezi prezenčními i kombinovanými studenty (35% ku 65%), očekávali bychom abcd přibližně, 40, 7, 14. Nulová hypotéza je tedy, že mezi očekávanými četnostmi a skutečně získanými četnostmi není žádný rozdíl. Konkrétním vyjádřením těchto rozdílů je jejich speciální součet zvaný chí-kvadrát, jehož výběrové rozložení známe = ( f f o ) χ f o Očekávaná hodnota (průměr) chí-kvadrát rozložení je rovna jeho stupňům volnosti = (i-1)(j-1) H 0 : χ > ν (ano, jednostranný test) a hladinu významnosti zvolíme α = 0,05. Spočítáme testovou statistiku 3. Jaká je pravděpodobnost, χ s jedním stupněm volnosti? CHIDIST(6,1;1)=0,0135 4. H 0 na 5% hladině významnosti zamítáme; rozdíly jsou příliš velké na to, aby se přihodily náhodou. 5. Interval spolehlivosti zde nepočítáme. 6. Velikost účinku je zde např. r φ, nebo Cramerovo V (interpretujeme jako r ) r φ = χ n

C) Interval spolehlivosti a test hypotézy o relativních četnostech ( 1 n ). p.(1 p) p má přibližně normální rozložení s průměrem π a σ N p = n 1. činitel v čitateli zohledňuje, jak velkou část populace máme ve vzorku. Je-li populace vzhledem k vzorku obrovská(nekonečná), nemusíme ho používat.