ADDS cviceni. Pavlina Kuranova

Podobné dokumenty
Statistika, Biostatistika pro kombinované studium. Jan Kracík

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Jednofaktorová analýza rozptylu

ADDS cvičení 7. Pavlína Kuráňová

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

12. cvičení z PST. 20. prosince 2017

Přednáška IX. Analýza rozptylu (ANOVA)

STATISTICA Téma 7. Testy na základě více než 2 výběrů

Tomáš Karel LS 2012/2013

5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Seminář 6 statistické testy

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Testy. Pavel Provinský. 19. listopadu 2013

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.

LEKCE 6 ZÁKLADY TESTOVÁNÍ HYPOTÉZ

Seminář 6 statistické testy

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

You created this PDF from an application that is not licensed to print to novapdf printer (

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Stav Svobodný Rozvedený Vdovec. Svobodná Rozvedená Vdova 5 8 6

Návod na vypracování semestrálního projektu

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

Úvod do analýzy rozptylu

Vzorová prezentace do předmětu Statistika

KGG/STG Statistika pro geografy

Opakování: Nominální proměnná více hodnotová odpověď.

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

Cvičení 9: Neparametrické úlohy o mediánech

Příklad: Test nezávislosti kategoriálních znaků

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

ČVUT FAKULTA DOPRAVNÍ

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

4ST201 STATISTIKA CVIČENÍ Č. 7

Statistické metody uţívané při ověřování platnosti hypotéz

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu.

Statistické testování hypotéz II

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

Jednostranné intervaly spolehlivosti

TECHNICKÁ UNIVERZITA V LIBERCI EKONOMICKÁ FAKULTA

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Zápočtová práce STATISTIKA I

Testování statistických hypotéz

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty

Metodologie pro Informační studia a knihovnictví 2

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Analýza dat z dotazníkových šetření

Testy statistických hypotéz

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

TECHNICKÁ UNIVERZITA V LIBERCI

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

= = 2368

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.

Cvičení ze statistiky - 9. Filip Děchtěrenko

Vysoká škola ekonomická v Praze

Opakování: Nominální proměnná více hodnotová odpověď.

Řešení: máme diskrétní N.V. vzdělání bez maturity, s maturitou, vysokoškoláci, PhD.

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

Cvičení 12: Binární logistická regrese

A B C D

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

INDUKTIVNÍ STATISTIKA

Vymezení důležitých pojmů. nulová hypotéza, alternativní hypotéza testování hypotézy hladina významnosti (alfa) chyba I. druhu, chyba II.

4EK211 Základy ekonometrie

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Intervaly spolehlivosti

TECHNICKÁ UNIVERZITA V LIBERCI

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

4EK211 Základy ekonometrie

Tomáš Karel LS 2012/2013

Cvičení ze statistiky - 8. Filip Děchtěrenko

Stručný úvod do testování statistických hypotéz

Opakování. Neparametrické testy. Pořadí. Jednovýběrový Wilcoxonův test. t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality

4EK211 Základy ekonometrie

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

12. prosince n pro n = n = 30 = S X

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

Regresní a korelační analýza

TECHNICKÁ UNIVERZITA V LIBERCI

Statistická analýza jednorozměrných dat

NEPARAMETRICKÉ TESTY

PRAVDĚPODOBNOST A STATISTIKA

ANOVA PSY252 Statistická analýza dat II

F p Test. statistika p 13,9 <,001 Muž 249 <,001 Žena 281 <,001. T test t df p Průměrný rozdíl 5, ,48 <,001 4,56

ÚVOD DO TESTOVÁNÍ HYPOTÉZ. Martina Litschmannová

Transkript:

ADDS cviceni Pavlina Kuranova

Testy pro dva nezávislé výběry Mannův Whitneyho test - Založen na Wilcoxnově statistice W - založen na pořadí jednotlivých pozorování (oba výběry spojeny do jednoho celku) v případě stejně velkých výběrů pro oba je pak Wilc. statistika menší hodnota ze získaných součtů. Test vhodný i pro ordinální data.

Mannův-Whitneyho test Příklad (soubor spokojenost_v_praci) Budeme zjišťovat zda je spokojenost se svou pracovní pozicí závislá na pohlaví. H0: spokojenost v práci nezávisí na pohlaví HA: spokojenost v práci závisí na pohlaví Analyze Nonparametric Tests a 2 Independent Samples

Mannův-Whitneyho test Příklad (soubor spokojenost_v_praci) Budeme zjišťovat zda je spokojenost se svou pracovní pozicí závislá na pohlaví. Analyze Nonparametric Tests a 2 Independent Samples Na základě hodnoty Asymp. Sig. nezamítáme H 0, tzn. Spokojenost v práci nezávisí na pohlaví.

Testy pro více než dva nezávislé výběry Kruskal-Wallisův test - Všechny měření uspořádáme podle velikosti - Hodnoty nahradíme jejich pořadími - Měříme rozdíl průměrů pořadí ve skupinách - Vhodný i pro ordinální data - Přibližně Chí-kvadrát rozdělení s K-1 stupni volnosti Předpoklad: Použití by mělo být jen když minimum n i 5

Testy pro více než dva nezávislé výběry Kruskal-Wallisův test - příklad Na základě získaných dat budeme zjišťovat zda spokojenost se svou pracovní pozicí závisí na věku respondentů. H0: spokojenost s pracovní pozicí nezávisí na věku respondenta HA: spokojenost s pracovní pozicí závisí na věku respondenta Jedná se o test, který využívá pro výpočet hodnotu mediánu, tzn. H0: mediány ve věkových skupinách jsou shodné, HA: alespoň jeden medián je různý od ostatních

Testy pro více než dva nezávislé výběry Kruskal-Wallisův test - příklad Budeme zjišťovat zda spokojenost se svou pracovní pozicí závisí na věku respondentů. Analyze Nonparametric Tests K Independent Samples Zaškrtnuto Kruskal Wallis H - Proměnnou věk nutno překódovat na metrickou. - Na základě hodnoty Asymp. Sig, vidíme, že na 5% hladině významnosti nezamítáme H O o shodě mediánů. Spokojenost s pracovní pozicí nezávisí na věku respondentů.

Mediánový test pro K výběrů Používá se když předpokládáme ve výběrech různá rozdělení. Nevytváříme pořadí, ale spočteme medián ze všech hodnot vysvětlované proměnné (grand median) Není ovlivněn odlehlými hodnotami Konzervativnější - méně informací určuje pouze zda se nacházíme nad nebo pod mediánem

Mediánový test pro K výběrů Příklad: zadání stejné jako v předchozím případě: Budeme zjišťovat zda spokojenost se svou pracovní pozicí závisí na věku respondentů. Analyze Nonparanetric Tests K Indenpendent Samples zaškrtneme položku Median Na základě této tabulky bychom byli schopni spočítat očekávané četnosti

Mediánový test pro K výběrů Příklad: zadání stejné jako v předchozím případě: Zjišťujeme, zda spokojenost se svou pracovní pozicí závisí na věku respondentů.» Zde vidíme údaje: N celkový počet pozorování Median určený ze všech pozorování (N hodnot vysvětlující proměnné) gradn Median Chi-Square hodnota testové statistiky df- počet stupňů volnosti Asymp. Sig. minimální hladina významnosti od které zamítáme nulovou hypotézu Pozor! Měly by platit stejné předpoklady jako u chí-kvadrát testu!!! Výsledek: Na 5% hladině významnosti nezamítáme H 0, spokojenost s pracovní pozicí nezávisí na věku respondenta

ANOVA ANOVA = ANalysis Of VAriance H 0 : proměnné jsou nezávislé (průměry ve všech skupinách jsou si rovny) H A : proměnné jsou závislé (alespoň dva průměry jsou různé)

ANOVA - předpoklady - Zkoumaná proměnná je metrická - Všechna měření jsou vzájemně nezávislá uvnitř skupin i mezi skupinami - Výběry pocházejí z normálního rozdělení - Všechny rozptyly ve skupinách jsou stejné (minimálně musí platit max s i min s i 3, kde s i jsou směrodatné odchylky v jednotlivých skupinách

Levenův test Zkoumá rovnost rozptylů H 0 : σ 1 2 = σ 2 2, H A : σ 1 2 σ 2 2 Předpoklady: - Metrická proměnná - Náhodné výběry jsou nezávislé - Robustní test, pokud n > 30, nemělo by vadit porušení normality Využití u Anovy jako : Test of Homogenity Variance

ANOVA - příklad - Otestujme zda příjem obyvatel je závislý na dosaženém vzdělání. - Soubor spokojenost_v_praci (pro jednoduchost spojíme data do 3 skupin) - Překódování je nutné!!! Pro ANOVU musí být proměnné metrické!!! Proměnná vzdělání: -Nižší (základní + vyučen) -Střední (maturita) -Vyšší (vysokoškolské + vyšší odborné) Proměnná příjem: překódujeme do řádu tisíců

ANOVA - příklad - Otestujme zda příjem obyvatel je závislý na dosaženém vzdělání. Na základě testu vidíme že hodnota p_value (Sig.) < α(5%) Na hladině významnosti 5% zamítám nulovou hypotézu o rovnosti rozptylů.

ANOVA - příklad - Otestujme zda příjem obyvatel je závislý na dosaženém vzdělání. - Na základě hodnoty Sig. (p-value) bychom zamítli nulovou hypotézu na hladině významnosti 5%. - NEBYL splněn předpoklad testu!!! Anova by neměla být prováděna, je možno využít nějakou alternativu (K-W test, mediánový test)

ANOVA příklad 2 - Otestujme zda příjem je závislý na věku respondentů. - Soubor spokojenost_v_praci - Zkontrolujte proměnné!!! Pro ANOVU musí být proměnné metrické!!! Proměnná věk (4 skupiny): - do 25-ti let Proměnná příjem: překódujeme do řádu tisíců - Nad 46 let

ANOVA - příklad - Otestujme zda příjem obyvatel je závislý na věku. Na základě testu vidíme že hodnota p_value (Sig.) α(5%) Na hladině významnosti 5% nezamítám nulovou hypotézu o rovnosti rozptylů.

ANOVA - příklad - Otestujme zda příjem obyvatel je závislý na věku. - Na základě hodnoty Sig. (p-value) zamítáme nulovou hypotézu na hladině významnosti 5%. Na hladině významnosti 1% bychom nulovou hypotézu nemohli zamítnout!!! - Výsledek: Příjem respondentů nezávisí na věku.

ANOVA POST HOC testy - V případě zamítnutí nulové hypotézy!! Otestujme zda jsou některé věkové skupiny ekvivalentní. - Analyze Compare Means One-Way Anova POST HOC

ANOVA POST HOC testy - V případě zamítnutí nulové hypotézy!! Otestujme zda jsou některé věkové skupiny ekvivalentní. - Analyze Compare Means One-Way Anova POST HOC - Graphs legacy dialogs error bar -