Příklad: Test nezávislosti kategoriálních znaků

Podobné dokumenty
{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

Stav Svobodný Rozvedený Vdovec. Svobodná Rozvedená Vdova 5 8 6

ADDS cvičení 7. Pavlína Kuráňová

Analýza dat z dotazníkových šetření

TECHNICKÁ UNIVERZITA V LIBERCI. Statistický rozbor dat z dotazníkového šetření

You created this PDF from an application that is not licensed to print to novapdf printer (

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.

PSY117/454 Statistická analýza dat v psychologii Přednáška 10

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

Kontingenční tabulky, korelační koeficienty

Kontingenční tabulky, korelační koeficienty

Seminář 6 statistické testy

TECHNICKÁ UNIVERZITA V LIBERCI

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

INDUKTIVNÍ STATISTIKA

ADDS cviceni. Pavlina Kuranova

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

F p Test. statistika p 13,9 <,001 Muž 249 <,001 Žena 281 <,001. T test t df p Průměrný rozdíl 5, ,48 <,001 4,56

TECHNICKÁ UNIVERZITA V LIBERCI

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

KONTINGENČNÍ TABULKY Komentované řešení pomocí programu Statistica

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

Testování hypotéz a měření asociace mezi proměnnými

Tomáš Karel LS 2012/2013

TECHNICKÁ UNIVERZITA V LIBERCI

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta

TECHNICKÁ UNIVERZITA V LIBERCI

Úkol 1.: Testování nezávislosti nominálních veličin V roce 1950 zkoumali Yule a Kendall barvu očí a vlasů u 6800 mužů.

SOFTWARE STAT1 A R. Literatura 4. kontrolní skupině (viz obr. 4). Proto budeme testovat shodu středních hodnot µ 1 = µ 2 proti alternativní

Přednáška X. Testování hypotéz o kvantitativních proměnných

(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination.

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

6. Testování statistických hypotéz. KGG/STG Zimní semestr 6. Testování statistických hypotéz

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Statistické metody uţívané při ověřování platnosti hypotéz

Cvičení 12: Binární logistická regrese

Jana Vránová, 3. lékařská fakulta UK

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

KGG/STG Statistika pro geografy

Test dobré shody v KONTINGENČNÍCH TABULKÁCH

PRAVDĚPODOBNOST A STATISTIKA. Testování hypotéz o rozdělení

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Seminář 6 statistické testy

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

= = 2368

Regresní a korelační analýza

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Pravděpodobnost a matematická statistika

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Testy. Pavel Provinský. 19. listopadu 2013

Fisherův exaktní test

ČVUT FAKULTA DOPRAVNÍ

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Opakování: Nominální proměnná více hodnotová odpověď.

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

SEMESTRÁLNÍ PRÁCE Z PŘEDMĚTU STATISTIKY

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

4EK211 Základy ekonometrie

12. cvičení z PST. 20. prosince 2017

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty

TEHNICKA UNIVERZITA V LIBERCI. Ekonomická fakulta

LEKCE 6 ZÁKLADY TESTOVÁNÍ HYPOTÉZ

Příloha č. 3. Kombinační třídění

4ST201 STATISTIKA CVIČENÍ Č. 7

Kontingenční tabulka: vztahy mezi kategorizovanými znaky - míry asociace/korelace, znaménkové schéma

LEKCE09 MĚŘENÍ (SÍLY) ASOCIACE MEZI DVĚMA SPOJITÝMI PROMĚNNÝMI: KORELAČNÍ KOEFICIENTY A GRAFY vzorový výsledek cvičení

Škály podle informace v datech:

Regresní a korelační analýza

Charakteristika datového souboru

ANALÝZA ZÁVISLOSTI. Martina Litschmannová

Interakce úrovně vzdělání a faktoru nezaměstnanosti v hospodářsky slabých a silných obcích České republiky

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

Analýza kvantitativních dat II. 2. Vztahy mezi kategorizovanými znaky v kontingenční tabulce

Jste aktivní sportovec?(pravidelně sportuji alespoň 2x týdně) Jakým sportovním činnostem se pravidelně věnujete? (alespoň 1 x za dva týdny v sezóně)

Metodologie pro Informační studia a knihovnictví 2

LEKCE 8 MĚŘENÍ SÍLY ASOCIACE MEZI DVĚMA PROMĚNNÝMI

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Plánování experimentu

Zápočtová práce STATISTIKA I

TECHNICKÁ UNIVERZITA V LIBERCI EKONOMICKÁ FAKULTA

Přednáška 10. Analýza závislosti

TESTOVÁNÍ KVALITATIVNÍCH ZNAKŮ V PROGRAMU

Statistika (KMI/PSTAT)

Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných)

Úvod do analýzy rozptylu

Dotazník výzkumného šetření. 2. Uveďte nejvyšší stupeň dosaženého vzdělání? základní střední bez maturity / vyučen střední s maturitou vysokoškolské

Statistika. Testování hypotéz statistická indukce Neparametrické testy. Roman Biskup

Analýza kvantitativních dat II. Testování hypotéz (1) a asociace mezi znaky v kontingenční tabulce

Technická univerzita v Liberci

Spokojenost se životem

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Transkript:

Příklad: Test nezávislosti kategoriálních znaků Určete na hladině významnosti 5 % na základě dat zjištěných v rámci dotazníkového šetření ve Šluknově, zda existuje závislost mezi pohlavím respondenta a jeho názorem na odstěhování se ze Šluknova. Případně změřte sílu závislosti vhodnou charakteristikou. Zjištěné údaje jsou uspořádané v následující tabulce. Pohlaví Názor na odstěhování ano dosud ne ne Součet muž 115 37 199 351 žena 10 41 54 415 Součet 35 78 453 766 Použeme test nezávislosti kategoriálních znaků, neboť obě proměnné, uspořádané v kontingenční tabulce, jsou slovní (kategoriální). 1) H 0 : pohlaví respondenta a názor na odstěhování na sobě nezávisí H 1 : non H 0 ) G r s n n i1 j1 n n... teoretické četnosti; r 1s 1, G, n h n... empirické četnosti; r... počet řádků kontingenční tabulky; s... počet sloupců kontingenční tabulky; h... menší z čísel (r-1) a (s-1). 3) W G; G 0,95 W G ; G 5,991 0, h... min (r 1), (s 1) Výpočet parametru rozdělení χ : (r 1) (s 1) = (-1) (3-1) = 1 = 4) Aby bylo možné vypočítat hodnotu G, je třeba určit teoretické četnosti pro každé políčko kontingenční tabulky. To lze podle: ni n j n n n1 n 1 351 35 př. n 11 107, 68 n 766 n1 n 351 78 n 1 35,74 atd. n 766 Teoretické četnosti n obsahuje následující tabulka: Pohlaví Názor na odstěhování ano dosud ne ne Součet muž 107,68 35,74 07,58 351 žena 17,3 4,6 45,4 415 Součet 35 78 453 766

Nyní mohu spočítat hodnotu testového kritéria G: 115 107,68 37 35,74 199 07,58 G 107,68 35,74 07,58 1,653 10 17,3 41 4,6 54 45,4 5) G W nezamítáme H 0, nepřímáme H 1. 17,3 4,6 Na hladině významnosti 5 % nezamítáme předpoklad o nezávislosti pohlaví a názoru respondenta na odstěhování se ze Šluknova. Poznámka: Pokud by byla testem závislost prokázána, mohli bychom její sílu změřit např. pomocí Cramérova koeficientu kontingence C C. Procedura v SGP: Describe Categorical Data Contingency Tables!!! Pokud budeme příklad řešit přes SGP, není potřeba stanovovat kritický obor. Stačí uvést formulaci hypotéz, hodnotu testového kritéria, P-Value, porovnání P-Value s α, závěr testu (zamítáme x nezamítáme H 0 ; přímáme x nepřímáme H 1 ) a slovní odpověď. 45,4 Příklad: Test nezávislosti kategoriálních znaků řešení v SGP 1. Zadání dat

. Posloupnost procedur Describe Categorical Data Contingency Tables 3. Pole se vstupními údaji

4. Požadované výstupy 5. Výstup Frequency Table Obsahuje kontingenční tabulku. Četnosti v tabulce lze měnit volbou Pane options. Pro ověření podmínky, že pracujeme s výběrem dostatečného rozsahu, můžeme zvolit zobrazení teoretických četností (Expected Frequencies). Viz další obrázek: Teoretické četnosti ve všech políčkách jsou větší než 5, proto lze konstatovat, že rozsah výběru je dostatečný.

6. Výstup Test of Independence Tests of Independence Test Statistic Df P-Value Chi-Square 1,653 0,4375 Výstup obsahuje hodnotu testového kritéria G ve sloupci Statistic, počet stupňů volnosti (tj. počet parametrů rozdělení chí-kvadrát, kterým se při platnosti nulové hypotézy řídí testové kritérium G) ve sloupci Df a hodnotu vypočtené hladiny významnosti (P-Value). 7. Výstup Summary Statistics Summary Statistics With Rows With Columns Statistic Symmetric Dependent Dependent Lambda 0,0000 0,0000 0,0000 Uncertainty Coeff. 0,0014 0,0016 0,001 Somer's D 0,0448 0,047 0,0470 Eta 0,0465 0,0464 Statistic Value P-Value Df Contingency Coeff. 0,0464 Cramer's V 0,0465 Conditional Gamma 0,0858 Pearson's R 0,0464 0,1991 764 Kendall's Tau b 0,0448 0,199 Kendall's Tau c 0,0467 Výstup obsahuje hodnoty různých charakteristik, které jsou mírami těsnosti závislosti kategoriálních proměnných. Pokud by byla závislost proměnných v testu prokázána, pak bychom ke změření síly závislosti mohli použít třeba Cramérův koeficient kontingence (žlutě zvýrazněný). Zde závislost prokázána nebyla, není tedy třeba měřit sílu závislosti.