Příklad: Test nezávislosti kategoriálních znaků Určete na hladině významnosti 5 % na základě dat zjištěných v rámci dotazníkového šetření ve Šluknově, zda existuje závislost mezi pohlavím respondenta a jeho názorem na odstěhování se ze Šluknova. Případně změřte sílu závislosti vhodnou charakteristikou. Zjištěné údaje jsou uspořádané v následující tabulce. Pohlaví Názor na odstěhování ano dosud ne ne Součet muž 115 37 199 351 žena 10 41 54 415 Součet 35 78 453 766 Použeme test nezávislosti kategoriálních znaků, neboť obě proměnné, uspořádané v kontingenční tabulce, jsou slovní (kategoriální). 1) H 0 : pohlaví respondenta a názor na odstěhování na sobě nezávisí H 1 : non H 0 ) G r s n n i1 j1 n n... teoretické četnosti; r 1s 1, G, n h n... empirické četnosti; r... počet řádků kontingenční tabulky; s... počet sloupců kontingenční tabulky; h... menší z čísel (r-1) a (s-1). 3) W G; G 0,95 W G ; G 5,991 0, h... min (r 1), (s 1) Výpočet parametru rozdělení χ : (r 1) (s 1) = (-1) (3-1) = 1 = 4) Aby bylo možné vypočítat hodnotu G, je třeba určit teoretické četnosti pro každé políčko kontingenční tabulky. To lze podle: ni n j n n n1 n 1 351 35 př. n 11 107, 68 n 766 n1 n 351 78 n 1 35,74 atd. n 766 Teoretické četnosti n obsahuje následující tabulka: Pohlaví Názor na odstěhování ano dosud ne ne Součet muž 107,68 35,74 07,58 351 žena 17,3 4,6 45,4 415 Součet 35 78 453 766
Nyní mohu spočítat hodnotu testového kritéria G: 115 107,68 37 35,74 199 07,58 G 107,68 35,74 07,58 1,653 10 17,3 41 4,6 54 45,4 5) G W nezamítáme H 0, nepřímáme H 1. 17,3 4,6 Na hladině významnosti 5 % nezamítáme předpoklad o nezávislosti pohlaví a názoru respondenta na odstěhování se ze Šluknova. Poznámka: Pokud by byla testem závislost prokázána, mohli bychom její sílu změřit např. pomocí Cramérova koeficientu kontingence C C. Procedura v SGP: Describe Categorical Data Contingency Tables!!! Pokud budeme příklad řešit přes SGP, není potřeba stanovovat kritický obor. Stačí uvést formulaci hypotéz, hodnotu testového kritéria, P-Value, porovnání P-Value s α, závěr testu (zamítáme x nezamítáme H 0 ; přímáme x nepřímáme H 1 ) a slovní odpověď. 45,4 Příklad: Test nezávislosti kategoriálních znaků řešení v SGP 1. Zadání dat
. Posloupnost procedur Describe Categorical Data Contingency Tables 3. Pole se vstupními údaji
4. Požadované výstupy 5. Výstup Frequency Table Obsahuje kontingenční tabulku. Četnosti v tabulce lze měnit volbou Pane options. Pro ověření podmínky, že pracujeme s výběrem dostatečného rozsahu, můžeme zvolit zobrazení teoretických četností (Expected Frequencies). Viz další obrázek: Teoretické četnosti ve všech políčkách jsou větší než 5, proto lze konstatovat, že rozsah výběru je dostatečný.
6. Výstup Test of Independence Tests of Independence Test Statistic Df P-Value Chi-Square 1,653 0,4375 Výstup obsahuje hodnotu testového kritéria G ve sloupci Statistic, počet stupňů volnosti (tj. počet parametrů rozdělení chí-kvadrát, kterým se při platnosti nulové hypotézy řídí testové kritérium G) ve sloupci Df a hodnotu vypočtené hladiny významnosti (P-Value). 7. Výstup Summary Statistics Summary Statistics With Rows With Columns Statistic Symmetric Dependent Dependent Lambda 0,0000 0,0000 0,0000 Uncertainty Coeff. 0,0014 0,0016 0,001 Somer's D 0,0448 0,047 0,0470 Eta 0,0465 0,0464 Statistic Value P-Value Df Contingency Coeff. 0,0464 Cramer's V 0,0465 Conditional Gamma 0,0858 Pearson's R 0,0464 0,1991 764 Kendall's Tau b 0,0448 0,199 Kendall's Tau c 0,0467 Výstup obsahuje hodnoty různých charakteristik, které jsou mírami těsnosti závislosti kategoriálních proměnných. Pokud by byla závislost proměnných v testu prokázána, pak bychom ke změření síly závislosti mohli použít třeba Cramérův koeficient kontingence (žlutě zvýrazněný). Zde závislost prokázána nebyla, není tedy třeba měřit sílu závislosti.