LEKCE09 MĚŘENÍ (SÍLY) ASOCIACE MEZI DVĚMA SPOJITÝMI PROMĚNNÝMI: KORELAČNÍ KOEFICIENTY A GRAFY vzorový výsledek cvičení

Podobné dokumenty
ZX510 Pokročilé statistické metody geografického výzkumu. Téma: Měření síly asociace mezi proměnnými (korelační analýza)

Testování hypotéz a měření asociace mezi proměnnými

LEKCE 8 MĚŘENÍ SÍLY ASOCIACE MEZI DVĚMA PROMĚNNÝMI

Seminář 6 statistické testy

LEKCE 9 JAK ODHALIT VLIV TŘETÍ PROMĚNNÉ (ELABORACE)

Příklad: Test nezávislosti kategoriálních znaků

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

Analýza dat z dotazníkových šetření

F p Test. statistika p 13,9 <,001 Muž 249 <,001 Žena 281 <,001. T test t df p Průměrný rozdíl 5, ,48 <,001 4,56

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

P íloha č. 1: Dotazník Volnočasové aktivity

LEKCE 6 ZÁKLADY TESTOVÁNÍ HYPOTÉZ

Lekce 11 EXPLORAČNÍ FAKTOROVÁ ANALÝZA

INDUKTIVNÍ STATISTIKA

PSY117/454 Statistická analýza dat v psychologii. Zobrazení dvojrozměrných dat Bodový graf - Scatterplot Korelační koeficient

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Tomáš Karel LS 2012/2013

KGG/STG Statistika pro geografy

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

Jana Vránová, 3. lékařská fakulta UK

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

LEKCE02a ANALÝZA ROZLOŽENÍ KATEGORIZOVANÝCH DAT vzorový výsledek cvičení

PSY117/454 Statistická analýza dat v psychologii Přednáška 5 ZOBRAZENÍ DVOUROZMĚRNÝCH DAT KORELAČNÍ KOEFICIENT. Všichni žijeme v matrixu.

Seminář 6 statistické testy

PSY117/454 Statistická analýza dat v psychologii Přednáška 10

PSY117/454 Statistická analýza dat v psychologii Přednáška 5 ZOBRAZENÍ DVOUROZMĚRNÝCH DAT KORELAČNÍ KOEFICIENT. Všichni žijeme v matrixu.

Spokojenost se životem

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

Měření závislosti statistických dat

Pearsonův korelační koeficient

Ing. Eva Hamplová, Ph.D. Ing. Jaroslav Kovárník, Ph.D.

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

ADDS cvičení 7. Pavlína Kuráňová

Regresní a korelační analýza

ADDS cviceni. Pavlina Kuranova

Tomáš Karel LS 2012/2013

Ilustrační příklad odhadu LRM v SW Gretl

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.

KORELACE. Komentované řešení pomocí programu Statistica

Shluková analýza dat a stanovení počtu shluků

Statistika (KMI/PSTAT)

PŘÍLOHA 2. Těším se na spolupráci, Olga Kučerová (studentka psychologie, PedF Cuni)

PSY117. Přednáška VZTAHY MEZI PROMĚNNÝMI KORELAČNÍ KOEFICIENT

Stav Svobodný Rozvedený Vdovec. Svobodná Rozvedená Vdova 5 8 6

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

Kontingenční tabulky, korelační koeficienty

KONTINGENČNÍ TABULKY Komentované řešení pomocí programu Statistica

Testy nezávislosti kardinálních veličin

Kontingenční tabulky, korelační koeficienty

Regresní a korelační analýza

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných)

Aplikovaná statistika v R - cvičení 2

Metodologie pro ISK 2, jaro Ladislava Z. Suchá

LEKCE 5: UMĚLÉ PROMĚNNÉ

VYHODNOCOVÁNÍ KVANTITATIVNÍCH DAT (ÚVOD DO PROBLEMATIKY) Metodologie pro ISK

Korelace. Komentované řešení pomocí MS Excel

Vícerozměrné statistické metody

Statistické metody uţívané při ověřování platnosti hypotéz

Návod na vypracování semestrálního projektu

Explorační faktorová analýza - analýza hlavních komponent

1. Který z následujících korelačních koeficientů ukazuje na nejtěsnější (nejsilnější) vztah? a) 0,55 b) 0,09 c) -0,77 d) 0,1 e) 1,05

You created this PDF from an application that is not licensed to print to novapdf printer (

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

4EK211 Základy ekonometrie

TESTOVÁNÍ KVALITATIVNÍCH ZNAKŮ V PROGRAMU

NOVÉ TRENDY A TECHNOLOGIE V OŠETŘOVATELSKÉ PÉČI. Aplikace metody krátkých intervencí v praxi

Metodologie pro Informační studia a knihovnictví 2

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Sociologický ústav Akademie věd ČR Jilská 1, , Praha 1

4ST201 STATISTIKA CVIČENÍ Č. 10

IBM SPSS Exact Tests. Přesné analýzy malých datových souborů. Nejdůležitější. IBM SPSS Statistics

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

Mannův-Whitneyův(Wilcoxonův) test pořadová obdoba dvouvýběrového t-testu. Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

Regresní a korelační analýza

MEZIREGIONÁLNÍ PŘEPRAVA NA ŽELEZNICI V ČR INTERREGINAL RAILWAY TRANSPORT IN CZECH REPUBLIC

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Kurz SPSS: Jednoduchá analýza dat. Jiří Šafr

Motivace a styly vedení

Zpracoval: Milan Tuček Centrum pro výzkum veřejného mínění, Sociologický ústav AV ČR,, v.v.i. Tel.: ;

18AEK Aplikovaná ekonometrie a teorie časových řad. Řešení domácích úkolů č. 1 a 2 příklad 1

velmi dobře spíše dobře spíše špatně velmi špatně neví

Téma 9: Vícenásobná regrese

ZA4980. Flash Eurobarometer 243 (Consumers views on switching service providers) Country Specific Questionnaire Czech Republic

Metody sociálních výzkumů. Velmi skromný úvod do statistiky. Motto: Jsou tři druhy lži-lež prostá, lež odsouzeníhodná a statistika.

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

4EK211 Základy ekonometrie

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

Metodologie pro Informační studia a knihovnictví 2

AKM CVIČENÍ. Opakování maticové algebry. Mějme matice A, B regulární, potom : ( AB) = B A

Cvičení 12: Binární logistická regrese

ÚKOL ,77 5,00 5 2,531,003,056 -,869,113

LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR

Pořízení licencí statistického SW

Fisherův exaktní test

Transkript:

LEKCE 9: MĚŘEÍ (SÍLY) ASOCIACE MEZI DVĚMA SPOJITÝMI PROMĚÝMI: KORELAČÍ KOEFICIETY A GRAFY LEKCE09 MĚŘEÍ (SÍLY) ASOCIACE MEZI DVĚMA SPOJITÝMI PROMĚÝMI: KORELAČÍ KOEFICIETY A GRAFY vzorový výsledek cvičení 1 C9.1: a) Jak velkou byste očekávali souvislost mezi důležitostí Boha (q33) a četností motliteb k Bohu mimo církevní obřady (q36)? b) Potvrdilo se vám toto očekávání? Jaký koeficient jste pro výpočet použili a proč? c) Pokud ano, o čem to svědčí? d) Co znamená, že má vypočtený korelační koeficient záporné znaménko? e) Je tato korelace signifikantní? Spearman's rho Q33 Bůh - důležitost v životě Q36 Modlení k Bohu mimo obřady Correlation Correlation Q33 Bůh - důležitost v životě Q36 Modlení k Bohu mimo obřady 1,000 -,784**,,000 1880 1857 -,784** 1,000,000, 1857 1911 a) Očekávali jsme vysokou korelaci a b) ona se potvrdila. Spearmana, jedna z proměnných je ordinální povahy. c) Svědčí to o tom, že respondenti jsou ve svých odpovědích konsistentní. d) Záporné znaménko znamená v daném případě kladnou korelaci: čím je Bůh důležitější, tím častěji se respondent modlí k Bohu i mimo církevní obřady (a naopak). Poznámka: Pozor, znaménko znamená směr vztahu, ale formální směr vztahu. Ve skutečnosti záporné znaménko tohoto vztahu říká pouze: KDYŽ ROSTE HODOTA JEDÉ ŠKÁLY, KLESÁ HODOTA DRUHÉ. Musíme vzít vždy v potaz natočení škál. U q33 důležitost boha na škále 1-10 stoupá a u q36 frekvence modlení na škále 1-7 klesá. Kdybychom změnili pořadí u jedné ze škál (např. 1 by reprezentovala nejvyšší a ne nejnižší význam boha), bylo by výsledné znaménko kladné. PROTO JE VĚTA čím je Bůh důležitější, tím častěji se respondent modlí k Bohu i mimo církevní obřady JIŽ ITERPRETACÍ ZJIŠTĚÉHO VZTAHU. e) Ano, korelace je signifikantní - viz sig. (2-tailed) =.000.

2 LEKCE 9: MĚŘEÍ (SÍLY) ASOCIACE MEZI DVĚMA SPOJITÝMI PROMĚÝMI: KORELAČÍ KOEFICIETY A GRAFY C9.2: a) Do jaké míry souvisí postoje v baterii q54a q54h se vzděláním respondenta (ISCED1)? Výpočet udělejte jako obdélníkovou matici, v níž vzdělání je nezávisle proměnnou. Formát výstupního výpočtu přetvořte tak, aby vzdělání bylo umístěno ve sloupci a závisle proměnné v řádcích. b) Jaký koeficient jste pro výpočet použili a proč? c) S jakou proměnnou v dané baterii vzdělání nejvíce koreluje? Jaký je příslušný koeficient determinace? d) A s jakou proměnnou naopak vzdělání koreluje nejméně? e) Proč jsou některé korelace kladné a některé záporné? a) Výsledkem je tato matice. Q54A Odpovědnost za jednotlivce má: Q54B ezaměstnaní nabízené zaměstnání: Q54C Konkurence je: Q54D Stát by měl: Q54E Příjmy by měly být: Q54F Rozšiřovat/ zachovat by se mělo obchod. a prům.: Q54G Za důchodové zabezp. má být zodpovědný: Q54H Za bydlení má být zodpovědný: Spearman's rho ISCED1 Correlation Sig. (2-tailed) -,192**,000 1860,024,312 1850 -,150**,000 1848 -,170**,000 1834,205**,000 1851 -,187**,000 1823 -,173**,000 1851 -,135**,000 1860 b) Použili jsme Spearmenův koeficient pořadové korelace. ejde o kardinální proměnné (nelze použít Pearsonův korelační koeficient) a tabulky nejsou ani čtvercové, neboť vzdělání má jiný počet variant (nelze použít Kendallovo taub) než ostatní proměnné. c) ejvíce je závislý na vzdělání názor o vyrovnanosti příjmů (q54e),. Spearmanův koeficient je 0,205. Je kladný, takže čím vyšší vzdělání (je seřazeno od nejnižšího k nejvyššímu), tím více se respondenti přiklánějí k názoru, že by se mělo více podnítit úsilí jednotlivce a naopak, čím nižší vzdělání, tím více se respondenti přiklánějí k názoru, že příjmy by měly být vyrovnanější. d) ejméně je závislý na vzdělání názor o vyrovnanosti příjmů (q54e),, Spearmanův koeficient je 0,024 (je to tak málo, že de facto o žádný vztah nejde, rozložení odpovědí v jednotlivých vzdělanostních kategoriích je přibližně stejné. e) Protože vztah má v konkrétních případech různý směr (pozitivní = čím vyšší vzdělání, tím více roste škálová hodnota druhé škály; negativní = čím nižší roste vzdělání, tím více roste škálová

LEKCE 9: MĚŘEÍ (SÍLY) ASOCIACE MEZI DVĚMA SPOJITÝMI PROMĚÝMI: KORELAČÍ KOEFICIETY A GRAFY C9.3: V otázce q62 lidé posuzovali svůj postoj k různým typům politických systémů. Jak spolu tyto postoje korelovaly (zvolte dobře koeficient)? Popište základní zjištění. 3 a) Volili jsme Kendallovo tau b, protože všechny škály mají stejný rozsah a proto všechny kontingenční tabulky budou čtvercové. Silný vůdce v politickém systému Experti rozhodují Zemi vládne armáda Demokratický systém Kendall's tau_b Silný vůdce v politickém systému Experti rozhodují Zemi vládne armáda Demokratický systém Correlation Correlation Correlation Correlation 1,000,163**,264** -,210**,,000,000,000 1758 1692 1733 1731,163** 1,000,104** -,033,000,,000,125 1692 1748 1720 1721,264**,104** 1,000 -,180**,000,000,,000 1733 1720 1811 1780 -,210** -,033 -,180** 1,000,000,125,000, 1731 1721 1780 1809 b) Korelace mezi proměnnými byla spíše slabší, jen: mezi preferencí vlády armády a preferencí silného vůdce byla středně silná asociace (0,264) - pozitivní, což znamená, že preference jednoho byla spojena s preferencí druhého) mezi preferencí demokracie a preferencí silného vůdce byla nalezena středně silná asociace (-0,264) - negativní, což znamená, že preference jednoho byla spojena s odmítáním druhého)

4 LEKCE 9: MĚŘEÍ (SÍLY) ASOCIACE MEZI DVĚMA SPOJITÝMI PROMĚÝMI: KORELAČÍ KOEFICIETY A GRAFY C9.4: Podívejte se na souvislosti (zvolte dobře koeficient) mezi znepokojením nad životními podmínkami osob podle toho jak jsou nám blízcí či vzdálení (q79). Dovedli byste zde odhalit nějakou tendenci (napovím, že se zde rýsují přinejmenším dva, možná tři typy respondentů - víte co mám na mysli)? Kendall's tau_b ejbližší příbuzní Sousedé Lidé z regionu ejbližší Lidé z Obyvatelé příbuzní Sousedé regionu ČR Evropané Lidstvo 1,000,599**,293**,167**,169**,018.,000,000,000,000,359 1937 1904 1895 1894 1850 1859,599** 1,000,544**,289**,270**,114**,000.,000,000,000,000,599 1908 1887 1877 1834 1838,293**,544** 1,000,516**,365**,265**,000,000.,000,000,000 1895 1887 1900 1879 1836 1839 Obyvatelé ČR Evropané Lidstvo **. Correlation is significant at the 0.01 level (2-tailed).,167**,289**,516** 1,000,512**,442**,000,000,000.,000,000 1894 1877 1879 1901 1840 1844,169**,270**,365**,512** 1,000,496**,000,000,000,000.,000 1850 1834 1836 1840 1853 1831,018,114**,265**,442**,496** 1,000,359,000,000,000,000. 1859 1838 1839 1844 1831 1865 Zdá se, že se vytvářejí dva typy respondentů. a) Jedni jsou orientováni, co se týče obav o životní podmínky ostatních, spíše na své nejbližší - příbuzné a sousedy (žlutá barva). b) Druzí jsou orientováni regionálně (zelená barva). c) Třetí jsou orientováni globálně (modrá barva). Poznámka: Obecně je výklad následující: Čím častěji je člověk znepokojen osudem svých příbuzných, tím častěji je současně znepokojen i osudem svých sousedů (0,599). Slabší je vazba mezi znepokojením s osudem příbuzných a s osudem lidí z regionu (0,293), ještě slabší co se týče znepokojení osudem obyvatel ČR (0,167) a Evropy (0,169) a téměř žádný vztah nenacházíme mezi znepokojením s osudem lidstva (0,018, vztah se blíží 0 a tak by se dalo takřka říci, že z těch, kdo jsou znepokojeni osudem příbuzných je osudem lidstva polovina znepokojena a polovina ne).

LEKCE 9: MĚŘEÍ (SÍLY) ASOCIACE MEZI DVĚMA SPOJITÝMI PROMĚÝMI: KORELAČÍ KOEFICIETY A GRAFY 5 C9.5: V minulém cvičení jste testovali nulovou hypotézu, že mezi hrdostí na to být občanem ČR (q71) a preferencí místa, k němuž respondenti pociťují největší příslušnost (q67) není žádná souvislost. Pokuste se nyní o vztahu rozhodnout na základě příslušného koeficientu asociace. Jaký koeficient zvolíte a proč? O co je nyní vaše informace bohatší? a) Pokud budeme vztah považovat za symetrický (jde o ordinální proměnné), je možné zvolit např. Kendalovo tau c (tabulka je 5x4) nebo Spearmana. Ordinal by Ordinal Interval by Interval of Valid Cases Kendall's tau-c Spearman Correlation Pearson's R a. ot assuming the null hypothesis. Symmetric Measures Asymp. Value Std. Error a Approx. T b Approx. Sig.,015,018,829,407,020,024,860,390 c,052,025 2,208,027 c 1832 b. Using the asymptotic standard error assuming the null hypothesis. c. Based on normal approximation. Korelace je ale nízká (v případě Kendallova tau 0,015 a v případě Spearmana je 0,020), navíc nesignifikantní (v případě Kendallova tau je sign. 0,407 a v případě Spearmana je 0,390). ízkou korelaci dokládá i rozložení dat v tabulce, viz první řádek dat v tabulce příslušného cvičení k lekci 8 (ať je člověk hrdý více nebo méně, pociťuje nejsilnější příslušnost k k obci, v níž žije). Oproti informaci vyvozené z rozložení či chí-kvadrátu nám dává koeficient asociace informaci i o (velmi malé) síle asociace. Poznámka: Signifikance varují, že odmítneme-li nulovou hypotézu (o neexistenci vztahu v populaci), činíme to s vysokým rizikem chyby. V případe Kendallova tau 41% riziko, v případě Spearmanova koeficientu 39% riziko. b) Pokud bychom považovali vztah za asymetrický, museli bychom použít např. Somersovo D: Ordinal by Ordinal Somers' d a. ot assuming the null hypothesis. Directional Measures Symmetric ejsilnější pocit příslušnosti Dependent Hrdost na občanství ČR Dependent b. Using the asymptotic standard error assuming the null hypothesis. Asymp. Value Std. Error a Approx. T b Approx. Sig.,018,021,829,407,019,023,829,407,017,020,829,407 Ani zde však nenacházíme téměř žádnou asociaci, ať již vybereme jako nezávislou jednu či druhou proměnnou. A i zde signifikance varují, že odmítneme-li nulovou hypotézu (o neexistenci vztahu v populaci), činíme to s vysokým rizikem chyby..