ZX510 Pokročilé statistické metody geografického výzkumu. Téma: Měření síly asociace mezi proměnnými (korelační analýza)



Podobné dokumenty
Testování hypotéz a měření asociace mezi proměnnými

ZX510 Pokročilé statistické metody geografického výzkumu

LEKCE 8 MĚŘENÍ SÍLY ASOCIACE MEZI DVĚMA PROMĚNNÝMI

LEKCE09 MĚŘENÍ (SÍLY) ASOCIACE MEZI DVĚMA SPOJITÝMI PROMĚNNÝMI: KORELAČNÍ KOEFICIENTY A GRAFY vzorový výsledek cvičení

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

Pearsonův korelační koeficient

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

KGG/STG Statistika pro geografy

INDUKTIVNÍ STATISTIKA

You created this PDF from an application that is not licensed to print to novapdf printer (

PSY117/454 Statistická analýza dat v psychologii. Zobrazení dvojrozměrných dat Bodový graf - Scatterplot Korelační koeficient

Tomáš Karel LS 2012/2013

Kontingenční tabulky, korelační koeficienty

Statistická analýza jednorozměrných dat

Korelace. Komentované řešení pomocí MS Excel

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Kontingenční tabulky, korelační koeficienty

Korelační a regresní analýza

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

Regresní a korelační analýza

Regresní a korelační analýza

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

PSY117/454 Statistická analýza dat v psychologii Přednáška 5 ZOBRAZENÍ DVOUROZMĚRNÝCH DAT KORELAČNÍ KOEFICIENT. Všichni žijeme v matrixu.

PSY117/454 Statistická analýza dat v psychologii Přednáška 5 ZOBRAZENÍ DVOUROZMĚRNÝCH DAT KORELAČNÍ KOEFICIENT. Všichni žijeme v matrixu.

Metodologie pro Informační studia a knihovnictví 2

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

Regresní a korelační analýza

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan

Regresní a korelační analýza

Statistické metody uţívané při ověřování platnosti hypotéz

Statistické testování hypotéz II

KORELACE. Komentované řešení pomocí programu Statistica

Jana Vránová, 3. lékařská fakulta UK

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

TECHNICKÁ UNIVERZITA V LIBERCI

MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ

Regresní a korelační analýza

LIMITY APLIKACE STATISTICKÝCH TESTŮ VÝZNAMNOSTI V PEDAGOGICKÉM VÝZKUMU: SEMINÁŘ PRO NESTATISTIKY

Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy

4ST201 STATISTIKA CVIČENÍ Č. 10

Cvičení ze statistiky - 3. Filip Děchtěrenko

Ilustrační příklad odhadu LRM v SW Gretl

Úvodem Dříve les než stromy 3 Operace s maticemi

Vícerozměrné statistické metody

LINEÁRNÍ REGRESE. Lineární regresní model

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Kurz SPSS: Jednoduchá analýza dat. Jiří Šafr

Tomáš Karel LS 2012/2013

ADDS cvičení 7. Pavlína Kuráňová

Kontingenční tabulka: vztahy mezi kategorizovanými znaky - míry asociace/korelace, znaménkové schéma

Aplikovaná statistika v R - cvičení 2

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

IBM SPSS Exact Tests. Přesné analýzy malých datových souborů. Nejdůležitější. IBM SPSS Statistics

Statistika (KMI/PSTAT)

Spokojenost se životem

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

Statistická a věcná významnost. Statistická významnost. Historie hypotézy a testů. Hypotézy a statistické testy.

10. Předpovídání - aplikace regresní úlohy

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

6. Lineární regresní modely

6. Dokončená bytová výstavba v relaci s vybranými statistickými charakteristikami území správních obvodů obcí s rozšířenou působností Zlínského kraje

Kontingenční tabulky analýza kategoriálních dat: Úvod. Třídění 2. stupně

Mnohorozměrná statistická data

PSY117. Přednáška VZTAHY MEZI PROMĚNNÝMI KORELAČNÍ KOEFICIENT

Ing. Eva Hamplová, Ph.D. Ing. Jaroslav Kovárník, Ph.D.

PSY117/454 Statistická analýza dat v psychologii Přednáška 10

Stručný úvod do vybraných zredukovaných základů statistické analýzy dat

Inovace bakalářského studijního oboru Aplikovaná chemie

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

LEKCE 9 JAK ODHALIT VLIV TŘETÍ PROMĚNNÉ (ELABORACE)

Měření závislosti statistických dat

Příklad: Test nezávislosti kategoriálních znaků

Interakce úrovně vzdělání a faktoru nezaměstnanosti v hospodářsky slabých a silných obcích České republiky

Lineární regrese. Komentované řešení pomocí MS Excel

Analýza dat z dotazníkových šetření

V praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více

Metody sociálních výzkumů. Velmi skromný úvod do statistiky. Motto: Jsou tři druhy lži-lež prostá, lež odsouzeníhodná a statistika.

Neparametrické metody

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Stav Svobodný Rozvedený Vdovec. Svobodná Rozvedená Vdova 5 8 6

Analýza dat na PC I.

Plánování experimentu

Testování hypotéz o parametrech regresního modelu

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Testování hypotéz o parametrech regresního modelu

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Testy nezávislosti kardinálních veličin

Kanonická korelační analýza

letní semestr Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika vektory

1.1 Úvod Data Statistická analýza dotazníkových dat 8. Literatura 10

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

Analýza kvantitativních dat: 1. Popisné statistiky a testování hypotéz

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

Transkript:

ZX510 Pokročilé statistické metody geografického výzkumu Téma: Měření síly asociace mezi proměnnými (korelační analýza)

Měření síly asociace (korelace) mezi proměnnými Vztah mezi dvěma proměnnými existuje, pokud hodnoty jedné proměnné jsou vztaženy k hodnotám druhé proměnné (tzv. kovariují). zajímáme se nejen o to, zdali je mezi proměnnými souvislost, ale také jakou má tato souvislost sílu (těsnost vztahu) a jakou má povahu (jaký má směr) pro zjištění síly či těsnosti vztahu počítáme tzv. koeficienty asociace (u nominálních znaků) nebo korelace (ordinální, kardinální)

Korelační analýza v SPSS (funkce Crosstabs)

Korelační analýza v SPSS (funkce Compare means)

Typy korelačních koeficientů Hodnoty koeficientů se pohybují v intervalech <0;1> (u nominálních znaků nemá smysl určovat směr vztahu) nebo <-1;+1> Čím vyšší je hodnota koeficientů, tím silnější je vztah mezi proměnnými Záporné koeficienty znamenají negativní asociaci a kladné koeficienty pozitivní asociaci. Nula má obvykle význam neexistence vztahu (vztah může existovat, ale je nelineární!), hodnota 1 má význam existence perfektního vztahu. Pro každou úroveň měření (pro typ proměnných - nominální, ordinální a kardinální) jsou určeny speciální koeficienty.

Typy korelačních koeficientů Jsou-li proměnné různého charakteru (např. nominální a intervalové), musíme volit vždy koeficient pro proměnnou nižší úrovně Některé typy koeficientů lze použít jen při lineárním vztahu, jiné i pro vztahy nelineární Některé koeficienty rozlišují, která z proměnných je závislá a která nezávislá proměnná (asymetrické vztahy), jiné to nerozlišují (symetrické vztahy) Některé koeficienty rozlišují i velikost kontingenční tabulky Prokázání asociace není důkazem kauzality vztahu

Metody analýzy a korelační koeficienty Úroveň měření Počet kategorií Vhodná metoda Vhodný koeficient 1. Nominální / Nominální 2 x 2 Crosstabs Phi, Lambda 2. Nominální / Nominální 3+ x 2+ Crosstabs Cramerovo V, Lambda 3. Nominální / Ordinální 3+ x 3+ Crosstabs Cramerovo V, Lambda 4. Nominální / Intervalová nominální nezávislá a) Crosstabs (pokud má intervalová proměnná málo kategorií b) Means, ANOVA 5. Ordinální / Ordinální obě proměnné s malým počtem kategorií 6. Ordinální / Ordinální jedna proměnná s mnoha kategoriemi 7. Ordinální / Ordinální obě proměnné s mnoha kategoriemi 8. Ordinální / Intervalová obě proměnné s několika kategoriemi 9. Ordinální / Intervalová ordinální s několika kategoriemi, intervalová s mnoha 10. Ordinální / Intervalová obě s mnoha kategoriemi 11. Intervalová / Intervalová Crosstabs pořadová korelace pořadová korelace a) Crosstabs b) Srovnání průměrů pokud je závisle proměnná intervalová a) Means b) Pořadová korelace pořadová korelace bodový graf Eta Eta Gamma, Kendalovo tau b (pro čtvercovou tabulku, Sommersovo D, Kendalovo tau c (pro obdélníkovou tabulku) Kendalovo tau c Kendalovo tau c Spearmanovo rhó Eta, stejné koeficienty jak v 5. Eta Eta Kendalovo tau Kendalovo tau Spearmanovo rhó Pearsonovo R, Regrese Podle Vaus, D. A. (1990): Surveys in Social Research. Unwin Hyman, London, p.182. In. Mareš, P. Rabušic, L. (2002): Měření (síly) asociace mezi dvěma spojitými proměnnými: korelační koeficienty a grafy.

Korelační analýza v SPSS výběr korelačních koeficientů

Charakteristicky korelačních koeficientů Koeficient Velikost tabulky Rozsah hodnot Směr Symetrický Linearita Phi 2 x 2 <0; 1> ne ano ne Cramerovo V větší než 2 x 2 <0; 1> ne ano ne Lambda jakákoliv velikost <0; 1> ne obě verze ne Gamma jakákoliv velikost <-1; 1> ano ano ano Somersovo d jakákoliv velikost <-1; 1> ano obě verze ano Kendallovo tau b čtvercové tabulky <-1; 1> ano ano ano Kendallovo tau c jakákoliv velikost <-1; 1> ano ano ano Eta jakákoliv velikost <0; 1> ne ne ne Spearmanovo rhó jakákoliv velikost <-1; 1> ano ano ano Pearsonovo r netabelovat <-1; 1> ano ano ano Zdroj: Mareš, P. Rabušic, L. (2002): Měření (síly) asociace mezi dvěma spojitými proměnnými: korelační koeficienty a grafy.

Interpretace hodnot korelačního koeficientu v sociálních vědách (podle de Vaus, 2002) Hodnota korelace interpretace souvislosti 0,01 0,09 triviální, žádná 0,10 0,29 nízká až střední 0,30 0,49 střední až podstatná 0,50 0,69 podstatná až velmi silná 0,70 0,89 velmi silná 0,90 0,99 téměř perfektní

Statistická významnost (significance) Korelační koeficient vypovídá pouze o vztahu proměnných ve výběrovém souboru - cílem výzkumu je ale zobecnit (generalizovat) výsledky na základní soubor - to umožňuje test signifikance Výsledek testu statistické signifikance je závislý na velikosti souboru: - silné korelace lze získat spíše v malých souborech než ve velkých (malé soubory jsou více ovlivněny výběrovou chybou) - silné korelace budou často statisticky nevýznamné v malých souborech, - silná korelace v malém souboru může být statisticky nevýznamná, ale nízká korelace ve velkém souboru může být statisticky významná

Statisticky významný neznamená důležitý Statistická signifikance nemá nic společného s významností věcnou - i statisticky vysoce signifikantní výsledek může mít z věcného hlediska nulový význam Signifikance = jde o podmíněnou pravděpodobnost získání našich dat při platnosti nulové hypotézy v základním souboru a nikoliv o pravděpodobnost platnosti nulové hypotézy při existenci našich dat. neplatí tvrzení, že čím je hodnota statistické významnosti nižší (výsledek statisticky významnější), tím je výsledek důležitější nebo kvalitnější pro vědu či praxi. Více viz: Soukup, P. (2007): Statisticky významný neznamená důležitý. In. Socioweb 6/2007. Dostupné z: http://www.socioweb.cz/index.php?disp=teorie&shw=298&lst=108 Soukup, P., Rabušic, L. (2007): Několik poznámek k jedné obsesi českých sociálních věd statistické významnosti. Sociologický časopis, 43, 2: 379-395,

Příklad: jak souvisí ukazatele ekonomického potenciálu obce s velikostí obce a její periferialitou v rámci regionu Datový soubor: Faktorovka_priklad.sav Obsahuje data za obce JMK (např. vzdálenost od regionální centra, počet obyvatel, míra nezaměstnanosti, bytová výstavba, index stáří, míra vzdělanosti, ekonomická aktivita, infrastruktura, daňový výtěžnost, atd.) Cílem korelační analýzy je zjistit, které proměnné mají statisticky významný vliv na vybrané ukazatele ekonomického potenciálu obce

Příklad použití funkce Compare Means

Porovnání průměrných hodnot - míry nezaměstnanosti - ekonomicky aktivních v terciéru - míry podnikatelské aktivity a - daňové výtěžnosti u různě velkých kategorií obcí (dle počtu obyvatel)

Hodnoty koeficientu ETA a statistická významnost vztahu mezi velikostí obce a indikátory ekonomického potenciálu

Příklad použití funkce Crosstabs

Vztah mezi kategorizovanou mírou nezaměstnanosti a vzdáleností obce od Brna míra korelace