ZX510 Pokročilé statistické metody geografického výzkumu

Podobné dokumenty
Explorační faktorová analýza - analýza hlavních komponent

Lekce 11 EXPLORAČNÍ FAKTOROVÁ ANALÝZA

LEKCE 11 FAKTOROVÁ ANALÝZA

ZX510 Pokročilé statistické metody geografického výzkumu. Téma: Měření síly asociace mezi proměnnými (korelační analýza)

Úvod do vícerozměrných metod. Statistické metody a zpracování dat. Faktorová a komponentní analýza (Úvod do vícerozměrných metod)

Statistické metody a zpracování dat. IX Faktorová a komponentní analýza (Úvod do vícerozměrných metod) Petr Dobrovolný

Faktorová analýza příklad. Obrázek 1 Ukázka části vstupních dat

LEKCE12 FAKTOROVÁ ANALÝZA vzorový výsledek cvičení

AVDAT Mnohorozměrné metody metody redukce dimenze

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Faktorová analýza. PSY252 Statistická analýza dat v psychologii II

6. Dokončená bytová výstavba v relaci s vybranými statistickými charakteristikami území správních obvodů obcí s rozšířenou působností Zlínského kraje

Fakulta chemicko technologická Katedra analytické chemie

Testování hypotéz a měření asociace mezi proměnnými

Příklad 2: Určení cihlářských surovin na základě chemické silikátové analýzy

Výstupy z výukové jednotky. 2. Princip faktorové analýzy

Vyhodnocení průměrných denních analýz kalcinátu ananasového typu. ( Metoda hlavních komponent )

Faktorová analýza Osnova

SEMESTRÁLNÍ PRÁCE. Určení vnitřní struktury analýzou vícerozměrných dat. Ing. Pavel Bouchalík

Faktorová analýza (FACT)

RIZIKO NEDOSTATKU PITNÉ VODY

Vícerozměrné metody. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Schematický úvod

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

INDUKTIVNÍ STATISTIKA

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Vícerozměrné statistické metody

10. Předpovídání - aplikace regresní úlohy

Přednáška 13 Redukce dimenzionality

MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ

KGG/STG Statistika pro geografy

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

KLASIFIKACE LOKÁLNÍCH TRHŮ PRÁCE V MORAVSKOSLEZSKÉM KRAJI S VYUŽITÍM GIS STATISTIK

1 Cíl a oblast výzkumu

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan

Analýzy regionálního trhu práce v České republice Analysis of regional labour market in Czech Republic

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy

Regresní analýza 1. Regresní analýza

Číselné charakteristiky

ANALÝZA REGIONÁLNÍHO ROZVOJE S VYUŽITÍM VÍCEROZMĚRNÝCH STATISTICKÝCH METOD

Pearsonův korelační koeficient

PŘÍKLAD 4.5 Chromatografická analýza farmakologických sloučenin Byly měřeny hodnoty R F pro 20 sloučenin s 18 eluenty. Žádné eluční činidlo však nepro

Počet světlo-absorbujících částic v rovnovážné směsi faktorovou analýzou spekter

Počítačová analýza vícerozměrných dat v oborech přírodních, technických a společenských věd

Hledání optimální polohy stanic a zastávek na tratích regionálního významu

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

You created this PDF from an application that is not licensed to print to novapdf printer (

Příklad 2: Obsah PCB v játrech zemřelých lidí. Zadání: Data: Program:

Ilustrační příklad odhadu LRM v SW Gretl

Odhalení skryté struktury a vnitřních vazeb dat metodami vícerozměrné statistické analýzy

Normální (Gaussovo) rozdělení

Optimalizace provozních podmínek. Eva Jarošová

Cronbachův koeficient α nová adaptovaná metoda uvedení vlastností položkové analýzy deskriptivní induktivní parametrické

Vícerozměrné statistické metody

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Úvodem Dříve les než stromy 3 Operace s maticemi

Testování hypotéz o parametrech regresního modelu

Regresní a korelační analýza

LIDSKÉ ZDROJE JAKO PŘEDPOKLAD REGIONÁLNÍHO ROZVOJE

Regresní a korelační analýza

S E M E S T R Á L N Í

Testování hypotéz o parametrech regresního modelu

Tomáš Karel LS 2012/2013

LINEÁRNÍ REGRESE. Lineární regresní model

, Brno Hanuš Vavrčík Základy statistiky ve vědě

STATISTICKÉ METODY; ZÍSKÁVÁNÍ INFORMACÍ Z DRUHOVÝCH A ENVIRONMENTÁLNÍCH DAT

VI. česko-slovenská konference Doprava, zdraví a životní prostředí Brno

5EN306 Aplikované kvantitativní metody I

Regresní a korelační analýza

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

6. Lineární regresní modely

Regresní a korelační analýza

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

TECHNICKÁ UNIVERZITA V LIBERCI

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

Regresní a korelační analýza

Návod na použití aplikace Limity využití půdy

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Aplikovaná statistika pro učitele a žáky v hodinách zeměpisu aneb jak využít MS Excel v praxi. Geografický seminář 30. března 2011 Pavel Bednář

Statistické testování hypotéz II

TECHNICKÁ UNIVERZITA V LIBERCI

Spokojenost se životem

Univerzita Pardubice. Fakulta chemicko-technologická. Katedra analytické chemie. Semestrální práce. Licenční studium

Interakce úrovně vzdělání a faktoru nezaměstnanosti v hospodářsky slabých a silných obcích České republiky

Plánování experimentu

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

Karta předmětu prezenční studium

cena 19,9% technici 20,4% design 20,8% značka 20,3% praktici 18,6%

POLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými.

Statistika (KMI/PSTAT)

11.Metody molekulové spektrometrie pro kvantitativní analýzu léčiv

MULTIFAKTOROVÁ ANALÝZA DOPRAVNÍ NEHODOVOSTI

Analýza a vyhodnocení obsahu územně analytických podkladů krajů

Porovnání dvou výběrů

Transkript:

ZX510 Pokročilé statistické metody geografického výzkumu Téma: Explorační faktorová analýza (analýza hlavních komponent)

Smysl a princip faktorové analýzy v explorační verzi není faktorová analýza určena k meritorní analýze, tzn. neslouží k testování hypotéz ani k měření vztahů mezi nezávisle a závisle proměnnou jejím cílem je především redukce dat a odhalení (explorace) skrytých souvislostí z mnoha položek (proměnných) vybere ty, které statisticky patří k sobě (vykazují podobnou variabilitu) a z nichž je možné vytvořit novou proměnnou (faktor, komponentu)

Příklad: analýza faktorů rozvojového potenciálu obcí Jihomoravského kraje Datový soubor: Faktorovka_priklad.sav Obsahuje data za obce JMK u kterých předpokládáme, že představují dílčí indikátory rozvojového potenciálu obcí (např. vzdálenost od regionální centra, počet obyvatel, míra nezaměstnanosti, bytová výstavba, index stáří, míra vzdělanosti, ekonomická aktivita, infrastruktura, daňový výtěžnost, atd.) Cílem faktorové analýzy je zjistit, zda proměnné společně tvoří určité komponenty, představující faktory rozvojového potenciálu obcí

Faktorová analýza v SPSS

Postup faktorové analýzy (1) Typ dat - musíme rozhodnout, zda jsou data pro faktorovou analýzu vhodná; (2) Počet faktorů - musíme rozhodnout, s jakým počtem faktorů (komponent) budeme pracovat; (3) Výpočet sycení faktorů a jejich pojmenování - musíme vypočítat faktorové zátěže a jednotlivé faktory pojmenovat

Ad 1. Vhodnost dat pro faktorovou analýzu Položky vstupující do faktorové analýzy, musí mít podobu ordinálních nebo intervalových proměnných, nevhodné jsou dichotomické proměnné (výjimečně je možné použít tzv. dummy variables) Proměnné by mezi sebou měly korelovat (viz. výstup v podobě tzv. matice interkorelací), ale neměl by mezi nimi být kauzální vztah Míru vhodnosti dat zjistíme také s tzv. anti-image matice s hodnotami Kaiser-Meyer-Olkinovy míry - KMO míra vhodnosti položek pro faktorovou analýzu. Hodnota KMO by měla být vyšší než 0,6. Signifikance tzv. Bartlettova testu sféricity by měla být významná minimálně na úrovni 0,05.

Vhodnost dat pro faktorovou analýzu

Ad 2. Extrakce faktorů Musíme rozhodnout, s kolika faktory máme pracovat výpočet tzv. eigen hodnoty (eigenvalue) volíme takový počet faktorů (komponent), které mají hodnotu eigenvalue vyšší než 1 (tzv. Kaiserovo pravidlo) zvolíme takový počet faktorů, který nám bude vysvětlovat dostatečné % variability v souboru zvolíme takový počet faktorů, které v grafu (Scree plot) budou nad tzv. zlomem či prolomením křivky

Ad 2. Extrakce faktorů

Výstupy z faktorové analýzy

Výstupy z faktorové analýzy

Ad 3. Výpočet faktorových zátěží a pojmenování faktorů výpočet faktorových zátěží (factor loadings) - tyto zátěže jsou korelace mezi faktorem a příslušnou položkou -čím vyšší je korelace, tím více je faktor touto položkou sycen (korelace by měla být vyšší než 0,30).

Rotace faktorů - smyslem rotace faktorů je, aby se původně rozptýlené body co nejvíce přimkly k jednomu z extrahovaných faktorů Obr. rozptyl hodnot kolem faktorů při nerotovaném a rotovaném řešení Obr.: Faktorové zát že 10 položek ve dvoufaktorovém ešení br. : Ukázka rotace faktor : 1 Faktor 2 Faktor 1 1 Faktor 2 0,5 0,5 Faktor 1 0-1 -0,5 0 0,5 1 0-1 -0,5 0 0,5 1-0,5-0,5 p6-1 -1

Základní typy rotace Rotace Varimax ortogonální (pravoúhlá, kolmá) extrahované faktory nemusí korelovat výstupem je tabulka tzv. pattern matrix ve které hodnoty představují korelace a zároveň sycení (loadings) mezi faktory a proměnnými

Základní typy rotace Rotace Oblimin šikmá předpokládáme, že extrahované faktory navzájem korelují! Výstupem jsou dvě tabulky: tzv. pattern matrix ve které hodnoty sycení (loadings) představují regresní koeficient, který určuje hodnotu proměnné a tzv. structure matrix představuje hodnoty korelace mezi faktorem a proměnnou

Výstupy nerotované a nestrukturované řešení

Výstupy nerotované strukturované řešení

Výstupy rotované řešení - Varimax

Výstupy rotované řešení - Oblimin

Pojmenování faktorů u vybraného řešení (Oblimin) 1 ekonomický potenciál Pattern Matrix a 2 demografický růst Component 3 vybavenost 4 perifernost daňová výtěžnost,774,327 podnikatelská_aktivita,759 EA_terciér,584 -,387 vzdělanost,574 -,466 hustota,468 -,424 dokončené byty,906 přirustek obyvatel,858 index_stari -,550,490 technická infrastruktura -,800 občanská vybavenost -,792 zeleznice -,700 vzdálenost od Brno,850 nezaměstnanost,841 vzdálenost od ORP,642 Extraction Method: Principal Component Analysis. Rotation Method: Oblimin with Kaiser Normalization.

Ukázka mapového zpracování výsledků analýzy kategorizace obcí dle hodnot dílčích faktorů

Ukázka mapového zpracování výsledků analýzy kategorizace obcí dle celkové hodnoty rozvojového potenciálu