Faktorová analýza. PSY252 Statistická analýza dat v psychologii II

Podobné dokumenty
Vícerozměrné metody. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Schematický úvod

ZX510 Pokročilé statistické metody geografického výzkumu

Faktorová analýza příklad. Obrázek 1 Ukázka části vstupních dat

Úvod do vícerozměrných metod. Statistické metody a zpracování dat. Faktorová a komponentní analýza (Úvod do vícerozměrných metod)

Statistické metody a zpracování dat. IX Faktorová a komponentní analýza (Úvod do vícerozměrných metod) Petr Dobrovolný

Vyhodnocení průměrných denních analýz kalcinátu ananasového typu. ( Metoda hlavních komponent )

Příklad 2: Určení cihlářských surovin na základě chemické silikátové analýzy

LEKCE 11 FAKTOROVÁ ANALÝZA

AVDAT Mnohorozměrné metody, metody klasifikace

AVDAT Klasický lineární model, metoda nejmenších

AVDAT Mnohorozměrné metody metody redukce dimenze

vzorek vzorek

KONFIRMAČNÍ FAKTOROVÁ ANALÝZA. STANDA JEŽEK FSS:PSY stan&apps.fss.muni.cz

Faktorová analýza Osnova

Fakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy

Cronbachův koeficient α nová adaptovaná metoda uvedení vlastností položkové analýzy deskriptivní induktivní parametrické

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

Explorační faktorová analýza - analýza hlavních komponent

Výstupy z výukové jednotky. 2. Princip faktorové analýzy

POLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými.

6. Lineární regresní modely

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

Fakulta chemicko technologická Katedra analytické chemie

TECHNICKÁ UNIVERZITA V LIBERCI

Statistická analýza dat

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

Pokročilejší metody: výběr. Začínáme otázkami na povahu vysvětlované proměnné a končíme otázkami na povahu vysvětlujících proměnných

Univerzita Pardubice 8. licenční studium chemometrie

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

Korelační a regresní analýza

Statistické testování hypotéz II

SEMESTRÁLNÍ PRÁCE. Určení vnitřní struktury analýzou vícerozměrných dat. Ing. Pavel Bouchalík

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

Lekce 11 EXPLORAČNÍ FAKTOROVÁ ANALÝZA

TECHNICKÁ UNIVERZITA V LIBERCI EKONOMICKÁ FAKULTA

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination.

Příklad 2: Obsah PCB v játrech zemřelých lidí. Zadání: Data: Program:

TECHNICKÁ UNIVERZITA V LIBERCI

Simulace. Simulace dat. Parametry

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Ilustrační příklad odhadu LRM v SW Gretl

Optimalizace provozních podmínek. Eva Jarošová

Regresní analýza 1. Regresní analýza

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

PSY117/454 Statistická analýza dat v psychologii Přednáška 5 ZOBRAZENÍ DVOUROZMĚRNÝCH DAT KORELAČNÍ KOEFICIENT. Všichni žijeme v matrixu.

Regresní a korelační analýza

Tomáš Karel LS 2012/2013

PSY117/454 Statistická analýza dat v psychologii. Zobrazení dvojrozměrných dat Bodový graf - Scatterplot Korelační koeficient

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

Úvodem Dříve les než stromy 3 Operace s maticemi

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Regresní a korelační analýza

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Analýzy regionálního trhu práce v České republice Analysis of regional labour market in Czech Republic

Seminář 6 statistické testy

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Seminář 6 statistické testy

Testování hypotéz a měření asociace mezi proměnnými

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Jednofaktorová analýza rozptylu

Faktorová analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

6. Lineární regresní modely

, Brno Hanuš Vavrčík Základy statistiky ve vědě

PSY401 Metodologie v psychologii Designy kvantitativního výzkumu*

8 Coxův model proporcionálních rizik I

Vícerozměrná rozdělení

Testování hypotéz o parametrech regresního modelu

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan

Testování hypotéz o parametrech regresního modelu

Analýza rozptylu. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Srovnávání více než dvou průměrů

PSY117/454 Statistická analýza dat v psychologii Přednáška 10

Vícerozměrné statistické metody

4EK211 Základy ekonometrie

ČETNOSTI A ROZLOŽENÍ ČETNOSTÍ

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Vzorová prezentace do předmětu Statistika

Cvičení ze statistiky - 3. Filip Děchtěrenko

Tabulka 1. Výběr z datové tabulky

Tomáš Karel LS 2012/2013

ADDS cviceni. Pavlina Kuranova

Obsah přednášky Jaká asi bude chyba modelu na nových datech?

Počítačová analýza vícerozměrných dat v oborech přírodních, technických a společenských věd

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Faktorová analýza (FACT)

METODOLOGIE I - METODOLOGIE KVANTITATIVNÍHO VÝZKUMU

Inovace bakalářského studijního oboru Aplikovaná chemie

PRAVDĚPODOBNOST A STATISTIKA

Transkript:

Faktorová analýza PSY252 Statistická analýza dat v psychologii II 8.12.2010

Latentní a manifestní proměnné Perspektiva CTT: (pro)jevy, které spolu nějakým způsobem souvisejí, mají stejnou podstatu, jsou určeny stejnou latentní proměnnou LP je hypotetický konstrukt, odvozený právě z manifestací (jevů), které spolu nějakým způsobem kovariují Manifestní proměnné tedy sdílí nějakou část svého celkového rozptylu 2 Classical test theory, latent & manifest variables, structural equation modelling

Faktorový model 3 Dvě složky rozptylu manifestní proměnné ve faktorovém modelu: Komunalita: sdílený (faktorový) rozptyl určený latentní proměnnou, společný s ostatními proměnnými Unicita: jedinečnost, vlastní část rozptylu proměnné Unicita = 1 komunalita CTT: Unicita zahrnuje jednak část vlastního rozptylu proměnné, jednak chybu měření Sdílený rozptyl je patrný z korelační matice MP; jsou-li korelace MP nenulové, potom MP sdílí nějakou část rozptylu Celkový rozptyl, sdílený rozptyl, jedinečný rozptyl

Faktorový model Korelující proměnné mohou být nahrazeny jedinou proměnnou, která je jejich lineární kombinací faktorem. Faktorový náboj (Fx, Fy) je interpretován jako korelace původní proměnné s daným faktorem. Komunalita h 2 = FxP1 2 * FyP1 2 je faktorový rozptyl položky, podíl rozptylu položky vyčerpaný daným faktorovým řešením. Dobrá struktura je požadavek na jasnost faktorové matice. Každá položka by měla vysoko skórovat v právě jednom faktoru, každý faktor by měl obsahovat dva nebo více vysokých faktorových nábojů. 4 Korelační matice P1 P2 P3 P4 Faktorová matice P1 P2 P3 P4 P1 -,14,74,08 Factor loadings, simple structure, communality, 1 F1,73,47,87,58 P2 P3 -,14,74 1,19,19 1,59,17 F2 -,60,77 -,35,66 P4,08,59,17 1 h 2,89,81,87,77

Explorativní a konfirmatorní FA Exploratorní faktorová analýza je analytický postup, jehož smyslem je nalézt optimální matici faktorových nábojů, které maximálně zjednoduší korelační matici = při co nejmenším počtu faktorů vysvětlí co největší podíl celkového rozptylu Redukce korelační matice Metoda maximální věrohodnosti (maximum likelihood) Vlastní FA; zdůrazňuje specifické faktory Analýza hlavních komponent (principal components) Postupný rozbor sdílených rozptylů; zdůrazňuje g-faktor Konfirmatorní faktorová analýza je test hypotézy o korelační a faktorové matici Matice je nulová Matice má konkrétní strukturu Kdykoliv je to možné, měli bychom se snažit o použití CFA tedy formulovat hypotézy, spíše než dojit data Software nám bohužel nevychází vstříc STATISTICA SEPATH SPSS AMOS LISREL, M+ a další 5

Předpoklady použití FA 6 Možnost vytvoření smysluplné korelační matice: Alespoň ordinální úroveň měření Rozložení proměnných nesmí být extrémně šikmé Proměnné musí pocházet zhruba ze stejné domény Až na speciální případy nemá smysl analyzovat jednotlivé položky osobnostního dotazníku společně se součtovými skóry jiného či proměnnými úplně jiného charakteru (výsledky výkonového testu) Smysluplný počet položek: 3 při předpokladu jediného faktoru k*2 při předpokladu k faktorů (jinak nemůže vzniknout Thurstonova struktura) Adekvátní počet měření Málo je málo a moc je moc Absolutní minimum velikosti vzorku je N>5*mp a současně N>20*k, ideálně od N>20*mp Extrémně velké soubory poskytují nepříjemně přesné odhady parametrů: V CFA paradoxně dochází k zamítnutí jakéhokoliv modelu V ML nikdy nevyjde uspokojivě test dobré shody Proto se zavádí tzv. Chi2/df ratio: Chi2/df by měl poskytovat hodnotu okolo 2, nikdy více než 5

Komunality Přehled komunalit... V PC vždy vyšší. požadavek alespoň 0,7 teoreticky! V případě ML pozor na tzv. nevlastní řešení (Heywoodův případ) faktorová matice je problematická Znamená, že některá z položek vyčnívá, je sama o sobě faktorem 7

Eigenvalue & Explained variance Přehled vysvětleného rozptylu 8 Eigen value vlastní hodnota Suma eigenvalues vždy rovna počtu položek Vypovídá o poměru rozptylu vysvětleného daným faktorem/komponentou vzhledem k celku Obdobně procentuální údaj Eigenvalue je obvykle kriteriem volby počtu interpretovaných faktorů/komponent Eigen > 1 Nemá smysl interpretovat faktory, které vysvětlují méně než jednu proměnnou

Je řešení smysluplné? Test dobré shody a reprodukovaná matice Test dobré shody (pouze ML) Test hypotézy o residuální matici!!! Testujeme hypotézu o tom, že residuální matice je nulová tedy naším požadavkem je dojít k neprůkaznému testu V praxi problematické, na velkých souborech je test vždy průkazný a na malých průkaznost nespolehlivá Proto požadavek na Chi2/df ratio okolo hodnoty 2 Residuální matice by neměla obsahovat věcně významné korelace (dejme tomu do 10%) 9

Komponentová/faktorová matice Primární výstup PC/ML, obsahuje matici nerotovaných faktorových nábojů Kontrola požadavků na dobrou strukturu! Za nepodstatné lze považovat pouze náboje pod 0,1 Pokud není jasná dobrá struktura, rotujeme. 10

Rotovaná matice Rotovaná matice je výsledek pokusu vyčistit řešení při zachování stávajících dimenzí Pokud ani rotovaná matice nedává smysl, opouštíme FA jako řešení daného problému... 11