Faktorová analýza příklad. Obrázek 1 Ukázka části vstupních dat

Podobné dokumenty
AVDAT Mnohorozměrné metody metody redukce dimenze

Příklad 2: Určení cihlářských surovin na základě chemické silikátové analýzy

LEKCE 11 FAKTOROVÁ ANALÝZA

ZX510 Pokročilé statistické metody geografického výzkumu

Fakulta chemicko technologická Katedra analytické chemie

Faktorová analýza. PSY252 Statistická analýza dat v psychologii II

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

Úvod do vícerozměrných metod. Statistické metody a zpracování dat. Faktorová a komponentní analýza (Úvod do vícerozměrných metod)

Statistické metody a zpracování dat. IX Faktorová a komponentní analýza (Úvod do vícerozměrných metod) Petr Dobrovolný

LEKCE12 FAKTOROVÁ ANALÝZA vzorový výsledek cvičení

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

Shluková analýza příklad

Výstupy z výukové jednotky. 2. Princip faktorové analýzy

Vyhodnocení průměrných denních analýz kalcinátu ananasového typu. ( Metoda hlavních komponent )

SEMESTRÁ LNÍ PRÁ CE. Licenč ní studium STATISTICKÉZPRACOVÁ NÍ DAT PŘ I KONTROLE A Ř ÍZENÍ JAKOSTI. Předmě t POČ ÍTAČ OVÁ ANALÝ ZA VÍCEROZMĚ RNÝ CH DAT

Lekce 11 EXPLORAČNÍ FAKTOROVÁ ANALÝZA

Vícerozměrné statistické metody

ÚKOL ,77 5,00 5 2,531,003,056 -,869,113

(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination.

Fakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

Příklad 2: Obsah PCB v játrech zemřelých lidí. Zadání: Data: Program:

Faktorová analýza (FACT)

Vícerozměrné statistické metody

INTRODUCTION TO MACHINE LEARNING (NPFL054) A template for Homework #2

Technické informace Technical book MANITOU MI 15-35

Počítačová analýza vícerozměrných dat

Pomůcka pro cvičení: 3. semestr Bc studia

TECHNICKÁ UNIVERZITA V LIBERCI

Explorační faktorová analýza - analýza hlavních komponent


Technická univerzita v Liberci

Vícerozměrné statistické metody

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

SEMESTRÁLNÍ PRÁCE. Určení vnitřní struktury analýzou vícerozměrných dat. Ing. Pavel Bouchalík

Popisná statistika. Komentované řešení pomocí MS Excel

Cronbachův koeficient α nová adaptovaná metoda uvedení vlastností položkové analýzy deskriptivní induktivní parametrické

S E M E S T R Á L N Í

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza



UNIVERZITA PARDUBICE. Semestrální práce z 5. soustředění

Analýza dat z dotazníkových šetření. Zdrojová data: dotazník

Počítačová analýza vícerozměrných dat v oborech přírodních, technických a společenských věd

Univerzita Pardubice 8. licenční studium chemometrie

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie

Mimořádná nabídka optiky ZEISS Číslo zboží Popis Záměrná MOC osnova s DPH ,8-5x38 Z-plex Kč

TECHNICKÁ UNIVERZITA V LIBERCI

Zadání Máme data hdp.wf1, která najdete zde: Bodová předpověď: Intervalová předpověď:

Kdy kanonická korelace a kdy vícerozměrná lineární regrese?

SYSTÉM S POSTUP. PRIPOJOVÁNÍM SACÍCH JEDNOTEK

Stay classic. Ride different... Be free

Poměrní ukazatelé. Centrum pro virtuální a moderní metody a formy vzdělávání na Obchodní akademii T. G. Masaryka, Kostelec nad Orlicí

Faktorová analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Semestrální projekt. do předmětu Statistika. Vypracoval: Adam Mlejnek Oponenti: Patrik Novotný Jakub Nováček Click here to buy 2

KSBR 44 INS 11969/2014-A-4

Fakulta chemicko-technologická Katedra analytické chemie. Licenční studium Statistické zpracování dat při managementu jakosti. Semestrální práce:

Příprava souboru dat a analýza

Faktorová analýza Osnova

Standardní výbava Gratulujeme k vytvoření konfigurace Vašeho nového vozu Mazda. Zde naleznete standardní výbavu a vybrané doplňkové příslušenství.

Návrhy dalších možností statistického zpracování aktualizovaných dat

LEKCE 02a UNIVARIAČNÍ ANALÝZA KATEGORIZOVANÝCH DAT


VÝBAVY A CENY AVEO 4DVEŘOVÉ

skladbu obou směsí ( v tunách komponenty na 1 tunu směsi):

Metodologie pro Informační studia a knihovnictví 2

Hodnocení obcí podle zastoupení druhů pozemků 1

Technická specifikace - 1. tovární značka [DOPLNÍ UCHAZEČ] - benzinový motor - typ B-SUV

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

Příloha č.1 Vypočtené hodnoty jednotlivých proměnných indexu OCA pro MUBS za období

VÝBAVY A CENY AVEO 5DVEŘOVÉ

KGG/STG Statistika pro geografy

Standardní výbava Gratulujeme k vytvoření konfigurace Vašeho nového vozu Mazda. Zde naleznete standardní výbavu a vybrané doplňkové příslušenství.

Optimalizace provozních podmínek. Eva Jarošová

Optimalizace parametrů hmotnostního detektoru (MS/MS) s využitím vícerozměrných statistických analýz

Příloha zadávací dokumentace č. 1 Vymezení předmětu veřejné zakázky

Ilustrační příklad odhadu LRM v SW Gretl

PSY117/454 Statistická analýza dat v psychologii Přednáška 5 ZOBRAZENÍ DVOUROZMĚRNÝCH DAT KORELAČNÍ KOEFICIENT. Všichni žijeme v matrixu.

V praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více

CZ.1.07/1.2.08/ Vyhledávání talentů pro konkurenceschopnost a práce s nimi. Závislost úspěšnosti v testu TP2 na známce z matematiky

Demografická trajektorie České republiky v rámci regionu EU

Internal bounds and hidden structure of the metallurgic data with the use of Multivariate Data Analysis MDA

TECHNICKÁ UNIVERZITA V LIBERCI EKONOMICKÁ FAKULTA

1 Cíl a oblast výzkumu

Lekce 2 ZÁKLADY UNIVARIAČNÍ ANALÝZY A) ROZLOŽENÍ KATEGORIZOVANÝCH DAT

Analýza hlavních komponent

Technická data Platná pro modelový rok Nový Caddy

PŘÍKLAD 4.5 Chromatografická analýza farmakologických sloučenin Byly měřeny hodnoty R F pro 20 sloučenin s 18 eluenty. Žádné eluční činidlo však nepro

Metodologie pro Informační studia a knihovnictví 2

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

Čtvrtotáčkové motorové šnekové převodovky - ZPM KATALOG 8/12

TECHNICKÁ UNIVERZITA V LIBERCI

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání


ŠKODA KODIAQ RS Vznětové motory

POLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými.

6. Dokončená bytová výstavba v relaci s vybranými statistickými charakteristikami území správních obvodů obcí s rozšířenou působností Zlínského kraje

Analýzy regionálního trhu práce v České republice Analysis of regional labour market in Czech Republic

21E403: Výzkum provozních podmínek mechanických automobilních převodovek.

Metodika. Zájmová území

Transkript:

Faktorová analýza příklad Obrázek 1 Ukázka části vstupních dat

Maticový graf vybraných proměnných: Fueltank Passengers Length Wheelbase Width U Turn Space Rear seat Luggage Weight Horsepower Engine Size

Proměnné, které jsou předmětem faktorové analýzy: Engine Size (číslo motoru) Horsepower (výkon motoru v koňských silách) Fueltank (obsah palivové nádrže) Passengers (maximální počet cestujících) Length (délka vozu) Wheelbase (rozvor) Width (šířka vozu) U Turn Space Rear seat (zadní sedadla prostor) Luggage (zavazadlový prostor) Weight (hmotnost vozu) Výstupy z SGP: Factor Analysis Data variables: Engine Size (liters) Horsepower (maximum) Fueltank (gallons) Passengers (persons) Length (inches) Wheelbase (inches) Width (inches) U Turn Space (feet) Rear seat (inches) Luggage (cu. ft.) Weight (pounds) Data input: observations Number of complete cases: 82 Missing value treatment: listwise Standardized: yes Type of factoring: principal components Number of factors extracted: 2 Byly vytvořeny 2 faktory!

Factor Analysis Factor Percent of Cumulative Number Eigenvalue Variance Percentage 1 7,92395 72,036 72,036 2 1,32354 12,032 84,068 3 0,47071 4,279 88,347 4 0,353248 3,211 91,559 5 0,269048 2,446 94,004 6 0,190242 1,729 95,734 7 0,172892 1,572 97,306 8 0,107148 0,974 98,280 9 0,0824071 0,749 99,029 10 0,0694689 0,632 99,660 11 0,0373497 0,340 100,000 Počet faktorů zde byl vytvořen podle procenta vysvětlené variability. Dva faktory dokáží vysvětlit 84,068 % variability původních dat. Pouze 2 vlastní čísla korelační matice(eigenvalue) překračují předem stanovenou hodnotu 1 viz sloupec s hodnotami Eigenvalue. To dobře ukazuje i následující Scree Plot: Scree Plot 8 6 Eigenvalue 4 2 0 0 2 4 6 8 10 12 Factor V následující tabulce jsou počáteční hodnoty komunalit. Initial Variable Communality Engine Size 1,0 Horsepower 1,0 Fueltank 1,0 Passengers 1,0 Length 1,0 Wheelbase 1,0 Width 1,0 U Turn Space 1,0 Rear seat 1,0 Luggage 1,0 Weight 1,0

V následující tabulce vidíme odhadované hodnoty koeficientů pro každý faktor před provedením jakékoli rotace. Ve druhé tabulce jsou hodnoty komunalit (Estimated Communality), které vyjadřují, jak dobře je daný ukazatel vysvětlen použitým modelem. Jedná se o rozptyl společných faktorů. Specific Variance (specifický nebo také chybový rozptyl) je zbývající část rozptylu proměnných. Factor Loading Matrix Before Rotation Factor Factor 1 2 Engine Size 0,936606-0,154035 Horsepower 0,754754-0,50948 Fueltank 0,876138-0,241737 Passengers 0,671882 0,610074 Length 0,944075 0,0244126 Wheelbase 0,944096 0,0702147 Width 0,914567-0,154446 U Turn Space 0,842284-0,0955416 Rear seat 0,650975 0,613778 Luggage 0,778316 0,371338 Weight 0,948687-0,237682 Estimated Specific Variable Communality Variance Engine Size 0,900958 0,0990419 Horsepower 0,829223 0,170777 Fueltank 0,826054 0,173946 Passengers 0,823616 0,176384 Length 0,891874 0,108126 Wheelbase 0,896247 0,103753 Width 0,860287 0,139713 U Turn Space 0,71857 0,28143 Rear seat 0,800491 0,199509 Luggage 0,743667 0,256333 Weight 0,9565 0,0435005 Toto řešení nemusí být optimální, proto se provádí rotace faktorů, zde pomocí metody VARIMAX. Z následující tabulky, která uvádí jednotlivé faktorové zátěže, můžeme zjistit, že dominantní proměnné u Faktoru 1 jsou: Engine Size, Horsepower, Fueltank, Length, Wheelbase, Width, U Turn Space a Weight. Faktor 1 by tedy bylo možné nazvat Technické parametry vozidla. Faktor 2 obsahuje 3 dominantní proměnné Passangers, Rear seat a Luggage. Faktor 2 by bylo možné nazvat Užitné vlastnosti vozidla. Vysoké hodnoty faktorových zátěží u uvedených 3 proměnných naznačují, že Faktor 2 označuje vozidla velkých rodin jako jsou velkoprostorové osobní automobily, resp. malé dodávkové automobily a vozy SUV. Factor Loading Matrix After Varimax Rotation Factor Factor 1 2 Engine Size 0,859769 0,402188 Horsepower 0,910596 0,00617243 Fueltank 0,859441 0,295661 Passengers 0,209571 0,883004 Length 0,765091 0,553632 Wheelbase 0,739226 0,591432 Width 0,841818 0,389395 U Turn Space 0,748896 0,397145 Rear seat 0,190229 0,874245 Luggage 0,43229 0,746186 Weight 0,917004 0,340004

Estimated Specific Variable Communality Variance Engine Size 0,900958 0,0990419 Horsepower 0,829223 0,170777 Fueltank 0,826054 0,173946 Passengers 0,823616 0,176384 Length 0,891874 0,108126 Wheelbase 0,896247 0,103753 Width 0,860287 0,139713 U Turn Space 0,71857 0,28143 Rear seat 0,800491 0,199509 Luggage 0,743667 0,256333 Weight 0,9565 0,0435005 Následující graf ukazuje dominantní proměnné u jednotlivých faktorů. Plot of Factor Loadings 1 0,8 Rear Passengers seat Luggage Factor 2 0,6 0,4 0,2 Wheelbase Length U Turn Space Engine Width Size Weight Fueltank 0 Horsepower 0 0,2 0,4 0,6 0,8 1 Factor 1