LEKCE 11 FAKTOROVÁ ANALÝZA
|
|
- Vít Dostál
- před 6 lety
- Počet zobrazení:
Transkript
1 LEKCE 11 FAKTOROVÁ ANALÝZA Představuje způsob REDUKCE DAT: Jde o přeměnu souboru vzájemně korelovaných proměnných (matice jejich korelací) na menší soubor nekorelovaných faktorů, tento původní soubor reprezentující Barevně označené položky patří do společného faktoru a lze je zahrnout pod obecnější pojem +1 FAKTOR 1 *A (latentní proměnná 1) *B *D *C silnější korelace mezi A, B, C, D slabší korelace mezi proměnnými patřícími k různým faktorům (například mezi C a I, D a H etc.) I* korelace *E *G proměnné E H* s faktorem 1 FAKTOR 2 (latentní proměnná 2) korelace proměnné E silnější korelace s faktorem 2 mezi E, F, G, H, I -1 Poznámky: - Faktory jsou statistickými útvary. - Rozsah stupnic na osách je <-1;1> neboť jde o korelační koeficienty
2 2 DEMONSTRACE VÝSLEDKU FAKTOROVÉ ANALÝZA Zde je seznam věcí, o nichž si lidé myslí, že jsou nutné pro úspěšné manželství. Prosím, řekněte mi pro každou z nich, zda ji považujete za 1 = velmi důležitou, 2 = spíše důležitou, nebo 3 = nepříliš důležitou pro úspěšné manželství. Časté debaty o společných zájmech Dělba domácích prací Společné trávení co nejvíce času Věrnost Shoda názorů na politiku Společné náboženské přesvědčení Stejný etnický původ Stejný sociální původ Děti Dobré bydlení Přiměřený příjem Ochota diskutovat o problémech Porozumění a snášenlivost Vzájemná úcta a uznání Dobré sexuální soužití Oddělené bydlení od rodičů partnera Zde jsou použité škály seřazeny tak, jak se seskupily při FAKTOROVÉ ANALÝZE v jednotlivých faktorech (nejsou tedy zde prezentovány vlastní výstupy z faktorové analýzy). Příklad uvádíme i s vědomím, že pouze třístupňové škály nejsou pro použití faktorové analýzy nejideálnější.
3 3 POUŽITÍ FAKTOROVÉ ANALÝZY Vytvoření faktorů a jejich věcná interpretace dle významu proměnných ve faktoru seskupených (vytvořit a pojmenovat). Identifikace relevantních ukazatelů (vyřazení otázek, které nepracují tak, jak se od nich očekávalo - nepatří do faktoru jak se původně předpokládalo). Vytvoření sumačních indexů uvnitř faktorů, nebo použití tzv. faktorových skóre jako nových proměnných a jejich další analýza např. pomocí procedur jako t-test, analýza variancí, regrese, diskriminační analýza. Příklad: Otázka: Prosím, řekněte o každé z následujících skutečností, jak je ve Vašem životě důležitá: Velmi Dost Ne příliš Vůbec ne důležitá důležitá důležitá důležitá Q1_1 Práce Q1_2 Rodina Q1_3 Přátelé a známí Q1_4 Volný čas Q1_5 Politika Q1_6 Náboženství Poznámka: Pro demonstraci volíme menší počet položek, ale ve skutečnosti má smysl položky faktorovat až od určitého většího počtu.
4 4 POSTUP FAKTOROVÉ ANALÝZY 1. Musíme rozhodnout co s případy, které mají "missing value" pro některé z použitých proměnných. 2. Provedeme výpočet korelační nebo kovarianční matice (někdy tato matice může představovat vstupní data). Korelační matice je základním vstupem dat pro faktorovou analýzu, která je de facto právě analýzou korelační matice. 3. Zjišťujeme jak dobře odpovídá zvolený model faktorové analýzy našim datům a také zda jsou všechny proměnné vhodné (zda některé z nich neoslabují řešení). Mají-li proměnné velmi slabé korelace s ostatními proměnnými, měly by být v dalším běhu z analýzy vyloučeny (zjišťujeme, zda je model pro soubor o tyto proměnné oproštěný vhodnější. 4. Provedeme faktorovou extrakci (factor extraction) neboli současně identifikaci faktorů a určení příslušnosti jednotlivých položek k faktorům. Je možné zvolit z několika metod extrakce (doporučuje se začít s metodou hlavních komponentů - principle components). Provádí se též a odhad faktorových zátěží (factor loadings) neboli korelací mezi faktorem a jeho prvky (položkami k faktoru příslušejícími). 5. Rotace řešení. Má přispět k lepší interpretovatelnosti faktorové zátěže. Rotace faktorovou má za cíl dále zvýšit sílu silných zátěží a snížit sílu nízkých zátěží. Máme možnost volit z několika metod rotace. 6. Výpočet faktorových skóre pro každý případ a jejich přiřazení těmto případům (nové proměnné). Skóre může sloužit také k identifikaci odlehlých případů, formulaci strategie zacházení s nimi nebo pro další analýzy. 7. Eventuální uložení faktorových skóre pro další výpočty.
5 5 ANALYZE Data Reduction Factor Variables: (uvedou se proměnné) DESCRIPTIVES STATISTICS Univariate descriptives Initial Solution CORRELATION MATRIX Coefficients KMO and Bartlett's test of Sphericity EXTRACTION METHOD Principal Components ANALYZE Correlation Matrix DISPLAY Unrotated Factor Solution Scree Plot ROTATION METHOD Varimax, DISPLAY Rotated Solution Loading Plots SCORES SAVE AS VARIABLES DISPLAY FACTOR SCORE COEFFICIENT MATRIX OPTIONS MISSING VALUE COEFFICIENT DISPLAY FORMAT Sorted by Size Suppress absolute values less than: 0.20
6 6 Zadání položek, které budou faktorovány: Zadání popisných statistik a měr adekvátnosti použití faktorové analýzy JE FAKTOROVÁ ANALÝZA VHODNÝM MODELEM PRO DATA? (míry adekvátnosti použití faktorové analýzy) Bartlettův test sféricity (Bartlett s test of sphericty). KMO: Kaiser-Mayer-Olkinova míra adekvátnosti výběru (Kaiser-Mayer-Olkin Measure of Sampling Adequacy) Matice negativních hodnot parciálních koeficientů (anti-image correlation matrix)
7 7 BARTLETTŮV TEST SFÉRICITY (Bartlett s Test of Sphericity). Testování nulové hypotézy, že korelační matice je maticí jednotkovou (identity matrix) neboli, že v korelační matici jsou na diagonále hodnoty 1 a v ostatních polích hodnoty 0 neboli, že vztahy mezi kombinacemi všech dvojic proměnných neexistují. KMO - Kaiser-Mayer-Olkinova míra adekvátnosti výběru (Kaiser-Mayer-Olkin Measure of Sampling Adequacy) Index porovnávající velikosti pozorovaných korelačních koeficientů a velikost koeficientů parciální korelace. Malé hodnoty KMO indikují, nevhodnost použití faktorové analýzy (korelace mezi páry proměnných nemohou být vysvětleny jinými proměnnými). Velikost KMO a použitelnost FA: 0,90... skvělá 0,80... velmi dobrá 0,70... střední 0,60... slabší 0,50... bídná pod 0,5... nevyhovující Příklad: KMO and Bartlett's Test Kaiser-Meyer-Olkin Measure of Sampling Adequacy..565 Bartlett's Test of Sphericity Approx. Chi-Square df Sig Jak je vidět, použití faktorové analýzy není ideální (nepředstavuje vhodný model pro data). Zadání extrakce faktorů a metody této extrakce (zde Principal components):
8 8 Rozhodnutí o podobě výstupu a o způsobu zacházení s missing values Označte při zadávání sorted by size, dostanete nejčitelnější výstup! Zacházení s missing valeues: Listwise: Z analýzy jsou vyloučeny všechny případy, jež mají v některé z faktorovaných položek missing value. Pairwise: Z analýza jsou vyloučeny případy s missing values jen pro ty konkrétní případy (položky), v nichž missing value existuje.
9 9 TOTAL VARIANCE EXPLAINED Tabulka obsahuje ve sloupci "Eigenvalue celkovou variance vysvětlenou každým faktorem. EIGENVALUES (také characteristic roots nebo latent roots ) jsou variance komponent. Jejich velikosti popisuje rozptyl nebo tvar shluku bodů v multivariačním prostoru, který má osu pro každou proměnnou, zahrnutou do analýzy. Total Variance Explained Initial Eigenvalues Extraction Sums of Squared Loadings Rotation Sums of Squared Loadings Component Total % of Variance Cumulative % Total Extraction Method: Principal Component Analysis. % of Variance Cumulative % Total % of Variance Cumulative % variance vysvětlitelné jednotlivými faktory 2. faktor: variance vysvětlená (1,175/6).100 = 19,59 všemi 3 faktory 1. faktor: (1,550/6).100 = 25,83 VŠIMNĚTE SI, ŽE V TOMTO PŘÍPADĚ JDE O DVĚ TABULKY:
10 10 FAKTOROVÉ ZÁTĚŽE Při extrakci faktorů jsou pro jednotlivé položky počítány faktorové zátěže. A ji čili koeficienty zvané THE FACTOR LOADINGS neboli FAKTOROVÉ ZÁTĚŽE indikují jaká váha je přisouzena každému faktoru. Představují analogii standardizovaných regresních koeficientů v mnohonásobné regresi s: původní proměnnou jako závisle proměnnou a faktory jako nezávislými proměnnými. Faktory s vysokými loadings (v absolutní hodnotě) pro konkrétní proměnné jsou s těmito proměnnými úzce asociovány. INDIVIDUÁLNÍ FAKTOROVÉ ZÁTĚŽE (FACTOR LOADINGS) A ji PRO KAŽDOU PROMĚNNOU BY MĚLY BÝT BUĎ VELMI VYSOKÉ NEBO VELMI NÍZKÉ. Pak je proměnná asociována s minimálním počtem faktorů a je možné vysvětlit pozorované korelace s minimálním počtem faktorů. Prvotní extrakce faktorů (initial factor extraction) obvykle neposkytuje příliš interpretovatelné faktory. Provádíme tedy rotaci faktorů. Zadání rotace faktorů: Všimněte si, že zde máme možnost zadat rotované řešení (důležité, neboť nerotované řešení není optimální) a způsob rotace, ale také grafické vyjádření výsledku.
11 11 ROTACE Představuje snahu zvýšit hodnotu vyšších faktorových zátěží proměnných a snížit hodnotu menších. ORTHOGONÁLNÍ ROTACE. Osy stále svírají pravý úhel. VARIMAX. Je pokusem minimalizovat počet proměnných, které mají vysokou faktorovou zátěž s faktorem. QUARTIMAX. Klade důraz na jednoduchou interpretaci proměnných, minimalizuje počet faktorů potřebných k vysvětlení proměnné. EQUAMAX. je kombinací obou předchozích. OBLIQUE ROTACE. Osy nemusí v konečném řešení svírat pravý úhel. OBLIMIN. Parametr delta (δ) kontroluje rozsah šikmosti. Když je roven 0, dosáhlo se nejvyšší šikmosti. Pro záporné hodnoty delta se faktory stávají méně šikmé jak se delta stává zápornější. ROTATED COMPONENT MATRIX Rotated Component Matrix a Component Q1_4 Volný čas Q1_3 Přátelé a známí Q1_1 Práce Q1_2 Rodina Q1_6 Náboženství Q1_5 Politika Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. a. Rotation converged in 4 iterations. Všimněte si, jak se Vám, díky použití sorted by size, položky přehledně seřadily (konfrontujte výstup, který byste dostali bez použití tohoto příkazu).
12 12 GRAFICKÉ VYJÁDŘENÍ Vytvoření grafu proměnných, který používá faktorové zátěže (faktorová sycení - factor loadings) jako souřadnice. Zadáte ho v menu rotation (loading plot). Component Plot in Rotated Space 1.0 práce rodina Component přátelé a známí volný čas politika náboženství Component 1 Component 3 Analysis weighted by W Trojrozměrný graf lze převést na několik dvourozměrných grafů. Klikneme v Output 2x na graf a editujeme ho. Edit Gallery Scatter Simple (replace) (omitt component ):
13 13.8 Component Plot in Rotated Space rodina práce.6.4 politika Component náboženství přátelé a známí volný čas Component 1 Analysis weighted by W
ZX510 Pokročilé statistické metody geografického výzkumu
ZX510 Pokročilé statistické metody geografického výzkumu Téma: Explorační faktorová analýza (analýza hlavních komponent) Smysl a princip faktorové analýzy v explorační verzi není faktorová analýza určena
Lekce 11 EXPLORAČNÍ FAKTOROVÁ ANALÝZA
SOC108 LEKCE 11: FAKTOROVÁ ANALÝZA 1 Lekce 11 EXPLORAČNÍ FAKTOROVÁ ANALÝZA Ladislav Rabušic Faktorová analýza (FA) ve své explorační verzi (viz níže) je technika, která se odlišuje od dosud probraných
LEKCE12 FAKTOROVÁ ANALÝZA vzorový výsledek cvičení
1 LEKCE12 FAKTOROVÁ ANALÝZA vzorový výsledek cvičení 12.1 Pokuste se najít v položkách na nichž respondenti oceňovali jednotlivé prvky vybavenosti AQUAPARKU příbuznost voleb. Identifikujte v položkách
Faktorová analýza příklad. Obrázek 1 Ukázka části vstupních dat
Faktorová analýza příklad Obrázek 1 Ukázka části vstupních dat Maticový graf vybraných proměnných: Fueltank Passengers Length Wheelbase Width U Turn Space Rear seat Luggage Weight Horsepower Engine Size
AVDAT Mnohorozměrné metody metody redukce dimenze
AVDAT Mnohorozměrné metody metody redukce dimenze Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Opakování vlastní čísla a vlastní vektory A je čtvercová matice řádu n. Pak
Explorační faktorová analýza - analýza hlavních komponent
Explorační faktorová analýza - analýza hlavních komponent Faktorová analýza (FA) - ve své explorační verzi není primárně určena k meritorní analýze, to je neslouží k testování hypotéz ani k měření souvislostí
Fakulta chemicko technologická Katedra analytické chemie
Fakulta chemicko technologická Katedra analytické chemie Licenční studium statistické zpracování dat Analýza vícerozměrných dat Ing. Pavel Valášek Školní rok OBSAH ÚVOD DATA EDA EXPLORATORÍ AALÝZA 4 PCA
Faktorová analýza. PSY252 Statistická analýza dat v psychologii II
Faktorová analýza PSY252 Statistická analýza dat v psychologii II 8.12.2010 Latentní a manifestní proměnné Perspektiva CTT: (pro)jevy, které spolu nějakým způsobem souvisejí, mají stejnou podstatu, jsou
Příklad 2: Určení cihlářských surovin na základě chemické silikátové analýzy
Příklad 2: Určení cihlářských surovin na základě chemické silikátové analýzy Zadání: Deponie nadložních jílových sedimentů SHP byla testována za účelem využití v cihlářské výrobě. Z deponie bylo odebráno
Úvod do vícerozměrných metod. Statistické metody a zpracování dat. Faktorová a komponentní analýza (Úvod do vícerozměrných metod)
Úvod do vícerozměrných metod Statistické metody a zpracování dat Faktorová a komponentní analýza (Úvod do vícerozměrných metod) Petr Dobrovolný O řadě jevů či procesů máme k dispozici ne jeden statistický
Statistické metody a zpracování dat. IX Faktorová a komponentní analýza (Úvod do vícerozměrných metod) Petr Dobrovolný
Statistické metody a zpracování dat IX Faktorová a komponentní analýza (Úvod do vícerozměrných metod) Petr Dobrovolný Úvod do vícerozměrných metod O řadě jevů či procesů máme k dispozici ne jeden statistický
Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou
Úvod.................................................................. 11 Kapitola 1 Než začneme.................................................................. 17 1.1 Logika kvantitativního výzkumu...........................................
PŘÍLOHY. Příloha č. 1 - Vyjádření etické komise FTVS UK. Příloha č. 2 Informovaný souhlas. Příloha č. 3 Dotazník
PŘÍLOHY Příloha č. 1 - Vyjádření etické komise FTVS UK Příloha č. 2 Informovaný souhlas Příloha č. 3 Dotazník Příloha č. 4 Obrázky spoušťových bodů v oblasti ruky Příloha č. 5 Grafy Příloha č. 6 Tabulky
Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza
Korelační a regresní analýza 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza Pearsonův korelační koeficient u intervalových a poměrových dat můžeme jako
Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti
Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti. Autor práce: Přednášející: Prof. RNDr. Milan Meloun, DrSc Zpracovávaná data jsou
Vyhodnocení průměrných denních analýz kalcinátu ananasového typu. ( Metoda hlavních komponent )
Vyhodnocení průměrných denních analýz kalcinátu ananasového typu. ( Metoda hlavních komponent ) Zadání : Titanová běloba (TiO ) se vyrábí ve dvou základních krystalových modifikacích - rutilové a anatasové.
Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.
SEMINÁRNÍ PRÁCE Zadání: Data: Statistické metody: Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi. Minimálně 6 proměnných o 30 pozorováních (z toho 2 proměnné
Vícerozměrné statistické metody
Vícerozměrné statistické metody Ordinační analýzy principy redukce dimenzionality Jiří Jarkovský, Simona Littnerová FSTA: Pokročilé statistické metody Ordinační analýza a její cíle Cíle ordinační analýzy
Faktorová analýza Osnova
Faktorová analýza Osnova Motivace Formulace modelu faktorové analýzy Vhodnost použití modelu faktorové analýzy Odhad faktorové matice a její rotace Volba počtu společných faktorů Odhad faktorového skóre
Vícerozměrné metody. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Schematický úvod
PSY117/454 Statistická analýza dat v psychologii Přednáška 12 Vícerozměrné metody Schematický úvod Co je na slově statistika tak divného, že jeho vyslovení tak často způsobuje napjaté ticho? William Kruskal
Výstupy z výukové jednotky. 2. Princip faktorové analýzy
Faktorová analýza Faktorová analýza je vícerozměrná statistická metoda, jejíž podstatou je rozbor struktury vzájemných závislostí proměnných na základě předpokladu, že jsou tyto závislosti důsledkem působení
Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy
Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Autor práce : RNDr. Ivo Beroun,CSc. Vedoucí práce: prof. RNDr. Milan Meloun, DrSc. PROFILOVÁNÍ Profilování = klasifikace a rozlišování
Úvodem Dříve les než stromy 3 Operace s maticemi
Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová
Tomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
POLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými.
POLYNOMICKÁ REGRESE Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými. y = b 0 + b 1 x + b 2 x 2 + + b n x n kde b i jsou neznámé parametry,
Téma 9: Vícenásobná regrese
Téma 9: Vícenásobná regrese 1) Vytvoření modelu V menu Statistika zvolíme nabídku Vícerozměrná regrese. Aktivujeme kartu Detailní nastavení viz obr.1. Nastavíme Proměnné tak, že v příslušném okně viz.
Vícerozměrné statistické metody
Vícerozměrné statistické metody Ordinační analýzy přehled metod Jiří Jarkovský, Simona Littnerová FSTA: Pokročilé statistické metody Analýza hlavních komponent jako příklad výpočtu redukce dimenzionality
AVDAT Mnohorozměrné metody, metody klasifikace
AVDAT Mnohorozměrné metody, metody klasifikace Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Mnohorozměrné metody Regrese jedna náhodná veličina je vysvětlována pomocí jiných
Faktorová analýza (FACT)
Faktorová analýza (FAC) Podobně jako metoda hlavních komponent patří také faktorová analýza mezi metody redukce počtu původních proměnných. Ve faktorové analýze předpokládáme, že každou vstupující proměnnou
SEMESTRÁLNÍ PRÁCE. Určení vnitřní struktury analýzou vícerozměrných dat. Ing. Pavel Bouchalík
SEMESTRÁLNÍ PRÁCE Určení vnitřní struktury analýzou vícerozměrných dat Ing. Pavel Bouchalík 1. ZADÁNÍ Tato semestrální práce je písemným vypracováním zkouškových otázek z okruhu Určení vnitřní struktury
Počítačová analýza vícerozměrných dat v oborech přírodních, technických a společenských věd
Počítačová analýza vícerozměrných dat v oborech přírodních, technických a společenských věd Prof. RNDr. Milan Meloun, DrSc. (Univerzita Pardubice, Pardubice) 20.-24. června 2011 Tato prezentace je spolufinancována
Statistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )
Úloha M608 Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely ) Zadání : Při kvantitativní analýze lidského krevního séra ovlivňují hodnotu obsahu vysokohustotního
1 Cíl a oblast výzkumu
1 Cíl a oblast výzkumu Cílem této bakalářské práce je analýza cafeteria systému ve velkých firmách v ČR. Využívání cafeteria systému bude zjišťováno pomocí marketingového výzkumu. Z tohoto důvodu byly
STATISTICA Téma 8. Regresní a korelační analýza, regrese prostá
STATISTICA Téma 8. Regresní a korelační analýza, regrese prostá 1) Lineární i nelineární regrese prostá, korelace Naeditujeme data viz obr. 1. Obr. 1 V menu Statistika zvolíme submenu Pokročilé lineární/nelineární
{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků
Příklad: Test nezávislosti kategoriálních znaků Určete na hladině významnosti 5 % na základě dat zjištěných v rámci dotazníkového šetření ve Šluknově, zda existuje závislost mezi pohlavím respondenta a
Cronbachův koeficient α nová adaptovaná metoda uvedení vlastností položkové analýzy deskriptivní induktivní parametrické
Československá psychologie 0009-062X Metodologické požadavky na výzkumné studie METODOLOGICKÉ POŽADAVKY NA VÝZKUMNÉ STUDIE Výzkumné studie mají přinášet nová konkrétní zjištění získaná specifickými výzkumnými
Tomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
Příklad 2: Obsah PCB v játrech zemřelých lidí. Zadání: Data: Program:
Příklad 2: Obsah PCB v játrech zemřelých lidí Zadání: V rámci Monitoringu zdraví byly měřeny koncentrace polychlorovaných bifenylů vjátrech lidí zemřelých náhodnou smrtí ve věku 40 let a více. Sedm vybraných
PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz
PSY117/454 Statistická analýza dat v psychologii seminář 9 Statistické testování hypotéz Základní výzkumné otázky/hypotézy 1. Stanovení hodnoty parametru =stanovení intervalu spolehlivosti na μ, σ, ρ,
4ST201 STATISTIKA CVIČENÍ Č. 10
4ST201 STATISTIKA CVIČENÍ Č. 10 regresní analýza - vícenásobná lineární regrese korelační analýza Př. 10.1 Máte zadaný výstup regresní analýzy závislosti závisle proměnné Y na nezávisle proměnné X. Doplňte
Technická univerzita v Liberci
Technická univerzita v Liberci Ekonomická fakulta Analýza výsledků z dotazníkového šetření Jména studentů: Adam Pavlíček Michal Karlas Tomáš Vávra Anna Votavová Ročník: 2015/2016 Datum odevzdání: 13/05/2016
4EK211 Základy ekonometrie
4EK Základy ekonometrie Odhad klasického lineárního regresního modelu II Cvičení 3 Zuzana Dlouhá Klasický lineární regresní model - zadání příkladu Soubor: CV3_PR.xls Data: y = maloobchodní obrat potřeb
Karta předmětu prezenční studium
Karta předmětu prezenční studium Název předmětu: Číslo předmětu: 545-0250 Garantující institut: Garant předmětu: Ekonomická statistika Institut ekonomiky a systémů řízení RNDr. Radmila Sousedíková, Ph.D.
(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination.
Neparametricke testy (motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination. Andrew Lang) 1. Příklad V následující tabulce jsou
6. Dokončená bytová výstavba v relaci s vybranými statistickými charakteristikami území správních obvodů obcí s rozšířenou působností Zlínského kraje
6. Dokončená bytová výstavba v relaci s vybranými statistickými charakteristikami území správních obvodů obcí s rozšířenou působností Zlínského kraje Kapitola si klade za cíl posoudit případný vztah intenzity
STATISTICKÉ METODY; ZÍSKÁVÁNÍ INFORMACÍ Z DRUHOVÝCH A ENVIRONMENTÁLNÍCH DAT
STATISTICKÉ METODY; ZÍSKÁVÁNÍ INFORMACÍ Z DRUHOVÝCH A ENVIRONMENTÁLNÍCH DAT (NE)VÝHODY STATISTIKY OTÁZKY si klást ještě před odběrem a podle nich naplánovat design, metodiku odběru (experimentální vs.
PSY117/454 Statistická analýza dat v psychologii Přednáška 5 ZOBRAZENÍ DVOUROZMĚRNÝCH DAT KORELAČNÍ KOEFICIENT. Všichni žijeme v matrixu.
PSY117/454 Statistická analýza dat v psychologii Přednáška 5 ZOBRAZENÍ DVOUROZMĚRNÝCH DAT KORELAČNÍ KOEFICIENT Všichni žijeme v matrixu. V minulých dílech jsme viděli/y: Frekvence = četnosti Procenta =
Simulace. Simulace dat. Parametry
Simulace Simulace dat Menu: QCExpert Simulace Simulace dat Tento modul je určen pro generování pseudonáhodných dat s danými statistickými vlastnostmi. Nabízí čtyři typy rozdělení: normální, logaritmicko-normální,
Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy
Dichotomická proměnná (0-1) Spojitá proměnná STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA Typ proměnné Požadovaný typ analýzy Ověření variability Předpoklady Testy, resp. intervalové odhad Test o rozptylu
KORELACE. Komentované řešení pomocí programu Statistica
KORELACE Komentované řešení pomocí programu Statistica Vstupní data I Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná
KGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost
VI. česko-slovenská konference Doprava, zdraví a životní prostředí Brno
Doprava, zdraví a životní prostředí 10. 11. 11. 11. 2012 Brno RNDr. Jiří Huzlík Metodika kvantifikace emisí statistickými metodami Úvod Východiska pro tvorbu metodiky výsledky měření chemického složení
Analýza dat z dotazníkových šetření
Analýza dat z dotazníkových šetření Cvičení 6. Rozsah výběru Př. Určete minimální rozsah výběru pro proměnnou věk v souboru dovolena, jestliže 95% interval spolehlivost průměru proměnné nemá být širší
8 ANALÝZA ČASOVÝCH ŘAD SEZÓNNÍ SLOŽKA
8 ANALÝZA ČASOVÝCH ŘAD SEZÓNNÍ SLOŽKA RYCHLÝ NÁHLED KAPITOLY Následující kapitolou pokračujeme v tématu analýza časových řad a blíže se budeme zabývat problematikou jich pravidelné kolísavost, která je
PSY117/454 Statistická analýza dat v psychologii. Zobrazení dvojrozměrných dat Bodový graf - Scatterplot Korelační koeficient
PSY117/454 Statistická analýza dat v psychologii Zobrazení dvojrozměrných dat Bodový graf - Scatterplot Korelační koeficient Analýza vztahů mezi dvěma proměnnými Souvisí nějak? Výška a váha Známky u jednotlivých
Kanonická korelační analýza
Kanonická korelační analýza Kanonická korelační analýza je vícerozměrná metoda, která se používá ke zkoumání závislosti mezi dvěma skupinami proměnných. První ze skupin se považuje za soubor nezávisle
Vícerozměrné statistické metody
Praktické řešení v software Statistica Jiří Jarkovský, Simona Littnerová Vícerozměrné metody 1. Vstupní data pro vícerozměrné analýzy 2. Metriky podobností a vzdáleností 3. Cluster Analysis 4. Principal
cena 19,9% technici 20,4% design 20,8% značka 20,3% praktici 18,6%
Typologie nákupního chování při výběru mobilního telefonu Autoři ( bude v anglické verzi ) Cíle a zdroje : Cílem této práce je vytvořit typologii lidí podle toho, co je ovlivňuje při výběru mobilního telefonu
Lineární regrese. Komentované řešení pomocí MS Excel
Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních
1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,
KMA/SZZS1 Matematika 1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, operace s limitami. 2. Limita funkce
Testy nezávislosti kardinálních veličin
Testy nezávislosti kardinálních veličin Komentované řešení pomocí programu R Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze Načtení vstupních dat Vstupní data
3.4 Určení vnitřní struktury analýzou vícerozměrných dat
3. Určení vnitřní struktury analýzou vícerozměrných dat. Metoda hlavních komponent PCA Zadání: Byly provedeny analýzy chladící vody pro odběrové místa. Byly stanoveny parametry - ph, vodivost, celková
Regresní analýza 1. Regresní analýza
Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému
AVDAT Klasický lineární model, metoda nejmenších
AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i
Statistické testování hypotéz II
PSY117/454 Statistická analýza dat v psychologii Přednáška 9 Statistické testování hypotéz II Přehled testů, rozdíly průměrů, velikost účinku, síla testu Základní výzkumné otázky/hypotézy 1. Stanovení
různé typy přehledových studií integrativní typ snaha o zobecnění výsledků z množství studií
Meta-analýza přehledové studie, definice postup meta-analýzy statistické techniky ověření homogenity studií, agregace velikosti účinku, moderující proměnné, analýza citlivosti, publikační zkreslení přínosy
odpovídá jedna a jen jedna hodnota jiných
8. Regresní a korelační analýza Problém: hledání, zkoumání a hodnocení souvislostí, závislostí mezi dvěma a více statistickými znaky (veličinami). Typy závislostí: pevné a volné Pevná závislost každé hodnotě
6. Lineární regresní modely
6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu
Pearsonův korelační koeficient
I I.I Pearsonův korelační koeficient Úvod Předpokládejme, že náhodně vybereme n objektů (nebo osob) ze zkoumané populace. Často se stává, že na každém z objektů měříme ne pouze jednu, ale několik kvantitativních
Klasifikace a rozpoznávání. Extrakce příznaků
Klasifikace a rozpoznávání Extrakce příznaků Extrakce příznaků - parametrizace Poté co jsme ze snímače obdržely data která jsou relevantní pro naši klasifikační úlohu, je potřeba je přizpůsobit potřebám
LEKCE02a ANALÝZA ROZLOŽENÍ KATEGORIZOVANÝCH DAT vzorový výsledek cvičení
SOC1/ LEKCE : ANALÝZA ROZLOŽENÍ KATEGORIZOVANÝCH A SPOJITÝCH DAT: LEKCEa ANALÝZA ROZLOŽENÍ KATEGORIZOVANÝCH DAT vzorový výsledek cvičení CVIČENÍ.1: Je česká populace věřící, nebo nevěřící? Tuto otázku
Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie
Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie 12. licenční studium PYTHAGORAS Statistické zpracování dat 3.3 Tvorba nelineárních regresních modelů v analýze dat Semestrální
MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ
MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ v praxi u jednoho prvku souboru se často zkoumá více veličin, které mohou na sobě různě záviset jednorozměrný výběrový soubor VSS X vícerozměrným výběrovým souborem VSS
Testování hypotéz a měření asociace mezi proměnnými
Testování hypotéz a měření asociace mezi proměnnými Testování hypotéz Nulová a alternativní hypotéza většina statistických analýz zahrnuje různá porovnání, hledání vztahů, efektů Tvrzení, že efekt je nulový,
Stav Svobodný Rozvedený Vdovec. Svobodná 37 10 6. Rozvedená 8 12 8. Vdova 5 8 6
1. Příklad Byly sledovány rodinné stavy nevěst a ženichů při uzavírání sňatků a byla vytvořena následující tabulka četností. Stav Svobodný Rozvedený Vdovec Svobodná 37 10 6 Rozvedená 8 12 8 Vdova 5 8 6
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
6. Lineární regresní modely
6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu
Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
Korelační a regresní analýza
Korelační a regresní analýza Analýza závislosti v normálním rozdělení Pearsonův (výběrový) korelační koeficient: r = s XY s X s Y, kde s XY = 1 n (x n 1 i=0 i x )(y i y ), s X (s Y ) je výběrová směrodatná
Diskriminační analýza hodnocení rozdílů mezi 2 nebo více skupinami objektů charakterizovanými více znaky
Diskriminační analýza hodnocení rozdílů mezi 2 nebo více skupinami objektů charakterizovanými více znaky Interpretují rozdíly mezi předem stanovenými třídami Cílem je klasifikace objektů do skupin Hledáme
Fakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody
Fakulta chemicko-technologická Katedra analytické chemie 3.2 Metody s latentními proměnnými a klasifikační metody Vypracoval: Ing. Tomáš Nekola Studium: licenční Datum: 21. 1. 2008 Otázka 1. Vypočtěte
Univerzita Pardubice. Fakulta chemicko-technologická. Katedra analytické chemie. Semestrální práce. Licenční studium
Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie Semestrální práce Licenční studium Statistické zpracování dat při kontrole a řízení jakosti předmět 3.1. Matematické principy
Faktorová analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel
Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz J. Neubauer, J. Michálek (Katedra ekonometrie UO) 1 / 27 úvod Na sledovaných objektech
Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
METODOLOGIE I - METODOLOGIE KVANTITATIVNÍHO VÝZKUMU
METODOLOGIE I - METODOLOGIE KVANTITATIVNÍHO VÝZKUMU vyučující doc. RNDr. Jiří Zháněl, Dr. M I 4 Metodologie I 7. ANALÝZA DAT (KVANTITATIVNÍ VÝZKUM) (MATEMATICKÁ) STATISTIKA DESKRIPTIVNÍ (popisná) ANALYTICKÁ
S E M E S T R Á L N Í
Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie S E M E S T R Á L N Í P R Á C E Licenční studium Statistické zpracování dat při managementu jakosti Předmět Určení vnitřní
Příloha č. 1 Grafy a protokoly výstupy z adstatu
1 Příklad 3. Stanovení Si metodou OES Byly porovnávány naměřené hodnoty Si na automatickém analyzátoru OES s atestovanými hodnotami. Na základě testování statistické významnosti regresních parametrů (úseku
MÍRY ZÁVISLOSTI (KORELACE A REGRESE)
zhanel@fsps.muni.cz MÍRY ZÁVISLOSTI (KORELACE A REGRESE) 2.5 MÍRY ZÁVISLOSTI 2.5.1 ZÁVISLOST PEVNÁ, VOLNÁ, STATISTICKÁ A KORELAČNÍ Jednorozměrné soubory - charakterizovány jednotlivými statistickými znaky
Shluková analýza dat a stanovení počtu shluků
Shluková analýza dat a stanovení počtu shluků Autor: Tomáš Löster Vysoká škola ekonomická v Praze Ostrava, červen 2017 Osnova prezentace Úvod a teorie shlukové analýzy Podrobný popis shlukování na příkladu
Regresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
KLASIFIKACE LOKÁLNÍCH TRHŮ PRÁCE V MORAVSKOSLEZSKÉM KRAJI S VYUŽITÍM GIS STATISTIK
KLASIFIKACE LOKÁLNÍCH TRHŮ PRÁCE V MORAVSKOSLEZSKÉM KRAJI S VYUŽITÍM GIS STATISTIK Doc.Ing.Jana Hančlová, CSc. Katedra matematických metod v ekonomice, VŠB TU Ostrava, Sokolská tř.33, 70121 Ostrava 1 tel.
INDUKTIVNÍ STATISTIKA
10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ HODNOCENÍ ZÁVISLOSTÍ KVALITATIVNÍ VELIČINY - Vychází se z kombinační (kontingenční) tabulky, která je výsledkem třídění druhého stupně KVANTITATIVNÍ
Návrhy dalších možností statistického zpracování aktualizovaných dat
Návrhy dalších možností statistického zpracování aktualizovaných dat Při zjišťování disparit ve fyzické dostupnosti bydlení navrhuji použití těchto statistických metod: Bag plot; Krabicové grafy a jejich
31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě
31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě Motto Statistika nuda je, má však cenné údaje. strana 3 Statistické charakteristiky Charakteristiky polohy jsou kolem ní seskupeny ostatní hodnoty
Inovace bakalářského studijního oboru Aplikovaná chemie
http://aplchem.upol.cz CZ.1.07/2.2.00/15.0247 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Regrese Závislostproměnných funkční y= f(x) regresní y= f(x)
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická
Spokojenost se životem
SEMINÁRNÍ PRÁCE Spokojenost se životem (sekundárních analýza dat sociologického výzkumu Naše společnost 2007 ) Předmět: Analýza kvantitativních revize Šafr dat I. Jiří (18/2/2012) Vypracoval: ANONYMIZOVÁNO
SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík
SEMESTRÁLNÍ PRÁCE Leptání plasmou Ing. Pavel Bouchalík 1. ÚVOD Tato semestrální práce obsahuje písemné vypracování řešení příkladu Leptání plasmou. Jde o praktickou zkoušku znalostí získaných při přednáškách
Univerzita Pardubice 8. licenční studium chemometrie
Univerzita Pardubice 8. licenční studium chemometrie Statistické zpracování dat při managementu jakosti Semestrální práce Metody s latentními proměnnými a klasifikační metody Ing. Jan Balcárek, Ph.D. vedoucí