Identifikace Implicitní kovarianční matice t Pravidlo...8. Odhad parametrů...14
|
|
- Barbora Urbanová
- před 6 lety
- Počet zobrazení:
Transkript
1 Obsah Předmluva Teoretická část Specifikace modelu Diagram cest Zápis modelu Rekurzívní a nerekurzívní modely stukturálních rovnic Identifikace Implicitní kovarianční matice t Pravidlo Odhad parametrů Metoda maximální věrohodnosti Ostatní metody Koeficienty shody Chí-kvadrát test ( test) GFI, AGFI RMSEA Praktická část Stabilita odcizení (Stability of Alienation) Identifikace Odhad parametrů Koeficienty shody...15 Závěr...16 Seznam použité literatiry...17 Seznam tabulek...18 Seznam obrázků a diagramů...22
2 Předmluva Většina výzkumníků používající statistiku vychází z hlediska modelování jednotlivých pozorování [1]. Například, v mnohorozměrné regresi nebo analýze ANOVA (analýza rozptylu) se dozvídáme, že regresní koeficienty nebo odhady rozptylu chyb pochází z minimalizace součtu čtverců rozdílů předpovězených a pozorovaných proměnných pro každý případ. Analýza reziduí (Residual Analysis) zobrazuje rozdíly mezi odhadnutými a pozorovanými hodnotami pro každý člen výběru. Metody modelování strukturálními rovnicemi nabízí reorientaci. Postupy kladou důraz spíše na kovarianci než na jednotlivé případy. Místo minimalizující funkce pozorovaných a předpovězených hodnot, minimalizujeme rozdíl mezi výběrovou kovariancí a kovariancí odhadnutou z modelu. Pozorovaná kovariance mínus odhadnutá kovariance tvoří reziduum. Zásadním předpokladem pro postupy pomocí strukturálních rovnic je skutečnost, že kovarianční matice pozorovaných proměnných je funkce souboru parametrů. V případě, že je model správný a parametry jsou známé, populační matice rozptylu bude přesně reprodukována. Rovnice, která dává formální podobu tomuto zásadnímu předpokladu vypadá takto: (0.1) V rovnici (0.1) (sigma) je populační kovarianční matice pozorovaných proměnných, (théta) je vektor obsahující parametry modelu, a je kovarianční matice zapsaná jako funkce. Jednoduchost této rovnice jen předčí její obecnosti. To umožňuje sjednotit velmi mnoho metod, používaných v sociální vědě. Regresní analýza, konfirmační faktorová analýza, analýza rozptylu a jiné jsou speciálními případy rovnice (0.1). 1
3 1. Teoretická část Modely strukturálních rovnic (Structural Equation Models, zkráceně SEM), nebo se jim také říká modely souběžných rovnic (Simultaneous Equation Models), jsou vícerozměrnými regresními modely, ale na rozdíl od tradičních lineárních modelů, se odezvová (výstupní) proměnná může objevit v jedné regresní rovnici v SEM jako nezávislá (vstupní) proměnná v druhé rovnici [2]. Proměnné mohou ovlivňovat jedna druhou vzájemně, a to buď přímo nebo prostřednictvím jiných proměnných. Tyto strukturální rovnice jsou určeny pro reprezentaci příčinných vztahů mezi proměnnými v modelu Specifikace modelu Na nejzákladnější úrovni je model statistickým vyjádřením vztahů mezi proměnnými [1]. Takže se celý model skládá ze systému strukturálních rovnic. Rovnice obsahují náhodné proměnné, strukturální parametry a někdy nenáhodné proměnné. Tři typy náhodných proměnných jsou latentní, pozorované a rušené/chybné proměnné. Nenáhodné proměnné jsou vysvětlující proměnné, jejichž hodnota zůstává stejná při opakovaném náhodném výběru. Jsou méně běžné než náhodné vysvětlující proměnné. Latentní (skryté) proměnné (Latent Variables), nebo se jim také říká konstrukty nebo faktory, jsou proměnné, které nejsou přímo pozorované nebo změřené, a proto jsou odvozeny od souboru proměnných, které měříme pomocí testů, průzkumů a tak dále. Pozorované (Obseved Variables), měřené nebo indikatorní proměnné jsou souborem proměnných, které používáme k definování nebo odvození latentních proměnných nebo konstruktů. Proměnné, latentní a pozorované, mohou být také definovány buď jako endogenní (Endogenous Variables) nebo exogenní proměnné (Exogenous Variables) [2]. Endogenní proměnná je proměnná, jejíž hodnoty jsou určeny (generovány) systémem či jeho modelem. Je odezvovou (výstupní) proměnnou, a obecně existuje jedna strukturální rovnice pro každou endogenní proměnnou v SEM. Může se také objevit jako vysvětlující v jiné strukturální rovnici. Exogenní proměnná je proměnná, jejíž hodnoty jsou determinovány mimo modelovaný systém, a která daný systém ovlivňuje. V strukturálních modelech se objevují pouze jako vysvětlující proměnné (vstupní). Má se za to, že jsou měřeny bez 2
4 chyb (stejně jako nezávislé proměnné v obecném regresním modelu se považují jako bezchybné). Strukturální chyby (Structural Errors, Disturbances) představují souhrnná vynechaná působení (vztahy) mezi engogenními proměnnými, spolu s chybou měření (a možná i vnitřní náhodou) endogenních proměnných. Existuje jedna chybná proměnná pro každou endogenní proměnnou, a tudíž pro každou strukturální rovnici. Předpokládá se, že chybná proměnná má nulovou střední hodnotu a že je nezávislá na exogenních proměnných. Obecně se nepředpokládá, že různé chyby jsou na sobě nezávislé, ačkoli v jednotlivých modelech tyto předpoklady mohou existovat. Vztahy mezi proměnnými jsou shrnuty v strukturálních parametrech (Structural Parameters, Regression Coefficients). Strukturální parametry jsou neměnné konstanty, které poskytují příčinné vztahy mezi proměnnými. Pro další práci se strukturálními rovnicemi zavedeme následující značení [2]: - Endogenní proměnné: - Exogenní proměnné: - Chyby: - Strukturální koeficienty: vliv exogenní proměnné na endogenní proměnnou, na : (gama) vliv endogenní proměnné na jinou endogenní proměnnou, na : (beta) - Kovariance mezi: dvěma exogenními proměnnými, a : dvěma chybnými proměnnými, a : Diagram cest Diagram cest (Path Diagram) je obrázkovým znázorněním systému simultánních rovnic. Jednou z hlavních výhod diagramu cest je to, že představuje obraz o vztazích, u kterého je ten předpoklad, že drží. Pro většinu výzkumníků tento obrázek může představovat vztahy jasněji než rovnice. Pro pochopení diagramu cest je potřeba zadefinovat symboly, které se v něm používají. Zápis, který dále používám pochází z [1]. Tabulka 1.1 představuje zásadní symboly. Pozorované proměnné jsou umistěné do obdélníků nebo čtverců. Nepozorované nebo latentní proměnné včetně chyb jsou uzavřené do kružnic nebo elips. Jednosměrná šipka představuje přimý vliv jedné proměnné na druhou. Každá taková šipka je označená strukturálním 3
5 koeficientem. Na diagramu cest lze endogenní proměnné snadno odlišit od exogenních proměnných, protože šipky směrují k nim, zatímco exogenní proměnné se objevují pouze na ocasech směrující šipky. Obousměrná šipka představuje kovarianci, a to buď mezi exogenními proměnnými, nebo mezi chybami. Řeckými písmenky jsou značeny nepozorované proměnné, včetně latentních proměnných, strukturálních chyb, chyb měření, kovariancí a strukturálních parametrů. Latinská písmenka představují pozorované proměnné Zápis modelu Strukturální rovnice modelu mohou být načteny přímo z diagramu cest. Systém strukturálních rovnic má dva hlavní podsystémy: model latentních proměnných (Latent Variable Model) a hodnotící model (Measurement Model) Model latentních proměnných Model latentních proměnných zarhuje strukturální rovnice, které shrnují vztahy mezi latentními proměnnými. Někdy se této části modelu říká strukturální submodel. Maticově můžeme tento submodel zapsat následovně [1]: (1.1) Začneme první proměnnou, ( eta ) je vektor latentních endogenních náhodných proměnných o velikosti m 1. Vektor ( ksi ) je vektor o velikosti n 1, a představuje n exogenních latentních proměnných. Chyby v rovnicích nebo vychýlení jsou představovány ( zeta ), vektorem o velikosti m 1. je spojená s každou, pro i běžící od 1 do m. Vektor obvykle obsahuje náhodné proměnné. Koeficientní matice jsou ( beta ) a ( gama ). Matice je matice koeficientů pro latentní endogenní proměnné, jejíž prvky jsou, kde i a j odpovídají řádkovým a sloupcovým pozicím. Model předpokládá, že je regulární, to jest existuje. Na hlavní diagonále matice jsou vždy nuly. To se týká rovnice, pro kterou je odstraněna z pravé strany i-té rovnice, pro kterou je to závislá proměnná. Předpokládá se, že proměnná není bezprostředním a okamžitým vlivem sama o sobě. Nulové prvky v matici také ukazují na absensi vlivu jedné latentní proměnné na druhou. Matice je koeficientová matice pro latentní exogenní proměnné o velikosti m n, jejíž prvky jsou. Dvě kovarianční matice jsou součástí modelu latentních proměnných, jež obsahují rozptyly proměnných na hlavní diagonále a kovariance mezi všemi dvojcemi proměnných mimo hlavní diagonálu. Kovarianční matice latentních exogenních 4
6 proměnných (neboli ) o velikosti n n je ( fí ), s prvky. Jako všechny kovarianční matice, je symetrická. Kovarianční matice chyb v rovnicích je matice o velikosti m m ( psí ), mající prvky. Celé shrnutí všech proměnných je zapsáno do Tabulky Hodnotící model Hodnotící model obsahuje strukturální rovnice, které představují vztah mezi latentními a pozorovanými proměnnými. Rovnice pro hodnotící model mohou být zapsány maticově jako (1.2) (1.3) Rovnice (1.2) a (1.3) jsou také ukazány v Tabulce 1.3, která představuje zápis pro hodnotící model [1]. Náhodné proměnné v představují indikátory latentních exogenních proměnných ( ). Náhodné proměnné v představují indikátory latentních endogenních proměnných ( ). Obecně, je o velikosti q 1 (kde q je počet indikátorů, počet exogenních proměnných), je o velikosti p 1 (kde p je počet indikátorů, počet endogenních proměnných) Matice ( lambda ) a obsahují parametry, které jsou strukturálními koeficienty spojující latentní a pozorované proměnné. Velikost matice je q n (kde n je počet ) a velikost matice je p m (kde m je počet ). Koeficienty jsou velikosti očekáváné změny pozorované proměnné při změně latentní proměnné o jednotku. Tyto koeficienty jsou regresními koeficienty pro vliv latentních proměnných na pozorované proměnné (také se jim říká anglicky Factor Loadings (faktorové váhy)). Vektor chyb při měření pro je ( delta ), a má velikost q 1. Vektor chyb pro je ( epsilon ), který má velikost p 1. Předpokladáme, že a mají nulovou střední hodnotu, a že jsou nekorelované s,,, a také že a jsou nekorelované pro všechny i a j. Dvě kovarianční matice ( théta ) a, jsou kovariačními maticemi pro chyby při měření. Hlavní diagonály obsahují rozptyly odpovídajících jednotek, mimo hlavní diagonálu jsou kovariance pro různé jednotky. Matice je o velikosti q q a má rozptyly a kovariance chyb pro proměnné. Matice je matice velikosti p p, a obsahuje rozptyly a kovariance chyb proměnné. 5
7 Rekurzívní a nerekurzívní modely stukturálních rovnic Důležitým druhem modelu strukturálních rovnic je takzvaný rekurzivní model [1,2,4,5], který má dvě definující vlastnosti: - Různé proměnné chyb jsou nezávislé (nebo alespoň nekorelované) - Kauzalita v modelu je jednosměrná: nejsou oboustranné cesty (Reciprocal Path) a zpětnovazební smyčky (Feedback Loop) - jsou znázorněny na Obrázku 1.1. Jinak řečeno, matice pro rekurzivní model strukturálních rovnic je dolní trojúhelníková matice, zatímco kovarianční matice chyb je diagonální. Model, který není rekurzivním modelem se nazývá nerekurzivní model Identifikace Identifikace je tématem týkající se všech modelů strukturálních rovnic [1]. Pokud parametr strukturální rovnice může být odhadnut, říká se, že parametr je identifikovaný. V opačném případě je parametr neidentifikovaný. Pokud je možný více než jeden odhad - parametr je nad-identifikovaný (overidentified), v opačném případě jde o pod-identifikovaný parametr (underidentified) [2,4] Implicitní kovarianční matice Jak už bylo řečeno na začátku, zásadní předpoklad obecného modelu strukturálních rovnic je (1.4) kde je populační kovarianční matice mezi a, a je kovarianční matice zapsaná jako funkce volných parametrů modelu v [1]. Rovnice (1.4) značí, že každý prvek kovarianční matice je funkcí jednoho nebo více parametrů modelu. Vztah k je základním pro pochopení identifikace a hodnocení modelu. Vypočteme ve třech krocích: (1) kovarianční matice, (2) kovarianční matice mezi a, a (3) kovariační matice. Model: - Submodel latentních proměnných - Hodnotící submodel (1.5) (1.6) 6
8 (1.7) Takže naše kovarianční matice je: (1) (1.8) Za dosadíme rovnici z modelu do rovnice (1.8) a dostaneme (1.9) kde je kovarianční matice, je kovarianční matice. Analogicky spočítáme a (2) (1.10) a znovu použíjeme rovnici (3) (1.11) (1.12) Poté dáme dohromady rovnice (1.9), (1.11) a (1.12), takže kovarianční matice jako funkce parametrů modelu je: ( ) ( ) (1.13) Parametry, jejichž hodnoty bychom měli odnadnout, jsou ve vektoru. Vektor obsahuje t volných parametrů z matic,, a. Rovnice vztahu a je. Pokud neznámý parametr v může být zapsán jako funkce jednoho nebo více prvků matice, tak je parametr identifikovaný. Pokud všechny neznámé parametry v jsou identifikované, tak model je identifikovaný. Předpokládá se, že a jsou regulární. Alternativní definice identifikace začíná tím, že uvažujeme dva vektory a o velikosti t 1, každý z nich obsahuje specifické hodnoty neznámých parametrů v. 7
9 Můžeme sestavit implicitní kovarianční matice, a, pro každý vektor řešení. Pokud je model identifikovaný, všechna a řešení kde musí být. Jestliže pro dvojice vektorů a platí, že a, není identifikovaná t Pravidlo Nejjednodušší test, který lze použít, je nutnou, ale nikoliv postačující podmínkou identifikace, je t-pravidlo [1,2]. Tato nutná podmínka je zcela obecná a může být aplikována na všechny modely. Spočívá v tom, že počet volných parametrů v modelu nemůže být větší než počet rozptylů a kovariancí mezi pozorovanými proměnnými: (1.14) kde je počet pozorovaných proměnných a je počet volných parametrů v. Pokud počet neznámých překročí počet rovnic, pak identifikace není možná Odhad parametrů Postupy odhadnutí pochází ze vztahu kovarianční matice pozorovaných proměnných k strukturálním parametrům. ( ) (1.15) Jestli model strukturálních rovnic je správný a populační parametry jsou známé, tak se bude rovnat. Označme výběrovou kovarianční matici. znamená kovarianční matici, s vektorem místo (tj. ). Residuální matice ( ) indikuje jak blízká je matice k. Abychom věděli, kdy jsou naše odhady co nejbližší, potřebujeme funkci, kterou pak budeme minimalizovat. Pro tento účel lze použít mnoho různých vyhovujících funkcí. Vyhovující funkce jsou založené na výběrové kovarianční matici a implicitní kovarianční matici struturálních parametrů. Hodnota vyhovující funkce pro je. Vyhovující funkce má následující vlastnosti [1]: (1) je skalární, (2), (3), právě když, a (4) je spojitá v a. 8
10 Existuje několik všeobecných a hodně specifických postupů odhadu parametrů v modelu strukturálních rovnic. Patří mezi ně metoda nejmenších čtverců a metoda maximální věrohodnosti Metoda maximální věrohodnosti Nejpoužívanější vyhovující funkce pro obecné modely strukturálních rovnic je funkce maximální věrohodnosti (Maximum Likelihood function) [1,2,3,4]. Vyhovující funkce, která má být minimalizována je (1.16) Obecně, předpokládáme, že a jsou pozitivně definitní, což znamená, že jsou regulární. Abychom ověřili, že je nula [1], když, nahradíme za a do rovnice maximální věrohodnosti (1.16). V takovém případě (1.17) kde, a je nula. Tudíž, když máme model, který dokonale odhaduje hodnoty výběrové kovarianční matice, dokonalá shoda je indikovaná nulou. Odhady metodou maximální věrohodnosti jsou nestranné a konzistentní pro velké výběry Ostatní metody Jako druhá z nejpoužívanějších metod je metoda nejmenších čtverců, která minimalizuje druhou odmocninu rozdílů mezi výběrovou maticí a kovarianční maticí. Ostatní metody jsou modifikacemi těchto dvou základních modelů. 2SLS (Two-Stage Least Squares) je dvoustupňová metoda nejmenších čtverců. FIML (Full- Information likelihood) je metoda maximální věrohodnosti s plnou informaci, je docela podobná [1,2,3,4] Koeficienty shody Kovarianční struktura je. Celkové míry vhodnosti modelu pomáhají zjistit, zda je platný, a pokud ne, pomáhají změřit rozdíl od. Vzhledem k tomu, že a jsou populačními parametry, nejsou k dispozici, proto výzkumníci testují jejich výběrový protějšek a [1]. je výběrová kovarianční matice, a je implicitní kovarianční matice spočítaná odhadem vektoru, který minimalizuje. Označme jako. 9
11 Koeficienty odhadu posuzují blízkost k, tato blízkost se měří různými způsoby Chí-kvadrát test ( test) Důležitým aspektem odhadu je skutečnost, že test poskytuje celkové modelové shody pro nad-identifikované modely. Asymptotické rozdělení je rozdělení s stupní volnosti, kde t je počet volných parametrů a je hodnota vyrovnané funkce spočtená v posledním odhadu [1]. Nulová hypotéza pro chí-kvadrát test je. Protože je ekvivalentní hypotéza, chí-kvadrát test je souběžný test, kdy všechna rezidua v jsou nuly. To znamená, že nad-identifikovaná omezení jsou správná. Zamítnutí znamená, že aspoň jedno omezení je chybné a že. Chí-kvadrát testuje nulovou hypotézu, že omezení na implikované modelem jsou platné (t.j. ). Kritériem srovnání je dokonalá shoda matice, která je rovná. Hladina pravděpodobnosti spočteného chí-kvadrátu je pravděpodobnost získání hodnoty větší než hodnota získána, pokud je správná. Čím větší je pravděpodobnost, tím blížší je shoda k dokonalé shodě. Ad hoc míra vhodnosti je odhad chí-kvadrátu dělený jeho stupněmi volnosti. Odůvodnění je, že očekávaná hodnota náhodné veličiny chí-kvadrátu je počet jeho stupní volnosti. Takže odhaduje, kolikrát je větší odhad chí-kvadrátu než očekávaná hodnota, když aproximuje náhodné veličiny chí-kvadrátu. Neexistuje jednoznačná odpověď na to, co představuje dobrou shodu, doporučení se pohybují v rozmezí poměru 3, 2, nebo méně, až do GFI, AGFI Goodness of fit index (GFI) a upravený GFI (Adjusted GFI) pro : (1.18) [ ] (1.19) měří relativní počet rozptylů a kovariancí v, které jsou odhadnuty. upraví stupni volnosti modelu relativně k počtu proměnných. Oba z koeficientů jsou maximální, když. Obvykle jsou větší než nula, ale mohou být také záporné [1,4]. 10
12 RMSEA Jeden koeficient, který je více atraktivní než jiné, je RMSEA (Root Mean- Squared Error Aproximation) [4], který je odhadem relativní shody modelu k saturačnímu modelu populace, a počítá se jako: ( ) (1.20) Malé hodnoty RMSEA znamenají, že shoda modelu je blízká stejně jako saturační model. RMSEA 0.05 je obvykle vzata jako dobrá shoda s datami. 11
13 2. Praktická část Rekurzivní modely jsou zvláště užitečné pro analýzu dat z dlouhodobých studií (Longitudinal Study) v psychologii, vzdělání a sociologii [5]. Charakteristickým rysem návrhu dlouhodobého výzkumu je to, že stejná měřítka jsou používána pro stejné lidé jednou nebo víckrát. Účelem dlouhodobého výzkumu je stanovit změny, které nastaly mezi vyšetřeními, a vysvětlit tyto změny určitými podkladovými charakteristikami a událostmi, existujícími, nebo ke kterým došlo před prvním vyšetřením, a/nebo různou léčbou a vývojem, které nastaly po prvním vyšetření. Často, když se stejné proměnné používají opakovaně, je tendence korelování chyb měření proměnných v průběhu času kvůli specifickým faktorům, paměti nebo jiným efektům (vlivům) Stabilita odcizení (Stability of Alienation) Budeme se zabývat modelem strukturálních rovnic s latentními exogenními a engodenními proměnnými. Wheaton, Muthén, Alwin a Summer (1977) přišli s výzkumnou prací, zabývající se stabilitou v čase postojů, jako třeba odcizení (Alienation), a vztahu s podkladovými proměnnými (Background Variables) jako je vzdělání a zaměstnání. Data byla získána od 932 osob ve dvou venkovských oblastech v Illinois, ve třech místech v čase: 1966, 1967,1971. Proměnné, použíté pro účely tohoto příkladu, jsou rozpětí afázii (Anomia) a nemohoucnosti (Powerlessness), jež jsou považovány za ukazatele odcizení. V tomto příkladě používáme data pouze z let 1967 a Podkladové proměnné jsou vzdělání respodenta (Respodent s education) - (dokončené roky studia) a socioekonomický index (SEI), které jsou považovány za ukazatele socioekonomického statusu respodenta (SES). Výběrová kovarianční matice šesti pozorovaných proměnných je dána v Tabulce 2.1 [3,5]. Model, kterým se budeme zabývat je znázorněn na Obrázku 2.1 [5]. Čtyři jednosměrové šipky na horní části obrázku představují chyby při měření proměnné Afázie 67, Nemohoucnost 67, Afázie 71 a Nemohoucnost 71 v tomto pořadí. Obousměrná šipka na horní části diagramu znamená, že některé chyby při měření jsou korelované. Kovariance mezi dvěma chybami pro každou proměnnou může být interpretována jako specifický rozptyl chyb. Z diagramu cest 2.1 můžeme zapsat model pomocí strukturálních rovnic. Model se skládá ze submodelu latentních proměnných, který má dvě rovnice pro dvě 12
14 latentní endogenní proměnné (Odcizení 67 a Odcizení 71), a hodnotícího submodelu, který má rovnice pro šest indikátorů latentních proměnných. - Submodel latentních proměnných: - Hodnotící submodel: Nebo maticově tento model můžeme přepsat následovně: - Submodel latentních proměnných: ( ) ( ) ( ) ( ) ( ) (2.1) - Hodnotící submodel: ( ) ( ) ( ) ( ) (2.2) kde ( ) ( ) ( ) (2.3) ( ), ( ), ( ),, ( ) ( ), ( ), ( ), ( ), ( ), ( ), ( ),, ( ), ( ) 13
15 Matice modelu je horní trojúhelníková, a je diagonální, takže podmínky pro rekurzivní model jsou splněny Identifikace Parametry v jsou globálně identifikovány, pokud neexistují žádné vektory a takové, že, s výjimkou. Kovarianční struktura implikuje rovnic. Pokud prvek může být vyjádřen jako funkce jednoho nebo více prvku matice, tak to určí identifikaci. Jestli všechny prvky splňují tuto podmínku, tak je model identifikován. Matice pozorovaných proměnných je: ( ) (2.4) Vektor neznámých parametrů: ( ) Jako nutná, ale nikoliv postačující podmínka pro identifikaci je t-pravidlo: (2.5) kde t je počet volných prvků v. Prvky implikují rovnic, pokud počet neznámých překročí počet rovnic, pak není identifikace možná. Model na Obrázku 2.1 a rovnice modelu ukazují, že vektor má 17 prvků a je 21. Takže t-pravidlo je splněno Odhad parametrů Předpokladem našeho modelu je. Potřebujeme zvolit tak, aby byla co nejblíž k, kde je výběrová kovarianční matice pozorovaných proměnných. Použíjeme metodu maximální věrohodnosti: (2.6) Náš problém vyřešíme v programu R [2,3]. Je široce používán, zejména u statistiků, a v současnosti má rozsáhlé možnosti. Balíček sem poskytuje základní možnosti modelování stukturálními rovnicemi, včetně možnosti zkoušet strukturální 14
16 rovnice v modelech s pozorovanými proměnnými metodami 2SLS a FIML za předpokladu mnohorozměrného normálního rozdělení. V programu R, odhadnutí metodou maximální věrohodnost řešíme pomocí funcke sem [2,3,4]. Pro ni potřebujeme zadefinovat model, to jest zadefinovat existující vztahy mezi proměnnými. Také potřebujeme zadefinovat výběrovou kovarianční matici pro data, které jsou dány v Tabulce 2.1. Kovarianční matice je zapsána jako dolní-trojúhelníková vzhledem k symetrii kovarianční matice. Sem akceptuje dolní trojúhelníkové, horní trojúhelníkové nebo symetrické kovarianční matice. Celkový zdrojový kód najdeme v Příloze 1. Odhadnuté hodnoty jsou ukázány v Tabulce Koeficienty shody Poměr je blízký k 1. ( je 4,7302/4 = ) Počet stupní volnosti je 21 17, neboli 4. Pravděpodobnost získání hodnoty větší než získaná hodnota, pokud je správná, je kolem 0,3. Na hladině 0,05 nemůžeme zamítnout nulovou hypotézu. Model má dostatečně dobrou shodu. Goodness of fit index (GFI) ukazuje, že model popisuje 99,831% reality. Adjusted GFI (AGFI) je kolem 1 (0,99115). Hodnota RMSEA je 0,014003, což je docela málo, a je menší než 0,05. Celkově můžeme konstatovat, že odhadnuté parametry dostatečně dobře popisují náš model. 15
17 Závěr Proč je strukturální modelování populární? Existuje několik příčin popularity metody SEM [6]. Prvním důvodem je ten fakt, že výzkumníci si stále více uvědomují nutnost použití více pozorovaných proměnných, aby lépe pochopili svoji oblast vědeckého zkoumání. Základní statistické metody používají pouze omezený počet proměnných, které nemohou pracovat se složitějšími teoriemi na etapě vývoje (počáteční etapě). SEM umožňuje komplexní jevy statisticky modelovat a testovat. Druhou příčinou je vyšší spolehlivost zjištěných výsledků z měřících instrumentů. Konkrétně, chyba měření se stala hlavním problémem v mnoha oborech, ale chyba měření a statistická analýza byly řešeny zvlášť. Techniky strukturálního modelování berou v úvahu chybu měření v průběhu statistické analýzy dat. SEM analýza zahrnuje skryté a pozorované proměnné, stejně jako chybu měření v některých modelech SEM. Dalším důvodem je to, jak strukturální modelování dospělo během posledních 30 let, zejména schopnost analyzovat více pokročilé teoretické SEM modely. Výzkumníci mohou analyzovat složité teoretické modely komplexních jevů pomocí víceúrovňového modelování strukturálními rovnicemi a oceňování pomocí více skupinových SEM modelů. Konečně, SEM softwarové programy se staly uživatelsky příjemnější. Dříve, do roku 1993, uživatelé LISREL museli zadat programní syntax pro jejich modely pomocí Řecké a maticové notace. Byla potřeba složitých programových požadavků a znalostí syntaxe SEM. Dnes většina SEM softwarových programů už má zabudovaný programní syntax a jsou snazší pro používání. 16
18 Seznam použité literatiry [1] Bollen, Keneth. A. (1989). Structural Equations With Latent Variables. Wiley, New York. [2] Fox, John (2006). An Introduction to Structural Equation Modelling - Lecture Notes. Zdroj: Datum zveřejnění: Datum přístupu: Department of Sociology, McMaster University, Hamilton, Ontario, Canada. [3] Fox, John (2006). Structural Equation Modeling With the sem Package in R. Technical report. McMaster University, Hamilton, Ontario, Canada. [4] Fox, John (2002). Structural Equation Models. Appendix to An R and S- PLUS companion to Applied Regression. Technical report. McMaster University, Hamilton, Ontario, Canada. [5] Joreskog, Karl G. and Sorbom, Dag (1996). LISREL 8: User's Reference Guide. Scientific Software International, Chicago. [6] Schumacker, Randall E. and Lomax, Richard G.(2004), A Beginner s Guide to Structural Equation Modeling (2nd Edition). :Lawrence Erlbaum Associates, Inc., Mahwah, New Jersey. [7] Wheaton, B., Muthén, B., Alwin, D. F., & Summers, G. F. (1977). Assessing reliability and stability in panel models. In D. R. Heise (Ed.), Sociological methodology Jossey-Bass, San Francisco. 17
19 Seznam tabulek (Tabulka 1.1) Zásadní symboly používané v analýze cest Obdélník nebo čtverec značí pozorovanou proměnnou Kružnice nebo elipsa značí nepozorovanou nebo latentní proměnnou, a také chyby Jednosměrná přímá šipka znamená, že proměnná, která je v ocasu šipky ovlivňuje proměnnou, která je v hlavičce šipky Zakřivená obousměrná šipka označuje neanalyzované spojení mezi dvěma proměnnými Obousměrná šipka spojující dvě proměnné označuje zpětnovazební vztah nebo vzájemné působení 18
20 (Tabulka 1.2) Zápis pro model latentních (nepozorovaných) proměnných Strukturální rovnice pro model latentních proměnných Předpoklady je nekorelované s je regulární Symbol Název Dimenze Definice Proměnné eta m 1 latentní endogenní proměnné ksí n 1 latentní exogenní proměnné zeta m 1 latentní chyby v rovnicích Koeficienty beta m m gama m n koeficientní matice pro latentní endogenní proměnné koeficientní matice pro latentní exogenní proměnné Kovarianční matice fí n n (kovarianční matice ) psí m m (kovarianční matice ) 19
21 (Tabulka 1.3) Zápis pro hodnotící model Strukturální rovnice pro hodnotící model Předpoklady,, je nekorelované s,a, a je nekorelované s, Symbol Název a Dimenze Definice Proměnné p 1 pozorované indikátory pro q 1 pozorované indikátory pro epsilon p 1 chyby při měření pro delta q 1 chyby při měření pro Koeficienty lambda x p m koeficienty vlivu lambda y q n koeficienty vlivu na na Kovarianční matice théta-epsilon p p (kovarianční matice ) théta-delta q q (kovarianční matice ) (Tabulka 2.1) Kovarianční matice pro model stability odcizení Afázie Nemohoucnost Afázie Nemohoucnost Vdělání SEI
22 (Tabulka 2.2) Odhady parametrů pro model Stability Odcizení. Parametr Odhad Standardní chyba
23 Seznam obrázků a diagramů (Obrázek 1.1) Obousměrné šipky a zpětnovazební smyčky nejsou povoleny v rekurzivních modelech Obousměrná šipka Zpětnovazební smyčka y k y k y k y k y k (Obrázek 2.1) Diagram cest pro model stability odcizení y 1 : Afázie 67 y 2 : Nemohoucnost 67 y 3 : Afázie 71 y 4 : Nemohoucnost : Odcizení 67 2: Odcizení : SES 1 3 x 1 : Vzdělání x 2 : SEI
AVDAT Klasický lineární model, metoda nejmenších
AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i
8 Coxův model proporcionálních rizik I
8 Coxův model proporcionálních rizik I Předpokládané výstupy z výuky: 1. Student umí formulovat Coxův model proporcionálních rizik 2. Student rozumí významu regresních koeficientů modelu 3. Student zná
Pojem endogenity a exogenity
22. 4. 2010 Úvodní definice Klasická definice Exogenita a endogenita není jednoznačná, přesto se nejčastěji pracuje s následující definicí. Proměnná x vysvětlující proměnnou y je exogenní, pokud L(y x)
4EK211 Základy ekonometrie
4EK211 Základy ekonometrie ZS 2015/16 Cvičení 7: Časově řady, autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Časové řady Data: HDP.wf1
4EK211 Základy ekonometrie
4EK Základy ekonometrie Odhad klasického lineárního regresního modelu II Cvičení 3 Zuzana Dlouhá Klasický lineární regresní model - zadání příkladu Soubor: CV3_PR.xls Data: y = maloobchodní obrat potřeb
AVDAT Geometrie metody nejmenších čtverců
AVDAT Geometrie metody nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model klasický lineární regresní model odhad parametrů MNČ y = Xβ + ε, ε
4EK211 Základy ekonometrie
4EK211 Základy ekonometrie LS 2014/15 Cvičení 7: Autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Autokorelace - teorie Zopakujte si G-M
4EK211 Základy ekonometrie
4EK211 Základy ekonometrie LS 2014/15 Cvičení 10: Heteroskedasticita LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Heteroskedasticita - teorie Druhý
Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup
Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009
1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou
Úvodem Dříve les než stromy 3 Operace s maticemi
Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová
Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou
Úvod.................................................................. 11 Kapitola 1 Než začneme.................................................................. 17 1.1 Logika kvantitativního výzkumu...........................................
Tomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
Zadání Máme data hdp.wf1, která najdete zde: Bodová předpověď: Intervalová předpověď:
Predikce Text o predikci pro upřesnění pro ty, které zajímá, kde se v EViews všechna ta čísla berou. Ruční výpočty u průběžného testu nebudou potřeba. Co bude v závěrečném testu, to nevím. Ale přečíst
Jednofaktorová analýza rozptylu
I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých
Regresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
PRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOS A SAISIKA Regresní analýza - motivace Základní úlohou regresní analýzy je nalezení vhodného modelu studované závislosti. Je nutné věnovat velkou pozornost tomu aby byla modelována REÁLNÁ
Testování hypotéz o parametrech regresního modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,
Testování hypotéz o parametrech regresního modelu
Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO
V praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více
9 Vícerozměrná data a jejich zpracování 9.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat, hledáme souvislosti mezi dvěmi, případně více náhodnými veličinami. V praxi pracujeme
Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13
Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test
Regresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
Regresní analýza 1. Regresní analýza
Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému
Klasická a robustní ortogonální regrese mezi složkami kompozice
Klasická a robustní ortogonální regrese mezi složkami kompozice K. Hrůzová, V. Todorov, K. Hron, P. Filzmoser 13. září 2016 Kompoziční data kladná reálná čísla nesoucí pouze relativní informaci, x = (x
Vícerozměrné metody. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Schematický úvod
PSY117/454 Statistická analýza dat v psychologii Přednáška 12 Vícerozměrné metody Schematický úvod Co je na slově statistika tak divného, že jeho vyslovení tak často způsobuje napjaté ticho? William Kruskal
4EK211 Základy ekonometrie
4EK211 Základy ekonometrie LS 2014/15 Cvičení 4: Statistické vlastnosti MNČ LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE Upřesnění k pojmům a značení
Matematika (CŽV Kadaň) aneb Úvod do lineární algebry Matice a soustavy rovnic
Přednáška třetí (a pravděpodobně i čtvrtá) aneb Úvod do lineární algebry Matice a soustavy rovnic Lineární rovnice o 2 neznámých Lineární rovnice o 2 neznámých Lineární rovnice o dvou neznámých x, y je
0.1 Úvod do lineární algebry
Matematika KMI/PMATE 1 01 Úvod do lineární algebry 011 Vektory Definice 011 Vektorem aritmetického prostorur n budeme rozumět uspořádanou n-tici reálných čísel x 1, x 2,, x n Definice 012 Definice sčítání
Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.
1. Korelační analýza V životě většinou nesledujeme pouze jeden statistický znak. Sledujeme více statistických znaků zároveň. Kromě vlastností statistických znaků nás zajímá také jejich těsnost (velikost,
Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan
1 Úvod 1.1 Empirický výzkum a jeho etapy 1.2 Význam teorie pro výzkum 1.2.1 Konstrukty a jejich operacionalizace 1.2.2 Role teorie ve výzkumu 1.2.3 Proces ověření hypotéz a teorií 1.3 Etika vědecké práce
Statistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica
JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu
{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků
Příklad: Test nezávislosti kategoriálních znaků Určete na hladině významnosti 5 % na základě dat zjištěných v rámci dotazníkového šetření ve Šluknově, zda existuje závislost mezi pohlavím respondenta a
676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368
Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540
Cronbachův koeficient α nová adaptovaná metoda uvedení vlastností položkové analýzy deskriptivní induktivní parametrické
Československá psychologie 0009-062X Metodologické požadavky na výzkumné studie METODOLOGICKÉ POŽADAVKY NA VÝZKUMNÉ STUDIE Výzkumné studie mají přinášet nová konkrétní zjištění získaná specifickými výzkumnými
0.1 Úvod do lineární algebry
Matematika KMI/PMATE 1 01 Úvod do lineární algebry 011 Lineární rovnice o 2 neznámých Definice 011 Lineární rovnice o dvou neznámých x, y je rovnice, která může být vyjádřena ve tvaru ax + by = c, kde
Úvod do problematiky měření
1/18 Lord Kelvin: "Když to, o čem mluvíte, můžete změřit, a vyjádřit to pomocí čísel, něco o tom víte. Ale když to nemůžete vyjádřit číselně, je vaše znalost hubená a nedostatečná. Může to být začátek
4EK211 Základy ekonometrie
4EK211 Základy ekonometrie ZS 2015/16 Cvičení 1: Opakování ze statistiky LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE Z čeho studovat 1) Z KNIHY Krkošková,
Testování hypotéz a měření asociace mezi proměnnými
Testování hypotéz a měření asociace mezi proměnnými Testování hypotéz Nulová a alternativní hypotéza většina statistických analýz zahrnuje různá porovnání, hledání vztahů, efektů Tvrzení, že efekt je nulový,
12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)
cvičení z PSI 0-4 prosince 06 Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) Z realizací náhodných veličin X a Y s normálním rozdělením) jsme z výběrů daného rozsahu obdrželi
Měření závislosti statistických dat
5.1 Měření závislosti statistických dat Každý pořádný astronom je schopen vám předpovědět, kde se bude nacházet daná hvězda půl hodiny před půlnocí. Ne každý je však téhož schopen předpovědět v případě
Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.
Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít
1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Testy hypotéz na základě více než 2 výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů Na analýzu rozptylu lze pohlížet v podstatě
5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza
5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně
6 Vícerovnicové ekonometrické soustavy 1
6 Vícerovnicové ekonometrické soustavy Obsah 6 Vícerovnicové ekonometrické soustavy 1 6.1 SUR - Seemingly unrelated regression (zdánlivě nepropojené regrese).......... 3 6.2 Panelová data.........................................
Optimalizace provozních podmínek. Eva Jarošová
Optimalizace provozních podmínek Eva Jarošová 1 Obsah 1. Experimenty pro optimalizaci provozních podmínek 2. EVOP klasický postup využití statistického softwaru 3. Centrální složený návrh model odezvové
Lineární regrese. Komentované řešení pomocí MS Excel
Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních
Tomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
Stavový model a Kalmanův filtr
Stavový model a Kalmanův filtr 2 prosince 23 Stav je veličina, kterou neznáme, ale chtěli bychom znát Dozvídáme se o ní zprostředkovaně prostřednictvím výstupů Příkladem může býapř nějaký zašuměný signál,
ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.
ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz PŘEHLED TESTŮ rozdělení normální spojité alternativní / diskrétní
Statistické metody v marketingu. Ing. Michael Rost, Ph.D.
Statistické metody v marketingu Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Regresní analýza doplnění základů Vzhledem k požadavku Vašich kolegů zařazuji doplňující partii o regresní
Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)
Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, např. hmotnost a pohlaví narozených dětí. Běžný statistický postup pro ověření závislosti dvou veličin je zamítnutí jejich
PRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y β ε Matice n,k je matice realizací. Předpoklad: n > k, h() k - tj. matice je plné hodnosti
Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel
Regresní analýza Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Regresní analýza 1 / 23
LINEÁRNÍ MODELY. Zdeňka Veselá
LINEÁRNÍ MODELY Zdeňka Veselá vesela.zdenka@vuzv.cz Genetika kvantitativních vlastností Jednotlivé geny nejsou zjistitelné ani měřitelné Efekty většího počtu genů poskytují variabilitu, kterou lze většinou
Úlohy nejmenších čtverců
Úlohy nejmenších čtverců Petr Tichý 7. listopadu 2012 1 Problémy nejmenších čtverců Ax b Řešení Ax = b nemusí existovat, a pokud existuje, nemusí být jednoznačné. Často má smysl hledat x tak, že Ax b.
Diagnostika regrese pomocí grafu 7krát jinak
StatSoft Diagnostika regrese pomocí grafu 7krát jinak V tomto článečku si uděláme exkurzi do teorie regresní analýzy a detailně se podíváme na jeden jediný diagnostický graf. Jedná se o graf Předpovědi
Ilustrační příklad odhadu LRM v SW Gretl
Ilustrační příklad odhadu LRM v SW Gretl Podkladové údaje Korelační matice Odhad lineárního regresního modelu (LRM) Verifikace modelu PEF ČZU Praha Určeno pro posluchače předmětu Ekonometrie Needitovaná
SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík
SEMESTRÁLNÍ PRÁCE Leptání plasmou Ing. Pavel Bouchalík 1. ÚVOD Tato semestrální práce obsahuje písemné vypracování řešení příkladu Leptání plasmou. Jde o praktickou zkoušku znalostí získaných při přednáškách
11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.
11 cvičení z PSI 12-16 prosince 2016 111 (Test dobré shody - geometrické rozdělení Realizací náhodné veličiny X jsme dostali následující četnosti výsledků: hodnota 0 1 2 3 4 5 6 pozorovaná četnost 29 15
5EN306 Aplikované kvantitativní metody I
5EN306 Aplikované kvantitativní metody I Přednáška 5 Zuzana Dlouhá Předmět a struktura kurzu 1. Úvod: struktura empirických výzkumů 2. Tvorba ekonomických modelů: teorie 3. Data: zdroje a typy dat, význam
1 Řešení soustav lineárních rovnic
1 Řešení soustav lineárních rovnic 1.1 Lineární rovnice Lineární rovnicí o n neznámých x 1,x 2,..., x n s reálnými koeficienty rozumíme rovnici ve tvaru a 1 x 1 + a 2 x 2 +... + a n x n = b, (1) kde koeficienty
12. cvičení z PST. 20. prosince 2017
1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace
Regrese. používáme tehdy, jestliže je vysvětlující proměnná kontinuální pokud je kategoriální, jde o ANOVA
Regrese používáme tehd, jestliže je vsvětlující proměnná kontinuální pokud je kategoriální, jde o ANOVA Specifikace modelu = a + bx a závisle proměnná b x vsvětlující proměnná Cíl analýz Odhadnout hodnot
Vektory a matice. Obsah. Aplikovaná matematika I. Carl Friedrich Gauss. Základní pojmy a operace
Vektory a matice Aplikovaná matematika I Dana Říhová Mendelu Brno Obsah 1 Vektory Základní pojmy a operace Lineární závislost a nezávislost vektorů 2 Matice Základní pojmy, druhy matic Operace s maticemi
Časové řady, typy trendových funkcí a odhady trendů
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Stochastický proces Posloupnost náhodných veličin {Y t, t = 0, ±1, ±2 } se nazývá stochastický proces
Metoda backward výběru proměnných v lineární regresi a její vlastnosti
Metoda backward výběru proměnných v lineární regresi a její vlastnosti Aktuárský seminář, 13. dubna 2018 Milan Bašta 1 / 30 1 Metody výběru proměnných do modelu 2 Monte Carlo simulace, backward metoda
Maticí typu (m, n), kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru:
3 Maticový počet 3.1 Zavedení pojmu matice Maticí typu (m, n, kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru: a 11 a 12... a 1k... a 1n a 21 a 22...
PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz
PSY117/454 Statistická analýza dat v psychologii seminář 9 Statistické testování hypotéz Základní výzkumné otázky/hypotézy 1. Stanovení hodnoty parametru =stanovení intervalu spolehlivosti na μ, σ, ρ,
Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test
Testování hypotéz 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test Testování hypotéz proces, kterým rozhodujeme, zda přijmeme nebo zamítneme nulovou hypotézu
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická
Odhady Parametrů Lineární Regrese
Odhady Parametrů Lineární Regrese Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké
Matematické modelování Náhled do ekonometrie. Lukáš Frýd
Matematické modelování Náhled do ekonometrie Lukáš Frýd Výnos akcie vs. Výnos celého trhu - CAPM model r it = r ft + β 1. (r mt r ft ) r it r ft = α 0 + β 1. (r mt r ft ) + ε it Ekonomický (finanční model)
EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy
EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy Ekonometrická analýza proces, skládající se z následujících fází: a) specifikace b) kvantifikace c) verifikace d) aplikace Postupné zpřesňování jednotlivých
2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení
2 Zpracování naměřených dat Důležitou součástí každé experimentální práce je statistické zpracování naměřených dat. V této krátké kapitole se budeme věnovat určení intervalů spolehlivosti získaných výsledků
11 Analýza hlavních komponet
11 Analýza hlavních komponet Tato úloha provádí transformaci měřených dat na menší počet tzv. fiktivních dat tak, aby většina informace obsažená v původních datech zůstala zachována. Jedná se tedy o úlohu
Praktikum z ekonometrie Panelová data
Praktikum z ekonometrie Panelová data Jan Zouhar Katedra ekonometrie, FIS VŠE v Praze, zouharj@vse.cz 9. května 2014 1 Terminologie a značení Sledujeme-li pro všechny průřezové jednotky stejná časová období,
Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty
Neparametrické testy (motto: Hypotézy jsou lešením, které se staví před budovu a pak se strhává, je-li budova postavena. Jsou nutné pro vědeckou práci, avšak skutečný vědec nepokládá hypotézy za předmětnou
Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.
Ing. Michal Dorda, Ph.D. 1 Př. 1: Cestující na vybraném spoji linky MHD byli dotazováni za účelem zjištění spokojenosti s kvalitou MHD. Legenda 1 Velmi spokojen Spokojen 3 Nespokojen 4 Velmi nespokojen
Opravená data Úloha (A) + (E) Úloha (C) Úloha (B) Úloha (D) Lineární regrese
- základní ukazatele Komentované řešení pomocí programu R Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze - základní ukazatele Načtení vstupních dat Vstupní data
Bodové a intervalové odhady parametrů v regresním modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model Mějme lineární regresní model (LRM) Y = Xβ + e, kde y 1 e 1 β y 2 Y =., e
AVDAT Mnohorozměrné metody metody redukce dimenze
AVDAT Mnohorozměrné metody metody redukce dimenze Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Opakování vlastní čísla a vlastní vektory A je čtvercová matice řádu n. Pak
4. Aplikace matematiky v ekonomii
4. Aplikace matematiky v ekonomii 1 Lineární algebra Soustavy 1) Na základě statistických údajů se zjistilo, že závislost množství statku z poptávaného v průběhu jednoho týdne lze popsat vztahem q d =
4EK211 Základy ekonometrie
4EK11 Základy ekonometrie Autokorelace Cvičení 5 Zuzana Dlouhá Gauss-Markovy předpoklady Náhodná složka: Gauss-Markovy předpoklady 1. E(u) = náhodné vlivy se vzájemně vynulují. E(uu T ) = σ I n konečný
Časové řady, typy trendových funkcí a odhady trendů
Časové řady, typy trendových funkcí a odhady trendů Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Jiří Neubauer (Katedra ekonometrie UO Brno) Časové
Pearsonův korelační koeficient
I I.I Pearsonův korelační koeficient Úvod Předpokládejme, že náhodně vybereme n objektů (nebo osob) ze zkoumané populace. Často se stává, že na každém z objektů měříme ne pouze jednu, ale několik kvantitativních
Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1
Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu
MÍRY ZÁVISLOSTI (KORELACE A REGRESE)
zhanel@fsps.muni.cz MÍRY ZÁVISLOSTI (KORELACE A REGRESE) 2.5 MÍRY ZÁVISLOSTI 2.5.1 ZÁVISLOST PEVNÁ, VOLNÁ, STATISTICKÁ A KORELAČNÍ Jednorozměrné soubory - charakterizovány jednotlivými statistickými znaky
2 Hlavní charakteristiky v analýze přežití
2 Hlavní charakteristiky v analýze přežití Předpokládané výstupy z výuky: 1. Student umí definovat funkci přežití, rizikovou funkci a kumulativní rizikovou funkci a zná funkční vazby mezi nimi 2. Student
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza
1. Přednáška. Ing. Miroslav Šulai, MBA
N_OFI_2 1. Přednáška Počet pravděpodobnosti Statistický aparát používaný ve financích Ing. Miroslav Šulai, MBA 1 Počet pravděpodobnosti -náhodné veličiny 2 Počet pravděpodobnosti -náhodné veličiny 3 Jevy
Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11
Příklad 1 Vyhláška Ministerstva zdravotnictví předpokládala, že doba dojezdu k pacientovi od nahlášení požadavku nepřekročí 17 minut. Hodnoty deseti náhodně vybraných dob příjezdu sanitky k nemocnému byly:
Faktorová analýza. PSY252 Statistická analýza dat v psychologii II
Faktorová analýza PSY252 Statistická analýza dat v psychologii II 8.12.2010 Latentní a manifestní proměnné Perspektiva CTT: (pro)jevy, které spolu nějakým způsobem souvisejí, mají stejnou podstatu, jsou
RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných
Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza
Korelační a regresní analýza 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza Pearsonův korelační koeficient u intervalových a poměrových dat můžeme jako
Cvičení ze statistiky - 8. Filip Děchtěrenko
Cvičení ze statistiky - 8 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Centrální limitní věta Laplaceho věta (+ korekce na spojitost) Konfidenční intervaly
KGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 5. Odhady parametrů základního souboru Mgr. David Fiedor 16. března 2015 Vztahy mezi výběrovým a základním souborem Osnova 1 Úvod, pojmy Vztahy mezi výběrovým a základním
Pokročilejší metody: výběr. Začínáme otázkami na povahu vysvětlované proměnné a končíme otázkami na povahu vysvětlujících proměnných
Výběr metody Jak vybrat správnou statistickou metodu pro moje data a pro otázku, kterou si kladu Neexistuje žádná náhražka za zkušenost nejlepší metoda, jak vědět co dělat, je použít stejnou správnou metodu
5EN306 Aplikované kvantitativní metody I
5EN306 Aplikované kvantitativní metody I Přednáška 10 Zuzana Dlouhá Předmět a struktura kurzu 1. Úvod: struktura empirických výzkumů 2. Tvorba ekonomických modelů: teorie 3. Data: zdroje a typy dat, význam