22. 4. 2010
Úvodní definice
Klasická definice Exogenita a endogenita není jednoznačná, přesto se nejčastěji pracuje s následující definicí. Proměnná x vysvětlující proměnnou y je exogenní, pokud L(y x) se nemění při změnách procesu generujícího x. Proměnná je endogenní, pokud není exogenní. V lineárním regresním modelu znamená podmínka exogenity nekorelovanost regresorů s reziduální složkou.
Vlastnosti Endogenní proměnné v soustavě vznikají. alespoň v jedné rovnici figurují jako vysvětlované proměnné. Naopak exogenní proměnné vznikají v minulých časech nebo do soustavy vstupují zvnějšku. musí být pouze vysvětlující.
Druhy exogenní proměnné Exogenní proměnnou můžeme rozdělit do dvou kategoríı: Predeterminovaná je nekorelovaná se současnými a budoucími hodnotami reziduální složky. Byla vytvořena soustavou v minulém čase. Striktně exogenní je nekorelovaná se všemi hodnotami reziduální složky. Vznikla vně soustavy.
Kritika Rozdělení na endogenní a exogenní proměnné je subjektivní. Většinou se z důvodu dosáhnutí idenfikace některé proměnné ze systému vyloučí. Změny v exogenních proměnných by neměly měnit hodnoty koeficientů u proměnných. Další definice je založena na Grangerově kauzalitě, jejíž základní myšlenkou je, že budoucnost nemůže ovlivnit přítomnost nebo minulost a definuje: slabou exogenitu superexogenitu silnou exogenitu
Slabá exogenita Proměnná x t je slabě exogenní při odhadu parametru λ, pokud nedochází ke ztrátě informace. To znamená, že pokud v rovnici f (y t, x t ) = g(y t x t )h(x t ) obsahuje g(y t x t ) parametr λ, pak ho marginální rozdělení h(x t ) neobsahuje.
Superexogenita Proměnná x t je superexogenní, pokud je slabě exogenní. parametr v f (y t, x t ) je invariantní vůči změnám marginálního rozdělení proměnné x t.
Silná exogenita Proměnná x t je silně exogenní, pokud je slabě exogenní. není generována jinou endogenní proměnnou v systému.
Příklad V soustavě rovnic x t = α 0 + α 1 y t + ε 0t, y t = β 0 + β 1 z t + ε 1t jsou proměnné x t a y t endogenní a proměnná z t exogenní. V soustavě x t = α 0 + α 1 y t + ε 0t, y t = β 0 + β 1 z t + ε 1t, jsou všechny proměnné endogenní. z t = γ 0 + γ 1 y t + ε 2t
Testování exogenity 1 Hausmannův test pro instrumentální proměnné využívá F-statistiku (b 2SLS b) (( ˆX ˆX ) 1 (X X ) 1 ) 1 (b 2SLS b) s2sls 2, kde ˆX = Z(Z Z) 1 Z X a Z je matice instrumentálních proměnných. V modelu y j = Ŷjγ j + X j β j + ε j provedeme test o platnosti H 0 : γ j = 0.
Testování exogenity 2 Je možné použít klasický F-test, kde statistika T (k j + m j 1) RSS 0 RSS F mj 1,T (k m j 1 RSS j +m j 1). Jednodušší variantou je použití LM-testu, kde má veličina LM = TR 2 χ 2 m j 1 a R 2 je koeficient determinace v modelu E u j = Ŷ j γ j + X j β j pro OLSrezidua u j z modelu E y j = X j β j.
Strukturální tvar Nebo-li SEM, simultaneous equation models je soustava rovnic y jt = m i=1,i j y it γ ji + k x it β ji + ε jt, i=1 y j = Y j γ j + X j β j + ε j = Z j δ j + ε j, 0 = YΓ + XB + E = Z + E kde y jt, j = 1,..., m jsou endogenní a x it, i = 1,..., k exogenní proměnné. Matice Y je matice endogenních proměnných tvaru (T m), matice odpovídajících parametrů Γ má pak tvar (m m). Podobně má matice exogenních proměnných X tvar (T k).
Redukovaný tvar Pokud je Γ invertibilní, můžeme SEM převést do redukovaného tvaru Y = XΠ + V kde Π = BΓ 1, V = EΓ 1.
Identifikace OLS-odhad tvaru Y = XΠ + V je nestranný a konzistentní, ale může nastat problém s transformací zpět:
Identifikace OLS-odhad tvaru Y = XΠ + V je nestranný a konzistentní, ale může nastat problém s transformací zpět: inverzní transformace k Π = BΓ 1 není jednoznačná nebo neexistuje
Identifikace OLS-odhad tvaru Y = XΠ + V je nestranný a konzistentní, ale může nastat problém s transformací zpět: inverzní transformace k Π = BΓ 1 není jednoznačná nebo neexistuje problém nenastane, tj. lze jednoznačně transformovat Π do strukturálního tvaru na Γ a B. Pak stejnou transformací z odhadu P = (X X) 1 X Y získáme nestranný a konzistentní odhad ˆΓ a ˆB, tzv. ILS-odhad
Druhy SEM rovnic neidetifikovaná (unidentified) - z redukovaných parametrů nelze získat žádný soubor strukturálních parametrů identifikovaná (identified) - když není neidentifikovaná přesně identifikovaná (exactly identified) - získáme právě jeden soubor, tj. jednoznačně přeidentifikovaná (overidentified) - lze získat aspoň dva odlišné soubory
Druhy SEM rovnic neidetifikovaná (unidentified) - z redukovaných parametrů nelze získat žádný soubor strukturálních parametrů identifikovaná (identified) - když není neidentifikovaná přesně identifikovaná (exactly identified) - získáme právě jeden soubor, tj. jednoznačně přeidentifikovaná (overidentified) - lze získat aspoň dva odlišné soubory Určení typu rozměrová podmínka (order condition) - založena na počtech zařazených a chybějících proměnných v rovnici. Pouze nutná a nikoli postačující hodnostní podmínka (rank condition) - založena na hodnostech matic parametrů. Nutná a postačující, ale technické problémy
Rozměrová podmínka identifikace m celkový počet endogenních proměnných k celkový počet exogenních proměnných m j počet endogenních proměnných v j-té rovnici k j počet exogenních proměnných v j-té rovnici mj kj počet vynechaných endogenních proměnných v j-té rovnici počet vynechaných exogenních proměnných v j-té rovnici Rozměrová podmínka pro identifikovanost je ve tvaru: m j + k j m 1
Příklad Uvažujme následující soustavu simultánních rovnic: y 1t = γ 12 y 2t + γ 13 y 3t + β 11 + β 12 x 2t + β 13 x 3t + ε 1t y 2t = γ 23 y 3t + β 21 + β 22 x 2t + ε 2t y 3t = γ 32 y 2t + β 31 + ε 3t. V tomto příkladu je m = 3 a k = 3 první rovnice je neidentifikovaná (žádná proměnná není vynechaná) druhá rovnice je přesně identifikovaná (vynechány y 1 a x 3 ) třetí rovnice je přeidentifikovaná (vynechány y 1, x 2 a x 3 ) V praxi je většina rovnic přeidentifikovaná
Hodnostní podmínka identifikace Hodnostní podmínka pro identifikaci je ve tvaru: rank(a j ) = m 1 zaručuje jednoznačnost
Hodnostní podmínka identifikace Hodnostní podmínka pro identifikaci je ve tvaru: rank(a j ) = m 1 zaručuje jednoznačnost [ Γ B ] = A 0j A 1j A 2j A 3j A 4j 1 γ j 0 β j 0 po přerovnání sloupců A 5j A 6j A 7j A 8j A 9j [ ] A2j A potom A j = 4j A 7j A 9j
Hodnostní podmínka identifikace Hodnostní podmínka pro identifikaci je ve tvaru: rank(a j ) = m 1 zaručuje jednoznačnost [ Γ B ] = A 0j A 1j A 2j A 3j A 4j 1 γ j 0 β j 0 po přerovnání sloupců A 5j A 6j A 7j A 8j A 9j [ ] A2j A potom A j = 4j A 7j A 9j podmínky spolu souvisejí - počet vynechaných proměnných je počet nul
Příklad 0 1 0 0 = @ 1 0 γ 1 0 31 γ 12 1 γ 32 A @ y 1 0 1 y 2 A + @ β 1 x 1 0 11 β 21 β 31 β 41 0 x 2 β 12 1 β 32 0 β 52 A Bx 3 C 0 γ 23 1 y 3 β 13 0 0 β 43 0 @ x A + @ ε 1 1 ε 2 A 4 ε 3 x 5 A 1 = ( ) ( ) ( ) 1 β52 β41 1 β21 β, A γ 23 0 2 =, A β 3 = 31 0 43 γ 12 1 β 32 β 52 Kromě A 2 můžeme dosáhnout hodnost matic A j rovnu m 1 = 2, a tedy kromě druhé rovnice mohou být všechny identifikované.
Existuje mnoho metod, jak odhadovat soustavy simultánních rovnic. Obecně můžeme tyto odhady rozdělit do dvou skupin Odhady s omezenou informací (LI-odhady, limited information methods) - odhadují jednotlivé rovnice soustavy každou zvlášť, takže pro odhad j-té rovnice nevyužijí veškerou informaci, kterou o soustavě máme. Patří sem např. ILS - odhad, 2SLS - odhad a LIML - odhad. Odhady s úplnou informací (FI-odhady, full information methods) - odhadují najednou parametry všech rovnic soustavy, takže využijí veškerou datovou informaci, kterou o soustavě máme. Patří sem např. 3SLS - odhad a FIML - odhad.
ILS - odhad (Indirect Least Squares, nepřímý odhad metodou nejmenších čtverců) Tento odhad přistupuje k odhadu strukturálních parametrů simultánních rovnic ve dvou krocích klasickou metodou nejmenších čtverců odhadneme matici parametrů redukované formy P = (X X) 1 X Y spočítáme parametry strukturální formy podle vztahu ˆB = PˆΓ
- transformace inverzní k nemusí obecně existovat. Platí Π = BΓ 1 pro neidentifikovanou rovnici neexistuje ILS - odhad pro přesně identifikovanou rovnici existuje právě jeden ILS - odhad, tento odhad je konzistentní a asymptoticky eficientní pro přeidentifikovanou rovnici existují aspoň dva různé ILS - odhady, všech možných odhadů je nejvýše ( ) k kj. m j 1 Každý z těchto odhadů je konzistentní, ale není asymptoticky eficientní.
2SLS - odhad (Two Stage Least Squares, dvoustupňový odhad metodou nejmenších čtverců) Tento odhad je nejpoužívanějším odhadem pro SEM. Za instrumentální proměnné se vezmou všechny exogenní proměnné uvažované soustavy. 2SLS - odhad se opět provádí ve dvou krocích pro j-tou rovnici y j = Y j γ j + X j β j + ε j = Z j δ j + ε j vypočteme OLS - hodnoty všech endogenních proměnných Y j na pravé straně j-té rovnice Ŷ j = XP j = X(X X) 1 X Y j
vypočteme finální odhad b 2SLSj a c 2SLSj parametrů β j a γ j tak, že v původní rovnici nahradíme regresory Y j vypočtenými hodnotami Ŷj Platí y j = Ŷ j γ j + X j β j + ε j a opět zkonstruujeme OLS - odhad. 2SLS - odhad parametrů j-té rovnice je konzistentní 2SLS - odhad parametrů j-té rovnice je asymptoticky normální 2SLS - odhad parametrů j-té rovnice je asymptoticky eficientní 2SLS - odhad parametrů j-té rovnice je totožný s ILS - odhadem, pokud j-tá rovnice je přesně identifikovaná
LIML - odhad (Limited Information Maximum Likelihood, maximálně věrohodný odhad s neúplnou informací) Tento odhad je maximálně věrohodný odhad vycházející z pravděpodobnostního rozdělení reziduální složky j-té rovnice, v praxi většinou předpokládáme (asymptotickou) normalitu. Označme W 0 j = E 0 j E 0 j, kde a E 0 j = [I X j (X jx j ) 1 X j]y 0 j Y 0 j = (y j, Y j ).
Tedy každý sloupec E 0 j odpovídá vektoru reziduí při regresi odpovídajícího sloupce Y 0 j na X j (tj. regrese endogenních proměnných vyskytujících se v j-té rovnici na exogenní proměnné ve stejné rovnici). Dále definujme W 1 j = E 1 j E 1 j = Y 0 j [I X(X X) 1 X ]Y 0 j. V tomto modelu každý sloupec E 1 j odpovídajícího sloupce Y 0 j na X. odpovídá vektoru reziduí při regresi
Označme λ nejmenší vlastní číslo matice (W 1 j ) 1 W 0 j W 0 j a W 1 j ve tvaru ( ) W 0 wjj 0 w 0 j j = w 0 j W 0 jj a W 1 j = ( wjj 1 w 1 j w 1 j W 1 jj ) a zapišme matice
Potom LIML - odhady parametrů β j a γ j jsou definovány jako c LIMLj = [W 0 jj λw 1 jj] 1 (w 0 j λw 1 j ) a b LIMLj = [X jx j ] 1 X j (y j Y j c LIMLj ).
3SLS - odhad (Three Stage Least Squares, třístupňový odhad metodou nejmenších čtverců) v prvním a druhém kroku získáme 2SLS - rezidua všech rovnic soustavy a pomocí nich odhadneme všechny kovariance σ ij ve třetím kroku vypočteme finální 3SLS - odhad jako přípustný Aitkenův odhad v zobecněném modelu lineární regrese. Platí 3SLS - odhad je konzistentní 3SLS - odhad je asymptoticky normální 3SLS - odhad je asymptoticky eficientní
FIML - odhad (Full Information Maximum Likelihood, maximálně věrohodný odhad s úplnou informací) Tento odhad je maximálně věrohodný odhad vycházející z pravděpodobnostního rozdělení reziduálních složek všech rovnic soustavy, v praxi většinou předpokládáme (asymptotickou) normalitu. Vycházíme z redukovaného tvaru soustavy Y = XΠ + V a předpokládáme, že každý řádek V má mnohorozměrné normální rozdělení s E[v t X] = 0 a E[v t v t X] = Ω.
Potom logaritmická věrohodnostní funkce má tvar log L = T 2 [m log(2π) + log Ω + tr(ω 1 W)], kde W ij = 1 T (y Xπ0 i ) (y Xπ 0 j ) a π 0 j je j-tý sloupec Π.
Použitím substitucí Π = BΓ 1 a Ω 1 = ΓΣ 1 Γ a několika úpravami dostaneme logaritmickou věrohodnostní funkci ve tvaru log L = T 2 [m log(2π) 2 log Γ + tr(σ 1 S) + log Σ ], kde s ij = 1 T (Y Γ i + XB i ) (Y Γ j + XB j ). FIML - odhad dostaneme maximalizací této věrohodnostní funkce.
Cipra, T., Finanční ekonomie. Ekopress, Praha. Wooldridge, J. M., Econometric Analysis of Cross Section and Panel Data. MIT Press, Cambridge, Massachusetts. Maddala, G. S., Introduction to Econometrics. Macmillam Press, New York. Greene, W. H., Econometric Analysis. Macmillam Press, New York.