EKONOMETRIE 8. předáška Klasický lieárí regresí model Formulace a podmíky (pozor a ozačeí parametrů) Základí edorovicový model: zobrazue ekoomickou hypotézu o vztahu mezi edou vysvětlovaou ekoomickou veličiou a edou ebo ěkolika vysvětluícími veličiami. Jedá se o klasický lieárí regresí model, který budeme psát ve tvaru Y β 0 + β x + β x +... + β k x k + u, Pro pozorováí musí platit Y β 0 + β x + β x +... + β k x k + u Y β 0 + β x + β x +... + β k x k + u... Y β 0 + β x + β x +... + β k x k + u Soustavu můžeme přepsat v maticovém vyádřeí y Xβ + u, Y x x... x k β 0 Y x x... x k β........................... Y x x... x k β k u u. +.. u Z pozorováí odhademe výběrovou regresí fukci: $Y b 0 + b x + b x +... + b k x k, Pro i-té pozorováí (i,,...,) dostáváme Y i β 0 + β x i + β x i +... + β k x ki + u i, $Y i b 0 + b x i + b x i +... + b k x ki Rozdíly mezi skutečými hodotami Y i a vyrovaými hodotami $ Y i sou tzv. rezidua, což sou odhady ezámých áhodých složek u i e i Y i - $ Y i, i,,...,. Model e potom možo apsat v maticovém vyádřeí.
Pro vyrovaé hodoty: $y Xb pro skutečé hodoty: y Xb + e Aby bylo možé statisticky odhadout vektor odhadů parametrů b, e třeba zavést zásadí předpoklady. Tyto podmíky sou pro kvatifikaci modelu zásadí, aby bylo možo použít pro odhad parametrů metodu emeších čtverců. Nedříve podmíky vyádříme formálě a potom e budeme dále aalyzovat. Symbolem u` vyadřueme traspozici vektoru u. Podmíky. E(u) 0. E (uu`) σ I, 3. E(X`u) 0, 4. h(x ) k+. Metoda emeších čtverců Při splěí podmíek základího modelu lze použít pro odhad parametrů metodu emeších čtverců. Pro obecé odvozeí vzorců použieme maticového vyádřeí. Model v maticovém vyádřeí: y Xb + e Kritérium pro odvozeí odhadové fukce e miimum součtu čtverců reziduí: e`e (y-xb)` (y-xb) y`y - b`x`y + b`x`xb. Hledáme miimum této kvadratické formy, proto položíme parciálí derivace podle parametrů rovy ule. Což maticově vyádřeo zapíšeme ásledově: ( e` e) b` X `y + X `Xb 0. Řešeím této soustavy dostáváme ormálí rovice: X`Xb X`y Při existeci iverzí matice (X`X) - dostáváme bodovou odhadovou fukci: b (X`X) - X`y Metoda emeších čtverců poskytue odhady s dobrými vlastostmi i pro malé výběry pozorováí. Vlastosti odhadové fukce:
. estraost. vydatost Nestraost zameá, že středí hodota odhadu parametrů se rová parametrům teoretické regresí fukce: E(b) β. To zameá, že odhadová fukce b e při opakovaých výběrech v průměru přesá. Vydeme z odhadové fukce: b (X`X) - X`y dosadíme y Xβ + u a dostáváme: b (X`X) - X`(Xβ + u) β + (X`X) - X`u Spočteme středí hodotu b a vzhledem k podmíce E(u) 0, dostáváme E(b) E(β) + (X`X) - X`E(u) β Jestliže eplatí: E(b) β, odhadová fukce e vychýleá, kde vychýleí e rovo E(b) β Vydatost zameá, že odhadová fukce má emeší rozptyl mezi všemi estraými odhadovými fukcemi. Kovariačí matice pro b e defiováa ásledově a vzhledem k podmíce E (uu`) σ I, dostáváme V(b) E[ (b-β)`(b-β)] E[ (X`X) - X`uu`X(X`X) - ] (X`X) - X` E( uu`)x(x`x) - σ (X`X) -. Rozptyly odhadutých parametrů sou rovy součiu rozptylu áhodé složky σ a odpovídaících diagoálích prvků matice (X`X) -. Dá se ukázat, že tyto rozptyly sou emeší. Odhad kovariačí matice V(b) ozačíme S(b) a ezámý rozptyl áhodé složky σ ahradíme eho odhadem s : S(b) s (X`X) -, kde s e`e ( k + ) Hodota (k+) e počet stupňů volosti. Čím e větší počet pozorováí oproti počtu odhadovaých parametrů modelu, tím e meší rozptyl s a i rozptyly odhadu parametrů. Testy Statistická verifikace modelu spočívá v provedeí řady statistických testů.
Testy výzamosti parametrů Při staoveí bodového odhadu parametrů modelu pomocí metody emeších čtverců ebylo uté mít žádý předpoklad o pravděpodobostím rozděleí áhodých složek. Při testováí výzamosti parametrů a při itervalových odhadech parametrů musíme připoit předpoklad ormálího rozděleí áhodých složek s ulovými středími hodotami a kovariačí maticí: u ~ N( 0, σ I ). Odhady rozptylů odhadutých parametrů b matice: S(b) (X`X) - : s x sou a diagoále kovariačí Odmociy těchto hodot sou odhady stadardích chyb s b odhadů b. Kovariace dvoic představuí ediagoálí prvky : cov(b i,b) s x i Testové kritérium e statistika: t která má pro < 30 Studetovo t rozděleí s (k+) stupňů volosti. b β s b,i. V ekoometrické aalýze velice často testueme ulovou hypotézu, že regresí parametr β 0, což zameá, že vysvětluící proměá x emá vliv a vysvětlovaou proměou. Staovíme ulovou a alterativí hypotézu: H 0 : β 0 H : β 0 Jestliže platí t t* α/ akceptueme hypotézu H 0. Jestliže platí t > t* α/ odmíteme hypotézu H 0 ve prospěch hypotézy H. Hladia výzamosti α se většiou bere 0,05. To zameá, prohlásíme-li, že platí hypotéza H, eseme 5% riziko esprávosti tohoto výroku a 95% spolehlivosti výroku. Hodoty t* α/ ademe v tabulkách studetova rozděleí s (k+) stupi volosti. Itervaly spolehlivosti parametrů Určeí itervalů spolehlivosti zameá aít meze, mezi kterými leží skutečé hodoty parametrů se zadaým stupěm spolehlivosti α. Z testováí hypotéz víme, že: P( t* α/ < t < t* α/ ) α.
Po dosazeí statistiky: t b β dostáváme: s b P( b t* α/ s b < β < b + t* α/ s b ) α. To zameá, že s pravděpodobostí α, leží skutečá hodota parametru β v mezích: b t* α/ s b < β < b + t* α/ s b. Test shody odhadutého modelu s daty Nečastěi se pro testováí shody modelu s daty používá ako míra koeficiet determiace. Víme, že z apozorovaých empirických hodot a vyrovaých hodot vypočteých z regresí fukce můžeme určit 3 rozptyly s růzou vypovídací schopostí: a) rozptyl empirických hodot y s y ( yi y), t. celkový součet čtverců (CSČ), b) rozptyl vyrovaých hodot sy$ ( y$ i y), t. vysvětleý součet čtverců (VSČ), c) reziduálí rozptyl s( y y$ ) ( yi y$ ) t. evysvětleý součet čtverců (NSČ). Koeficiet determiace určíme ako podíl vysvětleého součtu čtverců a celkovém součtu čtverců. R VSČ CSČ NSČ CSČ Korigovaý koeficiet determiace: R e`e y`y y, R < 0, > k R R ( k + ) ( ) Statistickou výzamost modelu ako celku podle koeficietu determiace, lze testovat podle testovacího kritéria F R R ( k + ) k Staovíme ulovou a alterativí hypotézu: H 0 : statistická evýzamost R H : statistická výzamost R
Jestliže platí F > F*, odmíteme hypotézu H 0 ve prospěch hypotézy H, že hodota R e statisticky výzamá a rověž shoda modelu s daty e výzamá.