Předáška I Lukáš Frýd
Sylabus 1. Lieárí regresí model - opakováí 2. Lieárí regresí model II- odhady a Gauss-Markovovy předpoklady 3. Zobecěý lieárí regresí model 4. Úvod do časových řad 5. ARMA 6. ARIMA 7. Modely volatility I 8. Modely volatility II 9. Zobecěá metoda ejmeších čtverců 10. Vektorová autoregrese 11.Koitegrace 12.VECM
Hodoceí Průběžý test 0 až 40 bodů Hlavě praktická aplikace, ASI ope book. Semiárí práce ve dvojicích 60 bodů. Aktivita a hodiách! Máte ějaké vlastí ávrhy? Upravit BP? Co máte jako DP?
Zdroje Kihy: Itroductory Ecoometrics: A Moder Approach Wooldridge Itroductory Ecoometrics for Fiace Chris Brooks, user friedly https://www.kevisheppard.com/category:mfe i s Matlab kody Aalysis of Fiacial Time Series - Ruey S. Tsay Time Series Aalysis - James Douglas Hamilto, pěká kížka, ale špatě se sháí
Kozultačí hodiy? místost 429 NB Podělí 14:30-15:30 Pravděpodobě po domluvě Kotakt Lukas.fryd@gmail.com 777 995 850
Postup při modelováí ekoomických procesů 1) Sestavit ekoomický model 2) Sestavit ekoometrický model a základě ekoomického modelu 3) Získat data (pozor) 4) Odhadout ekoometický model a datovém vzorku 5) Otestovat model a odhaduté parametry možá chyba v bodě 1,2,3,4 6) Iterpretovat výsledky
Základí soubor (populace) vs. Výběr (sample) log(wage) = β 0 + β 1 educ + ε Nemůžeme zkoumat každého jedice v populaci Nákladé Často emožé log(wage) = 0,2535 + 0,0359educ + ε Výběrový soubor provedeme výběr, se kterým pak pracujeme Kdybychom mohli opakovat výběr Odhad vztahu z výběrového souboru log(wage) = 0,3491 + 0,0279educ + e 0,0359educ 0,0279educ Proč? Odhad je áhodá veličia má své rozděleí!!! β 1
Musíme rozlišovat log wage = β 0 + β. educ + ε Populačí regresí fukce log wage = b 0 + b 1. educ + e výběrová regresí fukce (sample) b 0 je odhadem β 0 Naším úkolem v ekoometrii bude PRÁVĚ ODHADNOUT hodoty parametrů b 1 je odhadem β 1 β 0, β 1 jsou parametry NEMĚNÍ SE b 0, b 1 jsou estimátory odhad áhodé veličiy měí se, se změou výběrového souboru!!!
NEZNÁME Hodoty populačí regresí fukce Ai zda-li má skutečý vztah tvar: log(wage) = β 0 + β 1 educ + ε Proto je uté ejprve vytvořit ekoomický model!!! Ekoomická teorie ám pomáhá k jeho vytvořeí Velikost mzdy může záviset a: Vzděláí Délce praxe Dobu u yějšího zaměstavatele Pohlaví... log(wage) = 0,2535 + 0,0359educ + ε Výběrový soubor Odhad základího souboru log(wage) = 0,3491 + 0,0279educ + e
Pracujeme s výběrovým souborem!!! Vytváříme odhad Q = β 0 + β 1. C + ε q = b 0 + b 1. C + e Skutečý vztah (ezáme) """""Q = 72 1,8. C + ε"""""" Reziduum Musíme odhadout parametry (β) modelu metoda ejmeších čtverců maximum likelihood maximálí věrohodost GLZ GMM Q 60 Závislost výstupu a průměrých ákladech q = 71,74 1,77. C + e Všechy body eleží a přímce 50 40 30 20 10 0 0 50 100 150 200 250 300 350 C
Q = β 0 + β 1. C + ε q = b 0 + b 1. C + e q = 71,74 0,177. C Q = 72 0,18. C + ε Skutečý vztah Nepozorovatelý Odhadutý vztah Naměřeé hodoty NELEŽÍ a teoretické (populačí) regresí přímce Naměřeé hodoty NELEŽÍ ai a empirické (odhaduté) regresí přímce Náhodá složka (chyba) 60 50 40 30 20 10 0 0 50 100 150 200 250 300 350
Vyrovaé hodoty a rezidua Každé apozorovaé y i ahradíme (afitujeme) vyrovaou hodotou y i Ideálí by bylo kdyby y i = y i Všechy body by ležely a přímce determiistický model bohužel existují další proměé (áhodé) Úkol Určit odhady parametrů b 0,1 tak, aby hodota reziduí byla co ejmeší Rozlišovat!!! y = β 0 + β 1. x + ε y = b 0 + b 1. x + e y = b 0 + b 1. x y y 5 y = β 0 + β 1. x + ε y = b 0 + b 1. x y 2 y 5 y 2 x
y = β 0 + β 1. x + ε Skutečý vztah Provedeme áhodý výběr Vyrováme (afitujeme) hodoty Napozorovaé hodoty ahradíme vyrovaými hodotami Otázkou je: podle jakého pravidla ahrazovat apozorovaé hodoty jak zjistit, zda-li bylo ahrazeí OK y = b 0 + b 1. x Vytvoříme odhad Skutečého vztahu y y 5 y = b 0 + b 1. x e 5 y 5 y i = y i + e i y 5 = y 5 + e 5 y 2 x 5 x
Existece áhodé chyby 1) Zahruje v sobě další miorití vlivy praxe, schoposti wage = β 0 + β 1 educ + ε 2) Chyba v měřeí, sběru dat 3) Možost špaté specifikace modelu praxe, schoposti 4) Stochastický (áhodý) charakter lidského chováí (epředvídatelý) C C = β 0 + β 1 Y + ε C = β 0 + β 1 Y Aalýza residuí Y
x Teoretická a empirická regresí fukce Pro každé pozorováí (i),2 y i = β 0 + β 1. x i + ε i Při eexisteci chyby (ε) Model determiistický (pevá závislost) y=3+2.x y i - i-tá empirická hodota vysvětlovaé proměé (výos pole i) Mzda Míry, Kirilla, Leky ε i - áhodá chyba e i -reziduum rozdíl mezi empirickou regresí fukcí a empirickou hodotou Náhodá chyba ε i - áhodá složka (chyba) rozdíl mezi teoretickou regresí fukcí a empirickou hodotou Na (y) působí další áhodé proměé ež pouze (x) Na pozorováí působí áhodé chyby (epřesé váhy) y y i Empirická regresí fukce ε i e i Reziduum je odhadem áhodé chyby (dopustili jsme se dalších chyb) ε i Teoretická regresí fukce e i
Nezáme skutečý vztah PRF Musíme udělat odhady β 0,1 - b 0,1 Proč? Pro odhad parametrů využíváme růzé techiky OLS (MNČ), GLS(MZNČ), MLM(MMV) Požadavky a odhad Nezkresleý (estraý, evychýleý) Kozistetí Vydatý výos = β 0 + β 1 hojivo + ε Chceme zát ceteris paribus efekt Vlastosti odhadů y = β 0 + β 1 x + ε y = b 0 + b 1 x + e Pokud budou splěy určité předpoklady Metoda ejmeších čtverců ám poskyte požadovaé vlastosti odhadu Pamatovat: β 0,1 jsou parametry (kostaty) ezáme b 0,1 jsou áhodé veličiy mají svoje rozděleí
Požadavky a odhad Nezkresleý (estraý, evychýleý) Kozistetí Vydatý Proč? výos = β 0 + β 1 hojivo + ε y = β 0 + β 1 x + ε y = b 0 + b 1 x + e Pokud budou splěy určité předpoklady Metoda ejmeších čtverců ám poskyte požadovaé vlastosti odhadu Pamatovat: β 0,1 jsou parametry (kostaty) ezáme b 0,1 jsou áhodé veličiy mají svoje rozděleí Provádíme pouze 1 áhodý výběr proto spíše mluvíme o postupu při získáí odhadu pokud budou splěy předpoklady a provedli bychom -áhodých výběrů Odhad parametrů by byl ezkresleý, kozistetí, vydatý Pro 1 áhodý výběr musíme doufat, že získaý vzorek, se blíží základímu souboru Jelikož základí soubor ezáme, emůžeme si být zcela jisti o podobosti se ZS Důležité uvědomit si pro případé využité ekoometrických modelů Pokud budou splěy daé předpoklady Daá metoda vede k ezkresleému, kozistetímu případě i vydatému odhadu
Závislá a ezávislá proměá 1) y = β 0 + β 1. x + ε Skutečý epozorovaý vztah Zajímá ás jak se měí y se změou x Na y kromě x působí další proměé - ε Jiak by body byly a přímce Předpoklad správosti modelu!!! My se pouze domíváme že 1) představuje skutečý vztah y = β 1 x y/ x = β 1 y zavislá vysvětlovaá x ezávislá Vysvětlující y wage y = b 0 + b 1 x y = β 0 + β 1. x respose CONTROL regresad Regresor y = β 1 predicted predictor β 0 x = 1 β 1 sklo β 0 úrovňová kostata x edu
y = β 1 x wage = 0,5 + 0,3edu + ε NEZNÁME wage = 0,3 x Nás PRÁVĚ zajímá jak stupě vzděláí ovliví velikost mzdy Změa (růst) vzděláí o 1 rok avíc Zameá růst mzdy o 0,3 Jedá se o ceteris paribus (když ostatí se eměí) Zůstává fixí wage y = β 0 + β 1. x Proto musíme zavést restrikci pro chováí áhodé složky Chceme aby se změou (x) se měil POUZE y A e ostatí faktory i ty v ε y = β 1 ε = 0 pak y = β 1 x β 0 x = 1 β 1 sklo β 0 úrovňová kostata itercept edu
y = β 0 + β 1. x + ε wage = β 0 + β 1 edu + ε ε = 0 pak y = β 1 x Zovu: a) Zajímá ás jak se měí y se změou x b) Na y kromě x působí další proměé - ε Proto restrikce a vztah x a ε E εȁx = E ε Bez této restrikce bychom ezjistili ceteris paribus efekt β k Je uté, aby (x) a (ε) byly ezávislé Setkáte se s ekorelovaé (slabší předpoklad) Pro ás E εȁx = E ε = 0 ε Pod áhodou složkou si zle představit: Další miorití vlivy Chyby v měřeí Stochastický charakter lidského chováí Možost chybého modelu špatý model Pro (ε) je áhodá proměá předpokládáme, že: Spojeí s úrovovou kostatou E ε = 0 áhodé vlivy se v průměru vyruší Faktory obsažey v áhodé složce jsou v průměru ulové Proč? Korelace řeší lieárí vztah (jak se změí ε když se změí x) Může astat korelace (ε) a (x) je ula, ale korelace (ε) a (x 2 ) apř. 0,6 E εȁx = 0 postihuje i tyto elieárí případy Nedodržeí obecě povede ke zkresleému odhadu x
Regresí fukce y = β 0 + β 1. x + ε E ȁ y x = β 0 + β 1. x E( wageȁedu) Podmíěá středí hodota jak ovlivňuje hodota (x) středí hodotu (y) jak se měí (y), když se měí (x) v průměru zbavit se dalších vlivů Cílem je popsat co ejlépe vztah Aby v průměru bylo (y) vysvětleo pomocí (x) Aby v průměru další vlivy (ezkreslovali) model V průměru zameá osoba A má vzděláí 10 a mzdu 4 E ȁ ε x = 0 wage = 0,5 + 0,3 10 = 3,5 wage = 0,5 + 0,3edu + ε Regresí aalýza ám eřeke, že osoba Veroika, Míra má přesě daou mzdu Zjistíme však jak vzděláí ovlivňuje její velikost!!! To platí jak pro PRF i SRF!!! ȁ E(ε x) = 0 Jak růzá x ovliví očekávaé (průměré) ε Proměá x je exogeí při eplatosti edogeí Zero-coditioal mea assumptio
mzda = β 0 + β 1. vzděláí + ε Cíl zjistit jak vzděláí ovlivňuje velikost mzdy E ȁ ε x = 0 E ȁ mzda vzděláí = β 0 + β 1. vzděláí Na výši mzdy působí i další vlivy Předpoklad ε=schoposti E Předpokládáme E ȁ schoposti vzděláí = 0 schopostiȁ5 = 0 E schopostiȁ15 = 0 Zjistíme jak růst/pokles vzděláí ovliví velikost mzdy -β 1 Kdy míra schopostí se eměí E ȁ schoposti vzděláí 0 Vzděláí ovliví schoposti i mzdu Odhad β 1 bude zkresleý a ekozistetí
E mzda = β 0 + β 1. vzděláí + ε Cíl zjistit jak vzděláí ovlivňuje velikost mzdy ȁ mzda vzděláí = β 0 + β 1. vzděláí mzda = b 0 + b 1. vzděláí + e b 0 = 146,852 b 1 = 60,2143 mzda = 146,852 + 60,2143. vzděláí + e mzda = 146,852 + 60,2143. vzděláí
mzda = 146,852 + 60,2143. vzděláí + e mzda = 146,852 + 60,2143. vzděláí
E ȁ y x = β 0 + β 1. x E(ε) = 0 E ȁ ε x = 0 mzda = β 0 + β 1. vzdláí + ε E ȁ schoposti vzděláí = 0 Vliv x i a vývoj středí hodoty y i měří změu středí hodoty (y) - tedy E yȁx v závislosti a změě x Pro daý stupeň vzděláí, budeme měit pozorováí Získáme rozdílé hodoty (y) mzdy Vlivem áhodé složky y E E yȁx = β 0 + β 1. x ȁ mzda vzděláí = β 0 + β 1. vzděláí Míra má plat 30 000 a studoval 5 let Jeho plat by měl být 20 000 Jakto? Náhodá složky Míra má MFF ε~iid(0, σ 2 ) Myšleka v průměru 2 5 10 Markéta má plat 18 000 a studoval 5 let Jeho plat by měl být 20 000 Jakto? Rozděleí (hustota) áhodé složky Náhodá složky NF Nepozorovatelá Zatím žádý předpoklad o kokrétím rozděleí áhodé složky x
Hledáí kokrétího tvaru regresí fukce Červeé body začí empirické (apozorovaé) hodoty Musíme ajít vhodou přímku, která ejlépe proloží apozorovaá data Nebo-li určit odhady parametrů b 0,1 tak, aby hodota reziduí byla co ejmeší y i = β 0 + β 1. x i + ε i y i = b 0 + b 1. x i Každou empirickou hodotu y i ahradíme určitou vyrovaou hodotou y i Která bude ležet a zvoleé empirické (výběrové) regresí přímce y Problém je, že takových přímek může existovat ekoečě moho Musíme ajít kritérium ejlépe vystihe daý vztah y 5 y 6 y y 5 y 1 y 2 y 3 y 3 y 4 y 4 = y 4 y 5 y 6 y 1 y 3 y 4 y 6 y 7 y 1 y 2 x y 2 x
Metoda ejmeších čtverců (MNČ,OLS) Jeda z metod jak odhadout parametry β 0 a β 1 další metoda mometů(mom) a maximálí věrohodost (ML) y = β 0 + β 1 x + ε y = b 0 + b 1 x y = b 0 + b 1 x + e Pro OLS si uvedeme 3 způsoby odhadu (každý at si vybere) Pomocí sum (přehledé, epraktické) Maticově (pro sudety eřehledé, praktické) Pomocí tzv. Moetů Problém je, že takových přímek může existovat ekoečě moho Musíme ajít kritérium ejlépe vystihe daý vztah y y 5 y 3 y 4 y 7 y 1 y 6 y 2 x
Zeleé šipky představují odchylku skutečé hodoty od vyrovaé hodoty e i = y i y Otázka: Když už musí existovat odchylky ideálí by bylo jejich vzájemé vykompezováí? e i = y i y i = 0 y y 5 y 6 y 7 Kladé a záporé odchylky se požerou y 3 y 4 y 5 y 7 e i = y i b 0 b 1 x 1 = 0 y 1 y 3 y 4 = y 4 y 6 y 1 y 2 e i -reziduum Rozdíl mezi empirickou regresí fukcí a empirickou hodotou x
Součet čtverců odchylek empirických hodot y i od hodot teoretických η i byl miimálí Metoda ejmeších čtverců (MNČ, OLS) y = β 0 + β 1 x + ε y = b 0 + b 1 x + e y i = b 0 + b 1. x i e 2 i = (y i y i ) 2 mi y y 7 e 2 i = (y i b 0 b 1 x 1 ) 2 mi y 5 y 6 y 3 y 4 y 5 y 6 y 7 e i = 0 y 1 y 2 y 3 y 4 = y 4 Rozlišovat y 1 y 2 e 2 i mi x
Přímková regrese y = β 0 + β 1. x + ε y = b 0 + b 1. x e 2 i = (y i y i ) 2 mi Q mi hledáme extrém miimum b 0 je odhad β 0 b 1 je odhad β 1 Q = (y i b 0 b 1. x i ) 2 Tedy takové b 0,1, které budou miimalizovat fukci Q 2 Q = (y i b 0 b 1. x i ) 2 = (y 1 b 0 b 1. x 1 ) 2 +(y 2 b 0 b 1. x 2 ) 2 Idex i představuje i-té pozorováí Mzdu, vzděláí Natáliye Q = 2 b 0 y i b 0 b 1. x i. 1 = 0 Q b 0 = 2. y 1 b 0 b 1. x 1. 1 + 2. y 2 b 0 b 1. x 2. 1 = 0 Q = 2 b 1 y i b 0 b 1. x i. x i = 0 Q b 1 = 2. y 1 b 0 b 1. x 1. x 1 + 2. y 2 b 0 b 1. x 2. x 2 = 0
Q = 2 b 0 y i b 0 b 1. x i. 1 = 0 Q = 2 b 1 y i b 0 b 1. x i. x i = 0 y i b 0 b 1. x i = 0 y i =. b 0 +b 1 തy =. b 0 +b 1 xҧ തy = b 0 + b 1 xҧ b 0 = തy b 1 xҧ x i y i b 0 b 1. x i. x i = 0 y i. x i = b 0 x i + b 1 y i. x i = b 0 x ҧ + b 1 x i 2 x i 2 y i. x i = (തy b 1 x) ҧ x ҧ + b 1 y i. x i = തy xҧ b 1 xҧ 2 + b 1 x i 2 x i 2 pozor suma ҧ x = x i
ҧ y i. x i = തy xҧ b 1 xҧ 2 + b 1 y i. x i തy x ҧ = b 1 x 2 i xҧ 2 x i 2 Pozor a idexy!!! xҧ 2 = x i 2 = 1 x i x i y i. x i തy xҧ x 2 i xҧ 2 = b 1 x i =. xҧ x i x ҧ. y i തy = y i x i x ҧ = x i (y i തy) (y i. x i y i x) ҧ (x 2 i x i x) ҧ = b 1 x i x ҧ. y i തy b x i xҧ 2 = b 1 = 1 Cov(x, y) Var(x) (x 2 i x i x) = x i xҧ 2 b 0 = തy b 1 xҧ
ҧ ҧ x ҧ = x i x i =. xҧ x i x ҧ. y i തy = y i x i x ҧ = x i (y i തy) x i x ҧ. y i തy = (x i y i x i തy xy ҧ i + xҧ തy) = x i y i തy (x 2 i x i x) = x i xҧ x i xҧ 2 = x i xҧ 2 y i + xҧ തy = x 2 i 2xҧ x i + xҧ 2 = x i y i തy xҧ xҧ തy + xҧ തy = x i y i തy x ҧ = = x i y i തy x i = x i (y i തy) x 2 i 2x ҧ x ҧ + xҧ 2 = = x 2 i xҧ 2 = (x 2 i x i x) തy x ҧ = തy x i = xҧ y i
Regresí koeficiet (výběrový regresí koeficiet) Směrice (sklo) regresí přímky Může abýt libovolých hodot!!! Přímková regrese je lieárí regresí fukce (lieárí v parametrech) Obráceě emusí platit!!! b 1 = y i = b 0 + b 1. x b xy = s xy s x 2 x i x ҧ. (y i തy) x i xҧ 2 PŘÍMKOVÁ REGRESE!!! JEDNODUCHÝ RM!!! Zaméko kovariace udává zaméko odhadu parametru!! Proč? b 1 = Cov(x, y) var(x) cov(x, y) > 0 cov(x, y) < 0 cov x, y = 0 Lieárí ezávislost
Víceásobá regrese V praxi jedoduchý regresí model málo užitečý Dobrý pro pochopeí a ilustraci Poptávka po peězích MD=f(Y,i), poptávka po statku (x) Q X =f(p X,P y,i) atd. Pro lepší popis reality musíme (většiou) pracovat s více ezávislými proměými Více podstatých faktorů přispívá k vyšší míře vysvětleí variability y Vyšší flexibilita vztahů z hlediska fukčí formy wage = β 0 + β 1 edu + ε V áhodé složce (ε) obsažey další faktory: wage = β 0 + β 1. educ + β 2. exper + ε Délka praxe Schoposti (ějaká aproximace) Doba u stávajícího zaměstavatele Faktory, které ejsou vyjádřey v modelu i chybá fukčí forma více jié fukčí formy Pokud bude ějaká proměá v (ε) korelovaá s (edu) zkresleý a ekozistetí odhad E( εȁx) 0 E yȁx β 0 + β 1. x vytáhli jsme délku praxe (exper) z áhodé složky Nyí můžeme měřit apř. vliv změy v praxi v případě, kdy se vzděláí eměí Ceteris paribus efekt Δwage Δexper = β 2
y = β 0 + β 1. x 1 + β 2. x 2 + + β k. x k + ε β 0 úrovňová kostata velikost x 1,,k = 0 β 1 "sklo" jak se změí y když se změí x 1 a x 2,,k se eměí β 2 "sklo" jak se změí y když se změí x 2 a x 1,,3,k se eměí β 1,2 k sklo vždy jak se změíβ 1,2 k když ostatí faktory růstaou fixí Vliv x i a vývoj středí hodoty y za předpokladu, že ostatí vysvětlující proměé se ezměí E ȁ y X = wage = β 0 + β 1. educ + β 2. exper + ε β 0 úrovňová kostata velikost mzdy pokud educ = 0 a exper = 0 β 1 "sklo" jak se změí wage, když se změí edu a exper se eměí β 2 "sklo" jak se změí wage když se změí exper a exper se eměí parciálí regresí koeficiety "partiall efect
y = β 0 + β 1. x 1 + β 2. x 2 + β 3. x 3 + ε β 0 úrovňová kostata velikost x 1,2,3 = 0 β 1 "sklo" jak se změí y když se změí x 1 a x 2,3 se eměí β 2 "sklo" jak se změí y když se změí x 2 a x 1,3 se eměí β 3 "sklo" jak se změí y když se změí x 3 a x 1,2 se eměí Δ y = b 1. Δx 1 ceteris paribus efekt Δ y = b 1. Δx 1 + b 2 Δx 2 Δ y = b 1. Δx 1 + b 2 Δx 2 + b 3 Δx 3 celková změa Dopad a změu afitovaé hodoty Ne pozorovaé! Řešíme podmíěou STŘEDNÍ hodotu
y = β 0 + β 1. x 1 + β 2. x 2 + ε log(wage) = β 0 + β 1. educ + β 2. exper + ε Odhad log(wage) = b 0 + b 1. educ + b 2. exper + e log(wage) = 5,50271 + 0,077782. educ + 0,0197768. exper + e educ vzděláí v letech exper praxe v letech
y = β 0 + β 1. x 1 + β 2. x 2 + + β. x + ε wage = β 0 + β 1. educ + β 2. exper + β 3. teure + ε educ-vzděláí v letech exper-počet let a trhu práce teure- doba zaměstáí u současého zaměstavatele wage = 0,284 + 0,092. educ + 0,0041. exper + 0,022teure + e Jak ovliví velikost mzdy apříklad: Vzroste doba vzděláí o další 1 rok Vzroste doba praxe o 2 roky Dodělám si ástavbu (1 rok) a budu o rok déle u zaměstavatele Velikost mzdy vzroste o 0,092 jedotek Velikost mzdy vzroste o 0,0041*2=0,008 jedotek y = b 1. x 1 + b 2. x 2 = 0,092.1 + 0,022.1 = 0,114 Ceteris paribus Chceme vědět jak se změí mzda, pokud vzroste (změí) vzděláí o 1 rok a ostatí proměé se ezměí zůstaou fixí Simultáí změa ezávislých proměých y = b 1. x 1 + b 2. x 2 + + b. x
Pro jedoduchý regresí model E ȁ y x = β 0 + β 1. x E ȁ ε x = 0 Pro víceásobý (pro jedoduchost budeme pracovat se 2 ezávislými proměými-aalogie) y = β 0 + β 1. x 1 + β 2. x 2 + ε wage = β 0 + β 1. educ + β 2. exper + ε Opět požadujeme předpoklad E ȁ ε x 1, x 2 = E ε = 0 E ȁ ε educ, exper = 0 Žádá ezávislá proměá v průměru eovliví áhodou složku Všechy vysvětlující proměé jsou exogeí E E ȁ y x 1, x 2 = β 0 + β 1. x 1 + β 2. x 2 ȁ y X = β 0 + β 1. x 1 + β 2. x 2 β i měří změu středí hodoty (y), tedy E yȁx 1, x 2 v závislosti a jedotkovém zvýšeí x i za předpokladu že ostatí vysvětlující proměé jsou fixí tj. ceteris paribus. Vliv x i a vývoj středí hodoty y za předpokladu, že ostatí vysvětlující proměé se ezměí
y = β 0 + β 1. x 1 + β 2. x 2 + ε E ȁ ε x 1, x 2 = 0 E ȁ y x 1, x 2 = β 0 + β 1. x 1 + β 2. x 2 Důležité upozorěí ikdy eobsáhu všechy proměé, které působí a (y) Častý ešvar aflákat co ejvíce vysvětlujících proměých do modelu Řiďte se logikou, teorií, to co už ěkdo (kvalití) vymyslel Zahrutí více proměých má své plus i míus (vyechaá proměá, Omitted variable )
E ȁ y x = β 0 + β 1. x E(ε) = 0 E ȁ ε x = 0 mzda = β 0 + β 1. vzdláí + ε E ȁ mzda vzděláí = β 0 + β 1. vzděláí Vliv x i a vývoj středí hodoty y i měří změu středí hodoty y - tedy E v závislosti a jedotkovém zvýšeí x ȁ y x Myšleka v průměru E ȁ schoposti vzděláí = 0 y E yȁx = β 0 + β 1. x Populačí distribučí fukce Nepozorovatelá Zatím žádý předpoklad o kokrétím rozděleí áhodé složky 5 10 30 x
Odhad získáme jako výsledek ějaké fukce (estimator) - OLS Odhad je výstup z estimátoru b 0,,k Výběrový soubor prožeeme ějakou fukcí (estimator) získáme odhad (bodový, itervalový) Výška studetů VŠE Estimátor തX = 1 X i Odhademe populačí průměr výšky dospělých lidí Var(X) = 1 1 X i തX 2 Odhademe populačí rozptyl výšky dospělých lidí b = X X 1 X y Odhademe populačí parametry vlivu β populačí proces
y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + ε y 1 = β 0 + β 1 x 11 + β 2 x 12 + + β k x 1k + ε 1 y 2 = β 0 + β 1 x 21 + β 2 x 22 + + β k x 2k + ε 2 Data pro korétí subjekt jedotlivec, firma atd. y 1 y 2 y = 1 1 1. β 0 + x 11 x 21 x 1 β 1 + x 12 x 22 x 2 β 2 + + x 1k x 2k x k β k + ε 1 ε 2 ε y 1 y 2 y = 1 x 11 x 12 x 1k 1 x 21 x 22 x 2k 1 x 1 x 2. x k β 0 β 1 β 2 β k + ε 1 ε 2 ε 3 ε PRF: y = Xβ + ε
y = b 0 + b 1 x 1 + b 2 x 2 + + b k x k + e y 1 y 2 y = 1 x 11 x 12 x 1k 1 x 21 x 22 x 2k 1 x 1 x 2. x k b 0 b 1 b 2 b k + e 1 e 2 e SRF: y = Xb + e
εε = ε 1 ε 2. ε 1 ε 2 ε 3 = ε 3 ε 1 ε 1 ε 1 ε 2 ε 1 ε 3 ε 2 ε 1 ε 2 ε 2 ε 2 ε 3 ε 3 ε 1 ε 3 ε 2 ε 3 ε 3 = σ 2 0 0 0 σ 2 0 = σ 2 0 0 σ 2 1 0 0 0 1 0 0 0 1 = σ 2 I kovariačí matice Σ Co jsou prvky mimo diagoálu? Cov x, y = x E x. (y E(y)) ε~(0, σ 2 I) E ε = 0 Cov ε 2, ε 1 = ε 2 E(ε 2 ). (ε 1 E(ε 1 )) Cov ε 2, ε 1 = ε 2. ε 1 = 0 Var ε = σ 2 I Var ε = E ε 2 = σ 2 I ε 1 ε 1 ε 1 ε 2 ε 1 ε 3 ε 2 ε 1 ε 2 ε 2 ε 2 ε 3 = ε 3 ε 1 ε 3 ε 2 ε 3 ε 3 Var(ε 1 ) Cov(ε 1, ε 2 ) Cov(ε 1, ε 3 ) Cov(ε 2, ε 1 ) Var(ε 2 ) Cov(ε 2, ε 3 ) Cov(ε 3, ε 1 ) Cov(ε 3, ε 2 ) Var(ε 3 )
Maticově e e = mi b y Xb. (y Xb) e e = mi(y b X ). (y Xb) b mi e 2 i = y i y 2 mi y i b 0 b 1. x i1 + b 2. x i2 2 mi(y y y Xb b X y + b X Xb) b y Xb = y Xb = b X y traspoovaý skalár je skalár mi(y y 2b X y + b X Xb) b b = 2X y + 2X Xb = 0 2X y + 2X Xb = 0 X y = X Xb b = X X 1 X y Ax = A AB = B A x x x A = A x x Ax = A + A x A ei symetricka matice x Ax = 2Ax A je symetricka matice x x x A Ax = 2A Ax
b = X X 1 X y b = X X 1 X (Xβ + ϵ) b = X X 1 X Xβ + X X 1 X ϵ b = β + X X 1 X ϵ
b = X X 1 X y Pozorováí wage educ exper 1 20 4 10 2 15 6 1 3 35 10 5 4 18 5 4 X y 1 1 1 1 4 6 10 5 10 1 5 4 X X 1 4 10 1 1 1 6 10 5 1 5 4 = 4 25 20 25 177 116 20 116 142 1 1 1 1 4 6 10 5 10 1 5 4 X y 20 15 35 18 = 88 610 462 X X 1 3,6932 0,3890 0,2024 0,3890 0,0531 0,0114 0,2024 0,0114 0,0262 X y 88 610 462 = b 5,7925 3,4383 1,2606 wage = 5,7925 + 3,4383. educ + 1,2606exper
X = 1 1 1 x 1 z 1 x 2 z 2 x 3 z 3 X = 1 1 1 x 1 x 2 x 3 z 1 z 2 z 3 b = X X 1 X y y = y 1 y 2 y 3 b = b 0 b 1 b 2 1 x i z i X X = 1 1 1 x 1 x 2 x 3 z 1 z 2 z 3 1 1 1 x 1 z 1 x 2 z 2 x 3 z 3 = x i x i 2 x i z i z i z i x i z i 2 y i X y = 1 1 1 x 11 x 21 x 31 x 12 x 22 x 32. y 1 y 2 y 3 = x i y i z i y i
y = β 0 + β 1 x + β 2 z + ε b = X X 1 X y b 0 b 1 b 2 = 1 x i x i 2 x i z i x i z i 1 y i x i y i Pro ás důležité, že apř. odhad b 1 představující dopad změy x a y je spoje i s daty z!!! z i z i x i z i 2 z i y i Podroběji v části A Partiallig Out Iterpretatio Frische.. 1 y i + x i x i y i + z i z i y i b 0 b 1 b 2 = x i z i 2 y i + x i x i y i + x i z i 1 2 y i + z i x i x i y i + z i z i y i z i y i PRODUKT Z INVERZNÍ MATICE
Nafitovaé hodoty OLS a residua y = β 0 + β 1. x 1 + β 2. x 2 + ε Residua jsou pozorovatelá Náhodé chyby e!!! Residua jsou odhadem áhodých chyb Residua ejsou to samé jako áhodé chyby e i = y i y i y = b 0 + b 1. x 1 + b 2. x 2 y = b 0 + b 1. x 1 + b 2. x 2 + e V residuálí aalýze budeme zkoumat vlastosti residuí Chceme, aby měla určité vlastosti proč? Gauss-Markovy předpoklady Využíváme testy pro hodoceí modelu založea a vlastostech residuí OLS je pouze jeda z metod odhadu Jié metody jié afitovaé hodoty-jié hodoty residuí Průměr ebo suma? Pro OLS platí: výběrový průměr residuí = 0 E e = 0 a tak തy = y - víme z odvozeí OLS výběrová kovariace mezi X a e = 0 E X, e = 0 Výběrová kovariace y a e = 0 E y, e = 0 തy = b 0 + b 1. x 1 + b 2. x 2 + + b x തy, x 1, x 2,, x vždy leží a OLS regresí "přímce"
Když uděláme odhad parametrů pomocí OLS Lze rozdělit apozorovaé hodoty y i a dvě části Vyrovaé hodoty a rezidua y i = y i + e i y i = b 0 + b 1 x i SST = y i തy 2 SSE = y i തy 2 SSR = Total sum of squares Explaied sum of squares Residual sum of squares SST = SSE + SSR e 2 y y 5 e 5 čím více jsou fialové a červeé čtverce podobé tím lépe y 5 തy x
čím více jsou fialové a červeé čtverce podobé tím lépe Jak OLS regresí přímka afituje data Neí to tak jasé, ale jsou to čtverce y y 5 y y 5 e 5 e 5 y 5 y 5 തy തy x x
Užitečé mít hodotu, jedo číslo, které shre jak regrese pomocí OLS fituje hodoty Vytvořeí SRF zároveň získáme jedotlivá rezidua Čím větší bude hodota reziduí tím méě bude SRF fitovat aměřé hodoty y i SST = SSE + SSR /SST Jak hodotit kvalitu OLS metody SST = y i തy 2 SSE = y i തy 2 SSR = e i 2 R 2 = 1 = SSE SST + SSR SST SSE SST = R2 = 1 SSR SST vysvětleý rozptyl (díky x) celkový rozptyl (y) Část(zlomek, proceto ) Rozptylu v (y), který se podařil vysvětlit působeím (x) (100. R2) v % Koeficiet determiace R 2 =< 0,1 > R 2 = 1 perfektí proložeí SSE = SST, tedy SSR = 0 R 2 = 0 Vyjadřuje stupeň vysvětleí celkové změy závislé edogeí proměé y regresí při působeí všech ezávislých exogeích proměých x zahrutých v regresím modelu Využití pro ověřeí shody odhadutého modelu s apozorovaými daty
R 2 = vysvětleý rozptyl (díky x) celkový rozptyl (y) R 2 =< 0,1 > Problémem je, že R 2 ikdy eklese přidáím další proměé Buď se ezměí, spíše vzroste R 2 eí dobrý způsob pro porováí modelů s rozdílým možství vysvětlujícíh proměých (X)
Problém hodoceí modelu s růzým počtem vysvětlujících proměých (X) vyřešíme pomocí Korigovaého (upraveého, adjusted) koeficietu determiace Zároveň vhodé pro použití modelů pro rozdílá možství pozorováí () Pealizuje rostoucí (k) adjr 2, ഥR 2 R 2 = 1 SSR SST തR 2 = 1 Var(e) Var(y) = 1 1 k 1 (1 R2 ) 1 "trestá" další k k 1 തR 2 = 1 SSR k 1 SST 1 = 1 1 k 1 (1 R2 ) Nezkresleý výběrový rozptyl!!! y = β 0 + β 1. x 1 + β 2. x 2 + ε vs. l(y) = β 0 + β 1. x 1 + β 2. x 2 + ε Pozor a k v ěkteré literatuře v sobě obsahuje itercept!!! Pozor തR 2 elze použít pro rozdílé fukčí tvary závisle proměé
y തy x