Přednáška I. Lukáš Frýd

Podobné dokumenty
Lekce 2 Jednoduchý lineární regresní model

Přednáška II. Lukáš Frýd

EKONOMETRIE 9. přednáška Zobecněný lineární regresní model

K čemu slouží regrese?

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

} kvantitativní znaky. korelace, regrese. Prof. RNDr. Jana Zvárov. Obecné principy

Odhady parametrů 1. Odhady parametrů

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

Pravděpodobnost a aplikovaná statistika

8. Analýza rozptylu.

Lekce 1 úvod do ekonometrie

PRAVDĚPODOBNOST A STATISTIKA

Intervalové odhady parametrů

Náhodný výběr 1. Náhodný výběr

Petr Šedivý Šedivá matematika

KONEČNĚ ROZDĚLENÁ ZPOŽDĚNÍ. POLYNOMICKY ROZDĚLENÉ ZPOŽDĚNÍ.

Metody zkoumání závislosti numerických proměnných

Závislost slovních znaků

Deskriptivní statistika 1

14. B o d o v é o d h a d y p a r a m e t r ů

3. Lineární diferenciální rovnice úvod do teorie

Intervalové odhady parametrů některých rozdělení.

REGRESNÍ DIAGNOSTIKA. Regresní diagnostika

Základy statistiky. Zpracování pokusných dat Praktické příklady. Kristina Somerlíková

9. Měření závislostí ve statistice Pevná a volná závislost

Pravděpodobnostní model doby setrvání ministra školství ve funkci

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

4. B o d o v é o d h a d y p a r a m e t r ů

OVMT Přesnost měření a teorie chyb

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

je konvergentní, právě když existuje číslo a R tak, že pro všechna přirozená <. Číslu a říkáme limita posloupnosti ( ) n n 1 n n n

je konvergentní, právě když existuje číslo a R tak, že pro všechna přirozená <. Číslu a říkáme limita posloupnosti ( ) n n 1 n n n

Přepoklady KLM a Gauss Markov teorém. Blue odhad - GM. KLM Klasický lineární model. 1) Lineární v parametrech. 2) E ε = 0

Přednáška VI. Intervalové odhady. Motivace Směrodatná odchylka a směrodatná chyba Centrální limitní věta Intervaly spolehlivosti

PRAVDĚPODOBNOST A STATISTIKA

Úloha II.S... odhadnutelná

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

IAJCE Přednáška č. 12

veličiny má stejný řád jako je řád poslední číslice nejistoty. Nejistotu píšeme obvykle jenom jednou

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

Při sledování a studiu vlastností náhodných výsledků poznáme charakter. podmínek různé výsledky. Ty odpovídají hodnotám jednotlivých realizací

OKRUŽNÍ A ROZVOZNÍ ÚLOHY: OBCHODNÍ CESTUJÍCÍ. FORMULACE PŘI RESPEKTOVÁNÍ ČASOVÝCH OKEN

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

Tento projekt je spolufinancován Evropským sociálním fondem a Státním rozpočtem ČR InoBio CZ.1.07/2.2.00/

Úloha III.S... limitní

Sekvenční logické obvody(lso)

VaR analýza citlivosti, korekce

VYSOCE PŘESNÉ METODY OBRÁBĚNÍ

8. Odhady parametrů rozdělení pravděpodobnosti

8.2.1 Aritmetická posloupnost I

Iterační metody řešení soustav lineárních rovnic

Lineární a adaptivní zpracování dat. 9. Modely časových řad II.

Katedra pravděpodobnosti a matematické statistiky. χ 2 test nezávislosti

P2: Statistické zpracování dat

12. N á h o d n ý v ý b ě r

Pro statistické šetření si zvolte si statistický soubor např. všichni žáci třídy (několika tříd, školy apod.).

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

základním prvkem teorie křivek v počítačové grafice křivky polynomiální n

MATICOVÉ HRY MATICOVÝCH HER

UPLATNĚNÍ ZKOUŠEK PŘI PROHLÍDKÁCH MOSTŮ

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

Mezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby.

n-rozměrné normální rozdělení pravděpodobnosti

8.2.1 Aritmetická posloupnost

Kvantová a statistická fyzika 2 (Termodynamika a statistická fyzika)

Parametr populace (populační charakteristika) je číselná charakteristika sledované vlastnosti

Budeme pokračovat v nahrazování funkce f(x) v okolí bodu a polynomy, tj. hledat vhodné konstanty c n tak, aby bylo pro malá x a. = f (a), f(x) f(a)

jsou reálná a m, n jsou čísla přirozená.

Pravděpodobnost vs. statistika. Data. Teorie pravděpodobnosti pracuje s jednou nebo více teoretickými náhodnými

4 DOPADY ZPŮSOBŮ FINANCOVÁNÍ NA INVESTIČNÍ ROZHODOVÁNÍ

Lineární a adaptivní zpracování dat. 8. Modely časových řad I.

Tržní ceny odrážejí a zahrnují veškeré informace předpokládá se efektivní trh, pro cenu c t tedy platí c t = c t + ε t.

Matematika 1. Katedra matematiky, Fakulta stavební ČVUT v Praze. středa 10-11:40 posluchárna D / 13. Posloupnosti

MATEMATICKÁ INDUKCE. 1. Princip matematické indukce

PODNIKOVÁ EKONOMIKA A MANAGEMENT (2-letý) (písemný test)

PODNIKOVÁ EKONOMIKA A MANAGEMENT (2-letý) (písemný test)

1. ZÁKLADY VEKTOROVÉ ALGEBRY 1.1. VEKTOROVÝ PROSTOR A JEHO BÁZE

Užití binomické věty

Aplikovaná informatika. Podklady předmětu Aplikovaná informatika pro akademický rok 2006/2007 Radim Farana. Obsah. Algoritmus

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

f x a x DSM2 Cv 9 Vytvořující funkce Vytvořující funkcí nekonečné posloupnosti a0, a1,, a n , reálných čísel míníme formální nekonečnou řadu ( )

Číselné charakteristiky náhodných veličin

Pravděpodobnostní modely

STUDIUM MAXWELLOVA ZÁKONA ROZDĚLENÍ RYCHLSOTÍ MOLEKUL POMOCÍ DERIVE 6

8.1.3 Rekurentní zadání posloupnosti I

4EK311 Operační výzkum. 4. Distribuční úlohy LP část 2

Intervalový odhad. nazveme levostranným intervalem pro odhad parametru Θ. Statistiku. , kde číslo α je blízké nule, nazveme horním

Generování dvojrozměrných rozdělení pomocí copulí

PRAVDĚPODOBNOST A STATISTIKA

Interval spolehlivosti pro podíl

V. Normální rozdělení

1.1. Definice Reálným vektorovým prostorem nazýváme množinu V, pro jejíž prvky jsou definovány operace sčítání + :V V V a násobení skalárem : R V V

3. Sekvenční obvody. b) Minimalizujte budící funkce pomocí Karnaughovy mapy

Teorie odhadů 2 Teorie odhadů... 3 Odhad parametrů... 4

NEPARAMETRICKÉ METODY

14. Testování statistických hypotéz Úvod statistické hypotézy Definice 14.1 Statistickou hypotézou parametrickou neparametrickou. nulovou testovanou

Matematika 1. Ivana Pultarová Katedra matematiky, Fakulta stavební ČVUT v Praze. středa 10-11:40 posluchárna D Posloupnosti

Náhodný výběr, statistiky a bodový odhad

Transkript:

Předáška I Lukáš Frýd

Sylabus 1. Lieárí regresí model - opakováí 2. Lieárí regresí model II- odhady a Gauss-Markovovy předpoklady 3. Zobecěý lieárí regresí model 4. Úvod do časových řad 5. ARMA 6. ARIMA 7. Modely volatility I 8. Modely volatility II 9. Zobecěá metoda ejmeších čtverců 10. Vektorová autoregrese 11.Koitegrace 12.VECM

Hodoceí Průběžý test 0 až 40 bodů Hlavě praktická aplikace, ASI ope book. Semiárí práce ve dvojicích 60 bodů. Aktivita a hodiách! Máte ějaké vlastí ávrhy? Upravit BP? Co máte jako DP?

Zdroje Kihy: Itroductory Ecoometrics: A Moder Approach Wooldridge Itroductory Ecoometrics for Fiace Chris Brooks, user friedly https://www.kevisheppard.com/category:mfe i s Matlab kody Aalysis of Fiacial Time Series - Ruey S. Tsay Time Series Aalysis - James Douglas Hamilto, pěká kížka, ale špatě se sháí

Kozultačí hodiy? místost 429 NB Podělí 14:30-15:30 Pravděpodobě po domluvě Kotakt Lukas.fryd@gmail.com 777 995 850

Postup při modelováí ekoomických procesů 1) Sestavit ekoomický model 2) Sestavit ekoometrický model a základě ekoomického modelu 3) Získat data (pozor) 4) Odhadout ekoometický model a datovém vzorku 5) Otestovat model a odhaduté parametry možá chyba v bodě 1,2,3,4 6) Iterpretovat výsledky

Základí soubor (populace) vs. Výběr (sample) log(wage) = β 0 + β 1 educ + ε Nemůžeme zkoumat každého jedice v populaci Nákladé Často emožé log(wage) = 0,2535 + 0,0359educ + ε Výběrový soubor provedeme výběr, se kterým pak pracujeme Kdybychom mohli opakovat výběr Odhad vztahu z výběrového souboru log(wage) = 0,3491 + 0,0279educ + e 0,0359educ 0,0279educ Proč? Odhad je áhodá veličia má své rozděleí!!! β 1

Musíme rozlišovat log wage = β 0 + β. educ + ε Populačí regresí fukce log wage = b 0 + b 1. educ + e výběrová regresí fukce (sample) b 0 je odhadem β 0 Naším úkolem v ekoometrii bude PRÁVĚ ODHADNOUT hodoty parametrů b 1 je odhadem β 1 β 0, β 1 jsou parametry NEMĚNÍ SE b 0, b 1 jsou estimátory odhad áhodé veličiy měí se, se změou výběrového souboru!!!

NEZNÁME Hodoty populačí regresí fukce Ai zda-li má skutečý vztah tvar: log(wage) = β 0 + β 1 educ + ε Proto je uté ejprve vytvořit ekoomický model!!! Ekoomická teorie ám pomáhá k jeho vytvořeí Velikost mzdy může záviset a: Vzděláí Délce praxe Dobu u yějšího zaměstavatele Pohlaví... log(wage) = 0,2535 + 0,0359educ + ε Výběrový soubor Odhad základího souboru log(wage) = 0,3491 + 0,0279educ + e

Pracujeme s výběrovým souborem!!! Vytváříme odhad Q = β 0 + β 1. C + ε q = b 0 + b 1. C + e Skutečý vztah (ezáme) """""Q = 72 1,8. C + ε"""""" Reziduum Musíme odhadout parametry (β) modelu metoda ejmeších čtverců maximum likelihood maximálí věrohodost GLZ GMM Q 60 Závislost výstupu a průměrých ákladech q = 71,74 1,77. C + e Všechy body eleží a přímce 50 40 30 20 10 0 0 50 100 150 200 250 300 350 C

Q = β 0 + β 1. C + ε q = b 0 + b 1. C + e q = 71,74 0,177. C Q = 72 0,18. C + ε Skutečý vztah Nepozorovatelý Odhadutý vztah Naměřeé hodoty NELEŽÍ a teoretické (populačí) regresí přímce Naměřeé hodoty NELEŽÍ ai a empirické (odhaduté) regresí přímce Náhodá složka (chyba) 60 50 40 30 20 10 0 0 50 100 150 200 250 300 350

Vyrovaé hodoty a rezidua Každé apozorovaé y i ahradíme (afitujeme) vyrovaou hodotou y i Ideálí by bylo kdyby y i = y i Všechy body by ležely a přímce determiistický model bohužel existují další proměé (áhodé) Úkol Určit odhady parametrů b 0,1 tak, aby hodota reziduí byla co ejmeší Rozlišovat!!! y = β 0 + β 1. x + ε y = b 0 + b 1. x + e y = b 0 + b 1. x y y 5 y = β 0 + β 1. x + ε y = b 0 + b 1. x y 2 y 5 y 2 x

y = β 0 + β 1. x + ε Skutečý vztah Provedeme áhodý výběr Vyrováme (afitujeme) hodoty Napozorovaé hodoty ahradíme vyrovaými hodotami Otázkou je: podle jakého pravidla ahrazovat apozorovaé hodoty jak zjistit, zda-li bylo ahrazeí OK y = b 0 + b 1. x Vytvoříme odhad Skutečého vztahu y y 5 y = b 0 + b 1. x e 5 y 5 y i = y i + e i y 5 = y 5 + e 5 y 2 x 5 x

Existece áhodé chyby 1) Zahruje v sobě další miorití vlivy praxe, schoposti wage = β 0 + β 1 educ + ε 2) Chyba v měřeí, sběru dat 3) Možost špaté specifikace modelu praxe, schoposti 4) Stochastický (áhodý) charakter lidského chováí (epředvídatelý) C C = β 0 + β 1 Y + ε C = β 0 + β 1 Y Aalýza residuí Y

x Teoretická a empirická regresí fukce Pro každé pozorováí (i),2 y i = β 0 + β 1. x i + ε i Při eexisteci chyby (ε) Model determiistický (pevá závislost) y=3+2.x y i - i-tá empirická hodota vysvětlovaé proměé (výos pole i) Mzda Míry, Kirilla, Leky ε i - áhodá chyba e i -reziduum rozdíl mezi empirickou regresí fukcí a empirickou hodotou Náhodá chyba ε i - áhodá složka (chyba) rozdíl mezi teoretickou regresí fukcí a empirickou hodotou Na (y) působí další áhodé proměé ež pouze (x) Na pozorováí působí áhodé chyby (epřesé váhy) y y i Empirická regresí fukce ε i e i Reziduum je odhadem áhodé chyby (dopustili jsme se dalších chyb) ε i Teoretická regresí fukce e i

Nezáme skutečý vztah PRF Musíme udělat odhady β 0,1 - b 0,1 Proč? Pro odhad parametrů využíváme růzé techiky OLS (MNČ), GLS(MZNČ), MLM(MMV) Požadavky a odhad Nezkresleý (estraý, evychýleý) Kozistetí Vydatý výos = β 0 + β 1 hojivo + ε Chceme zát ceteris paribus efekt Vlastosti odhadů y = β 0 + β 1 x + ε y = b 0 + b 1 x + e Pokud budou splěy určité předpoklady Metoda ejmeších čtverců ám poskyte požadovaé vlastosti odhadu Pamatovat: β 0,1 jsou parametry (kostaty) ezáme b 0,1 jsou áhodé veličiy mají svoje rozděleí

Požadavky a odhad Nezkresleý (estraý, evychýleý) Kozistetí Vydatý Proč? výos = β 0 + β 1 hojivo + ε y = β 0 + β 1 x + ε y = b 0 + b 1 x + e Pokud budou splěy určité předpoklady Metoda ejmeších čtverců ám poskyte požadovaé vlastosti odhadu Pamatovat: β 0,1 jsou parametry (kostaty) ezáme b 0,1 jsou áhodé veličiy mají svoje rozděleí Provádíme pouze 1 áhodý výběr proto spíše mluvíme o postupu při získáí odhadu pokud budou splěy předpoklady a provedli bychom -áhodých výběrů Odhad parametrů by byl ezkresleý, kozistetí, vydatý Pro 1 áhodý výběr musíme doufat, že získaý vzorek, se blíží základímu souboru Jelikož základí soubor ezáme, emůžeme si být zcela jisti o podobosti se ZS Důležité uvědomit si pro případé využité ekoometrických modelů Pokud budou splěy daé předpoklady Daá metoda vede k ezkresleému, kozistetímu případě i vydatému odhadu

Závislá a ezávislá proměá 1) y = β 0 + β 1. x + ε Skutečý epozorovaý vztah Zajímá ás jak se měí y se změou x Na y kromě x působí další proměé - ε Jiak by body byly a přímce Předpoklad správosti modelu!!! My se pouze domíváme že 1) představuje skutečý vztah y = β 1 x y/ x = β 1 y zavislá vysvětlovaá x ezávislá Vysvětlující y wage y = b 0 + b 1 x y = β 0 + β 1. x respose CONTROL regresad Regresor y = β 1 predicted predictor β 0 x = 1 β 1 sklo β 0 úrovňová kostata x edu

y = β 1 x wage = 0,5 + 0,3edu + ε NEZNÁME wage = 0,3 x Nás PRÁVĚ zajímá jak stupě vzděláí ovliví velikost mzdy Změa (růst) vzděláí o 1 rok avíc Zameá růst mzdy o 0,3 Jedá se o ceteris paribus (když ostatí se eměí) Zůstává fixí wage y = β 0 + β 1. x Proto musíme zavést restrikci pro chováí áhodé složky Chceme aby se změou (x) se měil POUZE y A e ostatí faktory i ty v ε y = β 1 ε = 0 pak y = β 1 x β 0 x = 1 β 1 sklo β 0 úrovňová kostata itercept edu

y = β 0 + β 1. x + ε wage = β 0 + β 1 edu + ε ε = 0 pak y = β 1 x Zovu: a) Zajímá ás jak se měí y se změou x b) Na y kromě x působí další proměé - ε Proto restrikce a vztah x a ε E εȁx = E ε Bez této restrikce bychom ezjistili ceteris paribus efekt β k Je uté, aby (x) a (ε) byly ezávislé Setkáte se s ekorelovaé (slabší předpoklad) Pro ás E εȁx = E ε = 0 ε Pod áhodou složkou si zle představit: Další miorití vlivy Chyby v měřeí Stochastický charakter lidského chováí Možost chybého modelu špatý model Pro (ε) je áhodá proměá předpokládáme, že: Spojeí s úrovovou kostatou E ε = 0 áhodé vlivy se v průměru vyruší Faktory obsažey v áhodé složce jsou v průměru ulové Proč? Korelace řeší lieárí vztah (jak se změí ε když se změí x) Může astat korelace (ε) a (x) je ula, ale korelace (ε) a (x 2 ) apř. 0,6 E εȁx = 0 postihuje i tyto elieárí případy Nedodržeí obecě povede ke zkresleému odhadu x

Regresí fukce y = β 0 + β 1. x + ε E ȁ y x = β 0 + β 1. x E( wageȁedu) Podmíěá středí hodota jak ovlivňuje hodota (x) středí hodotu (y) jak se měí (y), když se měí (x) v průměru zbavit se dalších vlivů Cílem je popsat co ejlépe vztah Aby v průměru bylo (y) vysvětleo pomocí (x) Aby v průměru další vlivy (ezkreslovali) model V průměru zameá osoba A má vzděláí 10 a mzdu 4 E ȁ ε x = 0 wage = 0,5 + 0,3 10 = 3,5 wage = 0,5 + 0,3edu + ε Regresí aalýza ám eřeke, že osoba Veroika, Míra má přesě daou mzdu Zjistíme však jak vzděláí ovlivňuje její velikost!!! To platí jak pro PRF i SRF!!! ȁ E(ε x) = 0 Jak růzá x ovliví očekávaé (průměré) ε Proměá x je exogeí při eplatosti edogeí Zero-coditioal mea assumptio

mzda = β 0 + β 1. vzděláí + ε Cíl zjistit jak vzděláí ovlivňuje velikost mzdy E ȁ ε x = 0 E ȁ mzda vzděláí = β 0 + β 1. vzděláí Na výši mzdy působí i další vlivy Předpoklad ε=schoposti E Předpokládáme E ȁ schoposti vzděláí = 0 schopostiȁ5 = 0 E schopostiȁ15 = 0 Zjistíme jak růst/pokles vzděláí ovliví velikost mzdy -β 1 Kdy míra schopostí se eměí E ȁ schoposti vzděláí 0 Vzděláí ovliví schoposti i mzdu Odhad β 1 bude zkresleý a ekozistetí

E mzda = β 0 + β 1. vzděláí + ε Cíl zjistit jak vzděláí ovlivňuje velikost mzdy ȁ mzda vzděláí = β 0 + β 1. vzděláí mzda = b 0 + b 1. vzděláí + e b 0 = 146,852 b 1 = 60,2143 mzda = 146,852 + 60,2143. vzděláí + e mzda = 146,852 + 60,2143. vzděláí

mzda = 146,852 + 60,2143. vzděláí + e mzda = 146,852 + 60,2143. vzděláí

E ȁ y x = β 0 + β 1. x E(ε) = 0 E ȁ ε x = 0 mzda = β 0 + β 1. vzdláí + ε E ȁ schoposti vzděláí = 0 Vliv x i a vývoj středí hodoty y i měří změu středí hodoty (y) - tedy E yȁx v závislosti a změě x Pro daý stupeň vzděláí, budeme měit pozorováí Získáme rozdílé hodoty (y) mzdy Vlivem áhodé složky y E E yȁx = β 0 + β 1. x ȁ mzda vzděláí = β 0 + β 1. vzděláí Míra má plat 30 000 a studoval 5 let Jeho plat by měl být 20 000 Jakto? Náhodá složky Míra má MFF ε~iid(0, σ 2 ) Myšleka v průměru 2 5 10 Markéta má plat 18 000 a studoval 5 let Jeho plat by měl být 20 000 Jakto? Rozděleí (hustota) áhodé složky Náhodá složky NF Nepozorovatelá Zatím žádý předpoklad o kokrétím rozděleí áhodé složky x

Hledáí kokrétího tvaru regresí fukce Červeé body začí empirické (apozorovaé) hodoty Musíme ajít vhodou přímku, která ejlépe proloží apozorovaá data Nebo-li určit odhady parametrů b 0,1 tak, aby hodota reziduí byla co ejmeší y i = β 0 + β 1. x i + ε i y i = b 0 + b 1. x i Každou empirickou hodotu y i ahradíme určitou vyrovaou hodotou y i Která bude ležet a zvoleé empirické (výběrové) regresí přímce y Problém je, že takových přímek může existovat ekoečě moho Musíme ajít kritérium ejlépe vystihe daý vztah y 5 y 6 y y 5 y 1 y 2 y 3 y 3 y 4 y 4 = y 4 y 5 y 6 y 1 y 3 y 4 y 6 y 7 y 1 y 2 x y 2 x

Metoda ejmeších čtverců (MNČ,OLS) Jeda z metod jak odhadout parametry β 0 a β 1 další metoda mometů(mom) a maximálí věrohodost (ML) y = β 0 + β 1 x + ε y = b 0 + b 1 x y = b 0 + b 1 x + e Pro OLS si uvedeme 3 způsoby odhadu (každý at si vybere) Pomocí sum (přehledé, epraktické) Maticově (pro sudety eřehledé, praktické) Pomocí tzv. Moetů Problém je, že takových přímek může existovat ekoečě moho Musíme ajít kritérium ejlépe vystihe daý vztah y y 5 y 3 y 4 y 7 y 1 y 6 y 2 x

Zeleé šipky představují odchylku skutečé hodoty od vyrovaé hodoty e i = y i y Otázka: Když už musí existovat odchylky ideálí by bylo jejich vzájemé vykompezováí? e i = y i y i = 0 y y 5 y 6 y 7 Kladé a záporé odchylky se požerou y 3 y 4 y 5 y 7 e i = y i b 0 b 1 x 1 = 0 y 1 y 3 y 4 = y 4 y 6 y 1 y 2 e i -reziduum Rozdíl mezi empirickou regresí fukcí a empirickou hodotou x

Součet čtverců odchylek empirických hodot y i od hodot teoretických η i byl miimálí Metoda ejmeších čtverců (MNČ, OLS) y = β 0 + β 1 x + ε y = b 0 + b 1 x + e y i = b 0 + b 1. x i e 2 i = (y i y i ) 2 mi y y 7 e 2 i = (y i b 0 b 1 x 1 ) 2 mi y 5 y 6 y 3 y 4 y 5 y 6 y 7 e i = 0 y 1 y 2 y 3 y 4 = y 4 Rozlišovat y 1 y 2 e 2 i mi x

Přímková regrese y = β 0 + β 1. x + ε y = b 0 + b 1. x e 2 i = (y i y i ) 2 mi Q mi hledáme extrém miimum b 0 je odhad β 0 b 1 je odhad β 1 Q = (y i b 0 b 1. x i ) 2 Tedy takové b 0,1, které budou miimalizovat fukci Q 2 Q = (y i b 0 b 1. x i ) 2 = (y 1 b 0 b 1. x 1 ) 2 +(y 2 b 0 b 1. x 2 ) 2 Idex i představuje i-té pozorováí Mzdu, vzděláí Natáliye Q = 2 b 0 y i b 0 b 1. x i. 1 = 0 Q b 0 = 2. y 1 b 0 b 1. x 1. 1 + 2. y 2 b 0 b 1. x 2. 1 = 0 Q = 2 b 1 y i b 0 b 1. x i. x i = 0 Q b 1 = 2. y 1 b 0 b 1. x 1. x 1 + 2. y 2 b 0 b 1. x 2. x 2 = 0

Q = 2 b 0 y i b 0 b 1. x i. 1 = 0 Q = 2 b 1 y i b 0 b 1. x i. x i = 0 y i b 0 b 1. x i = 0 y i =. b 0 +b 1 തy =. b 0 +b 1 xҧ തy = b 0 + b 1 xҧ b 0 = തy b 1 xҧ x i y i b 0 b 1. x i. x i = 0 y i. x i = b 0 x i + b 1 y i. x i = b 0 x ҧ + b 1 x i 2 x i 2 y i. x i = (തy b 1 x) ҧ x ҧ + b 1 y i. x i = തy xҧ b 1 xҧ 2 + b 1 x i 2 x i 2 pozor suma ҧ x = x i

ҧ y i. x i = തy xҧ b 1 xҧ 2 + b 1 y i. x i തy x ҧ = b 1 x 2 i xҧ 2 x i 2 Pozor a idexy!!! xҧ 2 = x i 2 = 1 x i x i y i. x i തy xҧ x 2 i xҧ 2 = b 1 x i =. xҧ x i x ҧ. y i തy = y i x i x ҧ = x i (y i തy) (y i. x i y i x) ҧ (x 2 i x i x) ҧ = b 1 x i x ҧ. y i തy b x i xҧ 2 = b 1 = 1 Cov(x, y) Var(x) (x 2 i x i x) = x i xҧ 2 b 0 = തy b 1 xҧ

ҧ ҧ x ҧ = x i x i =. xҧ x i x ҧ. y i തy = y i x i x ҧ = x i (y i തy) x i x ҧ. y i തy = (x i y i x i തy xy ҧ i + xҧ തy) = x i y i തy (x 2 i x i x) = x i xҧ x i xҧ 2 = x i xҧ 2 y i + xҧ തy = x 2 i 2xҧ x i + xҧ 2 = x i y i തy xҧ xҧ തy + xҧ തy = x i y i തy x ҧ = = x i y i തy x i = x i (y i തy) x 2 i 2x ҧ x ҧ + xҧ 2 = = x 2 i xҧ 2 = (x 2 i x i x) തy x ҧ = തy x i = xҧ y i

Regresí koeficiet (výběrový regresí koeficiet) Směrice (sklo) regresí přímky Může abýt libovolých hodot!!! Přímková regrese je lieárí regresí fukce (lieárí v parametrech) Obráceě emusí platit!!! b 1 = y i = b 0 + b 1. x b xy = s xy s x 2 x i x ҧ. (y i തy) x i xҧ 2 PŘÍMKOVÁ REGRESE!!! JEDNODUCHÝ RM!!! Zaméko kovariace udává zaméko odhadu parametru!! Proč? b 1 = Cov(x, y) var(x) cov(x, y) > 0 cov(x, y) < 0 cov x, y = 0 Lieárí ezávislost

Víceásobá regrese V praxi jedoduchý regresí model málo užitečý Dobrý pro pochopeí a ilustraci Poptávka po peězích MD=f(Y,i), poptávka po statku (x) Q X =f(p X,P y,i) atd. Pro lepší popis reality musíme (většiou) pracovat s více ezávislými proměými Více podstatých faktorů přispívá k vyšší míře vysvětleí variability y Vyšší flexibilita vztahů z hlediska fukčí formy wage = β 0 + β 1 edu + ε V áhodé složce (ε) obsažey další faktory: wage = β 0 + β 1. educ + β 2. exper + ε Délka praxe Schoposti (ějaká aproximace) Doba u stávajícího zaměstavatele Faktory, které ejsou vyjádřey v modelu i chybá fukčí forma více jié fukčí formy Pokud bude ějaká proměá v (ε) korelovaá s (edu) zkresleý a ekozistetí odhad E( εȁx) 0 E yȁx β 0 + β 1. x vytáhli jsme délku praxe (exper) z áhodé složky Nyí můžeme měřit apř. vliv změy v praxi v případě, kdy se vzděláí eměí Ceteris paribus efekt Δwage Δexper = β 2

y = β 0 + β 1. x 1 + β 2. x 2 + + β k. x k + ε β 0 úrovňová kostata velikost x 1,,k = 0 β 1 "sklo" jak se změí y když se změí x 1 a x 2,,k se eměí β 2 "sklo" jak se změí y když se změí x 2 a x 1,,3,k se eměí β 1,2 k sklo vždy jak se změíβ 1,2 k když ostatí faktory růstaou fixí Vliv x i a vývoj středí hodoty y za předpokladu, že ostatí vysvětlující proměé se ezměí E ȁ y X = wage = β 0 + β 1. educ + β 2. exper + ε β 0 úrovňová kostata velikost mzdy pokud educ = 0 a exper = 0 β 1 "sklo" jak se změí wage, když se změí edu a exper se eměí β 2 "sklo" jak se změí wage když se změí exper a exper se eměí parciálí regresí koeficiety "partiall efect

y = β 0 + β 1. x 1 + β 2. x 2 + β 3. x 3 + ε β 0 úrovňová kostata velikost x 1,2,3 = 0 β 1 "sklo" jak se změí y když se změí x 1 a x 2,3 se eměí β 2 "sklo" jak se změí y když se změí x 2 a x 1,3 se eměí β 3 "sklo" jak se změí y když se změí x 3 a x 1,2 se eměí Δ y = b 1. Δx 1 ceteris paribus efekt Δ y = b 1. Δx 1 + b 2 Δx 2 Δ y = b 1. Δx 1 + b 2 Δx 2 + b 3 Δx 3 celková změa Dopad a změu afitovaé hodoty Ne pozorovaé! Řešíme podmíěou STŘEDNÍ hodotu

y = β 0 + β 1. x 1 + β 2. x 2 + ε log(wage) = β 0 + β 1. educ + β 2. exper + ε Odhad log(wage) = b 0 + b 1. educ + b 2. exper + e log(wage) = 5,50271 + 0,077782. educ + 0,0197768. exper + e educ vzděláí v letech exper praxe v letech

y = β 0 + β 1. x 1 + β 2. x 2 + + β. x + ε wage = β 0 + β 1. educ + β 2. exper + β 3. teure + ε educ-vzděláí v letech exper-počet let a trhu práce teure- doba zaměstáí u současého zaměstavatele wage = 0,284 + 0,092. educ + 0,0041. exper + 0,022teure + e Jak ovliví velikost mzdy apříklad: Vzroste doba vzděláí o další 1 rok Vzroste doba praxe o 2 roky Dodělám si ástavbu (1 rok) a budu o rok déle u zaměstavatele Velikost mzdy vzroste o 0,092 jedotek Velikost mzdy vzroste o 0,0041*2=0,008 jedotek y = b 1. x 1 + b 2. x 2 = 0,092.1 + 0,022.1 = 0,114 Ceteris paribus Chceme vědět jak se změí mzda, pokud vzroste (změí) vzděláí o 1 rok a ostatí proměé se ezměí zůstaou fixí Simultáí změa ezávislých proměých y = b 1. x 1 + b 2. x 2 + + b. x

Pro jedoduchý regresí model E ȁ y x = β 0 + β 1. x E ȁ ε x = 0 Pro víceásobý (pro jedoduchost budeme pracovat se 2 ezávislými proměými-aalogie) y = β 0 + β 1. x 1 + β 2. x 2 + ε wage = β 0 + β 1. educ + β 2. exper + ε Opět požadujeme předpoklad E ȁ ε x 1, x 2 = E ε = 0 E ȁ ε educ, exper = 0 Žádá ezávislá proměá v průměru eovliví áhodou složku Všechy vysvětlující proměé jsou exogeí E E ȁ y x 1, x 2 = β 0 + β 1. x 1 + β 2. x 2 ȁ y X = β 0 + β 1. x 1 + β 2. x 2 β i měří změu středí hodoty (y), tedy E yȁx 1, x 2 v závislosti a jedotkovém zvýšeí x i za předpokladu že ostatí vysvětlující proměé jsou fixí tj. ceteris paribus. Vliv x i a vývoj středí hodoty y za předpokladu, že ostatí vysvětlující proměé se ezměí

y = β 0 + β 1. x 1 + β 2. x 2 + ε E ȁ ε x 1, x 2 = 0 E ȁ y x 1, x 2 = β 0 + β 1. x 1 + β 2. x 2 Důležité upozorěí ikdy eobsáhu všechy proměé, které působí a (y) Častý ešvar aflákat co ejvíce vysvětlujících proměých do modelu Řiďte se logikou, teorií, to co už ěkdo (kvalití) vymyslel Zahrutí více proměých má své plus i míus (vyechaá proměá, Omitted variable )

E ȁ y x = β 0 + β 1. x E(ε) = 0 E ȁ ε x = 0 mzda = β 0 + β 1. vzdláí + ε E ȁ mzda vzděláí = β 0 + β 1. vzděláí Vliv x i a vývoj středí hodoty y i měří změu středí hodoty y - tedy E v závislosti a jedotkovém zvýšeí x ȁ y x Myšleka v průměru E ȁ schoposti vzděláí = 0 y E yȁx = β 0 + β 1. x Populačí distribučí fukce Nepozorovatelá Zatím žádý předpoklad o kokrétím rozděleí áhodé složky 5 10 30 x

Odhad získáme jako výsledek ějaké fukce (estimator) - OLS Odhad je výstup z estimátoru b 0,,k Výběrový soubor prožeeme ějakou fukcí (estimator) získáme odhad (bodový, itervalový) Výška studetů VŠE Estimátor തX = 1 X i Odhademe populačí průměr výšky dospělých lidí Var(X) = 1 1 X i തX 2 Odhademe populačí rozptyl výšky dospělých lidí b = X X 1 X y Odhademe populačí parametry vlivu β populačí proces

y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + ε y 1 = β 0 + β 1 x 11 + β 2 x 12 + + β k x 1k + ε 1 y 2 = β 0 + β 1 x 21 + β 2 x 22 + + β k x 2k + ε 2 Data pro korétí subjekt jedotlivec, firma atd. y 1 y 2 y = 1 1 1. β 0 + x 11 x 21 x 1 β 1 + x 12 x 22 x 2 β 2 + + x 1k x 2k x k β k + ε 1 ε 2 ε y 1 y 2 y = 1 x 11 x 12 x 1k 1 x 21 x 22 x 2k 1 x 1 x 2. x k β 0 β 1 β 2 β k + ε 1 ε 2 ε 3 ε PRF: y = Xβ + ε

y = b 0 + b 1 x 1 + b 2 x 2 + + b k x k + e y 1 y 2 y = 1 x 11 x 12 x 1k 1 x 21 x 22 x 2k 1 x 1 x 2. x k b 0 b 1 b 2 b k + e 1 e 2 e SRF: y = Xb + e

εε = ε 1 ε 2. ε 1 ε 2 ε 3 = ε 3 ε 1 ε 1 ε 1 ε 2 ε 1 ε 3 ε 2 ε 1 ε 2 ε 2 ε 2 ε 3 ε 3 ε 1 ε 3 ε 2 ε 3 ε 3 = σ 2 0 0 0 σ 2 0 = σ 2 0 0 σ 2 1 0 0 0 1 0 0 0 1 = σ 2 I kovariačí matice Σ Co jsou prvky mimo diagoálu? Cov x, y = x E x. (y E(y)) ε~(0, σ 2 I) E ε = 0 Cov ε 2, ε 1 = ε 2 E(ε 2 ). (ε 1 E(ε 1 )) Cov ε 2, ε 1 = ε 2. ε 1 = 0 Var ε = σ 2 I Var ε = E ε 2 = σ 2 I ε 1 ε 1 ε 1 ε 2 ε 1 ε 3 ε 2 ε 1 ε 2 ε 2 ε 2 ε 3 = ε 3 ε 1 ε 3 ε 2 ε 3 ε 3 Var(ε 1 ) Cov(ε 1, ε 2 ) Cov(ε 1, ε 3 ) Cov(ε 2, ε 1 ) Var(ε 2 ) Cov(ε 2, ε 3 ) Cov(ε 3, ε 1 ) Cov(ε 3, ε 2 ) Var(ε 3 )

Maticově e e = mi b y Xb. (y Xb) e e = mi(y b X ). (y Xb) b mi e 2 i = y i y 2 mi y i b 0 b 1. x i1 + b 2. x i2 2 mi(y y y Xb b X y + b X Xb) b y Xb = y Xb = b X y traspoovaý skalár je skalár mi(y y 2b X y + b X Xb) b b = 2X y + 2X Xb = 0 2X y + 2X Xb = 0 X y = X Xb b = X X 1 X y Ax = A AB = B A x x x A = A x x Ax = A + A x A ei symetricka matice x Ax = 2Ax A je symetricka matice x x x A Ax = 2A Ax

b = X X 1 X y b = X X 1 X (Xβ + ϵ) b = X X 1 X Xβ + X X 1 X ϵ b = β + X X 1 X ϵ

b = X X 1 X y Pozorováí wage educ exper 1 20 4 10 2 15 6 1 3 35 10 5 4 18 5 4 X y 1 1 1 1 4 6 10 5 10 1 5 4 X X 1 4 10 1 1 1 6 10 5 1 5 4 = 4 25 20 25 177 116 20 116 142 1 1 1 1 4 6 10 5 10 1 5 4 X y 20 15 35 18 = 88 610 462 X X 1 3,6932 0,3890 0,2024 0,3890 0,0531 0,0114 0,2024 0,0114 0,0262 X y 88 610 462 = b 5,7925 3,4383 1,2606 wage = 5,7925 + 3,4383. educ + 1,2606exper

X = 1 1 1 x 1 z 1 x 2 z 2 x 3 z 3 X = 1 1 1 x 1 x 2 x 3 z 1 z 2 z 3 b = X X 1 X y y = y 1 y 2 y 3 b = b 0 b 1 b 2 1 x i z i X X = 1 1 1 x 1 x 2 x 3 z 1 z 2 z 3 1 1 1 x 1 z 1 x 2 z 2 x 3 z 3 = x i x i 2 x i z i z i z i x i z i 2 y i X y = 1 1 1 x 11 x 21 x 31 x 12 x 22 x 32. y 1 y 2 y 3 = x i y i z i y i

y = β 0 + β 1 x + β 2 z + ε b = X X 1 X y b 0 b 1 b 2 = 1 x i x i 2 x i z i x i z i 1 y i x i y i Pro ás důležité, že apř. odhad b 1 představující dopad změy x a y je spoje i s daty z!!! z i z i x i z i 2 z i y i Podroběji v části A Partiallig Out Iterpretatio Frische.. 1 y i + x i x i y i + z i z i y i b 0 b 1 b 2 = x i z i 2 y i + x i x i y i + x i z i 1 2 y i + z i x i x i y i + z i z i y i z i y i PRODUKT Z INVERZNÍ MATICE

Nafitovaé hodoty OLS a residua y = β 0 + β 1. x 1 + β 2. x 2 + ε Residua jsou pozorovatelá Náhodé chyby e!!! Residua jsou odhadem áhodých chyb Residua ejsou to samé jako áhodé chyby e i = y i y i y = b 0 + b 1. x 1 + b 2. x 2 y = b 0 + b 1. x 1 + b 2. x 2 + e V residuálí aalýze budeme zkoumat vlastosti residuí Chceme, aby měla určité vlastosti proč? Gauss-Markovy předpoklady Využíváme testy pro hodoceí modelu založea a vlastostech residuí OLS je pouze jeda z metod odhadu Jié metody jié afitovaé hodoty-jié hodoty residuí Průměr ebo suma? Pro OLS platí: výběrový průměr residuí = 0 E e = 0 a tak തy = y - víme z odvozeí OLS výběrová kovariace mezi X a e = 0 E X, e = 0 Výběrová kovariace y a e = 0 E y, e = 0 തy = b 0 + b 1. x 1 + b 2. x 2 + + b x തy, x 1, x 2,, x vždy leží a OLS regresí "přímce"

Když uděláme odhad parametrů pomocí OLS Lze rozdělit apozorovaé hodoty y i a dvě části Vyrovaé hodoty a rezidua y i = y i + e i y i = b 0 + b 1 x i SST = y i തy 2 SSE = y i തy 2 SSR = Total sum of squares Explaied sum of squares Residual sum of squares SST = SSE + SSR e 2 y y 5 e 5 čím více jsou fialové a červeé čtverce podobé tím lépe y 5 തy x

čím více jsou fialové a červeé čtverce podobé tím lépe Jak OLS regresí přímka afituje data Neí to tak jasé, ale jsou to čtverce y y 5 y y 5 e 5 e 5 y 5 y 5 തy തy x x

Užitečé mít hodotu, jedo číslo, které shre jak regrese pomocí OLS fituje hodoty Vytvořeí SRF zároveň získáme jedotlivá rezidua Čím větší bude hodota reziduí tím méě bude SRF fitovat aměřé hodoty y i SST = SSE + SSR /SST Jak hodotit kvalitu OLS metody SST = y i തy 2 SSE = y i തy 2 SSR = e i 2 R 2 = 1 = SSE SST + SSR SST SSE SST = R2 = 1 SSR SST vysvětleý rozptyl (díky x) celkový rozptyl (y) Část(zlomek, proceto ) Rozptylu v (y), který se podařil vysvětlit působeím (x) (100. R2) v % Koeficiet determiace R 2 =< 0,1 > R 2 = 1 perfektí proložeí SSE = SST, tedy SSR = 0 R 2 = 0 Vyjadřuje stupeň vysvětleí celkové změy závislé edogeí proměé y regresí při působeí všech ezávislých exogeích proměých x zahrutých v regresím modelu Využití pro ověřeí shody odhadutého modelu s apozorovaými daty

R 2 = vysvětleý rozptyl (díky x) celkový rozptyl (y) R 2 =< 0,1 > Problémem je, že R 2 ikdy eklese přidáím další proměé Buď se ezměí, spíše vzroste R 2 eí dobrý způsob pro porováí modelů s rozdílým možství vysvětlujícíh proměých (X)

Problém hodoceí modelu s růzým počtem vysvětlujících proměých (X) vyřešíme pomocí Korigovaého (upraveého, adjusted) koeficietu determiace Zároveň vhodé pro použití modelů pro rozdílá možství pozorováí () Pealizuje rostoucí (k) adjr 2, ഥR 2 R 2 = 1 SSR SST തR 2 = 1 Var(e) Var(y) = 1 1 k 1 (1 R2 ) 1 "trestá" další k k 1 തR 2 = 1 SSR k 1 SST 1 = 1 1 k 1 (1 R2 ) Nezkresleý výběrový rozptyl!!! y = β 0 + β 1. x 1 + β 2. x 2 + ε vs. l(y) = β 0 + β 1. x 1 + β 2. x 2 + ε Pozor a k v ěkteré literatuře v sobě obsahuje itercept!!! Pozor തR 2 elze použít pro rozdílé fukčí tvary závisle proměé

y തy x