Lekce 1 úvod do ekonometrie
Některé věci se zde budou opakovat několikrát důležité pro rozležení v hlavě a jiný úhel pohledu Dokázat aplikovat ekonometrie nestačí se pouze naučit na zkoušku Základní kurz lineární algebra (matice) spíše v dodatcích Využití programu Gretl (zdarma) pro základy stačí Je dobré mít základy statistiky ekofun určitě ne flákač!! v apendixu, určité opáčko průběžně budu doplňovat Některé použitá data jsou z reálná, některá vymyšlená Použité modely jsou většinou pro didaktické účely a nemusí se zakládat na ekonomické (jiné) teorii Než se budete ptát, projděte si celou lekci Snažte se dát lekci na jeden zátah Stažení materiálů
Co si řekneme v této lekci Co je to ekonometrie a k čemu slouží Motivační příklady, zatím bez matematického aparátu Lehký, ale důležitý úvod
K čemu slouží ekonometrie Mikroekonomie Jak ovlivní změna ceny poptávku po... Jak ovlivní snížení daně z příjmu, množství nabízené práce Makroekonomie Jak ovlivní změna úrokové míry, HDP, množství úvěrů Dopad měnové, fiskální politiky na makroekonomické indikátory Finanční trhy Fundamentální analýza Predikce volatility aktiv Bankovnictví Podle kterých kritérií má banka pujčovat peníze Vývoj porfolia CP Marketing Které faktory ovlivňují poptávku po... Sociologie, medicína...
Typy ekonomických dat Průřezová data - Cross-section Data firem (poměrové ukazatele), lidí (mzda, tlak) za konkrétní časové období Vybíráme výběrový soubor z určité populace co ovlivňuje mzdu v ČR, jaké faktory ovlivňují krevní tlak Prostorový charakter Pooled (repeated) cross-section Data firem (poměrové ukazatele), lidí (mzda, tlak) za rozdílná časová období Vybereme data firem pro rok 2000 a 2014 a např. zjišťujeme zda došlo k nějaké změna (dopad změny v preferencích) Časové řady Danou proměnnou (é) sledujeme v různých časových intervalech Finanční časové řady, HDP, vývoj peněžní zásoby Panelová data Data mají jak průřezový, tak časový charakter Sledujeme konkrétní firmy (poměrové ukazatele) v čase Sledujeme konkrétní domácnosti v čase a zjišťujeme například nákupní chování
Motivační příklady Z mikroekonomie známe, že poptávka (Q) je např: Q = f(p, P S, Y) Q-poptávané množství (pivo) P cena komodity (pivo) P S - cena substitutu (víno) Y disponibilní důchod Z ekonomie Ceteris paribus POZOR POPTÁVKU PO STATKU NEODHADNEME JAKO REGRESI NAPŘ. 4 PROMĚNNÝCH PROBLÉM JE SLOŽITĚJŠÍ Mikroekonomická teorie nám dala námět čím je řízena poptávka po dané komoditě Ekonometrie nám pomůže aplikovat tento námět v praxi Ekonometrický model poptávky např: Q = β 0 + β 1 P + β 2 P s + β 3 Y + ε Využijeme ekonometrické nástroje a zjistíme, že: Q = 20 0,7P + 0,001P s + 0,25Y Interpretace: Mezi cenou piva a poptávaným množstvím existuje nepřímá úměra Pokles ceny vína způsobí substituci mezi pivem a vínem Citlivost poptávky po pivu na cenu vína je malá S růstem disponibilního důchodu, vzroste poptávka po pivu Přesnou interpretaci hodnot si vysvětlíme dále
wage = β 0 + β 1 educ + ε wage = 2,41 + 0,7607educ + e Zjistili jsme: Růst vzdělání (o 1 rok) Znamená růst mzdy o 0,7607
Postup při modelování ekonomických procesů 1) Sestavit ekonomický model 2) Sestavit ekonometrický model na základě ekonomického modelu 3) Získat data (pozor) 4) Odhadnout ekonometický model na datovém vzorku 5) Otestovat model a odhadnuté parametry možná chyba v bodě 1,2,3,4 6) Interpretovat výsledky
Základní soubor (populace) vs. Výběr (sample) log(wage) = β 0 + β 1 educ + ε Nemůžeme zkoumat každého jedince v populaci Nákladné Často nemožné log(wage) = 0,2535 + 0,0359educ + ε Výběrový soubor provedeme výběr, se kterým pak pracujeme Kdybychom mohli opakovat výběr Odhad vztahu z výběrového souboru log(wage) = 0,3491 + 0,0279educ + e 0,0359educ 0,0279educ Proč? Odhad je náhodná veličina má své rozdělení!!! β 1
Musíme rozlišovat log wage = β 0 + β. educ + ε Populační regresní funkce log wage = b 0 + b 1. educ + e výběrová regresní funkce (sample) b 0 je odhadem β 0 Naším úkolem v ekonometrii bude PRÁVĚ ODHADNOUT hodnoty parametrů b 1 je odhadem β 1 β 0, β 1 jsou parametry NEMĚNÍ SE b 0, b 1 jsou estimátory odhad náhodné veličiny mění se, se změnou výběrového souboru!!!
NEZNÁME Hodnoty populační regresní funkce Ani zda-li má skutečný vztah tvar: log(wage) = β 0 + β 1 educ + ε Proto je nutné nejprve vytvořit ekonomický model!!! Ekonomická teorie nám pomáhá k jeho vytvoření Velikost mzdy může záviset na: Vzdělání Délce praxe Dobu u nynějšího zaměstnavatele Pohlaví... log(wage) = 0,2535 + 0,0359educ + ε Výběrový soubor Odhad základního souboru log(wage) = 0,3491 + 0,0279educ + e
Ekonomický model Jak závisí velikost prodaného zboží na jednotkových nákladech? 1) Vytvoříme ekonomický model 2) Vytvoříme ekonometrický model podle ekonomického modelu 3) Získáme data 4) Vytvoříme odhad ekonometrického modelu 5) Testujeme model, vlastnosti odhadu 6) Interpretujeme výsledky π pivovar = Q P. P Q P. C π pivovar = P. Q C. Q = tržby náklady P-cena piva C průměrné náklady na jednotku výstupu Q(P) poptávka po pivu Q P = a b. P π pivovar = Q a Q b Q. C = Q. a Q C. b b P = a Q P b π pivovar Q = a 2. Q b. C = 0 Q = a 2 b 2. C Jen ukázka
Ekonometrický model Předpokládáme následující vztah: Nemusí být správný!!! Q = β 0 + β 1. C + ε Q = a 2 b 2. C 1) Vytvoříme ekonomický model 2) Vytvoříme ekonometrický model podle ekonomického modelu 3) Získáme data 4) Vytvoříme odhad ekonometrického modelu 5) Testujeme model, vlastnosti odhadu 6) Interpretujeme výsledky P = a Q P b β 0 =a/2 (úrovňová konstanta) β 1 =-b/2 (sklon) ε- další vlivy
Pro zjištění vztahu nejlepší získat data z celé ekonomiky (základní soubor) Nákladné, nereálné Pracujeme s výběrovým souborem 1) Vytvoříme ekonomický model 2) Vytvoříme ekonometrický model podle ekonomického modelu 3) Získáme data 4) Vytvoříme odhad ekonometrického modelu 5) Testujeme model, vlastnosti odhadu 6) Interpretujeme výsledky Firma 1 2 3 4 5 6 Q 15 31 52 14 37 27 C 290 246 152 320 170 220 Q = β 0 + β 1. C + ε Odhad populační regresní funkce Q = b 0 + b 1. C + e Q 60 50 Závislost výstupu na průměrných nákladech 40 30 20 10 0 0 50 100 150 200 250 300 350 C
Pracujeme s výběrovým souborem!!! Vytváříme odhad Q = β 0 + β 1. C + ε q = b 0 + b 1. C + e Skutečný vztah (neznáme) """""Q = 72 1,8. C + ε"""""" Reziduum Musíme odhadnout parametry (β) modelu metoda nejmenších čtverců maximum likelihood maximální věrohodnost GLZ GMM Q 60 Závislost výstupu na průměrných nákladech q = 71,74 1,77. C + e Všechny body neleží na přímce 50 40 30 20 10 0 0 50 100 150 200 250 300 350 C
Q = β 0 + β 1. C + ε q = 71,74 0,177. C + e q = b 0 + b 1. C + e Firma 1 2 3 4 5 6 Q 15 31 52 14 37 27 C 290 246 152 320 170 220 q 3 = 71,74 0,177.152 = 44,8 q 6 = 71,74 0,177.220 = 32 Existují další faktory, které ovlivňují velikost prodeje Značka, kvalita výrobku Q 60 50 Závislost výstupu na průměrných nákladech 40 30 20 10 0 0 50 100 150 200 250 300 350 C
Q = β 0 + β 1. C + ε q = b 0 + b 1. C + e q = 71,74 0,177. C Q = 72 0,18. C + ε Skutečný vztah Nepozorovatelný Odhadnutý vztah Naměřené hodnoty NELEŽÍ na teoretické (populační) regresní přímce Naměřené hodnoty NELEŽÍ ani na empirické (odhadnuté) regresní přímce Náhodná složka (chyba) 60 50 40 30 20 10 0 0 50 100 150 200 250 300 350
Náhodná složka ε Představuje další faktory, které kromě (x) ovlivňují (y) Chybová složka je NEPOZOROVATELNÁ y = β 0 + β 1. x 1 + ε Díky náhodné chybě neleží všechny hodnoty na přímce y 1) y je ovlivňováno x 2) y je ovlivňováno ε y = β 0 + β 1. x 1 Našim úkolem je zjistit parametry β 0,1 Udělat odhad těchto parametrů Sestrojit SRF sample regression function x
Na základě teorie sestavíme model (eko+ekonometrický) Udělali bychom průzkum (výběrový soubor) Odhadli parametry Q pivo = β 0. P rum + β 1 Y β 2 P pivo + ε Q pivo = 0,51P rum + 0,99Y 2,01P pivo + e y = 0,51x 1 + 0,99x 2 2,01x 3 + e e = y 0,51x 1 0,99x 2 + 2.01. x 3 Existují nějaké další vlivy které působí (počasí), měsíc (Prosinec) Zahrunuté v náhodné složce ε a tedy i v residuu e.
Q = β 0 + β 1. C + ε q = b 0 + b 1. C + e q = 71,74 0,177. C 60 Skutečný vztah Nepozorovatelný Odhadnutý vztah!!!náhodná chyba není to samé jako reziduum!!! Náhodná chyba nepozorovatelná neznáme totiž bety Reziduum pozorovatelné Reziduum je odhadem náhodné chyby 50 40 30 20 ε e e 10 ε 0 0 50 100 150 200 250 300 350
Vyrovnané hodnoty a rezidua Každé napozorované y i nahradíme (nafitujeme) vyrovnanou hodnotou y i Ideální by bylo kdyby y i = y i Všechny body by ležely na přímce deterministický model bohužel existují další proměnné (náhodné) Úkol Určit odhady parametrů b 0,1 tak, aby hodnota reziduí byla co nejmenší Rozlišovat!!! y = β 0 + β 1. x + ε y = b 0 + b 1. x + e y = b 0 + b 1. x y y 5 y = β 0 + β 1. x + ε y = b 0 + b 1. x y 2 y 5 y 2 x
y = β 0 + β 1. x + ε Skutečný vztah Provedeme náhodný výběr Vyrovnáme (nafitujeme) hodnoty Napozorované hodnoty nahradíme vyrovnanými hodnotami Otázkou je: podle jakého pravidla nahrazovat napozorované hodnoty jak zjistit, zda-li bylo nahrazení OK y = b 0 + b 1. x Vytvoříme odhad Skutečného vztahu y y 5 y = b 0 + b 1. x e 5 y 5 y i = y i + e i y 5 = y 5 + e 5 y 2 x 5 x
Existence náhodné chyby 1) Zahrnuje v sobě další minoritní vlivy praxe, schopnosti wage = β 0 + β 1 educ + ε 2) Chyba v měření, sběru dat 3) Možnost špatné specifikace modelu praxe, schopnosti 4) Stochastický (náhodný) charakter lidského chování (nepředvídatelný) C C = β 0 + β 1 Y + ε C = β 0 + β 1 Y Analýza residuí Y
Co bychom si měli z této lekce odnést Rozlišovat populaci a výběrový soubor Populační regresní funkce neznámá Cílem odhadnout její parametry Vycházíme z teorie ekonomického modelu nenaflákáme veškerá data, která nás napadnou