FJFJ Cvičení 1 Lukáš Frýd
WAGE1.RAW https://sites.google.com/site/ekonometrievse/4ek214/tyden-03 DATA log wage = β 0 + β 1 educ + β 2 exper + β 3 tenure + ε Jak vypadá výběrová regresní funkce? Interpretace H 0 : β 2 = 0 Který zápis je dobře? H 0 : b 2 = 0 t = b j β j sd(b j ) ~t n k 1 H 1 : β 2 > 0 Jak vypadá testová statistika? Umět vypočítat z výstupu! Proč je důležitý rozptyl b? Co je P-value? Var b j = σ 2 x j ഥx j 2 (1 Rj 2 ) Var b = σ 2 X X 1
Populace výběrový vzorek Na základě výběrového vzorku budeme dělat závěry ohledně celé populace Testujeme populační parametry Výběrové nám pouze dávají nástroj
α 5% předpoklad testovací kritérium má normální rozdělení Kritický obor Zamítáme H0 5/2=2,5% Obor přijetí Nezamítáme H0 (1 - a) P ȁ zamítnu H0 platí H0 a/2 Kritický obor Zamítáme H0 5/2=2,5% -1,96 0 1,96 Obor přijetí Nezamítáme H0 (1 - a) Kritický obor Zamítáme H0 a 5% 0 c P ȁ zamítnu H0 platí H0 a
HPRICE2 For a sample of 506 communities in the Boston area, we estimate a model relating median housing price ( price) in the community to various community characteristics: - nox is the amount of nitrogen oxide in the air, in parts per million - dist is a weighted distance of the community from five employment centers, in miles - rooms is the average number of rooms in houses in the community - stratio is the average student-teacher ratio of schools in the community. log price = β 0 + β 1 log nox + β 2 log dist + β 3 rooms + β 4 stratop + ε Které parametry jsou signifikantní a na jaké hladině významnosti? Interpretace odhadů. t = b j β j sd(b j ) ~t n k 1 H 0 : β 1 = 1 H 1 : β 1 1 Přijmeme nulovou hypotézu? Nikdy neříkáme, že přijmeme H0. Pouze, že se nedalo prokázat, že by β 1 byla různá od -1. Každý si spočte na papír a nakreslí studentovo rozdělení.
BWGHT bwght = β 0 + β 1 cigs + β 2 parity + β 3 faminc + β 4 motheduc + β 5 fatheduc + ε - bwght birth weight, in pounds. - cigs average number of cigarettes the mother smoked per day during pregnancy. - parity the birth order of this child. - faminc annual family income. - motheduc years of schooling for the mother. - fatheduc years of schooling for the father. Má vzdělání vliv na váhu? Jsou proměnné motheeduc a fatheduc SDRUŽENĚ signifikantní? Vyřadili jsme 2 proměnné q=2 Z 6 proměnných k=6 + konstanta Potřebujeme kvůli stupňům volnosti H 0 : β 4 = 0, β 5 = 0 H 1 : neplati H 0 Restrikce Omezený vs. Neomezený model bwght = β 0 + β 1 cigs + β 2 parity + β 3 faminc + ε bwght = β 0 + β 1 cigs + β 2 parity + β 3 faminc + β 4 motheduc + β 5 fatheduc + ε
Základní myšlenka F-testu budeme porovnávat e 2 = SSR pro jednotlivé modely omezený vs. neomezený Jsou rozdíly statisticky významné? n n n Testovací kritérium: SST = y i തy 2 SSE = y i തy 2 SSR = i=1 i=1 i=1 e 2 F = SSR O SSR NE q SSR NE n k 1 ~F[q, n k 1] q množství restrikcí, kdy q = df O df NE Hodnota F-testu je vždy pozitivní Měříme, zda-li nárůst SSR v důsledku restrikcí zhoršení nafitování Je významný Při platnosti H0 má F-rozdělení s (q, n k 1) stupni volnosti f(f) Zamítneme H0 naa hladině významnosti pokud F > c Obor přijetí Nezamítáme H0 (1 - a) 0 c a Kritický obor Zamítáme H0 F
bwght = β 0 + β 1 cigs + β 2 parity + β 3 faminc + ε bwght = β 0 + β 1 cigs + β 2 parity + β 3 faminc + β 4 motheduc + β 5 fatheduc + ε Alternativní zápis F = SSR O SSR NE q SSR NE n k 1 ~F[q, n k 1] F = R 2 NE R 2 O q 2 1 R NE n k 1 ~F[q, n k 1] Musíme mít stejný počet pozorování
Odhadneme omezený a neomezený model Z každého modelu získáme residua y = b 0 + b 1 x 1 + b 5 x 5 + e RE y = b 0 + b 1 x 1 + b 2 x 2 + b 3 x 3 + b 4 x 4 + b 5 x 5 + e UN Pokud nezamítneme restrikci (H0) residua z obou modelů budou velmi podobná e UN ~e RE Naopak pokud zamítneme H0 residua budou značně odlišná
Celková významnost modelu Kromě různých kombinací restrikcí Využijeme F-test pro celkové zhodnocení všech parametrů modelu výstup z SW y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + ε y = β 0 + ε H0: β 1 = β 2 = = β k = 0 H1: neplatí H0 alespoň jedna β i 0, kdy i = 1,, k F = R 2 NE R 2 O q 2 1 R NE n k 1 F = R 2 k 1 R 2 ~F[q, n k 1] n k 1 R O 2 = 0 pouze úrovnová konstanta
HPRICE1, Now, suppose we would like to test whether the assessed housing price is a rational valuation. If this is the case, then a 1% change in assess should be associated with a 1% change in price; that is, β 1 = 1. In addition, lotsize, sqrft, and bdrms should not help to explain. log(price), once the assessed value has been controlled for. log price = β 0 + β 1 log assess + β 2 log lotsize + β 3 log sqrft + β 4 bdrms + ε Price cena domu Assess hodnota domu Lotsize-velikost v lot Sqrft velikost ve square footage Bdrms- počet ložnic H0: β 1 = 1, β 2 = 0, β 3 = 0, β 4 = 0 H1: neplatí H0
log price = β 0 + β 1 log assess + β 2 log lotsize + β 3 log sqrft + β 4 bdrms + ε y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4 + ε Úprava na omezený model y = β 0 + x 1 + ε y x 1 = β 0 + ε H0: β 1 = 1, β 2 = 0, β 3 = 0, β 4 = 0 Počet restrikcí? F = SSR O SSR NE q SSR NE n k 1 ~F[q, n k 1] Můžeme použít?! R 2 F = k 1 R 2 ~F[q, n k 1] n k 1
Model Závislá proměnná Nezávislá proměnná Interpretace β 1 level-level y x y = β 1. x level-log y log(x) y = β 1 100 %. x log-level log(y) x % y = 100β 1. x log-log log(y) log(x) % y = β 1. % x
Vyhodnocení modelů pomocí R2 salary = β 0 + β 1. year + β 2. gamesyr + β 3 bavg + u R2 = 0,3445 log salary = β 0 + β 1. year + β 2. gamesyr + β 3 bavg + u Rozdílné závislé proměnné!!! Který model je lepší? R2 = 0,2445 rdintens = β 0 + β 1. log(sales) + u rdintens R&D rdintens = β 0 + β 1. sales + β 2. sales 2 + u Nespoléhat tolik na R2
Mocninný y = β 0 + β 1. x 1 + β 2. x 1 2 + ε Například produkční funkce Výnosy z variabilního vstupu Q L
y = β 0 + β 1. x 1 + β 2. x 1 2 + ε Jaká je interpretace parametrů? y x = β 1 + 2β 2 x wage = β 0 + β 1. exper + β 2. exper 2 + ε wage exper = β 1 + 2β 2 exper
wage = β 0 + β 1. exper + β 2. exper 2 + u wage = 3,73 + 0,298. exper 0,0061. exper 2 O kolik vzroste mzda pro 0 1 roku? O kolik vzroste mzda pro 10 11 let? O kolik vzroste mzda pro 10 12 let? wage = 0,298 2.0,0061. exper. exper wage = 0,298 2.0,0061. (10). 2
wage = 3,73 + 0,298. exper 0,0061. exper 2 wage Interpretace? 24,4 exper