FJFJ Cvičení 1. Lukáš Frýd

Podobné dokumenty
Matematické modelování Náhled do ekonometrie. Lukáš Frýd

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Ing. Michael Rost, Ph.D.

Testy. Pavel Provinský. 19. listopadu 2013

Testování statistických hypotéz

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

Stručný úvod do testování statistických hypotéz

Testy statistických hypotéz

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Normální (Gaussovo) rozdělení

PRAVDĚPODOBNOST A STATISTIKA

4EK211 Základy ekonometrie

ADDS cviceni. Pavlina Kuranova

STATISTICKÉ HYPOTÉZY

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

Testování statistických hypotéz

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

5 Parametrické testy hypotéz

Testování hypotéz. 4. přednáška

Testování statistických hypotéz

Cvičení ze statistiky - 9. Filip Děchtěrenko

Normální (Gaussovo) rozdělení

(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination.

Cvičení ze statistiky - 8. Filip Děchtěrenko

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Testování hypotéz Biolog Statistik: Matematik: Informatik:

4EK211 Základy ekonometrie

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

= = 2368

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

12. cvičení z PST. 20. prosince 2017

Příklady na testy hypotéz o parametrech normálního rozdělení

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

TECHNICKÁ UNIVERZITA V LIBERCI

4ST201 STATISTIKA CVIČENÍ Č. 7

4EK211 Základy ekonometrie

Ranní úvahy o statistice

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

Regresní analýza 1. Regresní analýza

Technická univerzita v Liberci

You created this PDF from an application that is not licensed to print to novapdf printer (

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Aproximace binomického rozdělení normálním

4EK211 Základy ekonometrie

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Opakování. Neparametrické testy. Pořadí. Jednovýběrový Wilcoxonův test. t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality

5EN306 Aplikované kvantitativní metody I

Přepoklady KLM a Gauss Markov teorém. Blue odhad - GM. KLM Klasický lineární model. 1) Lineární v parametrech. 2) E ε = 0

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty

Jednofaktorová analýza rozptylu

Vymezení důležitých pojmů. nulová hypotéza, alternativní hypotéza testování hypotézy hladina významnosti (alfa) chyba I. druhu, chyba II.

4EK211 Základy ekonometrie

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)

Charakteristika datového souboru

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

Náhodné veličiny, náhodné chyby

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Návrh a vyhodnocení experimentu

Pravděpodobnost a aplikovaná statistika

4EK211 Základy ekonometrie

Regresní a korelační analýza

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Design Experimentu a Statistika - AGA46E

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

STATISTICA Téma 7. Testy na základě více než 2 výběrů

AKM CVIČENÍ. Opakování maticové algebry. Mějme matice A, B regulární, potom : ( AB) = B A

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

TECHNICKÁ UNIVERZITA V LIBERCI. Statistický rozbor dat z dotazníkového šetření

Tomáš Karel LS 2012/2013

Opakování: Nominální proměnná více hodnotová odpověď.

STATISTICKÉ TESTY VÝZNAMNOSTI

Jednostranné intervaly spolehlivosti

PRAVDĚPODOBNOST A STATISTIKA

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

Transkript:

FJFJ Cvičení 1 Lukáš Frýd

WAGE1.RAW https://sites.google.com/site/ekonometrievse/4ek214/tyden-03 DATA log wage = β 0 + β 1 educ + β 2 exper + β 3 tenure + ε Jak vypadá výběrová regresní funkce? Interpretace H 0 : β 2 = 0 Který zápis je dobře? H 0 : b 2 = 0 t = b j β j sd(b j ) ~t n k 1 H 1 : β 2 > 0 Jak vypadá testová statistika? Umět vypočítat z výstupu! Proč je důležitý rozptyl b? Co je P-value? Var b j = σ 2 x j ഥx j 2 (1 Rj 2 ) Var b = σ 2 X X 1

Populace výběrový vzorek Na základě výběrového vzorku budeme dělat závěry ohledně celé populace Testujeme populační parametry Výběrové nám pouze dávají nástroj

α 5% předpoklad testovací kritérium má normální rozdělení Kritický obor Zamítáme H0 5/2=2,5% Obor přijetí Nezamítáme H0 (1 - a) P ȁ zamítnu H0 platí H0 a/2 Kritický obor Zamítáme H0 5/2=2,5% -1,96 0 1,96 Obor přijetí Nezamítáme H0 (1 - a) Kritický obor Zamítáme H0 a 5% 0 c P ȁ zamítnu H0 platí H0 a

HPRICE2 For a sample of 506 communities in the Boston area, we estimate a model relating median housing price ( price) in the community to various community characteristics: - nox is the amount of nitrogen oxide in the air, in parts per million - dist is a weighted distance of the community from five employment centers, in miles - rooms is the average number of rooms in houses in the community - stratio is the average student-teacher ratio of schools in the community. log price = β 0 + β 1 log nox + β 2 log dist + β 3 rooms + β 4 stratop + ε Které parametry jsou signifikantní a na jaké hladině významnosti? Interpretace odhadů. t = b j β j sd(b j ) ~t n k 1 H 0 : β 1 = 1 H 1 : β 1 1 Přijmeme nulovou hypotézu? Nikdy neříkáme, že přijmeme H0. Pouze, že se nedalo prokázat, že by β 1 byla různá od -1. Každý si spočte na papír a nakreslí studentovo rozdělení.

BWGHT bwght = β 0 + β 1 cigs + β 2 parity + β 3 faminc + β 4 motheduc + β 5 fatheduc + ε - bwght birth weight, in pounds. - cigs average number of cigarettes the mother smoked per day during pregnancy. - parity the birth order of this child. - faminc annual family income. - motheduc years of schooling for the mother. - fatheduc years of schooling for the father. Má vzdělání vliv na váhu? Jsou proměnné motheeduc a fatheduc SDRUŽENĚ signifikantní? Vyřadili jsme 2 proměnné q=2 Z 6 proměnných k=6 + konstanta Potřebujeme kvůli stupňům volnosti H 0 : β 4 = 0, β 5 = 0 H 1 : neplati H 0 Restrikce Omezený vs. Neomezený model bwght = β 0 + β 1 cigs + β 2 parity + β 3 faminc + ε bwght = β 0 + β 1 cigs + β 2 parity + β 3 faminc + β 4 motheduc + β 5 fatheduc + ε

Základní myšlenka F-testu budeme porovnávat e 2 = SSR pro jednotlivé modely omezený vs. neomezený Jsou rozdíly statisticky významné? n n n Testovací kritérium: SST = y i തy 2 SSE = y i തy 2 SSR = i=1 i=1 i=1 e 2 F = SSR O SSR NE q SSR NE n k 1 ~F[q, n k 1] q množství restrikcí, kdy q = df O df NE Hodnota F-testu je vždy pozitivní Měříme, zda-li nárůst SSR v důsledku restrikcí zhoršení nafitování Je významný Při platnosti H0 má F-rozdělení s (q, n k 1) stupni volnosti f(f) Zamítneme H0 naa hladině významnosti pokud F > c Obor přijetí Nezamítáme H0 (1 - a) 0 c a Kritický obor Zamítáme H0 F

bwght = β 0 + β 1 cigs + β 2 parity + β 3 faminc + ε bwght = β 0 + β 1 cigs + β 2 parity + β 3 faminc + β 4 motheduc + β 5 fatheduc + ε Alternativní zápis F = SSR O SSR NE q SSR NE n k 1 ~F[q, n k 1] F = R 2 NE R 2 O q 2 1 R NE n k 1 ~F[q, n k 1] Musíme mít stejný počet pozorování

Odhadneme omezený a neomezený model Z každého modelu získáme residua y = b 0 + b 1 x 1 + b 5 x 5 + e RE y = b 0 + b 1 x 1 + b 2 x 2 + b 3 x 3 + b 4 x 4 + b 5 x 5 + e UN Pokud nezamítneme restrikci (H0) residua z obou modelů budou velmi podobná e UN ~e RE Naopak pokud zamítneme H0 residua budou značně odlišná

Celková významnost modelu Kromě různých kombinací restrikcí Využijeme F-test pro celkové zhodnocení všech parametrů modelu výstup z SW y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + ε y = β 0 + ε H0: β 1 = β 2 = = β k = 0 H1: neplatí H0 alespoň jedna β i 0, kdy i = 1,, k F = R 2 NE R 2 O q 2 1 R NE n k 1 F = R 2 k 1 R 2 ~F[q, n k 1] n k 1 R O 2 = 0 pouze úrovnová konstanta

HPRICE1, Now, suppose we would like to test whether the assessed housing price is a rational valuation. If this is the case, then a 1% change in assess should be associated with a 1% change in price; that is, β 1 = 1. In addition, lotsize, sqrft, and bdrms should not help to explain. log(price), once the assessed value has been controlled for. log price = β 0 + β 1 log assess + β 2 log lotsize + β 3 log sqrft + β 4 bdrms + ε Price cena domu Assess hodnota domu Lotsize-velikost v lot Sqrft velikost ve square footage Bdrms- počet ložnic H0: β 1 = 1, β 2 = 0, β 3 = 0, β 4 = 0 H1: neplatí H0

log price = β 0 + β 1 log assess + β 2 log lotsize + β 3 log sqrft + β 4 bdrms + ε y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4 + ε Úprava na omezený model y = β 0 + x 1 + ε y x 1 = β 0 + ε H0: β 1 = 1, β 2 = 0, β 3 = 0, β 4 = 0 Počet restrikcí? F = SSR O SSR NE q SSR NE n k 1 ~F[q, n k 1] Můžeme použít?! R 2 F = k 1 R 2 ~F[q, n k 1] n k 1

Model Závislá proměnná Nezávislá proměnná Interpretace β 1 level-level y x y = β 1. x level-log y log(x) y = β 1 100 %. x log-level log(y) x % y = 100β 1. x log-log log(y) log(x) % y = β 1. % x

Vyhodnocení modelů pomocí R2 salary = β 0 + β 1. year + β 2. gamesyr + β 3 bavg + u R2 = 0,3445 log salary = β 0 + β 1. year + β 2. gamesyr + β 3 bavg + u Rozdílné závislé proměnné!!! Který model je lepší? R2 = 0,2445 rdintens = β 0 + β 1. log(sales) + u rdintens R&D rdintens = β 0 + β 1. sales + β 2. sales 2 + u Nespoléhat tolik na R2

Mocninný y = β 0 + β 1. x 1 + β 2. x 1 2 + ε Například produkční funkce Výnosy z variabilního vstupu Q L

y = β 0 + β 1. x 1 + β 2. x 1 2 + ε Jaká je interpretace parametrů? y x = β 1 + 2β 2 x wage = β 0 + β 1. exper + β 2. exper 2 + ε wage exper = β 1 + 2β 2 exper

wage = β 0 + β 1. exper + β 2. exper 2 + u wage = 3,73 + 0,298. exper 0,0061. exper 2 O kolik vzroste mzda pro 0 1 roku? O kolik vzroste mzda pro 10 11 let? O kolik vzroste mzda pro 10 12 let? wage = 0,298 2.0,0061. exper. exper wage = 0,298 2.0,0061. (10). 2

wage = 3,73 + 0,298. exper 0,0061. exper 2 wage Interpretace? 24,4 exper