Matematické modelování Náhled do ekonometrie. Lukáš Frýd

Podobné dokumenty
Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

AVDAT Klasický lineární model, metoda nejmenších

Bodové a intervalové odhady parametrů v regresním modelu

Lekce 1 úvod do ekonometrie

PRAVDĚPODOBNOST A STATISTIKA

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

5EN306 Aplikované kvantitativní metody I

FJFJ Cvičení 1. Lukáš Frýd

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie

Tomáš Karel LS 2012/2013

Přepoklady KLM a Gauss Markov teorém. Blue odhad - GM. KLM Klasický lineární model. 1) Lineární v parametrech. 2) E ε = 0

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

12. cvičení z PST. 20. prosince 2017

Regresní a korelační analýza

PRAVDĚPODOBNOST A STATISTIKA

Statistika (KMI/PSTAT)

Regresní a korelační analýza

18AEK Aplikovaná ekonometrie a teorie časových řad. Řešení domácích úkolů č. 1 a 2 příklad 1

Regresní a korelační analýza

LINEÁRNÍ REGRESE. Lineární regresní model

Regresní analýza 1. Regresní analýza

Regresní a korelační analýza

4EK211 Základy ekonometrie

5EN306 Aplikované kvantitativní metody I

4EK211 Základy ekonometrie

13.1. Úvod Cílem regresní analýzy je popsat závislost hodnot znaku Y na hodnotách

Odhad parametrů N(µ, σ 2 )

4EK211 Základy ekonometrie

Korelační a regresní analýza

4EK211 Základy ekonometrie

STATISTICKÉ ZJIŠŤOVÁNÍ

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Odhady Parametrů Lineární Regrese

Přednáška 4. Lukáš Frýd

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení

4EK211 Základy ekonometrie

Regrese. 28. listopadu Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly:

7. Analýza rozptylu.

AVDAT Nelineární regresní model

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

Regresní a korelační analýza

= = 2368

Inovace bakalářského studijního oboru Aplikovaná chemie

PRAVDĚPODOBNOST A STATISTIKA

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

Neparametrické metody

Odhad parametrů N(µ, σ 2 )

4EK211 Základy ekonometrie

15. T e s t o v á n í h y p o t é z

PRAVDĚPODOBNOST A STATISTIKA

Intervalová data a výpočet některých statistik

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

AKM CVIČENÍ. Opakování maticové algebry. Mějme matice A, B regulární, potom : ( AB) = B A

Tomáš Karel LS 2012/2013

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

LINEÁRNÍ MODELY. Zdeňka Veselá

odpovídá jedna a jen jedna hodnota jiných

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Regresní analýza. Eva Jarošová

Základy ekonometrie. XI. Vektorové autoregresní modely. Základy ekonometrie (ZAEK) XI. VAR modely Podzim / 28

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Ilustrační příklad odhadu LRM v SW Gretl

PRAVDĚPODOBNOST A STATISTIKA

6. Lineární regresní modely

Téma 9: Vícenásobná regrese

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Bodové a intervalové odhady parametrů v regresním modelu

You created this PDF from an application that is not licensed to print to novapdf printer (

Technická univerzita v Liberci

Základní statistické modely Statistické vyhodnocování exp. dat M. Čada ~ cada

Cvičení ze statistiky - 8. Filip Děchtěrenko

Charakteristika datového souboru

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

STATISTICKÉ HYPOTÉZY

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

Neparametrické testy

4EK211 Základy ekonometrie

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

STATISTICKÉ ODHADY Odhady populačních charakteristik

Testování předpokladů pro metodu chain-ladder. Seminář z aktuárských věd Petra Španihelová

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Testy. Pavel Provinský. 19. listopadu 2013

5EN306 Aplikované kvantitativní metody I

INDUKTIVNÍ STATISTIKA

Testování hypotéz. 4. přednáška

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Transkript:

Matematické modelování Náhled do ekonometrie Lukáš Frýd

Výnos akcie vs. Výnos celého trhu - CAPM model r it = r ft + β 1. (r mt r ft ) r it r ft = α 0 + β 1. (r mt r ft ) + ε it Ekonomický (finanční model) Ekonometrický model r i,t výnos akcie i v čase t α 0 výnosová míra, která není určena tržním výnosem β 1 citlivost výnosu akcie na výnos tržního indexu r mt výnos tržního indexu m v čase t ε it -mimo jiné ostatní proměnné ovlivňující výnos akcie α > 0 výnos investice je vyšší, než odměna za předpokládané riziko α < 0 výnos investice je nižší, než odměna za předpokládané riziko α = 0 výnos investice je adekvátní odměna za předpokládané riziko Pokud je investiční instrument správně oceněn, alfa je nula Hypotéza - je signifikantní alfa?

Předpokládejme, že známe data generující proces: r IBM,t r 10YBondt = 0. 03 + 0. 94 r SPt r 10YBondt + ε IBMt Vidíme 1 realizaci Kdybychom mohli vracet minulost b 1

Základní soubor (populace) vs. Výběr (sample) wage = β 0 + β 1 educ + ε wage = 150.23 + 61.5educ + ε Výběrový soubor Nemůžeme zkoumat každého jedince v populaci Nákladné Často nemožné provedeme výběr, se kterým pak pracujeme Kdybychom mohli opakovat výběr Odhad vztahu z výběrového souboru wage = 146.95 + 60.216educ + e 0,0359educ 0,0279educ Proč? Odhad je náhodná veličina má své rozdělení!!! b 1

r IBM,t r 10YBondt = α + β r SPt r 10YBondt + ε IBMt

Závislá a nezávislá proměnná 1) y = β 0 + β 1. x + ε Zajímá nás jak se mění y se změnou x Na y kromě x působí další proměnné - ε Jinak by body byly na přímce Skutečný nepozorovaný vztah y = β 1 x y/ x = β 1 y y = b 0 + b 1 x Δ y/ x = b 1 "y = β 0 + β 1. x" y = β 1 β 0 x = 1 β 1 sklon β 0 úrovňová konstanta x

Hledání konkrétního tvaru regresní funkce Musíme najít vhodnou přímku, která nejlépe proloží napozorovaná data Nebo-li odhadnout β 0,1, tedy určit b 0,1 Každou empirickou hodnotu y i nahradíme určitou vyrovnanou hodnotou y i Která bude ležet na zvolené empirické (výběrové) regresní přímce y i = β 0 + β 1. x i + ε i y i = b 0 + b 1. x i y Problém je, že takových přímek může existovat nekonečně mnoho Musíme najít kritérium nejlépe vystihne daný vztah y 5 y 6 y y 5 y 1 y 2 y 3 y 3 y 4 y 4 = y 4 y 5 y 6 y 1 y 3 y 4 y 6 y 7 y 1 y 2 x y 2 x

Metoda nejmenších čtverců (MNČ,OLS) Jedna z metod jak odhadnout parametry β 0 a β 1 y = β 0 + β 1 x + ε y = b 0 + b 1 x y = b 0 + b 1 x + e Problém je, že takových přímek může existovat nekonečně mnoho Musíme najít kritérium nejlépe vystihne daný vztah y y 5 y 3 y 4 y 7 y 1 y 6 y 2 x

Součet čtverců odchylek empirických hodnot y i od hodnot nafitovaných byl minimální Metoda nejmenších čtverců (MNČ, OLS) y = β 0 + β 1 x + ε y = b 0 + b 1 x + e y i = b 0 + b 1. x i n n e 2 i = (y i y i ) 2 min y n n y 7 e 2 i = (y i b 0 b 1 x 1 ) 2 min y 5 y 6 y 3 y 4 y 5 y 6 y 7 y 1 y 4 = y 4 y 2 y 3 y 1 y 2 x

Přímková regrese y = β 0 + β 1. x + ε y = b 0 + b 1. x n n e 2 i = (y i y i ) 2 min Q min hledáme extrém minimum Tedy takové b 0,1, které budou minimalizovat funkci Q b 0 je odhad β 0 b 1 je odhad β 1 n Q = (y i b 0 b 1. x i ) 2 n Q = 2 b 0 y i b 0 b 1. x i. 1 = 0 n Q = 2 b 1 y i b 0 b 1. x i. x i = 0

Regresní koeficient (výběrový regresní koeficient) Směrnice (sklon) regresní přímky Znaménko kovariance udává znaménko odhadu parametru!! Proč? y i = b 0 + b 1. x i b xy = s xy s x 2 PŘÍMKOVÁ REGRESE!!! JEDNODUCHÝ RM!!! b 1 = σ n σn x i x ҧ. (y i തy) x i xҧ 2 b 1 = Cov(x, y) var(x) y y = b 0 + b 1 x y = β 0 + β 1. x b 0 = തy b 1 xҧ y = β 1 β 0 x = 1 β 1 sklon β 0 úrovňová konstanta x

Co je to estimator Odhad získáme jako výsledek nějaké funkce (estimator) - OLS Odhad je výstup z estimátoru b 0,,k Výběrový soubor proženeme nějakou funkcí (estimator) získáme odhad (bodový, intervalový) Výška studentů VŠE Estimátor Odhadneme populační průměr výšky dospělých lidí തX = 1 n σx i b 1 = Cov(x, y) var(x) b 0 = തy b 1 xҧ

Více o OLS a podmínkách Víme: Odhad je náhodná veličiny Jako taková má své charakteristiky b~iid(μ, σ 2 I) Rozdělení (y, b 0,1 ) je určeno předpokládaným rozdělením náhodné složky ε Proto nás zajímá, jak se chová střední hodnota a rozptyl odhadu Požadavky na odhad Nezkreslený (nestranný, nevychýlený) Konzistentní Vydatný Pokud budou splněny určité předpoklady Metoda nejmenších čtverců nám poskytne požadované vlastnosti odhadu Pokud budou splněny dané předpoklady Daná metoda vede k nezkreslenému, konzistentnímu případně i vydatnému odhadu

Střední hodnota E b 0 = β 0 E b 1 = β 1 b~rozdel(μ, σ 2 ) Chceme aby střední hodnota odhadu byla rovna skutečné hodnotě parametru Nebo-li, aby byl odhad NEZKRESLENÝ Zda-li bude odhad nezkreslený, bude záviset na splnění předpokladů pro metodu OLS Pokud budou splněny dané předpoklady víme, že metoda OLS vede k nezkreslenému odhadu neznámých parametrů β b 1 = σ n σn x i x ҧ. (y i തy) x i xҧ 2 b 1 = β 1 + σ n σn x i x ҧ. ε x i xҧ 2 E(b 1 ) = β 1 + σ n σn x i xҧ x i xҧ 2 E(ε) β

Rozptyl b 1 ~rozdel(β 1, σ 2 ) Kromě toho, zda-li se náš odhad b 0,1 nezkreslený pohybuje se kolem skutečné hodnoty parametru β 0,1 a střední hodnota E(b 0,1 ) Nás zajímá, jak moc se pohybuje kolem skutečné hodnoty rozptyl Var(b 0,1 ) y = β 0 + β 1 x + ε y = b 0 + b 1 x + e y = b 0 + b 1 x + v Proč nás zajímá rozptyl? Menší rozptyl lepší odhad Vydatnější Využijeme při hypotézách a testování E b 1 shodné rozdílné Var(b 1 ) Var(b OLS ) Var(b NON OLS )

b 1 ~iid(β 1, σ 2 ) ε~iid(0, σ 2 I) Typ rozdělení b je určen typem rozdělení náhodné složky Zatím předpokládáme pouze iid. (identical, independent, distribution) Až dále si zavedeme silnější předpoklad, že náhodná složka se řídí normálním rozdělením

Gauss-Markov předpoklady 1) Linearita v parametrech (koeficientech) 2) Náhodná chyba má střední hodnotu rovnou nule není restriktivní pokud zahrneme úrovňovou konstantu 3) Všechny vysvětlující proměnné (x) jsou nekorelované s náhodnou chybou 4) Žádná vysvětlující proměnná není lineární kombinací jiných VP 5) Náhodná chyba má konstantní rozptyl homoskedasticita 6) Náhodné chyby jsou nekorelovaná mezi sebou- není autokorelace Po splnění získáme pomocí metody OLS odhady s těmito vlastnostmi: Nezkreslené (nestranný, nevychýlený) Konzistentní Vydatné

Úvod do testování hypotéz Populace vs. Výběrový vzorek (sample) Na základě ekonomické (i jiné) teorie vybereme relevantní proměnné (data) y = Xβ + ε Populace výběrový vzorek Na základě výběrového vzorku budeme dělat závěry ohledně celé populace Testujeme populační parametry Výběrové nám pouze dávají nástroj

Termíny Statistika testovací kritérium Při testování používáme tzv. statistiky (vzorec) Tyto statistiky nabývají určitých rozdělení při platnosti H0 t = b j β j sd(b j ) ~t n k 1 Rozdělení rozdělujeme na 2 části: Obor přijetí Pokud vypočtená hodnota ze statistiky padne do oboru přijetí Nezamítáme nulovou hypotézu H0 Kritický obor Zamítáme H0 Obor přijetí Nezamítáme H0 Kritický obor (rejection region) Pokud vypočtená hodnota ze statistiky padne do kritického oboru Zamítáme nulovou hypotézu Kritický obor Zamítáme H0 0

Testuje se následující hypotéza H 0 : β = 0 H 1 : β 0 Testuje se zda-li má cenu do modelu zahrnout danou proměnnou Zda-li má signifikantní vliv na závislou proměnnou Zda-li je signifikantní Testovací statistika t = b j β j sd(b j ) ~t n k 1 t = b j sd(b j ) ~t n k 1 t-test t educ = 0,07486 0,006512 = 11,5 t 935 3 1 (0,975) = 1.962515 1.962515

Děkuji za pozornost