EKONOMETRIE 8. přednáška Klasický lineární regresní model



Podobné dokumenty
EKONOMETRIE 9. přednáška Zobecněný lineární regresní model

17 t. Analytická geometrie přímky rovnice přímky, vzájemná poloha přímek, odchylka přímek, průsečík přímek, vzdálenost přímky od roviny

} kvantitativní znaky. korelace, regrese. Prof. RNDr. Jana Zvárov. Obecné principy

17. Statistické hypotézy parametrické testy

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Doba rozběhu asynchronního motoru.

PRAVDĚPODOBNOST A STATISTIKA

ij m, velikosti n je tvořen (n m) rozměr-ným polem dat x x x 22 x n1 ... x n2 7.1 Druhy korelačních koeficientů

1. Základy počtu pravděpodobnosti:

Regresní a korelační analýza

8. Analýza rozptylu.

Odhad parametru p binomického rozdělení a test hypotézy o tomto parametru. Test hypotézy o parametru p binomického rozdělení

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

z možností, jak tuto veličinu charakterizovat, je určit součet

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

Odhady parametrů 1. Odhady parametrů

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

Statistika. Statistické funkce v tabulkových kalkulátorech MSO Excel a OO.o Calc

Dynamická pevnost a životnost Statistika

Pravděpodobnost a aplikovaná statistika

Pravděpodobnostní model doby setrvání ministra školství ve funkci

Statistika je vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter.

MATEMATIKA PŘÍKLADY K PŘÍJÍMACÍM ZKOUŠKÁM BAKALÁŘSKÉ STUDIUM MGR. RADMILA STOKLASOVÁ, PH.D.

Pravděpodobnost a statistika - absolutní minumum

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

- metody, kterými lze z napozorovaných hodnot NV získat co nejlepší odhady neznámých parametrů jejího rozdělení.

12. N á h o d n ý v ý b ě r

Náhodný výběr 1. Náhodný výběr

Seznámíte se s pojmem Riemannova integrálu funkce jedné proměnné a geometrickým významem tohoto integrálu.

Intervalové odhady parametrů některých rozdělení.

V praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více

14. B o d o v é o d h a d y p a r a m e t r ů

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

Iterační metody řešení soustav lineárních rovnic

PRAVDĚPODOBNOST A STATISTIKA

Intervalové odhady parametrů

P2 Chyby a nejistoty měření

u, v, w nazýváme číslo u.( v w). Chyba! Chybné propojení.,

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

Směrnice 1/2011 Statistické vyhodnocování dat, verze 4 Verze 4 je shodná se Směrnicí 1/2011 verze 3, pouze byla rozšířena o robustní analýzu

Základní princip regulace U v ES si ukážeme na definici statických charakteristik zátěže

Regresní analýza. Statistika II. Jiří Neubauer. Katedra ekonometrie FEM UO Brno kancelář 69a, tel

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

Test hypotézy o parametru π alternativního rozdělení příklad

Mezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby.

Testujeme hypotézu: proti alternativě. Jednoduché třídění:

Test dobré shody se používá nejčastěji pro ověřování těchto hypotéz:

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

20. Eukleidovský prostor

6. T e s t o v á n í h y p o t é z

Lineární Regrese Hašovací Funkce

4EK211 Základy ekonometrie

VÍCEROZMĚRNÝ STATISTICKÝ SOUBOR

VYSOCE PŘESNÉ METODY OBRÁBĚNÍ

Budeme pokračovat v nahrazování funkce f(x) v okolí bodu a polynomy, tj. hledat vhodné konstanty c n tak, aby bylo pro malá x a. = f (a), f(x) f(a)

Matematika I. Název studijního programu. RNDr. Jaroslav Krieg České Budějovice

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

Deskriptivní statistika 1

4. B o d o v é o d h a d y p a r a m e t r ů

Úvod do zpracování měření

Periodicita v časové řadě, její popis a identifikace

0. 4b) 4) Je dán úhel Urči jeho základní velikost a převeď ji na radiány. 2b) Jasný Q Q ZK T D ZNÁMKA. 1. pololetí

Pravděpodobnost a aplikovaná statistika

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 2

3. Lineární diferenciální rovnice úvod do teorie

Základy statistiky. Zpracování pokusných dat Praktické příklady. Kristina Somerlíková

IV-1 Energie soustavy bodových nábojů... 2 IV-2 Energie elektrického pole pro náboj rozmístěný obecně na povrchu a uvnitř objemu tělesa...

Testy statistických hypotéz

2 EXPLORATORNÍ ANALÝZA

AVDAT Klasický lineární model, metoda nejmenších

Část III. Regresní a korelační analýza. Ing. Michal Dorda, Ph.D.

ODHADY PARAMETRŮ ZÁKLADNÍHO SOUBORU. 9. cvičení

STATISTIKA A PRAVD PODOBNOST - P EHLED VZORC A POZNATK. Doc. RNDr. Zden k Karpíšek, CSc. RNDr. Pavel Popela, Ph.D. Ing. Josef Bedná, Ph.D.

( + ) ( ) ( ) ( ) ( ) Derivace elementárních funkcí II. Předpoklady: Př. 1: Urči derivaci funkce y = x ; n N.

III. Mezinárodní konference STROJÍRENSKÁ TECHNOLOGIE PLZEŇ

Modelování ve výpočtových software

CHEMOMETRIKA a STATISTIKA. Prozatímní učební text (srpen 2012) Miloslav Suchánek

PRAVDĚPODOBNOST A STATISTIKA. Bodové a intervalové odhady

základním prvkem teorie křivek v počítačové grafice křivky polynomiální n

5.1. Posloupnosti. Posloupnost je funkce, jejímž definičním oborem je množina všech přirozených čísel.

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

Měřící technika - MT úvod

Matice. nazýváme m.n reálných čísel a. , sestavených do m řádků a n sloupců ve tvaru... a1

7. Odhady populačních průměrů a ostatních parametrů populace

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

20. Kontingenční tabulky

P2: Statistické zpracování dat

p 1 n zp p p ,5 z 2,5 1 x x 21 p p ,5 z 7,5 1 x x 24 Obecný vzorec pro výpočet kvantilů sudé n:

Katedra aplikované matematiky FEI VŠB Technická univerzita Ostrava

15 s. Analytická geometrie lineárních útvarů

Obsah. 1 Mocninné řady Definice a vlastnosti mocninných řad Rozvoj funkce do mocninné řady Aplikace mocninných řad...

n-rozměrné normální rozdělení pravděpodobnosti

INŽENÝRSKÁ MATEMATIKA LOKÁLNÍ EXTRÉMY

Poznámky k předmětu Aplikovaná statistika, 9.téma

Při sledování a studiu vlastností náhodných výsledků poznáme charakter. podmínek různé výsledky. Ty odpovídají hodnotám jednotlivých realizací

Závislost slovních znaků

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Fakulta strojního inženýrství. Matematika IV. Semestrální práce

Teorie chyb a vyrovnávací počet. Obsah:

OBRAZOVÁ ANALÝZA POVRCHU POTISKOVANÝCH MATERIÁLŮ A POTIŠTĚNÝCH PLOCH

8. Odhady parametrů rozdělení pravděpodobnosti

Transkript:

EKONOMETRIE 8. předáška Klasický lieárí regresí model Formulace a podmíky (pozor a ozačeí parametrů) Základí edorovicový model: zobrazue ekoomickou hypotézu o vztahu mezi edou vysvětlovaou ekoomickou veličiou a edou ebo ěkolika vysvětluícími veličiami. Jedá se o klasický lieárí regresí model, který budeme psát ve tvaru Y β 0 + β x + β x +... + β k x k + u, Pro pozorováí musí platit Y β 0 + β x + β x +... + β k x k + u Y β 0 + β x + β x +... + β k x k + u... Y β 0 + β x + β x +... + β k x k + u Soustavu můžeme přepsat v maticovém vyádřeí y Xβ + u, Y x x... x k β 0 Y x x... x k β........................... Y x x... x k β k u u. +.. u Z pozorováí odhademe výběrovou regresí fukci: $Y b 0 + b x + b x +... + b k x k, Pro i-té pozorováí (i,,...,) dostáváme Y i β 0 + β x i + β x i +... + β k x ki + u i, $Y i b 0 + b x i + b x i +... + b k x ki Rozdíly mezi skutečými hodotami Y i a vyrovaými hodotami $ Y i sou tzv. rezidua, což sou odhady ezámých áhodých složek u i e i Y i - $ Y i, i,,...,. Model e potom možo apsat v maticovém vyádřeí.

Pro vyrovaé hodoty: $y Xb pro skutečé hodoty: y Xb + e Aby bylo možé statisticky odhadout vektor odhadů parametrů b, e třeba zavést zásadí předpoklady. Tyto podmíky sou pro kvatifikaci modelu zásadí, aby bylo možo použít pro odhad parametrů metodu emeších čtverců. Nedříve podmíky vyádříme formálě a potom e budeme dále aalyzovat. Symbolem u` vyadřueme traspozici vektoru u. Podmíky. E(u) 0. E (uu`) σ I, 3. E(X`u) 0, 4. h(x ) k+. Metoda emeších čtverců Při splěí podmíek základího modelu lze použít pro odhad parametrů metodu emeších čtverců. Pro obecé odvozeí vzorců použieme maticového vyádřeí. Model v maticovém vyádřeí: y Xb + e Kritérium pro odvozeí odhadové fukce e miimum součtu čtverců reziduí: e`e (y-xb)` (y-xb) y`y - b`x`y + b`x`xb. Hledáme miimum této kvadratické formy, proto položíme parciálí derivace podle parametrů rovy ule. Což maticově vyádřeo zapíšeme ásledově: ( e` e) b` X `y + X `Xb 0. Řešeím této soustavy dostáváme ormálí rovice: X`Xb X`y Při existeci iverzí matice (X`X) - dostáváme bodovou odhadovou fukci: b (X`X) - X`y Metoda emeších čtverců poskytue odhady s dobrými vlastostmi i pro malé výběry pozorováí. Vlastosti odhadové fukce:

. estraost. vydatost Nestraost zameá, že středí hodota odhadu parametrů se rová parametrům teoretické regresí fukce: E(b) β. To zameá, že odhadová fukce b e při opakovaých výběrech v průměru přesá. Vydeme z odhadové fukce: b (X`X) - X`y dosadíme y Xβ + u a dostáváme: b (X`X) - X`(Xβ + u) β + (X`X) - X`u Spočteme středí hodotu b a vzhledem k podmíce E(u) 0, dostáváme E(b) E(β) + (X`X) - X`E(u) β Jestliže eplatí: E(b) β, odhadová fukce e vychýleá, kde vychýleí e rovo E(b) β Vydatost zameá, že odhadová fukce má emeší rozptyl mezi všemi estraými odhadovými fukcemi. Kovariačí matice pro b e defiováa ásledově a vzhledem k podmíce E (uu`) σ I, dostáváme V(b) E[ (b-β)`(b-β)] E[ (X`X) - X`uu`X(X`X) - ] (X`X) - X` E( uu`)x(x`x) - σ (X`X) -. Rozptyly odhadutých parametrů sou rovy součiu rozptylu áhodé složky σ a odpovídaících diagoálích prvků matice (X`X) -. Dá se ukázat, že tyto rozptyly sou emeší. Odhad kovariačí matice V(b) ozačíme S(b) a ezámý rozptyl áhodé složky σ ahradíme eho odhadem s : S(b) s (X`X) -, kde s e`e ( k + ) Hodota (k+) e počet stupňů volosti. Čím e větší počet pozorováí oproti počtu odhadovaých parametrů modelu, tím e meší rozptyl s a i rozptyly odhadu parametrů. Testy Statistická verifikace modelu spočívá v provedeí řady statistických testů.

Testy výzamosti parametrů Při staoveí bodového odhadu parametrů modelu pomocí metody emeších čtverců ebylo uté mít žádý předpoklad o pravděpodobostím rozděleí áhodých složek. Při testováí výzamosti parametrů a při itervalových odhadech parametrů musíme připoit předpoklad ormálího rozděleí áhodých složek s ulovými středími hodotami a kovariačí maticí: u ~ N( 0, σ I ). Odhady rozptylů odhadutých parametrů b matice: S(b) (X`X) - : s x sou a diagoále kovariačí Odmociy těchto hodot sou odhady stadardích chyb s b odhadů b. Kovariace dvoic představuí ediagoálí prvky : cov(b i,b) s x i Testové kritérium e statistika: t která má pro < 30 Studetovo t rozděleí s (k+) stupňů volosti. b β s b,i. V ekoometrické aalýze velice často testueme ulovou hypotézu, že regresí parametr β 0, což zameá, že vysvětluící proměá x emá vliv a vysvětlovaou proměou. Staovíme ulovou a alterativí hypotézu: H 0 : β 0 H : β 0 Jestliže platí t t* α/ akceptueme hypotézu H 0. Jestliže platí t > t* α/ odmíteme hypotézu H 0 ve prospěch hypotézy H. Hladia výzamosti α se většiou bere 0,05. To zameá, prohlásíme-li, že platí hypotéza H, eseme 5% riziko esprávosti tohoto výroku a 95% spolehlivosti výroku. Hodoty t* α/ ademe v tabulkách studetova rozděleí s (k+) stupi volosti. Itervaly spolehlivosti parametrů Určeí itervalů spolehlivosti zameá aít meze, mezi kterými leží skutečé hodoty parametrů se zadaým stupěm spolehlivosti α. Z testováí hypotéz víme, že: P( t* α/ < t < t* α/ ) α.

Po dosazeí statistiky: t b β dostáváme: s b P( b t* α/ s b < β < b + t* α/ s b ) α. To zameá, že s pravděpodobostí α, leží skutečá hodota parametru β v mezích: b t* α/ s b < β < b + t* α/ s b. Test shody odhadutého modelu s daty Nečastěi se pro testováí shody modelu s daty používá ako míra koeficiet determiace. Víme, že z apozorovaých empirických hodot a vyrovaých hodot vypočteých z regresí fukce můžeme určit 3 rozptyly s růzou vypovídací schopostí: a) rozptyl empirických hodot y s y ( yi y), t. celkový součet čtverců (CSČ), b) rozptyl vyrovaých hodot sy$ ( y$ i y), t. vysvětleý součet čtverců (VSČ), c) reziduálí rozptyl s( y y$ ) ( yi y$ ) t. evysvětleý součet čtverců (NSČ). Koeficiet determiace určíme ako podíl vysvětleého součtu čtverců a celkovém součtu čtverců. R VSČ CSČ NSČ CSČ Korigovaý koeficiet determiace: R e`e y`y y, R < 0, > k R R ( k + ) ( ) Statistickou výzamost modelu ako celku podle koeficietu determiace, lze testovat podle testovacího kritéria F R R ( k + ) k Staovíme ulovou a alterativí hypotézu: H 0 : statistická evýzamost R H : statistická výzamost R

Jestliže platí F > F*, odmíteme hypotézu H 0 ve prospěch hypotézy H, že hodota R e statisticky výzamá a rověž shoda modelu s daty e výzamá.