Testování hypotéz o parametrech regresního modelu

Podobné dokumenty
Testování hypotéz o parametrech regresního modelu

Bodové a intervalové odhady parametrů v regresním modelu

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Regresní a korelační analýza

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Regresní a korelační analýza

Regresní analýza 1. Regresní analýza

Regresní a korelační analýza

odpovídá jedna a jen jedna hodnota jiných

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

Regresní a korelační analýza

Tomáš Karel LS 2012/2013

Bodové a intervalové odhady parametrů v regresním modelu

AVDAT Klasický lineární model, metoda nejmenších

LINEÁRNÍ REGRESE. Lineární regresní model

Regresní a korelační analýza

AVDAT Geometrie metody nejmenších čtverců

Kontingenční tabulky, korelační koeficienty

PRAVDĚPODOBNOST A STATISTIKA

Regresní a korelační analýza

12. cvičení z PST. 20. prosince 2017

Inovace bakalářského studijního oboru Aplikovaná chemie

PRAVDĚPODOBNOST A STATISTIKA

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

4EK211 Základy ekonometrie

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

PRAVDĚPODOBNOST A STATISTIKA

Statistika (KMI/PSTAT)

PRAVDĚPODOBNOST A STATISTIKA

Ekonometrie. Jiří Neubauer

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

4EK211 Základy ekonometrie

Statistická analýza jednorozměrných dat

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

INDUKTIVNÍ STATISTIKA

Cvičící Kuba Kubina Kubinčák Body u závěrečného testu

4EK211 Základy ekonometrie

Tomáš Karel LS 2012/2013

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

KGG/STG Statistika pro geografy

Testování statistických hypotéz

4EK211 Základy ekonometrie

Kontingenční tabulky, korelační koeficienty

Statistika II. Jiří Neubauer

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

Statistika II. Jiří Neubauer

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Časové řady, typy trendových funkcí a odhady trendů

4EK211 Základy ekonometrie

Normální (Gaussovo) rozdělení

PRAVDĚPODOBNOST A STATISTIKA

Faktorová analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Regresní analýza. Eva Jarošová

7. Analýza rozptylu.

Normální (Gaussovo) rozdělení

Korelační a regresní analýza

AVDAT Výběr regresorů v mnohorozměrné regresi

Statistická analýza jednorozměrných dat

Ilustrační příklad odhadu LRM v SW Gretl

4EK211 Základy ekonometrie

6. Lineární regresní modely

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Časové řady, typy trendových funkcí a odhady trendů

Regrese. 28. listopadu Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly:

Statistická analýza jednorozměrných dat

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

13.1. Úvod Cílem regresní analýzy je popsat závislost hodnot znaku Y na hodnotách

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

5EN306 Aplikované kvantitativní metody I

Základy teorie odhadu parametrů bodový odhad

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination.

Testování statistických hypotéz

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

AVDAT Nelineární regresní model

4EK211 Základy ekonometrie

Testy statistických hypotéz

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

5EN306 Aplikované kvantitativní metody I

EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy

Zápočtová práce STATISTIKA I

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

= = 2368

Mnohorozměrná statistická data

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Aproximace binomického rozdělení normálním

Stručný úvod do testování statistických hypotéz

Pravděpodobnost a matematická statistika

Transkript:

Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO Brno) Testování hypotéz o parametrech regresního modelu 1 / 15

Testy významnosti parametrů Lineární regresní model kde Y = Xβ + ɛ, y 1 ɛ 1 β y 2 Y =., ɛ = ɛ 2 x 11 x 1 1k., X =....... β 2, β =.. x y n ɛ n1 x nk n β k Odhady neznámých parametrů metodou nejmenších čtverců jsou dány reziduální součet čtverců je β = ( X X ) 1 X Y, S e = (Y X β) (Y X β) = Y Y β X Y. Jiří Neubauer (Katedra UO Brno) Testování hypotéz o parametrech regresního modelu 2 / 15

Testy významnosti parametrů Lineární regresní model Předpokládejme nyní, že náhodné chyby ɛ i, i = 1, 2,..., n v lineárním regresním modelu mají normální rozdělení s nulovou střední hodnotou a rozptylem σ 2. Potom mají odhady β j, j = 1,..., k regresní koeficientů β j normální rozdělení, tedy platí βj N(β j, D( β j )), kde rozptyly D( β j ) jsou dány: D( β 1) = σ 2 v 11, D( β 2) = σ 2 v 22,..., D( β k ) = σ 2 v kk, přičemž v 11, v 22,..., v kk jsou prvky na hlavní diagonále matice (X X) 1. Rozptyly odhadů regresních parametrů odhadneme D( β j ) = se 2 v jj, druhé odmocniny těchto odhadů s( β j ) = se 2 v jj se nazývají směrodatné chyby odhadů regresních parametrů. Jiří Neubauer (Katedra UO Brno) Testování hypotéz o parametrech regresního modelu 3 / 15

Testy významnosti parametrů Testy významnosti parametrů β j, j = 1,..., k (jejich nenulovosti) jsou založeny na statistikách t = β j β j s( β j ), které mají Studentovo rozdělení s n k stupni volnosti. Budeme testovat nulovou hypotézu H: β j = 0 proti alternativní hypotéze A: β j 0. Při platnosti nulové hypotézy má statistika t = β j β j s( β j ) = β j 0 s( β j ) = β j s( β j ) Studentovo rozdělení s n k stupni volnosti. Kritickou hodnotou odpovídající hladině významnosti α je tedy kvantil t 1 α 2 (n k). Jiří Neubauer (Katedra UO Brno) Testování hypotéz o parametrech regresního modelu 4 / 15

Test významnosti modelu Test významnosti regresního modelu Zřejmě platí, že Y i Y = (Y i Ŷi) + (Ŷi Y ). Lze ukázat, že také platí kde (Y i Y ) 2 = (Y i Ŷi) 2 + celkový součet čtverců S Y = Y Y ny 2 S Y = (Ŷi Y ) 2 S Y = S e + S T, (Y i Y ) 2 = n sn(y 2 ), kde sn(y 2 ) = 1 n reziduální součet čtverců S e = Y Y β X Y S e = (Y i Y ) 2 (Y i Ŷi) 2 = (n k) se 2, kde se 2 = 1 (Y i n k Ŷi) 2 teoretický součet čtverců S T = β X Y ny 2 S T = (Ŷi Y ) 2 = n sn(ŷ 2 ), kde sn(ŷ 2 ) = 1 n (Ŷi Y ) 2 Jiří Neubauer (Katedra UO Brno) Testování hypotéz o parametrech regresního modelu 5 / 15

Test významnosti modelu Test významnosti regresního modelu Pro regresní přímku ŷ = β 1 + β 2x dostáváme S e = = S T = (Y i Ŷi) 2 = Y 2 i β 1 (Y i β 1 β 2x i ) 2 = = Y i β 2 (Ŷi Ŷ i ) 2 = = β 1 Y i + β 2 x i Y i ( β 1 + β 2x i 1 n ( ) x i Y i 1 2 Y i n S Y = S e + S T = = Y 2 i ( ) 1 2 Y i n Y 2 i ) = = Jiří Neubauer (Katedra UO Brno) Testování hypotéz o parametrech regresního modelu 6 / 15

Test významnosti modelu Test významnosti regresního modelu teoretický součet čtverců S T je ta část celkového součtu čtverců S Y, která je vysvětlená zvolenou regresní funkcí reziduální součet čtverců S e je ta část celkového součtu čtverců S Y, která zvolenou regresní funkcí vysvětlená není Jiří Neubauer (Katedra UO Brno) Testování hypotéz o parametrech regresního modelu 7 / 15

Test významnosti modelu Test významnosti regresního modelu Při ověřování významnosti regresního modelu (model s konstantou β 1) se testuje nulová hypotéza H: β 2 = β 3 = = β k = 0 proti alternativní hypotéze A: β j 0 pro alespoň jedno j = 2, 3,..., k. Testové kritérium je statistika F = S T k 1 : S e n k, která má při platnosti nulové hypotézy Fisher-Snedecorovo rozdělení F s k 1 a n k stupni volnosti, Kritickou hodnotou je kvantil F 1 α(k 1, n k) daného F rozdělení. Jiří Neubauer (Katedra UO Brno) Testování hypotéz o parametrech regresního modelu 8 / 15

Test významnosti modelu Test významnosti regresního modelu Jsou-li celkový F -test i všechny t-testy jsou statisticky významné, model se považuje za vhodný k vystižení variability proměnné Y (to však ještě neznamená, že je model správně navržen). Jsou-li celkový F -test i všechny t-testy jsou statisticky nevýznamné, model se považuje za nevhodný, protože nevystihuje variabilitu proměnné Y. Je-li celkový F -test statisticky významný, ale některé t-testy vychází nevýznamné, model se považuje za vhodný, ale provádí se zpravidla vypuštění nevýznamných parametrů. Je-li celkový F -test statisticky významný, ale všechny t-testy vychází nevýznamné paradox: formálně model jako celek vyhovuje, ale žádný člen modelu sám o sobě významný není jde o důsledek tzv. multikolinearity, tj. lineární závislosti mezi jednotlivými regresory. Jiří Neubauer (Katedra UO Brno) Testování hypotéz o parametrech regresního modelu 9 / 15

Test významnosti modelu Koeficient (index) determinace Vhodnost zvoleného modelu lze vyjádřit pomocí tzv. indexu (koeficientu) determinace, který je definován jako podíl variability, kterou je schopen popsat regresní model, ku celkové variabilitě vysvětlované proměnné S c = n (Y i Y i ) 2 R 2 = S n T = (Ŷi Y ) 2 S n c (Y i Y i ). 2 Toto číslo nabývá hodnot z intervalu 0, 1. Čím více se R 2 blíží k 1, tím považujeme danou závislost za silnější, a tedy dobře vystiženou použitým regresním modelem; naopak čím více se bude blížit k 0, tím považujeme danou závislost za slabší a regresní funkci za méně výstižnou. Nízká hodnota R 2 ještě nemusí znamenat nízký stupeň závislosti mezi proměnnými, ale může signalizovat chybnou volbu regresního modelu. Jiří Neubauer (Katedra UO Brno) Testování hypotéz o parametrech regresního modelu 10 / 15

Test významnosti modelu Koeficient (index) determinace R 2 představuje výběrový index determinace, který lze použít jako odhad teoretického indexu determinace. Tento odhad je asymptoticky nestranný, nicméně pro malé výběry nadhodnocuje skutečnou těsnost závislosti a je závislý na počtu parametrů regresního modelu. Lze provést jeho korekci čím získáme odhad nestranný. R 2 adj = 1 (1 R 2 ) n 1 n k, Jiří Neubauer (Katedra UO Brno) Testování hypotéz o parametrech regresního modelu 11 / 15

Test obecné lineární hypotézy Test obecné lineární hypotézy Z předchozích výsledků lze odvodit, za předpokladu že LRM je plné hodnosti, že pro libovolnou reálnou matici A typu m k a hodnosti m k má statistika F = 1 ( β β) A [A(X X) 1 A ] 1 A( β β) mse 2 Fisher-Snedecorovo F rozdělení o m a n k stupních volnosti. Tuto statistiku lze pak využít při testování obecné lineární hypotézy H 0, kterou zapíšeme ve tvaru Aβ = a, (1) kde a je vhodný m rozměrný reálný vektor, pro něž je rovnice (1) řešitelná. Odtud pak plyne, že testovací statistika F = 1 (A β a) [A(X X) 1 A ] 1 (A β a) (2) mse 2 má za platnosti nulové hypotézy H 0 Fisher-Snedecorovo F rozdělení o m a n k stupních volnosti. Proto nulovou hypotézu H 0 zamítáme na hladině významnosti α, když F F 1 α(m, n k), kde F 1 α(m, n k) kvantil F rozdělení o m a n k stupních volnosti. Jiří Neubauer (Katedra UO Brno) Testování hypotéz o parametrech regresního modelu 12 / 15

Test obecné lineární hypotézy Test obecné lineární hypotézy Speciální volbou matice A a vektoru a v (1) lze potom získat speciální hypotézy, které experimentátora zajímají. Po dosazení za A a a do statistiky F ve (2) lze získat odpovídající testovací statistiky pro testování hypotéz o parametrech β 1,..., β k. Tímto způsobem lze konstruovat řadu běžných testů o neznámých parametrech včetně testů o parametrech LRM, které byly uvedeny dříve. Jiří Neubauer (Katedra UO Brno) Testování hypotéz o parametrech regresního modelu 13 / 15

Test obecné lineární hypotézy Test obecné lineární hypotézy Příklad 1. Test hypotézy β j = 0 lze získat při volbě A = u j, kde u j je k rozměrný jednotkový vektor s jedničkou na j tém místě a a = 0. Jde o test, založený na testovací statistice t. Příklad 2. Testy hypotéz o rovnosti parametrů, např. test hypotézy β 1 = β 2 = = β m, m k, lze získat volbou a = 0 m 1 a 1 1 0 0 0 0 0 0 1 1 0 0 0 0 A =........ 0 0 0 1 1 0 0 je matice typu (m 1) k. Jiří Neubauer (Katedra UO Brno) Testování hypotéz o parametrech regresního modelu 14 / 15

Test obecné lineární hypotézy Příklad 3. Předpokládejme, že jsou dány dva nezávislé regresní modely, každý s jedním regresorem. První o rovnici Y = Xβ + ɛ a druhý o rovnici Y = X β + ɛ, kde X n 2 a Xn 2 jsou příslušné matice plánů s vektorem jedniček v prvním sloupci, Y a Y jsou vektory pozorování závisle proměnných v obou modelech, ɛ a ɛ jsou nezávislé normálně rozdělené vektory náhodných chyb a konečně β a β jsou dvourozměrné vektory neznámých parametrů. Tedy jsou dány dva nezávislé regresní modely a regresní funkce v obou modelech je dána přímkou. Když oba vektory náhodných chyb mají varianční matice σ 2 I n a σ 2 I n, lze vytvořit spojení obou modelů a uvážit nový model tvaru ( ) Y Y ( ) ( ) X 0 β = 0 X β + ( ɛ ɛ V tomto modelu lze např. testovací statistiku pro testování rovnoběžnosti obou regresních přímek snadno dostat ze vzorce (2) volbou A = (0, 1, 0, 1), a = 0. ) Jiří Neubauer (Katedra UO Brno) Testování hypotéz o parametrech regresního modelu 15 / 15