Kapitola 9.: Jednoduchá lineární regresní analýza

Podobné dokumenty
} kvantitativní znaky

Přednáška č. 10 Analýza rozptylu při jednoduchém třídění

Směrnice 1/2011 Statistické vyhodnocování dat, verze 3 Verze 3 je shodná s původní Směrnicí 1/2011 verze 2, za čl. 2.3 je vložen nový odstavec

Metody zkoumání závislosti numerických proměnných

PRAVDĚPODOBNOST A STATISTIKA

Odhady a testy hypotéz o regresních přímkách

TECHNICKÁ UNIVERZITA V LIBERCI

Téma 1: Pravděpodobnost

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 2

Téma 5: Analýza závislostí

Interval spolehlivosti pro podíl

1 Měření závislosti statistických znaků. 1.1 Dvourozměrný statistický soubor

Testování statistických hypotéz

1.1 Rozdělení pravděpodobnosti dvousložkového náhodného vektoru

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

PRAVDĚPODOBNOST A STATISTIKA

Směrnice 1/2011 Statistické vyhodnocování dat, verze 4 Verze 4 je shodná se Směrnicí 1/2011 verze 3, pouze byla rozšířena o robustní analýzu

8 DALŠÍ SPOJITÁ ROZDĚLENÍ PRAVDĚPODOBNOSTI

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Fakulta strojního inženýrství. Matematika IV. Semestrální práce

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

Měření závislostí. Statistická závislost číselných znaků

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

Odhady parametrů 1. Odhady parametrů

Regrese. Aproximace metodou nejmenších čtverců ( ) 1 ( ) v n. v i. v 1. v 2. y i. y n. y 1 y 2. x 1 x 2 x i. x n

- metody, kterými lze z napozorovaných hodnot NV získat co nejlepší odhady neznámých parametrů jejího rozdělení.

Generování dvojrozměrných rozdělení pomocí copulí

Téma 4: Výběrová šetření

Testování statistických hypotéz

Mendelova univerzita v Brně Statistika projekt

Jednoduchá lineární regrese

11. Regresní analýza. Čas ke studiu kapitoly: 60 minut. Cíl VÝKLAD Úvod

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i

Aktivita 1 Seminář základů statistiky a workshop (Prof. Ing. Milan Palát, CSc., Ing. Kristina Somerlíková, Ph.D.)

PRAVDĚPODOBNOST A STATISTIKA

Nejistoty měření. Aritmetický průměr. Odhad směrodatné odchylky výběrového průměru = nejistota typu A

,6 32, ,6 29,7 29,2 35,9 32,6 34,7 35,3

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

8. Analýza rozptylu.

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor

Národní informační středisko pro podporu kvality

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor

9. REGRESNÍ A KORELAČNÍ ANALÝZA

Příklady z přednášek

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA

Ilustrativní příklad ke zkoušce z B_PS_A léto 2013.

6. SLEDOVÁNÍ STATISTICKÉHO CHARAKTERU RADIOAKTIVNÍHO ROZPADU

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

Statistické charakteristiky (míry)

Intervalové odhady parametrů některých rozdělení.

SP2 Korelační analýza. Korelační analýza. Libor Žák

Kapitola 3.: Úlohy o jednom náhodném výběru z normálního rozložení

Optimalizace portfolia

, jsou naměřené a vypočtené hodnoty závisle

Test dobré shody se používá nejčastěji pro ověřování těchto hypotéz:

12. N á h o d n ý v ý b ě r

8 NELINEÁRNÍ REGRESNÍ MODELY

Soustava momentů. k s. Je-li tedy ve vzorci obecného momentu s = 1, získáme vzorec aritmetického průměru.

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA. Testy hypotéz

PRAVDĚPODOBNOST A STATISTIKA

[ jednotky ] Chyby měření

14. B o d o v é o d h a d y p a r a m e t r ů

Charakteristiky úrovně

Ing. Vladimíra Michalcová, Ph.D. Katedra stavební mechaniky (228)

PRAVDĚPODOBNOST A STATISTIKA. Náhodná proměnná vybraná rozdělení

Téma 6: Indexy a diference

V. Normální rozdělení

U. Jestliže lineární zobrazení Df x n n

EKONOMETRIE 9. přednáška Zobecněný lineární regresní model

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

8. Zákony velkých čísel

Testování statistických hypotéz

9 NÁHODNÉ VÝBĚRY A JEJICH ZPRACOVÁNÍ. Čas ke studiu kapitoly: 30 minut. Cíl:

ž ř ž ě ěá é é á ě ě ú Í ř Ť á é á ě ž š ž ě č ě ř é ý ě ř á ž ď á é á ě ě ř á á ýě ý ří ě š é ě Í ěá ť ž ř šř Á ý ř ú ý é ě ě č é ě ř á ú á á ť Í á ě

Úvod do korelační a regresní analýzy

PRAVDĚPODOBNOST A STATISTIKA. Bodové a intervalové odhady

} kvantitativní znaky. korelace, regrese. Prof. RNDr. Jana Zvárov. Obecné principy

Jednoduchá lineární závislost

Lineární regrese ( ) 2

Spojité (kontinuální) - nap. podle vykázaného zisku, tržeb, náklad Nespojité (diskrétní) - nap. podle potu len v rodin

Přednáška č. 11 Analýza rozptylu při dvojném třídění

c) Pomocí Liouvillovy věty dokažte, že Liouvillovo číslo je transcendentí. xp 1 (p 1)! (x 1)p (x 2) p... (x d) p e x t f(t) d t = F (0)e x F (x),

9. Měření závislostí ve statistice Pevná a volná závislost

1. Rozdělení četností a grafické znázornění Předpokládejme, že při statistickém šetření nás zajímá jediný statistický znak x, který nabývá

Posouzení vlivu vybraných makroekonomických veličin na vývoj systému sociálního zabezpečení

Pravděpodobnost a aplikovaná statistika

Interpolační křivky. Interpolace pomocí spline křivky. f 1. f 2. f n. x... x 2

4.2 Elementární statistické zpracování Rozdělení četností

Korelační analýza. sdružené regresní přímky:

2. Najděte funkce, které vedou s těmto soustavám normálních rovnic

Budeme pokračovat v nahrazování funkce f(x) v okolí bodu a polynomy, tj. hledat vhodné konstanty c n tak, aby bylo pro malá x a. = f (a), f(x) f(a)

11. INDUKTIVNÍ STATISTIKA

VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE FAKULTA INFORMATIKY A STATISTIKY Katedra statistiky a pravděpodobnosti STATISTIKA VZORCE PRO 4ST201

Regresní lineární model symboly

MATICOVÉ HRY MATICOVÝCH HER

Pravděpodobnostní model doby setrvání ministra školství ve funkci

Momenty a momentové charakteristiky

2. Úvod do indexní analýzy

Transkript:

Katola 9: Jedoduchá leárí regreí aalýza Cíl katoly Po rotudováí této katoly udete umět - metodou emeších čtverců odhadout arametry regreí fukce - kotruovat tervaly olehlvot ro regreí arametry - tetovat hyotézy o regreích arametrech - omocí růzých krtérí ouzovat vhodot zvoleé regreí fukce Čaová zátěž Na rotudováí této katoly a lěí úkolů í oeých udete otřeovat a 3 hod tuda 9 Motvace Cílem regreí aalýzy e oat závlot hodot áhodé velčy Y a hodotách velčy X, která může ýt áhodá eáhodá Přtom e zaotřeí vyřešt dva rolémy: a) aký ty fukce e ouže k ou daé závlot; ) ak e taoví kokrétí arametry daého tyu fukce? ad a) Př určeí tyu fukce e třea rovét teoretcký rozor zkoumaé závlot Můžeme ař zkoumat závlot cey oetého auta (velča Y) a eho táří (velča X) Je zřemé, že rotoucím tářím ude kleat cea, ale eí aé, zda leárě, kvadratcky č dokoce exoecálě Vždy e ažíme o to ay regreí model yl edoduchý, t ay eoahoval řílš moho arametrů Přadá-l v úvahu více fukcí, ouzueme ech vhodot omocí růzých krtérí vz dále Čato však emáme dotatek formací k rovedeí teoretckého rozoru Pak e ažíme odhadout ty fukce omocí dvourozměrého tečkového dagramu Zde e omezíme a fukce, které záveí leárě a arametrech β, β, K β, Zvláští ozorot udeme věovat olyomálí fukc tuě y β + β x ad ) Odhady,, K, ezámých arametrů β, β,, β K zíkáme a základě dvouroz- x y měrého datového ouoru K K metodou emeších čtverců, t z odmíky, ay oučet čtverců odchylek zštěých a odhadutých hodot yl x y mmálí 9 Klacký model leárí regree 9 Po modelu Nechť závlot áhodé velčy Y a velčě X e vyádřea modelem Y m x; β, β, K β +, (, ) ε kde m( x;, β, β ) β K e determtcká ložka modelu a ε e áhodá ložka modelu Je to, áhodá odchylka od determtcké závlot Y a X Poue závlot vyvětlovaé velčy a ezámých eo eozorovaých velčách a oue vlv áhody Nelze fukčě vyádřt

( ) Jako krtérum kvalty redkce závle roměé velčy Y a ezávle roměé velčě E Y m x; β, β, K β Lze doká- X e ovykle volí tředí kvadratcká chya redkce [ (, ) ] zat, že tředí kvadratcká chya redkce e mmálí, když m( x;, β,, β ) E( Y x) β K, t závlot Y a X udeme modelovat omocí odmíěé tředí hodoty eol omocí regreí fukce velčy Y vzhledem k velčě X Nadále ředokládáme, že regreí fukce leárě záví a ezámých regreích arametrech β, β, K, β a zámých fukcích f( x), K,f ( x), které ž eoahuí ezámé arametry, t ( x; β, β,, β ) β f ( x) m K, řčemž ( x) f Regreí arametry β, β, K, β lze terretovat tak, že arametr β vyadřue růměrou změu hodoty Y ř růtu hodoty fukce f (x) o edu edotku za ředokladu, že hodoty otatích fukcí f k (x), k,,, k, zůtaou ezměěé x, y, K, x,, t dvourozměrý datový ouor Pořídíme dvoc ozorováí ( ) ( ) x y K K x y y Pro,, latí: y m( x ; β, β,, β) + ε K O áhodých odchylkách ε, K, ε ředokládáme, že (odchylky eou ytematcké) a) E( ε ) ) D( ) σ ε > (všecha ozorováí ou rováděa touž řeotí ou homokedatcká) Cε, ε ro (mez áhodým odchylkam eextue žádý leárí vztah) c) ( ) ε ~ (, ) d) N σ V tomto říadě hovoříme o klackém modelu leárí regree 9 Ozačeí,, K, - odhady regreích arametrů β, β, K, β (ečatě e zíkáme metodou emeších čtverců, t z odmíky, že výraz y f ( x ) β aývá vého mma ro β,,,, ) mˆ x;, K, - emrcká regreí fukce ( ) ( x ;,, ) f ( x ) ŷ mˆ K - regreí odhad -té hodoty velčy Y (-tá redkovaá hodota velčy Y) e y ŷ - -té rezduum ( y ŷ) S - rezduálí oučet čtverců E S E - odhad roztylu σ S R ( ŷ m ) - regreí oučet čtverců (řtom m y )

( y m ) S - celkový oučet čtverců T Pro oučty čtverců latí: S S + S T 93 Matcový zá klackého modelu leárí regree y Xβ+ ε, kde ( y ) ', K, y f ( x ) K f ( x ) R y - vektor ozorováí závle roměé velčy Y, X K K K K - regreí matce f ( ) ( ) x K f x (ředokládáme, že h(x) + < ) β ( β ) ', β, K, β - vektor regreích arametrů, ε ( ε ) ', K, ε - vektor áhodých odchylek Podmíky (a) až (d) lze zkráceě zaat ve tvaru ε ~ N (, σ I) E x Nař ro regreí římku y β +βx+ ε má regreí matce tvar X M M a vektor x β regreích arametrů e β β Matcově zaaá metoda emeších čtverců vede a rovce X Xβ X y ytém ormálích rovc, (X X) - X y odhad vektoru β zíkaý metodou emeších čtverců Pro regreí římku zíkáme řešeím ytému ormálích rovc odhady a m m kde e výěrová kovarace hodot (x, y ),,, a e výěrový roztyl hodot x, K, x Regreí římku můžeme vyádřt ve tvaru y m + ( x m) + ε ŷ X vektor regreích odhadů (vektor redkce) e y - ŷ vektor rezduí Vlatot odhadu : - odhad e leárí, eoť e vytvoře leárí komací ozorováí y,, y matcí vah ' ' ( X) X X ; - odhad e etraý, eoť E() β; - odhad má varačí matc var σ (X'X) - ; - odhad ~ N+(β, σ (X'X)-) vzhledem k latot odmíky (d); - ro odhad latí Gauova - Markovova věta: Odhad (X'X) - X'y e eleší etraý leárí odhad vektoru β (Neleší v tom mylu, že rozdíl varačí matce lovolého ého etraého odhadu vektoru β a varačí matce odhadu e matce oztvě emdeftí)

94 Příklad U šet ochodíků yla zšťováa otávka o určtém druhu zoží lo (velča X - v kuech) a leto (velča Y - v kuech) čílo ochodíka 3 4 5 6 otávka lo (X) 6 7 5 6 otávka leto (Y) 5 6 6 3 3 Předokládete, že závlot letoší otávky a loňké lze vythout regreí římkou Setavte regreí matc, vyočtěte odhady regreích arametrů a ašte rovc regreí římky Iterretute arametry regreí římky Řešeí: Setavíme regreí matc x X M M, tedy X x ' ( ) y 6 7 5 6 ' Podle vzorce X X X zíkáme odhady regreích arametrů Nerve vyočítáme matc 6 66 X X 66 9 a k í verzí matc (X X) -,49984,3,3,7 Dále zíkáme ouč 84 X y 385 a akoec vektor odhadů regreích arametrů:,49984,3 84,6868,3,7 385,665 Regreí římka má tedy rovc y,6868 +,665 x Zameá to, že ř ulové loňké otávce y letoší otávka čla,6868 kuů a ř zvýšeí loňké otávky o kuů y e letoší otávka zvedla o,665 kuů Výočet omocí ytému STATISTICA Vytvoříme ový datový ouor e dvěma roměým X a Y a 6 říady: Stattky Vícerozměrá regree Závle roměá Y, ezávle roměá X - OK OK Výočet: Výledky regree

N6 Ačle X Výledky regree e závlou roměou : Y (Taulka) R,97977 R,9447393 Uraveé R,93945 F(,4)68,384 <,7 Směrod chya odhadu : 9,9 Beta Smchya B Smchya t(4) Úroveň eta B,68683,6436,337,9755,97977,7538,66484,535 8,69474,67 Ve výtuí taulce ademe koefcet ve louc B a řádku ozačeém A čle, koefcet ve louc B a řádku ozačeém X Rovce regreí římky: y,68683 +,66484 x Zameá to, že ř ulové loňké otávce y letoší otávka čla,6868 kuů a ř zvýšeí loňké otávky o kuů y e letoší otávka zvedla o,665 kuů 95 Tetováí výzamot modelu ako celku (celkový F-tet) Na hladě výzamot α tetueme H : ( β K, β ) (,, ) rot H : ( β K, β ) (,, ), K, K (Nulová hyotéza říká, že dotačuící e model kotaty) S Tetová tattka: F R S má rozložeí F(, --), okud H latí E ( ) Krtcký oor: F (, ) ) W α, Jetlže F W, ak H zamítáme a hladě výzamot α Výledky F-tetu zaueme do taulky aalýzy roztylu: zdro varalty oučet čtverců tuě volot odíl model S R S R / rezduálí S E -- S E /(--) - celkový S T - - - tattka F SR S E ( ) Z této taulky také můžeme ado zíkat odhad roztylu σ : SE 96 Tetováí výzamot regreích arametrů (dílčí t-tety) Na hladě výzamot α ro,,, tetueme hyotézu H : β rot H : β Tetová tattka: T má rozložeí t(--), okud H latí Krtcký oor: (, t ( ) t ( ) ) W α / α /, Pokud T W, H zamítáme a hladě výzamot α Uozorěí: Tet výzamot měrce regreí římky (t tet H : β rot H : β ) e ekvvaletí tetováí hyotézy o ekorelovaot velč X, Y (t tetu H : ρ rot H : ρ ) Jetlže koefcet korelace velč X, Y e lízký, emá myl očítat arametry regreí římky

97 Příklad Pro zadáí z říkladu 94 aděte odhad roztylu, roveďte celkový F-tet, a roveďte rověž dílčí t-tety Řešeí: Nerve vyočteme vektor regreích odhadů roměé Y (vektor redkce): 6, 6 76,68 7,6868 89,34 ŷ X,665 7,34 5 9,66 6 39,97 Staovíme vektor rezduí: 5 6, 3,98 6 76,68 6,68 6 89,34 9,34 e y yˆ 7,34 7,34 3 9,66 39,34 3 39,97 9,97 Pomocí vektoru rezduí vyočteme rezduálí oučet čtverců: 3,98 6,68 9,34 S E e e (3,98-6,68-9,34-7,34 39,34-9,97) 345, 7,34 39,34 9,97 S 345, Odhad roztylu: E 853, 78 6 Dále otřeueme celkový oučet čtverců S T (y m ) (y m ), kde m e loucový vektor tyu x ložeý z růměru m závle roměé velčy Y V ašem říadě e m 4 Po doazeí do vzorce ro celkový oučet čtverců tedy dotaeme 5 4 6 4 6 4 S T (5-4, 6-4, 6-4, -4, 3-4, 3-4) 68 4 3 4 3 4 (Celkový oučet čtverců lze zíkat také tak, že výěrový roztyl velčy Y vyáoíme -: S T 536 68) Regreí oučet čtverců ak e: S R S T S E 68 345, 58348,89

Provedeí celkového F-tetu: a hladě výzamot α,5 tetueme H : β rot H : β S / 58348,89 / Tetová tattka F R 68, 384 S /( ) 345,/(6 ), E krtcký oor: F (, ), ) F (,4), ) 7,786 ) W α, 95, Protože e tetová tattka realzue v krtckém ooru, hyotézu o evýzamot regreího arametru β (t měrce regreí římky) zamítáme a hladě výzamot,5 Výledky tetováí výzamot modelu ako celku zaíšeme do taulky ANOVA: zdro varalty oučet čtverců tuě volot odíl tattka F model S R 58348,89 S R /58348,89 68,384 rezduálí S E 345, -- 4 S E /(--)853,78 - celkový S T 68-5 - - Provedeí dílčích t-tetů: Na hladě výzamot α,5 tetueme H : β rot H : β,6868 Tetová tattka: t, 337,,644 krtcký oor:, t ( α / ( ) t α / ( ), ) (, t,975( 4) t, ( 4), ) (,,7764,7764, ) W 975 Protože e tetová tattka erealzue v krtckém ooru, hyotézu o evýzamot regreího arametru β (t ouutí regreí římky) ezamítáme a hladě výzamot,5 Ke teému výledku doěeme, odíváme-l e a 95% terval olehlvot ro β Vyočítal me, že -56,63 < β < 58 ravděodootí aoň,95 Protože teto terval oahue, hyotézu H : β ezamítáme a hladě výzamot,5 Na hladě výzamot α,5 tetueme H : β rot H : β,665 Tetová tattka: t 8, 7,,53 krtcký oor:, t ( α / ( ) t α / ( ), ) (, t,975( 4) t, ( 4), ) (,,7764,7764, ) W 975 Protože e tetová tattka realzue v krtckém ooru, hyotézu o evýzamot regreího arametru β (t měrce regreí římky) zamítáme a hladě výzamot,5 Ke teému výledku doěeme, odíváme-l e a 95% terval olehlvot ro β Vyočítal me, že,84< β <,69 ravděodootí aoň,95 Protože teto terval eoahue, hyotézu H : β zamítáme a hladě výzamot,5 V říadě modelu regreí římky e dílčí t-tet ro arametr β ekvvaletí celkovým F- tetem Výočet omocí ytému STATISTICA: Aychom zíkal odhad roztylu, vrátíme e do Výledky víceáoá regree Detalí výledky ANOVA

Efekt Regre Rezd Celk Aalýza roztylu (Taulka) Součet v Průměr F Úroveň čtverců čtverců 58384,89 58384,89 68,384,67 345, 4 853,78 68, Odhad roztylu ademe a řádku Rezd, ve louc Průměr čtverců, tedy 853,78 Tetovou tattku F-tetu a odovídaící -hodotu ademe v záhlaví výtuí taulky regree: N6 Ačle X Výledky regree e závlou roměou : Y (Taulka) R,97977 R,9447393 Uraveé R,93945 F(,4)68,384 <,7 Směrod chya odhadu : 9,9 Beta Smchya B Smchya t(4) Úroveň eta B,68683,6436,337,9755,97977,7538,66484,535 8,69474,67 Zde F 68,384, -hodota <,7, tedy a hladě výzamot,5 zamítáme hyotézu o evýzamot modelu ako celku Výledky F-tetu ou rověž uvedey v taulce ANOVA Výledky dílčích t-tetů ou uvedey ve výtuí taulce regree Tetová tattka ro tet hyotézy H : β e,337, -hodota e,9755 Hyotézu o evýzamot úeku regreí římky tedy ezamítáme a hladě výzamot,5 Tetová tattka ro tet hyotézy H : β e 8,69474, -hodota e,67 Hyotézu o evýzamot měrce regreí římky tedy zamítáme a hladě výzamot,5 98 Itervaly olehlvot ro regreí arametry Ozačme v -tý dagoálí rvek matce (X'X) - a v tzv měrodatou chyu odhadu Pro,,, e tattka T β řídí rozložeím t( ) ± t α / (- α)% terval olehlvot ro β má meze: ( ), tedy (S tervaly olehlvot ouví relatví chyy odhadů regreích arametrů Zíkaí e tak, že e vyočítá aolutí hodota odílu olovčí šířky tervalu olehlvot a hodoty odhadu Relatví chya odhadu y eměla řeáhout %) 99 Příklad Pro zadáí z říkladu 94 aděte 95% tervaly olehlvot ro regreí arametry a ztěte relatví chyy odhadů regreích arametrů Řešeí: Vyočteme měrodaté chyy odhadů regreích arametrů a odle vzorce,, kde v e -tý dagoálí rvek matce (X'X) - : v,

(X'X) -,49984,3,3,7 Přtom uvědomíme, že v,49984, v,7, 853,78 v 853,78,49984,644, v 853,78,7,53 Staovíme meze 95% tervalů olehlvot ro regreí arametry β a β K tomu louží vzorec ± t α / ( ),, 95% terval olehlvot ro β : t 4,6868,7764,644 56, ( ) 63 ( 4),6868+,7764,644 58 d,975 h + t,975 Zameá to, že -56,63 < β < 58 ravděodootí aoň,95 Relatví chya odhadu β : ( 58+ 56,63 ) / % 834%,6868 95% terval olehlvot ro β : t 4,665,7764,53, ( ) 84 ( 4),665+,7764,53, 69 d,975 h + t,975 Zameá to, že,84< β <,69 ravděodootí aoň,95 Relatví chya odhadu β : (,69,84 ) / % 33,6%,665 Výočet omocí ytému STATISTICA: Ve výtuí taulce výledků regree řdáme za roměou Úroveň tř ové roměé: dm (ro dolí meze 95% tervalů olehlvot ro regreí arametry), hm (ro horí meze 95% tervalů olehlvot ro regreí arametry) a chya (ro relatví chyy odhadů regreích arametrů) Do Dlouhého méa roměé dm aíšeme: v3-v4*vstudet(,975;4) Do Dlouhého méa roměé hm aíšeme: v3+v4*vstudet(,975;4) Do Dlouhého méa roměé chya aíšeme: *a(,5*(hm-dm)/v3) N6 Ačle Prom Výledky regree e závlou roměou : Prom (Taulka) R,97977 R,9447393 Uraveé R,93945 F(,4)68,384 <,7 Směrod chya odhadu : 9,9 Beta Smchya B Smchya t(4) Úroveň dm hm chya eta B v3-v4*v v3+v4* *a,68683,6436,337,9755-56,656 57,9998 8344,68,97977,7538,66484,535 8,69474,67,8466,697 33,57463 Vdíme, že -56,63 < β < 58 ravděodootí aoň,95 a,84< β <,69 ravděodootí aoň,95 Relatví chya odhadu arametru β čí 8344,68% a relatví chya odhadu arametru β čí 33,57% V oou říadech ou chyy řílš velké 9 Krtéra ro oouzeí vhodot zvoleé regreí fukce

a) Idex determace SR SE Čílo ID e azývá dex determace ST ST Vlatot dexu determace: aývá hodot z tervalu, ; udává, akou čát varalty závle roměé velčy Y lze vyvětlt zvoleou regreí fukcí (čato e vyadřue v %); e zároveň mírou těot závlot velčy Y a velčě X; e to oecá míra, ezávlá a tyu regreí fukce (lze oužít ro měřeí eleárí závlot); e to míra, která eere v úvahu očet arametrů regreí fukce U regreích fukcí více arametry vychází tedy ovykle vyšší ež u regreích fukcí méě arametry; tato míra eí ymetrcká Za vhoděší e ovažue ta regreí fukce, ro ž e dex determace vyšší V říadě, že orováváme ěkolk modelů rozdílým očtem arametrů, oužíváme adutovaý dex ( ID ) determace: IDad ID Malá hodota dexu determace emuí zameat, že mez velčam X, Y e ízká závlot, může galzovat evhodou volu tyu regreí fukce V říadě regreí římky e dex determace rove kvadrátu koefcetu korelace: ID r ) Tetové krtérum F Za vhoděší e ovažováa ta regreí fukce, u íž e hodota tetové tattky S F R S ro tet výzamot modelu ako celku vyšší E ( ) c) Rezduálí oučet čtverců a rezduálí roztyl Rezduálí oučet čtverců: S ( y ŷ ) E Za vhoděší ovažueme fukc, která má rezduálí oučet čtverců žší Rezduálí oučet čtverců lze oužít ouze tehdy, když rováváme fukce e teým očtem arametrů SE Rezduálí roztyl: Za vhoděší ovažueme tu fukc, která má rezduálí roztyl žší Rezduálí roztyl můžeme oužít vždy, ez ohledu a to, kolk arametrů maí rovávaé regreí fukce d) Středí aolutí rocetuálí chya redkce (MAPE) y ŷ MAPE y Za vhoděší ovažueme tu fukc, která má MAPE žší e) Aalýza rezduí

Rezdua ovažueme za odhady áhodých odchylek a klademe a ě teé ožadavky ako a áhodé odchylky, t maí ýt ezávlá, ormálě rozložeá ulovou tředí hodotou a kotatím roztylem (t ou homokedatcká) Nezávlot rezduí (autokorelac) ouzueme ař omocí Durovy Watoovy tattky, která y e měla acházet v tervalu,4;, 6 (to e ovšem ouze oretačí vodítko, korektí otu očívá v orováí této tattky taelovaou krtckou hodotou) Normaltu rezduí ověřueme omocí tetů ormalty (ař Lleforovou varatou Kolmogorovova Smrovova tetu eo Sharovým Wlkovým tetem) č grafcky omocí N-P lotu Tetováí ulovot tředí hodoty rezduí rovádíme omocí edovýěrového t-tetu Homokedatctu rezduí ouzueme omocí grafu závlot rezduí a redkovaých hodotách V tomto grafu y rezdua měla ýt rovoměrě roztýlea 9 Příklad Pro zadáí z říkladu 94 vyočtěte dex determace a terretute ho Vyočtěte rověž tředí aolutí rocetuálí chyu redkce a aděte regreí odhad letoší otávky ř loňké otávce kuů Proveďte aalýzu rezduí Nakrelete regreí římku do dvourozměrého tečkového dagramu Řešeí: Idex determace e očítá odle vzorce S S R ID V říkladu 97 ylo vyočteo, že regreí oučet čtverců S R 58348, 89 a celkový oučet čtverců S T 68 Idex determace: ID, 944 58348,89 68 Zameá to, že varalta hodot závle roměé velčy e z 94,4% vyvětlea regreí římkou Pro regreí římku můžeme využít toho, že ID r V ašem říadě ztíme, že r,97977, tedy ID,97977, 9447 MAPE e očítá odle vzorce MAPE T y ŷ V říkladě 97 me vyočetl vektor y 3,98 5 6,68 6 9,34 6 rezduí y ŷ a vektor ozorováí 7,34 39,34 3 9,97 3 Tedy dotáváme MAPE 3,98 6,68 9,34 7,34 39,34 9,97 + + + + +,57 6 5 6 6 3 3 Regreí odhad ro x dotaeme ouhým doazeím do rovce regreí římky: ŷ,6868+,665 4 Př loňké otávce kuů y odhad letoší otávky čl 4 kuů zoží

Výočet omocí ytému STATISTICA: Idex determace e uvede v záhlaví ůvodí výtuí taulky od ozačeím R: N6 Ačle X Výledky regree e závlou roměou : Y (Taulka) R,97977 R,9447393 Uraveé R,93945 F(,4)68,384 <,7 Směrod chya odhadu : 9,9 Beta Smchya B Smchya t(4) Úroveň eta B,68683,6436,337,9755,97977,7538,66484,535 8,69474,67 V ašem říadě ID,9447, tedy varalta letoší otávky e z 94,5% vyvětlea regreí římkou Aychom vyočetl MAPE, tak ve výledcích Víceáoé regree zvolíme záložku Rezdua / ředoklady / ředověd Rezduálí aalýza Uložt Uložt rezdua a ředověd Vyrat vše OK Ve vzklé taulce řdáme roměou chyy a do eího Dlouhého méa aíšeme *a(v4/v) Pak očteme růměr této roměé a ztíme, že MAPE 5,7% Pro výočet redkovaé hodoty zvolíme Rezdua/ředoklady/ředověd Předověd závle roměé X: OK Ve výtuí taulce e hledaá hodota ozačea ako Předověď Proměá X A čle Předověď -95,%LS +95,%LS Předovězeé hodoty (Taulka roměé: Y B-váž Hodota B-váž * Hodot,66484, 39,33,6868 4, 6,883 73,97 Př loňké otávce kuů e redkovaá hodota letoší otávky 4 kuů Př aalýze rezduí erve ooudíme ezávlot rezduí omocí Durova Watoovy tattky: Na záložce Rezdua/ředoklady/ředověd zvolíme Rezduálí aalýza - Pokročlá Durova Watoova tattka Dur-Watoovo d (otavkata) a érové korelace rezduí Dur- Sérové Watod korelace Odhad,847 -,355 Tato tattka e lízká čílu, tedy rezdua můžeme ovažovat za ezávlá Normaltu rezduí ooudíme Lleforovou varatou K-S tetu a S-W tetem:

Tety ormalty (Taulka6) N max D Lllefor W Proměá Rezdua 6,7784 <,5,9935,4495 A ede z tetů ezamítá hyotézu o ormaltě rezduí a hladě výzamot,5 Grafcky ooudíme ormaltu N-P lotem:,4 Normal Proalty Plot of Redual,,,8,6 Exected Normal Value,4,, -, -,4 -,6 -,8 -, -, -,4-4 -3 - - 3 4 5 Redual Vdíme, že rezdua e od deálí římky eodchyluí řílš výrazě Nulovot tředí hodoty rezduí ověříme edovýěrovým t-tetem: Tet růměrů vůč referečí kotatě (hodotě) (Taulka6) Průměr Smodch N Smchya Referečí t SV Proměá kotata Rezdua -,3 6,3469 6,66944, -, 5, Vdíme, že -hodota e, tudíž a hladě výzamot,5 ezamítáme hyotézu, že rezdua maí ulovou tředí hodotu Homokedatctu rezduí ooudíme omocí grafu závlot rezduí a redkovaých hodotách velčy Y: Na záložce Rezdua/ředoklady/ředověd zvolíme Rezduálí aalýza Bodové grafy Předověd v Rezdua 5 Předovězeé hodoty v rezdua Závlá roměá : Y 4 3 Rezdua - - -3-4 5 5 5 3 35 Předov hodoty,95 Itol

Rezdua evykazuí žádou závlot a redkovaých hodotách Nakoec do dvourozměrého tečkového dagramu akrelíme regreí římku V meu D Bodové grafy zvolíme Ty roložeí: Leárí, OK 35 Bodový graf z Y rot X Taulka v*6c Y,6868+,665*x 3 5 Y 5 5 4 6 8 4 6 8 4 6 8 X Vzhled grafu azačue, že římka e vhodým modelem závlot letoší otávky a loňké otávce Shrutí Jedoduchá leárí regreí aalýza louží k tomu, ay oala závlot áhodé vel- E Y x ), která e čy Y a velčě X omocí regreí fukce (t odmíěé tředí hodoty ( ) leárí v arametrech Důležtým úkolem regreí aalýzy e alezeí vhodého tyu regreí fukce a odhad eích arametrů V říadě leárích regreích modelů odhadueme ezámé arametry metodou emeších čtverců a základě zalot dvourozměrého datového ouoru hodot velč X a Y Pokud e áhodé odchylky regreího modelu od kutečot řídí ormálím rozložeím ulovou tředí hodotou a kotatím roztylem a řtom ou ezávlé, ak můžeme kotruovat tervaly olehlvot ro regreí arametry, omocí F-tetu ověřovat výzamot modelu ako celku a omocí dílčích t-tetů ověřovat výzamot edotlvých regreích arametrů Vhodot zvoleého regreího modelu ouzueme omocí růzých krtérí, ař omocí dexu determace, omocí odhadu rezduálího roztylu eo omocí tředí aolutí rocetuálí chyy redkce (MAPE) Důležtá e rověž aalýza rezduí, v eímž růěhu ověřueme ezávlot rezduí, ech ormaltu, ulovot tředí hodoty a homokedatctu roztylu Kotrolí otázky Jak e defováa odmíěá tředí hodota ( ) Y x E a k čemu louží? Pošte rc metody emeších čtverců 3 Jak e defová rezduálí, regreí a celkový oučet čtverců a aký e mez m vztah? 4 Co latí ro hodot regreí matce? 5 Jaké vlatot má odhad vektoru regreích arametrů zíkaý metodou emeších čtverců? 6 Jak zíkáme relatví chyy odhadů regreích arametrů?

7 K čemu louží celkový F-tet a dílčí t-tety? 8 Jaká krtéra oužíváme ro hodoceí kvalty regreího modelu? Autokorekčí tet Který z áleduících ředokladů klackého leárího regreího modelu y Xβ+ ε e chyý? a) h(x) + ) var(ε) σ I c) E(ε) Jedo z áleduících tvrzeí o vektoru, který e zíká metodou emeších čtverců ako odhad vektoru regreích arametrů β, e ravdvé Které to e? a) var σ (XX') - ) odhad e vychýleý odhad vektoru β c) odhad e leárí 3 Máte k dozc výtuí taulku ro model regreí římky: N9 Itercet Var * StdErr of * StdErr of t(7) -value 38,463,666,5483,,9648,6444 9,7785,98396 5,958, Pokud e hodota ezávle roměé velčy X zvýší o 5 edotek, ak regreí odhad hodoty závle roměé velčy Y e zvýší o: a) 9,3 edotek ) 48,9 edotek c) 9,8 edotek 4 Máte k dozc eúlou taulku ANOVA ro model regreí římky: Effect Regre Redual Total Sum of Square df Mea Square F -value 5545,3 5545,3 5,875, 384,9 7 54359, Odhad roztylu e: a) 43,6 ) 973,4 c) 86, 5 Př výočtu adutovaého dexu determace eotřeueme zát: a) očet ozorováí ) hodot regreí matce c) očet arametrů v regreím modelu 6 Výěrový koefcet korelace vyočteý a základě áhodého výěru z dvourozměrého ormálího rozložeí ayl hodoty -,94 Pokud ychom modeloval závlot velčy Y a

velčě X omocí regreí římky, akou čát varalty hodot velčy Y y evyvětlovala regreí římka? a) 88,36% ),64% c) 6% Srávé odověd: a), c), 3), 4a), 5), 6) Příklady U om áhodě vyraých frem okytuících odoré kozultace v olat akot výroy yly v roce 8 zštěy očty zamětaců (áhodá velča X) a ročí oraty (áhodá velča Y, v mlóech Kč), ak e uvedeo v taulce: Čílo frmy 3 4 5 6 7 8 X 3 5 5 8 9 5 Y,8,,5,9,8,4,5 3, Předokládáme, že závlot ročího oratu a očtu zamětaců lze oat regreí římkou K dozc ou čátečé výtuy regreí aalýzy ze ytému STATISTICA: N8 Ačle X Beta Smchya eta B Smchya B,367,47,984798,794,834,336 Efekt Regre Rezd Celk Součet čtverců v Průměr čtverců F Úroveň 3,874 3,874 9,857,9,876 6,973 3,9 a) Našte rovc regreí římky vyadřuící závlot Y a X Iterretute úek a měrc regreí římky ) Naděte 95% tervaly olehlvot ro arametry regreí římky a ech omocí tetute a hladě výzamot hyotézy o evýzamot úeku a měrce regreí římky c) Vyočtěte dex determace a terretute ho Výledek: ad a) y,367 +,834x Pokud frma eude mít žádé zamětace (tz, že racuí ouze matelé), ude ročí orat a 36 Kč Pokud e zvýší očet zamětaců o edoho, vzrote ročí orat a o 8 Kč ad ) 95% terval olehlvot ro β : t 6,367,4469,47 d,975 h + t,975 ( ), 64 ( 6),367+,4469,47, 65833 Zameá to, že,64 < β <,6533 ravděodootí aoň,95

Protože teto terval eoahue čílo, a hladě výzamot,5 zamítáme hyotézu o evýzamot úeku regreí římky 95% terval olehlvot ro β : t 6,834,7764,336, d,975 h + t,975 ( ) 4937 ( 6),834+,7764,336, 93 Zameá to, že,4937 < β <,93 ravděodootí aoň,95 Protože teto terval eoahue čílo, a hladě výzamot,5 zamítáme hyotézu o evýzamot měrce regreí římky (Teto terval olehlvot ám vlatě udává, že ř zvýšeí očtu zamětaců o edoho e řírůtek ročího oratu frmy ude ravděodootí aoň,95 ohyovat v tervalu 49 Kč až 3 Kč) SR 3,874 ad c) ID, 9698 ST 3,9 Zameá to, že varalta ročího oratu e z téměř 97 % vyvětlea regreí římkou V modelu regreí římky e dex determace rove,8 a rezduálí roztyl e Jaký e roztyl hodot závle roměé velčy? Výledek: 5 3 Určtý lék e řeravová v amulkách, které ou aley o kuech v edom kartou U áhodě vyraých kartoů ylo zštěo, kolkrát yl karto řekládá (velča X) a očet oškozeých amulek ř řevzetí zálky (velča Y) X 3 Y 6 9 7 3 8 5 9 Na základě těchto údaů, které ovažueme za realzace áhodého výěru z dvourozměrého ormálího rozložeí, yly vyočtey arametry regreí římky, která vythue závlot očtu oškozeých amulek a očtu řekládáí:,, 4 Směrodaté chyy odhadů regreích arametrů ou:,66335,, 4694 Na hladě výzamot,5 tetute hyotézy o evýzamot arametrů β a β V oou říadech vyočtěte hodotu tetové tattky, aděte krtcký oor a ašte rozhodutí o ulové hyotéze Výledek: Na hladě výzamot α,5 tetueme H : β rot H : β, Tetová tattka: t 5, 377,,66335 krtcký oor:, t ( α / ( ) t α / ( ), ) (, t,975( 8) t, ( 8), ) (,,36,36, ) W 975 Protože e tetová tattka realzue v krtckém ooru, hyotézu o evýzamot regreího arametru β (t ouutí regreí římky) zamítáme a hladě výzamot,5 Na hladě výzamot α,5 tetueme H : β rot H : β 4 Tetová tattka: t 8, 58,,4694

krtcký oor:, t ( α / ( ) t α / ( ), ) (, t,975( 8) t, ( 8), ) (,,36,36, ) W 975 Protože e tetová tattka realzue v krtckém ooru, hyotézu o evýzamot regreího arametru β (t měrce regreí římky) zamítáme a hladě výzamot,5