KVALITA REGRESNÍHO MODELU Radek Fajfr

Podobné dokumenty
Metody zkoumání závislosti numerických proměnných

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i

, jsou naměřené a vypočtené hodnoty závisle

Generování dvojrozměrných rozdělení pomocí copulí

9. Měření závislostí ve statistice Pevná a volná závislost

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

3. Hodnocení přesnosti měření a vytyčování. Odchylky a tolerance ve výstavbě.

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

Spolehlivost a diagnostika

Úvod do korelační a regresní analýzy

Nejistoty měření. Aritmetický průměr. Odhad směrodatné odchylky výběrového průměru = nejistota typu A

Testování statistických hypotéz

a další charakteristikou je četnost výběrového souboru n.

Regrese. Aproximace metodou nejmenších čtverců ( ) 1 ( ) v n. v i. v 1. v 2. y i. y n. y 1 y 2. x 1 x 2 x i. x n

PRAVDĚPODOBNOST A STATISTIKA

Lineární regrese ( ) 2

8 NELINEÁRNÍ REGRESNÍ MODELY

Mendelova univerzita v Brně Statistika projekt

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

5.5. KOMPLEXNÍ ODMOCNINA A ŘEŠENÍ KVADRATICKÝCH A BINOMICKÝCH ROVNIC

Regresní a korelační analýza

Ilustrativní příklad ke zkoušce z B_PS_A léto 2013.

Chyby přímých měření. Úvod

Odhady parametrů 1. Odhady parametrů

P1: Úvod do experimentálních metod

4.2 Elementární statistické zpracování Rozdělení četností

Přednáška č. 10 Analýza rozptylu při jednoduchém třídění

Metody statistické analýzy. doc. Ing. Dagmar Blatná, CSc.

Pravděpodobnostní modely

Úvod do teorie měření

1.1 Rozdělení pravděpodobnosti dvousložkového náhodného vektoru

PRAVDĚPODOBNOST A STATISTIKA

1 Měření závislosti statistických znaků. 1.1 Dvourozměrný statistický soubor

VY_52_INOVACE_J 05 01

14. Korelace Teoretické základy korelace Způsoby měření závislostí pro různé typy dat

11. Časové řady Pojem a klasifikace časových řad

Optimalizace portfolia

[ jednotky ] Chyby měření

Přednáška č. 2 náhodné veličiny

veličiny má stejný řád jako je řád poslední číslice nejistoty. Nejistotu píšeme obvykle jenom jednou

Přednáška V. Úvod do teorie odhadu. Pojmy a principy teorie odhadu Nestranné odhady Metoda maximální věrohodnosti Průměr vs.

Deskriptivní statistika 1

Univerzita Karlova v Praze Pedagogická fakulta

MATICOVÉ HRY MATICOVÝCH HER

Interpolační křivky. Interpolace pomocí spline křivky. f 1. f 2. f n. x... x 2

11. Popisná statistika

12. N á h o d n ý v ý b ě r

1. Základy měření neelektrických veličin

PRAVDĚPODOBNOST A STATISTIKA

Chyby měření: 1. hrubé chyby - nepozornost, omyl, únava pozorovatele... - významně převyšuje rozptyl náhodné chyby 2. systematické chyby - chybné

PRAVDĚPODOBNOST A STATISTIKA

Test dobré shody se používá nejčastěji pro ověřování těchto hypotéz:

8. Zákony velkých čísel

Měření závislostí. Statistická závislost číselných znaků

Náhodné jevy, jevové pole, pravděpodobnost

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

Model poptávky po železniční osobní dopravě Českých drah, a. s. na tuzemském přepravním trhu

Statistika - vícerozměrné metody

Vzorový příklad na rozhodování BPH_ZMAN

12. Neparametrické hypotézy

U. Jestliže lineární zobrazení Df x n n

PRAVDĚPODOBNOST A STATISTIKA

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA STAVEBNÍ KATEDRA SPECIÁLNÍ GEODÉZIE DIPLOMOVÁ PRÁCE

8. Analýza rozptylu.

T e c h n i c k á z p r á v a. Pokyn pro vyhodnocení nejistoty měření výsledků kvantitativních zkoušek. Technická zpráva č.

APLIKOVANÁ STATISTIKA

14. Testování statistických hypotéz Úvod statistické hypotézy Definice 14.1 Statistickou hypotézou parametrickou neparametrickou. nulovou testovanou

6. Posloupnosti a jejich limity, řady

TECHNICKÁ UNIVERZITA V LIBERCI

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

Spojitost a limita funkcí jedné reálné proměnné

Matematika I, část II

VYSOCE PŘESNÉ METODY OBRÁBĚNÍ

1.1 Definice a základní pojmy

Univerzita Karlova v Praze Pedagogická fakulta

PODNIKOVÁ EKONOMIKA 3. Cena cenných papírů

Výsledky této ásti regresní analýzy jsou asto na výstupu z poítae prezentovány ve form tabulky analýzy rozptylu.

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

} kvantitativní znaky

Jednoduchá lineární regrese

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

Doc. Ing. Dagmar Blatná, CSc.

METHOD OF THE URBAN MASS TRANSPORTATION QUALITY EVALUATION

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 2

Náhodu bychom mohli definovat jako součet velkého počtu drobných nepoznaných vlivů.

SOUKROMÁ VYSOKÁ ŠKOLA EKONOMICKÁ ZNOJMO. Statistika I. distanční studijní opora. Milan Křápek

jsou varianty znaku) b) při intervalovém třídění (hodnoty x

P2: Statistické zpracování dat

Pravděpodobnost a aplikovaná statistika

2. Vícekriteriální a cílové programování

Náhodný výběr 1. Náhodný výběr

STUDIUM MAXWELLOVA ZÁKONA ROZDĚLENÍ RYCHLSOTÍ MOLEKUL POMOCÍ DERIVE 6

základním prvkem teorie křivek v počítačové grafice křivky polynomiální n

UNIVERZITA JANA EVANGELISTY PURKYNĚ V ÚSTÍ NAD LABEM PEDAGOGICKÁ FAKULTA Katedra tělesné výchovy

UČEBNÍ TEXTY OSTRAVSKÉ UNIVERZITY. Přírodovědecká fakulta ANALÝZA DAT. 2. upravené vydání. Josef Tvrdík

1 Popis statistických dat. 1.1 Popis nominálních a ordinálních znaků

S1P Popisná statistika. Popisná statistika. Libor Žák

Transkript:

UNIVERZITA PARDUBICE FAKULTA EKONOMICKO-SPRÁVNÍ KVALITA REGRESNÍHO MODELU Radek Fajfr Bakalářská práce 00

Prohlášeí Tuto prác jsem vypracoval samostatě. Veškeré lterárí pramey a formace, které jsem v prác využl, jsou uvedey v sezamu použté lteratury. Byl jsem sezáme s tím, že se a moj prác vztahují práva a povost vyplývající ze zákoa č. /000 Sb., autorský záko, zejméa se skutečostí, že Uverzta Pardubce má právo a uzavřeí lcečí smlouvy o užtí této práce jako školího díla podle 60 odst. autorského zákoa, a s tím, že pokud dojde k užtí této práce mou ebo bude poskytuta lcece o užtí jému subjektu, je Uverzta Pardubce oprávěa ode me požadovat přměřeý příspěvek a úhradu ákladů, které a vytvořeí díla vyaložla, a to podle okolostí až do jejch skutečé výše. Souhlasím s prezečím zpřístupěím své práce v Uverztí khově. V Pardubcích de.4.00 Fajfr Radek

ANOTACE Bakalářská práce je vypracováa a téma Kvalta regresího modelu. Cílem je vymezeí základích pojmů regresí aalýzy a využtí těchto zalostí př praktckém řešeí příkladů. V praktcké část jsou příklady řešeé metodam regresí aalýzy a ásleduje vytvořeí regresích fukcí. Dále ásleduje výběr optmálího regresího modelu spolu se zdůvoděím tohoto výběru. KLÍČOVÁ SLOVA Regresí aalýza, Náhodá velča, Metoda ejmeších čtverců, Idex determace, Idex korelace, Rezdua, Výzamost F. TITLE Qualty of Regresso Model ANOTATION Ths bachelor work s created for the topc Qualty of Regresso Model. The am of ths work s to expla of basc expressos related to regresso aalyss ad applcato of ths kowledge practcular solutos. I practcal part of the bachelor work there are examples solved by methods of regresso aalyss ad the are regresso fuctos created. The followg topc s the choce of the optmal regresso model together wth the explaato of ths choce. KEYWORDS Regresso aalyss, Radom varable, Method of the least squares, Idex determato, Idex corelato, Resdua, Meag F.

Poděkováí Zde bych rád poděkoval Mgr. Haě Boháčové a Mgr. Pavle Jdrové za ochotu a odboré vedeí, ceé rady a áměty během tvorby práce. Dále bych rád poděkoval celé své rodě, zejméa otc Fatšku Fajfrov a bratrov Martov Fajfrov za projeveou podporu.

OBSAH: Úvod... 9 Pojmy regresí aalýzy... 0. Pevá a volá závslost... 0. Fukčí závslost... 0.3 Statstcká závslost (stochastcká)... Regresí fukce.... Jedoduchý model leárí regrese.... Modely leárí vzhledem k parametrům... 3.. Přímková regrese... 3.. Parabolcká regrese... 5..3 Polyomcká regrese... 6..4 Hyperbolcká regrese... 7..5 Logartmcká regrese... 7.3 Modely eleárí vzhledem k parametrům... 8.3. Expoecálí regrese... 8.4 Modely obtížě learzovatelé vzhledem k parametrům... 9 3 Metoda ejmeších čtverců... 0 4 Volba regresí fukce... 4 4. Věcě ekoomcká krtéra... 4 4. Emprcký způsob volby... 4 5 Kvalta regresí fukce a tezta závslost... 5 5. Rozptyly emprckých, vyrovaých a skutečých hodot... 5 5. Idex determace... 6 5.3 Idex korelace... 6 5.4 Aalýza rezduí... 7 6 Cíl regresí aalýzy... 7 7 Příklad... 8 7. Zadáí... 8 7. Aalýza regresí přímky... 9 7.3 Aalýza regresí paraboly... 3 7.4 Aalýza regresího polyomu 3. stupě... 33

7.5 Aalýza regresí hyperboly... 34 7.6 Aalýza regresí expoecály... 35 7.7 Aalýza regresího dekadckého logartmu... 36 7.8 Aalýza regresího přrozeého logartmu... 38 7.9 Hodotící tabulka... 38 7.0 Výběr optmálího regresího modelu... 39 8 Příklad... 40 8. Zadáí... 40 8. Aalýza regresí přímky... 4 8.3 Aalýza regresí paraboly... 4 8.4 Aalýza regresího polyomu 3. stupě... 43 8.5 Aalýza regresí hyperboly... 44 8.6 Aalýza regresí expoecály... 45 8.7 Aalýza regresího dekadckého logartmu... 47 8.8 Aalýza regresího přrozeého logartmu... 48 8.9 Hodotící tabulka... 49 8.0 Výběr optmálího regresího modelu... 49 Závěr... 5 Použtá lteratura... 53 Sezam zkratek... 55 Sezam obrázků... 56 Sezam tabulek... 57 Sezam příloh... 58

Úvod Úvodem lze říc, že regresí aalýza s klade za cíl vkout do podstaty sledovaého jevu a procesů určté oblast. Tím se saží přblížt příčým souvslostem. Příčou souvslostí je stuace, kdy exstece určtého jevu souvsí s exstecí jého jevu. Důvodem, proč jsem s vybral toto téma je skutečost, že s regresí se setkáváme v moha stuacích reálého světa právě v podobě vztahu příčy a ásledku. Například ekoomcká krze vyvolává árůst ezaměstaost, což je typcká ukázka vztahu příčy a ásledku. Dalším důvodem, proč jsem s daé téma zvoll byl fakt, že tato matematcká metoda je velm důležtá eje pro statstku jako vědí obor, ale pro já odvětví a tato uverzálost mě rověž zaujala. Jedím z hlavích cílů této práce je výběr optmálího regresího modelu pro vybraá data. Dříve ež však můžeme vytvořt, aalyzovat jedotlvé regresí modely a akoec vybrat optmálí regresí model, je potřeba sezámt se s teorí tohoto problému. Proto práce zahruje odděleou teoretckou část, kde jsou vysvětley jedotlvé pojmy regresí aalýzy hlaví matematcké vztahy s tímto problémem souvsející. Všechy popsaé vztahy a defce jsou zpracovaé pomocí relevatí matematcké lteratury uvedeé v použtých zdrojích. Teoretcká část obsahuje a vysvětluje základí pojmy leárí regrese (apř. volá, pevá závslost) a také popsuje základí regresí modely, které jsou používáy př řešeí příkladů. Dále teoretcká část mmo jé popsuje používaou metodu ejmeších čtverců a defuje základí parametry (apř. dex determace), podle kterých se vybírá optmálí regresí model v řešeých příkladech. V další část práce se pak v souladu se zadáím zaměřuj a samoté řešeí vybraých příkladů. Zpracoval jsem dva odlšé příklady, ale průběh aalýzy je v obou případech stejý. Nejprve je pomocí ástroje MS Excel vždy vytvoře regresí model. Dále se zhodotí proložeí regrese daty jedak vzuálě z vytvořeého grafu, ale hlavě podle ukazatelů kvalty regresího modelu. V ěkterých případech je provedea předběžá predkce porováím vstupích závslých proměých y a očekávaých Y vytvořeých aalýzou. Na závěr každého z příkladů je vytvořea hodotící tabulka, která obsahuje všechy vytvořeé modely s jejch parametry. Vzájemým porováím parametrů se vybere ejoptmálější model. 9

Pojmy regresí aalýzy. Pevá a volá závslost Je vhodé rozlšt tzv. pevé a volé závslost. Závslostí pevou je případ, kdy výskytu jedoho jevu utě odpovídá výskyt druhého jevu. Pro pevou závslost je charakterstcké to, že se opakuje ve všech jedotlvých případech, v chž je pozorováa. To zameá, že j charakterzuje jedé pozorováí []. Zámým příkladem, který mohu uvést je proslulé Descartovo Myslím, tedy jsem. Jde o vztah, který se projeví s jstotou, tedy pravděpodobostí rové jedé. Průběh závslost lze přesě charakterzovat matematckou fukcí. O závslost volé hovoříme v těch případech, kdy výskyt jedoho jevu ovlvňuje výskyt druhého jevu. Podmíkou je astoupeí prvího jevu. Je to tedy závslost, př íž jede jev podmňuje jev jý je s určtou pravděpodobostí a v růzé teztě. Jsou-l tedy jevy spojey volě, eříká ám jedé pozorováí o jejch závslost vůbec c. Takto pozorovaá závslost může být ahodlá []. Př rozšířeí těchto úvah a statstcké zaky, které bude vhodější azývat proměým, zameá pevá závslost vztah, kdy hodotě jedé proměé odpovídá jeda a je jeda hodota jých proměých a podobě aopak. Jedá se o pevou závslost, protože je v podstatě kauzálí (když astae jeda událost, tak s pravděpodobostí astae další určtá událost). Volou závslostí pak dle Hdlse rozumíme vztah, kdy hodotám (apř. jedé proměé) odpovídají sce růzé hodoty jé proměé, ale kdy lze hovořt o jakés obecé tedec, která se projevuje př změách hodot těchto proměých. Z toho tedy plye, že hodoty se měí plyule s určtou pravděpodobostí v závslost a proměých. Ozačme jede statstcký zak (jedu proměou) jako x, druhý statstcký zak jako y. Pak můžeme př volé závslost mez x a y očekávat změy hodot y př změách hodot x a aopak tedec změ hodot x př změách hodot y [5].. Fukčí závslost Pokud hodota jedé proměé závsí a hodotách druhé proměé, pak říkáme, že je tato závslost určea fukčím vztahem y = f(x). Pokud tedy záme kokrétí hodoty x, pak dokážeme přesě určt, jaké hodoty abude proměá y. Kdekolv je takový pevý, čl fukčí stav mez kvattatvím statstckým zaky, říkáme, že závslost je úplá []. V praktckých úlohách eí stuace zdaleka tak jedozačá. Na sledovaou velču 0

epůsobí obvykle pouze jeda áhodá velča X, ale většou je jch více. V takovémto případě eí mez velčam X a Y fukčí závslost, ale přesto se jedá o velčy závslé. Nemluvíme pak o závslost fukčí, ale stochastcké..3 Statstcká závslost (stochastcká) Defce [7]: Nechť X, Y jsou dvě áhodé velčy. Jestlže změa hodoty jedé áhodé velčy vyvolá změu rozděleí pravděpodobost druhé áhodé velčy, říkáme, že áhodé velčy X, Y jsou stochastcky závslé. Proměou y považujeme za stochastcky závslou a proměé x tehdy, jestlže se př změách proměé x, měí podmíěá rozděleí četostí proměé y[5]. Zaky stochastcké závslost [7]: a) Změy závslé proměé jsou vysvětley pouze ěkterým (e všem) čtel těchto změ, b) bere se v úvahu působeí áhodých vlvů, c) přpouštíme možost chyb. Příkladem může být počet čleů domácost a výdaje domácost a ákup potrav. Je možé tvrdt, že určtému počtu čleů domácost odpovídá určté rozděleí výdajů a potravy. Výdaje a potravy jsou ovlvěy růzým ekotrolovatelým vlvy, které azýváme áhodým vlvy (oslava jublea, ávštěva, emoc, deta..) Závslostí statstckou azýváme volou závslostí (defováo v podkaptole.), která se týká kvattatvích zaků. Se závslostm pevým se většou setkáváme v teoretcké oblast. Takovým způsobem byl zformulová Newtoův gravtačí záko ebo Ohmův fyzkálí záko a z oblast ekoomcké je možé sem zařadt růzé teoretcké zákoy. Jedá se apříklad o závslost možství peěz v ekoomce a úrocích. V reálých stuacích se setkáváme většou pouze s volým závslostm. Za obecým tedecem, projevujícím se v souboru statstckých údajů se mohou ukrývat hlubší zákotost vztahů mez velčam. K pozáí a matematckému popsu statstckých závslostí slouží metody regresí aalýzy.

Regresí fukce Defce [7]: Nechť exstují X a Y, které jsou áhodým velčam. Podmíěou středí hodotu E(Y x), považovaou za fukc proměé x, budeme azývat regresí fukcí áhodé velčy Y vzhledem k X. Regresí fukce vyjadřuje změy podmíěé středí hodoty jedé áhodé velčy př změě hodot druhé áhodé velčy. Graf regresí fukce azýváme regresí křvka. Jak jž bylo apsáo výše, pomocí regresí fukce můžeme předpovídat, jaké hodoty abude jeda áhodá velča, když záme hodotu druhé áhodé velčy. Protože Y je áhodá velča, emusí vždy př daé hodotě x áhodé velčy X abýt hodoty E(Y x), ale bude abývat hodoty rozptýleé okolo í, což vyplývá z vlastostí áhodých velč. Hlavím úkolem regresí aalýzy je zjštěí tvaru stochastcké závslost a parametrů regresí fukce. V regresí aalýze se budeme zabývat závslostí áhodé velčy Y a velčě X (ezávsle proměé), která může být obecě m rozměrá. [7].. Jedoduchý model leárí regrese Jedoduchý model leárí regrese je takovým regresím modelem, kdy grafem regresí fukce je přímka. Pro větší srozumtelost u parametrů β 0 a β použjeme ozačeí α a β. Předpokládejme, že Y je -tce ekorelovaých (ezávslých) áhodých velč s vlastostm středí hodoty EY = α + β x, ezámé parametry a x, x,, x DY = σ, =,,..,, kde α, β, σ jsou je -tce zámých hodot. Pak jedoduchým modelem leárí regrese budeme azývat model Y = α + β x + ε, kde složky ε jsou ezávslé áhodé velčy, pro které platí Eε = 0, působeí áhodých vlvů, které ejsou zahruty do modelu [7]. Dε = σ, =,,..,. Tyto složky obsahují Přímka y = α + β x se azývá regresí přímka. β je její směrce, která udává sklo regresí přímky. Pokud je směrce kladá, je regresí přímka rostoucí, v opačém případě je klesající. α je kostata matematckého modelu, která ám určuje, v jaké vzdáleost od počátku přímka vede, přčemž může být záporá. Abychom dostal platý regresí model, musíme odhadout ezámé parametry α, β, σ modelu. Tyto odhady budeme po řadě

začt A, B, S. Bodové odhady parametrů α, β získáme metodou ejmeších čtverců, která je popsáa podrobě v kaptole 3.. Modely leárí vzhledem k parametrům Modely leárím vzhledem k parametrům rozumíme modely, kde je závslost k popsáa regresí fukcí g( x, β0, β, β,..., β ) = β g ( x), kde g jsou fukce proměých x x x x m k 0 = (,,..., ). Ukázky leárích modelů jsou uvedey v ásledujících rovcích [7]: Přímková regrese g( x, β0, β) = β0 + βx. (.0) Parabolcká regrese g( x, β, β, β ) β β x β x 0 = 0 + +. (.) Hyperbolcká regrese g( x, β0, β) = β0 + β. x (.) Logartmcká regrese g( x, β0, β) = β0 + β log x. (.3) Regresí rova g( x, β0, β, β) = β0 + βx + βx. (.4).. Přímková regrese y β Nejpoužívaějším typem regresí fukce je přímková regrese uvedeá ve tvaru β = 0 + x. Staovíme odhady parametrů 0 metodu ejmeších čtverců, formulovaou podmíkou β a β. K odhadům parametrů používáme ( y ɵy ) chyb mmálí. Dosadíme-l do této podmíky rovc regresí, dostaeme:, aby byl součet čtverců ε ( y ) β0 βx Q = =. (.5) Součet čtverců Q je fukcí ezámých parametrů. Pro určeí mma je uté vypočítat prví parcálí dervac podle β j, kde j=0,. V dalším kroku tyto dervace potom Podkaptoly upravey ze zdroje Hdls, R., Hroová, S., Seger, J. Statstka pro ekoomy. 3

položt rovy ule. Parametry β j ahradíme jejch odhady b j, j=0,. Zdůrazňuj, že parcálí dervace jsou v tomto případě podle odhadů b 0 v případě prví rovce a b v případě druhé rovce (.6). Ostatí čley jsou kostaty. ( y b0 b x ) =, (.6) ( ) 0 ( y b0 b x ) x =. ( ) 0 Po ásledém počítáí se sumam a po úpravě dostaeme dvě ormálí rovce: y = b0 + b x, (.7) yx = b0 x + b x. Velčy, x, y, x a y x můžeme vypočítat z emprckých pozorováí. Proto je uté určt pouze odhady parametrů β 0 a β řešeím soustavy rovc (.7). Pro výpočet odhadů b 0 a b použjeme Cramerovo pravdlo, které se používá pro řešeí soustavy leárích algebrackých rovc. Použtím Cramerova pravdla dostáváme : b 0 yx x y x = = x x x y x x yx x x, (.8) 4

x yx b = = x y x x y x x y x x... Parabolcká regrese Parabolcká regrese má tvar y x x = β0 + β + β. Pokud tuto rovc opět dosadíme do podmíky ejmeších čtverců ɵ ( y y ) a budeme aplkovat postup použtý u přímkové regrese, dostaeme formulac zázorěou vztahem (.9). ( ) ε β0 β β. (.9) Q = = y x x Po výpočtu prvích parcálích dervací výrazu podle β 0, β a β ahradíme obecě jejch odhady b j, j=0,, a pak parcálí dervace položíme rovy ule. Bude tedy platt: β j ( y b0 b x b x )( ) = 0, (.0) ( y b0 b x b x )( x ) = 0, ( y b0 b x b x )( x ) = 0. Po úpravě máme tř ormálí rovce, jejchž řešeím získáme odhady parametrů β 0, β a β. Rovce mají tvar: y = b0 + b x + b x, (.) 5

3 yx = b0 x + b x + b x, 3 4 yx = b0 x + b x + b x. Odhady b 0, b, b parametrů β 0, β a β získáme vyřešeím soustavy rovc (. )...3 Polyomcká regrese Zobecěím předcházejících typů regresích fukcí je polyomcká regrese ve tvaru y x x x p = β0 + β + β +... + β p. Postupujeme jako u paraboly a dostaeme: p ( y b0 b x bpx )( )... = 0, (.) p ( y b0 b x bpx )( x )... = 0,.. p p ( y b0 b x bpx )( x )... = 0. Po úpravě dostaeme soustavu rovc, které mají ásledující tvar: p y = b0 + b x +... + bp x, (.3) p yx = b0 x + b x +... + bp x +, p p p p yx = b0 x + b x + +... + bp x. 6

V prax se setkáváme ejvýše s polyomy 3. až 4. stupě. I v tomto případě dostaeme odhady parametrů β0, β,..., β p vyřešeím předchozí soustavy rovc (.3)...4 Hyperbolcká regrese β Hyperbolcká regrese má tvar y = β0 +. Př použtí stejého postupu, sloužícího x k odhadu parametrů jako v předcházejících případech, získáme metodou ejmeších čtverců soustavu ormálích rovc. y = b + b, (.4) 0 x y = b + b x 0 x x. Řešeím těchto rovc dostaeme odhady parametrů: b y x x x 0 = x x y, (.5) y y x x = b x x...5 Logartmcká regrese Posledí z fukcí leárích v parametrech, o které se chc stručě zmít pro její použtelost je fukce y = β β log x 0 +. Metodou ejmeších čtverců dostaeme ormálí rovce: y = b + b log x, (.6) 0 7

y log x = b0 log x + b log x..3 Modely eleárí vzhledem k parametrům Tyto modely je možé vhodou trasformací upravt a leárí tvar vzhledem k parametrům. Odhady parametrů modelů leárích a modelů, které je možo trasformovat a leárí tvar se provádějí ejčastěj metodou ejmeších čtverců [6], která bude popsáa v kaptole 3. Ukázky eleárích modelů jsou uvedey v ásledujících rovcích [7]: Regresí mocá fukce g( x, β, β ) = β x β. (.7) 0 0 x Regresí expoecálí fukce g( x, β0, β) = β0 β. (.8).3. Expoecálí regrese Parametry fukcí, které ejsou leárí eodhadujeme metodou ejmeších čtverců přímo, protože její použtí vede k soustavě eleárích rovc. Proto ajdeme jejch vhodý počátečí odhad a postupým zlepšováím řešeí alezeme odhad s požadovaou přesostí. Metod počátečího odhadu je celá řada. Jejch umercké řešeí však bývá ěkdy zdlouhavé a ásledé alezeí vhodého počátečího odhadu emusí být jedozačé. Ukážeme s jedoduchý způsob, kdy určtou regresí fukc, která eí leárí z hledska parametrů, můžeme pomocí learzující trasformace a fukc leárí v parametrech převést. Trasformace spočívá v tom, že pomocí logartmů, převráceím hodot a dalším úpravam dojdeme k takovému tvaru regresí fukce, že její parametry bude už možé x odhadout metodou ejmeších čtverců. Expoecálí fukce má tvar y = β0 β Provedeme logartmckou trasformac: log y = log β + x log β (.9) 0 Po learzac (.9) jž můžeme postupovat stejě jako v případě leárí regrese s tím rozdílem, že podmíka metody ejmeších čtverců bude v logartmckém tvaru (.0,.): Upraveo ze zdroje Hdls, R., Hroová, S., Seger, J. Statstka pro ekoomy. 8

, (.0) ( ) log log ˆ Q = y y 0. (.) ( ) log log β log β Q = y x Stejým způsobem dostaeme ormálí rovce: log y = log b + log b x, (.) 0 x log y = log b0 x + log b x. Jejch řešeím dostaeme: log b log y x - x log y 0 = x - x, (.3) log b x log y log y x = x x. log 0 Odhady parametrů β0 a β jsou potom 0 b log b 0 = a 0 b b =..4 Modely obtížě learzovatelé vzhledem k parametrům Tyto eleárí modely se edají jedoduše trasformovat a leárí tvar g( x, β, β β ) = β β + β (.4) x 0, 0 Neí proto vhodé použít metodu ejmeších čtverců pro odhady parametrů. Používáme jé metody, apř. metodou částečých součtů, metodou dílčích průměrů, ebo metodou vybraých bodů [7]. 9

3 Metoda ejmeších čtverců Až dosud jsme se zabýval odhadem ezámých parametrů pro průběh leárí regrese, až bychom s o metodě odhadu těchto parametrů řekl ěco podrobějšího. Proto je potřeba s říc o prcpech této metody více. Parametry emprckých regresích fukcí se ejčastěj určují metodou ejmeších čtverců. Metodu ejmeších čtverců lze použít ke staoveí parametrů jých fukcí, ež je přímka. Tato metoda je použtelá ke staoveí parametrů všech fukcí, jež jsme azval leárí regresí fukce [3]. Předpokládejme, že máme kokrétí dvojce aměřeých hodot ( x, y),( x, y),...,( x, y ). Hledáme takovou fukc (odhad) ɵ y = a + bx, aby v jstém smyslu co ejvíce přléhala k bodům ( x, y),( x, y),...,( x, y ), kde přléháí měříme součtem rozdílů ɵ y y (tzv. rezduí). Jde tedy v podstatě o to, že chceme odhadout reálé souřadcové body, aby rozdíly mez skutečým hodotam a těm odhadutým byly co ejmeší. Aby se ovšem estalo, že př začých odchylkách mez ɵ y a y se kladé a záporé rozdíly avzájem odečtou, vezmeme jako míru přléháí e prostý součet rezduí, ale součet jejch čtverců [7]. Můžeme tedy říc, že dvojce ( x, y),( x, y),...,( x, y) jsou počátečí aměřeá vstupí data, která budou pomocí ejmeších čtverců proložea apříklad regresí přímkou ɵ y = a + bx. Nám jde o to, aby rozdíl mez prokládaým skutečým daty a jejch odhadem daým regresí fukcí byl co možá ejmeší. Teto vztah vyjadřuje vzorec (3.0) [7]. ɵ ( y y ) = m. (3.0) Na ásledujícím obrázku (Obrázek ) je metoda zachycea grafcky. Stručě jej lze popsat tak, že dvojce (x, y ) je -tá hodota skutečě aměřeých bodů. Body regresí přímky ɵ y = a + bx jsou odhadem skutečých hodot. Čím meší jsou čtverce vzdáleostí (vztah 3.0), tím lepší je odhad a proložeí regresí fukce. 0

Obrázek : Metoda ejmeších čtverců [3] Budeme tedy v jedoduchém leárím modelu hledat mmum fukce, kde A, B jsou odhady kostaty a a směrce b daé přímky, Y je áhodou velčou. Následující matematcké vztahy jsou převzaty ze zdroje [7]. S( A, B) = ( Y Y ) = ( Y A Bx ), (3.) Hledáme parcálí dervac (směrovou dle jedé a ásledě druhé proměé) prvího řádu: S = A ( Y A Bx ) ; S = B ( Y A Bx ) x, Vypočítáme extrém fukce dvou proměých. Nutou podmíkou je ulovost obou parcálích dervací prvího řádu: ( Y A Bx ) = 0 ; ( Y A Bx) x = 0. Po úpravě (jedá se o algebracké úpravy se sumam) dostaeme soustavu ormálích rovc: A + B x = Y, (3.)

A x + B x = xy. Z rovc (3.) vypočteme odhady A, B: x Y x Y B = x ( x ) ; A = x Y x xy x ( x ). (3.3) K ověřeí, že fukce S (3.) abývá mma musíme určt parcálí dervace druhého řádu: S A = ; S = x ; A B S B = x. Výsledkem výrazu S S S A B A B dostaeme: 4 x 4 x = 4 x x + x = 4 = ( ) x x 4 ( ) x x > 0. Podle věty z dferecálího počtu víme, že pokud výraz S S S A B A B abývá kladé hodoty a také parcálí dervace S = A (což platí), má fukce S ostré lokálí mmum. a S = B x abývají kladých hodot Regresí přímka, získaá takto metodou ejmeších čtverců, má tvar ɵ y = A + Bx. Uvedeou rovc lze upravt a tvar Y = Y + B ( x x )[7].

Dále dokážeme, že odhady A, B parametrů α, β jsou evychýleé. Pro toto tvrzeí musí platt EB = β a EA = α. Nejprve upravíme tvar odhadu parametru β (vzorec 3.3): x Y x Y B = = x ( x ) x Y x Y x x = x Y xy + x x x x = ( x x) Y ( x x) = Y. x x ( x ) x Nyí ověřujeme EB = β x x EB = E Y ( ) = EY x x ( x x ) ( x x ) x x x x = ( α + β x ) = α = ( x x) ( x x) + β ( x ) x x ( x x) = β protože ( x x) = 0 ; ( x x) x = ( x ) x. Dále ověříme EA = α Y B x EA = E = EY xeb = ( α β x ) β x + = α = α. Dokázal jsme, že odhady A, B parametrů α, β pomocí metody ejmeších čtverců jsou evychýleé. Fukce Y = A + Bx je tedy evychýleým odhadem regresí přímky y = α + β x [7]. 3

4 Volba regresí fukce 4. Věcě ekoomcká krtéra Vhodá regresí fukce by měla být zvolea a základě věcého rozboru vztahů mez velčam. Základem pro rozhodováí o vhodém typu regresí fukce by měla být věcá krtéra. Př věcé aalýze založeé a platé teor lze v ěkterých případech posoudt, zda jde o fukc rostoucí č klesající, jaký je smysl zakřveí, přchází-l v úvahu flexí bod č kolv. Zda jde o fukc ekoečě rostoucí ebo aopak o fukc s růstem ke koečé lmtě. K tomu ám samozřejmě může dobře posloužt vyšetřeí průběhu fukce dle obecých postupů. Lze získat předběžé formace o parametrech modelu apod. Jdy lze použít př volbě regresí fukce zkušeost získaé s použtím určtého typu regresí fukce jž v mulost. Jde-l o závslost, která byla jž jedou popsáa, stačí ověřt, zda edošlo k takové změě podmíek ebo zkoumaého jevu, který by měl vlv a výběr regresí fukce [5]. Toto všecho jsou postupy ozačovaé v odboré lteratuře jako věcě ekoomcké ástroje, které ám mohou usadt rozmýšleí, který regresí model prokládá daou závslost mez proměým ejlépe. 4. Emprcký způsob volby Nestaovíme-l vhodý typ regresí fukce a základě ekoomckých krtérí, uchylujeme se k emprckému způsobu volby. Základí metodou je metoda grafcká, kdy průběh závslost zázorňujeme ve formě bodového dagramu. Každá dvojce x a y zde tvoří jede bod tohoto grafu. Podle průběhu proložeí bodového grafu rozhodujeme, jaký typ kokrétí regresí fukce (přímka, parabola...) je pro pops sledovaé závslost ejvhodější. K tomu, abychom zhodotl kvaltu získaé regresí fukce a evetuálě posoudl oprávěost ěkterých předpokladů, které souvsejí s uplatěím požadovaých metod odhadu používáme růzá matematcko statstcká krtéra [6]. Ekoomcká matematcko-statstcká krtéra mají své výhody evýhody. Podle zastáců ekoomckých krtérí dobrý ekoomcký rozbor stuace umožňuje alézt vhodý typ fukce. Zastác používáí matematcko-statstckých krtérí se aopak přkláí k ázoru, že kvalfkovaý rozbor číselých údajů je schope jedozačě určt tvar ejlepší regresí fukce bez zalost zkoumaých ekoomckých velč[6]. 4

5 Kvalta regresí fukce a tezta závslost Jedím z úkolů regresí aalýzy je posouzeí kvalty regresí fukce a zjštěí tezty (síly, těsost) závslost. Regresí fukce je tím lepší, čím je posuzovaý vztah slější, a čím více jsou emprcké hodoty vysvětlovaé proměé soustředěé kolem odhadu regresí fukce. Naopak vztah je tím slabší, čím více jsou emprcké hodoty vzdáley hodotám vyrovaých Y. Míra tezty závslost úzce souvsí s hodoceím účost odhaduté regresí fukce a tedy s kvaltou regresího odhadu. Pro kvaltu regresí fukce používáme zejméa charakterstky jako dex korelace, dex determace, rozptyl a aalýzu rezduí. Tyto charakterstky jsou v jedotlvých podkaptolách vysvětley. 5. Rozptyly emprckých, vyrovaých a skutečých hodot Můžeme zkostruovat tř rozptyly se zcela odlšou vypovídající schopostí [5]: a) Rozptyl emprckých hodot: ( ) y, (5.0) s = y y b) rozptyl vyrovaých hodot: ( ) s = Y y Y, = c) rozptyl skutečých hodot (rezduálí rozptyl): s ( y Y ). ( y Y ) = Př použtí metody ejmeších čtverců mez uvedeým rozptyly platí: s = s + s y Y ( y Y ) Rozptyl emprckých hodot můžeme rozložt a rozptyl vyrovaých hodot a rozptyl rezduálích hodot. Všechy emprcké hodoty by byly zároveň hodotam vyrovaým, kdyby mez závsle proměou y a vysvětlující proměou x exstovala fukčí závslost. Potom by se rozptyl emprckých hodot roval rozptylu vyrovaých hodot a rezduálí rozptyl by byl ulový. Platlo by s = s. Pokud by exstovala úplá y Y ezávslost mez oběma proměým, pak by všechy vyrovaé hodoty byly stejé a jejch rozptyl ulový. Vhodá je regresí fukce s meším rozptylem [5]. 5

5. Idex determace Z uvedeého vyplývá, že tezta závslost bude zřejmě tím slější, čím větší bude podíl rozptylu vyrovaých hodot a celkovém rozptylu. Naopak tezta bude tím slabší, čím bude podíl tohoto rozptylu meší. Toto určuje, jakou část varablty sledovaých hodot je možé vysvětlt daým modelem. Parametr může abývat hodot v tervalu <0,> [6]. Sílu závslost je tedy možé měřt poměrem rozptylu vyrovaých a emprckých hodot. I yx s = (5.) s Y y Teto poměr se azývá dex determace [5] a v případě leárí regrese se začí jako koefcet R. U fukčí závslost bude jeho hodota rova, v případě ezávslost abude hodoty ula. Čím více se bude blížt jedé, tím je závslost slější a dobře vysthuje regresí fukc. Čím více se bude blížt ule, tím považujeme daou závslost za slabší a regresí fukc za méě výstžou [6]. Během hodoceí a základě dexu determace je také třeba uvažovat, že jeho velkost je ovlvěa tím, zda se ám podařlo alézt vhodý typ regresí fukce pro pops daé závslost. Vyjde-l potom ízká hodota dexu determace, emusí to ještě zameat ízký stupeň závslost mez proměým, ale může to sgalzovat chybou volbu regresí fukce. Vhodější je model s vyšším dexem determace. Je třeba vzít v úvahu, že hodota dexu determace bývá vyšší pro regresí fukce s větším počtem parametrů. Proto je vhodé ověřt volbu vhodého modelu dalším testy. 5.3 Idex korelace K měřeí těsost závslost se v prax obyčejě epoužívá pouze samotého dexu determace, ale také jeho odmocy, kterou azýváme dex korelace [5]. I yx s = (5.) s Y y Idex korelace poskytuje stejé formace o těsost závslost jako dex determace. Teto dex však má meší vypovídací schopost [5]. 6

5.4 Aalýza rezduí Umožňuje posoudt vhodost zvoleé regresí fukce podle průběhu rezduí e = y -Y [6]. Rezdua zobrazeá v závslost a hodotách proměé x umožňují ověřt vhodost tvaru regresí fukce a splěí předpokladu kostatost rozptylu. Rezdua zobrazeá v závslost a pořadí pozorováí umožňují odhalt porušeí předpokladu ezávslost. Rezdua zobrazeá v závslost a hodotách v modelu dosud ezařazeých proměých ukazují, zda je vhodé zařadt příslušou proměou do modelu. Vhodý je model s ízkým hodotam rezduí [6]. 6 Cíl regresí aalýzy Cílem regresí aalýzy je přspět k pozáí příčých vztahů mez statstckým zaky. Úkolem regresí aalýzy je také matematcký pops systematckých okolostí, které provázejí statstcké závslost. Je zde saha alézt dealzující matematckou fukc tak, aby co ejlépe vyjadřovala charakter závslostí a co ejlépe zobrazovala průběh změ podmíěých průměrů závslé proměé. Tato hypotetcká matematcká fukce se azývá regresí fukce. Záměrem aalýzy je co ejlepší přblížeí emprcké regresí fukce k hypotetcké regresí fukc. Pro hlaví cíle regresí aalýzy je uto splt řadu dílčích úkolů. Některé z ch jsou apříklad [5]: a) Shromáždt a matematcky formulovat aprorí představy o charakteru regresí fukce, b) formulovat aše představy o souhrém působeí euvažovaých statstckých zaků, c) odhadout emprckou regresí fukc a základě statstckých pozorováí, d) posoudt kvaltu emprcké regresí fukce z hledska důvodů a cílů statstckého zjšťováí. Zvoleý typ regresí fukce by měl respektovat zákotost souvslost jedotlvých áhodých jevů. Př volbě typu regresí fukce se přhlíží k tomu, aby zvoleý model byl ejjedodušší a zároveň aby odchylky teoretckých a emprckých hodot byly mmálí. Rozhodováí často usadí sestaveí bodového dagramu, kterým se příslušá regresí fukce proloží. 7

7 Příklad Po teoretcké část, jejímž cílem bylo objast podstatu regresí aalýzy se zaměřím a praktcké příklady. Oba příklady jsou zpracováy v tabulkovém programu MS Excel využtím astalovaého balíku Aalýza dat (Příloha,, 3), který obsahuje metody regrese. Zadáí tohoto příkladu je ze sbírek úloh ze statstky od Mgr. Slívka z terích zdrojů VOŠ Česká Třebová [0]. Nejprve je uvedeo zadáí příkladu spolu s tabulkou a grafem dat. V dalších částech jsou zobrazey jedotlvé regresí fukce a podstaté údaje z regresí aalýzy zpracovaé ástrojem MS Excel. Následuje výběr optmálí regresí fukce. 7. Zadáí U dvacet prodaých ojetých automoblů určté začky byla zjštěa cea y [ts. Kč] a počet ajetých klometrů [ts. km] x. Nalezěte ejvhodější regresí křvku vysthující závslost cey automoblů a počtu ajetých klometrů. Tabulka : Data x (km) y (cea), 55,5 54,6 0,4 50,6 4,5 5, 3,4 47 8,6 50 3,4 43,6 5,3 4,3 6 43 54 39,9 36 34 66, 3 44,5 9 4 3,6 36,4 34 8,6 5,6 64,5 8 70,8 4,6 78,7 7 90, 7,6 Obrázek : Vstupí data Výše jsou zobrazea data v tabulce (Tabulka ), kde x (ajeté klometry) vyjadřují ezávslé proměé a y zobrazují závslé proměé (cea vozů). Cea automoblu je závslá a ajetých km. Bodový graf (Obrázek ) vedle tabulky s daty zobrazuje vstupí hodoty. 8

7. Aalýza regresí přímky Níže můžeme vdět (Obrázek 3, str. 30), že regresí přímka sestrojea z ezávslých proměých x a očekávaých hodot Y (Tabulka, str. 9) vytvořeých pomocí regresí aalýzy dobře prokládá data a tedy vysthuje závslost. K posouzeí závslost jak v tomto případě, tak v případech ostatích budeme používat jedak vzuálího hodoceí proložeí dat regresí fukcí a hlavě ukazatele regresí aalýzy. Tyto ukazatele jsou pro každou regresí fukc zobrazey ve vytvořeé regresí statstce (pod obrázkem 3 v případě regresí přímky), kde použjeme hodotu spolehlvost R (dex korelace), ásobé R (dex determace) a chybu středí hodoty (resduálí směrodatá odchylka s). O dexu korelace a dexu determace víme z teoretcké část, že čím větší hodoty mají, tím je model lepší. Chyba středí hodoty by aopak měla být co ejžší. V ukazatelích ANOVA, které jsou také vytvořey pro každou regresí fukc v rámc aalýzy, se zaměříme a tučě zvýrazěá rezdua a výzamost F. I tyto parametry by měly být co ejžší. Jak jž bylo apsáo výše, regresí fukce přímky dobře prokládá data. Potom můžeme říc, že hodoty skutečě aměřeých dat se přílš eodchylují od jejch odhadů vyjádřeých regresí fukcí. Tomu by odpovídaly velm dobré parametry regresí statstky pod grafem regresí přímky jako je dex korelace a dex determace, kdy se oba parametry blíží jedé. Jak víme z teoretcké část (Kaptola 5), tyto parametry ám vypovídají o těsost závslost regresí fukce. V případě plé fukčí závslost jedé proměé a druhé, by oba koefcety měly hodotu. Chybu středí hodoty, ebo-l rezduálí rozptyl a rezdua můžeme porovávat až s výsledky ostatích regresích fukcí. Pro rezduálí rozptyly a stejě tak pro hodoty rezduí platí, že čím jsou hodoty těchto parametrů žší, tím je regresí model lepší. U obou parametrů je to proto, že regresí křvka je tím lepší, čím blíže je všem aměřeým datům. Právě tuto vzdáleost křvky od skutečě aměřeých dat oba parametry popsují. Potom platí, že čím meší jsou hodoty těchto parametrů, tím meší je vzdáleost odhadu křvky od dat, a tím lepší je proložeí dat křvkou. Parametr výzamost F, sce eí v teoretcké část popsová, ale to z toho důvodu, že ás pouze formuje o celkové výzamost statstckého modelu. Platí, že čím je regresí model statstcky výzamější, tím je hodota tohoto parametru žší. Za statstcky evýzamý model se pokládá takový model, který by měl parametr výzamost F větší jak 0,05. Pokud toto platí, tak s jstotou 95% zamítáme hypotézu o výzamost modelu. 9

Potom můžeme říc, že tato regresí přímka je modelem statstcky výzamým. Jak o regresí přímce samoté můžeme říc, že parametr b 0 ebol její kostata protíá osu y zhruba v hodotě 5,5 a její směrce b je záporá, protože přímka má tvar klesající. V tabulce dole (Tabulka ) jsou obsažey jedotlvé ezávslé hodoty x (počet ujetých km) a závslé hodoty y (cea). Tato data, a rozdíl od pole očekávaá Y jsem do tabulky zadal a jsou vstupím daty. Pole očekávaá Y bylo vytvořeo regresím modelem. Totéž platí pro tyto tabulky u ostatích regresích modelů, které jsou dále uváděy v příloze (Příloha 4 až 6). Hodoty očekávaá Y s můžeme představt jako body, kterým aše regresí křvka bude procházet. Je to v podstatě jž mohokrát zmňovaý odhad regresího modelu v tomto případě pro regresí přímku. Čím jsou tato očekávaá Y podobější skutečým hodotám y, tím lépe model prokládá data. Jž z této tabulky bychom alespoň částečě mohl odhadout, že regresí přímka bude data dobře prokládat, protože ve většě případů odchylka hodot pole očekávaá Y a y eí velká. Tabulka : Vstupí data a očekávaé hodoty regresí přímky x y Očekávaá Y, 55 5,576,5 54,6 5,63798 0,4 50,6 48,747963 4,5 5, 50,90470895 3,4 47 4,0498968 8,6 50 49,40663 3,4 43,6 40,6763830 5,3 4,3 43,799033 6 43 46,688733 54 39,9 3,75767906 36 34 39,3565990 66, 3 8,8507776 44,5 9 36,404438 4 3,6 37,5695904 36,4 34 39,0995636 8,6 5,6,77846 64,5 8 8,90830909 70,8 4,6 6,598687 78,7 7 3,7049445 90, 7,6 9,486578 30

Obrázek 3: Regresí přímka VÝSLEDEK Regresí statstka Násobé R 0,9300798 Hodota spolehlvost R 0,8688898 Nastaveá hodota spolehlvost R 0,865367 Chyba středí hodoty 4,50930879 Pozorováí 0 ANOVA Rozdíl SS MS F Výzamost F Regrese 053,973 053,97 9,,73E-09 Rezdua 8 30,44 7,30 Celkem 9 364,8 7.3 Aalýza regresí paraboly Opět je vytvořea tabulka (Příloha 4) s potřebým daty. Tabulka obsahuje ezávslá závslá vstupí data x a y. Mmo očekávaých hodot Y vytvořeých regresí aalýzou je zde avíc druhá moca x, kterou zadáváme v MS Excel do ástroje aalýzy dat. Z íže uvedeého grafu (Obrázek 4) můžeme vdět, že regresí parabola velm dobře prokládá data. Na tomto příkladu lze pozat, že vzualzace k posouzeí optmálího 3

modelu vždy estačí. K přesému porováí (apř. mez přímkou a parabolou) je uté použít číselé údaje z ANOVY a regresí statstky. Je uté použít údajů z aalýzy dat, protože kvalta regresí fukce eí vždy pouhým porováím proložeí regresích fukcí daty hed patrá. Kdybychom se spoléhal pouze a áš vlastí úsudek, lehce bychom mohl způsobt chybu. Z regresí aalýzy můžeme prozatím zhodott, že regresí parabola má o ěco lepší parametry ež regresí přímka. Idex korelace dex determace, které určují míru těsost přléháí křvky k datům jsou v případě přímky paraboly blížící se jedé. Výzamost F určující statstckou výzamost modelu je v obou případech v pořádku. Chybu středí hodoty ebol rezduálí rozptyl čtverců a rezdua má ale parabola lepší. Obrázek 4: Regresí parabola VÝSLEDEK Regresí statstka Násobé R 0,938077576 Hodota spolehlvost R 0,879989539 Nastaveá hodota spolehlvost R 0,86587066 Chyba středí hodoty 4,085594 Pozorováí 0 ANOVA Rozdíl SS MS F Výzamost F Regrese 080,398668 040,99 6,376,4906E-08 Rezdua 7 83,7883 6,68934 Celkem 9 364,75 3

7.4 Aalýza regresího polyomu 3. stupě Vytvořeá tabulka (Příloha 5) obsahuje závslé proměé y a ezávsle proměé x. V tabulce je zařazea ově vytvořeá proměá x 3, protože se jedá o polyom 3. stupě. Hodoty proměé x 3 spolu s hodotam y byly dále zpracováy pro účely aalýzy. Opět jsme dostal hodoty očekávaá Y, vytvořeé aalýzou regresího polyomu 3. stupě. Polyom a základě porováí očekávaých Y se skutečým hodotam y (Příloha 5) prokládá vstupí data velm dobře, protože chyby daé rozdílem obou proměých ejsou velké. Více ež z přílohy se ale jstě dozvíme z grafckého výstupu a především z parametrů regresí aalýzy. Obrázek 5: Regresí polyom Z grafckého výstupu vdíme, že polyom dle očekáváí optmálě prokládá data. Stejě jako v předchozích případech evdíme žádé vybočující hodoty skutečých dat y, které by ebyly křvkou proložey. Proto bude uté použít údaje z regresí statstky a ANOVY pro koečé porováí modelů. Výsledky regresí aalýzy jsou podobé jako v případě regresího modelu paraboly, ale ve všech případech je teto model ještě lepší. Porováme-l dex korelace a dex determace, je těsost přléháí skutečých dat ke křvce lepší. Pokud porováme rezdua a chybu středí hodoty, zjstíme, že tyto vlastost má polyom prozatím ejlepší. 33

Regresí statstka Násobé R 0,9430337 Hodota spolehlvost R 0,8893098 Nastaveá hodota spolehlvost R 0,868555388 Chyba středí hodoty 4,04467395 Pozorováí 0 ANOVA Rozdíl SS MS F Výzamost F Regrese 3 0,433 700,8 4,849 7,4368E-08 Rezdua 6 6,6846 6,3559 Celkem 9 364,8 7.5 Aalýza regresí hyperboly Do tabulky vytvořeé pro aalýzu regresí hyperboly (Příloha 6) jsou opět zaeseé hodoty vstupích proměých y a x. Pro účely regresí aalýzy byla vytvořeá proměá /x, protože se jedá o hyperbolu a z teoretcké část víme, že regresí hyperbola má tvar β y = β 0 +. Koefcet β 0 bude vypočítá aalytckým ástrojem, ale koefcet β rový x jedé jsme zvoll my, protože základí tvar fukce hyperboly je y = /x. Porováím očekávaých hodot Y se skutečým hodotam y v příloze můžeme vdět, že hyperbolcká závslost mez daty patrě ebude ejvhodější. Více se ale dozvíme z regresí aalýzy. Obrázek 6: Regresí hyperbola 34

Z obrázku vdíme, že regresí hyperbola dle předpokladu zdaleka eprokládá vstupí data stejě dobře jako předchozí modely. Z grafu je jasě patrý rozdíl mez skutečým daty a regresí křvkou. Nevhodě je proložea zejméa část křvky u počátku osy x a poté se regresí křvka chová skoro jako přímka bez větších změ. Z tohoto důvodu s myslím, že aalýzu dat pomocí MS Excel bychom a uvádět emusel. Pro pořádek s j ale v tomto dalších případech uvádět budeme. Alespoň tak pozáme, zda je model statstcky výzamý. Uvedu je pro porováí, že dex determace a dex korelace je mohem horší (žší) ež v předchozích případech. Chyba středí hodoty a rezdua jsou také výzamě horší (vyšší). Tedy rozdíl mez skutečým daty a odhadovaým hodotam vyjádřeý regresí hyperbolckou závslostí mez daty je velký. I přesto je model statstcky výzamý, protože platí 0,0045 < 0,005. VÝSLEDEK Regresí statstka Násobé R 0,60686877 Hodota spolehlvost R 0,36888985 Nastaveá hodota spolehlvost R 0,3339398 Chyba středí hodoty 9,08738 Pozorováí 0 ANOVA Rozdíl SS MS F Výzamost F Regrese 870,6784 870,6784 0,49404 0,0045499 Rezdua 8 493,439 8,96884 Celkem 9 364,8 7.6 Aalýza regresí expoecály Jž z tabulky uvedeé v příloze (Příloha 7) vdíme, že regresí model expoecálí závslost mez daty bude as zcela epoužtelý, protože rozdíl mez očekávaým Y a skutečým y je velký. Navíc se teto model chová u většy hodot téměř kostatě a emá a sahu data optmálě prokládat. 35

Obrázek 7: Regresí expoecála Z obrázku vdíme, že teto model opravdu eí vhodý. Parametry regresí aalýzy jsou přesto pro srováí uvedey, ale dále se jm zabývat ebudeme. Nebudeme se jm zabývat, protože se stačí podívat a parametr výzamost F. Jeho hodota v případě regresí expoecály je vyšší ež 0,05 a tedy model zamítáme jako statstcky evýzamý. VÝSLEDEK Regresí statstka Násobé R 0,490 Hodota spolehlvost R 0,8406 Nastaveá hodota spolehlvost R 0,3873 Chyba středí hodoty 0,3507 Pozorováí 0 ANOVA Rozdíl SS MS F Výzamost F Regrese 435,4 435,4 4,06045 0,05908349 Rezdua 8 98,977 07,654 Celkem 9 364,8 7.7 Aalýza regresího dekadckého logartmu Z rozdílů v tabulce (Příloha 8) mez očekávaým Y a vstupím y vdíme, že model regresího dekadckého logartmu prokládá data o pozáí lépe ež regresí hyperbola ebo expoecála. Zdal jsou ale data proložea lépe ež v případě regresího polyomu ebo 36

regresího modelu přímky přímo z tabulky zjstt emůžeme. Proto se zaměříme a grafcký výstup a parametry regresí aalýzy. Obrázek 8: Regresí log V tomto případě ám opět pro koečé posouzeí optmálího regresího modelu pomůže aalýza dat, protože samotý graf ám data prokládá velm dobře, stejě jako v případech regresího modelu paraboly, přímky a polyomu 3. stupě. I zde se ám potvrzuje, že spoléhat se a pouhé vzuálí hodoceí z obrázku grafu je začě rzkové. Dle mého ázoru zde totž eí velký rozdíl mez proložeím dat logartmckou křvkou a zatím ejlepšího modelu regresího polyomu 3. stupě. Porováím obou modelů ale rychle zjstíme, že ve všech parametrech více vyhovuje polyom. VÝSLEDEK Regresí statstka Násobé R 0,8789006 Hodota spolehlvost R 0,774663 Nastaveá hodota spolehlvost R 0,7598555 Chyba středí hodoty 5,4666488 Pozorováí 0 ANOVA Rozdíl SS MS F Výzamost F Regrese 86,0 86,0 6,096 3,40055E-07 Rezdua 8 537,964 9,8844 Celkem 9 364,8 37

7.8 Aalýza regresího přrozeého logartmu Obrázek 9: Regresí l Jak vdíme z obrázku, grafy dekadckého a přrozeého logartmus jsou téměř totožé, regresí statstky jsou s také velm podobé. Proto je zbytečé aalýzu blíže popsovat. VÝSLEDEK Regresí statstka Násobé R 0,87890065 Hodota spolehlvost R 0,77466309 Nastaveá hodota spolehlvost R 0,75985548 Chyba stř. hodoty 5,4666488 Pozorováí 0 ANOVA Rozdíl SS MS F Výzamost F Regrese 86,0 86,0 6, 3,40055E-07 Rezdua 8 537,964 9,8844 Celkem 9 364,8 7.9 Hodotící tabulka Př ukázkách dříve zázorěých regresích modelů bylo mohokrát upozorěo, že ěkteré regresí modely můžeme jž pouhým vzuálím zhlédutím předem odmítout jako fukce evhodě prokládající data. Ovšem u jých modelů, jako apříklad u regresího 38

polyomu ebo regresí paraboly (v tomto příkladě) stuace jž zdaleka eí tak jasá, jak by se ám zamlouvalo. Nejlepším řešeím je proto sestrojt hodotící tabulku, která bude porovávat parametry kvalty všech použtých regresích fukcí, ačkolv jsme tyto výsledky jž částečé porovával. Tabulka je vytvořeá pro maxmálí přehledost srovávací aalýzy parametrů jedotlvých regresích modelů. Bude obsahovat dex determace I, dex korelace I a rezduálí směrodatou odchylku s z regresí statstky. Dále výzamost F a rezdua RSC z ANOVY. Jak vdíme, tabulka dohromady obsahuje pět krtérí, což je dle ázoru odboríků dostatečý počet pro správý výběr optmálího modelu. Tabulka 3: Hodotcí tabulka Regresí model / Vlastost I I RSC F s PŘÍMKA 0,8688 0,930 30,44,7E-09 4,5093 PARABOLA 0,87999 0,938078 83,788,49E-08 4,0856 POLYNOM 3. STUPNĚ 0,8893 0,94303 6,6846 7,4E-08 4,0447 HYPERBOLA 0,36889 0,606868 493,439 0,00455 9,087 EXPONENCIÁLA 0,8406 0,490 98,977 0,059083 0,35 LOG 0,77466 0,87890 537,964 3,40E-07 5,46665 LN 0,77466 0,87890 537,964 3,40E-07 5,46665 7.0 Výběr optmálího regresího modelu Zopakujme, že optmálí regresí model by měl splňovat maxmálí dex determace, což spolu s mmálím RSC a vyhovující hladou výzamost F jsou as ejpodstatější parametry. Dále je vhodá mmálí směrodatá odchylku s a vysoký dex korelace. Z hodotící tabulky můžeme vyčíst, že v téměř všech parametrech je ejlepším modelem polyom 3. stupě. Má ze všech modelů ejvyšší dex determace, ejžší rezdua RSC a současě je v dalších parametrech ejlepším modelem. Pro teto typ regresí fukce rověž svědčí fakt optmálího proložeí vstupím daty touto regresí fukcí. Z celkového výsledku aalýzy jsme se tedy dozvěděl, že závslost cey automoblu a počtu ajetých klometrů je závslostí polyomckou. Druhým modelem, který dobře vysthuje závslost dat je parabola. Naopak bez vzuálího hodoceí jedotlvých grafů můžeme pomocí oretace v tabulce hed vyloučt expoecálí regresí fukc, která v téměř všech parametrech evyhovuje a avíc je jedým modelem statstcky evýzamým v tomto příkladě. 39

8 Příklad 8. Zadáí Tetokrát byl vybrá příklad z ekoomcké praxe, kdy jsem zjšťoval závslost míry hrubých domácích úspor a měsíčí hrubé reálé mzdě. Opět je mým cílem zjstt pomocí proložeí regresích fukcí daty deálí závslost mez zmíěou hrubou mzdou a úsporam domácostí. Data jsem opatřl z ekoomckého serveru Měšec.cz dostupá ole z www http://www.mesec.cz/dae/ekoomka/pruvodce/mzdy/ [],[]. Růsty č poklesy obou skup dat jsou vyjádřey v procetech a vztahují se k určtému období. Nezávslým daty x jsou hrubé mzdy a a ch závslým daty y jsou úspory domácostí. Tabulka 4: Vstupí data rok průměré mzdy x úspory y 995 8,7,4 996 8,7,5 997,3,3 998 -,4 9,3 999 6, 8,5 000,4 8,4 00 3,8 7,4 00 5,4 8,3 003 6,5 7,4 004 3,7 5,4 005 3,3 8, 006 3,9 9,3 007 4,4 9,0 008, 8, Obrázek 0: Vstupí data 40

8. Aalýza regresí přímky V aalýze se bude postupovat obdobým způsobem jako v předchozím příkladě. K posouzeí závslost budeme používat předběžé vzuálí ukázky grafů a opět se hlavě zaměřím a ukazatele regresí aalýzy. V regresí statstce opět použjeme hodotu spolehlvost R (dex korelace), ásobé R (dex determace) a chybu středí hodoty (resduálí směrodatá odchylka s). V ukazatel ANOVA se zaměříme a tučě zvýrazěá rezdua a výzamost F. Tabulky potřebé k vytvořeí regresí aalýzy jsou opět uvedey v příloze stejě jako v příkladě kaptoly sedm. Obrázek : Regresí přímka Z grafu můžeme vdět, že regresí fukce eprokládá data přílš dobře a eprokládá vůbec odlehlé hodoty. Protože se jedá o prví regresí model, emůžeme porovávat hodoty parametrů regresí aalýzy. Model je ale stejě statstcky evýzamý, protože parametr výzamost F je větší ež 0,05. VÝSLEDEK Regresí statstka Násobé R 0,9588 Hodota spolehlvost R 0,055593 Nastaveá hodota spolehlvost R -0,0639408 Chyba středí hodoty,7339 Pozorováí 4 4

ANOVA Rozdíl SS MS F Výzamost F Regrese,97475969,97476 0,66570 0,430453 Rezdua 35,55609546,963008 Celkem 3 37,585743 8.3 Aalýza regresí paraboly V příloze je uvedea tabulka se vstupím daty (Příloha ). Opakují se závslá a ezávslá vstupí data avíc doplěá o druhou mocu x. Tato data zpracovávám v programu MS Excel. Jedotlvá x jsou ezávslá vstupí data, zatímco jedotlvá y jsou závslé velčy. Očekávaá Y jsou odhadovaé velčy, které odhadla regresí aalýza použtá v MS Excel. Obrázek : Regresí parabola Z grafu můžeme posoudt, že regresí parabola prokládá data lépe ež regresí přímka. Počátečí fáze regresí paraboly je téměř totožá s regresí přímkou, avšak v dalším průběhu vdíme, že model má alespoň sahu proložt okolí odlehlé hodoty vpravo. I v tomto případě ám více řeke hodotící tabulka (Tabulka 5), ve které porováme jedotlvé parametry paraboly ve srováí s ostatím regresím fukcem. O vyloučeí ěkterých odlehlých hodot emůže být a uvažováo, protože zjštěých údajů je přílš málo. 4

Níže je zobraze výsledek regresí aalýzy. Z aalýzy můžeme vyčíst, že parabola má lepší parametry ež přímka. Například parametry dex determace ebo dex korelace mají vyšší hodoty ež přímka a aopak třeba parametr RSC má hodotu žší. Přesto je také teto model statstcky evýzamý, ačkolv je výzamost F žší ež v případě regresí přímky. VÝSLEDEK Regresí statstka Násobé R 0,4440804 Hodota spolehlvost R 0,97074 Nastaveá hodota spolehlvost R 0,30308 Chyba středí hodoty,5844994 Pozorováí 4 ANOVA Rozdíl SS MS F Výzamost F Regrese 7,40 7,4009,948 0,66798 Rezdua 30,3,506 Celkem 3 37,53 8.4 Aalýza regresího polyomu 3. stupě Tabulka v příloze zobrazuje vstupí závslé a ezávslé velčy (Příloha ). V případě polyomu 3. stupě avíc zahruje třetí mocu ezávslých vstupích hodot x. Obrázek 3: Regresí polyom 43

Z grafu je patré, že regresí polyom 3. stupě je dobrou fukcí pro vystžeí závslost mez daty, protože dobře prokládá zjštěé hodoty. Můžeme jej tedy jž v této fáz ozačt jako vhodý z vzuálího hledska. I z výsledků parametrů je vdět, že proložeí daty je celkem dobré. Teto model je prvím modelem, který je statstcky výzamý. Z toho vyplývá, že dex determace a dex korelace je větší, ež v případě paraboly a aopak chyba středí hodoty a rezdua mají hodoty žší. Toto vše ukazuje a vyšší kvaltu regresího modelu ež v předchozích případech. VÝSLEDEK Regresí statstka Násobé R 0,5396969 Hodota spolehlvost R 0,89975 Nastaveá hodota spolehlvost R 0,3406 Chyba středí hodoty,49745048 Pozorováí 4 ANOVA Rozdíl SS MS F Výzamost F Regrese 0,608 0,608 4,7360907 0,0506943 Rezdua 6,9083,4358 Celkem 3 37,5857 8.5 Aalýza regresí hyperboly Obrázek 4 regresí hyperboly ám také jedozačě eurčí, zda lépe prokládá data regresí hyperbola ebo třeba přímka. Z aalýzy ale vdíme, že parametry regresí hyperboly ejsou přílš dobré. Hyperbola má dost ízký dex determace a velm ízký dex korelace v porováí s předchozím modely. Naopak rezdua a třeba výzamost F mají velké hodoty. Model je statstcky evýzamý a zatím je svým parametry ejhorším modelem vysthující závslost mez daty. Tabulka s daty k tomuto modelu je ozačea jako Příloha 3. 44

Obrázek 4: Regresí hyperbola VÝSLEDEK Regresí statstka Násobé R 0,000976 Hodota spolehlvost R 4,4000E-06 Nastaveá hodota spolehlvost R -0,08338567 Chyba středí hodoty,768436369 Pozorováí 4 ANOVA Rozdíl SS MS F Výzamost F Regrese 0,00065 0,00065 5,3E-05 0,994375 Rezdua 37,584 3,7367 Celkem 3 37,5857 8.6 Aalýza regresí expoecály Z grafu můžeme vdět, že regresí expoecála dobře prokládá vstupí data a možá bude ejvhodější fukcí pro vystžeí závslost. Neje že dobře prokládá oblast, kde je ejvíce aměřeých hodot vstupích dat, ale avíc prokládá odlehlou hodotu v pravé část grafu, což u předchozích regresích modelů eplatlo. 45

Obrázek 5: Regresí expoecála Vše se objasí závěrečým porováím parametrů všech modelů. Model regresí expoecály má ale prozatím ejlepší parametry ve srováí s polyomem ebo parabolou, které prokládaly data celkem dobře, ačkolv model paraboly ebyl statstcky výzamý. Vdíme, že dexy korelace a determace mají prozatím ejvětší hodoty. Naopak rezdua ebo výzamost F jsou výrazě žší ež v předchozích případech. Výzamost F je meší ež 0,05 a proto je model statstcky výzamý. Zatím se jedá o ejlepší model vysthující závslost mez daty eje svým parametry, ale z vzuálího hledska. VÝSLEDEK Regresí statstka Násobé R 0,6360688 Hodota spolehlvost R 0,40463897 Nastaveá hodota spolehlvost R 0,35507889 Chyba středí hodoty,3645307 Pozorováí 4 ANOVA Rozdíl SS MS F Výzamost F Regrese 5,856 5,8557 8,556 0,0446667 Rezdua,3433,86949 Celkem 3 37,5857 46

8.7 Aalýza regresího dekadckého logartmu Proložeí regresí fukce daty (Obrázek 6) je podobé jako v případě přímky. Rověž parametry jsou podobé, což vysvětluje podobý tvar regresí fukce. Níže je uvede opět výstup z regresí aalýzy. Jak vdíme, parametry jsou horší ve srováí s expoecálou ebo polyomem. Model je statstcky evýzamý. I tak ale zahreme teto model do koečého hodoceí v tabulce. Ze závěrečé hodotící tabulky se můžeme vzájemým porováím dozvědět důležté věc. Obrázek 6: Regresí log Z hodotící tabulky pozáme eje který model je ejoptmálější pro odhad vývoje dat, ale které modely je třeba zavrhout jako vyložeě ehodící se pro budoucí predkc dat. Nebo můžeme odhadout, které modely by se aopak daly použít, kdybychom dostal větší počet dat z aalyzovaé oblast (hrubé domací úspory závslé a reálých mzdách) a kdybychom v ávazost a tuto skutečost mohl vybočující hodoty odstrat. Potom by třeba expoecála ebyla přílš vhodá, ale spíše by se více hodla přímková regrese ebo model logartmu. VÝSLEDEK Regresí statstka Násobé R 0,88389 Hodota spolehlvost R 0,0456 Nastaveá hodota spolehlvost R -0,07550408 Chyba středí hodoty,88309 Pozorováí 3 47

ANOVA Rozdíl SS MS F Výzamost F Regrese 0,5657 0,5657 0,5756 0,6990070 Rezdua 36,7666 3,3406 Celkem 37,893 8.8 Aalýza regresího přrozeého logartmu Průběh regresí fukce přrozeého logartmu se od logartmcké fukce přílš elší, proto jej ebudu blíže popsovat. Pouze zbývá dodat, že u přrozeého dekadckého logartmu jsem vyřadl hodotu,4 v ezávslých datech x, protože fukce obou logartmů je defováa pouze pro kladé hodoty. Obrázek 7: Regresí l VÝSLEDEK Regresí statstka Násobé R 0,7833 Hodota spolehlvost R 0,04 Nastaveá hodota spolehlvost R -0,075504 Chyba středí hodoty,883 Pozorováí 3 ANOVA Rozdíl SS MS F Výzamost F Regrese 0,56570777 0,566 0,576 0,6990070 Rezdua 36,76565999 3,34 Celkem 37,893077 48

8.9 Hodotící tabulka Jak vdíme, tabulka opět obsahuje dex determace I, dex korelace I a rezduálí směrodatou odchylku s z regresí statstky. Dále výzamost F a rezdua RSC z ANOVY. Dohromady obsahuje pět krtérí, které jsou postačující pro posouzeí modelu. Tabulka 5: Hodotcí tabulka Regresí model / Vlastost I I RSC F s PŘÍMKA 0,05559 0,958 35,556 0,430453,7339 PARABOLA 0,9707 0,44408 30,766 0,668,584499 POLYNOM 3. STUPNĚ 0,899 0,5397 6,9083 0,0507,49745 HYPERBOLA 4,40E-06 0,00098 37,584 0,9943,768436 EXPONENCIÁLA 0,40463 0,63607,3433 0,04466,36453 LOG 0,04 0,8833 36,7666 0,699007,883 LN 0,04 0,7833 36,76566 0,699007,883 8.0 Výběr optmálího regresího modelu Nejprve bych chtěl říc, že kdyby ám šlo o rychlou aalýzu, zaměřl bych se v popsech modelů ejprve a parametr výzamost F, který je velm důležtý z hledska použtelost modelů. Zjstl bych, že statstcky výzamé jsou pouze regresí modely polyomu 3. stupě a expoecály. Poté bych porovával pouze parametry těchto modelů a ostatí regresí modely bych vůbec euvažoval. Protože však statstcky výzamé modely vyšly v tomto příkladě pouze dva, dovoll jsem s aalyzovat ostatí regresí modely. Máme k dspozc alespoň ázorou ukázku, že modely statstcky evýzamé mají parametry skutečě výrazě horší. Vzájemým porováím parametrů (Tabulka 5) ám vychází, že ejlepším regresím modelem pro vystžeí závslost mez daty, je závslost expoecálí. Je ejlepším modelem, protože hodoty dex korelace dex determace jsou ze všech uvedeých modelů ejvyšší a aopak chybu středí hodoty má expoecálí model ejžší. V ukazatelích ANOVA jsme se zaměřl a tučě zvýrazěá rezdua RSC a výzamost F. Tyto hodoty jsou také ejžší, což vhodost expoecálího modelu je potvrzuje. Mmoto, jak jž bylo apsáo, je expoecálí model ještě s polyomem 3. stupě jedým modelem, který je statstcký výzamý. 49

Výrazě ejhorším modelem pro vystžeí závslost je hyperbolcký model, který evyhovuje ve srováí s ostatím modely ve všech parametrech. Celkem slušé parametry pro vystžeí závslost mez daty má také polyom 3. stupě a regresí parabola, ačkolv je statstcky evýzamá. Z výsledku tabulky potom můžeme usoudt, že závslost procetího růstu úspor domácostí y a velkost růstu procet hrubých mezd x je závslostí expoecálí. Je třeba říc, že to eí a přílš překvapvé zjštěí, protože s jstě dokážeme představt expoecálí růst (č pokles) rodých úspor (apř. a bydleí, spořeí, dovoleou a ostatí výdaje) v závslost a výš mezd. 50

Závěr Na závěr se dá říc, že záměr bakalářské práce byl splě. Cílem zadáí práce bylo teoretcky popsat metody a pojmy regresí aalýzy a ásledě vytvořt a vyhodott jedotlvé regresí modely u zpracovaých příkladů. V teoretcké část jsem mmo jé charakterzoval jedotlvé regresí modely použté v praktcké část práce a jedotlvé ukazatelé kvalty regresí fukce, kterých se pro posouzeí kvalty modelu ásledě využívalo. V praktcké reprezetac metod regresí aalýzy pro všechy tyto modely vytvořla aalýza v programu MS Excel určté parametry. Z těchto parametrů jsem se zaměřl a dex determace I, dex korelace I, chybu středí hodoty s, dále výzamost F a rezdua RSC. Následě jsem pomocí očekávaých hodot Y, které jsou výstupem pro každý model vždy vytvořl příslušou regresí fukc prokládající vstupí data. Nejprve se u většy modelů provedlo vzuálí zhodoceí proložeí regresí fukce daty, avšak hlaví důraz pro určeí kvalty regresího modelu se kladl a porováí jedotlvých parametrů. Porováím se určla vhodost regresích modelů a dle toho byl vybrá te model, který ejlépe prokládá zvoleá data. Výběr ejlepšího modelu byl vždy zdůvodě a zároveň se poukázalo a regresí modely, které jsou evhodé pro pops závslost mez daty. Příklady byly zpracováy dva proto, aby bylo možo porovat výstupy dvou odlšých případů. Z výsledků vdíme, že výstupy mohou být pro odlšá data zcela já. Zatímco v prvím příkladě vyšel pouze jede statstcky evýzamý model, v druhém případě je evýzamých modelů pět. U příkladu v sedmé kaptole byla aalyzováa data vztahující se k závslost mez stářím a ceou automoblů. Naměřeých hodot je dvacet a bylo zjštěo, že tato data jsou proložea ejlépe polyomem 3. stupě. U tohoto příkladu se přílš edalo spoléhat a subjektví vzuálí hodoceí, protože další modely data dobře prokládaly, ačkolv měl horší parametry. Výsledky aalýzy jsem tedy odvodl hlavě pomocí hodotící tabulky (Tabulka 3), kde jsou vypsáy hodoty ejdůležtějších parametrů pro určeí kvalty modelů. Naopak se dá říc, že model, který absolutě evyhovuje jak z hledska vzuálího, tak z hledska parametrckého je model regresí expoecály. Regresí aalýza ám dala predkc, že pro budoucost můžeme očekávat polyomckou závslost mez ceou automoblu a jeho ajetým klometry. 5

V druhém příkladě v kaptole osmé byla aalyzováa závslost mez výší hrubých reálých mezd a úsporam domácost, přčemž bylo k dspozc 4 aměřeých hodot. Bylo zjštěo, že data jsou ejlépe proložea expoecálí fukcí. Expoecálí fukce byla jž z pouhého vzuálího hodoceí ejlepším regresím modelem, což bylo potvrzeo porováím parametrů s ostatím modely. Dalším regresím modelem dobře popsujícím závslost mez daty byl model polyomu 3. stupě. Nejhorším modelem z hledska parametrů, je regresí hyperbola, ačkolv v tomto příkladě bylo více statstcky evýzamých modelů. Na základě této aalýzy můžeme predkovat, že v budoucost se závslost mez mzdou a úsporam bude řídt expoecálí fukčí závslostí. Je třeba zmít, že př modelováí dat v obou příkladech byl použt pouze polyom 3. stupě. Obvykle se sce jeví regresí polyomy vyšších stupňů jako vhodější, protože lépe aproxmují data, ale a druhou strau čím vyšší je stupeň regresího polyomu, tím obtížější se s ím pracuje. Vzrůstá rzko, že se regresí fukce bude zbytečě sažt popsat áhodé výchylky od celkového tredu a důsledkem bude, že regresí fukce bude pro předpověď aprosto evhodá. 5

Použtá lteratura [] CYHELSKÝ, L. Úvod do teore statstky. vydáí. Praha : SNTL, 98. 35 s. ISBN L3-C3-3-4/3853. [] CYHELSKÝ, L., NOVÁK, I. Statstka. díl. vydáí. Praha: SNTL, 967. 87 s. ISBN L3-C3-4-4/3740/. [3] CYHELSKÝ, L. a kolektv. Základy teore statstky pro ekoomy. vydáí. Praha: SNTL, 979. 365 s. ISBN L3-C3-4-4/384. [4] HENDL, J. Přehled statstckých metod zpracováí dat. vydáí. Praha: PORTÁL, 006. 583 s. ISBN 80-7367-3-9. [5] HINDLS, R., HRONOVÁ, S., SEGER, S. Statstka pro ekoomy. vydáí 3. Praha: PROFESSIONAL PUBLISHING, 003. 45 s. ISBN 80-8649-34-7. [6] HINDLS, R., KAŇKOVÁ, R., NOVÁK, I. Metody statstcké aalýzy pro ekoomy. vydáí. Praha: MANAGEMENT PRESS, 997. 50 s. ISBN 80-85943-44-. [7] KUBANOVÁ, J. Statstcké metody pro ekoomckou a techckou prax. vydáí 3. Bratslava: STATIS, 008. 47 s. ISBN 978-80-85659-474. [8] MAREK, L. Statstka pro ekoomy aplkace. vydáí. Praha: PROFESSIONAL PUBLISHING, 005. 43 s. ISBN 80-8649-68-. [9] MELOUN, M. a MILITKÝ, J. Statstcké zpracováí expermetálích dat. vydáí. Praha: EAST PUBLISHING, 998. 84 s. ISBN 80-79-003-. [0] SLÍVKO, P. Sbírka úloh ze statstky. vydáí. Česká Třebová : Iterí zdroj VOŠ, 003. 64 s. [] Měšec.cz : Vývoj reálých mezd v ČR, 995-008 [ole]. 008 [ct. 00-0-0]. Dostupé z WWW: <http://www.mesec.cz/dae/ekoomka/pruvodce/mzdy/>. 53

[] Měšec.cz : Vývoj spotřeby v ČR, 995-008 [ole]. 008 [ct. 009-0-]. Dostupé z WWW: <http://www.mesec.cz/dae/ekoomka/pruvodce/spotreba/> [3] Regresí aalýza : Metoda ejmeších čtverců. I Less8reg. Praha :fzp.ujep.cz, 4..008 [ct.00-0-07].dostupé z WWW: <http://fzp.ujep.cz/~syek/statstka/predasky/?c=d;o=ad;o=a>. 54

Sezam zkratek X x x ɵ y I I s RSC ε Náhodá velča Hodota statstckého zaku Artmetcký průměr Odhad hodoty statstckého zaku Idex determace Idex korelace Chyba středí hodoty Resduálí součet čtverců Náhodá chyba 55

Sezam obrázků Obrázek : Metoda ejmeších čtverců... Obrázek : Vstupí data... 8 Obrázek 3: Regresí přímka... 3 Obrázek 4: Regresí parabola... 3 Obrázek 5: Regresí polyom... 33 Obrázek 6: Regresí hyperbola... 34 Obrázek 7: Regresí expoecála... 36 Obrázek 8: Regresí log... 37 Obrázek 9: Regresí l... 38 Obrázek 0: Vstupí data... 40 Obrázek : Regresí přímka... 4 Obrázek : Regresí parabola... 4 Obrázek 3: Regresí polyom... 43 Obrázek 4: Regresí hyperbola... 45 Obrázek 5: Regresí expoecála... 46 Obrázek 6: Regresí log... 47 Obrázek 7: Regresí l... 48 56

Sezam tabulek Tabulka : Data... 8 Tabulka : Vstupí data a očekávaé hodoty regresí přímky... 30 Tabulka 3: Hodotcí tabulka... 39 Tabulka 4: Vstupí data... 40 Tabulka 5: Hodotcí tabulka... 49 57

Sezam příloh Příloha :Doplňky MS EXCEL Příloha :Doplňky Aalytcké ástroje Příloha 3:Tvorba regrese Příloha 4: Vstupí data a očekávaé hodoty regresí paraboly Příloha 5: Vstupí data a očekávaé hodoty regresího polyomu Příloha 6: Vstupí data a očekávaé hodoty regresí hyperboly Příloha 7: Vstupí data a očekávaé hodoty regresí expoecály Příloha 8: Vstupí data a očekávaé hodoty regresího logartmu Příloha 9: Vstupí data a očekávaé hodoty regresího l Příloha 0: Vstupí data a očekávaé hodoty regresí přímky Příloha : Vstupí data a očekávaé hodoty regresí paraboly Příloha : Vstupí data a očekávaé hodoty regresího polyomu Příloha 3: Vstupí data a očekávaé hodoty regresí hyperboly Příloha 4: Vstupí data a očekávaé hodoty regresí expoecály Příloha 5: Vstupí data a očekávaé hodoty regresího log Příloha 6: Vstupí data a očekávaé hodoty regresího l 58

Příloha :Doplňky MS EXCEL Příloha :Doplňky Aalytcké ástroje

Příloha 3:Tvorba regrese Příloha 4: Vstupí data a očekávaé hodoty regresí paraboly y x x Očekávaá Y 55,, 53,847464 54,6,5 6,5 53,45638 50,6 0,4 08,6 49,434337 5, 4,5 0,5 5,468955 47 3,4 985,96 39,973805 50 8,6 73,96 50,0699059 43,6 3,4 049,76 39,568756 4,3 5,3 640,09 4,53869 43 6 56 46,663869 39,9 54 96 3,6597648 34 36 96 38,405057 3 66, 438,44 7,875993 9 44,5 980,5 34,9444 3,6 4 764 35,856968 34 36,4 34,96 37,98450458 5,6 8,6 68,76 3,5853046 8 64,5 460,5 8,3760609 4,6 70,8 50,64 6,58069467 7 78,7 693,69 4,53566 7,6 90, 836,04,9039083