KVALITA REGRESNÍHO MODELU Radek Fajfr

Rozměr: px
Začít zobrazení ze stránky:

Download "KVALITA REGRESNÍHO MODELU Radek Fajfr"

Transkript

1 UNIVERZITA PARDUBICE FAKULTA EKONOMICKO-SPRÁVNÍ KVALITA REGRESNÍHO MODELU Radek Fajfr Bakalářská práce 00

2

3

4 Prohlášeí Tuto prác jsem vypracoval samostatě. Veškeré lterárí pramey a formace, které jsem v prác využl, jsou uvedey v sezamu použté lteratury. Byl jsem sezáme s tím, že se a moj prác vztahují práva a povost vyplývající ze zákoa č. /000 Sb., autorský záko, zejméa se skutečostí, že Uverzta Pardubce má právo a uzavřeí lcečí smlouvy o užtí této práce jako školího díla podle 60 odst. autorského zákoa, a s tím, že pokud dojde k užtí této práce mou ebo bude poskytuta lcece o užtí jému subjektu, je Uverzta Pardubce oprávěa ode me požadovat přměřeý příspěvek a úhradu ákladů, které a vytvořeí díla vyaložla, a to podle okolostí až do jejch skutečé výše. Souhlasím s prezečím zpřístupěím své práce v Uverztí khově. V Pardubcích de.4.00 Fajfr Radek

5 ANOTACE Bakalářská práce je vypracováa a téma Kvalta regresího modelu. Cílem je vymezeí základích pojmů regresí aalýzy a využtí těchto zalostí př praktckém řešeí příkladů. V praktcké část jsou příklady řešeé metodam regresí aalýzy a ásleduje vytvořeí regresích fukcí. Dále ásleduje výběr optmálího regresího modelu spolu se zdůvoděím tohoto výběru. KLÍČOVÁ SLOVA Regresí aalýza, Náhodá velča, Metoda ejmeších čtverců, Idex determace, Idex korelace, Rezdua, Výzamost F. TITLE Qualty of Regresso Model ANOTATION Ths bachelor work s created for the topc Qualty of Regresso Model. The am of ths work s to expla of basc expressos related to regresso aalyss ad applcato of ths kowledge practcular solutos. I practcal part of the bachelor work there are examples solved by methods of regresso aalyss ad the are regresso fuctos created. The followg topc s the choce of the optmal regresso model together wth the explaato of ths choce. KEYWORDS Regresso aalyss, Radom varable, Method of the least squares, Idex determato, Idex corelato, Resdua, Meag F.

6 Poděkováí Zde bych rád poděkoval Mgr. Haě Boháčové a Mgr. Pavle Jdrové za ochotu a odboré vedeí, ceé rady a áměty během tvorby práce. Dále bych rád poděkoval celé své rodě, zejméa otc Fatšku Fajfrov a bratrov Martov Fajfrov za projeveou podporu.

7 OBSAH: Úvod... 9 Pojmy regresí aalýzy Pevá a volá závslost Fukčí závslost Statstcká závslost (stochastcká)... Regresí fukce.... Jedoduchý model leárí regrese.... Modely leárí vzhledem k parametrům Přímková regrese Parabolcká regrese Polyomcká regrese Hyperbolcká regrese Logartmcká regrese Modely eleárí vzhledem k parametrům Expoecálí regrese Modely obtížě learzovatelé vzhledem k parametrům Metoda ejmeších čtverců Volba regresí fukce Věcě ekoomcká krtéra Emprcký způsob volby Kvalta regresí fukce a tezta závslost Rozptyly emprckých, vyrovaých a skutečých hodot Idex determace Idex korelace Aalýza rezduí Cíl regresí aalýzy Příklad Zadáí Aalýza regresí přímky Aalýza regresí paraboly Aalýza regresího polyomu 3. stupě... 33

8 7.5 Aalýza regresí hyperboly Aalýza regresí expoecály Aalýza regresího dekadckého logartmu Aalýza regresího přrozeého logartmu Hodotící tabulka Výběr optmálího regresího modelu Příklad Zadáí Aalýza regresí přímky Aalýza regresí paraboly Aalýza regresího polyomu 3. stupě Aalýza regresí hyperboly Aalýza regresí expoecály Aalýza regresího dekadckého logartmu Aalýza regresího přrozeého logartmu Hodotící tabulka Výběr optmálího regresího modelu Závěr... 5 Použtá lteratura Sezam zkratek Sezam obrázků Sezam tabulek Sezam příloh... 58

9 Úvod Úvodem lze říc, že regresí aalýza s klade za cíl vkout do podstaty sledovaého jevu a procesů určté oblast. Tím se saží přblížt příčým souvslostem. Příčou souvslostí je stuace, kdy exstece určtého jevu souvsí s exstecí jého jevu. Důvodem, proč jsem s vybral toto téma je skutečost, že s regresí se setkáváme v moha stuacích reálého světa právě v podobě vztahu příčy a ásledku. Například ekoomcká krze vyvolává árůst ezaměstaost, což je typcká ukázka vztahu příčy a ásledku. Dalším důvodem, proč jsem s daé téma zvoll byl fakt, že tato matematcká metoda je velm důležtá eje pro statstku jako vědí obor, ale pro já odvětví a tato uverzálost mě rověž zaujala. Jedím z hlavích cílů této práce je výběr optmálího regresího modelu pro vybraá data. Dříve ež však můžeme vytvořt, aalyzovat jedotlvé regresí modely a akoec vybrat optmálí regresí model, je potřeba sezámt se s teorí tohoto problému. Proto práce zahruje odděleou teoretckou část, kde jsou vysvětley jedotlvé pojmy regresí aalýzy hlaví matematcké vztahy s tímto problémem souvsející. Všechy popsaé vztahy a defce jsou zpracovaé pomocí relevatí matematcké lteratury uvedeé v použtých zdrojích. Teoretcká část obsahuje a vysvětluje základí pojmy leárí regrese (apř. volá, pevá závslost) a také popsuje základí regresí modely, které jsou používáy př řešeí příkladů. Dále teoretcká část mmo jé popsuje používaou metodu ejmeších čtverců a defuje základí parametry (apř. dex determace), podle kterých se vybírá optmálí regresí model v řešeých příkladech. V další část práce se pak v souladu se zadáím zaměřuj a samoté řešeí vybraých příkladů. Zpracoval jsem dva odlšé příklady, ale průběh aalýzy je v obou případech stejý. Nejprve je pomocí ástroje MS Excel vždy vytvoře regresí model. Dále se zhodotí proložeí regrese daty jedak vzuálě z vytvořeého grafu, ale hlavě podle ukazatelů kvalty regresího modelu. V ěkterých případech je provedea předběžá predkce porováím vstupích závslých proměých y a očekávaých Y vytvořeých aalýzou. Na závěr každého z příkladů je vytvořea hodotící tabulka, která obsahuje všechy vytvořeé modely s jejch parametry. Vzájemým porováím parametrů se vybere ejoptmálější model. 9

10 Pojmy regresí aalýzy. Pevá a volá závslost Je vhodé rozlšt tzv. pevé a volé závslost. Závslostí pevou je případ, kdy výskytu jedoho jevu utě odpovídá výskyt druhého jevu. Pro pevou závslost je charakterstcké to, že se opakuje ve všech jedotlvých případech, v chž je pozorováa. To zameá, že j charakterzuje jedé pozorováí []. Zámým příkladem, který mohu uvést je proslulé Descartovo Myslím, tedy jsem. Jde o vztah, který se projeví s jstotou, tedy pravděpodobostí rové jedé. Průběh závslost lze přesě charakterzovat matematckou fukcí. O závslost volé hovoříme v těch případech, kdy výskyt jedoho jevu ovlvňuje výskyt druhého jevu. Podmíkou je astoupeí prvího jevu. Je to tedy závslost, př íž jede jev podmňuje jev jý je s určtou pravděpodobostí a v růzé teztě. Jsou-l tedy jevy spojey volě, eříká ám jedé pozorováí o jejch závslost vůbec c. Takto pozorovaá závslost může být ahodlá []. Př rozšířeí těchto úvah a statstcké zaky, které bude vhodější azývat proměým, zameá pevá závslost vztah, kdy hodotě jedé proměé odpovídá jeda a je jeda hodota jých proměých a podobě aopak. Jedá se o pevou závslost, protože je v podstatě kauzálí (když astae jeda událost, tak s pravděpodobostí astae další určtá událost). Volou závslostí pak dle Hdlse rozumíme vztah, kdy hodotám (apř. jedé proměé) odpovídají sce růzé hodoty jé proměé, ale kdy lze hovořt o jakés obecé tedec, která se projevuje př změách hodot těchto proměých. Z toho tedy plye, že hodoty se měí plyule s určtou pravděpodobostí v závslost a proměých. Ozačme jede statstcký zak (jedu proměou) jako x, druhý statstcký zak jako y. Pak můžeme př volé závslost mez x a y očekávat změy hodot y př změách hodot x a aopak tedec změ hodot x př změách hodot y [5].. Fukčí závslost Pokud hodota jedé proměé závsí a hodotách druhé proměé, pak říkáme, že je tato závslost určea fukčím vztahem y = f(x). Pokud tedy záme kokrétí hodoty x, pak dokážeme přesě určt, jaké hodoty abude proměá y. Kdekolv je takový pevý, čl fukčí stav mez kvattatvím statstckým zaky, říkáme, že závslost je úplá []. V praktckých úlohách eí stuace zdaleka tak jedozačá. Na sledovaou velču 0

11 epůsobí obvykle pouze jeda áhodá velča X, ale většou je jch více. V takovémto případě eí mez velčam X a Y fukčí závslost, ale přesto se jedá o velčy závslé. Nemluvíme pak o závslost fukčí, ale stochastcké..3 Statstcká závslost (stochastcká) Defce [7]: Nechť X, Y jsou dvě áhodé velčy. Jestlže změa hodoty jedé áhodé velčy vyvolá změu rozděleí pravděpodobost druhé áhodé velčy, říkáme, že áhodé velčy X, Y jsou stochastcky závslé. Proměou y považujeme za stochastcky závslou a proměé x tehdy, jestlže se př změách proměé x, měí podmíěá rozděleí četostí proměé y[5]. Zaky stochastcké závslost [7]: a) Změy závslé proměé jsou vysvětley pouze ěkterým (e všem) čtel těchto změ, b) bere se v úvahu působeí áhodých vlvů, c) přpouštíme možost chyb. Příkladem může být počet čleů domácost a výdaje domácost a ákup potrav. Je možé tvrdt, že určtému počtu čleů domácost odpovídá určté rozděleí výdajů a potravy. Výdaje a potravy jsou ovlvěy růzým ekotrolovatelým vlvy, které azýváme áhodým vlvy (oslava jublea, ávštěva, emoc, deta..) Závslostí statstckou azýváme volou závslostí (defováo v podkaptole.), která se týká kvattatvích zaků. Se závslostm pevým se většou setkáváme v teoretcké oblast. Takovým způsobem byl zformulová Newtoův gravtačí záko ebo Ohmův fyzkálí záko a z oblast ekoomcké je možé sem zařadt růzé teoretcké zákoy. Jedá se apříklad o závslost možství peěz v ekoomce a úrocích. V reálých stuacích se setkáváme většou pouze s volým závslostm. Za obecým tedecem, projevujícím se v souboru statstckých údajů se mohou ukrývat hlubší zákotost vztahů mez velčam. K pozáí a matematckému popsu statstckých závslostí slouží metody regresí aalýzy.

12 Regresí fukce Defce [7]: Nechť exstují X a Y, které jsou áhodým velčam. Podmíěou středí hodotu E(Y x), považovaou za fukc proměé x, budeme azývat regresí fukcí áhodé velčy Y vzhledem k X. Regresí fukce vyjadřuje změy podmíěé středí hodoty jedé áhodé velčy př změě hodot druhé áhodé velčy. Graf regresí fukce azýváme regresí křvka. Jak jž bylo apsáo výše, pomocí regresí fukce můžeme předpovídat, jaké hodoty abude jeda áhodá velča, když záme hodotu druhé áhodé velčy. Protože Y je áhodá velča, emusí vždy př daé hodotě x áhodé velčy X abýt hodoty E(Y x), ale bude abývat hodoty rozptýleé okolo í, což vyplývá z vlastostí áhodých velč. Hlavím úkolem regresí aalýzy je zjštěí tvaru stochastcké závslost a parametrů regresí fukce. V regresí aalýze se budeme zabývat závslostí áhodé velčy Y a velčě X (ezávsle proměé), která může být obecě m rozměrá. [7].. Jedoduchý model leárí regrese Jedoduchý model leárí regrese je takovým regresím modelem, kdy grafem regresí fukce je přímka. Pro větší srozumtelost u parametrů β 0 a β použjeme ozačeí α a β. Předpokládejme, že Y je -tce ekorelovaých (ezávslých) áhodých velč s vlastostm středí hodoty EY = α + β x, ezámé parametry a x, x,, x DY = σ, =,,..,, kde α, β, σ jsou je -tce zámých hodot. Pak jedoduchým modelem leárí regrese budeme azývat model Y = α + β x + ε, kde složky ε jsou ezávslé áhodé velčy, pro které platí Eε = 0, působeí áhodých vlvů, které ejsou zahruty do modelu [7]. Dε = σ, =,,..,. Tyto složky obsahují Přímka y = α + β x se azývá regresí přímka. β je její směrce, která udává sklo regresí přímky. Pokud je směrce kladá, je regresí přímka rostoucí, v opačém případě je klesající. α je kostata matematckého modelu, která ám určuje, v jaké vzdáleost od počátku přímka vede, přčemž může být záporá. Abychom dostal platý regresí model, musíme odhadout ezámé parametry α, β, σ modelu. Tyto odhady budeme po řadě

13 začt A, B, S. Bodové odhady parametrů α, β získáme metodou ejmeších čtverců, která je popsáa podrobě v kaptole 3.. Modely leárí vzhledem k parametrům Modely leárím vzhledem k parametrům rozumíme modely, kde je závslost k popsáa regresí fukcí g( x, β0, β, β,..., β ) = β g ( x), kde g jsou fukce proměých x x x x m k 0 = (,,..., ). Ukázky leárích modelů jsou uvedey v ásledujících rovcích [7]: Přímková regrese g( x, β0, β) = β0 + βx. (.0) Parabolcká regrese g( x, β, β, β ) β β x β x 0 = (.) Hyperbolcká regrese g( x, β0, β) = β0 + β. x (.) Logartmcká regrese g( x, β0, β) = β0 + β log x. (.3) Regresí rova g( x, β0, β, β) = β0 + βx + βx. (.4).. Přímková regrese y β Nejpoužívaějším typem regresí fukce je přímková regrese uvedeá ve tvaru β = 0 + x. Staovíme odhady parametrů 0 metodu ejmeších čtverců, formulovaou podmíkou β a β. K odhadům parametrů používáme ( y ɵy ) chyb mmálí. Dosadíme-l do této podmíky rovc regresí, dostaeme:, aby byl součet čtverců ε ( y ) β0 βx Q = =. (.5) Součet čtverců Q je fukcí ezámých parametrů. Pro určeí mma je uté vypočítat prví parcálí dervac podle β j, kde j=0,. V dalším kroku tyto dervace potom Podkaptoly upravey ze zdroje Hdls, R., Hroová, S., Seger, J. Statstka pro ekoomy. 3

14 položt rovy ule. Parametry β j ahradíme jejch odhady b j, j=0,. Zdůrazňuj, že parcálí dervace jsou v tomto případě podle odhadů b 0 v případě prví rovce a b v případě druhé rovce (.6). Ostatí čley jsou kostaty. ( y b0 b x ) =, (.6) ( ) 0 ( y b0 b x ) x =. ( ) 0 Po ásledém počítáí se sumam a po úpravě dostaeme dvě ormálí rovce: y = b0 + b x, (.7) yx = b0 x + b x. Velčy, x, y, x a y x můžeme vypočítat z emprckých pozorováí. Proto je uté určt pouze odhady parametrů β 0 a β řešeím soustavy rovc (.7). Pro výpočet odhadů b 0 a b použjeme Cramerovo pravdlo, které se používá pro řešeí soustavy leárích algebrackých rovc. Použtím Cramerova pravdla dostáváme : b 0 yx x y x = = x x x y x x yx x x, (.8) 4

15 x yx b = = x y x x y x x y x x... Parabolcká regrese Parabolcká regrese má tvar y x x = β0 + β + β. Pokud tuto rovc opět dosadíme do podmíky ejmeších čtverců ɵ ( y y ) a budeme aplkovat postup použtý u přímkové regrese, dostaeme formulac zázorěou vztahem (.9). ( ) ε β0 β β. (.9) Q = = y x x Po výpočtu prvích parcálích dervací výrazu podle β 0, β a β ahradíme obecě jejch odhady b j, j=0,, a pak parcálí dervace položíme rovy ule. Bude tedy platt: β j ( y b0 b x b x )( ) = 0, (.0) ( y b0 b x b x )( x ) = 0, ( y b0 b x b x )( x ) = 0. Po úpravě máme tř ormálí rovce, jejchž řešeím získáme odhady parametrů β 0, β a β. Rovce mají tvar: y = b0 + b x + b x, (.) 5

16 3 yx = b0 x + b x + b x, 3 4 yx = b0 x + b x + b x. Odhady b 0, b, b parametrů β 0, β a β získáme vyřešeím soustavy rovc (. )...3 Polyomcká regrese Zobecěím předcházejících typů regresích fukcí je polyomcká regrese ve tvaru y x x x p = β0 + β + β β p. Postupujeme jako u paraboly a dostaeme: p ( y b0 b x bpx )( )... = 0, (.) p ( y b0 b x bpx )( x )... = 0,.. p p ( y b0 b x bpx )( x )... = 0. Po úpravě dostaeme soustavu rovc, které mají ásledující tvar: p y = b0 + b x bp x, (.3) p yx = b0 x + b x bp x +, p p p p yx = b0 x + b x bp x. 6

17 V prax se setkáváme ejvýše s polyomy 3. až 4. stupě. I v tomto případě dostaeme odhady parametrů β0, β,..., β p vyřešeím předchozí soustavy rovc (.3)...4 Hyperbolcká regrese β Hyperbolcká regrese má tvar y = β0 +. Př použtí stejého postupu, sloužícího x k odhadu parametrů jako v předcházejících případech, získáme metodou ejmeších čtverců soustavu ormálích rovc. y = b + b, (.4) 0 x y = b + b x 0 x x. Řešeím těchto rovc dostaeme odhady parametrů: b y x x x 0 = x x y, (.5) y y x x = b x x...5 Logartmcká regrese Posledí z fukcí leárích v parametrech, o které se chc stručě zmít pro její použtelost je fukce y = β β log x 0 +. Metodou ejmeších čtverců dostaeme ormálí rovce: y = b + b log x, (.6) 0 7

18 y log x = b0 log x + b log x..3 Modely eleárí vzhledem k parametrům Tyto modely je možé vhodou trasformací upravt a leárí tvar vzhledem k parametrům. Odhady parametrů modelů leárích a modelů, které je možo trasformovat a leárí tvar se provádějí ejčastěj metodou ejmeších čtverců [6], která bude popsáa v kaptole 3. Ukázky eleárích modelů jsou uvedey v ásledujících rovcích [7]: Regresí mocá fukce g( x, β, β ) = β x β. (.7) 0 0 x Regresí expoecálí fukce g( x, β0, β) = β0 β. (.8).3. Expoecálí regrese Parametry fukcí, které ejsou leárí eodhadujeme metodou ejmeších čtverců přímo, protože její použtí vede k soustavě eleárích rovc. Proto ajdeme jejch vhodý počátečí odhad a postupým zlepšováím řešeí alezeme odhad s požadovaou přesostí. Metod počátečího odhadu je celá řada. Jejch umercké řešeí však bývá ěkdy zdlouhavé a ásledé alezeí vhodého počátečího odhadu emusí být jedozačé. Ukážeme s jedoduchý způsob, kdy určtou regresí fukc, která eí leárí z hledska parametrů, můžeme pomocí learzující trasformace a fukc leárí v parametrech převést. Trasformace spočívá v tom, že pomocí logartmů, převráceím hodot a dalším úpravam dojdeme k takovému tvaru regresí fukce, že její parametry bude už možé x odhadout metodou ejmeších čtverců. Expoecálí fukce má tvar y = β0 β Provedeme logartmckou trasformac: log y = log β + x log β (.9) 0 Po learzac (.9) jž můžeme postupovat stejě jako v případě leárí regrese s tím rozdílem, že podmíka metody ejmeších čtverců bude v logartmckém tvaru (.0,.): Upraveo ze zdroje Hdls, R., Hroová, S., Seger, J. Statstka pro ekoomy. 8

19 , (.0) ( ) log log ˆ Q = y y 0. (.) ( ) log log β log β Q = y x Stejým způsobem dostaeme ormálí rovce: log y = log b + log b x, (.) 0 x log y = log b0 x + log b x. Jejch řešeím dostaeme: log b log y x - x log y 0 = x - x, (.3) log b x log y log y x = x x. log 0 Odhady parametrů β0 a β jsou potom 0 b log b 0 = a 0 b b =..4 Modely obtížě learzovatelé vzhledem k parametrům Tyto eleárí modely se edají jedoduše trasformovat a leárí tvar g( x, β, β β ) = β β + β (.4) x 0, 0 Neí proto vhodé použít metodu ejmeších čtverců pro odhady parametrů. Používáme jé metody, apř. metodou částečých součtů, metodou dílčích průměrů, ebo metodou vybraých bodů [7]. 9

20 3 Metoda ejmeších čtverců Až dosud jsme se zabýval odhadem ezámých parametrů pro průběh leárí regrese, až bychom s o metodě odhadu těchto parametrů řekl ěco podrobějšího. Proto je potřeba s říc o prcpech této metody více. Parametry emprckých regresích fukcí se ejčastěj určují metodou ejmeších čtverců. Metodu ejmeších čtverců lze použít ke staoveí parametrů jých fukcí, ež je přímka. Tato metoda je použtelá ke staoveí parametrů všech fukcí, jež jsme azval leárí regresí fukce [3]. Předpokládejme, že máme kokrétí dvojce aměřeých hodot ( x, y),( x, y),...,( x, y ). Hledáme takovou fukc (odhad) ɵ y = a + bx, aby v jstém smyslu co ejvíce přléhala k bodům ( x, y),( x, y),...,( x, y ), kde přléháí měříme součtem rozdílů ɵ y y (tzv. rezduí). Jde tedy v podstatě o to, že chceme odhadout reálé souřadcové body, aby rozdíly mez skutečým hodotam a těm odhadutým byly co ejmeší. Aby se ovšem estalo, že př začých odchylkách mez ɵ y a y se kladé a záporé rozdíly avzájem odečtou, vezmeme jako míru přléháí e prostý součet rezduí, ale součet jejch čtverců [7]. Můžeme tedy říc, že dvojce ( x, y),( x, y),...,( x, y) jsou počátečí aměřeá vstupí data, která budou pomocí ejmeších čtverců proložea apříklad regresí přímkou ɵ y = a + bx. Nám jde o to, aby rozdíl mez prokládaým skutečým daty a jejch odhadem daým regresí fukcí byl co možá ejmeší. Teto vztah vyjadřuje vzorec (3.0) [7]. ɵ ( y y ) = m. (3.0) Na ásledujícím obrázku (Obrázek ) je metoda zachycea grafcky. Stručě jej lze popsat tak, že dvojce (x, y ) je -tá hodota skutečě aměřeých bodů. Body regresí přímky ɵ y = a + bx jsou odhadem skutečých hodot. Čím meší jsou čtverce vzdáleostí (vztah 3.0), tím lepší je odhad a proložeí regresí fukce. 0

21 Obrázek : Metoda ejmeších čtverců [3] Budeme tedy v jedoduchém leárím modelu hledat mmum fukce, kde A, B jsou odhady kostaty a a směrce b daé přímky, Y je áhodou velčou. Následující matematcké vztahy jsou převzaty ze zdroje [7]. S( A, B) = ( Y Y ) = ( Y A Bx ), (3.) Hledáme parcálí dervac (směrovou dle jedé a ásledě druhé proměé) prvího řádu: S = A ( Y A Bx ) ; S = B ( Y A Bx ) x, Vypočítáme extrém fukce dvou proměých. Nutou podmíkou je ulovost obou parcálích dervací prvího řádu: ( Y A Bx ) = 0 ; ( Y A Bx) x = 0. Po úpravě (jedá se o algebracké úpravy se sumam) dostaeme soustavu ormálích rovc: A + B x = Y, (3.)

22 A x + B x = xy. Z rovc (3.) vypočteme odhady A, B: x Y x Y B = x ( x ) ; A = x Y x xy x ( x ). (3.3) K ověřeí, že fukce S (3.) abývá mma musíme určt parcálí dervace druhého řádu: S A = ; S = x ; A B S B = x. Výsledkem výrazu S S S A B A B dostaeme: 4 x 4 x = 4 x x + x = 4 = ( ) x x 4 ( ) x x > 0. Podle věty z dferecálího počtu víme, že pokud výraz S S S A B A B abývá kladé hodoty a také parcálí dervace S = A (což platí), má fukce S ostré lokálí mmum. a S = B x abývají kladých hodot Regresí přímka, získaá takto metodou ejmeších čtverců, má tvar ɵ y = A + Bx. Uvedeou rovc lze upravt a tvar Y = Y + B ( x x )[7].

23 Dále dokážeme, že odhady A, B parametrů α, β jsou evychýleé. Pro toto tvrzeí musí platt EB = β a EA = α. Nejprve upravíme tvar odhadu parametru β (vzorec 3.3): x Y x Y B = = x ( x ) x Y x Y x x = x Y xy + x x x x = ( x x) Y ( x x) = Y. x x ( x ) x Nyí ověřujeme EB = β x x EB = E Y ( ) = EY x x ( x x ) ( x x ) x x x x = ( α + β x ) = α = ( x x) ( x x) + β ( x ) x x ( x x) = β protože ( x x) = 0 ; ( x x) x = ( x ) x. Dále ověříme EA = α Y B x EA = E = EY xeb = ( α β x ) β x + = α = α. Dokázal jsme, že odhady A, B parametrů α, β pomocí metody ejmeších čtverců jsou evychýleé. Fukce Y = A + Bx je tedy evychýleým odhadem regresí přímky y = α + β x [7]. 3

24 4 Volba regresí fukce 4. Věcě ekoomcká krtéra Vhodá regresí fukce by měla být zvolea a základě věcého rozboru vztahů mez velčam. Základem pro rozhodováí o vhodém typu regresí fukce by měla být věcá krtéra. Př věcé aalýze založeé a platé teor lze v ěkterých případech posoudt, zda jde o fukc rostoucí č klesající, jaký je smysl zakřveí, přchází-l v úvahu flexí bod č kolv. Zda jde o fukc ekoečě rostoucí ebo aopak o fukc s růstem ke koečé lmtě. K tomu ám samozřejmě může dobře posloužt vyšetřeí průběhu fukce dle obecých postupů. Lze získat předběžé formace o parametrech modelu apod. Jdy lze použít př volbě regresí fukce zkušeost získaé s použtím určtého typu regresí fukce jž v mulost. Jde-l o závslost, která byla jž jedou popsáa, stačí ověřt, zda edošlo k takové změě podmíek ebo zkoumaého jevu, který by měl vlv a výběr regresí fukce [5]. Toto všecho jsou postupy ozačovaé v odboré lteratuře jako věcě ekoomcké ástroje, které ám mohou usadt rozmýšleí, který regresí model prokládá daou závslost mez proměým ejlépe. 4. Emprcký způsob volby Nestaovíme-l vhodý typ regresí fukce a základě ekoomckých krtérí, uchylujeme se k emprckému způsobu volby. Základí metodou je metoda grafcká, kdy průběh závslost zázorňujeme ve formě bodového dagramu. Každá dvojce x a y zde tvoří jede bod tohoto grafu. Podle průběhu proložeí bodového grafu rozhodujeme, jaký typ kokrétí regresí fukce (přímka, parabola...) je pro pops sledovaé závslost ejvhodější. K tomu, abychom zhodotl kvaltu získaé regresí fukce a evetuálě posoudl oprávěost ěkterých předpokladů, které souvsejí s uplatěím požadovaých metod odhadu používáme růzá matematcko statstcká krtéra [6]. Ekoomcká matematcko-statstcká krtéra mají své výhody evýhody. Podle zastáců ekoomckých krtérí dobrý ekoomcký rozbor stuace umožňuje alézt vhodý typ fukce. Zastác používáí matematcko-statstckých krtérí se aopak přkláí k ázoru, že kvalfkovaý rozbor číselých údajů je schope jedozačě určt tvar ejlepší regresí fukce bez zalost zkoumaých ekoomckých velč[6]. 4

25 5 Kvalta regresí fukce a tezta závslost Jedím z úkolů regresí aalýzy je posouzeí kvalty regresí fukce a zjštěí tezty (síly, těsost) závslost. Regresí fukce je tím lepší, čím je posuzovaý vztah slější, a čím více jsou emprcké hodoty vysvětlovaé proměé soustředěé kolem odhadu regresí fukce. Naopak vztah je tím slabší, čím více jsou emprcké hodoty vzdáley hodotám vyrovaých Y. Míra tezty závslost úzce souvsí s hodoceím účost odhaduté regresí fukce a tedy s kvaltou regresího odhadu. Pro kvaltu regresí fukce používáme zejméa charakterstky jako dex korelace, dex determace, rozptyl a aalýzu rezduí. Tyto charakterstky jsou v jedotlvých podkaptolách vysvětley. 5. Rozptyly emprckých, vyrovaých a skutečých hodot Můžeme zkostruovat tř rozptyly se zcela odlšou vypovídající schopostí [5]: a) Rozptyl emprckých hodot: ( ) y, (5.0) s = y y b) rozptyl vyrovaých hodot: ( ) s = Y y Y, = c) rozptyl skutečých hodot (rezduálí rozptyl): s ( y Y ). ( y Y ) = Př použtí metody ejmeších čtverců mez uvedeým rozptyly platí: s = s + s y Y ( y Y ) Rozptyl emprckých hodot můžeme rozložt a rozptyl vyrovaých hodot a rozptyl rezduálích hodot. Všechy emprcké hodoty by byly zároveň hodotam vyrovaým, kdyby mez závsle proměou y a vysvětlující proměou x exstovala fukčí závslost. Potom by se rozptyl emprckých hodot roval rozptylu vyrovaých hodot a rezduálí rozptyl by byl ulový. Platlo by s = s. Pokud by exstovala úplá y Y ezávslost mez oběma proměým, pak by všechy vyrovaé hodoty byly stejé a jejch rozptyl ulový. Vhodá je regresí fukce s meším rozptylem [5]. 5

26 5. Idex determace Z uvedeého vyplývá, že tezta závslost bude zřejmě tím slější, čím větší bude podíl rozptylu vyrovaých hodot a celkovém rozptylu. Naopak tezta bude tím slabší, čím bude podíl tohoto rozptylu meší. Toto určuje, jakou část varablty sledovaých hodot je možé vysvětlt daým modelem. Parametr může abývat hodot v tervalu <0,> [6]. Sílu závslost je tedy možé měřt poměrem rozptylu vyrovaých a emprckých hodot. I yx s = (5.) s Y y Teto poměr se azývá dex determace [5] a v případě leárí regrese se začí jako koefcet R. U fukčí závslost bude jeho hodota rova, v případě ezávslost abude hodoty ula. Čím více se bude blížt jedé, tím je závslost slější a dobře vysthuje regresí fukc. Čím více se bude blížt ule, tím považujeme daou závslost za slabší a regresí fukc za méě výstžou [6]. Během hodoceí a základě dexu determace je také třeba uvažovat, že jeho velkost je ovlvěa tím, zda se ám podařlo alézt vhodý typ regresí fukce pro pops daé závslost. Vyjde-l potom ízká hodota dexu determace, emusí to ještě zameat ízký stupeň závslost mez proměým, ale může to sgalzovat chybou volbu regresí fukce. Vhodější je model s vyšším dexem determace. Je třeba vzít v úvahu, že hodota dexu determace bývá vyšší pro regresí fukce s větším počtem parametrů. Proto je vhodé ověřt volbu vhodého modelu dalším testy. 5.3 Idex korelace K měřeí těsost závslost se v prax obyčejě epoužívá pouze samotého dexu determace, ale také jeho odmocy, kterou azýváme dex korelace [5]. I yx s = (5.) s Y y Idex korelace poskytuje stejé formace o těsost závslost jako dex determace. Teto dex však má meší vypovídací schopost [5]. 6

27 5.4 Aalýza rezduí Umožňuje posoudt vhodost zvoleé regresí fukce podle průběhu rezduí e = y -Y [6]. Rezdua zobrazeá v závslost a hodotách proměé x umožňují ověřt vhodost tvaru regresí fukce a splěí předpokladu kostatost rozptylu. Rezdua zobrazeá v závslost a pořadí pozorováí umožňují odhalt porušeí předpokladu ezávslost. Rezdua zobrazeá v závslost a hodotách v modelu dosud ezařazeých proměých ukazují, zda je vhodé zařadt příslušou proměou do modelu. Vhodý je model s ízkým hodotam rezduí [6]. 6 Cíl regresí aalýzy Cílem regresí aalýzy je přspět k pozáí příčých vztahů mez statstckým zaky. Úkolem regresí aalýzy je také matematcký pops systematckých okolostí, které provázejí statstcké závslost. Je zde saha alézt dealzující matematckou fukc tak, aby co ejlépe vyjadřovala charakter závslostí a co ejlépe zobrazovala průběh změ podmíěých průměrů závslé proměé. Tato hypotetcká matematcká fukce se azývá regresí fukce. Záměrem aalýzy je co ejlepší přblížeí emprcké regresí fukce k hypotetcké regresí fukc. Pro hlaví cíle regresí aalýzy je uto splt řadu dílčích úkolů. Některé z ch jsou apříklad [5]: a) Shromáždt a matematcky formulovat aprorí představy o charakteru regresí fukce, b) formulovat aše představy o souhrém působeí euvažovaých statstckých zaků, c) odhadout emprckou regresí fukc a základě statstckých pozorováí, d) posoudt kvaltu emprcké regresí fukce z hledska důvodů a cílů statstckého zjšťováí. Zvoleý typ regresí fukce by měl respektovat zákotost souvslost jedotlvých áhodých jevů. Př volbě typu regresí fukce se přhlíží k tomu, aby zvoleý model byl ejjedodušší a zároveň aby odchylky teoretckých a emprckých hodot byly mmálí. Rozhodováí často usadí sestaveí bodového dagramu, kterým se příslušá regresí fukce proloží. 7

28 7 Příklad Po teoretcké část, jejímž cílem bylo objast podstatu regresí aalýzy se zaměřím a praktcké příklady. Oba příklady jsou zpracováy v tabulkovém programu MS Excel využtím astalovaého balíku Aalýza dat (Příloha,, 3), který obsahuje metody regrese. Zadáí tohoto příkladu je ze sbírek úloh ze statstky od Mgr. Slívka z terích zdrojů VOŠ Česká Třebová [0]. Nejprve je uvedeo zadáí příkladu spolu s tabulkou a grafem dat. V dalších částech jsou zobrazey jedotlvé regresí fukce a podstaté údaje z regresí aalýzy zpracovaé ástrojem MS Excel. Následuje výběr optmálí regresí fukce. 7. Zadáí U dvacet prodaých ojetých automoblů určté začky byla zjštěa cea y [ts. Kč] a počet ajetých klometrů [ts. km] x. Nalezěte ejvhodější regresí křvku vysthující závslost cey automoblů a počtu ajetých klometrů. Tabulka : Data x (km) y (cea), 55,5 54,6 0,4 50,6 4,5 5, 3,4 47 8,6 50 3,4 43,6 5,3 4, , , 3 44, ,6 36,4 34 8,6 5,6 64,5 8 70,8 4,6 78,7 7 90, 7,6 Obrázek : Vstupí data Výše jsou zobrazea data v tabulce (Tabulka ), kde x (ajeté klometry) vyjadřují ezávslé proměé a y zobrazují závslé proměé (cea vozů). Cea automoblu je závslá a ajetých km. Bodový graf (Obrázek ) vedle tabulky s daty zobrazuje vstupí hodoty. 8

29 7. Aalýza regresí přímky Níže můžeme vdět (Obrázek 3, str. 30), že regresí přímka sestrojea z ezávslých proměých x a očekávaých hodot Y (Tabulka, str. 9) vytvořeých pomocí regresí aalýzy dobře prokládá data a tedy vysthuje závslost. K posouzeí závslost jak v tomto případě, tak v případech ostatích budeme používat jedak vzuálího hodoceí proložeí dat regresí fukcí a hlavě ukazatele regresí aalýzy. Tyto ukazatele jsou pro každou regresí fukc zobrazey ve vytvořeé regresí statstce (pod obrázkem 3 v případě regresí přímky), kde použjeme hodotu spolehlvost R (dex korelace), ásobé R (dex determace) a chybu středí hodoty (resduálí směrodatá odchylka s). O dexu korelace a dexu determace víme z teoretcké část, že čím větší hodoty mají, tím je model lepší. Chyba středí hodoty by aopak měla být co ejžší. V ukazatelích ANOVA, které jsou také vytvořey pro každou regresí fukc v rámc aalýzy, se zaměříme a tučě zvýrazěá rezdua a výzamost F. I tyto parametry by měly být co ejžší. Jak jž bylo apsáo výše, regresí fukce přímky dobře prokládá data. Potom můžeme říc, že hodoty skutečě aměřeých dat se přílš eodchylují od jejch odhadů vyjádřeých regresí fukcí. Tomu by odpovídaly velm dobré parametry regresí statstky pod grafem regresí přímky jako je dex korelace a dex determace, kdy se oba parametry blíží jedé. Jak víme z teoretcké část (Kaptola 5), tyto parametry ám vypovídají o těsost závslost regresí fukce. V případě plé fukčí závslost jedé proměé a druhé, by oba koefcety měly hodotu. Chybu středí hodoty, ebo-l rezduálí rozptyl a rezdua můžeme porovávat až s výsledky ostatích regresích fukcí. Pro rezduálí rozptyly a stejě tak pro hodoty rezduí platí, že čím jsou hodoty těchto parametrů žší, tím je regresí model lepší. U obou parametrů je to proto, že regresí křvka je tím lepší, čím blíže je všem aměřeým datům. Právě tuto vzdáleost křvky od skutečě aměřeých dat oba parametry popsují. Potom platí, že čím meší jsou hodoty těchto parametrů, tím meší je vzdáleost odhadu křvky od dat, a tím lepší je proložeí dat křvkou. Parametr výzamost F, sce eí v teoretcké část popsová, ale to z toho důvodu, že ás pouze formuje o celkové výzamost statstckého modelu. Platí, že čím je regresí model statstcky výzamější, tím je hodota tohoto parametru žší. Za statstcky evýzamý model se pokládá takový model, který by měl parametr výzamost F větší jak 0,05. Pokud toto platí, tak s jstotou 95% zamítáme hypotézu o výzamost modelu. 9

30 Potom můžeme říc, že tato regresí přímka je modelem statstcky výzamým. Jak o regresí přímce samoté můžeme říc, že parametr b 0 ebol její kostata protíá osu y zhruba v hodotě 5,5 a její směrce b je záporá, protože přímka má tvar klesající. V tabulce dole (Tabulka ) jsou obsažey jedotlvé ezávslé hodoty x (počet ujetých km) a závslé hodoty y (cea). Tato data, a rozdíl od pole očekávaá Y jsem do tabulky zadal a jsou vstupím daty. Pole očekávaá Y bylo vytvořeo regresím modelem. Totéž platí pro tyto tabulky u ostatích regresích modelů, které jsou dále uváděy v příloze (Příloha 4 až 6). Hodoty očekávaá Y s můžeme představt jako body, kterým aše regresí křvka bude procházet. Je to v podstatě jž mohokrát zmňovaý odhad regresího modelu v tomto případě pro regresí přímku. Čím jsou tato očekávaá Y podobější skutečým hodotám y, tím lépe model prokládá data. Jž z této tabulky bychom alespoň částečě mohl odhadout, že regresí přímka bude data dobře prokládat, protože ve většě případů odchylka hodot pole očekávaá Y a y eí velká. Tabulka : Vstupí data a očekávaé hodoty regresí přímky x y Očekávaá Y, 55 5,576,5 54,6 5, ,4 50,6 48, ,5 5, 50, ,4 47 4, , , ,4 43,6 40, ,3 4,3 43, , ,9 3, , , 3 8, ,5 9 36, ,6 37, , , ,6 5,6, ,5 8 8, ,8 4,6 6, ,7 7 3, , 7,6 9,

31 Obrázek 3: Regresí přímka VÝSLEDEK Regresí statstka Násobé R 0, Hodota spolehlvost R 0, Nastaveá hodota spolehlvost R 0, Chyba středí hodoty 4, Pozorováí 0 ANOVA Rozdíl SS MS F Výzamost F Regrese 053, ,97 9,,73E-09 Rezdua 8 30,44 7,30 Celkem 9 364,8 7.3 Aalýza regresí paraboly Opět je vytvořea tabulka (Příloha 4) s potřebým daty. Tabulka obsahuje ezávslá závslá vstupí data x a y. Mmo očekávaých hodot Y vytvořeých regresí aalýzou je zde avíc druhá moca x, kterou zadáváme v MS Excel do ástroje aalýzy dat. Z íže uvedeého grafu (Obrázek 4) můžeme vdět, že regresí parabola velm dobře prokládá data. Na tomto příkladu lze pozat, že vzualzace k posouzeí optmálího 3

32 modelu vždy estačí. K přesému porováí (apř. mez přímkou a parabolou) je uté použít číselé údaje z ANOVY a regresí statstky. Je uté použít údajů z aalýzy dat, protože kvalta regresí fukce eí vždy pouhým porováím proložeí regresích fukcí daty hed patrá. Kdybychom se spoléhal pouze a áš vlastí úsudek, lehce bychom mohl způsobt chybu. Z regresí aalýzy můžeme prozatím zhodott, že regresí parabola má o ěco lepší parametry ež regresí přímka. Idex korelace dex determace, které určují míru těsost přléháí křvky k datům jsou v případě přímky paraboly blížící se jedé. Výzamost F určující statstckou výzamost modelu je v obou případech v pořádku. Chybu středí hodoty ebol rezduálí rozptyl čtverců a rezdua má ale parabola lepší. Obrázek 4: Regresí parabola VÝSLEDEK Regresí statstka Násobé R 0, Hodota spolehlvost R 0, Nastaveá hodota spolehlvost R 0, Chyba středí hodoty 4, Pozorováí 0 ANOVA Rozdíl SS MS F Výzamost F Regrese 080, ,99 6,376,4906E-08 Rezdua 7 83,7883 6,68934 Celkem 9 364,75 3

33 7.4 Aalýza regresího polyomu 3. stupě Vytvořeá tabulka (Příloha 5) obsahuje závslé proměé y a ezávsle proměé x. V tabulce je zařazea ově vytvořeá proměá x 3, protože se jedá o polyom 3. stupě. Hodoty proměé x 3 spolu s hodotam y byly dále zpracováy pro účely aalýzy. Opět jsme dostal hodoty očekávaá Y, vytvořeé aalýzou regresího polyomu 3. stupě. Polyom a základě porováí očekávaých Y se skutečým hodotam y (Příloha 5) prokládá vstupí data velm dobře, protože chyby daé rozdílem obou proměých ejsou velké. Více ež z přílohy se ale jstě dozvíme z grafckého výstupu a především z parametrů regresí aalýzy. Obrázek 5: Regresí polyom Z grafckého výstupu vdíme, že polyom dle očekáváí optmálě prokládá data. Stejě jako v předchozích případech evdíme žádé vybočující hodoty skutečých dat y, které by ebyly křvkou proložey. Proto bude uté použít údaje z regresí statstky a ANOVY pro koečé porováí modelů. Výsledky regresí aalýzy jsou podobé jako v případě regresího modelu paraboly, ale ve všech případech je teto model ještě lepší. Porováme-l dex korelace a dex determace, je těsost přléháí skutečých dat ke křvce lepší. Pokud porováme rezdua a chybu středí hodoty, zjstíme, že tyto vlastost má polyom prozatím ejlepší. 33

34 Regresí statstka Násobé R 0, Hodota spolehlvost R 0, Nastaveá hodota spolehlvost R 0, Chyba středí hodoty 4, Pozorováí 0 ANOVA Rozdíl SS MS F Výzamost F Regrese 3 0, ,8 4,849 7,4368E-08 Rezdua 6 6,6846 6,3559 Celkem 9 364,8 7.5 Aalýza regresí hyperboly Do tabulky vytvořeé pro aalýzu regresí hyperboly (Příloha 6) jsou opět zaeseé hodoty vstupích proměých y a x. Pro účely regresí aalýzy byla vytvořeá proměá /x, protože se jedá o hyperbolu a z teoretcké část víme, že regresí hyperbola má tvar β y = β 0 +. Koefcet β 0 bude vypočítá aalytckým ástrojem, ale koefcet β rový x jedé jsme zvoll my, protože základí tvar fukce hyperboly je y = /x. Porováím očekávaých hodot Y se skutečým hodotam y v příloze můžeme vdět, že hyperbolcká závslost mez daty patrě ebude ejvhodější. Více se ale dozvíme z regresí aalýzy. Obrázek 6: Regresí hyperbola 34

35 Z obrázku vdíme, že regresí hyperbola dle předpokladu zdaleka eprokládá vstupí data stejě dobře jako předchozí modely. Z grafu je jasě patrý rozdíl mez skutečým daty a regresí křvkou. Nevhodě je proložea zejméa část křvky u počátku osy x a poté se regresí křvka chová skoro jako přímka bez větších změ. Z tohoto důvodu s myslím, že aalýzu dat pomocí MS Excel bychom a uvádět emusel. Pro pořádek s j ale v tomto dalších případech uvádět budeme. Alespoň tak pozáme, zda je model statstcky výzamý. Uvedu je pro porováí, že dex determace a dex korelace je mohem horší (žší) ež v předchozích případech. Chyba středí hodoty a rezdua jsou také výzamě horší (vyšší). Tedy rozdíl mez skutečým daty a odhadovaým hodotam vyjádřeý regresí hyperbolckou závslostí mez daty je velký. I přesto je model statstcky výzamý, protože platí 0,0045 < 0,005. VÝSLEDEK Regresí statstka Násobé R 0, Hodota spolehlvost R 0, Nastaveá hodota spolehlvost R 0, Chyba středí hodoty 9,08738 Pozorováí 0 ANOVA Rozdíl SS MS F Výzamost F Regrese 870, ,6784 0, , Rezdua 8 493,439 8,96884 Celkem 9 364,8 7.6 Aalýza regresí expoecály Jž z tabulky uvedeé v příloze (Příloha 7) vdíme, že regresí model expoecálí závslost mez daty bude as zcela epoužtelý, protože rozdíl mez očekávaým Y a skutečým y je velký. Navíc se teto model chová u většy hodot téměř kostatě a emá a sahu data optmálě prokládat. 35

36 Obrázek 7: Regresí expoecála Z obrázku vdíme, že teto model opravdu eí vhodý. Parametry regresí aalýzy jsou přesto pro srováí uvedey, ale dále se jm zabývat ebudeme. Nebudeme se jm zabývat, protože se stačí podívat a parametr výzamost F. Jeho hodota v případě regresí expoecály je vyšší ež 0,05 a tedy model zamítáme jako statstcky evýzamý. VÝSLEDEK Regresí statstka Násobé R 0,490 Hodota spolehlvost R 0,8406 Nastaveá hodota spolehlvost R 0,3873 Chyba středí hodoty 0,3507 Pozorováí 0 ANOVA Rozdíl SS MS F Výzamost F Regrese 435,4 435,4 4, , Rezdua 8 98,977 07,654 Celkem 9 364,8 7.7 Aalýza regresího dekadckého logartmu Z rozdílů v tabulce (Příloha 8) mez očekávaým Y a vstupím y vdíme, že model regresího dekadckého logartmu prokládá data o pozáí lépe ež regresí hyperbola ebo expoecála. Zdal jsou ale data proložea lépe ež v případě regresího polyomu ebo 36

37 regresího modelu přímky přímo z tabulky zjstt emůžeme. Proto se zaměříme a grafcký výstup a parametry regresí aalýzy. Obrázek 8: Regresí log V tomto případě ám opět pro koečé posouzeí optmálího regresího modelu pomůže aalýza dat, protože samotý graf ám data prokládá velm dobře, stejě jako v případech regresího modelu paraboly, přímky a polyomu 3. stupě. I zde se ám potvrzuje, že spoléhat se a pouhé vzuálí hodoceí z obrázku grafu je začě rzkové. Dle mého ázoru zde totž eí velký rozdíl mez proložeím dat logartmckou křvkou a zatím ejlepšího modelu regresího polyomu 3. stupě. Porováím obou modelů ale rychle zjstíme, že ve všech parametrech více vyhovuje polyom. VÝSLEDEK Regresí statstka Násobé R 0, Hodota spolehlvost R 0, Nastaveá hodota spolehlvost R 0, Chyba středí hodoty 5, Pozorováí 0 ANOVA Rozdíl SS MS F Výzamost F Regrese 86,0 86,0 6,096 3,40055E-07 Rezdua 8 537,964 9,8844 Celkem 9 364,8 37

38 7.8 Aalýza regresího přrozeého logartmu Obrázek 9: Regresí l Jak vdíme z obrázku, grafy dekadckého a přrozeého logartmus jsou téměř totožé, regresí statstky jsou s také velm podobé. Proto je zbytečé aalýzu blíže popsovat. VÝSLEDEK Regresí statstka Násobé R 0, Hodota spolehlvost R 0, Nastaveá hodota spolehlvost R 0, Chyba stř. hodoty 5, Pozorováí 0 ANOVA Rozdíl SS MS F Výzamost F Regrese 86,0 86,0 6, 3,40055E-07 Rezdua 8 537,964 9,8844 Celkem 9 364,8 7.9 Hodotící tabulka Př ukázkách dříve zázorěých regresích modelů bylo mohokrát upozorěo, že ěkteré regresí modely můžeme jž pouhým vzuálím zhlédutím předem odmítout jako fukce evhodě prokládající data. Ovšem u jých modelů, jako apříklad u regresího 38

39 polyomu ebo regresí paraboly (v tomto příkladě) stuace jž zdaleka eí tak jasá, jak by se ám zamlouvalo. Nejlepším řešeím je proto sestrojt hodotící tabulku, která bude porovávat parametry kvalty všech použtých regresích fukcí, ačkolv jsme tyto výsledky jž částečé porovával. Tabulka je vytvořeá pro maxmálí přehledost srovávací aalýzy parametrů jedotlvých regresích modelů. Bude obsahovat dex determace I, dex korelace I a rezduálí směrodatou odchylku s z regresí statstky. Dále výzamost F a rezdua RSC z ANOVY. Jak vdíme, tabulka dohromady obsahuje pět krtérí, což je dle ázoru odboríků dostatečý počet pro správý výběr optmálího modelu. Tabulka 3: Hodotcí tabulka Regresí model / Vlastost I I RSC F s PŘÍMKA 0,8688 0,930 30,44,7E-09 4,5093 PARABOLA 0, , ,788,49E-08 4,0856 POLYNOM 3. STUPNĚ 0,8893 0, ,6846 7,4E-08 4,0447 HYPERBOLA 0, , ,439 0, ,087 EXPONENCIÁLA 0,8406 0,490 98,977 0, ,35 LOG 0, , ,964 3,40E-07 5,46665 LN 0, , ,964 3,40E-07 5, Výběr optmálího regresího modelu Zopakujme, že optmálí regresí model by měl splňovat maxmálí dex determace, což spolu s mmálím RSC a vyhovující hladou výzamost F jsou as ejpodstatější parametry. Dále je vhodá mmálí směrodatá odchylku s a vysoký dex korelace. Z hodotící tabulky můžeme vyčíst, že v téměř všech parametrech je ejlepším modelem polyom 3. stupě. Má ze všech modelů ejvyšší dex determace, ejžší rezdua RSC a současě je v dalších parametrech ejlepším modelem. Pro teto typ regresí fukce rověž svědčí fakt optmálího proložeí vstupím daty touto regresí fukcí. Z celkového výsledku aalýzy jsme se tedy dozvěděl, že závslost cey automoblu a počtu ajetých klometrů je závslostí polyomckou. Druhým modelem, který dobře vysthuje závslost dat je parabola. Naopak bez vzuálího hodoceí jedotlvých grafů můžeme pomocí oretace v tabulce hed vyloučt expoecálí regresí fukc, která v téměř všech parametrech evyhovuje a avíc je jedým modelem statstcky evýzamým v tomto příkladě. 39

40 8 Příklad 8. Zadáí Tetokrát byl vybrá příklad z ekoomcké praxe, kdy jsem zjšťoval závslost míry hrubých domácích úspor a měsíčí hrubé reálé mzdě. Opět je mým cílem zjstt pomocí proložeí regresích fukcí daty deálí závslost mez zmíěou hrubou mzdou a úsporam domácostí. Data jsem opatřl z ekoomckého serveru Měšec.cz dostupá ole z www [],[]. Růsty č poklesy obou skup dat jsou vyjádřey v procetech a vztahují se k určtému období. Nezávslým daty x jsou hrubé mzdy a a ch závslým daty y jsou úspory domácostí. Tabulka 4: Vstupí data rok průměré mzdy x úspory y 995 8,7, ,7,5 997,3, ,4 9, , 8,5 000,4 8,4 00 3,8 7,4 00 5,4 8, ,5 7, ,7 5, ,3 8, 006 3,9 9, ,4 9,0 008, 8, Obrázek 0: Vstupí data 40

41 8. Aalýza regresí přímky V aalýze se bude postupovat obdobým způsobem jako v předchozím příkladě. K posouzeí závslost budeme používat předběžé vzuálí ukázky grafů a opět se hlavě zaměřím a ukazatele regresí aalýzy. V regresí statstce opět použjeme hodotu spolehlvost R (dex korelace), ásobé R (dex determace) a chybu středí hodoty (resduálí směrodatá odchylka s). V ukazatel ANOVA se zaměříme a tučě zvýrazěá rezdua a výzamost F. Tabulky potřebé k vytvořeí regresí aalýzy jsou opět uvedey v příloze stejě jako v příkladě kaptoly sedm. Obrázek : Regresí přímka Z grafu můžeme vdět, že regresí fukce eprokládá data přílš dobře a eprokládá vůbec odlehlé hodoty. Protože se jedá o prví regresí model, emůžeme porovávat hodoty parametrů regresí aalýzy. Model je ale stejě statstcky evýzamý, protože parametr výzamost F je větší ež 0,05. VÝSLEDEK Regresí statstka Násobé R 0,9588 Hodota spolehlvost R 0, Nastaveá hodota spolehlvost R -0, Chyba středí hodoty,7339 Pozorováí 4 4

42 ANOVA Rozdíl SS MS F Výzamost F Regrese, , , , Rezdua 35, , Celkem 3 37, Aalýza regresí paraboly V příloze je uvedea tabulka se vstupím daty (Příloha ). Opakují se závslá a ezávslá vstupí data avíc doplěá o druhou mocu x. Tato data zpracovávám v programu MS Excel. Jedotlvá x jsou ezávslá vstupí data, zatímco jedotlvá y jsou závslé velčy. Očekávaá Y jsou odhadovaé velčy, které odhadla regresí aalýza použtá v MS Excel. Obrázek : Regresí parabola Z grafu můžeme posoudt, že regresí parabola prokládá data lépe ež regresí přímka. Počátečí fáze regresí paraboly je téměř totožá s regresí přímkou, avšak v dalším průběhu vdíme, že model má alespoň sahu proložt okolí odlehlé hodoty vpravo. I v tomto případě ám více řeke hodotící tabulka (Tabulka 5), ve které porováme jedotlvé parametry paraboly ve srováí s ostatím regresím fukcem. O vyloučeí ěkterých odlehlých hodot emůže být a uvažováo, protože zjštěých údajů je přílš málo. 4

43 Níže je zobraze výsledek regresí aalýzy. Z aalýzy můžeme vyčíst, že parabola má lepší parametry ež přímka. Například parametry dex determace ebo dex korelace mají vyšší hodoty ež přímka a aopak třeba parametr RSC má hodotu žší. Přesto je také teto model statstcky evýzamý, ačkolv je výzamost F žší ež v případě regresí přímky. VÝSLEDEK Regresí statstka Násobé R 0, Hodota spolehlvost R 0,97074 Nastaveá hodota spolehlvost R 0,30308 Chyba středí hodoty, Pozorováí 4 ANOVA Rozdíl SS MS F Výzamost F Regrese 7,40 7,4009,948 0,66798 Rezdua 30,3,506 Celkem 3 37, Aalýza regresího polyomu 3. stupě Tabulka v příloze zobrazuje vstupí závslé a ezávslé velčy (Příloha ). V případě polyomu 3. stupě avíc zahruje třetí mocu ezávslých vstupích hodot x. Obrázek 3: Regresí polyom 43

44 Z grafu je patré, že regresí polyom 3. stupě je dobrou fukcí pro vystžeí závslost mez daty, protože dobře prokládá zjštěé hodoty. Můžeme jej tedy jž v této fáz ozačt jako vhodý z vzuálího hledska. I z výsledků parametrů je vdět, že proložeí daty je celkem dobré. Teto model je prvím modelem, který je statstcky výzamý. Z toho vyplývá, že dex determace a dex korelace je větší, ež v případě paraboly a aopak chyba středí hodoty a rezdua mají hodoty žší. Toto vše ukazuje a vyšší kvaltu regresího modelu ež v předchozích případech. VÝSLEDEK Regresí statstka Násobé R 0, Hodota spolehlvost R 0,89975 Nastaveá hodota spolehlvost R 0,3406 Chyba středí hodoty, Pozorováí 4 ANOVA Rozdíl SS MS F Výzamost F Regrese 0,608 0,608 4, , Rezdua 6,9083,4358 Celkem 3 37, Aalýza regresí hyperboly Obrázek 4 regresí hyperboly ám také jedozačě eurčí, zda lépe prokládá data regresí hyperbola ebo třeba přímka. Z aalýzy ale vdíme, že parametry regresí hyperboly ejsou přílš dobré. Hyperbola má dost ízký dex determace a velm ízký dex korelace v porováí s předchozím modely. Naopak rezdua a třeba výzamost F mají velké hodoty. Model je statstcky evýzamý a zatím je svým parametry ejhorším modelem vysthující závslost mez daty. Tabulka s daty k tomuto modelu je ozačea jako Příloha 3. 44

45 Obrázek 4: Regresí hyperbola VÝSLEDEK Regresí statstka Násobé R 0, Hodota spolehlvost R 4,4000E-06 Nastaveá hodota spolehlvost R -0, Chyba středí hodoty, Pozorováí 4 ANOVA Rozdíl SS MS F Výzamost F Regrese 0, , ,3E-05 0, Rezdua 37,584 3,7367 Celkem 3 37, Aalýza regresí expoecály Z grafu můžeme vdět, že regresí expoecála dobře prokládá vstupí data a možá bude ejvhodější fukcí pro vystžeí závslost. Neje že dobře prokládá oblast, kde je ejvíce aměřeých hodot vstupích dat, ale avíc prokládá odlehlou hodotu v pravé část grafu, což u předchozích regresích modelů eplatlo. 45

46 Obrázek 5: Regresí expoecála Vše se objasí závěrečým porováím parametrů všech modelů. Model regresí expoecály má ale prozatím ejlepší parametry ve srováí s polyomem ebo parabolou, které prokládaly data celkem dobře, ačkolv model paraboly ebyl statstcky výzamý. Vdíme, že dexy korelace a determace mají prozatím ejvětší hodoty. Naopak rezdua ebo výzamost F jsou výrazě žší ež v předchozích případech. Výzamost F je meší ež 0,05 a proto je model statstcky výzamý. Zatím se jedá o ejlepší model vysthující závslost mez daty eje svým parametry, ale z vzuálího hledska. VÝSLEDEK Regresí statstka Násobé R 0, Hodota spolehlvost R 0, Nastaveá hodota spolehlvost R 0, Chyba středí hodoty, Pozorováí 4 ANOVA Rozdíl SS MS F Výzamost F Regrese 5,856 5,8557 8,556 0, Rezdua,3433,86949 Celkem 3 37,

47 8.7 Aalýza regresího dekadckého logartmu Proložeí regresí fukce daty (Obrázek 6) je podobé jako v případě přímky. Rověž parametry jsou podobé, což vysvětluje podobý tvar regresí fukce. Níže je uvede opět výstup z regresí aalýzy. Jak vdíme, parametry jsou horší ve srováí s expoecálou ebo polyomem. Model je statstcky evýzamý. I tak ale zahreme teto model do koečého hodoceí v tabulce. Ze závěrečé hodotící tabulky se můžeme vzájemým porováím dozvědět důležté věc. Obrázek 6: Regresí log Z hodotící tabulky pozáme eje který model je ejoptmálější pro odhad vývoje dat, ale které modely je třeba zavrhout jako vyložeě ehodící se pro budoucí predkc dat. Nebo můžeme odhadout, které modely by se aopak daly použít, kdybychom dostal větší počet dat z aalyzovaé oblast (hrubé domací úspory závslé a reálých mzdách) a kdybychom v ávazost a tuto skutečost mohl vybočující hodoty odstrat. Potom by třeba expoecála ebyla přílš vhodá, ale spíše by se více hodla přímková regrese ebo model logartmu. VÝSLEDEK Regresí statstka Násobé R 0,88389 Hodota spolehlvost R 0,0456 Nastaveá hodota spolehlvost R -0, Chyba středí hodoty,88309 Pozorováí 3 47

48 ANOVA Rozdíl SS MS F Výzamost F Regrese 0,5657 0,5657 0,5756 0, Rezdua 36,7666 3,3406 Celkem 37, Aalýza regresího přrozeého logartmu Průběh regresí fukce přrozeého logartmu se od logartmcké fukce přílš elší, proto jej ebudu blíže popsovat. Pouze zbývá dodat, že u přrozeého dekadckého logartmu jsem vyřadl hodotu,4 v ezávslých datech x, protože fukce obou logartmů je defováa pouze pro kladé hodoty. Obrázek 7: Regresí l VÝSLEDEK Regresí statstka Násobé R 0,7833 Hodota spolehlvost R 0,04 Nastaveá hodota spolehlvost R -0, Chyba středí hodoty,883 Pozorováí 3 ANOVA Rozdíl SS MS F Výzamost F Regrese 0, ,566 0,576 0, Rezdua 36, ,34 Celkem 37,

49 8.9 Hodotící tabulka Jak vdíme, tabulka opět obsahuje dex determace I, dex korelace I a rezduálí směrodatou odchylku s z regresí statstky. Dále výzamost F a rezdua RSC z ANOVY. Dohromady obsahuje pět krtérí, které jsou postačující pro posouzeí modelu. Tabulka 5: Hodotcí tabulka Regresí model / Vlastost I I RSC F s PŘÍMKA 0, ,958 35,556 0,430453,7339 PARABOLA 0,9707 0, ,766 0,668, POLYNOM 3. STUPNĚ 0,899 0,5397 6,9083 0,0507,49745 HYPERBOLA 4,40E-06 0, ,584 0,9943, EXPONENCIÁLA 0, ,63607,3433 0,04466,36453 LOG 0,04 0, ,7666 0,699007,883 LN 0,04 0, , ,699007, Výběr optmálího regresího modelu Nejprve bych chtěl říc, že kdyby ám šlo o rychlou aalýzu, zaměřl bych se v popsech modelů ejprve a parametr výzamost F, který je velm důležtý z hledska použtelost modelů. Zjstl bych, že statstcky výzamé jsou pouze regresí modely polyomu 3. stupě a expoecály. Poté bych porovával pouze parametry těchto modelů a ostatí regresí modely bych vůbec euvažoval. Protože však statstcky výzamé modely vyšly v tomto příkladě pouze dva, dovoll jsem s aalyzovat ostatí regresí modely. Máme k dspozc alespoň ázorou ukázku, že modely statstcky evýzamé mají parametry skutečě výrazě horší. Vzájemým porováím parametrů (Tabulka 5) ám vychází, že ejlepším regresím modelem pro vystžeí závslost mez daty, je závslost expoecálí. Je ejlepším modelem, protože hodoty dex korelace dex determace jsou ze všech uvedeých modelů ejvyšší a aopak chybu středí hodoty má expoecálí model ejžší. V ukazatelích ANOVA jsme se zaměřl a tučě zvýrazěá rezdua RSC a výzamost F. Tyto hodoty jsou také ejžší, což vhodost expoecálího modelu je potvrzuje. Mmoto, jak jž bylo apsáo, je expoecálí model ještě s polyomem 3. stupě jedým modelem, který je statstcký výzamý. 49

50 Výrazě ejhorším modelem pro vystžeí závslost je hyperbolcký model, který evyhovuje ve srováí s ostatím modely ve všech parametrech. Celkem slušé parametry pro vystžeí závslost mez daty má také polyom 3. stupě a regresí parabola, ačkolv je statstcky evýzamá. Z výsledku tabulky potom můžeme usoudt, že závslost procetího růstu úspor domácostí y a velkost růstu procet hrubých mezd x je závslostí expoecálí. Je třeba říc, že to eí a přílš překvapvé zjštěí, protože s jstě dokážeme představt expoecálí růst (č pokles) rodých úspor (apř. a bydleí, spořeí, dovoleou a ostatí výdaje) v závslost a výš mezd. 50

51 Závěr Na závěr se dá říc, že záměr bakalářské práce byl splě. Cílem zadáí práce bylo teoretcky popsat metody a pojmy regresí aalýzy a ásledě vytvořt a vyhodott jedotlvé regresí modely u zpracovaých příkladů. V teoretcké část jsem mmo jé charakterzoval jedotlvé regresí modely použté v praktcké část práce a jedotlvé ukazatelé kvalty regresí fukce, kterých se pro posouzeí kvalty modelu ásledě využívalo. V praktcké reprezetac metod regresí aalýzy pro všechy tyto modely vytvořla aalýza v programu MS Excel určté parametry. Z těchto parametrů jsem se zaměřl a dex determace I, dex korelace I, chybu středí hodoty s, dále výzamost F a rezdua RSC. Následě jsem pomocí očekávaých hodot Y, které jsou výstupem pro každý model vždy vytvořl příslušou regresí fukc prokládající vstupí data. Nejprve se u většy modelů provedlo vzuálí zhodoceí proložeí regresí fukce daty, avšak hlaví důraz pro určeí kvalty regresího modelu se kladl a porováí jedotlvých parametrů. Porováím se určla vhodost regresích modelů a dle toho byl vybrá te model, který ejlépe prokládá zvoleá data. Výběr ejlepšího modelu byl vždy zdůvodě a zároveň se poukázalo a regresí modely, které jsou evhodé pro pops závslost mez daty. Příklady byly zpracováy dva proto, aby bylo možo porovat výstupy dvou odlšých případů. Z výsledků vdíme, že výstupy mohou být pro odlšá data zcela já. Zatímco v prvím příkladě vyšel pouze jede statstcky evýzamý model, v druhém případě je evýzamých modelů pět. U příkladu v sedmé kaptole byla aalyzováa data vztahující se k závslost mez stářím a ceou automoblů. Naměřeých hodot je dvacet a bylo zjštěo, že tato data jsou proložea ejlépe polyomem 3. stupě. U tohoto příkladu se přílš edalo spoléhat a subjektví vzuálí hodoceí, protože další modely data dobře prokládaly, ačkolv měl horší parametry. Výsledky aalýzy jsem tedy odvodl hlavě pomocí hodotící tabulky (Tabulka 3), kde jsou vypsáy hodoty ejdůležtějších parametrů pro určeí kvalty modelů. Naopak se dá říc, že model, který absolutě evyhovuje jak z hledska vzuálího, tak z hledska parametrckého je model regresí expoecály. Regresí aalýza ám dala predkc, že pro budoucost můžeme očekávat polyomckou závslost mez ceou automoblu a jeho ajetým klometry. 5

52 V druhém příkladě v kaptole osmé byla aalyzováa závslost mez výší hrubých reálých mezd a úsporam domácost, přčemž bylo k dspozc 4 aměřeých hodot. Bylo zjštěo, že data jsou ejlépe proložea expoecálí fukcí. Expoecálí fukce byla jž z pouhého vzuálího hodoceí ejlepším regresím modelem, což bylo potvrzeo porováím parametrů s ostatím modely. Dalším regresím modelem dobře popsujícím závslost mez daty byl model polyomu 3. stupě. Nejhorším modelem z hledska parametrů, je regresí hyperbola, ačkolv v tomto příkladě bylo více statstcky evýzamých modelů. Na základě této aalýzy můžeme predkovat, že v budoucost se závslost mez mzdou a úsporam bude řídt expoecálí fukčí závslostí. Je třeba zmít, že př modelováí dat v obou příkladech byl použt pouze polyom 3. stupě. Obvykle se sce jeví regresí polyomy vyšších stupňů jako vhodější, protože lépe aproxmují data, ale a druhou strau čím vyšší je stupeň regresího polyomu, tím obtížější se s ím pracuje. Vzrůstá rzko, že se regresí fukce bude zbytečě sažt popsat áhodé výchylky od celkového tredu a důsledkem bude, že regresí fukce bude pro předpověď aprosto evhodá. 5

53 Použtá lteratura [] CYHELSKÝ, L. Úvod do teore statstky. vydáí. Praha : SNTL, s. ISBN L3-C3-3-4/3853. [] CYHELSKÝ, L., NOVÁK, I. Statstka. díl. vydáí. Praha: SNTL, s. ISBN L3-C3-4-4/3740/. [3] CYHELSKÝ, L. a kolektv. Základy teore statstky pro ekoomy. vydáí. Praha: SNTL, s. ISBN L3-C3-4-4/384. [4] HENDL, J. Přehled statstckých metod zpracováí dat. vydáí. Praha: PORTÁL, s. ISBN [5] HINDLS, R., HRONOVÁ, S., SEGER, S. Statstka pro ekoomy. vydáí 3. Praha: PROFESSIONAL PUBLISHING, s. ISBN [6] HINDLS, R., KAŇKOVÁ, R., NOVÁK, I. Metody statstcké aalýzy pro ekoomy. vydáí. Praha: MANAGEMENT PRESS, s. ISBN [7] KUBANOVÁ, J. Statstcké metody pro ekoomckou a techckou prax. vydáí 3. Bratslava: STATIS, s. ISBN [8] MAREK, L. Statstka pro ekoomy aplkace. vydáí. Praha: PROFESSIONAL PUBLISHING, s. ISBN [9] MELOUN, M. a MILITKÝ, J. Statstcké zpracováí expermetálích dat. vydáí. Praha: EAST PUBLISHING, s. ISBN [0] SLÍVKO, P. Sbírka úloh ze statstky. vydáí. Česká Třebová : Iterí zdroj VOŠ, s. [] Měšec.cz : Vývoj reálých mezd v ČR, [ole]. 008 [ct ]. Dostupé z WWW: < 53

54 [] Měšec.cz : Vývoj spotřeby v ČR, [ole]. 008 [ct ]. Dostupé z WWW: < [3] Regresí aalýza : Metoda ejmeších čtverců. I Less8reg. Praha :fzp.ujep.cz, [ct ].dostupé z WWW: < 54

55 Sezam zkratek X x x ɵ y I I s RSC ε Náhodá velča Hodota statstckého zaku Artmetcký průměr Odhad hodoty statstckého zaku Idex determace Idex korelace Chyba středí hodoty Resduálí součet čtverců Náhodá chyba 55

56 Sezam obrázků Obrázek : Metoda ejmeších čtverců... Obrázek : Vstupí data... 8 Obrázek 3: Regresí přímka... 3 Obrázek 4: Regresí parabola... 3 Obrázek 5: Regresí polyom Obrázek 6: Regresí hyperbola Obrázek 7: Regresí expoecála Obrázek 8: Regresí log Obrázek 9: Regresí l Obrázek 0: Vstupí data Obrázek : Regresí přímka... 4 Obrázek : Regresí parabola... 4 Obrázek 3: Regresí polyom Obrázek 4: Regresí hyperbola Obrázek 5: Regresí expoecála Obrázek 6: Regresí log Obrázek 7: Regresí l

57 Sezam tabulek Tabulka : Data... 8 Tabulka : Vstupí data a očekávaé hodoty regresí přímky Tabulka 3: Hodotcí tabulka Tabulka 4: Vstupí data Tabulka 5: Hodotcí tabulka

58 Sezam příloh Příloha :Doplňky MS EXCEL Příloha :Doplňky Aalytcké ástroje Příloha 3:Tvorba regrese Příloha 4: Vstupí data a očekávaé hodoty regresí paraboly Příloha 5: Vstupí data a očekávaé hodoty regresího polyomu Příloha 6: Vstupí data a očekávaé hodoty regresí hyperboly Příloha 7: Vstupí data a očekávaé hodoty regresí expoecály Příloha 8: Vstupí data a očekávaé hodoty regresího logartmu Příloha 9: Vstupí data a očekávaé hodoty regresího l Příloha 0: Vstupí data a očekávaé hodoty regresí přímky Příloha : Vstupí data a očekávaé hodoty regresí paraboly Příloha : Vstupí data a očekávaé hodoty regresího polyomu Příloha 3: Vstupí data a očekávaé hodoty regresí hyperboly Příloha 4: Vstupí data a očekávaé hodoty regresí expoecály Příloha 5: Vstupí data a očekávaé hodoty regresího log Příloha 6: Vstupí data a očekávaé hodoty regresího l 58

59 Příloha :Doplňky MS EXCEL Příloha :Doplňky Aalytcké ástroje

60 Příloha 3:Tvorba regrese Příloha 4: Vstupí data a očekávaé hodoty regresí paraboly y x x Očekávaá Y 55,, 53, ,6,5 6,5 53, ,6 0,4 08,6 49, , 4,5 0,5 5, ,4 985,96 39, ,6 73,96 50, ,6 3,4 049,76 39, ,3 5,3 640,09 4, , , , , , 438,44 7, ,5 980,5 34,9444 3, , ,4 34,96 37, ,6 8,6 68,76 3, ,5 460,5 8, ,6 70,8 50,64 6, ,7 693,69 4, ,6 90, 836,04,

Metody zkoumání závislosti numerických proměnných

Metody zkoumání závislosti numerických proměnných Metody zkoumáí závslost umerckých proměých závslost pevá (fukčí) změě jedoho zaku jedozačě odpovídá změa druhého zaku (podle ějakého fukčího vztahu) (matematka, fyzka... statstcká (volá) změám jedé velčy

Více

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

Odhady parametrů základního. Ing. Michal Dorda, Ph.D. Odhady parametrů základího souboru Úvodí pozámky Základí soubor můžeme popsat jeho parametry, apř. středí hodota μ, rozptyl atd. Př praktckých úlohách ovšem zpravdla elze vyšetřt celou populac, provádíme

Více

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i : ometové míry polohy zahrují růzé druhy průměrů pomocí kterých můžeme charakterzovat cetrálí tedec dat ometové míry polohy jsou jedoduché číselé charakterstky které se vyčíslují ze všech prvků výběru

Více

, jsou naměřené a vypočtené hodnoty závisle

, jsou naměřené a vypočtené hodnoty závisle Měřeí závslostí. Průběh závslost spojtá křvka s jedoduchou rovcí ( jedoduchým průběhem), s malým počtem parametrů, která v rozmezí aměřeých hodot vsthuje průběh závslost, určeí kokrétího tpu křvk (přímka,

Více

Generování dvojrozměrných rozdělení pomocí copulí

Generování dvojrozměrných rozdělení pomocí copulí Pravděpodobost a matematcká statstka eerováí dvojrozměrých rozděleí pomocí copulí umbelova copule PRAHA 005 Vpracoval: JAN ZÁRUBA OBSAH: CÍL PRÁCE TEORIE Metoda verzí trasformace O copulích Sklarova věta

Více

9. Měření závislostí ve statistice. 9.1. Pevná a volná závislost

9. Měření závislostí ve statistice. 9.1. Pevná a volná závislost Dráha [m] 9. Měřeí závslostí ve statstce Měřeí závslostí ve statstce se zývá především zkoumáím vzájemé závslost statstckých zaků vícerozměrých souborů. Závslost přtom mohou být apříklad pevé, volé, jedostraé,

Více

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D. Odhady parametrů základího souboru Ig. Mchal Dorda, Ph.D. Úvodí pozámky Základí soubor můžeme popsat jeho parametry, apř. středí hodota μ, rozptyl σ atd. Př praktckých úlohách ovšem zpravdla elze vyšetřt

Více

3. Hodnocení přesnosti měření a vytyčování. Odchylky a tolerance ve výstavbě.

3. Hodnocení přesnosti měření a vytyčování. Odchylky a tolerance ve výstavbě. 3. Hodoceí přesost měřeí a vytyčováí. Odchylky a tolerace ve výstavbě. 3.1 Úvod o měřeí obecě 3.2 Chyby měřeí a jejch děleí 3.2.1 Omyly a hrubé chyby 3.2.2 Systematcké chyby 3.2.3 Náhodé chyby 3.3 Výpočet

Více

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna. 6 Itervalové odhady parametrů základího souboru V předchozích kapitolách jsme se zabývali ejprve základím zpracováím experimetálích dat: grafické zobrazeí dat, výpočty výběrových charakteristik kapitola

Více

Spolehlivost a diagnostika

Spolehlivost a diagnostika Spolehlvost a dagostka Složté systémy a jejch spolehlvost: Co je spolehlvost? Vlv spolehlvost kompoetů systému Návrh systému z hledska spolehlvost Aplkace - žvotě důležté systémy - vojeské aplkace Teore

Více

Úvod do korelační a regresní analýzy

Úvod do korelační a regresní analýzy Úvod do korelačí a regresí aalýz Bude ás zajímat, jak těsě spolu souvsí dva sledovaé jev Příklad: vztah mez rchlostí auta a brzdou dráhou vztah mez věkem žáka a rchlostí v běhu a 60 m vztah mez spotřebou

Více

Nejistoty měření. Aritmetický průměr. Odhad směrodatné odchylky výběrového průměru = nejistota typu A

Nejistoty měření. Aritmetický průměr. Odhad směrodatné odchylky výběrového průměru = nejistota typu A Nejstoty měřeí Pro každé přesé měřeí potřebujeme formac s jakou přesostí bylo měřeí provedeo. Nejstota měřeí vyjadřuje terval ve kterém se achází skutečá hodota měřeé velčy s určtou pravděpodobostí. Nejstota

Více

Testování statistických hypotéz

Testování statistických hypotéz Testováí statstckých hypotéz - Testováí hypotéz je postup, sloužící k ověřeí předpokladů o ZS (hypotéz a základě výběrových dat (tj. hodot z výběrového souboru. - ypotéza = určtý předpoklad o základím

Více

a další charakteristikou je četnost výběrového souboru n.

a další charakteristikou je četnost výběrového souboru n. Předáška č. 8 Testováí rozptylu, testy relatví četost, testy dobré shody, test ezávslost kvaltatvích zaků Testy rozptylu Testy se používají k ověřeí hypotézy o určté velkost rozptylu a k ověřeí vztahu

Více

Regrese. Aproximace metodou nejmenších čtverců ( ) 1 ( ) v n. v i. v 1. v 2. y i. y n. y 1 y 2. x 1 x 2 x i. x n

Regrese. Aproximace metodou nejmenších čtverců ( ) 1 ( ) v n. v i. v 1. v 2. y i. y n. y 1 y 2. x 1 x 2 x i. x n Regrese Aproxmace metodou ejmeších čtverců v v ( ) = f x v v x x x x Je dáo bodů [x, ], =,,, předpoládáme závslost a x a chceme ajít fuc, terá vsthuje teto tred - Sažíme se proložt fuc = f x ta, ab v =

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA Matematka IV PRAVDĚPODOBNOT A TATITIKA Lbor Žák Matematka IV Lbor Žák Regresí aalýza Regresí aalýza zkoumá závslost mez ezávslým proměým X ( X,, X k a závsle proměou Y. Tato závslost se vjadřuje ve tvaru

Více

Lineární regrese ( ) 2

Lineární regrese ( ) 2 Leárí regrese Častým úolem je staoveí vzájemé závslost dvou (č více) fzálích velč a její matematcé vjádřeí. K tomuto účelu se používají růzé regresí metod, pomocí chž hledáme vhodou fuc f (), apromující

Více

8 NELINEÁRNÍ REGRESNÍ MODELY

8 NELINEÁRNÍ REGRESNÍ MODELY 8 NELINEÁRNÍ REGRESNÍ MODELY 8 Tvorba eleárího regresího modelu Postup tvorby eleárího regresího modelu se dá rozčlet do těchto kroků: Návrh regresího modelu Obvykle se jako eleárí regresí model používá

Více

Mendelova univerzita v Brně Statistika projekt

Mendelova univerzita v Brně Statistika projekt Medelova uverzta v Brě Statstka projekt Vypracoval: Marek Hučík Obsah 1. Úvod... 3. Skupové tříděí... 3 o Data:... 3 o Počet hodot:... 3 o Varačí rozpětí:... 3 o Počet tříd:... 4 o Šířka tervalu:... 4

Více

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014. Ilustratví příklad ke zkoušce z B_PS_A léto 0. Jsou dáa data výběrového souboru výšky že vz IS/ Učebí materály/ Témata 8, M. Kvaszová. č. výška č. výška 89 5 90 7 57 8 5 58 5 8 9 58 0 8 0 8 8 9 8 8 95

Více

5.5. KOMPLEXNÍ ODMOCNINA A ŘEŠENÍ KVADRATICKÝCH A BINOMICKÝCH ROVNIC

5.5. KOMPLEXNÍ ODMOCNINA A ŘEŠENÍ KVADRATICKÝCH A BINOMICKÝCH ROVNIC 5.5. KOMPLEXNÍ ODMOCNINA A ŘEŠENÍ KVADRATICKÝCH A BINOMICKÝCH ROVNIC V této kaptole se dozvíte: jak je defováa fukce přrozeá odmoca v kompleím oboru a jaké má vlastost včetě odlšostí od odmocy v reálém

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresí a korelačí aalýza Závslost příčá (kauzálí). Závslostí pevou se ozačuje případ, kdy výskytu jedoho jevu utě odpovídá výskyt druhé jevu (a často aopak). Z pravděpodobostího hledska jde o vztah, který

Více

Ilustrativní příklad ke zkoušce z B_PS_A léto 2013.

Ilustrativní příklad ke zkoušce z B_PS_A léto 2013. Ilustratví příklad ke zkoušce z B_PS_A léto 0. Jsou dáa data výběrového souboru výšky že vz IS/ Učebí materály/ Témata 8, M. Kvaszová. č. výška č. výška 89 5 90 7 57 8 5 58 5 8 9 58 0 8 0 8 8 9 8 8 95

Více

Chyby přímých měření. Úvod

Chyby přímých měření. Úvod Chyby přímých měřeí Úvod Př zjšťováí velkost sledovaé velčy dochází k růzým chybám, které ovlvňují celkový výsledek. V pra eestuje žádá metoda měřeí a měřcí zařízeí, které by bylo absolutě přesé, což zameá,

Více

Odhady parametrů 1. Odhady parametrů

Odhady parametrů 1. Odhady parametrů Odhady parametrů 1 Odhady parametrů Na statistický soubor (x 1,..., x, který dostaeme statistickým šetřeím, se můžeme dívat jako a výběrový soubor získaý realizací áhodého výběru z áhodé veličiy X. Obdobě:

Více

P1: Úvod do experimentálních metod

P1: Úvod do experimentálních metod P1: Úvod do epermetálích metod Chyby a ejstoty měřeí - Každé měřeí je zatížeo určtou epřesostí, která je způsobea ejrůzějším egatvím vlvy, vyskytujícím se v procesu měřeí. - Výsledek měřeí se díky tomu

Více

4.2 Elementární statistické zpracování. 4.2.1 Rozdělení četností

4.2 Elementární statistické zpracování. 4.2.1 Rozdělení četností 4.2 Elemetárí statstcké zpracováí Výsledkem statstckého zjšťováí (. etapa statstcké čost) jsou euspořádaá, epřehledá data. Proto 2. etapa statstcké čost zpracováí, začíá většou jejch utříděím, zpřehleděím.

Více

Přednáška č. 10 Analýza rozptylu při jednoduchém třídění

Přednáška č. 10 Analýza rozptylu při jednoduchém třídění Předáška č. 0 Aalýza roztylu ř jedoduchém tříděí Aalýza roztylu je statstcká metoda, kterou se osuzuje romělvost oakovaých realzací áhodého okusu tj. romělvost áhodé velčy. Náhodá velča vzká za relatvě

Více

Metody statistické analýzy. doc. Ing. Dagmar Blatná, CSc.

Metody statistické analýzy. doc. Ing. Dagmar Blatná, CSc. Metody statstcké aalýzy doc. Ig. Dagmar Blatá, CSc. Bakoví sttut vysoká škola, a.s. Praha 0 METODY STATISTICKÉ ANALÝZY Autor: Recezet: Vydal: Tsk: Vydáí: doc. Ig. Dagmar Blatá, CSc. doc. Ig. Jří Trešl,

Více

Pravděpodobnostní modely

Pravděpodobnostní modely Pravděpodobostí modely Meu: QCEpert Pravděpodobostí modely Modul hledá metodou maimálí věrohodosti (MLE Maimum Likelihood Estimate) statistický model (rozděleí) který ejlépe popisuje data. Je přitom k

Více

Úvod do teorie měření

Úvod do teorie měření Uverzta Jaa Evagelsty Purkyě v Ústí ad Labem Přírodovědecká fakulta Úvod do teore měřeí Prof. Chlář emář 0 Průměr, rozptyl a směrodatá odchylka X = X = ( X X ) = = = Výpočty pomocí vzorců a pomocí statstckých

Více

1.1 Rozdělení pravděpodobnosti dvousložkového náhodného vektoru

1.1 Rozdělení pravděpodobnosti dvousložkového náhodného vektoru Lekce Normálí rozděleí v rově V této lekc se udeme věovat měřeí korelačí závslost dvojce áhodých velč (dvousložkového áhodého vektoru) Vcházet udeme z ormálího rozděleí pravděpodoost áhodého vektoru v

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOT A TATITIKA Přpomeutí pojmů,, P m θ, R θ R - pravděpodobostí prostor - parametrcký prostor - parametrcká fukce,, T - áhodý vektor defovaý a pravděpodobostím prostoru,, P θ s hustotou f x,

Více

1 Měření závislosti statistických znaků. 1.1 Dvourozměrný statistický soubor

1 Měření závislosti statistických znaků. 1.1 Dvourozměrný statistický soubor 1 Měřeí závlot tattckých zaků 1.1 Dvourozměrý tattcký oubor Př aalýze ekoomckých kutečotí á čato ezajímají jedotlvé velč jako takové, ale vztah mez m. Ptáme e, jak záví poptávka a ceě produktu, plat zamětaců

Více

VY_52_INOVACE_J 05 01

VY_52_INOVACE_J 05 01 Název a adresa školy: Středí škola průmyslová a umělecká, Opava, příspěvková orgazace, Praskova 399/8, Opava, 74601 Název operačího programu: OP Vzděláváí pro kokureceschopost, oblast podpory 1.5 Regstračí

Více

14. Korelace Teoretické základy korelace Způsoby měření závislostí pro různé typy dat

14. Korelace Teoretické základy korelace Způsoby měření závislostí pro různé typy dat 4. Korelace 4. Teoretcké základy korelace 4. Způsoby měřeí závslostí pro růzé typy dat Př prác se statstckým údaj se velm často setkáváme s daty, která jsou tvořea dvojcem, trojcem hodot. Složky takovýchto

Více

11. Časové řady. 11.1. Pojem a klasifikace časových řad

11. Časové řady. 11.1. Pojem a klasifikace časových řad . Časové řad.. Pojem a klasfkace časových řad Specfckým statstckým dat jsou časové řad pomocí chž můžeme zkoumat damku jevů v čase. Časovou řadou (damcká řada, vývojová řada) rozumíme v čase uspořádaé

Více

Optimalizace portfolia

Optimalizace portfolia Optmalzace portfola ÚVOD Problémy vestováí prostředctvím ákupu ceých papírů sou klasckým tématem matematcké ekoome. Celkový výos z portfola má v době rozhodováí o vestcích povahu áhodé velčy, eíž rozložeí

Více

[ jednotky ] Chyby měření

[ jednotky ] Chyby měření Chyby měřeí Provedeme-l určté měřeí za stejých podmíek vícekrát, jedotlvá měřeí se mohou odlšovat (z důvodu koečé rozlšovací schopost měř. přístrojů, áhodých vlvů apod.). Chyba měřeí: e = x x x...přesá

Více

Přednáška č. 2 náhodné veličiny

Přednáška č. 2 náhodné veličiny Předáša č. áhodé velčy Pozámy záladím pojmům z počtu pravděpodobost Pozáma 1: Př výpočtu pravděpodobost áhodého jevu dle lascé defce je uté věovat pozorost způsobu formulace vybraého jevu. V ásledující

Více

veličiny má stejný řád jako je řád poslední číslice nejistoty. Nejistotu píšeme obvykle jenom jednou

veličiny má stejný řád jako je řád poslední číslice nejistoty. Nejistotu píšeme obvykle jenom jednou 1 Zápis číselých hodot a ejistoty měřeí Zápis číselých hodot Naměřeé hodoty zapisujeme jako číselý údaj s určitým koečým počtem číslic. Očekáváme, že všechy zapsaé číslice jsou správé a vyjadřují tak i

Více

Přednáška V. Úvod do teorie odhadu. Pojmy a principy teorie odhadu Nestranné odhady Metoda maximální věrohodnosti Průměr vs.

Přednáška V. Úvod do teorie odhadu. Pojmy a principy teorie odhadu Nestranné odhady Metoda maximální věrohodnosti Průměr vs. Předáška V. Úvod do teore odhadu Pojmy a prcpy teore odhadu Nestraé odhady Metoda mamálí věrohodost Průměr vs. medá Opakováí výběrová dstrbučí fukce Sestrojíme výběrovou dstrbučí fukc pro výšku a váhu

Více

Deskriptivní statistika 1

Deskriptivní statistika 1 Deskriptiví statistika 1 1 Tyto materiály byly vytvořey za pomoci gratu FRVŠ číslo 1145/2004. Základí charakteristiky souboru Pro lepší představu používáme k popisu vlastostí zkoumaého jevu určité charakteristiky

Více

Univerzita Karlova v Praze Pedagogická fakulta

Univerzita Karlova v Praze Pedagogická fakulta Uverzta Karlova v Praze Pedagogcká fakulta SEMINÁRNÍ PRÁCE Z OBECNÉ ALGEBRY DĚLITELNOST CELÝCH ČÍSEL V SOUSTAVÁCH O RŮZNÝCH ZÁKLADECH / Cfrk C. Zadáí: Najděte pět krtérí pro děltelost v jých soustavách

Více

MATICOVÉ HRY MATICOVÝCH HER

MATICOVÉ HRY MATICOVÝCH HER MATICOVÉ HRY FORMULACE, KONCEPCE ŘEŠENÍ, SMÍŠENÉ ROZŠÍŘENÍ MATICOVÝCH HER, ZÁKLADNÍ VĚTA MATICOVÝCH HER CO JE TO TEORIE HER A ČÍM SE ZABÝVÁ? Teorie her je ekoomická vědí disciplía, která se zabývá studiem

Více

Interpolační křivky. Interpolace pomocí spline křivky. f 1. f 2. f n. x... x 2

Interpolační křivky. Interpolace pomocí spline křivky. f 1. f 2. f n. x... x 2 Iterpolace pomocí sple křvky dáo: bodů v rově úkol: alézt takovou křvku, která daým body prochází y f f 2 f 0 f x0 x... x 2 x x Iterpolace pomocí sple křvky evýhodou polyomálí terpolace změa ěkterého z

Více

11. Popisná statistika

11. Popisná statistika . Popsá statstka.. Pozámka: Př statstckém zkoumáí ás zajímají hromadé jevy a procesy, u kterých zkoumáme zákotost, které se projevují u velkého počtu prvků. Prvky zkoumáí azýváme statstcké jedotky. Př

Více

12. N á h o d n ý v ý b ě r

12. N á h o d n ý v ý b ě r 12. N á h o d ý v ý b ě r Při sledováí a studiu vlastostí áhodých výsledků pozáme charakter rozděleí z toho, že opakovaý áhodý pokus ám dává za stejých podmíek růzé výsledky. Ty odpovídají hodotám jedotlivých

Více

1. Základy měření neelektrických veličin

1. Základy měření neelektrických veličin . Základ měřeí eelektrckých velč.. Měřcí řetězec Měřcí řetězec (měřcí soustava) je soubor měřcích čleů (jedotek) účelě uspořádaých tak, ab blo ožě splt požadovaý úkol měřeí, tj. získat formac o velkost

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA SP esty dobré shody PRAVDĚPODOBNOS A SAISIKA Lbor Žá SP esty dobré shody Lbor Žá Přpomeutí - estováí hypotéz o rozděleí Ch-vadrát test Chí-vadrát testem terý e založe a tříděém statstcém souboru. SP esty

Více

Chyby měření: 1. hrubé chyby - nepozornost, omyl, únava pozorovatele... - významně převyšuje rozptyl náhodné chyby 2. systematické chyby - chybné

Chyby měření: 1. hrubé chyby - nepozornost, omyl, únava pozorovatele... - významně převyšuje rozptyl náhodné chyby 2. systematické chyby - chybné CHYBY MĚŘENÍ Opakovaé měřeí téže fyzkáí večy evede vždy k přesě stejým výsedkům. Této skutečost bychom se evyhu, kdybychom měřeí provádě s ejvětší důkadostí a precsostí aopak, čím ctvější a přesější jsou

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA SP4 Přpomeutí pojmů PRAVDĚPODOBNOST A STATISTIKA SP4 Přpomeutí pojmů SP4 Přpomeutí pojmů Pravděpodobost Náhodý jev: - základí prostor - elemetárí áhodý jev A - áhodý jev, - emožý jev, jstý jev podjev opačý

Více

Test dobré shody se používá nejčastěji pro ověřování těchto hypotéz:

Test dobré shody se používá nejčastěji pro ověřování těchto hypotéz: Ig. Marta Ltschmaová Statstka I., cvčeí 1 TESTOVÁNÍ NEPARAMETRICKÝCH HYPOTÉZ Dosud jsme se zabýval testováím parametrcký hypotéz, což jsou hypotézy o parametrech rozděleí (populace). Statstckým hypotézám

Více

8. Zákony velkých čísel

8. Zákony velkých čísel 8 Zákoy velkých čísel V této část budeme studovat velm často užívaá tvrzeí o součtech posloupost áhodých velč Nedříve budeme vyšetřovat tvrzeí azývaá souhrě ako slabé zákoy velkých čísel Veškeré úvahy

Více

Měření závislostí. Statistická závislost číselných znaků

Měření závislostí. Statistická závislost číselných znaků Měřeí závslostí Statstcká závslost číselých zaků - závslost dvou velč lze vádřt ako ech fukčí vztah vzorcem, taulkou hodot příslušé fukce eo grafck; - mez zak zkoumaých evů zšťueme estec příčé (kauzálí

Více

Náhodné jevy, jevové pole, pravděpodobnost

Náhodné jevy, jevové pole, pravděpodobnost S Náhodé jevy pravděpodobost Náhodé jevy jevové pole pravděpodobost Lbor Žák S Náhodé jevy pravděpodobost Lbor Žák Základí pojmy Expermet česky též vědecký pokus je soubor jedáí a pozorováí jehož účelem

Více

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL Elea Mielcová, Radmila Stoklasová a Jaroslav Ramík; Statistické programy POPISNÁ STATISTIKA V PROGRAMU MS EXCEL RYCHLÝ NÁHLED KAPITOLY Žádý výzkum se v deší době evyhe statistickému zpracováí dat. Je jedo,

Více

Model poptávky po železniční osobní dopravě Českých drah, a. s. na tuzemském přepravním trhu

Model poptávky po železniční osobní dopravě Českých drah, a. s. na tuzemském přepravním trhu Vědeckotechcký sorík ČD č. 3/0 Leka Zahradíková Model poptávky po železčí osoí dopravě Českých drah, a. s. a tuzemském přepravím trhu Klíčová slova: poptávka, osoí doprava, České dráhy, regresí aalýza,

Více

Statistika - vícerozměrné metody

Statistika - vícerozměrné metody Statstka - vícerozměré metody Mgr. Mart Sebera, Ph.D. Katedra kezologe Masarykova uverzta Fakulta sportovích studí Bro 0 Obsah Obsah... Sezam obrázků... 4 Sezam tabulek... 4 Úvod... 6 Pojmy... 7 Náhodé

Více

Vzorový příklad na rozhodování BPH_ZMAN

Vzorový příklad na rozhodování BPH_ZMAN Vzorový příklad a rozhodováí BPH_ZMAN Základí charakteristiky a začeí symbol verbálí vyjádřeí iterval C g g-tý cíl g = 1,.. s V i i-tá variata i = 1,.. m K j j-té kriterium j = 1,.. v j x ij u ij váha

Více

12. Neparametrické hypotézy

12. Neparametrické hypotézy . Neparametrcké hypotézy V této část se budeme zabývat specálí částí teore statstckých hypotéz tzv. eparametrckým hypotézam ebo jak řečeo eparametrckým statstckým testy. Neparametrcké se azývají proto,

Více

U. Jestliže lineární zobrazení Df x n n

U. Jestliže lineární zobrazení Df x n n MATEMATICKÁ ANALÝZA III předášky M. Krupky Zmí semestr 999/ 3. Iverzí a mplctí zobrazeí V této kaptole uvádíme dvě důležté věty, které acházeí aplkace v moha oblastech matematky: Větu o verzím a větu o

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA SP Záko velkých čísel, cetrálí lmtí věta PRAVDĚPODOBNOST A STATISTIKA Lbor Žák SP Záko velkých čísel, cetrálí lmtí věta Lbor Žák Kovergece podle pravděpodobost Posloupost áhodých proměých,,,, koverguje

Více

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA STAVEBNÍ KATEDRA SPECIÁLNÍ GEODÉZIE DIPLOMOVÁ PRÁCE

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA STAVEBNÍ KATEDRA SPECIÁLNÍ GEODÉZIE DIPLOMOVÁ PRÁCE ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA STAVEBNÍ KATEDRA SPECIÁLNÍ GEODÉZIE DIPLOMOVÁ PRÁCE Praha 8 Pavel Třasák ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA STAVEBNÍ KATEDRA SPECIÁLNÍ GEODÉZIE DIPLOMOVÁ

Více

8. Analýza rozptylu.

8. Analýza rozptylu. 8. Aalýza rozptylu. Lieárí model je popis závislosti, který je využívá v řadě disciplí matematické statistiky. Uvedeme jeho popis a tvrzeí, která budeme využívat. Setkáme se s ím jedak v aalýze rozptylu,

Více

T e c h n i c k á z p r á v a. Pokyn pro vyhodnocení nejistoty měření výsledků kvantitativních zkoušek. Technická zpráva č.

T e c h n i c k á z p r á v a. Pokyn pro vyhodnocení nejistoty měření výsledků kvantitativních zkoušek. Technická zpráva č. Evropská federace árodích asocací měřcích, zkušebích a aalytckých laboratoří Techcká zpráva č. /006 Srpe 006 Poky pro vyhodoceí ejstoty měřeí výsledků kvattatvích zkoušek T e c h c k á z p r á v a EUROLAB

Více

APLIKOVANÁ STATISTIKA

APLIKOVANÁ STATISTIKA VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FAKULTA MANAGEMENTU A EKONOMIKY VE ZLÍNĚ APLIKOVANÁ STATISTIKA FRANTIŠEK PAVELKA PETR KLÍMEK ZLÍN 000 Recezoval: Haa Lošťáková Fratšek Pavelka, Petr Klímek, 000 ISBN 80 4

Více

14. Testování statistických hypotéz Úvod statistické hypotézy Definice 14.1 Statistickou hypotézou parametrickou neparametrickou. nulovou testovanou

14. Testování statistických hypotéz Úvod statistické hypotézy Definice 14.1 Statistickou hypotézou parametrickou neparametrickou. nulovou testovanou 4. Testováí statistických hypotéz Úvod Při práci s daty se mohdy spokojujeme s itervalovým či bodovým odhadem parametrů populace. V mohých případech se však uchylujeme k jiému postupu, většiou jde o případy,

Více

6. Posloupnosti a jejich limity, řady

6. Posloupnosti a jejich limity, řady Moderí techologie ve studiu aplikovaé fyziky CZ..07/..00/07.008 6. Poslouposti a jejich limity, řady Posloupost je speciálí, důležitý příklad fukce. Při praktickém měřeí hodot určité fyzikálí veličiy dostáváme

Více

TECHNICKÁ UNIVERZITA V LIBERCI

TECHNICKÁ UNIVERZITA V LIBERCI TECHNICKÁ UNIVERZITA V LIBERCI Ekoomcká fakulta Semestrálí ráce S kua Jméa: Leka Pastorová, Davd arha, Ja Vtásek a Fl Urbačík Ročík: 0/06 Učtel: gr. Jří Rozkovec Obor: Podková ekoomka Datum:.. 06 Obsah

Více

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu Cvičeí 6: Bodové a itervalové odhady středí hodoty, rozptylu a koeficietu korelace, test hypotézy o středí hodotě při zámém rozptylu Příklad : Bylo zkoumáo 9 vzorků půdy s růzým obsahem fosforu (veličia

Více

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti. 10 Cvičeí 10 Statistický soubor. Náhodý výběr a výběrové statistiky aritmetický průměr, geometrický průměr, výběrový rozptyl,...). Bodové odhady parametrů. Itervalové odhady parametrů. Jedostraé a oboustraé

Více

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky Téma 6.: Základí pojmy matematické statistiky Vlastosti důležitých statistik odvozeých z jedorozměrého áhodého výběru: Nechť X,..., X je áhodý výběr z rozložeí se středí hodotou μ, rozptylem σ a distribučí

Více

Spojitost a limita funkcí jedné reálné proměnné

Spojitost a limita funkcí jedné reálné proměnné Spojitost a limita fukcí jedé reálé proměé Pozámka Vyšetřeí spojitosti fukce je možo podle defiice převést a výpočet limity V dalším se proto soustředíme je problém výpočtu limit Pozámka Limitu fukce v

Více

Matematika I, část II

Matematika I, část II 1. FUNKCE Průvodce studiem V deím životě, v přírodě, v techice a hlavě v matematice se eustále setkáváme s fukčími závislostmi jedé veličiy (apř. y) a druhé (apř. x). Tak apř. cea jízdeky druhé třídy osobího

Více

VYSOCE PŘESNÉ METODY OBRÁBĚNÍ

VYSOCE PŘESNÉ METODY OBRÁBĚNÍ VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Fakulta strojího ižeýrství Ústav strojíreské techologie ISBN 978-80-214-4352-5 VYSOCE PŘESNÉ METODY OBRÁBĚNÍ doc. Ig. Jaroslav PROKOP, CSc. 1 1 Fakulta strojího ižeýrství,

Více

1.1 Definice a základní pojmy

1.1 Definice a základní pojmy Kaptola. Teore děltelost C. F. Gauss: Matematka je královou všech věd a teore čísel je králova matematky. Základím číselým oborem se kterým budeme v této kaptole pracovat jsou celá čísla a pouze v ěkterých

Více

Univerzita Karlova v Praze Pedagogická fakulta

Univerzita Karlova v Praze Pedagogická fakulta Uverzt Krlov v Prze Pedgogcká kult SEMINÁRNÍ PRÁCE Z POLYNOMICKÉ ALGEBRY POLYNOM / CIFRIK Zdáí: Vyšetřete všem probrým prostředky polyom Vyprcováí: Rcoálí kořey Podle věty: Nechť p Q je koře polyomu q

Více

PODNIKOVÁ EKONOMIKA 3. Cena cenných papírů

PODNIKOVÁ EKONOMIKA 3. Cena cenných papírů Semárky, předášky, bakalářky, testy - ekoome, ace, účetctví, ačí trhy, maagemet, právo, hstore... PODNIKOVÁ EKONOMIKA 3. Cea ceých papírů Ceé papíry jsou jedím ze způsobů, jak podk může získat potřebý

Více

Výsledky této ásti regresní analýzy jsou asto na výstupu z poítae prezentovány ve form tabulky analýzy rozptylu.

Výsledky této ásti regresní analýzy jsou asto na výstupu z poítae prezentovány ve form tabulky analýzy rozptylu. Ig. Marta Ltschmaová Statstka I., cveí 4 JEDNODUCHÁ LINEÁRNÍ REGRESE asto chceme prozkoumat vztah mez dvma velam, kde jeda z ch, tzv. ezávsle promá x, má ovlvovat druhou, tzv. závsle promou Y. edpokládá

Více

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA PODNIKATELSKÁ ÚSTAV INFORMATIKY FACULTY OF BUSINESS AND MANAGEMENT INSTITUTE OF INFORMATICS POSOUZENÍ FINANČNÍ VÝKONNOSTI FIRMY JMP,

Více

} kvantitativní znaky

} kvantitativní znaky Měřeí tattcké závlot, korelace, regree Obecé prcpy závlot vzájemá ouvlot měřeých zaků Prof. RNDr. Jaa Zvárov rová,, DrSc. fukčí závlot x tattcká závlot átroje pro měřeí závlot leár rí regree korelace }

Více

Jednoduchá lineární regrese

Jednoduchá lineární regrese Jedoduchá leárí regrese Motvace: Cíl regresí aalýz - popsat závslost hodot velč Y a hodotách velč X. Nutost vřešeí dvou problémů: a) jaký tp fukce se použje k popsu daé závslost; b) jak se staoví kokrétí

Více

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu Cvičeí 6: Výpočet středí hodoty a rozptylu, bodové a itervalové odhady středí hodoty a rozptylu Příklad 1: Postupě se zkouší spolehlivost čtyř přístrojů Další se zkouší je tehdy, když předchozí je spolehlivý

Více

Doc. Ing. Dagmar Blatná, CSc.

Doc. Ing. Dagmar Blatná, CSc. PRAVDĚPODOBNOST A STATISTIKA Doc. Ig. Dagmar Blatá, CSc. Statsta statstcé údaje o hromadých jevech čost, terá vede zísáí statstcých údajů a jejch zpracováí teore statsty - věda o stavu, vztazích a vývoj

Více

METHOD OF THE URBAN MASS TRANSPORTATION QUALITY EVALUATION

METHOD OF THE URBAN MASS TRANSPORTATION QUALITY EVALUATION Ročík., Číslo II., 009 METODA HODNOCENÍ KVALITY MĚTKÉ HROMADNÉ DOPRAVY METHOD OF THE URBAN MA TRANPORTATION QUALITY EVALUATION Ivaa Olvková Aotace: Čláek se zabývá problematkou hodoceí kvalt městské hromadé

Více

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 2

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 2 SP3 Neparametrcké testy hypotéz PRAVDĚPODOBNOST A STATISTIKA Neparametrcké testy hypotéz čast Lbor Žák SP3 Neparametrcké testy hypotéz Lbor Žák Neparametrcké testy hypotéz - úvod Neparametrcké testy statstckých

Více

Náhodu bychom mohli definovat jako součet velkého počtu drobných nepoznaných vlivů.

Náhodu bychom mohli definovat jako součet velkého počtu drobných nepoznaných vlivů. Náhodu bychom mohli defiovat jako součet velkého počtu drobých epozaých vlivů. V rámci přírodích věd se setkáváme s pokusy typu za určitých podmíek vždy astae určitý důsledek. Např. jestliže za ormálího

Více

SOUKROMÁ VYSOKÁ ŠKOLA EKONOMICKÁ ZNOJMO. Statistika I. distanční studijní opora. Milan Křápek

SOUKROMÁ VYSOKÁ ŠKOLA EKONOMICKÁ ZNOJMO. Statistika I. distanční studijní opora. Milan Křápek SOUKROMÁ VYSOKÁ ŠKOLA EKONOMICKÁ ZNOJMO Statstka I dstačí studjí opora Mla Křápek Soukromá vysoká škola ekoomcká Zojmo Dube 3 Statstka I Vydala Soukromá vysoká škola ekoomcká Zojmo. vydáí Zojmo, 3 ISBN

Více

jsou varianty znaku) b) při intervalovém třídění (hodnoty x

jsou varianty znaku) b) při intervalovém třídění (hodnoty x Výběr z eřeštelých příkladů ze zkouškových testů Jde o výběr z tpů příkladů, jejchž úspěšost řešeí u zkoušek se blíží ule. Itervalové versus bodové tříděí V tabulce je uvedeo rozděleí četostí a) př bodovém

Více

P2: Statistické zpracování dat

P2: Statistické zpracování dat P: Statistické zpracováí dat Úvodem - Statistika: věda, zabývající se shromažďováím, tříděím a ásledým popisem velkých datových souborů. - Základem statistiky je teorie pravděpodobosti, založeá a popisu

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobost a aplikovaá statistika MGR. JANA SEKNIČKOVÁ, PH.D. 4. KAPITOLA STATISTICKÉ CHARAKTERISTIKY 16.10.2017 23.10.2017 Přehled témat 1. Pravděpodobost (defiice, využití, výpočet pravděpodobostí

Více

2. Vícekriteriální a cílové programování

2. Vícekriteriální a cílové programování 2. Vícerterálí a cílové programováí Úlohy vícerterálího programováí jsou úlohy, ve terých se a možě přípustých řešeí optmalzuje ěol salárích rterálích fucí. Moža přípustých řešeí je přtom defováa podobě

Více

Náhodný výběr 1. Náhodný výběr

Náhodný výběr 1. Náhodný výběr Náhodý výběr 1 Náhodý výběr Matematická statistika poskytuje metody pro popis veliči áhodého charakteru pomocí jejich pozorovaých hodot, přesěji řečeo jde o určeí důležitých vlastostí rozděleí pravděpodobosti

Více

STUDIUM MAXWELLOVA ZÁKONA ROZDĚLENÍ RYCHLSOTÍ MOLEKUL POMOCÍ DERIVE 6

STUDIUM MAXWELLOVA ZÁKONA ROZDĚLENÍ RYCHLSOTÍ MOLEKUL POMOCÍ DERIVE 6 Středoškolská techika 00 Setkáí a prezetace prací středoškolských studetů a ČVUT STUDIUM MAXWELLOVA ZÁKONA ROZDĚLENÍ RYCHLSOTÍ MOLEKUL POMOCÍ DERIVE 6 Pavel Husa Gymázium Jiřího z Poděbrad Studetská 66/II

Více

základním prvkem teorie křivek v počítačové grafice křivky polynomiální n

základním prvkem teorie křivek v počítačové grafice křivky polynomiální n Petra Suryková Modelováí křivek základím prvkem teorie křivek v počítačové grafice křivky polyomiálí Q( t) a a t... a t polyomiálí křivky můžeme sado vyčíslit sado diferecovatelé lze z ich skládat křivky

Více

UNIVERZITA JANA EVANGELISTY PURKYNĚ V ÚSTÍ NAD LABEM PEDAGOGICKÁ FAKULTA Katedra tělesné výchovy

UNIVERZITA JANA EVANGELISTY PURKYNĚ V ÚSTÍ NAD LABEM PEDAGOGICKÁ FAKULTA Katedra tělesné výchovy UNIVERZITA JANA EVANGELISTY PURKYNĚ V ÚSTÍ NAD LABEM PEDAGOGICKÁ FAKULTA Katedra tělesé výchovy VYBRANÉ NEPARAMETRICKÉ STATISTICKÉ POSTUPY V ANTROPOMOTORICE Zdeěk Havel Davd Chlář 0 VYBRANÉ NEPARAMETRICKÉ

Více

UČEBNÍ TEXTY OSTRAVSKÉ UNIVERZITY. Přírodovědecká fakulta ANALÝZA DAT. 2. upravené vydání. Josef Tvrdík

UČEBNÍ TEXTY OSTRAVSKÉ UNIVERZITY. Přírodovědecká fakulta ANALÝZA DAT. 2. upravené vydání. Josef Tvrdík UČEBNÍ TEXTY OSTRAVSKÉ UNIVERZITY Přírodovědecká fakulta ANALÝZA DAT. upraveé vydáí Josef Tvrdík OSTRAVSKÁ UNIVERZITA 008 OBSAH: Úvod... 3 Parametrcké testy o shodě středích hodot... 4. Jedovýběrový t-test...

Více

1 Popis statistických dat. 1.1 Popis nominálních a ordinálních znaků

1 Popis statistických dat. 1.1 Popis nominálních a ordinálních znaků 1 Pops statstcých dat 1.1 Pops omálích a ordálích zaů K zobrazeí rozděleí hodot omálích ebo ordálích zaů lze použít tabulu ebo graf rozděleí četostí. Tuto formu zobrazeí lze dooce použít pro číselé zay,

Více

S1P Popisná statistika. Popisná statistika. Libor Žák

S1P Popisná statistika. Popisná statistika. Libor Žák SP Popsá statstka Popsá statstka Lbor Žák SP Popsá statstka Lbor Žák Základí zdroje : skrpta Mateatka IV - doc. RNDr. Z. Karpíšek, CSc. ateatka o le - http://athole.fe.vutbr.cz/ Základ ateatcké statstk

Více