podle typu regresní funkce na lineární nebo nelineární model Jednoduchá lineární regrese se dá vyjádřit vztahem y



Podobné dokumenty
Regresní a korelační analýza

9. cvičení 4ST201. Obsah: Jednoduchá lineární regrese Vícenásobná lineární regrese Korelační analýza. Jednoduchá lineární regrese

ANALÝZA VZTAHU DVOU SPOJITÝCH VELIČIN

REGRESNÍ ANALÝZA. 13. cvičení

6. Demonstrační simulační projekt generátory vstupních proudů simulačního modelu

STATISTIKA (pro navazující magisterské studium)

Tomáš Karel LS 2012/2013

ANALÝZA ROZPTYLU (Analysis of Variance ANOVA)

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

ANOVA. Analýza rozptylu při jednoduchém třídění. Jana Vránová, 3.lékařská fakulta UK, Praha

Regresní a korelační analýza

Regresní a korelační analýza

Regresní a korelační analýza

Statistická analýza jednorozměrných dat

4EK211 Základy ekonometrie

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

4EK211 Základy ekonometrie

Regresní analýza 1. Regresní analýza

8 ANALÝZA ČASOVÝCH ŘAD SEZÓNNÍ SLOŽKA

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA

Časové řady - Cvičení

4EK211 Základy ekonometrie

Regresní a korelační analýza

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty

2 TESTOVÁNÍ HYPOTÉZ. RYCHLÝ NÁHLED KAPITOLY Neříkej: Objevil jsem pravdu! ale raději: Objevil jsem jednu z pravd! Chalil Gibran

4EK211 Základy ekonometrie

Cvičící Kuba Kubina Kubinčák Body u závěrečného testu

Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra matematiky. Bakalářská práce. Zpracování výsledků vstupních testů z matematiky

Korelační a regresní analýza

Bodové a intervalové odhady parametrů v regresním modelu

VLIV VELIKOSTI OBCE NA TRŽNÍ CENY RODINNÝCH DOMŮ

4EK211 Základy ekonometrie

Regresní a korelační analýza

LINEÁRNÍ REGRESE. Lineární regresní model

Téma 9: Vícenásobná regrese

Matematika I A ukázkový test 1 pro 2018/2019

Ilustrační příklad odhadu LRM v SW Gretl

Příprava ke státním maturitám 2011, vyšší úroveň obtížnosti materiál stažen z

Využití logistické regrese pro hodnocení omaku

10. Předpovídání - aplikace regresní úlohy

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů

Bodové a intervalové odhady parametrů v regresním modelu

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

Testování hypotéz o parametrech regresního modelu

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

Testování hypotéz o parametrech regresního modelu

Statistická šetření a zpracování dat.

4ST201 STATISTIKA CVIČENÍ Č. 10

PRAVDĚPODOBNOST A STATISTIKA

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Lineární regrese. Komentované řešení pomocí MS Excel

=10 =80 - =

Popisná statistika. Komentované řešení pomocí MS Excel

Protokol č. 1. Tloušťková struktura. Zadání:

Inovace bakalářského studijního oboru Aplikovaná chemie

Zadání Máme data hdp.wf1, která najdete zde: Bodová předpověď: Intervalová předpověď:

4EK211 Základy ekonometrie

CHYBY MĚŘENÍ. uvádíme ve tvaru x = x ± δ.

Otto DVOŘÁK 1 NEJISTOTA STANOVENÍ TEPLOTY VZNÍCENÍ HOŘLAVÝCH PLYNŮ A PAR PARABOLICKOU METODOU PODLE ČSN EN 14522

Stavový model a Kalmanův filtr

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

Metody zkoumání závislosti numerických proměnných

Zápočtová práce STATISTIKA I

(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination.

Tomáš Karel LS 2012/2013

1. Příklad U automobilu byla měřena spotřeba benzínu v závislosti na rychlosti:

Zobecněná analýza rozptylu, více faktorů a proměnných

Numerická matematika 1. t = D u. x 2 (1) tato rovnice určuje chování funkce u(t, x), která závisí na dvou proměnných. První

Plánování experimentu

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

6. Lineární regresní modely

AVDAT Klasický lineární model, metoda nejmenších

You created this PDF from an application that is not licensed to print to novapdf printer (

SIMULACE. Numerické řešení obyčejných diferenciálních rovnic. Měřicí a řídicí technika magisterské studium FTOP - přednášky ZS 2009/10

odpovídá jedna a jen jedna hodnota jiných

Regresní analýza. Eva Jarošová

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

Statistika pro geografy

Simulace. Simulace dat. Parametry

4ST201 STATISTIKA CVIČENÍ Č. 7

Pracovní list č. 3: Pracujeme s kategorizovanými daty

Teoretické modely diskrétních náhodných veličin

KGG/STG Statistika pro geografy

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

INDUKTIVNÍ STATISTIKA

Neuronové časové řady (ANN-TS)

Iterační výpočty. Dokumentace k projektu pro předměty IZP a IUS. 22. listopadu projekt č. 2

MS EXCEL 2010 ÚLOHY. Vytvořte tabulku podle obrázku, která bude provádět základní matematické operace se dvěma zadanými čísly a a b.

ZÁKLADY STATISTICKÉHO ZPRACOVÁNÍ ÚDAJŮ 5. hodina , zapsala Veronika Vinklátová Revize zápisu Martin Holub,

Odhad parametrů N(µ, σ 2 )

MS EXCEL 2010 ÚLOHY. Vytvořte tabulku podle obrázku, která bude provádět základní matematické operace se dvěma zadanými čísly a a b.

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

František Hudek. srpen 2012

POLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými.

Transkript:

4 Lneární regrese 4 LINEÁRNÍ REGRESE RYCHLÝ NÁHLED DO KAPITOLY Častokrát potřebujete zjstt nejen, jestl jsou dvě nebo více proměnných na sobě závslé, ale také jakým vztahem se tato závslost dá popsat. Většnou se zavádí pops y=f(x), kde proměnné y y, y, y ) kterou popsujeme, se ( n ( x, x, xn říká vysvětlovaná nebo závslá proměnná, zatímco x ) nazýváme vysvětlující nebo nezávslá proměnná. Teoretcké (deální) hodnoty závslé proměnné se značí malým písmenem y ( y, y, yn ), zatímco odhady se značí velkým písmenem Y ( Y, Y, Yn ). Vztah y f (x) se nazývá regresní rovnce nebo regresní model. Regresní modely se dají rozdělt podle počtu závslých proměnných na jednorovncové nebo vícerovncové modely podle počtu nezávslých proměnných na jednoduchou regres (s jednou nezávslou proměnnou x) nebo na vícenásobnou regres (s mnmálně nezávslým proměnným podle typu regresní funkce na lneární nebo nelneární model 4. JEDNODUCHÁ LINEÁRNÍ REGRESE Jednoduchá lneární regrese se dá vyjádřt vztahem y.y, kde a jsou parametry regresní rovnce a se nazývá rezduální odchylka nebo chyba. Teoretcké hodnoty parametrů se obecně značí řeckým písmem, například a, zatímco odhadnuté hodnoty se značí latnkou: b a b. Hledaná regresní přímka bude mít tvar y b b.y Odhady regresních parametrů můžeme získat metodou největších čtverců v případě, že jsou splněny předpoklady: Chyby mají nulovou střední hodnotu: E(ε )= Rozptyl chyb je konstantní, nezávslý na : var(ε )=σ =konstanta Chyby jsou vzájemně nezávslé: cov(ε,ε j )= Chyby mají normální rozdělení N(, σ ) V případě jednoduché lneární regrese y=β +β.x jsou vztahy pro výpočet hodnot b a b vyjádřeny takto: xy x. y b ; x x b y b x Pro ohodnocení vhodnost modelu se používá takzvaný koefcent determnace. Koefcent determnace se značí R a určuje, kolk procent celkové varablty dat je vysvětltelných regresním modelem. Koefcent determnace nabývá hodnot z ntervalu,, čím větší R tím lépe model popsuje daná data. Vyjadřuje se vztahem: ST R S kde S se nazývá celkový součet čtverců: y S y y n ( y y) - 5 -

Elena Melcová, Radmla Stoklasová a Jaroslav Ramík; Statstcké programy S je teoretcký součet čtverců: T S je rezduální součet čtverců: R S S T n Mez jednotlvým součty čtverců platí vztah: S S S. y R T ( Y y), a n R ( Y y ) pro teoretcké hodnoty Pro malé rozsahy výběru se místo koefcentu determnace používá upravený koefcent determnace, značí se R (z anglckého adjusted ): adj n R adj ( R ) n Druhá odmocnna koefcentu determnace se nazývá ndex korelace a značí se R, druhá odmocnna upraveného koefcentu determnace se nazývá upravený ndex korelace a značí se R. Oba ndexy nabývají hodnot z ntervalu, ; když je jejch hodnota jedná adj se o lneární závslost mez y a x. Platí: R n R adj ( R ) n Bodový odhad rozptylu rezduální složky (chyby) se nazývá rezduální rozptyl: SR sr n k kde k je počet regresních koefcentů (u vícenásobné regrese). Druhá odmocnna rezduálního rozptylu se nazývá směrodatná chyba odhadu a platí: SR sr n k V programu Excel můžete využít více různých možností pro výpočet hodnot regresních parametrů, a koefcentu determnace; dvě možnost s ukážeme. První možností jak získat odhady regresních koefcentů jednoduché lneární regrese je vložení trendu do grafu. Postup je ukázán v následujícím příkladu. ŘEŠENÝ PŘÍKLAD 4. Společnost prodávající bílou technku zkoumala, jak závsí zsk z prodeje na výdajích na reklamu. Tabulka uvádí údaje obdržené v deset náhodně vybraných prodejnách: Výdaje na reklamu (ts Kč) 6 8 9 4 7 4 Zsk z prodeje ( ts. Kč) 6 7 3 5 3 37 5 58 Nalezněte rovnc regrese a hodnotu koefcenty determnace pomocí vložení trendu do grafu. Řešení: Vložíme data z příkladu do programu Excel. Datovou řadu Výdaje na reklamu označíme x, datovou řadu Zsk z prodeje pak y. Sestrojíme bodový graf závslost y na x, kde hodnoty x budou odpovídat vodorovné ose a hodnoty y svslé ose. Data přpravená na další výpočty budou vypadat následovně (Obr. 4.): S S T y Y. - 5 -

4 Lneární regrese Obrázek 4. Jednou z možností, jak získat odhady regresních koefcentů, je vložení trendu do grafu. Postup: Klkneme v grafu na datovou řadu (jeden z bodů) pravým tlačítkem myš a z nabídky zvolíme Přdat spojnc trendu Otevře se průvodce Formát spojnce trendu. Ve složce Možnost spojnce trendu vyznačíme, že se jedná o lneární trend a chceme Zobrazt rovnc regrese a Zobrazt hodnotu spolehlvost R (Obr. 4.). Obrázek 4. - 5 -

Elena Melcová, Radmla Stoklasová a Jaroslav Ramík; Statstcké programy Výsledkem bude vložení přímky do obrázku a současně zobrazení regresní rovnce a koefcentu determnace R.(Obr. 4.3). Obrázek 4.3 Postupem, uvedeným v předchozím příkladu pomocí vkládaní trendu do grafu. umožňuje Excel odhad čtyř nelneárních modelů, založených na metodě nejmenších čtverců: k Polynomcký trend: y. x x kx Logartmcký trend: y.ln( x) Mocnnný trend: y. x Jednoduchý exponencální trend (specální případ exponencálního trendu): x. y Druhou možností jak získat hodnoty regresních koefcentů pomocí programu Excel je využít analytcký nástroj Regrese. Tento analytcký nástroj vypočítá nejen hodnoty regresních koefcentů a koefcentu determnace, ale test statstcké významnost regresního modelu, regresních koefcentů, ntervaly spolehlvost a další. Použtí nástroje Regrese je uvedeno v následujícím příkladu. ŘEŠENÝ PŘÍKLAD 4. Společnost prodávající bílou technku zkoumala, jak závsí zsk z prodeje na výdajích na reklamu. Tabulka uvádí údaje obdržené v deset náhodně vybraných prodejnách: Výdaje na reklamu (ts Kč) 6 8 9 4 7 4 Zsk z prodeje ( ts. Kč) 6 7 3 5 3 37 5 58 Pomocí analytckého nástroje Regrese vypočítejte hodnoty regresních koefcentů a hodnotu koefcentu determnace, na hladně spolehlvost,5 určete, zda je regresní koefcent b statstcky významný, a určete jeho 99% nterval spolehlvost. - 53 -

4 Lneární regrese Řešení: Po otevření dalogového okna (Data Analýza dat Regrese) lze zadat vstupní oblast dat x a y s popskam, vyznačt, že vstupní oblast obsahuje popsky a zadat hladnu spolehlvost pro ntervaly spolehlvost. (Obr. 4.4). Obrázek 4.4 Výsledkem jsou tř tabulky (Obr. 4.5); v první tabulce nazvané Regresní statstka jsou postupně zadány hodnoty ndexu korelace, koefcentu determnace, upraveného koefcentu determnace, směrodatné chyby odhadu a počet pozorování. Druhá tabulka se nazývá ANOVA, která má stejnou strukturu jako tabulka ANOVA popsaná v předchozí kaptole. Analýza rozptylu u lneární regrese se využívá u testu vhodnost modelu. Vhodnost modelu posuzujeme pomocí testové statstky, která má F rozdělení. Struktura testu je následovní:. Hypotéza: H (což značí, že model není vhodný) prot hypotéze : H : ;. Testové krtérum (kde n je počet pozorování, k je počet regresních koefcentů: ST F k SR n k 3. Krtcká hodnota: F ( ) k, nk F k, nk ( 4. Výsledek: Je-l F ) zamítá se H a model se považuje za vyhovující. Poslední tabulkou, která je výstupem analytckého nástroje Regrese, je tabulka obsahující regresní koefcenty, testové krtérum pro test spolehlvost regresních koefcentů - 54 -

Elena Melcová, Radmla Stoklasová a Jaroslav Ramík; Statstcké programy a hrance ntervalů spolehlvost regresních koefcentů. Test statstcké významnost regresních koefcentů má tvar: Obrázek 4.5. Hypotéza: H :, H :. Testové krtérum: b T s b ) ( 3. Krtcká hodnota: ( ) tn k t n k 4. Výsledek: Je-l T ( ), zamítá se H a přjímá H ; regresní koefcent je různý od nuly. Jný způsob určení výsledku: Hodnota pravděpodobnost p odpovídající testovému krtéru T se pak porovnává s hladnou významnost α. Je-l p < α zamítá se H a model se považuje za vyhovující. Výsledky: Z poslední tabulky ve sloupc Koefcenty vyhledáte hodnoty regresních koefcentů. V tomto případě b 4, 9 a b, 86. Hodnotu koefcentu determnace určíte z první tabulky ( hodnota spolehlvost R nepeřesný překlad z anglčtny) R, 975. Koefcent b je na hladně spolehlvost,5 statstcky významný (p-hodnota je menší než,5), a 99% nterval spolehlvost pro koefcent b je,38; 3, 44. 4. VÍCENÁSOBNÁ LINEÁRNÍ REGRESE Vícenásobnou lneární regres lze vyjádřt vztahem: y. x. x k. xk, kde,.,.,, jsou parametry regresní rovnce a se nazývá rezduální odchylka k nebo chyba. Teoretcké hodnoty parametrů se obecně značí řeckým písmenem, například,.,.,, k, zatímco odhadnuté hodnoty se značí latnkou b, b., b,, bk. Hledaná regresní přímka bude mít tvar: y b b. x b. x b k. x k. - 55 -

4 Lneární regrese Odhady regresních parametrů můžeme získat metodou nejmenších čtverců v případě, že jsou splněny předpoklady: Chyby mají nulovou střední hodnotu: E ( ) Rozptyl chyb je konstantní, nezávslý na : var( ) konst. Chyby jsou vzájemně nezávslé: cov(, ) j Chyby mají normální rozdělení N (, ) Vysvětlující proměnné nejsou lneárně závslé Počet pozorování je větší než počet regresních koefcentů Hodnoty bývají zadávány jako výsledky průzkumu, měření nebo pozorování v tabulce: Hodnoty závsle proměnné Hodnoty nezávsle proměnných Y x x x k y x, x, x,k y x, x, x,k y n x n, x n, x n,k Kde k je počet nezávslých proměnných a n je počet pozorování. V Excelu se pro vícenásobnou regres používá analytcký nástroj Regrese. Interpretace výsledků pro vícenásobnou lneární regres je stejná jako v případě jednoduché lneární regrese, použtí tohoto nástroje demonstruje následující řešený příklad. ŘEŠENÝ PŘÍKLAD 4.3 Níže uvedená tabulka obsahuje údaje o objemu prodeje, velkost reklamních výdajů a ročních nákladů na školení obchodních zástupců u 8 vybraných frem: Objem prodeje (ml. Kč) Reklamní výdaje (ts. Kč) Náklady na školení (ts. Kč) Y x x 6 8 35 3 3 38 8 6 33 3 4 4 34 8 44 38 3 46 4 34 45 44 3 49 Popšte závslost objemu produkce na reklamních výdajích a nákladech na školení pomocí modelu y=b +b x +b x. - 56 -

Elena Melcová, Radmla Stoklasová a Jaroslav Ramík; Statstcké programy Řešení: Po otevření dalogového okna (Data Analýza dat Regrese) lze zadat vstupní oblast dat x a y s popskam, vyznačt, že vstupní oblast obsahuje popsky a zadat hladnu spolehlvost pro ntervaly spolehlvost (Obr. 4.6). Výsledné tabulky jsou podobné jako u jednoduché lneární regrese (Obr. 4.7). Obrázek 4.6 Obrázek 4.7 Odhadovaná regresní rovnce má tvar y 79,9,56. x 6,54. x - 57 -

4 Lneární regrese 4.3 VYROVNÁVÁNÍ ČASOVÝCH ŘAD Časové řady jsou jedním ze specálních druhů statstckých dat, kde nezávslou proměnnou je čas. Časové ntervaly, ve kterých byla závsle proměnná měřena, jsou stejně dlouhé a mohou to být například sekundy, mnuty, dny, roky, ale také trojmnutové ntervaly nebo a půldenní ntervaly. Časové řady se hodně využívají v ekonom, kde popsují časový vývoj různých ekonomckých ukazatelů. V Excelu máme k dspozc pouze jenoduché nástroje analýzy časových řad. Komplexnější nástroje analýzy poskytuje program SPSS, vz kaptly 7 a 8. Časovou řadu lze rozložt na 4 složky: trendovou, sezónní, cyklckou a náhodnou. Trendovou složku lze popsat regresním modelem, kdy za nezávsle proměnnou dosazujeme čas. V případě, že čas je zadaný nečíselně například datem nebo slovně (pondělí, úterý, atp.), je možné zavést náhradní časovou proměnnou (například přrozená čísla,, 3, ) a pak postupovat podle regresních modelů. Ekonomcké časové řady jsou obvykle dost nevyrovnané, obsahují šumy. Aby se zčást elmnoval vlv šumů na trendovou složku, časové řady se vyrovnávají. Program Excel nabízí dvě možnost vyrovnávání časových řad, a to buď pomocí klouzavých průměrů, nebo pomocí exponencálního vyrovnání. Podstata vyrovnání časové řady pomocí klouzavých průměrů spočívá v tom, že posloupnost hodnot časové řady se nahradí novou řadou průměrů vypočítaných z kratších úseků časové řady. V prax jsou rozsahy kratších částí voleny buď podle přrozené perodcty souboru (například 7, když se jedná o dny v týdnu, 4 když jde o kvartální data nebo když jde o měsíční data) nebo se používají menší lché délky 3, 5 nebo 7 časových jednotek. V programu Excel lze pro výpočet klouzavých průměrů využít analytcký nastroj Klouzavý průměr. Náhled na průvodce nástrojem (Obr. 4.8): Obrázek 4.8 Jako Vstupní oblast se vkládá sloupec vyrovnávaných hodnot; Interval označuje délku kratší časové řady, ze které se počítají klouzavé průměry. Standardně je zvolená délka m=3. Výsledkem je nová časová řada, ve které se prvním m- členům nepřradí žádná hodnota (#N/A), členům od pořadí m až do konce se přradí hodnota: y ˆ. y l. m lm - 58 -

Elena Melcová, Radmla Stoklasová a Jaroslav Ramík; Statstcké programy Když je zaklknuta volba Vytvořt graf, výstupem nástroje bude také graf původních a vyrovnaných hodnot. Po volbě Standardní chyby se zobrazí ještě hodnoty m členných klouzavých standardních chyb, a to tak, že prvních ( m ) členům se nepřradí žádná hodnota a dalším členům se přřadí hodnoty: ( yl yˆ l ) lm s ( yˆ) m Pro další analýzu metodou časových řad je vhodné hodnoty vypočítaných klouzavých průměrů posunout k časovým proměnným tak jak s to analýza vyžaduje. V případě, že s nejste jstí, jak velký nterval klouzavých průměrů chcete použít, je nejlepší podívat se na body na klouzavé průměry v grafcké podobě. To můžete udělat tak, že do bodového grafu závslost proměnné x na čase přdáte klouzavé průměry různých stupňů pomocí Přdat spojnc trendu stejně, jak u lneární regrese. Pro výpočet exponencálního vyrovnání je v procesoru Excel určený analytcký nástroj Exponencální vyrovnání. Náhled na průvodce nástrojem (Obr. 4.9): Obrázek 4.9 U exponencálního vyrovnání se nová vyrovnaná hodnota stanoví na základě exponencálně váženého průměru současné hodnoty a všech předchozích hodnot časové řady tak, že první vyrovnanou hodnotu postavíme rovnu první naměřené hodnotě a pro další hodnoty použjeme rekurentní vztah: yˆ y a dále y ˆ w. y ( w).ˆ y kde w je koefcent exponencálního zapomínání a ( w) se nazývá koefcent útlumu; w nabývá hodnot z ntervalu,.vyplnění vstupních hodnot analytckého nástroje Exponencální vyrovnání je podobné jako u nástroje Klouzavý průměr. Výsledek je sloupec dat, který neodpovídá přesně očekávaným hodnotám: první řádek je bez hodnoty a samotné hodnoty začínají až od druhého časového bodu, poslední hodnota chybí. Pro potřeby další analýzy musíte hodnoty posunout k odpovídajícím časovým bodům a poslední člen dopočítat (protože buňky vyrovnaných hodnot obsahují vzorce lze chybějící hodnotu získat zkopírováním vzorce). - 59 -

4 Lneární regrese ŘEŠENÝ PŘÍKLAD 4.4 Následující obrázek obsahuje hodnoty zadání výsledky. Úkolem bylo danou časovou řadu vyrovnat pomocí klouzavých průměrů s délkou 3 a správně přřadt vyrovnané hodnoty. Dalším úkolem bylo danou časovou řadu vyrovnat exponencálním vyrovnáním s koefcentem zapomínání,3; dopočítat poslední hodnotu a správně umístt vyrovnané hodnoty (Obr. 4.). Obrázek 4. 4.4 PŘÍKLADY K PROCVIČENÍ PŘÍKLAD 4. Následující tabulka obsahuje počty vyrobených televzí v ts. Kč v devít po sobě jdoucích letech. Rok 4 5 6 7 8 9 Počet 3 4 35 45 48 5 56 6 55 a) Danou časovou řadu vyrovnejte pomocí klouzavých průměrů s délkou 3. b) Časovou řadu vyrovnejte exponencálním vyrovnáním s koefcentem zapomínání,. c) Sestrojte bodový graf a přdejte znázornění klouzavých průměrů stupně 3 do grafu. - 6 -

Elena Melcová, Radmla Stoklasová a Jaroslav Ramík; Statstcké programy PŘÍKLAD 4. Banka zkoumala velkost měsíčního zůstatku na běžných účtech a jeho závslost na příjmové položce účtu. Hodnoty měsíčních zůstatků a příjmů za měsíc leden pro klentů jsou v následující tabulce: Zůstatek 46 57 58 5 3 79 5 8 Příjem 46 7 36 8 8 4 3 4 78 a) Vypočítejte regresní koefcenty, napšte rovnc modelu a vypočítejte koefcent determnace, když předpokládáte logartmcký trend. b) Vypočítejte stejné proměnné jako v a), ale předpokládejte mocnnný trend. PŘÍKLAD 4.3 Banka zkoumala velkost měsíčního zůstatku na běžných účtech a jeho závslost na příjmové položce účtu a na výdajové položce účtu. Hodnoty měsíčních zůstatků, příjmů a výdajů za měsíc leden pro klentů (v ts. Kč) jsou v následující tabulce: Zůstatek 46 57 58 5 3 79 5 8 Příjem 46 7 36 8 8 4 3 4 78 Výdej 8 43 4 4 3 44 6 7 a) Vypočítejte regresní koefcenty a napšte rovnc modelu s konstantním členem. b) Vypočítejte koefcent determnace. c) Na hladně významnost α=, testujte statstckou významnost koefcentů b a b. 4.5 ŘEŠENÍ PŘÍKLADŮ ŘEŠENÍ PŘÍKLADU 4. Obrázek 4. - 6 -

4 Lneární regrese ŘEŠENÍ PŘÍKLADU 4. Výsledek: a) zůstatek=-47,+69,96.ln(příjem), R =,478. b) zůstatek=,93.příjem,, R =,388. ŘEŠENÍ PŘÍKLADU 4.3 Výsledek: a) Zůstatek=7,69-,6.příjem+4,.výdej. b) R =,437. c) Na zvolené hladně významnost není b an b statstcky významný. 4.6 PŘÍPADOVÉ STUDIE PŘÍPADOVÁ STUDIE 4. Společnost prodávající počítače zkoumala zsk z prodeje a výdaje na reklamu. Tabulka uvádí údaje obdržené v dvacet za sebou jdoucích letech: Rok Zsk z prodeje Výdaje na reklamu 99 33 3 993 356 3 994 478 5 995 499 5 996 489 6 997 567 8 998 555 3 999 678 3 668 34 6 35 789 38 3 79 38 4 78 39 5 8 4 6 84 4 7 876 44 8 95 47 9 99 49 987 5 8 5 a) Popšte zsk z prodeje na reklamních výdajích pomocí modelu y=b +b x. Pro model vypočítejte hodnoty regresních koefcentů a hodnotu koefcentu determnace, pomocí analýzy rozptylu testujte vhodnost modelu. Na hladně spolehlvost, určete, zda je regresní koefcent b statstcky významný, a určete jeho 99% nterval spolehlvost. - 6 -

Elena Melcová, Radmla Stoklasová a Jaroslav Ramík; Statstcké programy b) Zkoumejte řady z hledska toho, že se jedná o časové řady. Obě řady vyrovnejte exponencálním vyrovnáním s koefcentem zapomínání,3; pro každou řadu odhadněte model trendové složky časové řady y=b +b t, kde za t dosadíte rok určení hodnot. Na hladně významnost, stanovte, zda jsou regresní koefcenty statstcky významné. PŘÍPADOVÁ STUDIE 4. Společnost prodávající počítače zkoumala zsk z prodeje a výdaje na reklamu. Tabulka uvádí údaje obdržené v dvacet za sebou jdoucích letech: Rok Zsk z prodeje Výdaje na reklamu 99 433 3 993 3556 33 994 478 5 995 4399 65 996 489 86 997 5467 8 998 5655 3 999 6778 3 6868 34 68 65 789 78 3 79 98 4 738 339 5 8 34 6 84 34 7 876 344 8 95 377 9 99 399 987 4 8 45 a) Popšte zsk z prodeje na reklamních výdajích pomocí modelu y=b +b x. Pro model vypočítejte hodnoty regresních koefcentů a hodnotu koefcentu determnace, pomocí analýzy rozptylu testujte vhodnost modelu. Na hladně významnost, určete, zda je regresní koefcent b statstcky významný, určete jeho 99% nterval spolehlvost. b) Zkoumejte následující řady z hledska toho, že se jedná o časové řady. Obě řady vyrovnejte exponencálním vyrovnáním s koefcentem zapomínání,3; a pro každou řadu odhadněte model trendové složky časové řady y=b +b t, kde za t dosadíte rok určení hodnot. Na hladně významnost, určete, zda jsou regresní koefcenty statstcky významné. - 63 -