Masarykova Univerzita Ekonomicko-správní fakulta. Kolektiv autorů (Jaroslav Bil, Daniel Němec, Martin Pospiš)

Rozměr: px
Začít zobrazení ze stránky:

Download "Masarykova Univerzita Ekonomicko-správní fakulta. Kolektiv autorů (Jaroslav Bil, Daniel Němec, Martin Pospiš)"

Transkript

1 Masarykova Univerzita Ekonomicko-správní fakulta gretl uživatelská příručka Kolektiv autorů (Jaroslav Bil, Daniel Němec, Martin Pospiš) podzim 2009

2 ii

3 Obsah Předmluva ix 1 Úvod Co je Gretl? Instalace Gretlu Základy práce v Gretlu Import dat Programovaní v Gretlu Session koncept Jednoduchá lineární regrese Načtení dat Sestrojení grafu Odhad parametrů Elasticita Model vícenásobné regrese Vytvoření modelu Statistiky modelu Testování parametrů modelu Multikolinearita T test F test Nelineární rozšíření modelu Testování klasických předpokladů Normalita reziduí Heteroskedasticita Testovaní homoskedasticity Řešení problémů s heteroskedasticitou Autokorelace Testování a řešení Literatura 51

4 iv OBSAH

5 Seznam tabulek

6 vi SEZNAM TABULEK

7 Seznam obrázků 1.1 Hlavní okno programu Gretl Import dat prostřednictvím GUI Gretlu Záložky nainstalovaných datových zdrojů Zobrazení hodnot proměnné y Seznam dostupných příkazů Seznam výpočetních funkcí Editor skriptů programu Gretl Nástrojová lišta Gretlu Ikonický úložný prostor Ukládání obsahu session do souboru Modelová tabulka v okně Gretlu Otevření datového souboru Úprava atributů proměnných Okno k editaci atributů proměnných Nastavení proměnných k grafu Výsledný graf Metoda nejmenších čtverců Nastavení proměnných modelu Okno s výsledkem regrese Kovarianční matice regresorů Popisná statistika dat Tabulka popisné statistiky dat Řešení modelu vícenásobné regrese Sestavení modelu Výsledky sestaveného modelu Sestavení ANOVA tabulky Analýza rozptylu Zobrazení korelační matice Sestavení korelační matice Korelační matice Sestavení tabulky konfidenčních intervalů Konfidenční intervaly koeficientů

8 viii SEZNAM OBRÁZKŮ 3.11 Výsledky F testu Vynechání proměnné Výběr proměnné k vynechání Výsledky redukovaného modelu Lineární omezení modelu Výsledky modelu s lineárním omezením Přidání druhých mocnin vybraných proměnných Výsledky testů normality reziduí Graf reziduí Graf reziduí v závislosti na WAGE Graf reziduí v závislosti na EDUC Graf reziduí v závislosti na EXPER Výběr příslušného testu heteroskedasticity Robustní směrodatné chyby Výsledky odhadu metodou WLS s robustními sm. chybami Nastavení časových řad Výběr korelogramu reziduí Nastavení maximálního zpoždění Graf ACF a PACF Tabulka korelogramu

9 Předmluva Tento text je založen primárně na anglickém, volně dostupném textu Adkinse [1], který doprovází učebnici základů ekonometrie trojice Hill, Griffiths a Lim [2]. Jedná se sice o velmi zkrácený (postupně doplňovaný) český překlad Adkinsonovy příručky, nicméně pro základní orientaci v práci s gretlem je dostačující.

10 x Předmluva

11 Kapitola 1 Úvod V první kapitole se seznámíme se základy programu Gretl, procesem jeho instalace a s popisem základního uživatelského rozhraní. 1.1 Co je Gretl? Název programu Gretl je zkratkou vycházející z Gnu Regression, Econometrics and Time-series Library. Jedná sa o softvérový balíček, který obsahuje užitečné a jednoduše aplikovatelné nástroje ekonometrické analýzy. Potěšující vlastností je jeho volná dostupnost, díky které si program můžete stáhnout zdarma z internetové adresy gretl.sourceforge.net. Gretl je možné rozšírit o množství vzorových datových zdrojů a databází makroekonomických časových řad. Program využívá při výpočtech plejádu účelových odhadových techník, s kterými se postupně obeznámíme v následujících kapitolách. Samozřejmostí je schopnost vykreslovat data do přehledných grafů, případně generovat textový výstup do standartních formátů (TXT, RTF), včetně populárního L A TEX Instalace Gretlu Práci s programem Gretl začneme jeho instalací. Po stáhnutí instalačního souboru z internetu nebo fakultního serveru a jeho následným spuštěním se aplikace dotazuje na umístění programu a název složky v seznamu nainstalovaných programů. Ideální je vše ponechat na přednastavených hodnotách, čím sa vyhneme případným problémům při pozdějším instalování dodatečných modulů a datových zdrojů. Nahrávání těchto doplňků do Gretlu probíhá stejným triviálním způsobem jako jeho samotná instalace(tedy opakovaným stláčením tlačítka Next ). Jelikož v této příručce využijeme příklady z publikace [2], je užitečné naplnit Gretl daty. Spuštěním souboru POEdata.exe, nacházejícím se ve složce

12 2 Úvod Obrázek 1.1: Hlavní okno programu Gretl. gretl - data files, začneme instalační proces datového zdroje a s využitím výše uvedeného postupu se dopracujeme k jeho úspěšnému konci Základy práce v Gretlu Stejných výsledků můžeme v Gretlu dosáhnout třemi způsoby: prostřednictvím grafického uživatelského rozhraní (GUI), konzole na psaní kódu a systémového příkazového řádku. Poslední z uvedených možností přeskočíme, neboť ji nebudeme využívat. 1.2 Import dat Prostředníctvím Gretlu můžeme pracovat s velkým množstvím vysoce kvalitních dat z různých ekonometrických učebnic, tak i reálného makroekonomického prostředí. Na ukázku načítáme do programu údaje z druhé kapitoly [2], představující výdaje na jídlo (za předpokladu, že datový zdroj OEdata.exe byl úspěšne nainstalovaný postupem, který je uvedený v sekci 1.1.1). Datová sada se skládá z dvou proměnných nazvaných x a y. Proměnná y představuje týdenní výdaje na jídlo v domácnosti a pod x se skrývá týdenní příjem měřený v $100 jednotkách. Z menu lišty hlavního okna Gretlu vybereme položku Soubor > Otevřít data > Vzorový soubor [File > Open data > Sample file], jak je vyobrazené na obrázku 1.2.

13 1.2 Import dat 3 Obrázek 1.2: Import dat prostřednictvím GUI Gretlu. Alternativně je možné využít rychlejší způsob, a sice kliknout na tlačítko Otevřít datový soubor [open dataset] v nástrojové liště. Docílíme tak otevření okna s názvem Datové soubory [data files] (obrázek 1.3), které obsahuje záložky reprezentující datové zdroje už nainstalované do Gretlu. Přejdeme na záložku PoE, vybereme datovou sadu pojmenovanou food a klikneme na tlačítko Otevřít [open] ve vrchní části okna. Tato operace nám zabezpečí načtení dat týkajících se výdajů domácností na jídlo do Gretlu. V tomto okamžiku stačí pro zobrazení hodnot proměnné y vybrat v menu lišty Data > Ukázat hodnoty [Data > Display values] (obrázek 1.4). Pokud si přejeme zobrazit hodnoty několika proměnných, označíme příslušné řádky a zopakujeme právě uvedený postup. Přes rozbalovací menu Data můžeme navíc data editovat, přidávat další pozorování a v neposlední řadě též určit strukturu datové sady. Struktura určuje, zda pracujeme s časovými řadami, průřezovými nebo panelovými daty. Výběr vhodného typu je velmi důležitý, neboť každá datová struktura má charakteristický rozsah dostupných funkcí pro její analýzu. Přes volbu Soubor > Otevřít data > Importovat [File > Open data > Import] je možné nahrát do Gretlu i data jiných formátů (např. z Excelovského.xls) bez nutnosti instalace datového zdroje. Rovněž je program schopný exportovat datovou sadu do dalších formátů nebo přes volbu Soubor > Databáze > Na databázovém serveru [File > Databases > On database server] zpřístupnit obrovské množství dat z internetu.

14 4 Úvod Obrázek 1.3: Záložky nainstalovaných datových zdrojů. Obrázek 1.4: Zobrazení hodnot proměnné y.

15 1.3 Programovaní v Gretlu 5 Obrázek 1.5: Seznam dostupných příkazů. 1.3 Programovaní v Gretlu Gretlovské GUI se vyznačuje rychlostí a jednoduchostí použití, i když k náročnějším úlohám je výhodnější využít konzolu na psaní kódu v jazyce Gretl. Tu si otevřeme buď prostředníctvím tlačítka na nástrojové liště nebo přes Nástroje > Konzole gretlu [Tools > Gretl console] v menu. Je důležité mít na zřeteli, že jazyk Gretlu rozlišuje velká a malá písmena, takže názvy příkazů musíme psát tak, jak jsou uvedené v seznamu dostupných příkazů (obrázek 1.5). Ten získáme stlačením příslušného tlačítka na nástrojové liště, přes menu v Nápověda > Popis příkazu > Prostý text [Help > Command reference > Plain text], případně zadáním příkazu help do konzoly. Podobně nápovědu k požadovanému příkazu vyvoláme napsáním help název příkazu (např. help arima). K seznamu dostupných výpočtových funkcí (obrázek 1.6) se dostaneme přes Nápověda > Popis funkce [Help > Function reference]. Nevýhodou konzole programu Gretl je skutečnost, že umožňuje jen postupné a jednorázové zadávání příkazů. Toto omezení snadno překonáme v editoru na psani skriptů, přístupného buď přes menu Soubor > Scriptové soubory > Nový script [File > Script files > New script] nebo tlačítkem na nástrojové liště. Editor (obrázek 1.7) slouží na vytvoření série příkazů (v souhrnu označované jako skript), které jsou následně provedeny v jedné dávce stlačením příslušného tlačítka. Skript může být uložen do samostatného souboru a spuštěná později. Pokud si nejsme jisti významem konkrétní funkce, stlačením záchranného kruhu v okně editoru skriptů se kurzor myši obohatí o otázník a následným kliknutím na text neznámeho příkazu vyskočí okno s nápovědou. Dobrou zprávou je, že všechny příkazy vykonané přes GUI nebo konzoli

16 6 Úvod Obrázek 1.6: Seznam výpočetních funkcí. Obrázek 1.7: Editor skriptů programu Gretl.

17 1.4 Session koncept 7 Obrázek 1.8: Nástrojová lišta Gretlu. Gretlu zůstanou zaznamenané v příkazovém protokole, který nájdeme v menu Nástroje > Výpis příkazu [Tools > Command log]. Pro zopakovaní uvádíme obrázek 1.8 s popisem tlačítek na nástrojové liště Gretlu. 1.4 Session koncept Gretl disponuje schopností ukládat modely, grafy a datové sady do společného, tzv. ikonického úložného prostoru s názvem relace [session]. K tomuto prostoru (obrázek 1.9) sa dostaneme jako obvykle stlačením příslušného tlačítka na nástrojové liště, a samozřejme též přes menu Zobrazit > Zobrazit ikony [View > Icon view]. Objekty (modely, grafy atd.) je možné do relace [session] přidávat výběrem Soubor > Uložit do relace jako ikonu [File > Save to session as icon] v menu okna (případně vyvoláním kontextové nabídky stisknutím pravého tlačítka myši), které si přejeme uchovat na pozdější použití. Celý obsah relace [session] následně uložíme přes Soubor > Soubory relace > Uložit relaci [File > Session files > Save session] z hlavního okna programu Gretl, jak je vyobrazené na obrázku Vraťme se ještě k úložnému prostoru icon view (obrázek 1.9). Z názvů jednotlivých ikon vyplývá, že umožňují zobrazení výsledků modelů a grafů, informace o datech a jejich editaci, náhled na souhrnou statistiku a korelace. Pokud posuneme kurzor myši na ikonu Tabulka modelu [Model table], sestavíme si přehlednou tabulku dosažených výsledků (obrázek 1.11), kterou můžeme vyexportovat do různých formátů včetně L A TEXu. Podobný postup je možné aplikovat za účelem vytvoření tabulky grafů.

18 8 Úvod Obrázek 1.9: Ikonický úložný prostor. Obrázek 1.10: Ukládání obsahu session do souboru.

19 1.4 Session koncept 9 Obrázek 1.11: Modelová tabulka v okně Gretlu.

20 10 Úvod

21 Kapitola 2 Jednoduchá lineární regrese Připomeňme, že jednoduchý lineární regresní model je tvaru: y t = β 1 + β 2 x t + ɛ t, kde y t je tzv. závisle proměnná, kterou odhadujeme pomocí parametrů β 1 a β 2 na základě pozorované veličiny x t a ɛ t je vektor reziduí, o němž předpokládáme, že jeho složky mají identické normální rozdělení s nulovou střední hodnotou a jsou nezávislé. Ještě doplňme, že odhad modelu je založen na metodě nejmenších čtverců. 2.1 Načtení dat Po spuštení Gretlu klikněte na Soubor > Otevřít data > Soubor uživatele [File > Open data > User file] nebo Vzorový soubor [Sample file]. Následně vyberte vámi zvolený datový soubor, s kterým budete chtít dále pracovat. Dále pak klikněte pravým tlačítkem myši a vyberte Otevřít [Open] nebo klikněte na ikonku nahoře vlevo viz obr Pak by se vám mělo otevřít následující okno obr. 2.2 s uvedením všech proměnných, které jsou v datovém souboru uloženy popř. i s jejich popiskem. Budete-li chtít upravit atributy jednotlivé proměnné (např. jak se má daná proměnná zobrazovat v grafech), pak klikněte na zvolenou proměnnou pravým tlačítkem myši a zvolte Upravit atributy [Edit attributes]. Alternativní postup vede z hlavního panelu přes Proměnná > Upravit atributy [Variable > Edit attributes]. Mělo by se vám otevřít následující okno, kde můžete jednotlivé atributy pozměnit či doplnit (obr. 2.3). 2.2 Sestrojení grafu Pro vytvoření grafu nejdříve klikneme na ikonku dole graf X-Y [X-Y graph], (třetí zprava). Objeví se nám okno jako na obr. 2.4.

22 12 Jednoduchá lineární regrese Obrázek 2.1: Otevření datového souboru. Obrázek 2.2: Úprava atributů proměnných.

23 2.2 Sestrojení grafu 13 Obrázek 2.3: Okno k editaci atributů proměnných. Obrázek 2.4: Nastavení proměnných k grafu.

24 14 Jednoduchá lineární regrese Obrázek 2.5: Výsledný graf. Zvolíme nezávisle proměnnou, kterou chceme vynést na osu X a klikneme na tlačítko Vybrat [Choose]. Následně zvolíme závisle proměnnou(é), kterou(é) vyneseme na osu Y a klikneme na Přidat [Add]. Teď už stačí jen potvrdit tlačítkem OK a dostaneme požadovanou regresní přímku (obr. 2.5). Křížkem jsou vyznačeny jednotlivá data,(najetím kursoru na příslušný datový prvek se zobrazí jeho časový údaj). V levém horním rohu je pak explicitně vyjádřena rovnice regresní přímky. 2.3 Odhad parametrů K odhadu parametrů modelu je třeba vybrat z hlavní nabídky záložku Model > Obyčejné nejmenší čtverce [Model > Ordinary Least Squares] nebo kliknout na ikonku OLS model vpravo dole. Poté se vám otevře okno podobné tomu jako v případě vykreslování grafu (obr. 2.7). Stejným způsobem zadáte závisle a nezávisle proměnné. Implicitně se vám nastaví do modelu konstantní složka,(budete li odhadovat model, o němž víte, že by regresní přímka měla procházet počátkem, bude třeba položku const ze seznamu nezávisle proměnných odebrat). Po odkliknutí OK se vám otevře následující okno s výsledkem (obr. 2.8), kde v prvním sloupečku jsou uvedeny odhadnuté koeficienty β 1, β 2 modelu, ve druhém směrodatné odchylky těchto odhadů, ve třetím pak realizace testové

25 2.4 Elasticita 15 Obrázek 2.6: Metoda nejmenších čtverců. statistiky a konečně v posledním tzv. p hodnota, která udává (v procentech 100) maximální možnou hladinu významnosti, za které by nulová hypotéza (v tomto případě β 1 = 384, 105) byla přijata. Počet hvězdiček jen znázorňuje, jaká by hladina významnosti měla být, aby nulová hypotéza byla přijata (*** - menší než 1%, ** - 1% až 5%, * - 5% až 10%). Pod tabulkou následuje výčet mnoha dalších z modelu vypočtených statistických údajů. Za zmínku stojí koeficient determinace, který pro připomenutí ukazuje, jak velký díl výchozí variability hodnot závisle proměnné se nám podařilo vysvětlit uvažovanou regresní závislostí. K odhadu rozptylů a kovariancí regresorů, tedy kovarianční matice, stačí zvolit z hlavního menu Analýza > Kovarianční matice regresorů [Analysis > Coefficient covariance matrix], jak ukazuje obr Elasticita Elasticita křivky je koncept, který je ekonomickou teorií poměrně často využíván. Připomeňme, že vyjadřuje míru citlivosti reakce zkoumané veličiny na změny jiné veličiny. Pokud bychom z našeho ilustrativního příkladu chtěli zjistit citlivost průměrné spotřeby ke změně důchodu, známý vztah převedeme do této podoby: ɛ = E(C)/E(C) Y/Y = β 2 Y E(C),

26 16 Jednoduchá lineární regrese Obrázek 2.7: Nastavení proměnných modelu.

27 2.4 Elasticita 17 Obrázek 2.8: Okno s výsledkem regrese. Obrázek 2.9: Kovarianční matice regresorů.

28 18 Jednoduchá lineární regrese Obrázek 2.10: Popisná statistika dat. kde E(C) a Y nahradíme jejich průměry. Ty získáme tak, že kursorem vybereme zmíněné proměnné (popř. podržením klávesy Ctrl a zaklikáním všech potřebných proměnných) a dále v hlavní nabídce najdeme Zobrazit > Popisné statistiky [View >Summary statistics] jak je ukázáno na obr Alternativní způsob by byl po zatržení proměnných kliknout pravým tlačítkem myši a z nabídky vybrat Deskriptivní statistika [Descriptive statistics]. Otevře se vám tabulka (obr. 2.11), ve které máte pro zvolené veličiny vypočteny střední hodnoty, mediány (prostřední hodnota ze seřazeného seznamu prvků), minimální a maximální hodnoty, směrodatné odchylky, variační koeficienty, které vyjadřují míru variability a jsou definované jako podíl směrodatné odchylky a absolutní hodnoty ze střední hodnoty a nakonec koeficienty šikmosti a špičatosti. V našem výpočtu elasticity bysme dostali: ɛ = 0, = 1.03.

29 2.4 Elasticita 19 Obrázek 2.11: Tabulka popisné statistiky dat.

30 20 Jednoduchá lineární regrese

31 Kapitola 3 Model vícenásobné regrese Tento model je určitým rozšířením předchozího modelu, které spocívá zejména v tom, že nyní budeme pracovat s více než jednou vysvětlující proměnnou. Obecný tvar tohoto modelu můžeme zapsat následovně: y i = β 0 + β 1 x i1 + + β K x ik i = 1, 2,..., N, kde index i značí jednotlivá pozorování a index k = 1, 2,..., K pak jednotlivé vysvětlující proměnné, a tedy β 0, β 1,....β K jsou parametry jež odhadujeme. Tento model oproti předchozímu musíme rovnež obohatit o jeden předpoklad, že libovolnou z vysvětlujících proměnných nejsme schopni vyjádřit jako nějakou lineární kombinaci ostatních vysvětlujících proměnných (pak by jsme totiž nemohli jednoznačně určit odhadované parametry, protože by existovala celá řada kombinací bet, která by stejně kvalitně vysvětlovala veličinu y). O tomto problému se obecně mluví jako o problému multikolinearity,(v dusledku existence korelací mezi vysvětlujícími proměnnými), a prakticky je jím do určité míry zatížen každý model. Ještě dodejme poznámku ke správné interpretaci obdrženého modelu. Jednotlivé odhadnuté parametry β 1,....β K udávájí, jak moc se v průměru změní odhadovaná veličina y, kdybysme o jednotku zvýšili příslušnou (k β k ) vysvětlující proměnnou x k o jednotku, za předpokladu, že ostatní vysvětlující proměnné se nezmění. 3.1 Vytvoření modelu Nejprve opět musíme načíst nějaký datový soubor, s kterým budeme chtít pracovat. Zde uvedený ilustrativní příklad najdete ve vzorových datových souborech Gretlu v záložce Ramanathan pod názvem data6-4 (Salary and employment characteristics). Kliknutím na ikonku s íčkem zjistíte, že tento datový soubor obsahuje informace o mzdách, úrovni vzdělání, věku a počtem roků jež jsou zaměstnanci u dané společnosti zaměstnáni.

32 22 Model vícenásobné regrese Obrázek 3.1: Řešení modelu vícenásobné regrese. Když už máme datový soubor načtený, můžeme se pustit do sestavení samotného modelu. Postup se prakticky shoduje s případem jednoduché regrese. Tedy klikneme buď na ikonu OLS model v dolní liště nebo vybereme záložku Model > Obyčejné nejmenší čtverce [Model > Ordinary Least Squares] (obr. 3.1). Vyskočí nám již známé okno, kde postupně přidáme závisle proměnnou mzdu (WAGE) a do nezávisle proměnných zbývající proměnné (není nutné a zpravidla ne i optimální do modelu zahrnout všechny dostupné proměnné). My pro začátek do modelu zahrneme všechny dostupné proměnné: vliv vzdělání, věrnosti společnosti a věk, tedy k nezávisle proměnným přidáme veličiny EDUC, EXPER a AGE (obr. 3.2). Poté klikneme na tlačítko OK a můžeme se podívat na obdržené výsledky (obr. 3.3), kterým v této kapitolce věnujeme trošku více pozornosti. 3.2 Statistiky modelu K výpočtu jednotlivých statistik se často využívá hodnot, jež jsou obsaženy v tzv. ANOVA tabulce. Tu získame tak, že z okna s modelem klikneme na záložku Analýza > ANOVA [Analysis > ANOVA]. Otevře se nám pak následující okno s analýzou rozptylu. Postup je zachycen na obrázcích 3.4 a 3.5. V prvním sloupci najdeme postupně součet čtverců regrese, reziduií a nakonec celkový součet čtverců, které jsou v literatuře obvykle značeny jako SSR, SSE a SST. Připomeňme, že SST vyjadřuje kvadratický součet odchylek od

33 3.2 Statistiky modelu 23 Obrázek 3.2: Sestavení modelu.

34 24 Model vícenásobné regrese Obrázek 3.3: Výsledky sestaveného modelu. Obrázek 3.4: Sestavení ANOVA tabulky.

35 3.3 Testování parametrů modelu 25 Obrázek 3.5: Analýza rozptylu. střední hodnoty z pozorovaných dat, matematicky zapsáno SST = N i=1 (Y i Ȳ ) 2, kde Ȳ značí střední hodnotu. SST se rozkládá na součet SSR a SSE, kde SSR je kvadratický součet odchylek od střední hodnoty z odhadnutých dat, matematicky SSR = N i=1 (Ŷi Ȳ )2, kde Ŷ jsou odhadnuté hodnoty pomocí modelu. Tedy můžeme říci, že SSR udává, vysvětlenou velikost variability z původních dat. Ta nevysvětlená je pak zahrnuta v SSE, kterou vyjádříme jako SSE = N i=1 (Y i Ŷ )2. V druhém sloupci jsou pak uvedeny příslušné stupně volnosti. Jejich vydělením pak obdržíme, zde uváděný střední kvadrát. Významná je zejména střední chyba reziduí, v literatuře značená jako M SE, jež je s využitím nestrannosti odhadu modelu pomocí metody nejmenších čtverců zároveň odhadem rozptylu reziduí. Poslední hodnota uvedená v ANOVA tabulce vyjadřuje odhad rozptylu závisle proměnné. Pod tabulkou pak máme vypočtený koeficient determinace, o nemž jsme se již zmínili dříve včetně postupu k jeho určení. Nakonec je tam i uvedena hodnota F-statistiky, ale o ní blíže pojednáme v následující subkapitole. Vraťme se ještě k výsledkům našeho modelu. Níže uvedené střední odchylky jsou získány jednoduše jako odmocniny z rozptylu, získaných např. z ANOVA tabulky. Je zde však zapotřebí upozornit na nepříliš vhodně zvolený výraz pro střední chybu reziduí, která je v české verzi značena jako S.CH. regrese (v původní angl. verzi tento problém není). Spíše pro zajímavost ještě stručně vysvětleme co je tzv. adjustovaný koeficient determinace. Jedná se o snahu klasický koeficient determinace očistit (snížit) od skutečnosti, že se koeficient zlepší jen v důsledku přidání další vysvětlující proměnné do modelu. 3.3 Testování parametrů modelu Multikolinearita V úvodu kapitoly jsme se zmínili o problému kolinearity, který vzniká v důsledku korelace mezi nezávisle proměnnými. Nejjednodušším způsobem jak zjistit, zda existuje silná korelace mezi proměnnými je, se podívat na korelační matici. Tu

36 26 Model vícenásobné regrese Obrázek 3.6: Zobrazení korelační matice. v Gretlu získáme, když z hlavní nabídky Gretlu vybereme záložku Zobrazit > Korelační matice [View > Correlation matrix] (obr. 3.6). Otevře se vám následující okno (obr. 3.7), kde již známým postupem přes tlačítko Pridat vyberete proměnné, z nichž budete chtít sestavit korelační matici. Pak již stačí odkliknout OK. V našem případě vidíme, že korelace nejsou příliš významné (obr. 3.8). Nejsilnější lineární vztah je mezi věkem a délkou zaměstnání, jak by se dalo i očekávat. Nicméně hodnota 0, 4 není natolik vysoká, aby způsobila větší problémy s multikolinearitou (dle [3] je hodnota závažná jestliže se vyskytne korelace v absolutní hodnotě větší než 0, 9). To jak daná míra korelace ovlivní intervaly spolehlivosti jednotlivých parametrů, závisí taktéž na tom, jak velký máme datový soubor a na velikosti rozptylu jednotlivých proměnných. Pokud budeme mít malý datový soubor s vysokou variací jednotlivých proměnných, pak i menší korelace mohou způsobit nevýznamnost jednotlivých parametrů modelu a naopak. I když tato metoda zjišťování multikolinearity není zrovna nejtechničtější, tak její síla spočívá zejména v jednoduchosti, a tedy průhlednosti. Ještě přidejme jednu menší poznámku, že pokud máme model s více jak dvěmi nezávisle proměnnými, pak jednotlivé korelace mohou být zkresleny od reality tím, že při jejich výpočtu nejsme schopni dobře rozlišit vzájemný vztah mezi dvěma proměnnými od vlivu lineární kombinace ostatních proměnných.

37 3.3 Testování parametrů modelu 27 Obrázek 3.7: Sestavení korelační matice. Obrázek 3.8: Korelační matice.

38 28 Model vícenásobné regrese T test T testy slouží především ke zkoumání významnosti jednotlivých odhadnutých koeficientů. To zda nulovou hypotézu, že β i = 0 zamítneme (a tedy řekneme, že na zvolené hladině významnosti není daný koeficient statisticky nevýznamný) můžeme zjistit třemi způsoby: pomocí intervalů spolehlivosti, porovnáním testové statistiky s kritickou hodnotou, pomocí p hodnoty. Intervaly spolehlivosti pro jednotlivé parametry modelu získáme jednoduše tak, že v okně s výsledkem modelu vybereme Analýza > Konfidenční intervaly koeficientů [Analysis > Confidence intervals for coefficients]. Pokud příslušný interval spolehlivosti obsahuje nulu, pak nulovou hypotézu nemůžeme zamítnout. V našem případe tedy nulové hypotézy, že const = 0 a AGE = 0 nemůžeme na hladině významnosti 95% zamítnout. Ze šířky intervalu také můžeme usuzovat o přesnosti odhadu. Čím je daný interval relativně vůči své střední hodnotě širší, tím je odhad parametru méně přesný (k tomuto účelu však lépe poslouží směrodatné odchylky parametrů uvedené ve výsledcích modelu). Změnu hladiny významnosti provedete kliknutím na ikonku alfy. Proč se intervaly spolehlivosti při vyšší hladině významnosti rozšiřují a naopak, ponecháme na promyšlení čtenáři. Postup s výsledky najdete na obrázcích 3.9 a K stejnému zjištění můžeme dojít porovnáme li hodnoty realizací testových statistik s kritickou hodnotou. Jestliže absolutní hodnota testové statistiky bude větší než kritická hodnota, tedy že se realizuje v kritickém oboru, pak nulovou hypotézu zamítame. Hodnoty testových statistik pro jednotlivé parametry modelu naleznete ve čtvrtém sloupečku v okně s výsledky modelu a kritickou hodnotu pak na prvním řádku okna konfidenčních intervalů spolehlivosti. Ještě udělejme poznámku, jak postupovat v případě alternetivní jednostranné,(pravo či levostranné) hypotézy (H 1 : β i > 0 β i < 0). Jednoduše kritickou hodnotu najdeme tak, že hladinu významnosti nastavíme na dvojnásobek než požadujeme. V případě levostranné hypotézy navíc využijeme vlastnosti symetrie studentova rozdělení (tedy si před kritickou hodnotu přimyslíme znaménko minus). Na závěr jsme si nechali uživatelsky nejpohodlnější metodu založenou na tzv. p hodnotě. O ní jsme již pojednali v předchozí kapitole, tak jen krátce shrneme, že nulovou hypotézu zamítneme, jestliže je p hodnota nižší než požadovaná hladina významnosti F test F testy lze formálně využít na testování jakékoli hypotézy, kterou lze zapsat lineární kombinací regresních koeficientů. My se zde hlavně zaměříme na testování významnosti modelu jako celku a na testování podmodelů, které nám umožní model co nejlépe specifikovat. Kdyby náš model obsahoval irelevantní

39 3.3 Testování parametrů modelu 29 Obrázek 3.9: Sestavení tabulky konfidenčních intervalů. Obrázek 3.10: Konfidenční intervaly koeficientů.

40 30 Model vícenásobné regrese Obrázek 3.11: Výsledky F testu. (z hlediska vysvětlovací síly) vysvětlující proměnné, pak by to vedlo k výšší variabilitě odhadnutých parametrů. Naopak kdybychom do modelu nezahrnuly relevantní proměnné, pak by odhady našich parametrů byly vychýlené. Připomeňme ještě matematickou konstrukci F statistiky: F = (SSE u SSE r )/(R u R r ) SS u /(N R u ) F (Ru R r,n R u) jestliže je H 0 pravdivá, kde N je počet pozorování, R = K + 1 je počet regresorů modelu a indexy r a u značí, zda se jedná o model omezený (restricted) nebo neomezený (unrestricted). Z této konstrukce je dobře vidět, že statistika nabyde nízkých hodnot, což nepovede k zamítnutí nulové hypotézy, jestliže se součty čtverců reziduí zkoumaných modelů nebudou výrazněji lišit. Pokud nás zajímá, jestli náš model celkově dobře vysvěluje chování závisle proměnné, potom vlastně testujeme nulovou hypotézu H 0 : β 1,..., β k = 0. Výsledky tohoto testu včetně p hodnoty jsou k nálezení v okně modelu popř. pod ANOVA tabulkou. V našem případě je p hodnota velice nízká, což nás vede k jednoznačnému zamítnutí nulové hypotézy (obr. 3.11). Pusťme se do zajímavějšího zkoumání toho, zda nějaké vysvětlující proměnné nejsou v našem modelu nadbytečné. Z výsledků našeho modelu jako největší kandidát na vyřazení se jeví parametr AGE. V Gretlu se s tím jednoduše vypořádáme tak, že v okně s modelem najedeme na Testy > Vynechat proměnné [Tests > Omit variables]. Otevře se nám následující okno, jak je zachyceno na obr a 3.13.

41 3.3 Testování parametrů modelu 31 Obrázek 3.12: Vynechání proměnné. Vybereme proměnnou AGE a přes tlačítko Přidat ji dáme do seznamu proměnných, které budou vynechány. Necháme zatržené políčko Odhadnout redukovaný model (Waldův test sice přinaší stejné výsledky, dokonce je operačně méně náročný, ale jeho výsledky jsou v Gretlu skromnějšího charakteru). Poté stačí odkliknout OK a dostane se nám podrobných informací o výsledcích testu (obr. 3.14). Tedy nejlepší lineární model, který z dostupných dat můžeme naestimovat je (můžete si sami vyzkoušet, že odbourání jakékoliv další proměnné k lepším výsledkům nepovede): W AGE i = EDUC i + 42EXP ER i + ɛ i Alternativní přístup, jak sestavit co nejlepší model je ten, že nejprve vytvoříme model s tou(těmi) vysvětlující(mi) proměnnou(-ými), u nichž jsme si jisti, že budou mít silnou vysvětlovací schopnost a pak postupně model zkoušíme obohacovat o další proměnné, přičemž sledujeme, zda přidání určité nové proměnné zlepšilo statistiky modelu. K tomu slouží nástroj Přidat proměnné [Add variables], který najdete hned pod nástrojem Vynechat proměnné. Postup práce je analogický jako při odebírání proměnných, tedy není nutné ho zde uvádět. Závěrem se budeme zabývat případem testování složitějších hypotéz. Předpokládejme, že se daná firma chválí tím, že každý dosažený vyšší stupeň vzdělání (pro jednoduchost budeme předpokládat, že každy další vyšší stupeň vzdělání je dosažen po třech letech) se u jejich zaměstnanců promítne v nárustu $500 v měsíční mzdě, a že každým rokem jsou zaměstnacům platy navyšovány v

42 32 Model vícenásobné regrese Obrázek 3.13: Výběr proměnné k vynechání.

43 3.3 Testování parametrů modelu 33 Obrázek 3.14: Výsledky redukovaného modelu.

44 34 Model vícenásobné regrese Obrázek 3.15: Lineární omezení modelu. průměru o $50. Naším úkolem bude na základě námi dostupných dat zjistit, zda chování firmy svědčí o tom, co prohlašuje. Tedy naší nulovou hypotézu, kterou budeme chtít testovat můžeme zapsat následovně: H 0 : 3 EDUC = 500, EXP ER = 70 K tomu bude zapotřebí kliknout na Testy > Lineární omezení [Tests > Linear restrictions]. Otevře se vám následující okno (obr. 3.15), do kterého budeme muset ručně zadat požadovanou testovou hypotézu. Hypotéza se zadává jako systém rovnic, přičemž by mělo být respektováno to, že na levé straně rovnice bude nějaká lineární kombinace parametrů a na straně pravé pouze hodnota. Parametry modelu se zadávají ve formě b[pořadí parametru]. Zde je nutno si dát pozor, neboť naše β 0 odpovídá b[1] atd.. Tedy naší nulovou hypotézu zapíšeme jako: 3 b[2] = 500 b[3] = 70 Pak stačí už jen odkliknout OK a otevře se nám následující okno (obr. 3.16) s výsledkem. Vidíme, že i toto na první pohled nadnesené tvrzení nemůžeme na hladině významnosti 95% (ani 90%) zamítnout. 3.4 Nelineární rozšíření modelu Zatím jsme zkoumali jen lineární závislosti mezi vysvětlovanou a vysvětlujícími proměnnými. V skutečnosti však může chování závisle proměnné lépe vyjadřovat nějaký jiný funkcionální vztah. Na druhou stranu použitím nějakého

45 3.4 Nelineární rozšíření modelu 35 Obrázek 3.16: Výsledky modelu s lineárním omezením. složitého modelu ztratíme jasnou vypovídací schopnost jednotlivých parametrů. Vyjímku tvoří datové soubory s exponenciálním trendem (v ekonomii je např. dobrým příkladem Cobb Douglesova produkční funkce), které po jejich logaritmizaci nabydou lineární podoby, kdy pak při interpratice parametrů stačí zaměnit slůvko o jednotku s o jeden procetní bod. Krom této log lineární formy se v praxi můžeme setkat s tzv. polynomickými modely, kdy obecně jednotlivé vysvětlující proměnné jsou vyjádřeny ve formě polynomu stupně n (ale většinou je dostačující použít kvadratickou závislost). Nyní zkusme náš dosavadní model lépe odhadnout s využitím druhých mocnin vysvětlujících proměnných EDUC a EXPER (u proměnné AGE nemá smysl uvažovat existenci kvadratického vztahu vzhledem k nevýznamnosti lineárního vztahu). Tedy náš nový model bude moci být zapsán v následujícím tvaru: W AGE i = β 0 + β 1 EDUC i + β 2 EXP ER i + β 3 EDUC 2 i + β 4 EXP ER 2 i + ɛ i Abysme mohli náš nový model sestavit potřebujeme do datového souboru přidat proměnné EDUCi 2 a EXP ERi 2. V Gretlu to provedeme nejdříve vybráním požadovaných proměnných a následným najetím kurzoru myši na Přidat > Druhé mocniny vybraných proměnných [Add > Squares of selected variables], jak to ukazuje následující obrázek Přidání nových proměnných do dosavadního modelu se provede výše popsaným způsobem. Je lepší do modelu proměnné přidávat postupně a přitom sledovat statistiky modelu (jestliže je model po přidání nové proměnné horší, tak tuto novou proměnnou do modelu nezahrneme, ale zkusíme přidat další, naopak pokud se náš model vylepší, tak pouze náš model zkoušíme dále obohatit). Neexistuje však naprosto jednoznačné stanovisko, která by nám vždy řeklo, zda je nový model lepší nebo horší než ten předchozí. Kromě výsledků, které nám Gretl při srovnání modelů vypíše je dobré sledovat, jak se mění t statistiky či

46 36 Model vícenásobné regrese Obrázek 3.17: Přidání druhých mocnin vybraných proměnných. směrodatné odchylky parametrů a hodnotu koeficientu determinace. Může se stát, že nový model bude lepší vysvětlovací sílu na úkor zhoršení přesnosti odhadů parametrů modelu. Pak závísí především na nás a na požadovaném cíli, s kterým model budujeme, pro který model se nakonec rozhodneme. Když si s naším modelem chvilku pohrajete, pak nejlepší forma, které pravděpodobně dosáhnete bude následující: W AGE i = EXP ER i + 11EDUC 2 i + ɛ i Z modelu vyplývá, že v daném podniku s délkou zaměstnání roste mzda lineárně, zatímco s dosaženým vyšším stupněm vzdělání kvadraticky. Na závěr zkusme ještě obohatit náš uvedený příklad o vlivu vzdělání a věrnosti podniku na průměrnou mzdu. Pro případné zájemce o práci v této firmě by byla relevantnější informace o kolik procent jim ročně mzda poroste. Proto firma dodává, že průměrný roční růst mezd je 5%. Zkusme otestovat tuto hypotézu. Abysme přímo zjistili, jak se každý další rok strávený u této společnosti promítne v procentním zhodnocení mzdy, musíme náš model odhadnout ve tvaru: log W AGE i = β 0 + β 1 EDUC i + β 2 EXP ER i + ɛ i Zlogaritmované hodnoty mezd dostaneme obdobným způsobem jako druhé mocniny tak, že klikneme na Přidat > Logaritmy vybraných proměnných [Add > Logs of selected variables]. Pak odhadneme výše zmíněný model, na

47 3.4 Nelineární rozšíření modelu 37 kterém otestujeme hypotézu H 0 : β 2 = 0.05, kterou v Gretlu zapíšeme jako b[3] = 0, V tomto případě již nulovou hypotézu zamítáme. 1 V Gretlu se nepouživá klasická anglická tečková notace nýbrž česká s desetinnou čárkou.

48 38 Model vícenásobné regrese

49 Kapitola 4 Testování klasických předpokladů V této kapitole si ukážeme některé postupy, které nám poslouží k ověření předpokladů modelu. Pokud některé předpoklady nejsou dodrženy, dochází ke zkreslení obdržených výsledků. Zaměříme se na testování normality a homoskedasticity reziduí a v závěru také autokorelace, která bývá spíše spojováná jen s dynamickými modely. V následujících dvou podkapitolách budeme vycházet z lineárního modelu odhadnutého v předchozí kapitole, který měl následující podobu: W AGE i = EDUC i + 42EXP ER i + ɛ i 4.1 Normalita reziduí Dle předpokladů by náhodná složka ɛ i, která je pro nás představována rezidui, měla mít normální rozdělení s nulovou střední hodnotou. Nulové střední hodnoty bude v případě zahrnutí úrovňové konstaty do modelu vždy dosaženo. Pak pracujeme s dostatečně velkým souborem, tak i s normalitou se nemusíme moc trápit, neboť odhad vektoru parametrů β má asymptoticky normální rozdělení. V našem případě datový soubor je tvořen 49 ti pozorování, proto ověření normality bude na místě. Abychom mohli s rezidui pohodlně pracovat, bude vhodné si je uložit jako další proměnnou. K tomu stačí najet na záložku Uložit > Rezidua [Save > Residuals]. K otestovaní normality, kdy za nulovou hypotézu bereme, že rezidua mají normální rozdělení, stačí vybrat Proměnná > Test normality [Variable > Normality test]. Ukáže se nám okno (obr. 4.1) s výsledky čtyř různých testů včetně na přednášce uvedeného Jarque-Berova testu, využivajícího koeficientu šikmosti a špičatosti. Vidíme, že nulová hypotéza je zamítnuta jen v případě Lillieforsova testu. Tedy můžeme říct, že předpoklad normality reziduí je pro náš model přípustný. Pokud bychom chtěli si Gretlovský výpočet ověřit ručně, tak potřebné koeficienty získáme z tabulky popisných statistik, k níž se dostaneme přes Zobrazit > Popisné statistiky [View > Summary

50 40 Testování klasických předpokladů Obrázek 4.1: Výsledky testů normality reziduí. statistics] (mj. zde můžeme ověřit nulovost střední hodnoty reziduí). Z okna s modelem najetím na Testy > Normalita reziduí [Tests > Normality of residuals] dostaneme výsledek Doornik-Hansenova testu-jeho stavbou se zde však zabývat nebudeme. 4.2 Heteroskedasticita Testovaní homoskedasticity Jedním z nejjednoduších, i když technicky ne zrovna nejpřesnějších způsobů, je podívat se čistě na graf reziduí a okem usoudit zda rozptyly můžeme považovat za homoskedastické. Graf jednoduše dostaneme, když v okně s modelem najedeme na Grafy > Graf reziduí > Podle čísla pozorování [Graphs > Residual graph > Against number of observations]. Pokud bychom chtěli na grafu něco poupravit, nyní se např. může nabýzet úprava pro lepší znázornění na schodovity tvar. Té bysme docílili kliknutím na graf a z možností vybrali Editovat [Edit] a v nově otevřeném okně vybrali záložku Čáry [Lines], kde jako typ čáry zvolíme Kroky [Steps]. Z grafu vidíme (obr. 4.2), že několika větších výkyvů složka reziduí dosahuje, i když to není až zas tak dramatické. Pokud by nás zajímala, zda rozptyl závisí na jednotlivých proměnných, pak stačí myší najet na Grafy > Graf reziduí > V závislosti na WAGE, EDUC, EXPER [Graphs > Residual graph > Against WAGE, EDUC, EXPER]. Zde vidíme, že se určitá závislost projevuje (obr. 4.3, 4.4 a 4.5). Nyní se podívejme na jednotlivé testy, které nám Gretl poskytuje. Ty jsou dostupné v záložce Testy > Heteroskedasticita [Tests > Heteroskedasticity] a kliknutím na příslušný test, který si přejeme provést (obr. 4.6). Whiteův test patří k obecnější testům, kdy za alternativní hypotézu bereme obecně

51 4.2 Heteroskedasticita 41 Obrázek 4.2: Graf reziduí. Obrázek 4.3: Graf reziduí v závislosti na WAGE.

52 42 Testování klasických předpokladů Obrázek 4.4: Graf reziduí v závislosti na EDUC. Obrázek 4.5: Graf reziduí v závislosti na EXPER.

53 4.2 Heteroskedasticita 43 Obrázek 4.6: Výběr příslušného testu heteroskedasticity. H 1 : σ i σ, kdy je pak v našem případě 2 odhadován model: ˆε 2 i = α 1 + α 2 EDUC i + α 3 EXP ER i + α 4 EDUC i EXP ER i + α 5 EDUC 2 i + + α 6 EXP ER 2 i + ν i Pak výsledná statistika N R 2, kde N je počet pozorování by měla mít za platnosti nulové hypotézy chí kvadrát rozdělení se tupni o jeden méně než je počet parametrů. Whiteův test s dodatkem pouze mocniny provede stejný test jen s tím rozdílem, že v odhadovaném regresním modelu jsou vynechány smíšené členy. Dalším v Gretlu uvedeným a zde posledně zmíněným je Breusch Paganův test. V něm by byla obecně pro náš případ alternativní hypotéza brána ve formě H 1 : σ i = h(α 1 + α 2 EDUC i + α 3 EXP ER i ), kdy za funkci h se obvykle bere funkce exponenciální nebo lineární, jak je tomu v případě Gretlu. Tedy při výpočtu je odhadován model: ˆε 2 i = α 1 + α 2 EDUC i + α 3 EXP ER i + ν i 2 Obecně jsou v regresi pro rozptyl jako nezávisle proměnné brány všechny nezávisle proměnné a jejich kvadráty z původního modelu plus smíšené součiny těchto regresorů.

54 44 Testování klasických předpokladů Obrázek 4.7: Robustní směrodatné chyby. Potřebná statistika je pak stejná jako u Whiteova testu. Všechny tyto modely naši nulovou hypotézu zamítají, tedy naše dosavadní výsledky jsou zatíženy tímto porušením předpokladů Řešení problémů s heteroskedasticitou Jedno z uživatelsky příjemných řešení, jak se s heteroskedasticitou vypořádat spočívá v tzv. robustních odhadech směrodatné odchylky, kdy odhady směrodatných odchylek parametrů jsou získány z variační matice vektoru parametrů. Gretl nám to jednoduše umožní tak, že v okně, kde specifukujeme model zatrhneme políčko Robustní směrodatné chyby [Robust standard errors] viz. obr Kliknutím na tlačítko nastavit [configure] lze vybrat jednu z odhadovacích technik. Všimněme si, že s využitím robustních odhadů získáme vyšší směrodatné odchylky parametrů, a tedy i širší intervaly spolehlivosti. Další z používaných metod a v Gretlu implementovaných je tzv. vážená

55 4.3 Autokorelace 45 metoda nejmenších čtverců. Tu je možné použít v případě, kdy jsme schopni odhadnout funkční závislost rozptylu na vysvětlujících proměných. Pro jednoduchost se můžeme omezit pouze na možnou existenci lineárního, či v případě určitého multiplikačního efektu exponenciálního tvaru. S využítím v předchozích kapitolách již zmíněných technik, dospějeme k tomuto nejlepšímu vyjádření (i když ne zrovna příliš přesvědčivému): σ 2 i = EDUC + ν i Kvadrát vektoru vah, který Gretl vyžaduje, je roven převrácené hodnotě výše odhadnutého rozptylu. Nejdříve si tedy uložíme hodnoty odhadnutých rozptylů tak, že myší najedeme na Uložit > Vyrovnané hodnoty [Save > Predicted values]. Převrácené hodnoty pak docílíme najetím na Přidat > Definovat novou proměnnou...[add > Define new variable...]. Do otevřeného okna pak zapíšeme vzorec, kterým bude nová proměnná získána - v našem případě tedy: prevh = 1/sighat. 3 Nyní se již můžeme bez potíží pustit ke stanovení modelu. Vybereme záložku Model > Další lineární modely > Vážené nejmenší čtverce... [Model > Other linear models > Weighted least squares...]. Otevře se nám podobné okno, jak je tomu u klasického modelu, jen s tím rozdílem, že zde je navíc políčko pro váhovou proměnou, do které přiáme zde značenou proměnnou prevh. 4 Pak stačí kliknout na OK. Otevře se již známé okno s výsledky (obr. 4.8), které mj. nabízí i srovnání určitých hodnot s klasickým modelem. 4.3 Autokorelace V lineárním regresním modelu předpokládáme, že jednotlivá pozorování nejsou mezi sebou korelována. Tento předpoklad může být porušen zejména v případě, že pracujeme s časovými řadami. Dochází pak k tomu, že složky nevysvětlené části modelu (jež je obsaženy ve vektoru reziduí) budou mezi sebou korelovány. Vliv autokorelace, podobně jako heteroskedasticity, způsobí, že odhady parametrů nebudou nejlepší (tj. s minimálním rozptylem), a že odhady směrodatných odchylek parametrů nebudou konzistentní. Ke zkoumání autokorelace využijeme příklad z kapitoly o jednoduchém lineárním regresním modelu, kde jsme odhadovali závislost spotřeby na produktu. Náš odhadnutý model dosáhl této konečné podoby: C t = , 93Y t + ɛ t. Aby Gretl mohl autokorelace testovat, je zapotřebí mít nastaveno, že pracujeme s časovými řadami. Toto nastavení můžeme zkontrolovat (bude-li třeba 3 Pojmenování samozřejmě může být různé, zde jsme novou proměnnou nazvali prevh a vyrovnané hodnoty rozptylu jsme uložili jako sighat. 4 V našem případě Gretl zahlásí chybu, že váhy obsahují záporné hodnoty. U 40 tého pozorování došlo k tomu, že odhadnutá hodnota rozptylu je záporná. Jelikož až na tuto skutečnost model vykazoval poměrně dobré vlastnosti, tak tento problém byl zde vyřešen hrubou silou, a to přepsáním hodnoty 40 té proměnné na hodnotu 0. Provede se to pravým kliknutím na proměnnou prevh a následným kliknutím na Upravit hodnoty.

56 46 Testování klasických předpokladů Obrázek 4.8: Výsledky odhadu metodou WLS s robustními sm. chybami.

57 4.3 Autokorelace 47 Obrázek 4.9: Nastavení časových řad. upravit) vybráním záložky Data > Struktura souboru dat... [Data > Data set structure]. V otevřeném okno zatrhneme Časové řady [Time series] a klikneme na Forward. V dalším okně vybereme délku mezi jednotlivými pozorováními (v našem případě se jedná o roční data) a opět odklikneme Forward. V dalším okně zadáme počateční pozorování (v tomto případě rok 1959). V posledním nabídnutém okně už jen odsouhlasíme délku našich pozorování. Uvedený postup je pro názornost ukázán na následujících obrázcích (obr. 4.9) Testování a řešení Jedním z velmi používaných testů je tzv. Durbin-Watsonova statistika, která slouží k detekci autokorelace prvního řádu (tedy, že jednotlivá rezidua můžeme simulovat AR(1) procesem). Durbin-Watsonova statistika nám vrátí hodnotu mezi 0 až 4, přičemž hodnota v okolí dvojky autokorelaci vyvrací. Nízké hodnoty ukazují na existenci pozitivní korelace mezi rezidui a naopak vysoké hodnoty poukazují na negativní korelaci. Dolní a horní limity k určení toho, zda případná hodnota značí existenci autokorelace, jsou pak sestrojovány v závislosti

58 48 Testování klasických předpokladů Obrázek 4.10: Výběr korelogramu reziduí. na počtu pozorování. V Gretlu se pří výše uvedeném nastavení hodnota Durbin- Watsonova testu zobrazí přímo v okně s modelem. V našem případě hodnota 0,514 jasně signalizuje existenci pozitivní autokorelace. Kdybychom chtěli znát připadně p-hodnotu testu (ve spornějších případech), pak je zapotřebí myší najet na Testy > Durbin-Watson p-value [Test > Durbin-Watson p-value]. Dalším z užitečných nástrojů k prošetření autokorelace je tzv. korelogram, který vykreslí vzájemné korelace mezi rezidui až do zvoleného řádu. V Gretlu ho získáme vybráním položky Grafy > Korelogram reziduí [Graphs > Correlogram]. Otevře se nám okno, kde je potřeba zadat délku zpoždení, do které chceme autokorelace zkoumat (zvolme např. 6). Poté se již zobrazí okno se spočtenými autokorelacemi (ACF), tak i parciálními autokorelacemi (PACF),jejichž hodnoty jsou v grafu vyznačeny červeně. Modrými linkami jsou pak vymezeny intervaly spolehlivosti, jejichž překročení signalizuje zamítnutí hypotézy o nulovosti příslušného koeficientu. V následujícím okně s tabulkou jsou již jen znázorněné hodnoty vyčísleny (navíc hodnoty Ljung-Box Q statistiky, o níž blíže pojednávat nebudeme). Uvedený postup je pro ilustraci znázorněn na obrázcích Hodnoty získané z korelogramu potvrzují výsledek Durbin-Watsonova testu, navíc signalizují i výskyt autokorelace druhého řádu. Kromě výše uvedených testových možností Gretl nabízí i další, které naleznete vybráním Testy > Autokorelace [Test > Autocorrelation].

59 4.3 Autokorelace 49 Obrázek 4.11: Nastavení maximálního zpoždění. Obrázek 4.12: Graf ACF a PACF.

60 50 Testování klasických předpokladů Obrázek 4.13: Tabulka korelogramu. Podobně jako v případě opravy heteroskedasticity existují pro případ časových řad tzv. HAC (heteroskedasticity autocorrelated consistent) robustní odhady směrodatných odchylek. Ty v Gretlu získáme stejným způsobem, jako v případě heteroskedasticity, tedy v okně se specifikací modelu je potřeba zatrhnout políčko Robustní směrodatné chyby [Robust standart errors] 5. 5 Tím, že máme v Gretlu nastaveno, že pracujeme s časovou řadou, tak je automaticko použito HAC odhadů namísto HC odhadů

Ilustrační příklad odhadu LRM v SW Gretl

Ilustrační příklad odhadu LRM v SW Gretl Ilustrační příklad odhadu LRM v SW Gretl Podkladové údaje Korelační matice Odhad lineárního regresního modelu (LRM) Verifikace modelu PEF ČZU Praha Určeno pro posluchače předmětu Ekonometrie Needitovaná

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie ZS 2015/16 Cvičení 7: Časově řady, autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Časové řady Data: HDP.wf1

Více

STATISTICA Téma 1. Práce s datovým souborem

STATISTICA Téma 1. Práce s datovým souborem STATISTICA Téma 1. Práce s datovým souborem 1) Otevření datového souboru Program Statistika.cz otevíráme z ikony Start, nabídka Programy, podnabídka Statistika Cz 6. Ze dvou nabídnutých možností vybereme

Více

Korelační a regresní analýza

Korelační a regresní analýza Korelační a regresní analýza Analýza závislosti v normálním rozdělení Pearsonův (výběrový) korelační koeficient: r = s XY s X s Y, kde s XY = 1 n (x n 1 i=0 i x )(y i y ), s X (s Y ) je výběrová směrodatná

Více

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11. UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace

Více

STATISTICA Téma 7. Testy na základě více než 2 výběrů

STATISTICA Téma 7. Testy na základě více než 2 výběrů STATISTICA Téma 7. Testy na základě více než 2 výběrů 1) Test na homoskedasticitu Nalezneme jej v několika submenu. Omezme se na submenu Základní statistiky a tabulky základního menu Statistika. V něm

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Obr. P1.1 Zadání úlohy v MS Excel

Obr. P1.1 Zadání úlohy v MS Excel Přílohy Příloha 1 Řešení úlohy lineárního programování v MS Excel V této příloze si ukážeme, jak lze řešit úlohy lineárního programování pomocí tabulkového procesoru MS Excel. Výpočet budeme demonstrovat

Více

Přílohy. Příloha 1. Obr. P1.1 Zadání úlohy v MS Excel

Přílohy. Příloha 1. Obr. P1.1 Zadání úlohy v MS Excel Přílohy Příloha 1 Řešení úlohy lineárního programování v MS Excel V této příloze si ukážeme, jak lze řešit úlohy lineárního programování pomocí tabulkového procesoru MS Excel 2007. Výpočet budeme demonstrovat

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy

EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy Ekonometrická analýza proces, skládající se z následujících fází: a) specifikace b) kvantifikace c) verifikace d) aplikace Postupné zpřesňování jednotlivých

Více

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1 Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu

Více

Simulace. Simulace dat. Parametry

Simulace. Simulace dat. Parametry Simulace Simulace dat Menu: QCExpert Simulace Simulace dat Tento modul je určen pro generování pseudonáhodných dat s danými statistickými vlastnostmi. Nabízí čtyři typy rozdělení: normální, logaritmicko-normální,

Více

Výsledný graf ukazuje následující obrázek.

Výsledný graf ukazuje následující obrázek. Úvod do problematiky GRAFY - SPOJNICOVÝ GRAF A XY A. Spojnicový graf Spojnicový graf používáme především v případě, kdy chceme graficky znázornit trend některé veličiny ve zvoleném časovém intervalu. V

Více

LINEÁRNÍ REGRESE. Lineární regresní model

LINEÁRNÍ REGRESE. Lineární regresní model LINEÁRNÍ REGRESE Chemometrie I, David MILDE Lineární regresní model 1 Typy závislosti 2 proměnných FUNKČNÍ VZTAH: 2 závisle proměnné: určité hodnotě x odpovídá jediná hodnota y. KORELACE: 2 náhodné (nezávislé)

Více

Začínáme pracovat s tabulkovým procesorem MS Excel

Začínáme pracovat s tabulkovým procesorem MS Excel Začínáme pracovat s tabulkovým procesorem MS Excel Nejtypičtějším představitelem tabulkových procesorů je MS Excel. Je to pokročilý nástroj pro tvorbu jednoduchých i složitých výpočtů a grafů. Program

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie LS 2014/15 Cvičení 4: Statistické vlastnosti MNČ LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE Upřesnění k pojmům a značení

Více

z dat nasbíraných v letech 1959 1994. Ke zpracování dat byl použit statistický software R. Základní model poptávkové funkce, ze kterého vycházíme,

z dat nasbíraných v letech 1959 1994. Ke zpracování dat byl použit statistický software R. Základní model poptávkové funkce, ze kterého vycházíme, Úloha 1: V naší studii se zabýváme poptávkovou funkcí životního pojištění, vycházíme z dat nasbíraných v letech 1959 1994. Ke zpracování dat byl použit statistický software R. Základní model poptávkové

Více

Nový způsob práce s průběžnou klasifikací lze nastavit pouze tehdy, je-li průběžná klasifikace v evidenčním pololetí a školním roce prázdná.

Nový způsob práce s průběžnou klasifikací lze nastavit pouze tehdy, je-li průběžná klasifikace v evidenčním pololetí a školním roce prázdná. Průběžná klasifikace Nová verze modulu Klasifikace žáků přináší novinky především v práci s průběžnou klasifikací. Pro zadání průběžné klasifikace ve třídě doposud existovaly 3 funkce Průběžná klasifikace,

Více

Neuronové časové řady (ANN-TS)

Neuronové časové řady (ANN-TS) Neuronové časové řady (ANN-TS) Menu: QCExpert Prediktivní metody Neuronové časové řady Tento modul (Artificial Neural Network Time Series ANN-TS) využívá modelovacího potenciálu neuronové sítě k predikci

Více

MS SQL Server 2008 Management Studio Tutoriál

MS SQL Server 2008 Management Studio Tutoriál MS SQL Server 2008 Management Studio Tutoriál Vytvoření databáze Při otevření management studia a připojením se ke konkrétnímu sql serveru mám v levé části panel s názvem Object Explorer. V tomto panelu

Více

2 PŘÍKLAD IMPORTU ZATÍŽENÍ Z XML

2 PŘÍKLAD IMPORTU ZATÍŽENÍ Z XML ROZHRANÍ ESA XML Ing. Richard Vondráček SCIA CZ, s. r. o., Thákurova 3, 160 00 Praha 6 www.scia.cz 1 OTEVŘENÝ FORMÁT Jednou z mnoha užitečných vlastností programu ESA PT je podpora otevřeného rozhraní

Více

Formátování pomocí stylů

Formátování pomocí stylů Styly a šablony Styly, šablony a témata Formátování dokumentu pomocí standardních nástrojů (přímé formátování) (Podokno úloh Zobrazit formátování): textu jsou přiřazeny parametry (font, velikost, barva,

Více

Ilustrační příklad odhadu SM v SW Gretl

Ilustrační příklad odhadu SM v SW Gretl Ilustrační příklad odhadu SM v SW Gretl Odhad simultánního modelu (SM) Verifikace modelu PEF ČZU Praha Určeno pro posluchače předmětu Ekonometrie Needitovaná studijní pomůcka MM2011 Úvodní obrazovka Gretlu

Více

Vytvoření tiskové sestavy kalibrace

Vytvoření tiskové sestavy kalibrace Tento návod popisuje jak v prostředí WinQbase vytvoříme novou tiskovou sestavu, kterou bude možno použít pro tisk kalibračních protokolů. 1. Vytvoření nového typu sestavy. V prvním kroku vytvoříme nový

Více

SOLVER UŽIVATELSKÁ PŘÍRUČKA. Kamil Šamaj, František Vižďa Univerzita obrany, Brno, 2008 Výzkumný záměr MO0 FVT0000404

SOLVER UŽIVATELSKÁ PŘÍRUČKA. Kamil Šamaj, František Vižďa Univerzita obrany, Brno, 2008 Výzkumný záměr MO0 FVT0000404 SOLVER UŽIVATELSKÁ PŘÍRUČKA Kamil Šamaj, František Vižďa Univerzita obrany, Brno, 2008 Výzkumný záměr MO0 FVT0000404 1. Solver Program Solver slouží pro vyhodnocení experimentálně naměřených dat. Základem

Více

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi. SEMINÁRNÍ PRÁCE Zadání: Data: Statistické metody: Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi. Minimálně 6 proměnných o 30 pozorováních (z toho 2 proměnné

Více

Microsoft Word - Styly, obsah a další

Microsoft Word - Styly, obsah a další Microsoft Word - Styly, obsah a další Definice uživatelských stylů Nový - tzv. uživatelský styl - se vytváří pomocí panelu Styly a formátování stiskem tlačítka Nový styl. Po stisknutí tlačítka se objeví

Více

Ovládání Open Office.org Calc Ukládání dokumentu : Levým tlačítkem myši kliknete v menu na Soubor a pak na Uložit jako.

Ovládání Open Office.org Calc Ukládání dokumentu : Levým tlačítkem myši kliknete v menu na Soubor a pak na Uložit jako. Ukládání dokumentu : Levým tlačítkem myši kliknete v menu na Soubor a pak na Uložit jako. Otevře se tabulka, v které si najdete místo adresář, pomocí malé šedočerné šipky (jako na obrázku), do kterého

Více

Stručný manuál k ovládání programu STATISTICA. Mgr. Petra Beranová

Stručný manuál k ovládání programu STATISTICA. Mgr. Petra Beranová Stručný manuál k ovládání programu STATISTICA Mgr. Petra Beranová Copyright StatSoft CR s.r.o. 2008, 1. vydání 2008 StatSoft CR Podbabská 16 CZ-160 00 Praha 6 tel.: +420 233 325 006 fax: +420 233 324 005

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com) Závislost náhodných veličin Úvod Předchozí přednášky: - statistické charakteristiky jednoho výběrového nebo základního souboru - vztahy mezi výběrovým a základním souborem - vztahy statistických charakteristik

Více

Návod k aplikaci DPH Kontrol

Návod k aplikaci DPH Kontrol Návod k aplikaci DPH Kontrol Obsah I. O aplikaci... 2 II. Jak používat DPH Kontrol... 3 1. Kontrola spolehlivosti plátců DPH... 3 2. Kontrola zveřejněných účtů... 5 III. Další práce s databází záznamů...

Více

Postup: Nejprve musíme vyplnit tabulku. Pak bude vypadat takto:

Postup: Nejprve musíme vyplnit tabulku. Pak bude vypadat takto: Úkol: Jednoduchá tabulka v Excelu Obrázky jsou vytvořené v Excelu verze 2003 CZ. Postupy jsou platné pro všechny běžně dostupné české verze Excelu s výjimkou verze roku 2007. Postup: Nejprve musíme vyplnit

Více

Vzorce. StatSoft. Vzorce. Kde všude se dá zadat vzorec

Vzorce. StatSoft. Vzorce. Kde všude se dá zadat vzorec StatSoft Vzorce Jistě se Vám již stalo, že data, která máte přímo k dispozici, sama o sobě nestačí potřebujete je nějak upravit, vypočítat z nich nějaké další proměnné, provést nějaké transformace, Jinak

Více

Styly odstavců. Word 2010. Přiřazení stylu odstavce odstavci. Změna stylu odstavce

Styly odstavců. Word 2010. Přiřazení stylu odstavce odstavci. Změna stylu odstavce Styly odstavců V textu, který přesahuje několik stránek a je nějakým způsobem strukturovaný (což znamená, že se dá rozdělit na části (v knize jim říkáme kapitoly) a jejich podřízené části (podkapitoly),

Více

Tvar dat a nástroj přeskupování

Tvar dat a nástroj přeskupování StatSoft Tvar dat a nástroj přeskupování Chtěli jste někdy použít data v jistém tvaru a STATISTICA Vám to nedovolila? Jistě se najde někdo, kdo se v této situaci již ocitl. Není ale potřeba propadat panice,

Více

Porovnání dvou výběrů

Porovnání dvou výběrů Porovnání dvou výběrů Menu: QCExpert Porovnání dvou výběrů Tento modul je určen pro podrobnou analýzu dvou datových souborů (výběrů). Modul poskytuje dva postupy analýzy: porovnání dvou nezávislých výběrů

Více

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení 2 Zpracování naměřených dat Důležitou součástí každé experimentální práce je statistické zpracování naměřených dat. V této krátké kapitole se budeme věnovat určení intervalů spolehlivosti získaných výsledků

Více

StatSoft Jak vyzrát na datum

StatSoft Jak vyzrát na datum StatSoft Jak vyzrát na datum Tento článek se věnuje podrobně možnostem práce s proměnnými, které jsou ve formě datumu. A že jich není málo. Pokud potřebujete pracovat s datumem, pak se Vám bude tento článek

Více

Manuál k programu KaraokeEditor

Manuál k programu KaraokeEditor Manuál k programu KaraokeEditor Co je KaraokeEditor? Program slouží pro editaci tagů v hudebních souborech formátu mp3. Tagy jsou doprovodné informace o písni, uložené přímo v mp3. Aplikace umí pracovat

Více

10. Předpovídání - aplikace regresní úlohy

10. Předpovídání - aplikace regresní úlohy 10. Předpovídání - aplikace regresní úlohy Regresní úloha (analýza) je označení pro statistickou metodu, pomocí nichž odhadujeme hodnotu náhodné veličiny (tzv. závislé proměnné, cílové proměnné, regresandu

Více

Protokol č. 1. Tloušťková struktura. Zadání:

Protokol č. 1. Tloušťková struktura. Zadání: Protokol č. 1 Tloušťková struktura Zadání: Pro zadané výčetní tloušťky (v cm) vypočítejte statistické charakteristiky a slovně interpretujte základní statistické vlastnosti tohoto souboru tloušťek. Dále

Více

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr StatSoft Intervalový odhad Dnes se budeme zabývat neodmyslitelnou součástí statistiky a to intervaly v nejrůznějších podobách. Toto téma je také úzce spojeno s tématem testování hypotéz, a tedy plynule

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie ZS 2014/15 Cvičení 5: Vícenásobná regrese, multikolinearita LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Jednoduchá

Více

Tiskové sestavy. Zdroj záznamu pro tiskovou sestavu. Průvodce sestavou. Použití databází

Tiskové sestavy. Zdroj záznamu pro tiskovou sestavu. Průvodce sestavou. Použití databází Tiskové sestavy Tiskové sestavy se v aplikaci Access používají na finální tisk informací z databáze. Tisknout se dají všechny objekty, které jsme si vytvořili, ale tiskové sestavy slouží k tisku záznamů

Více

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009

Více

Statistické metody v marketingu. Ing. Michael Rost, Ph.D.

Statistické metody v marketingu. Ing. Michael Rost, Ph.D. Statistické metody v marketingu Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Regresní analýza doplnění základů Vzhledem k požadavku Vašich kolegů zařazuji doplňující partii o regresní

Více

StatSoft Jak poznat vliv faktorů vizuálně

StatSoft Jak poznat vliv faktorů vizuálně StatSoft Jak poznat vliv faktorů vizuálně V tomto článku bychom se rádi věnovali otázce, jak poznat již z grafického náhledu vztahy a závislosti v analýze rozptylu. Pomocí následujících grafických zobrazení

Více

4ST201 STATISTIKA CVIČENÍ Č. 10

4ST201 STATISTIKA CVIČENÍ Č. 10 4ST201 STATISTIKA CVIČENÍ Č. 10 regresní analýza - vícenásobná lineární regrese korelační analýza Př. 10.1 Máte zadaný výstup regresní analýzy závislosti závisle proměnné Y na nezávisle proměnné X. Doplňte

Více

Tabulkový procesor. Orientace textu. O úroveň níž O úroveň výš

Tabulkový procesor. Orientace textu. O úroveň níž O úroveň výš Formátování Formátováním rozumíme změnu vlastností daného objektu, dle našich představ a možností programu MS Excel. Formátovat můžeme texty v buňkách, můžeme formátovat buňky, listy i celý sešit a měnit

Více

Internetový přístup do databáze FADN CZ - uživatelská příručka Modul FADN BASIC

Internetový přístup do databáze FADN CZ - uživatelská příručka Modul FADN BASIC Internetový přístup do databáze FADN CZ - uživatelská příručka Modul FADN BASIC Modul FADN BASIC je určen pro odbornou zemědělskou veřejnost bez větších zkušeností s internetovými aplikacemi a bez hlubších

Více

Regresní a korelační analýza

Regresní a korelační analýza Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Regresní analýza Cíl regresní analýzy: stanovení formy (trendu, tvaru, průběhu)

Více

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13 Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test

Více

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času Testování hypotéz 1 Jednovýběrové testy 90/ odhad času V podmínkách naprostého odloučení má voák prokázat schopnost orientace v čase. Úkolem voáka e provést odhad časového intervalu 1 hodiny bez hodinek

Více

Přehledy pro Tabulky Hlavním smyslem této nové agendy je jednoduché řazení, filtrování a seskupování dle libovolných sloupců.

Přehledy pro Tabulky Hlavním smyslem této nové agendy je jednoduché řazení, filtrování a seskupování dle libovolných sloupců. Přehledy pro Tabulky V programu CONTACT Professional 5 naleznete u firem, osob a obchodních případů záložku Tabulka. Tuto záložku lze rozmnožit, přejmenovat a sloupce je možné definovat dle vlastních požadavků

Více

Pro definici pracovní doby nejdříve zvolíme, zda chceme použít pouze informační

Pro definici pracovní doby nejdříve zvolíme, zda chceme použít pouze informační 1. 1 V programu Medicus Komfort a Medicus Profesionál je možné objednávat pacienty v nově přepracovaném objednávacím kalendáři. Volba Objednávky zpřístupňuje možnosti objednávání pacientů, nastavení pracovní

Více

Zdokonalování gramotnosti v oblasti ICT. Kurz MS Excel kurz 6. Inovace a modernizace studijních oborů FSpS (IMPACT) CZ.1.07/2.2.00/28.

Zdokonalování gramotnosti v oblasti ICT. Kurz MS Excel kurz 6. Inovace a modernizace studijních oborů FSpS (IMPACT) CZ.1.07/2.2.00/28. Zdokonalování gramotnosti v oblasti ICT Kurz MS Excel kurz 6 1 Obsah Kontingenční tabulky... 3 Zdroj dat... 3 Příprava dat... 3 Vytvoření kontingenční tabulky... 3 Možnosti v poli Hodnoty... 7 Aktualizace

Více

IMPORT DAT DO DATABÁZE

IMPORT DAT DO DATABÁZE Úvod do problematiky IMPORT DAT DO DATABÁZE Databázové tabulky lze naplňovat i již dříve pořízenými údaji. Můžeme tak snadno načíst do databáze data pořízená v textovém editoru WORD nebo v tabulkovém procesoru

Více

Pokud data zadáme přes "Commands" okno: SDF1$X1<-c(1:15) //vytvoření řady čísel od 1 do 15 SDF1$Y1<-c(1.5,3,4.5,5,6,8,9,11,13,14,15,16,18.

Pokud data zadáme přes Commands okno: SDF1$X1<-c(1:15) //vytvoření řady čísel od 1 do 15 SDF1$Y1<-c(1.5,3,4.5,5,6,8,9,11,13,14,15,16,18. Regresní analýza; transformace dat Pro řešení vztahů mezi proměnnými kontinuálního typu používáme korelační a regresní analýzy. Korelace se používá pokud nelze určit "kauzalitu". Regresní analýza je určena

Více

Typy souborů ve STATISTICA. Tento článek poslouží jako přehled hlavních typů souborů v programu

Typy souborů ve STATISTICA. Tento článek poslouží jako přehled hlavních typů souborů v programu StatSoft Typy souborů ve STATISTICA Tento článek poslouží jako přehled hlavních typů souborů v programu STATISTICA, ukáže Vám jejich možnosti a tím Vám dovolí využívat program efektivněji. Jistě jste již

Více

KAPITOLA 4 ZPRACOVÁNÍ TEXTU

KAPITOLA 4 ZPRACOVÁNÍ TEXTU KAPITOLA 4 ZPRACOVÁNÍ TEXTU TABULÁTORY Jsou to značky (zarážky), ke kterým se zarovná text. Můžeme je nastavit kliknutím na pravítku nebo v dialogovém okně, které vyvoláme kliknutím na tlačítko Tabulátory

Více

31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě

31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě 31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě Motto Statistika nuda je, má však cenné údaje. strana 3 Statistické charakteristiky Charakteristiky polohy jsou kolem ní seskupeny ostatní hodnoty

Více

Měření závislosti statistických dat

Měření závislosti statistických dat 5.1 Měření závislosti statistických dat Každý pořádný astronom je schopen vám předpovědět, kde se bude nacházet daná hvězda půl hodiny před půlnocí. Ne každý je však téhož schopen předpovědět v případě

Více

Internetový přístup do databáze FADN CZ - uživatelská příručka Modul FADN RESEARCH / DATA

Internetový přístup do databáze FADN CZ - uživatelská příručka Modul FADN RESEARCH / DATA Internetový přístup do databáze FADN CZ - uživatelská příručka Modul FADN RESEARCH / DATA Modul FADN RESEARCH je určen pro odborníky z oblasti zemědělské ekonomiky. Modul neomezuje uživatele pouze na předpřipravené

Více

Návod pro práci s aplikací

Návod pro práci s aplikací Návod pro práci s aplikací NASTAVENÍ FAKTURACÍ...1 NASTAVENÍ FAKTURAČNÍCH ÚDA JŮ...1 Texty - doklady...1 Fakturační řady Ostatní volby...1 Logo Razítko dokladu...2 NASTAVENÍ DALŠÍCH ÚDA JŮ (SEZNAMŮ HODNOT)...2

Více

Svolávací systém Uživatelský manuál

Svolávací systém Uživatelský manuál Uživatelský manuál TTC TELEKOMUNIKACE, s.r.o. Třebohostická 987/5 100 00 Praha 10 tel.: 234 052 111 fax.: 234 052 999 e-mail: ttc@ttc.cz http://www.ttc-telekomunikace.cz Datum vydání: 14. srpna 2013 Číslo

Více

Úloha 1. Napište matici pro případ lineárního regresního spline vyjádřeného přes useknuté

Úloha 1. Napište matici pro případ lineárního regresního spline vyjádřeného přes useknuté Úloha 1. Napište matici pro případ lineárního regresního spline vyjádřeného přes useknuté polynomy pro případ dvou uzlových bodů ξ 1 = 1 a ξ 2 = 4. Experimentální body jsou x = [0.2 0.4 0.6 1.5 2.0 3.0

Více

Úvodem Dříve les než stromy 3 Operace s maticemi

Úvodem Dříve les než stromy 3 Operace s maticemi Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová

Více

Popisná statistika kvantitativní veličiny

Popisná statistika kvantitativní veličiny StatSoft Popisná statistika kvantitativní veličiny Protože nám surová data obvykle žádnou smysluplnou informaci neposkytnou, je žádoucí vyjádřit tyto ve zhuštěnější formě. V předchozím dílu jsme začali

Více

TECHNIKA UMĚLÝCH PROMĚNNÝCH V PRŮŘEZOVÉ ANALÝZE A V MODELECH ČASOVÝCH ŘAD

TECHNIKA UMĚLÝCH PROMĚNNÝCH V PRŮŘEZOVÉ ANALÝZE A V MODELECH ČASOVÝCH ŘAD TECHNIKA UMĚLÝCH PROMĚNNÝCH V PRŮŘEZOVÉ ANALÝZE A V MODELECH ČASOVÝCH ŘAD Umělé (dummy) proměnné se používají, pokud chceme do modelu zahrnout proměnné, které mají kvalitativní či diskrétní charakter,

Více

Postupy práce se šablonami IS MPP

Postupy práce se šablonami IS MPP Postupy práce se šablonami IS MPP Modul plánování a přezkoumávání, verze 1.20 vypracovala společnost ASD Software, s.r.o. dokument ze dne 27. 3. 2013, verze 1.01 Postupy práce se šablonami IS MPP Modul

Více

THEOPHILOS. (návod k použití)

THEOPHILOS. (návod k použití) THEOPHILOS (návod k použití) Nejprve si z internetových stránek www.theophilos.com (nebo www.theophilos.sk) stáhněte všechny soubory, které Vás zajímají a nainstalujte je (podrobný návod na instalaci programu

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie ZS 2014/15 Cvičení 6: Dummy proměnné, úvod do časových řad LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Multikolinearita

Více

Kapitola 11: Formuláře 151

Kapitola 11: Formuláře 151 Kapitola 11: Formuláře 151 Formulář DEM-11-01 11. Formuláře Formuláře jsou speciálním typem dokumentu Wordu, který umožňuje zadávat ve Wordu data, která lze snadno načíst například do databázového systému

Více

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků Příklad: Test nezávislosti kategoriálních znaků Určete na hladině významnosti 5 % na základě dat zjištěných v rámci dotazníkového šetření ve Šluknově, zda existuje závislost mezi pohlavím respondenta a

Více

Webová aplikace Znalostní testy online UŽIVATELSKÁ PŘÍRUČKA

Webová aplikace Znalostní testy online UŽIVATELSKÁ PŘÍRUČKA Webová aplikace Znalostní testy online UŽIVATELSKÁ PŘÍRUČKA 2005 Lukáš Trombik OBSAH ÚVOD... 1 SPUŠTĚNÍ... 1 POPIS OVLÁDÁNÍ INFORMAČNÍHO SYSTÉMU... 1 POPIS KLIENTSKÉ ČÁSTI... 1 POPIS ADMINISTRÁTORSKÉ ČÁSTI...

Více

MS Word 2007 Šablony programu MS Word

MS Word 2007 Šablony programu MS Word MS Word 2007 Šablony programu MS Word Obsah kapitoly V této kapitole se seznámíme s: Možností využití šablon při vytváření nových dokumentů Vytvářením vlastních šablon Studijní cíle Po absolvování této

Více

PŘÍRUČKA PRÁCE SE SYSTÉMEM SLMS CLASS pro učitele

PŘÍRUČKA PRÁCE SE SYSTÉMEM SLMS CLASS pro učitele PŘÍRUČKA PRÁCE SE SYSTÉMEM SLMS CLASS pro učitele Vypracoval : Pavel Žemba Obsah Tvorba vlastních testů... 3 Postup tvorby... 3 Test otázky odpovědi... 3 Zadání otázek testu... 5 Test - cvičení na souboru,

Více

Stav Svobodný Rozvedený Vdovec. Svobodná 37 10 6. Rozvedená 8 12 8. Vdova 5 8 6

Stav Svobodný Rozvedený Vdovec. Svobodná 37 10 6. Rozvedená 8 12 8. Vdova 5 8 6 1. Příklad Byly sledovány rodinné stavy nevěst a ženichů při uzavírání sňatků a byla vytvořena následující tabulka četností. Stav Svobodný Rozvedený Vdovec Svobodná 37 10 6 Rozvedená 8 12 8 Vdova 5 8 6

Více

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540

Více

MS OFFICE POWER POINT 2010

MS OFFICE POWER POINT 2010 MS OFFICE POWER POINT 2010 Program Power Point patří do rodiny programů Microsoft Office a slouží ke tvorbě prezentací. Prezentace je tvořena snímky, které jsou postupně zobrazovány a to buď po nějaké

Více

GOODWILL vyššší odborná škola, s. r. o. P. Holého 400, Frýdek-Místek

GOODWILL vyššší odborná škola, s. r. o. P. Holého 400, Frýdek-Místek GOODWILL vyššší odborná škola, s. r. o. P. Holého 400, Frýdek-Místek Projekt Využití ICT ve výuce na gymnáziích, registrační číslo projektu CZ.1.07/1.1.07/02.0030 MS Word Metodický materiál pro základní

Více

Gabriela Janská. Středočeský vzdělávací institut akademie J. A. Komenského www.sviajak.cz

Gabriela Janská. Středočeský vzdělávací institut akademie J. A. Komenského www.sviajak.cz PŘÍRUČKA KE KURZU: ZÁKLADY PRÁCE NA PC MS WORD 2003 Gabriela Janská Středočeský vzdělávací institut akademie J. A. Komenského www.sviajak.cz Obsah: 1. Písmo, velikost písma, tučně, kurzíva, podtrhnout

Více

43 HTML šablony. Záložka Šablony v systému

43 HTML šablony. Záložka Šablony v systému 43 HTML šablony Modul HTML šablony slouží ke správě šablon pro výstupy z informačního systému modularis ve formátu HTML. Modul umožňuje k šablonám doplňovat patičku, dokumentaci a vázat šablony na konkrétní

Více

Hodina 50 Strana 1/14. Gymnázium Budějovická. Hodnocení akcií

Hodina 50 Strana 1/14. Gymnázium Budějovická. Hodnocení akcií Hodina 50 Strana /4 Gymnázium Budějovická Volitelný předmět Ekonomie - jednoletý BLOK ČÍSLO 8 Hodnocení akcií Předpokládaný počet : 9 hodin Použitá literatura : František Egermayer, Jan Kožíšek Statistická

Více

Úvod do problematiky ÚPRAVY TABULKY

Úvod do problematiky ÚPRAVY TABULKY Úvod do problematiky ÚPRAVY TABULKY Zaměříme se na úpravy, které určují finální grafickou úpravu tabulky (tzv. formátování.). Měnit můžeme celou řadu vlastností a ty nejdůležitější jsou popsány v dalším

Více

Základní popis Toolboxu MPSV nástroje

Základní popis Toolboxu MPSV nástroje Základní popis Toolboxu MPSV nástroje Nástroj XLS2DBF ze sady MPSV nástroje slouží pro zkonvertování souboru ve formátu XLS do formátu DBF. Nástroj umožňuje konvertovat buď vybraný list nebo listy ze sešitu

Více

Nápověda k systému CCS Carnet Mini

Nápověda k systému CCS Carnet Mini Nápověda k systému CCS Carnet Mini Manuál k aplikaci pro evidenci knihy jízd Vážený zákazníku, vítejte v našem nejnovějším systému pro evidenci knihy jízd - CCS Carnet Mini. V následujících kapitolách

Více

MONITORING OBCHODNÍCH PARTNERŮ

MONITORING OBCHODNÍCH PARTNERŮ MONITORING OBCHODNÍCH PARTNERŮ NÁVOD PRO APLIKACI 1 Obsah: 1. Prvotní spuštění aplikace Část monitoring insolvenčního rejstříku 2. Hlavní okno 3. Monitorované subjekty 3.1 Skupiny monitorovaných subjektů

Více

Export tabulky výsledků

Export tabulky výsledků StatSoft Export tabulky výsledků Jelikož prezentace výsledků je důležitou součástí naší každodenní práce, ukážeme si tentokrát, jak exportovat tabulky výsledků nejen do MS Wordu. Také se může hodit vědět,

Více

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně

Více

Windows Live Movie Maker

Windows Live Movie Maker Windows Live Movie Maker Tento program slouží k vytváření vlastních filmů, která se mohou skládat z fotografií, videí, titulků a zvuku. Movie Maker je součástí instalace operačního systému Windows 7 a

Více

Omezení funkcionalit v softwaru STATISTICA

Omezení funkcionalit v softwaru STATISTICA StatSoft Omezení funkcionalit v softwaru STATISTICA Věděli jste, že v softwaru STATISTICA si lze omezit jednotlivé nabídky? Pojďme se nyní podívat na pokročilejší úpravy softwaru, které mohou být v určitých

Více

Kontingenční tabulky, korelační koeficienty

Kontingenční tabulky, korelační koeficienty Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Mějme kategoriální proměnné X a Y. Vytvoříme tzv. kontingenční tabulku. Budeme tedy testovat hypotézu

Více

Spuštění a ukončení databázové aplikace Access

Spuštění a ukončení databázové aplikace Access Spuštění a ukončení databázové aplikace Access Aplikaci Access spustíte tak, že vyhledáte její ikonu v nabídce "Start" a klepnete na ní. Najdete ho v Sekci Všechny programy/mircosoft Office. Po výběru

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 10. Mgr. David Fiedor 27. dubna 2015 Nelineární závislost - korelační poměr užití v případě, kdy regresní čára není přímka, ale je vyjádřena složitější matematickou funkcí

Více

Dotazníky v Teamiu. Nastavení dotazníků. Vytvoření dotazníku

Dotazníky v Teamiu. Nastavení dotazníků. Vytvoření dotazníku Dotazníky v Teamiu Pomocí dotazníků si můžete vytvářet své vlastní odpovědní formuláře, které následně můžete přiložit k vybraným pozicím. Pokud uchazeč bude na danou pozici chtít reagovat, musí dotazník

Více