HOSPODÁŘSKÁ A SOCIÁLNÍ STATISTIKA

Rozměr: px
Začít zobrazení ze stránky:

Download "HOSPODÁŘSKÁ A SOCIÁLNÍ STATISTIKA"

Transkript

1 HOSPODÁŘSKÁ A SOCIÁLNÍ STATISTIKA 1. REGRESNÍ A KORELAČNÍ ANALÝZA Popisuje průběh a těsnost závislosti kvantitativních znaků, zjišťuje příčinnou souvislost mezi nimi Řadí se mezi vícerozměrné statistické metody Závislost:Jednostranné-y = závisle proměnná (vždy jen jedna) x = nezávisle proměnná (1 a více) Oboustranné - původní závisle proměnná se promění v nezávislou a naopak Závislost příčinná (kauzální) jeden jev (příčina) vyvolává existenci (vznik, změnu, zánik apod.) jevu druhého (důsledek). Závislost pevná výskytu jednoho jevu nutně odpovídá výskyt druhé jevu (a naopak). Průběh závislosti (v určitém intervalu) lze přesně charakterizovat určitou matematickou funkcí. Volná závislost jeden jev podmiňuje jev jiný jen s určitou pravděpodobností a v různé intenzitě. U této závislosti lze charakterizovat teoretický průběh závislosti a její těsnost. Závislost statistická volná závislost týkající se kvantitativních statistických znaků. K matematickému popisu statistických závislostí, jakož i k ověření deduktivně odvozených teorií, slouží metody regresní a korelační analýzy. Druhy statistických závislostí podle počtu kvantitativních znaků: * závislost jednoduchá dva znaky, * závislost vícenásobná více než dva znaky, podle typu regresní funkce: * lineární závislost, * nelineární závislost, podle směru změn kvantitativních znaků: * závislost pozitivní (kladná, přímá), * závislost negativní (záporná, nepřímá). 1) Vystihnout průběh závislosti tzv. tendenci změn, abychom mohli provádět odhady závisle proměnné = vlastní regresní analýza 2)Změřit sílu neboli intenzitu závislosti-abychom mohli říci, jak je závislost silná a zároveň abychom mohli posoudit přesnost regresních odhadů z předcházejícího bodu = korelační analýza REGRESE - vyjadřuje průběh závislosti mezi kvantitativními znaky pomocí matematického modelu. (regresní fce) REGRESNÍ KOEFICIENT (b)-udává, jak se změní závislá proměnná, pokud se nezávislá proměnná změní o jednotku KORELACE - vyjadřuje sílu závislosti. Měří těsnost (sílu, intenzitu, míru) statistické závislosti mezi kvantitativními znaky. Měří se korelačním koeficientem KORELAČNÍ KOEFICIENT (r) udává sílu závislosti, čím víc se blíží extrémům, tím je silnější závislost rϵ 1;1 Přímá r ϵ (0;1 Nepřímá r ϵ -1;0) Hodnoty korelačního koeficientu: - pod 0,3 = velmi slabá závislost - nad 0,8 = velmi silná závislost PARCIÁLNÍ KOEFICIENT REGRESE Udává změnu závisle proměnné (Y) při jednotkové změně j-té proměnné (Xj), za předpokladu že ostatní nezávisle proměnné jsou konstantní. Vyjadřuje pouze část vlivu působících na proměnnou Y, proto se k jejich názvu připojuje Parciální.

2 KOEFICIENT ÚPLNÉ KORELACE Těsnost závislosti závisle proměnné na všech nezávislých proměnných najednou. FISCHEROVA Z- TRANSFORMACE Metoda, kdy převádíme hodnoty r na hodnoty z, hodnoty z se blíží normálnímu rozdělení. Pro Interval spolehlivosti dílčího korelačního koeficientu. JEDNODUCHÁ NELINEÁRNÍ REGRESE A KORELACE Regresní fce dle nezávisle proměnných Jednoduchá = vztah 1 nezávisle proměnné, která působí na 1 závisle proměnnou (x y) vícenásobná = vztah více než 1 nezávisle proměnné, která působí na 1 závisle proměnnou (x1,x2,x3, xk y) o lineární (regresní přímka) o nelineární (aditivní a multiplikativní fce) KOLIK PROMĚNNÝCH? 2 KOLIK NEZÁVISLE PROMĚNNÝCH? 1 x, neboli faktor, vysvětlující proměnná KOLIK ZÁVISLE PROMĚNNÝCH? y, vždy jen jedna, nemůže vstoupit víc Základní úkoly regresní analýzy: získání statistických odhadů neznámých parametrů regresní funkce na základě výběru, testování hypotéz o těchto parametrech, ověřování předpokladů regresního modelu. Určování parametrů regresní funkce (str. 108) Regrese = průběh závislosti mezi oběma proměnnými, je popsán jednoduchými nelineárními regresními fcemi: - pouze 2 proměnné - nezávislá x, závislá y Při vyjádření nelineární regrese se nejčastěji používají následující typy funkcí (křivek): Aditivní typ funkcí (ad=přidat, přičíst, tam kde je + - ) Kvadratická (parabola 2. stupně) Hyperbolická = hyperbola Logaritmická, odmocninná, atd. Multiplikativní typ funkcí (zde je násobení) Exponenciální Mocninná CÍLEM je dle hodnot určit příslušné parametry METODOU NEJMENŠÍCH ČTVERCŮ získáme SOUSTAVU NORMÁLNÍCH ROVNIC, TO LZE POUZE U ADITIVNÍCH MODELŮ. PROTO SE MULTIPLIKATIVNÍ MUSÍ PŘEVÉST POMOCÍ LOGARITMNICKÉ TRANSFORMACE Př. y = a. (zlogaritmováno) log yi = loga + xi. logb (substituce) Y = A + Bx (podoba rovnice, přímky) Metoda nejmenších čtverců (str. 109) Požadujeme, aby součet odchylek jednotlivých napozorovaných hodnot závisle proměnné od regresní funkce (teoretických hodnot) byl minimální: = =min Po úpravách lze následně získat tzv. soustavu normálních rovnic, jejímž vyřešením se určí parametry výběrové regresní funkce. 2

3 Korelační analýza (str. 116) měří míru závislosti Korelace je míra, která označuje stupeň závislosti mezi proměnnými. Uvádí se, že dvě proměnné jsou korelované, jestliže určité hodnoty jedné proměnné mají tendenci se vyskytovat společně s určitými hodnotami druhé proměnné. Míra této tendence může sahat od neexistence korelace až po absolutní korelaci. V případě lineární závislosti používáme k vyjádření síly závislosti koeficient korelace, který se značí r (str. 116). Koeficient korelace se pohybuje v intervalu < 1;+1>. Jestliže je koeficient korelace roven ±1, existuje mezi proměnnými lineární funkční závislost. Je-li r = 0, jedná se o lineární nezávislost proměnných. Těsnost závislosti lze hodnotit zhruba takto: + r přímá závislost. - r nepřímá závislost r 2 koef.determinace Jednoduchá nelineární závislost - síla mezi 2 znaky, měří se pomocí Indexu korelace a indexu determinace INDEX KORELACE nutné poznat, co je na čem závislé, je v intervalu (0;1), nemůže být záporný 0 < r 0,3 závislost slabá 0,3 < r 0,8 závislost mírná (střední) 0,8 < r 1 závislost silná = 1 ȳ =! INDEX DETERMINACE = z kolika % jsou změny závisle proměnné vysvětlitelné změnami nezávisle proměnné, " (0;1) To co chybí do 100% jsem závisle nepostihli = nepostihnutelné údaje ( vlivy dalších jiných faktorů, které působí na y nemoc, počasí,...) Popište grafem nějakou fci: 3

4 2. ANALÝZA KVALITATIVNÍCH ZNAKŮ NOMINÁLNÍ-nelze varianty seřadit ORDINÁLNÍ -Řadí se mezi kvalitativní znaky, ale ve skutečnosti to jsou kvantitativní znaky. Můžeme seřadit od nejnižších po nejvyšší. VÍCENÁSOBNÁ REGRESE A KORELACE Analýza závislosti kvalitativních znaků znaky jsou vyjádřeny slovně a) Alternativní = vztah dvou obměn (muž/žena) = ASOCIACE b) Množné = vztah více obměn (ano/nevím/ne) = KONTINGENCE Při zpracování tabulek řešíme 2 úkoly: 1) Zda mezi znaky existuje závislost (testy) 2) Pokud ano, jaká je její síla (koeficienty) Schéma asociační tabulky TESTOVÁNÍ - Postup, při kterém ověřujeme, zda předem vyslovená hypotéza je platná či ne (pod vlivem pozorování to znamená na výběrovém souboru) - Nástrojem je statistický test (několik testů, každý má svůj pevný postup a přijímá nějaký závěr) - Testování jako procedura patří do oblasti statistické indukce (na základě výběrového vyvozuju základní dedukce opak) - 2 oblasti teorie odhadu, testování stat. Hypotéz - Pokud chci jistotu, musím pracovat se základním souborem př. sčítání lidí 1x10let - Pravidla volby testů: o n>40 => χ2 Test o o n<20 => F-test 20<n>40 => nutno zjistit očekávané četnosti * Pokud jsou všechny očekávané četnosti větší než 5 => χ2 Test * Pokud alespoň jedna očekávaná četnost je menší jak 5 => F-Test χ2 Test nezávislosti - Ho: mezi sledovanými znaky neexistuje závislost - Po vypočtení to musím porovnat s tabulkovým χ2 (1) str Je-li χ2 >χ2 (1) Ho zamítáme 4

5 Fisherův faktoriálový test - Ho: mezi sledovanými znaky neexistuje závislost - Postup: 1) Vyhledáme nejmenší skutečnou četnost 2) Tuto četnost postupně v pomocných 2 3 tabulkách zmenšujeme po jedné, až dostanu nulu, při zachování okrajových četností. 3) Pro každou tabulku spočítám pravděpodobnost Pi pomocí faktoriálu 4) Součet všech Pi je hodnotou testovacího kritéria a porovnává se s hladinou významnosti Pokud ΣPi < pak Ho zamítáme ΣPi testové kritérium k P ) Kritický obor (obor zamítnutí Ho) Mc Nemarův test (str.22) - Na základě náhodného výběru provádíme dvojí zjišťování před a po - Ho: v základním souboru se podíl jednotek se zjištěným sledovaným znakem nezměnil Mediánový test - Pro 2 nezávislé výběry - Oba sloučíme do 1 souboru, určíme jeho medián a setřídíme dle velikosti Určení síly závislosti: Koeficient asociace - Z měr založených na veličině χ2 V = Yuleův koeficient asociace Q = Koeficient koligace Y = Znaménkové schéma odchylek podrobnější hodnocení znaků umožní určit, kde se sdružené četnosti významně odlišují od hypotetických četností Míry rizika či ohrožení - Relativní riziko RR = kolikrát se zvýší pravděpodobnost ohrožení RR= a (c+d)/c(a+b) - Křížový poměr OR = kolikrát je vyšší šance na ohrožení OR= ad/bc - Atributivní riziko AR = o kolik se změní pravděpodobnost ohrožení - Relativní atributivní riziko AF o kolik %se změní pravděpodobnost ohrožení Schéma kontingenční tabulky 5

6 Testování závislosti - Test nezávislosti se provádí pomocí χ2 testu dobré shody - Teoretické četnosti součin okrajových četností dělený celkovým rozsahem souboru - Testové kritérium - Vypočtenou hodnotu porovnáváme s,,tabulkovu kritickou χ2 (k-1)(m-1), kde k =počet obměn 1.znaku, m=počet obměn druhého znaku je-li χ2 >χ2 (k-1)(m-1), Ho se zamítá - Podmínky použití χ2 testu o Podíl teoretických četností menších než 5 nesmí překročit 20% o Žádná z teoretických četností nesmí být menší než 1 - Porušení podmínek o Jestliže nejsou tyto podmínky splněny, pak je nutné spojit slabé skupiny o Slučujeme řádky nebo sloupce musí být logické, věcně správné a dobře interpretovatelné o Poté opět vyjádříme teoretických četnosti a kontrolujeme podminku U síly závislosti existují určité nedostatky př. citlivost na rozměry tabulky, problematika interpretace,.. To vedlo ke konstrukci Míry predikční charakteristiky typu PRE (Proportional Reduction od Error) str.15 - Nejsou závislé na testovacím kritériu χ2 - Zvlášť se konstruují pro znaky nominální a ordinální Určení síly závislosti Pearsonův koeficient kontingence ptž nenabývá hodnot 1. Musíme ho normalizovat C = normalizovaný Cn = - Nepoužívá se pro jednu, ale při porovnání několik kontingenčních tabulek z hlediska míry závislosti Cramerův koeficient (kramerovo V) V = Čuprorův koeficient kontingence K = 3. PŘÍPRAVA A HODNOCENÍ ANKETNÍHO ŠETŘENÍ Vytvoření projektu výzkumu, definování jednotek a stanovení nutného rozsahu výběru a způsobu výběru, vlastní rozpracování dotazníku, ověření dotazníku a provedení pilotního průzkumu, vlastní shromažďování materiálu, analýza získaného materiálu a jeho zobecnění. DRUHY OTÁZEK UZAVŘENÉ- předem dané možnosti odpovědi OTEVŘENÉ- volná formulace odpovědi POLOOTEVŘENÉ-uzavřené otázky + možnost jedné volné odpovědi IDENTIFIKAČNÍ-na jejich základě je možné třídění daného souboru dotazovaných kontaktní a tréninkové- navázat lepší kontakt s dotazovaným FILTRAČNÍ- umožňují vyloučit ze souboru ty jednotky, u nichž další dotazování ztrácí význam a nemělo by smysl jejich odpovědi hodnotit DOTAZNÍKOVÉ PRŮZKUMY PROGRAMOVÁ OTÁZKA Bývá abstraktní, špatně zodpověditelná, tudíž ji převádíme na otázky zjišťovací. Slouží ke zjištění hlavní věci, ke které chceme pomocí dotazování dojít. ZJIŠŤOVACÍ OTÁZKA Jsou formulovány konkrétněji, odpovědi na ně představují výchozí bázi pro vlastní analýzu hlavního problému. 6

7 4. ČASOVÁ ŘADY 1. ČASOVÁ ŘADA je posloupnost v čase uspořádaných údajů, zpravidla ve směru minulost - přítomnost, z nichž každý se vztahuje buď k určitému časovému úseku (intervalu) nebo k časovému bodu (okamžiku). Cílem analýzy ČŘ 1) charakterizovat (číselně popsat) dynamiku vývoje ukazatele v čase v referenčním období (to období, které jsme si vybrali) pomocí elementárních charakteristik ČŘ 2) na základě dosavadních vývojových tendencí předpovídat = predikovat úroveň ukazatele budoucnosti Základní druhy časových řad a) podle rozhodného časového hlediska * Intervalové časové řady týden, rok (stav zásob, výroby, zaměstnanců, ) Obsahují údaje, které se vztahují k určitému časovému intervalu Součet časové řady má smysl Př.: vývoj HDP v letech (intervalem je celý rok) Průměrem je prostý aritmetický průměr ȳ= * * Okamžikové časové řady rozhodující okamžik (sčítání lidu) Sestaveny z údajů k rozhodujícímu okamžiku Součet časové řady nemá smysl Př.: sčítání lidí, počty zaměstnanců k 1.1. Shrnují se pomocí chronologických průměrů prostý ȳ= vážený ȳ= b) podle periodicity sledování (jak často) * Krátkodobé časové řady (méně jak 1 rok) * Střednědobé časové řady (za 1 rok) * Dlouhodobé časové řady (delší jak 1 rok) = / *2 +, ,+/.. + 1, *2 +, ,+/ 3 - / , c) podle druhu sledovaných ukazatelů *primárních spotřeba masa na 1 obyvatele v letech (vývoj HDP v letech, vývoj sklizně v letech, ) *sekundárních odvozených ukazatelů (podíl celk. spotřeba : počet obyvatel = sekundární) (vypočteny na základě primárních ukazatelů HDP na obyvatele v letech ) d) podle způsobu vyjádření údajů * naturálních (změřit, zvážit) * peněžních 7

8 Srovnatelnost údajů v časové řadě - Každá časová řada musí splňovat 4 hlediska srovnatelnosti: o hledisko věcné srovnatelnosti každý musí být stejně metodicky vymezen, musí být stejná (míra nezaměstnanosti) o hledisko prostorové srovnatelnosti porovnání regionu formace prostoru stále stejný (kraje) o hledisko časové srovnatelnosti pouze u intervalových ČŘ zachovaná (1 měsíc, 1 rok) o hledisko cenové srovnatelnosti podceňováno, peníze ve stálých cenách, buď sami stanovit, nebo ve spolupráci s ČSÚ 2. ELEMENTÁRNÍ (= ZÁKLADNÍ) CHARAKTERISTIKY ČASOVÝCH ŘAD Slouží k popisu časových řad, slouží k rychlé informaci o charakteru a chování ukazatele v časové řadě = DYNAMIKY VÝVOJE a člení se: a) diference různého řádu absolutní (stejné jednotky), nebo relativní (%) b) tempa růstu a průměrného tempa růstu c) průměry (obecně) d) bazický index (báze=základna) a) Absolutní charakteristiky První absolutní diference = kde t=2, 3,, n Druhá absolutní diference 4 5 = kde t=3, 4,, n b) Relativní charakteristiky Bazický index 7 8 = 5 9 Koeficient růstu 7 3 = 5 51 t=2, 3,, n 1 Průměrný koeficient růstu 7 = : *2 Tempo přírůstku = 3 = > 5 51 = Koeficienty zrychlení? 3 = > 5 - > = < c) Průměr u intervalové ČŘ vypočtený jako prostý aritmetický průměr u okamžikové ČŘ se používá chronologický průměr Charakteristické rysy průběhu ČŘ 3 složky: 1. Trendová dlouhodobá vývojová tendence 2. Periodická kolísání výsledek periodicky působících faktorů 3. Náhodná kolísání neočekávané náhodné neřízené faktory působení vedlejších faktorů náhodného charakteru, drobné nepravidelné výkyvy, které nemůžeme předvídat. Každá ČŘ může obsahovat 3 složky, nemůže být nic jiného (1, 2 nebo všechny 3) Dle těchto se dále člení podle přítomnosti složek: a) ČŘ neperiodická s trendovou složkou Ceny pohonných hmot b) ČŘ periodická s trendovou složkou Trend + kolísání periodicity cestovní ruch, prodej zájezdu, počet nezaměstnaných

9 c) ČŘ neperiodická stacionární Nijaká, nevykazuje trend v zemědělství vývoj hektarových plodin, klimatické faktory, něco co můžu předvídat d) ČŘ periodická stacionární Elektrika v domácnosti, plyn, chceme, aby byla stabilní, ale když je zima topíme-zvednou se ceny a v létě naopak Periodická = pravidelně něčím ovlivňována 3. Modelování časových řad Princip založen na předpokladu, že jediný faktor dynamiky ukazatele shromážděného v ČŘ představuje čas. Modely založené na tomto principu se nazývají jednorozměrnými modely ve tvaru: 6 3 = f ( kdy 6 3 je hodnota modelového ukazatele v čase t, t=1,2,3, (časová je hodnota náhodné složky (poruchy, chyby, ) v čase t 3 způsoby jednorozměrných modelů: 1) Pomocí klasického (formálního) modelu - Model vychází z dekompozice (=rozklad) řady na 4 složky (formy) časového pohybu, které tvoří systematickou část průběhu ČŘ - Lze ji dekomponovat na složku o trendová složka (Tt) Trend hlavní tendence dlouhodobého vývoje (rostoucí, klesající,konstantní) o periodická složka (Pt): sezónní (St) nebo cyklická (Ct) Sezónní složka pravidelně se opakující odchylka od trendu, vyskytující se u ČŘ údajů s periodicitou kratší než jeden rok nebo rovnou právě jednomuroku Cyklická složka kolísání okolo trendu v důsledku dlouhodobého cyklického vývoje s délkou vlny delší než jeden rok o náhodné kolísání (εt) /epsilon/ Náhodná složka nelze ji popsat žádnou funkcí času, jejím zdrojem jsou drobné, vzájemně nezávislé a v jednotlivostech nepostižitelné příčiny 2) Pomocí Boxovy-Jenkinsovy metodologie - Považuje za základní prvek náhodnou službu, jež může být vytvořená 3) Pomocí spektrální analýzy Aditivní model 6 3 A =B 3 +D 3 +@ 3 Multiplikativní model 6 3 A =B 3 D 3 9

10 4. Analýza neperiodických ČŘ - hlavním úkolem je vystižení základní tendence jejich vývoje trendu. Popis trendu (trendové složky) v časových řadách: a) Graficky dvourozměrný graf b) Mechanicky pomocí klouzavých průměrů str častá empirická metoda, klouzavé (sklouznu o období níže) - vyrovnání pomocí klouzavých průměrů spočívá v nahrazení skutečných hodnot ČŘ průměrem určitého období - při postupném výpočtu průměrů postupujeme,,kloužeme vždy o 1 pozorování dopředu, přičemž zároveň nejstarší (tj. první) pozorování z té skupiny, z nich je průměr počítán, vypouštíme - klouzavé průměry o za lichý počet období o za sudý počet období, kdy střední hodnotu vyhledáme centrováním tzv. centrované klouzavé průměry c) Analyticky pomocí trendové fce 4.1. Mechanické vyrovnání Mechanické vyrovnání používá k popisu trendu čáru klouzavých průměrů. Při postupném výpočtu klouzavých průměrů postupujeme ( kloužeme ) vždy o jedno pozorování dopředu, přičemž zároveň nejstarší (tj. první) pozorování z té skupiny, z níž je průměr počítán, vypouštíme E F, -. /.. E,, /. H. E,-, F F kde k je délka klouzavého průměru (klouzavý průměr řádu k) 4.2. Analytické vyrovnání ČŘ pomocí trendových funkcí - trendová fce je obdoba jednoduché regresní fce, jde o vyjádření průběhu ČŘ matematickou fcí, kde zkoumaný ukazatel v ČŘ I vystupuje jako závisle proměnná a čas (časová proměnná) jako nezávisle proměnná (t), tedy J 3 =f(t) 3, kde J 3 je vyrovnaná hodnota zkoumaného ukazatele ČŘ, t časová proměnná, tj. pořadové číslo posloupnosti údajů v ČŘ (t=1,2,3, n),@ 3 je náhodná složka - pro analýzu vyrovnání se používají trendové fce, od nich se vyžaduje, aby byli matematicky jednoduché: * minimální počet členů v rovnici * minimální možná mocnina argumentu * linearita v parametru *spojitost * minimální počet extrémů a inflexních bodů Těmto vlastnostem odpovídají fce: Lineární B 3 = a + b t Kvadratická B 3 = a + b t + c K Logaritmická B 3 = a + b log t Exponenciální B 3 = a 3 Mocninná B 3 = a K L Odmocninná Kombinovaná B 3M N+. K B 3 = a + b. t+ c. K F Logistická B 3 = 2.P Q,R5 Pozn.: roky 1993, 1994, jsou pouze časové informace, které se musí převézt na časovou proměnou K a to 1, 2, 10

11 Parametry trendové fce (musíme určit a, b, c) obvykle se odhadnou pomocí MNČ, která je použitelná v případě, že zvolená trendová fce je lineární v parametrech Σ 6 3 J 3 2 UVW 6 3 = skutečné y =J 3 =J Lineární trend 6 =N+.K, grafem je přímka Parametry lze určit metodou nejmenších čtverců ze soustavy Xormálních rovnic: W.N+ ΣK M Σ 6 a Σ K + b ΣK = ΣK 6 Soustavy normálních rovnic pro časté trendové funkce: kvadratický trend (parabola): n. a + b Σ K + c Σ K = Σ 6 Y a Σ K + b Σ K + c Σ K = Σ 6 K Y a Σ K + b Σ K + c Σ K Z = Σ 6 K hyperbolický (lomený) trend: n a+b Σ 2 3 = Σ 6 a Σ b Σ = Σ 3 Řešením této soustavy se pak získají odhady parametrů lineárního trendu a = *.3 * = ȳ.k b = * * Posouzení vhodnosti modelů 1) Základem pro rozhodování o vhodném typu trendové fce by měla být věcně eko kritéria 2) Druhou jednoduchou možností volby je analýza grafů ČŘ (nebezpečí vizuální výběr fce může být subjektivní a závisí na měřítku!!! Z komára velblouda a naopak, stačí pouze zvětšit měřítko (špatný nákres regrese) 3) Kvalita modelu je porovnána např. pomocí reziduální (zbytek) směrodatné odchylky 4) Často používaným ukazatelem, který slouží k popisu stupně shody, je index determinace [ =1 Σ Σ 6 3 ȳ Čím je jeho hodnota bližší 1, tím model lépe popisuje zkoumaný jev (=existuje větší soulad s modelem) 5) Kritéria používaná stat.programy (chyby odhadu str 48) M.E. (mean error) střední chyba odhadu M.S.E. (mean squared error) střední kvadratická/čtvercová chyba odhadu M.A.E. (mean absolute error) střední absolutní chyba odhadu M.P.E. (mean percent error) střední procentní chyba odhadu M.A.P.E. (mean absolute percent error) střední absolutní procentní chyba odhadu M.A.P.E. = 288.Σ / 51 ] 5 / * 5 Hodnocení při kvalitě modelu M.A.P.E. Menší jak 5% velmi vhodný model 5 10 % vhodný model Větší jak 10% méně vhodný model, uvažovat o změně modelu nebo zda neobsahuje složku stacionární, méně přesné prognózy, uvažovat zda tam je trendová složka 11

12 Adaptivní přístupy k modelování ČŘ (kapitola3.8. SMII.) - dávají novým údajům větší váhu než těm starým - Adaptivní modely vychází z předpokladu, že pro konstrukci prognózy budoucnosti vývoje mají největší význam (váhu) nejnovější pozorování ČŘ, nejnovější=nejsilnější váha/nejstarší=nejslabší - berou v úvahu,,stárnutí informací - patří sem: metody exponenciálního vyrovnávání, ARIMA modely,apod - naprosto jiný přístup, nedá se počítat 6. Analýza periodických ČŘ (musí obsahovat periodické kolísání) Menší nebo rovno 1 rok - Sezónnost v časových řadách St (krátkodobé kolísání zemědělství, stavebnictví, eko, CR, musí mít periodické kolísání) Delší jak 1 rok cyklická složka Ct (dlouhodobé kolísání) může a nemusí být periodické kolísání, nesetkáme se, demografická info, hospodářská krize Objektivní faktory klima, roční období Subjektivní faktory působí omezeně na území tradice, prázdniny, náboženství, svátky, Intenzita sezónního kolísání - Měří se pomocí absolutních sezónních odchylek nebo častěji pomocí sezónních indexů ^I 1) Sezónní odchylky _= ȳ u ČŘ bez trendu _= `u ČŘ s trendem a 3 = 2) Sezónní indexy bf]3pč*á efg*f3h řhg 5 jkfj*h*á efg*f3h řhg 5 a = =lumv=vn7á hp4wpkn a7jklčwá q6=pqwnwá Klp=lKVn7áhp4WpKN Vyrovnaná hodnota - průměr řady, celkový průměr ȳ u ČŘ bez trendu - průměr za rok - klouzavé průměry - u ČŘ s trendem - hodnota vyjádřená z trendové funkce ui- u ČŘ s trendem Postup pro vyjádření z trendové funkce - výpočet trendové funkce - výpočet vyrovnaných hodnot z funkce výpočet sezónních indexů - výpočet průměrných sezónních indexů pro jednotlivá období Náhodné kolísání - Náhodou lze vyjádřit ve =6 3 J 3 lze chápat jako výsledek působení blíže nespecifického souboru - Popis: pomocí absolutní a relativní průměrné odchylky 7. Korelace časových řad - nutno odstranit trendovou složku z časové řady - korelační analýzu aplikujeme na rezidua obou ukazatelů VHODNOST TRENDOVÉ FUNKCE V ČŘ Posoudím podle Indexu korelace a determinace ( I, ). Pokud se I blíží k jedné funkce, je zvolena vhodně. Pokud k nule není zvolena vhodně, slabá závislost 12

13 INTERPOLACE V ČŘ - Doplnění chybějících údajů uvnitř ČŘ (válka, povodně, oheň, posloupnost, nesmí nic chybět) a) Pomocí dvou sousedních hodnot (starší díra mladší, něco chybí) jejich aritmetický průměr X průměrný koeficient růstu (k) b) Pomocí všech údajů v ČŘ z trendové fce EXTRAPOLACE V ČŘ = odhad údajů ukazatele za horizont známých hodnot Je to tzv. statistické prognózování. Odhady budoucích hodnot pomocí trendové funkce. Do t dosadíme očekávané období. - Předpověď: o Bodová výsledkem bod, číslo o Intervalová s určitou pravděpodobností Index determinace Posouzení prognózy * pomocí pseudoprognózy ČŘ zkrátíme o 1 období a vypočítáme modelově hodnotu pro poslední údaj a porovnáme * relativní chyba prognózy - u s = tkfu*ówhbf]3pč*fb3 * 100 r = xy.100 % bf]3pč*fb3 y Je-li u s větší jak 5% - velmi dobrá prognóza; mezi 5-10% uspokojivá; větší jak 10% nevhodný model * Theilův koeficient nesouladu: B = xy y - * relativní chyba extrapolace T = B. 100 (%) * M.A.P.E. čím menší chyba je, tím je model vhodnější * Index korelace čím větší tím lepší 5. INDEXNÍ ANALÝZA - pomocí ní provádíme porovnání ukazatelů, které se liší z hlediska věcného, prostorového a časového - Podílem hodnot téhož ukazatele získáme index, rozdílem pak absolutní rozdíl (absolutní přírůstek) ukazatele - Index = bezrozměrná veličina, vyjadřuje podíl a lze ho vyjádřit v % Vymezení a typy ukazatelů Ukazatel veličina, kt. popisuje určitou sociálněekonomickou skutečnost (údaj je pak konkrétní hodnota) 1) Způsob zjišťování o Primární (prvotní) ukazatele přímo zjišťované př. počet pracovníků, sklizeň, stav zásob, o zboží, Sekundární odvozené od primárních, zpravidla podíl či rozdíl př. zisk, produktivita práce, hektarový výnos, 13

14 2) Hledisko vyjádření o Absolutní vyjadřuje velikost určitého jevu bez vztahu k jinému jevu (primární i sekundární) o Relativní podíl absolutních (jen sekundární) 3) Hledisko doby zjišťování o Okamžikové k určitému okamžiku (datu) (počet pr-ků k 1.1.) o Intervalové za určité období (zisk za měsíc, náklady za rok, ) 4) Hledisko povahy ukazatelů o Extenzitní absolutní, kt. charakterizují množství, rozsah, objem o Intenzitní měří intenzitu, úroveň 5) Hledisko shrnování ukazatelů o Stejnorodé prostý součet má pro daný celek smysl o Nestejnorodé prostý součet nedává smysl (př objem produkce výrobků, sklizeň různých plodin, ) 6) Hledisko shrnovatelnosti schopnost ukazatele určit jeho celkovou hodnotu na základě jeho dílčích hodnot o Ukazatele shrnovatelné přímo o Ukazatele shrnovatelné nepřímo o Ukazatele neshrnovatelné Elementární prostředky srovnávání ukazatelů a) Porovnáváme hodnoty ukazatele vzhledem ke stejnému období (bázi) indexy bazické b) Porovnáváme hodnoty ukazatele vzhledem k období předchozímu indexy řetězové PŘEVOD Pomocí dělení převádíme Bazické => Řetězové Pomocí násobení převádíme Řetězové => Bazické Řetězové indexy charakterizují tempo růstu (poklesu) - Koeficient růstu - Koeficient přírůstku (úbytku) - Průměrný koeficient růstu Hodnota průměrného koeficientu růstu je závislá na první a poslední hodnotě v řadě (ptž dělím poslední prvním) Pokud vykazuje velké výkyvy, tak ztrácí smysl Druhy indexů 1) Individuální - Množství a úrovně; dále je lze dělit na jednoduché a složené - Symbolika: Intenzitní ukazatele p Extenzitní ukazatele q Ceny c 1 značí období běžné 0 značí období základní - Individuální indexy srovnáváme dvě hodnoty téhož ukazatele o Jednoduché porovnává množství pro jednu jednotku (není zde třeba shrnování) jednoduchý individuální index množství jednoduchý individuální index úrovně 14

15 o Složené indexy stejnorodého extenzitního a intenzitního ukazatele, kdy dílčí hodnoty shrnujeme za celek. Hodnoty extenzitního shrnujeme pomocí součtu a hodnoty intenzitního pomocí průměru složený individuální index množství Intenzitního ukazatele můžeme shrnovat pouze pomocí váženého harmonického průměru, kde jako váhy užijeme strukturu extenzitního ukazatele q. Tento index se nazývá INDEX PROMĚNLIVÉHO SLOŽENÍ (IPS) IPS - Tvořen z hodnot extenzitních a intenzitních ukazatelů. Zachycuje změny obou ukazatelů. Je potřeba znát i hodnoty ukazatelů, ty zachytí pouze změnu jedné složky, při konstantní hodnotě druhé složky. Lze ho vyjádřit jako součin dvou indexů, z nichž: a) Vyjadřuje vliv změny intenzitní složky při konstantním působení (váze) složky extenzitní=> INDEX STÁLEHO SLOŽENÍ (ISS) b) Vyjadřuje vliv změny extenzitní složky při konstantním působení (váze) složky intenzitní=> INDEX STRUKTURY (ISTR) Váhy mohou být z období základního i běžného, proto 2 způsoby rozkladu 2) Souhrnné představují indexy nestejnorodých extenzivních ukazatelů - Jsou nesouměřitelné, jejich součet nemá pro celkem význam, proto je nutné, abychom je učinili alespoň podmíněně souměřitelnými a to pomocí společných intenzitních ukazatelů (souměřitelů). Nejčastěji souměřitelné jsou ceny - Index hodnotový souhrnný index charakterizující změnu vytvořené hodnoty - Hodnotový index- lze rozložit na součin dvou indexů. a) Jeden představuje změnu intenzitní složky =>CENOVÝ INDEX (index úrovně) b) Druhý představuje vliv změny množství (extenzitní ukazatel) =>INDEX FYZICKÉHO OBJEMU (množství) Souhrnné indexy úrovně - Cenové indexy - Vliv změny cen při nezměnění váhy (extenzitní složky), a to množství LASPEYRESŮV PAASCHEHO LOWEHO FISHERŮV 15

16 Souhrnné indexy množství - Objemové indexy = jsou indexy nestejnorodého extenzitního ukazatele q - Podávají info o změnách objemu vytvořené či prodané produkce LASPEYRESŮV PAASCHEHO LOWEHO FISHERŮV LASPEYRESŮV jako váhy uvažuje množství základního období PAASCHEHO - jako váhy uvažuje množství běžného období LOWEHO jako váhy bere stálé množství ceny FISHERŮV představuje geometrický průměr Laspeyresova a Paascheho indexu. Slouží k vyjádření průměru, když chceme vypočítat, jak ovlivnila změna ceny, celkovou změnu. BORTKIEWICZŮV ROZKLAD lze odpovědět na otázku co je příčinou rozdílu mezi hodnotou Laspeyresova a Paascheho indexu - Rozdíl může být způsoben: o V důsledku variability hodnot znaku (cen c) o V důsledku variability podílu vah (množství - q) o V důsledku intenzity závislosti průměrových hodnot znaku a podílu vah korelace mezi objemovými a cenovými indexy SOUMĚŘITEL V INDEXNÍ ANALÝZE Je to hodnota, která srovnává nesrovnatelné, např. cena 1. ÚDAJE O STAVU OBYVATELSTVA 2. ÚDAJE O POHYBU OBYVATELSTVA 6.DEMOGRAFIE POČET OBYVATELSTVA-Okamžikový údaj STŘEDNÍ STAV OBYVATELSTVA-Vychází z průměru počátečního a konečného stavu za dané období SLOŽENÍ OBYVATELSTVA PODLE VĚKU: Biologické generace(i-0-14,ii-15-49,ii-50+) Index stáří =(obyvatelé nad 65)/(obyvatelé do 14) Ekonomické generace(i-0-19-předproduktivní,ii produktivní, III-65+-postproduktivní) Index hospodářského zatížení-počet osob, které musí živit svou prací jeden produktivní Vážený index hospodářského zatížení-kolik spotřebních jed. musí svou prací živit jeden produktivní Index závislosti mladých-zelené zatížení Index závislosti starých-šedé zatížení STROM ŽIVOTA VĚKOVÁ PYRAMIDA-představuje věkovou strukturu populace v daném období Progresivní převažuje I. biologická generace na III. biologickou generaci typická pro rozvojové země Stacionární podíl I. a III. biologické generace je přibližně stejný Regresivní podíl III. biologické generace převažuje nad I. biologickou generací - typické pro většinu evropských států DÉLKA ŽIVOTA STŘEDNÍ-naděje dožití, prům.počet let, kt. by se dožil novorozenec při zachování současné úmrtnosti. NORMÁLNÍ-modus délky života, věk, ve kterém lidé nejčastěji umírají PRAVDĚPODOBNÁ-věk, kterého by se při dané úmrtnosti dožila polovina obyvatel (medián) PRŮMĚRNÝ VĚK-průměr současného věku všech obyvatel žijících na daném území 16

17 KLASIFIKACE NAROZENÝCH Pohlaví, Vitalita (živé x mrtvé), Legitimita (narozen v manželství či mimo), Zralost (připravenost žít),pořadí(kolikáté dítě se narodilo),socioekonomická skupina (nejvyšší dosažené vzdělání matky) UKAZATELE POHYBU OBYVATELSTVA PŘIROZENÁ MĚNA ŽIVOTA Úmrtnost (mortalita)-schopnost zemřít (v jakém věku, na co častěji) Plodnost (fertilita)-schopnost rozmnožovat se (v jakém věku, jaké sociální skupiny) Sňatečnost-schopnost vytvářet jednotky, které reprodukci umožňují Rozvodovost-schopnost tyto jednotky rušit EVIDENCE MIGRACE Migrace- schopnost se stěhovat OBRAT MIGRACE O= I (počet přistěhovalých)+ E (počet vystěhovalých) SALDO MIGRACE S=I-EINTENZITA MIGRACE i=i/p x EKONOMICKÁ AKTIVITA OBYVATELSTVA AKTIVNÍ Disponibilní pracovní síly-ob.starší 15 let zaměstnané i nezaměstnané osoby NEAKTIVNÍ Objektivní(předškolní děti, žáci, studenti, starobní důchodci, dlouhodobě nemocní, invalidé) subjektivní(osoby v domácnosti, rentiéři, ostatní fin. zajištění, neochota pracovat) Hospodářské zatížení pracujících osob Podíl počtu neaktivních a počtu zaměstnaných osob Míra ekonom.aktivity obyvatelstva Podíl počtu ekonomicky aktivních osob z celkového počtu obyvatel ZAMĚSTNANOST Placená zaměstnanost Sebezaměstnanost Podzaměstnanost SLEDOVÁNÍ POMOCÍ SČÍTÁNÍ LIDU, DOMŮ A BYTŮ STATISTICKÉ VÝKAZNICTVÍ-sleduje pouze zaměstnané osoby a to pomocí podnikové statistiky EVIDENČNÍ POČET ZAMĚSTNANCŮ-denní stav PRŮMĚRNÝ EVIDENČNÍ POČET ZAMĚSTNANCŮ-Průměr z počátečního a konečného stavu. VÝBĚROVÁ ŠETŘENÍ PRAC.SIL PROVÁDĚNÝCH ČSÚ EVIDENCE ÚŘADŮ PRÁCE A MPSV-měsíční údaje NEZAMĚSTNANOST Registrované osoby hledající práci SLEDOVÁNÍ POMOCÍ ÚDAJE MPSV VÝBĚROVÉ ŠETŘENÍ ČSÚ 8.ŽIVOTNÍ ÚROVEŇ OBYVATELSTVA ŽIVOTNÍ ÚROVEŇ-souhrn všech užitných hodnot, kt. má obyvatelstvo v daném čase a prostoru k uspokojování živ. potřeb k dispozici. ZÁKLADNÍ PRVKY- Příjmy, Spotřeba, Standard bydlení, Volný čas a jeho využití, Stav SZ a soc. péče Při sledování a hodnocení ŽÚ důležité provedení diferenciace do (soc.,ekon.,biolog.) skupin obyvatelstva. Údaje vyjádřeny relativně- na spotřebitelskou jednotku (jednotlivec,domácnost). SPOTŘEBNÍ JEDNOTKA-relativní úroveň spotřeby(příjmu), stupnice spotřebních jednotek rozlišujeme: a)pro jednotlivce (nutriční hodnoty, na osobu ) 17

18 b)pro rodiny (ekonom.spotř.jednotky) METODY ZJIŠŤOVÁNÍ a)výkaznictví mezd a soc. příjmech b)výběrové šetření o příjmech domácností-mikrocensy c)daňová statistika d)statistika rodinných účtů MIKROCENSY Výběrové šetření, zjišťujeme ukazatele o soc. a příjmové diferenciaci domácností. Ve 2-5letých intervalech. Vždy náhodný výběr. Jednotka zjišťování domácnost. Dotazník spracovává instruovaný tazatel. STATISTIKA RODINNÝCH ÚČTŮ Veškeré peněžní a naturální příjmy a výdaje vybraných domácností.vedou deníky, záměrný výběr, počítá se metodou kvót(asi 3000domácností) PŘÍJMY OBYVATELSTVA Rozduje disponibilní příjem Čisté mzdy a platy zaměstnanců, Čistý příjem z vlastního podniku, Příjmy od družstev, prodej zem.výrobků, provize, důchody, stipendia, soc. podpory, PRO HODNOCENÍ ŽÚ Průměrný příjem na hlavu, na spotřební jednotku, příjem domácností, domácností na hlavu. Reálné Příjmy =Nominální Příjmy : Index spotřebitelských cen Úhrnný životní příjem-od počátku aktivního věku do doby pozorování Úhrnný celoživotní pracovní příjem- celé prac. období Životní minimum-částka k uspokojení životních potřeb, řeší pouze nejnutnější ex.záležitosti Existenční minimum-dolní hranice životního minima Sociální minimum-horní hranice životního minima SPOTŘEBA OBYVATELSTVA Veškeré spotřební produkty a služby. BYDLENÍ A JEHO PROSTŘEDÍ SOCIÁLNÍ ZABEZPEČENÍ A PÉČE Důchodové zabezpečení Nemocenské pojištění Dávky soc. a státní podpory Soc. péče a podpora v nezaměstnanosti Podpora v nezaměstnanosti ČASOVÝ FOND A VYUŽITÍ VOLNÉHO ČASU Pomocí speciálních dotazníků-časové DENÍKY LORENZOVA KŘIVKA Grafické znázornění kumulativní distribuční funkce rozdělení určité proměnné Např. přiřazuje poměrně rozloženým domácnostem poměrně rozložené důchody Absolutní rovnost přiřazena teoretickou Lorenzovou křivkou (y = x) se sklonem 45o GINIHO KOEFICIENT Rozdíl mezi plochou pod ideální Lorenzovou křivkou a plochou pod skutečnou L. K. s plochou pod ideální křivkou. Giniho koeficient nabývá hodnot od 0 do 1. Čím více se hodnota blíží k 0, tím je rozdělení rovnější a naopak Giniho koeficient sděluje, kolik procent mezd je třeba vyplatit navíc, aby bylo dosaženo dané diferenciace. Y= A/A+B 18

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009

Více

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

MÍRY ZÁVISLOSTI (KORELACE A REGRESE) zhanel@fsps.muni.cz MÍRY ZÁVISLOSTI (KORELACE A REGRESE) 2.5 MÍRY ZÁVISLOSTI 2.5.1 ZÁVISLOST PEVNÁ, VOLNÁ, STATISTICKÁ A KORELAČNÍ Jednorozměrné soubory - charakterizovány jednotlivými statistickými znaky

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

STATISTIKA I Metodický list č. 1 Název tématického celku:

STATISTIKA I Metodický list č. 1 Název tématického celku: STATISTIKA I Metodický list č. 1 Analýza závislostí Základním cílem tohoto tématického celku je seznámit se s pokročilejšími metodami zpracování statistických údajů.. 1. kontingenční tabulky 2. regresní

Více

Měření závislosti statistických dat

Měření závislosti statistických dat 5.1 Měření závislosti statistických dat Každý pořádný astronom je schopen vám předpovědět, kde se bude nacházet daná hvězda půl hodiny před půlnocí. Ne každý je však téhož schopen předpovědět v případě

Více

INDUKTIVNÍ STATISTIKA

INDUKTIVNÍ STATISTIKA 10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ HODNOCENÍ ZÁVISLOSTÍ KVALITATIVNÍ VELIČINY - Vychází se z kombinační (kontingenční) tabulky, která je výsledkem třídění druhého stupně KVANTITATIVNÍ

Více

KGG/STG Statistika pro geografy. Mgr. David Fiedor 4. května 2015

KGG/STG Statistika pro geografy. Mgr. David Fiedor 4. května 2015 KGG/STG Statistika pro geografy 11. Analýza časových řad Mgr. David Fiedor 4. května 2015 Motivace Úvod chceme získat představu o charakteru procesu, která časová řada reprezentuje Jaké jevy lze znázornit

Více

IV. Indexy a diference

IV. Indexy a diference IV. Indexy a diference Ukazatel specifická statistická veličina popisující určitou sociálně ekonomiclou skutečnost. Ekonomická teorie definuje své pojmy a jejich vztahy často bez ohledu, zda jde o pojmy

Více

Kontingenční tabulky, korelační koeficienty

Kontingenční tabulky, korelační koeficienty Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Mějme kategoriální proměnné X a Y. Vytvoříme tzv. kontingenční tabulku. Budeme tedy testovat hypotézu

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chb v této presentaci mě prosím upozorněte. Děkuji. Tto slid berte pouze jako doplňkový materiál není v nich

Více

Korelační a regresní analýza

Korelační a regresní analýza Korelační a regresní analýza Analýza závislosti v normálním rozdělení Pearsonův (výběrový) korelační koeficient: r = s XY s X s Y, kde s XY = 1 n (x n 1 i=0 i x )(y i y ), s X (s Y ) je výběrová směrodatná

Více

VNITROSKUPINOVÝ ROZPTYL. Je mírou variability uvnitř skupin Jiný název: průměr rozptylů Vypočítává se jako průměr rozptylů v jednotlivých skupinách

VNITROSKUPINOVÝ ROZPTYL. Je mírou variability uvnitř skupin Jiný název: průměr rozptylů Vypočítává se jako průměr rozptylů v jednotlivých skupinách ROZKLAD ROZPTYLU ROZKLAD ROZPTYLU Rozptyl se dá rozložit na vnitroskupinový a meziskupinový rozptyl. Celkový rozptyl je potom součet meziskupinového a vnitroskupinového Užívá se k výpočtu rozptylu, jestliže

Více

MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ

MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ v praxi u jednoho prvku souboru se často zkoumá více veličin, které mohou na sobě různě záviset jednorozměrný výběrový soubor VSS X vícerozměrným výběrovým souborem VSS

Více

Analýza časových řad. John Watters: Jak se stát milionářem.

Analýza časových řad. John Watters: Jak se stát milionářem. 5.2 Analýza časových řad Nechal jsem si udělat prognózu růstu své firmy od třech nezávislých odborníků. Jejich analýzy se shodovaly snad pouze v jediném - nekřesťanské ceně, kterou jsem za ně zaplatil.

Více

Kontingenční tabulky, korelační koeficienty

Kontingenční tabulky, korelační koeficienty Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Budeme předpokládat, že X a Y jsou kvalitativní náhodné veličiny, obor hodnot X obsahuje r hodnot (kategorií,

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com) Závislost náhodných veličin Úvod Předchozí přednášky: - statistické charakteristiky jednoho výběrového nebo základního souboru - vztahy mezi výběrovým a základním souborem - vztahy statistických charakteristik

Více

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

LINEÁRNÍ REGRESE. Lineární regresní model

LINEÁRNÍ REGRESE. Lineární regresní model LINEÁRNÍ REGRESE Chemometrie I, David MILDE Lineární regresní model 1 Typy závislosti 2 proměnných FUNKČNÍ VZTAH: 2 závisle proměnné: určité hodnotě x odpovídá jediná hodnota y. KORELACE: 2 náhodné (nezávislé)

Více

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků Příklad: Test nezávislosti kategoriálních znaků Určete na hladině významnosti 5 % na základě dat zjištěných v rámci dotazníkového šetření ve Šluknově, zda existuje závislost mezi pohlavím respondenta a

Více

Regresní analýza 1. Regresní analýza

Regresní analýza 1. Regresní analýza Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému

Více

6. Lineární regresní modely

6. Lineární regresní modely 6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie Predikce Multikolinearita Cvičení 4 Zuzana Dlouhá Aplikace EM predikce obecně ekonomické prognózování, předpověď, předvídání hlavním cílem je odhad hodnot vysvětlované proměnné

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,

Více

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza Korelační a regresní analýza 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza Pearsonův korelační koeficient u intervalových a poměrových dat můžeme jako

Více

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů) VYBRANÉ TESTY NEPARAMETRICKÝCH HYPOTÉZ TESTY DOBRÉ SHODY Název testu Předpoklady testu Testová statistika Nulové rozdělení test dobré shody Očekávané četnosti, alespoň 80% očekávaných četností >5 ( ) (p

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, KMA/SZZS1 Matematika 1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, operace s limitami. 2. Limita funkce

Více

Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Stochastický proces Posloupnost náhodných veličin {Y t, t = 0, ±1, ±2 } se nazývá stochastický proces

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie Predikce Multikolinearita Cvičení 4 Zuzana Dlouhá Aplikace EM predikce obecně ekonomické prognózování, předpověď, předvídání hlavním cílem je odhad hodnot vysvětlované proměnné

Více

EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy

EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy Ekonometrická analýza proces, skládající se z následujících fází: a) specifikace b) kvantifikace c) verifikace d) aplikace Postupné zpřesňování jednotlivých

Více

Mnohorozměrná statistická data

Mnohorozměrná statistická data Mnohorozměrná statistická data Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Mnohorozměrná

Více

Úvodem Dříve les než stromy 3 Operace s maticemi

Úvodem Dříve les než stromy 3 Operace s maticemi Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová

Více

Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů Časové řady, typy trendových funkcí a odhady trendů Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Jiří Neubauer (Katedra ekonometrie UO Brno) Časové

Více

Statistika pro geografy

Statistika pro geografy Statistika pro geografy 2. Popisná statistika Mgr. David Fiedor 23. února 2015 Osnova 1 2 3 Pojmy - Bodové rozdělení četností Absolutní četnost Absolutní četností hodnoty x j znaku x rozumíme počet statistických

Více

Základy popisné statistiky

Základy popisné statistiky Základy popisné statistiky Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 8. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 26 Obsah 1 Základy statistického zpracování dat 2

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK Základy ekonometrie Odhad klasického lineárního regresního modelu II Cvičení 3 Zuzana Dlouhá Klasický lineární regresní model - zadání příkladu Soubor: CV3_PR.xls Data: y = maloobchodní obrat potřeb

Více

Písemná práce k modulu Statistika

Písemná práce k modulu Statistika The Nottingham Trent University B.I.B.S., a. s. Brno BA (Hons) in Business Management Písemná práce k modulu Statistika Číslo zadání: 144 Autor: Zdeněk Fekar Ročník: II., 2005/2006 1 Prohlašuji, že jsem

Více

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Vybraná rozdělení spojitých náhodných veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Třídění Základním zpracováním dat je jejich třídění. Jde o uspořádání získaných dat, kde volba třídícího

Více

Regresní analýza. Eva Jarošová

Regresní analýza. Eva Jarošová Regresní analýza Eva Jarošová 1 Obsah 1. Regresní přímka 2. Možnosti zlepšení modelu 3. Testy v regresním modelu 4. Regresní diagnostika 5. Speciální využití Lineární model 2 1. Regresní přímka 3 nosnost

Více

Mnohorozměrná statistická data

Mnohorozměrná statistická data Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistický znak, statistický soubor Jednotlivé objekty nebo subjekty, které jsou při statistickém

Více

Jana Vránová, 3. lékařská fakulta UK

Jana Vránová, 3. lékařská fakulta UK Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace

Více

Testování hypotéz a měření asociace mezi proměnnými

Testování hypotéz a měření asociace mezi proměnnými Testování hypotéz a měření asociace mezi proměnnými Testování hypotéz Nulová a alternativní hypotéza většina statistických analýz zahrnuje různá porovnání, hledání vztahů, efektů Tvrzení, že efekt je nulový,

Více

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests) Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, např. hmotnost a pohlaví narozených dětí. Běžný statistický postup pro ověření závislosti dvou veličin je zamítnutí jejich

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

2.5 STATISTISKÉ ZJIŠŤOVÁNÍ, ZÁKLADNÍ STATISTICKÉ POJMY

2.5 STATISTISKÉ ZJIŠŤOVÁNÍ, ZÁKLADNÍ STATISTICKÉ POJMY Základní statistické pojmy Aleš Drobník strana 1 2.5 STATISTISKÉ ZJIŠŤOVÁNÍ, ZÁKLADNÍ STATISTICKÉ POJMY Organizace (zpravodajská jednotka) provádějí různé druhy statistického zjišťování z důvodu: vlastní

Více

10. Předpovídání - aplikace regresní úlohy

10. Předpovídání - aplikace regresní úlohy 10. Předpovídání - aplikace regresní úlohy Regresní úloha (analýza) je označení pro statistickou metodu, pomocí nichž odhadujeme hodnotu náhodné veličiny (tzv. závislé proměnné, cílové proměnné, regresandu

Více

časové indexy s pohyblivým základem = řetězové indexy (koeficienty růstu)

časové indexy s pohyblivým základem = řetězové indexy (koeficienty růstu) ndexní analýza je statistická metoda sloužící ke srovnání a analyzování ekonomických (a jiných) jevů pomocí indexních čísel index - bezrozměrné číslo, které popisuje časové, věcné nebo prostorové srovnání

Více

VÝVOJ INDEXŮ SPOTŘEBITELSKÝCH CEN

VÝVOJ INDEXŮ SPOTŘEBITELSKÝCH CEN ČESKÁ ZEMĚDĚLSKÁ UNIVERZITA V PRAZE Fakulta provozně ekonomická Katedra statistiky Studijní obor: Veřejná správa a regionální rozvoj Teze k diplomové práci VÝVOJ INDEXŮ SPOTŘEBITELSKÝCH CEN Vypracovala:

Více

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13 Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test

Více

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA 2018 4. dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Typy proměnných nominální (nominal) o dvou hodnotách lze říci pouze

Více

Statistické metody uţívané při ověřování platnosti hypotéz

Statistické metody uţívané při ověřování platnosti hypotéz Statistické metody uţívané při ověřování platnosti hypotéz Hypotéza Domněnka, předpoklad Nejčastěji o rozdělení, středních hodnotách, závislostech, Hypotézy ve vědeckém výzkumu pracovní, věcné hypotézy

Více

1 Indexy a časové řady. 1.1 Srovnávání ukazatelů, indexy

1 Indexy a časové řady. 1.1 Srovnávání ukazatelů, indexy 1 Indexy a časové řady 1.1 Srovnávání ukazatelů, indexy Pojem statistický ukazatel se používá zejména v ekonomické statistice jako synonymum pro statistický znak. Tento pojem je používán jak pro statistické

Více

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com) Testování statistických hypotéz Testování statistických hypotéz Princip: Ověřování určitého předpokladu zjišťujeme, zda zkoumaný výběr pochází ze základního souboru, který má určité rozdělení zjišťujeme,

Více

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie ZS 2015/16 Cvičení 7: Časově řady, autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Časové řady Data: HDP.wf1

Více

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012 Tutoriál č. 4: Exploratorní analýza Jan Kracík jan.kracik@vsb.cz Statistika věda o získávání znalostí z empirických dat empirická

Více

MATURITNÍ TÉMATA Z MATEMATIKY

MATURITNÍ TÉMATA Z MATEMATIKY MATURITNÍ TÉMATA Z MATEMATIKY 1. Základní poznatky z logiky a teorie množin Pojem konstanty a proměnné. Obor proměnné. Pojem výroku a jeho pravdivostní hodnota. Operace s výroky, složené výroky, logické

Více

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) 1) Význam a využití statistiky v biologických vědách a veterinárním lékařství ) Rozdělení znaků (veličin) ve statistice 3) Základní a

Více

odpovídá jedna a jen jedna hodnota jiných

odpovídá jedna a jen jedna hodnota jiných 8. Regresní a korelační analýza Problém: hledání, zkoumání a hodnocení souvislostí, závislostí mezi dvěma a více statistickými znaky (veličinami). Typy závislostí: pevné a volné Pevná závislost každé hodnotě

Více

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D. Zpracování náhodného výběru popisná statistika Ing. Michal Dorda, Ph.D. Základní pojmy Úkolem statistiky je na základě vlastností výběrového souboru usuzovat o vlastnostech celé populace. Populace(základní

Více

Úvod do analýzy rozptylu

Úvod do analýzy rozptylu Úvod do analýzy rozptylu Párovým t-testem se podařilo prokázat, že úprava režimu stravování a fyzické aktivity ve vybrané škole měla vliv na zlepšené hodnoty HDLcholesterolu u školáků. Pro otestování jsme

Více

MATEMATIKA III V PŘÍKLADECH

MATEMATIKA III V PŘÍKLADECH VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA STROJNÍ MATEMATIKA III V PŘÍKLADECH Cvičení 10 Mgr. Petr Otipka Ostrava 01 Mgr. Petr Otipka Vysoká škola báňská Technická univerzita Ostrava ISBN

Více

Základní statistické charakteristiky

Základní statistické charakteristiky Základní statistické charakteristiky Základní statistické charakteristiky slouží pro vzájemné porovnávání statistických souborů charakteristiky = čísla, pomocí kterých porovnáváme Základní statistické

Více

Lineární regrese. Komentované řešení pomocí MS Excel

Lineární regrese. Komentované řešení pomocí MS Excel Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních

Více

4. Aplikace matematiky v ekonomii

4. Aplikace matematiky v ekonomii 4. Aplikace matematiky v ekonomii 1 Lineární algebra Soustavy 1) Na základě statistických údajů se zjistilo, že závislost množství statku z poptávaného v průběhu jednoho týdne lze popsat vztahem q d =

Více

Cvičení 12: Binární logistická regrese

Cvičení 12: Binární logistická regrese Cvičení 12: Binární logistická regrese Příklad: V roce 2014 konalo státní závěrečné zkoušky bakalářského studia na jisté fakultě 167 studentů. U každého studenta bylo zaznamenáno jeho pohlaví (0 žena,

Více

Popisná statistika kvantitativní veličiny

Popisná statistika kvantitativní veličiny StatSoft Popisná statistika kvantitativní veličiny Protože nám surová data obvykle žádnou smysluplnou informaci neposkytnou, je žádoucí vyjádřit tyto ve zhuštěnější formě. V předchozím dílu jsme začali

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y β ε Matice n,k je matice realizací. Předpoklad: n > k, h() k - tj. matice je plné hodnosti

Více

Neuronové časové řady (ANN-TS)

Neuronové časové řady (ANN-TS) Neuronové časové řady (ANN-TS) Menu: QCExpert Prediktivní metody Neuronové časové řady Tento modul (Artificial Neural Network Time Series ANN-TS) využívá modelovacího potenciálu neuronové sítě k predikci

Více

Číselné charakteristiky

Číselné charakteristiky . Číselné charakteristiky statistických dat Průměrný statistik se během svého života ožení s 1,75 ženami, které se ho snaží vytáhnout večer do společnosti,5 x týdně, ale pouze s 50% úspěchem. W. F. Miksch

Více

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA... 2 2. Sylabus pro předmět STATISTIKA... 3 3. Pomůcky... 7

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA... 2 2. Sylabus pro předmět STATISTIKA... 3 3. Pomůcky... 7 Inovace předmětu STATISTIKA Obsah 1. Inovace předmětu STATISTIKA... 2 2. Sylabus pro předmět STATISTIKA... 3 3. Pomůcky... 7 1 1. Inovace předmětu STATISTIKA Předmět Statistika se na bakalářském oboru

Více

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1 Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu

Více

4ST201 STATISTIKA CVIČENÍ Č. 10

4ST201 STATISTIKA CVIČENÍ Č. 10 4ST201 STATISTIKA CVIČENÍ Č. 10 regresní analýza - vícenásobná lineární regrese korelační analýza Př. 10.1 Máte zadaný výstup regresní analýzy závislosti závisle proměnné Y na nezávisle proměnné X. Doplňte

Více

Cvičící Kuba Kubina Kubinčák Body u závěrečného testu

Cvičící Kuba Kubina Kubinčák Body u závěrečného testu 1. Příklad U 12 studentů jsme sledovali počet dosažených bodů na závěrečném testu (od 0 do 60). Vždy 4 z těchto studentů chodili k jednomu ze 3 cvičících panu Kubovi, panu Kubinovi, nebo panu Kubinčákovi.

Více

Analýza dat na PC I.

Analýza dat na PC I. CENTRUM BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita Analýza dat na PC I. Popisná analýza v programu Statistica IBA výuka Základní popisná statistika Popisná statistika

Více

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK. ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz PŘEHLED TESTŮ rozdělení normální spojité alternativní / diskrétní

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Pearsonův korelační koeficient

Pearsonův korelační koeficient I I.I Pearsonův korelační koeficient Úvod Předpokládejme, že náhodně vybereme n objektů (nebo osob) ze zkoumané populace. Často se stává, že na každém z objektů měříme ne pouze jednu, ale několik kvantitativních

Více

Statistika (KMI/PSTAT)

Statistika (KMI/PSTAT) Statistika (KMI/PSTAT) Cvičení dvanácté aneb Regrese a korelace Statistika (KMI/PSTAT) 1 / 18 V souboru 25 jedinců jsme měřili jejich výšku a hmotnost. Výsledky jsou v tabulce a grafu. Statistika (KMI/PSTAT)

Více

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY zhanel@fsps.muni.cz ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY METODY DESKRIPTIVNÍ STATISTIKY 1. URČENÍ TYPU ŠKÁLY (nominální, ordinální, metrické) a) nominální + ordinální neparametrické stat. metody b) metrické

Více

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III Vysoká škola báňská - Technická univerzita Ostrava 27. listopadu 2017 Typy statistických znaků (proměnných) Typy proměnných: Kvalitativní proměnná (kategoriální, slovní,... ) Kvantitativní proměnná (numerická,

Více

12. cvičení z PST. 20. prosince 2017

12. cvičení z PST. 20. prosince 2017 1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace

Více

Technická univerzita v Liberci

Technická univerzita v Liberci Technická univerzita v Liberci Ekonomická fakulta Analýza výsledků z dotazníkového šetření Jména studentů: Adam Pavlíček Michal Karlas Tomáš Vávra Anna Votavová Ročník: 2015/2016 Datum odevzdání: 13/05/2016

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy

Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy Relativní riziko a poměr šancí Princip korelace dvou náhodných veličin Korelační koeficienty Pearsonůva Spearmanův Korelace a kauzalita

Více

Renáta Bednárová STATISTIKA PRO EKONOMY

Renáta Bednárová STATISTIKA PRO EKONOMY Renáta Bednárová STATISTIKA PRO EKONOMY ZÁKLADNÍ STATISTICKÉ POJMY Statistika Statistický soubor Statistická jednotky Statistický znak STATISTIKA Vědní obor, který se zabývá hromadnými jevy Hromadné jevy

Více

4ST201 STATISTIKA CVIČENÍ Č. 7

4ST201 STATISTIKA CVIČENÍ Č. 7 4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické

Více

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé. 1. Korelační analýza V životě většinou nesledujeme pouze jeden statistický znak. Sledujeme více statistických znaků zároveň. Kromě vlastností statistických znaků nás zajímá také jejich těsnost (velikost,

Více