Vysoká škola ekonomická v Praze
|
|
- Bohumír Horáček
- před 8 lety
- Počet zobrazení:
Transkript
1 Vysoká škola ekonomická v Praze Fakulta managementu v Jindřichově Hradci D i p l o m o v á p r á c e Pavel Jauker 8
2 Vysoká škola ekonomická v Praze Fakulta managementu Jindřichův Hradec D i p l o m o v á p r á c e Pavel Jauker 8
3 Vysoká škola ekonomická v Praze Fakulta managementu v Jindřichově Hradci Katedra informatiky Modelování sociální situace domácností v Čechách a na Slovensku Vypracoval: Pavel Jauker Vedoucí diplomové práce: RNDr. Jitka Bartošová, Ph.D. České Budějovice, duben 8
4 Prohlášení Prohlašuji, že diplomovou práci na téma»modelování sociální situace domácností v Čechách a na Slovensku«jsem vypracoval samostatně. Použitou literaturu a podkladové materiály uvádím v přiloženém seznamu literatury. České Budějovice, duben 8 podpis studenta
5 Anotace Modelování sociální situace domácností v Čechách a na Slovensku Diplomová práce je zaměřena na modelování příjmů českých a slovenských domácností v závislosti na vybraných společensko-ekonomických a demografických faktorech (oporou práce budou informace zveřejňované Českým statistickým úřadem a jeho slovenským protějškem). duben 8
6 Poděkování Za cenné rady, náměty a inspiraci bych chtěl poděkovat RNDr. Jitce Bartošové, Ph.D. z Vysoké školy ekonomické v Praze, Fakulty managementu v Jindřichově Hradci.
7 Obsah Úvod Sociální situace občana po roce Růst mzdových nerovností a určující faktory Celková nerovnost Návratnost vzdělání Mzdy podle odvětví Demografické a kvalifikační vlivy Vnímání nerovnosti občany 5 1. Příjmová nerovnost domácností Změny v příjmech domácností Struktura příjmů a příčiny nerovnosti 7 Statistická teorie Zpracování statistických dat 8. Rozdělení příjmů domácností 9.3 Ukazatele vlastností rozdělení Momentové a kvantilové charakteristiky rozdělení 1.3. Ukazatele polohy Ukazatele variability Charakteristiky tvaru rozdělení 15.4 Rozdělení náhodné veličiny 17.5 Pravděpodobnostní modelování rozdělení Grafické metody 18.6 Spojitá rozdělení Normální rozdělení 1.6. Logaritmicko normální rozdělení Paretovo rozdělení.6.4 Weibullovo rozdělení Gama rozdělení 4.7 χ test dobré shody 4.8 Odhady parametrů základního modelu Metoda maximální věrohodnosti 6.8. Metoda momentů Metoda kvantilů 8
8 3 Data Mikrocenzus ČR 3 3. Mikrocenzus SR Silc ČR Silc SR Použité programy Microsoft Excel 3 4. Statgraphics 3 5 Praktická část Analýza a modelování celkových příjmů domácností v České Republice za rok Analýza a interpretace kvantilových grafů Statistické ukazatele Modelování jednoduchými pravděpodobnostními funkcemi Analýza a modelování celkových příjmů domácností ve Slovenské republice za rok Analýza a interpretace kvantilových grafů Statistické ukazatele Modelování jednoduchými pravděpodobnostními funkcemi Analýza a modelování příjmů na jednoho člena domácnosti v České republice za rok Analýza a interpretace kvantilových grafů Statistické ukazatele Modelování jednoduchými pravděpodobnostními funkcemi Analýza a modelování příjmů na jednoho člena domácnosti ve Slovenské republice za rok Analýza a interpretace kvantilových grafů Statistické ukazatele Modelování jednoduchými pravděpodobnostními funkcemi Tříparametrické lognormální rozdělení Tříparametrické lognormální rozdělení pro příjmy domácností v České republice za rok Tříparametrické lognormální rozdělení pro příjmy domácností ve Slovenské republice za rok Tříparametrické lognormální rozdělení pro příjmy na jednoho člena domácnosti v České republice za rok Tříparametrické lognormální rozdělení pro příjmy na jednoho člena domácnosti ve Slovenské republice za rok 3 89
9 5.6 Dvouparametrické Paretovo rozdělení Dvouparametrické Paretovo rozdělení pro příjmy domácností v České republice za rok Dvouparametrické Paretovo rozdělení pro příjmy domácností ve Slovenské republice za rok Dvouparametrické Paretovo rozdělení pro příjmy na jednoho člena domácnosti v České republice za rok Dvouparametrické Paretovo rozdělení pro příjmy na jednoho člena domácnosti ve Slovenské republice za rok Modelování celkových příjmů domácností podle počtu členů domácnosti Modelování celkových příjmů domácností v ČR podle počtu členů domácnosti za rok Modelování celkových příjmů domácností v SR podle počtu členů domácnosti za rok Modelování celkových příjmů domácností ve Slovenské republice za rok 3 podle sociálních skupin Zaměstnanci Samostatně činní Nezaměstnaní Důchodci Ostatní Silc Modelování celkových příjmů domácností v ČR podle počtu členů domácnosti za rok Modelování příjmů na člena domácnosti v ČR za rok Modelování celkových příjmů domácností v SR podle počtu členů domácnosti za rok Modelování příjmů na člena domácnosti v SR za rok 5 17 Závěr...19 Literatura...13 Přílohy
10 Úvod Tématem mé diplomové práce je modelování sociální situace domácností v Čechách a na Slovensku. Sociální situace je velmi široký pojem. V širším pojetí je možné ji charakterizovat jakou souhrn všech životních podmínek, a to jak hmotných, tak společenských. Podle této definice je však velmi obtížné ji kvantifikovat. Proto se při statistické analýze životní úrovně používají pouze měřitelné složky. Nejčastěji se pak využívá příjmů obyvatel. Výběr příjmů obyvatel právě těchto dvou zemí není náhodou. Po roce 199 můžeme sledovat v Československu první známky nerovnoměrného rozdělování důchodů. Důvodem byla transformace na plně tržní ekonomický systém. Po padesáti letech stability v rozdělování příjmů se začínají objevovat nerovnosti zapříčiněné tržními principy. Během této transformace se do popředí dostává otázka ekonomických nerovností. Tyto změny mají samozřejmě za následek narušení stability statistických modelů a z nich plynoucích závěrů. Ekonomická reforma přinesla mnohým lidem finanční potíže, některým dokonce chudobu, což způsobilo v otázce nerovnosti velmi citlivé téma. Nejnižší příjmy jsou sice zabezpečeny zavedením minimální mzdy, ale čím dál tím více rostou nejvyšší příjmy, což je způsobeno možností soukromého podnikání a přílivem silných zahraničních firem a jejich kapitálu. Privatizace, restituce a soukromé podnikání tyto sociální rozdíly ještě zvyšují. Velice zajímavé jsou údaje z výzkumu Ekonomická očekávání a postoje organizovaným týmem pro socioekonomii Sociologického ústavu AV ČR. Na otázku: Rozdíly ve mzdách a platech by se měly zvětšovat odpovědělo určitě ano v květnu ,8% dotázaných, zatímco v listopadu 1994 to bylo už jen 18,9%. Transformace nepřinesla pouze nerovnosti v rozdělování důchodů. V počátcích docházelo také k poklesu reálných příjmů, což bylo zapříčiněno uvolněním cen. Tento stav trval však jen krátkou dobu a již od roku 199 začaly mzdy opět růst rychleji než inflace, což trvá do dnešní doby. V roce 1993 se bývalé Československo rozdělilo na dva samostatné státy Českou a Slovenskou republiku, což znamenalo i vznik dvou nových a nezávislých ekonomik. To samozřejmě vedlo k odlišným ekonomickým reformám, odlišným makroekonomickým 1
11 ukazatelům a tudíž i k odlišným příjmům obyvatel. Příjmy obyvatel obou zemí budou vstupními daty pro vypracování mé diplomové práce, jelikož znalost jejich rozdělení, a tedy i možnost jejich porovnání z různých sociálně-ekonomických a časově prostorových hledisek, je východiskem pro posouzení životní úrovně. Ve své teoretické práci uvedu nejen statistickou teorii, kterou pak použiji pro zpracování praktické části, ale také se pokusím vystihnout sociální situaci občanů po roce Cílem praktické části je nalézt vhodné pravděpodobnostní modely příjmových rozdělení pro jednotlivé sociální skupiny i pro obyvatelstvo jako celek, bez ohledu na sociální skupinu. Pro nalezení vhodného modelu je možné si vybrat ze dvou cest. Využít hodnoty distribuční funkce nebo kvantilové funkce (případně jejich derivace). Já jsem si vybral první možnost. Ve své práci však využiji i kvantilových funkcí, zejména při zjišťování vhodnosti modelu pomocí Q- Q grafů. Na základě relativních ukazatelů porovnám některé údaje v České a Slovenské republice. To však jen tam, kde výsledky budou mít dostatečnou vypovídací schopnost. Problém v tomto případě je totiž v různých měnách, kupních silách a různých letech pozorování. Vstupními daty pro mě budou statistická šetření z Českého a Slovenského statistického úřadu. Konkrétně jde o statistické šetření Mikrocensus a Silc.
12 1 Sociální situace občana po roce 1989 Jelikož sociální situace a tedy i životní úroveň velmi závisí na příjmech obyvatel, objasním v této části práce situaci na pracovním trhu po roce 1989 a s ní spjaté zvyšování nerovnosti v oblasti příjmů jednotlivců i domácností. 1.1 Růst mzdových nerovností a určující faktory Československo za socialismu patřilo mezi země s nejmenšími mzdovými rozdíly nejen v Evropě, ale i ve světě. To bylo zapříčiněno zakořeněnými rovnostářskými tradicemi a později zejména politicko-ekonomickým tlakem socialistického systému. V tržní ekonomice lze žádoucí nerovnost vyjádřit funkcionální triádou vzdělání, profese a příjmu. Kvalifikace pracovníka by měla odpovídat vykonávané profesi a její význam by se zase měl promítnout do odpovídající příjmové úrovně. 1 Příjmová nerovnost přispívá k optimální alokaci práce a podmiňuje ekonomickou efektivnost a růst. Ekonomická reforma sice liberalizovala trh práce, ale zpočátku však zůstaly průměrné mzdy ve výrobním sektoru pod státní kontrolou prostřednictvím mzdové regulace. Tato mzdová regulace se týkala podniků s více než 5 zaměstnanci, které musely v případě překročení stanoveného limitu průměrné nominální mzdy zaplatit sankční odvody. To zapříčinilo, že v roce 1991 sice rostla nominální mzda, ale reálná poklesla o 6%. V roce 199 došlo k další liberalizaci a už rostla i reálná mzda a to o 1%. Úplná regulace mezd byla zrušena v polovině roku Mzdové chování se nijak dramaticky nezměnilo. Se zahájením transformace se otevřely nové zdroje nerovnosti v odměňování, a to lepším ohodnocením dovedností, manažerské odpovědnosti, nasazování rizika a celkové výkonnosti pracovníka Také nové příležitosti, které přinesl tržní systém přispěl k příjmovému vzestupu 1 J. Večerník, Občan a tržní ekonomika, str. 41 J. Večerník, Občan a tržní ekonomika, str. 46 3
13 mnoha pracovníků. Zde můžeme zařadit možnost soukromého podnikání, zaměstnání v zahraničí nebo u západních společností. Velice důležité je také odpovědět na otázky, jak se změnilo postavení nejvyšších a nejnižších příjmových kategorií. Možná ještě důležitější je ukázat měnící se váhu faktorů mzdové diferenciace, jako jsou rozdíly mezi muži a ženami, věkové rozpětí, návratnost lidského kapitálu a změny ve mzdách podle odvětví. Nezanedbatelné jsou však také demografické a vzdělanostní ukazatele Celková nerovnost Po roce 199 se nerovnost výdělků zvětšuje. Zhoršuje se relace nejnižších příjmů vůči průměru a naopak příjmový vrchol roste výrazně. Otevření prostoru pro vysoké výdělky a platové možnosti soukromého sektoru tedy vyvolaly u nejvyšší jedné desetiny odměňovaných výrazný posun. 3 To způsobilo celkové rozšíření mzdového rozpětí v krajních hodnotách Návratnost vzdělání Do roku 1989 nebyla životní úroveň téměř diferencována podle vzdělání dospělých členů. Transformace přinesla příležitosti především pro osoby s nižším vzděláním. A to především díky ohromnému rozvoji služeb a stavebnictví. Teprve až v druhém plánu přinesla lepší zhodnocení vyšších stupňů vzdělání. Velký zvrat však přineslo šetření v roce Podle tohoto výzkumu získávají středoškolsky vzdělaní 15% průměrné mzdy a vysokoškolsky vzdělaní dokonce 17% průměrné mzdy Mzdy podle odvětví Po roce 1989 došlo výrazným změnám v oblasti mezd. K relativnímu poklesu mezd vůči průměru došlo v zemědělství, průmyslu a dopravě. K nejdynamičtějšímu růstu mezd došlo v obchodu a zásobování. Nejviditelnější byl strmý růst mezd finančního sektoru. 4 3 J. Večerník, Občan a tržní ekonomika, str J. Večerník, Občan a tržní ekonomika, str. 51 4
14 1.1.4 Demografické a kvalifikační vlivy Během transformace se také změnil poměr demografických a kvalifikačních vlivů. Těsně před transformací vysvětlovaly pohlaví a věk dohromady 36% rozdílu ve mzdách, zatímco vzdělání pouze 8%. V roce 199 už byl však vliv pohlaví a věku 19%, zatímco vliv vzdělání vzrostl na 1% Vnímání nerovnosti občany Za socialismu byla mzdová rovnost předmětem nespokojenosti. Avšak souhlas s rostoucími příjmovými rozdíly po transformaci rychle vyprchává. Od roku 199 do roku 1996 se rozpětí mezi deseti procenty nejnižších a nejvyšších výdělků zvýšilo zhruba o polovinu. Ochota občanů přijmout toto rostoucí rozpětí poklesla z 9% na 45%. Je pochopitelné, že lidé vzdělanější a podnikatelé považují tuto změnu za sociálně spravedlivější. 1. Příjmová nerovnost domácností Samozřejmě nelze předpokládat, že nerovnost v příjmech domácností se bude odvíjet pouze od příjmů jednotlivců. Působí zde i další faktory. Celkový příjem domácností ovlivňují například příjmy ze zaměstnání dalších členů, společné rodinné prostředky, daně a sociální dávky. Poslední dva jmenované faktory působí jako vyrovnávací prostředek mzdových rozdílů. Sociální dávky mají nárok čerpat většinou domácnosti s nižším příjmem a mzdové daně jsou v České Republice zatím nastaveny progresivně. Mluví se však o rovné dani, která by podle mého názoru příjmovou nerovnost domácností zvýšila. Dalším faktorem který ovlivňuje celkový rodinný příjem je bezpochyby velikost a složení domácností z hlediska poměru aktivních a závislých členů. Proto je důležité si ujasnit s jakými údaji pracovat. Pro srovnatelné vystižení životní úrovně domácností je proto vhodnější uvažovat nikoli jejich celkový příjem, ale přepočtený na osobu. V zájmu vystižení domácnosti jako ekonomické jednotky je naopak vhodnější ukazatel jejího celkového příjmu. 5 5 J. Večerník, Občan a tržní ekonomika, str. 66 5
15 Jak jsem uvedl v předchozí kapitole, po transformaci se výrazně změnila struktura mezd, což nepochybně vedlo i ke změnám nerovnosti v příjmech domácností, a to bylo dáno právě nestejným vzestupem různých skupin obyvatelstva. Určité skupiny obyvatelstva v novém tržním prostředí získávají, jiní zase ztrácejí. Tak vzniká nové společenské rozvrstvení. Období transformace je velmi příznivé pro dosahování mimořádně vysokých příjmů a zakládání rozsáhlých majetků Změny v příjmech domácností Transformace umožnila nejen větší rozdíly z pracovních příjmů, ale také umožnila a posílila váhu i jiných příjmových zdrojů pocházející z majetku a finančních operací. Změna režimu zapříčinila i změnu metodiky statistických šetření. V Mikrocensech za socialismu byly částky mezd a důchodů sdělovány zaměstnavateli. Tato metodika byla se vznikem soukromého sektoru změněno. Již v Mikrocensu 199 byly všechny příjmy sděleny samotnými respondenty, což zvětšuje i možnost jejich zkreslení. Je možno předpokládat, že výše nepřiznaných příjmů bude větší u osob nacházející se ve vrchní části příjmového žebříčku. Zavedení a zvýšení minimální mzdy, opakovaná valorizace důchodů a státní podpora pro děti a rodiny způsobilo to, že postavení domácností v nejnižší příjmové skupině zůstalo ve vztahu k průměru po transformaci v zásadě stejné. Rozpětí rodinných příjmů se rozšířilo hlavně ve prospěch domácností v nejvyšší příjmové skupině. S ohledem na tyto dvě fakta se postavení rodin ve střední příjmové skupině vůči průměru zhoršilo. Výrazná státní intervence ve prospěch nízkopříjmových domácností zajistila udržení pouze jejich relativního postavení vůči průměru. Naproti tomu rodinám v nejvyšší příjmové kategorii se dostalo i výrazně většího dílu absolutního objemu úhrnných příjmů, čímž se výrazně posílila jejich koupěschopnost. 7 6 J. Večerník, Občan a tržní ekonomika, str J. Večerník, Občan a tržní ekonomika, str. 7 6
16 1.. Struktura příjmů a příčiny nerovnosti Privatizace a otevření trhů vedly ke značným změnám ve struktuře příjmů domácností. 8 Podíl příjmů z mezd v úhrnných příjmech obyvatelstva poklesl a na druhé straně vzrostl podíl ostatních příjmů. Hlavní díl těchto ostatních příjmů patří příjmům z podnikání a ze zahraničí. Mezi další složky bychom mohli zařadit například přijaté půjčky, úroky z vkladů, pojistné platby, dary nebo dokonce stipendia. Významnou změnu přineslo zavedení nového systému sociálních dávek a daní v roce Daň ze mzdy byla nahrazena daní z příjmu fyzických osob a o dva roky později byl zaveden nový systém sociálních dávek. Jaké byly výsledky této změny? Průměrné daňové zatížení zůstává stejné, ale změnil se přerozdělovací vliv. V porovnání s minulostí získávají mladé bezdětné páry a páry a rodiny se čtyřmi a více dětmi. Naopak ztrácejí rodiny s jedním dítětem nebo s jedním rodičem. Tyto změny měly za úkol k příjmovému vzestupu nižších příjmových skupin. Po transformaci se snížil vliv počtu ekonomicky aktivních osob na výši celkového příjmu domácnosti a snížil se i vliv věku hlavy rodiny. To znamená, že se zvýšily příjmy nejmladších domácností, zatímco příjmy nejstarších skupin poklesly. Naopak rostl význam vzdělání hlavy rodiny a velikost obce. V nerovnosti příjmu přepočteného na spotřební jednotku je nejpatrnější změnou zmenšující se význam počtu nezaopatřených dětí a věku hlavy rodiny. Podobně jako v případě celkového příjmu domácností platí i pro přepočtený příjem, že vliv vzdělání hlavy rodiny a také velikosti obce se zvyšuje. 9 8 J. Večerník, Občan a tržní ekonomika, str J. Večerník, Občan a tržní ekonomika, str. 76 7
17 Statistická teorie Statistika je velmi důležitou vědní disciplínou, která je založená na práci s daty. Mezi hlavní fáze patří sběr dat, jejich následné zpracování a shrnutí výsledků potřebné pro kvalifikovaná rozhodnutí. Počátky statistiky sahají až do starověkých říší, kde se jednalo o různé soupisy obyvatelstva využívané primárně pro daňové účely. Od počátku. století se statistika rychle rozvíjela již jako samostatná vědní disciplína. K její další akceleraci od 7. let nepochybně přispěl také rychlý rozvoj výpočetní techniky a vznik statistického výpočetního prostředí, bez kterého je dnes moderní statistická analýza nemyslitelná. 1 Je nesporné, že význam statistiky v současném světe a hlavně v ekonomice je značný. Mimořádně významná role je připisována statistice, která poskytuje soustavu číselných informací o národním hospodářství. Realizace kvalitních a úspěšných ekonomických reforem není možná bez kvalitní statistiky a existence ekonomů nemajících specializované statistické vzdělání. Tato vědní disciplína je však potřebná např. i v procesu tvorby manažerských rozhodnutí, analýz trhu nebo managementu jakosti. Ani já se ve své praktické části neobejdu bez některých statistických metod, a proto se je pokusím definovat a vysvětlit v této teoretické části mé práce. [3].1 Zpracování statistických dat Výsledkem statistického šetření je většinou velké množství číselných údajů, které jsou nepřehledné a na první pohled nám nic nenapoví. Podmínkou vzniku charakteristických rysů a zákonitostí zkoumaného datového souboru je jejich setřídění. Tříděním tedy rozumíme rozdělení jednotek souboru do takových skupin, aby co nejlépe vynikly charakteristické vlastnosti zkoumaných jevů. 11 Třídění pouze podle obměn jednoho statistického znaku, čili 1 Richard Hindls, Stanislava Hronová, Jan Seger, Jakub Fischer, Statistika pro ekonomy, Praha, Professional Publishing, 6, str Richard Hindls, Stanislava Hronová, Jan Seger, Jakub Fischer, Statistika pro ekonomy, Praha, Professional Publishing, 6, str. 17 8
18 jedné vlastnosti, se nazývá jednostupňové třídění. Třídění podle více statistických znaků najednou se nazývá vícestupňové. [3]. Rozdělení příjmů domácností K účelům statistického zkoumání příjmových rozdělení máme k dispozici pestrou škálu statistických metod a matematických i grafických postupů, které jsou dobře prozkoumány a propracovány jak po stránce teoretické, tak po stránce jejich praktického využití. 1 Vlastnosti rozdělení příjmů lze popsat pomocí různých typů charakteristik. Pro vystižení empirického rozdělení máme možnost využít řadu grafických a matematických postupů. A konečně empirické rozdělení, které je mnohdy značně složité, můžeme aproximovat jednoduchými teoretickými modely a tím si usnadnit popis aktuálního stavu rozdělení i jeho predikci do budoucna Ukazatele vlastností rozdělení Mezi hlavní vlastnosti každého rozdělení náhodné proměnné podle Václava Čermáka [1] můžeme zařadit: polohu neboli obecnou úroveň hodnot X proměnné x variabilitu těchto hodnot, kterou můžeme chápat jako vzájemnou rozdílnost všech možných párů hodnot, nebo jako odlišnost všech hodnot od nějaké konstanty (jako konstanta se zpravidla používá některá z charakteristik polohy). stupeň šikmosti daného rozdělení, který nám přináší informaci o tom, zda hodnoty větší než průměr (popř. medián) a hodnoty menší než průměr (popř. medián) jsou od nich stejně nebo nestejně vzdáleny. stupeň špičatosti, který je v poslední době spíše nazýván kurtoza či exces. 1 Jitka Bartošová, Volba a aplikace metod analýzy stavu rozdělení příjmů domácností v České republice po roce 199, Disertační práce. Praha: Fakulta informatiky a statistiky VŠE v Praze 6 13 Jitka Bartošová, Volba a aplikace metod analýzy stavu rozdělení příjmů domácností v České republice po roce 199, Disertační práce. Praha: Fakulta informatiky a statistiky VŠE v Praze 6 9
19 .3.1 Momentové a kvantilové charakteristiky rozdělení Momentové charakteristiky jsou v dnešní době nejčastěji používanými způsobem, jak charakterizovat vlastnosti dat a identifikovat jejich rozdělení. Tyto charakteristiky, které vycházejí ze všech empirických dat, jsou často upřednostňované před kvantilovými. V posledních letech už není problém zpracovávat větší objem dat a tak můžeme najít ve více odborných pracích také kvantilové charakteristiky. Kvantilové charakteristiky, které závisí pouze na jedné či několika empirických hodnotách jsou imunní vůči extrémním hodnotám z konců rozdělení. Jsou vhodné jako doplňující pohled k momentovým charakteristikám hlavně při asymetrickém rozdělení s větším výskytem hodnot v koncích rozdělení. [4].3. Ukazatele polohy Mírou polohy se pro daný znak rozumí jednočíselná charakteristika zobecňující v jistém smyslu co možná nejlépe pozorované hodnoty Momentové charakteristiky Průměry Průměry jsou střední hodnoty ze všech jednotek statistického souboru. Průměrů existuje několik, např. aritmetický, harmonický, geometrický, kvadratický. Já ve své práci budu pracovat pouze s průměrem aritmetickým. Ze zjištěných hodnot označených x, x,... x, kde n znamená celkový počet pozorování, lze prostý aritmetický průměr vyjádřit jako 1 n 1 x = n n x i i= 1 (1).3.. Kvantilové charakteristiky Medián Medián je prostřední hodnota uspořádaného souboru. Je definován vztahem Q = x, pro n liché (),5 n+ 1 1
20 1 Q,5 = x + n x n+, pro n sudé. (3) Jeho výhodou je, že je očištěn od extrémně malých a extrémně velkých hodnot, což u rozdělení příjmů hraje významnou roli..3.3 Ukazatele variability Střední hodnoty, o kterých je psáno v předchozím odstavci v sobě shrnují informaci pouze o úrovni. Může se však stát, že rozdělení četností mají shodnou polohu, ale přesto se od sebe výrazně liší. Příkladem je následující obrázek. Obr. č. 1 převzat z knihy Statistika pro ekonomy 14 Hodnoty statistického souboru A jsou koncentrovány blíže okolo aritmetického průměru než hodnoty souboru B. To znamená, že vypovídací schopnost průměru je větší u statistického souboru A. Obecně je možné říci, že vypovídací schopnost aritmetického průměru je tím větší, čím je variabilita sledovaného souboru menší. 14 Richard Hindls, Stanislava Hronová, Jan Seger, Jakub Fischer, Statistika pro ekonomy, Praha, Professional Publishing, 6, str
21 Měr variability je celá řada. Ty míry, které charakterizují měnlivost v absolutní velikosti nazýváme mírami absolutní variability a jejích charakteristikou je, že vyjadřují variabilitu ve stejných měrových jednotkách jako sledovaný znak. Pro srovnávání variability souborů lišících se svojí úrovní jsou vhodné míry relativní variability. Ty pro změnu měří variabilitu v poměru k úrovni sledovaného znaku v souboru. Jejich výsledkem jsou bezrozměrná čísla. [3] Momentové charakteristiky Míry absolutní variability Mezi nejvýznamnější míry absolutní variability patří rozptyl, který měří současně variabilitu hodnot kolem aritmetického průměru a také variabilitu vzájemných odchylek jednotlivých hodnot znaku. Je dán vztahem s = n 1 x n ( xi x) i= 1. (4) Určitou nevýhodou rozptylu je, že vždy vyjadřuje hodnoty ve čtvercích použité měrné jednoty. Proto se variabilita často popisuje pomocí směrodatné odchylky, která je odmocninou rozptylu., tj. s x = s 1 x = n n ( xi x) i= 1. (5) [3] Míry relativní variability Jak už bylo uvedeno, míry relativní variability mají tu výhodu, že lze srovnávat variabilitu statistického znaku u dvou nebo více souborů, které se liší úrovní znaku nebo jsou vyjádřeny v jiných měrových jednotkách. Nejznámější mírou relativní variability je variační koeficient s V = x x x. (6) 1
22 Variační koeficient je tedy definován jako poměr směrodatné odchylky a aritmetického průměru. Výsledkem je bezrozměrné číslo, které po vynásobení 1, udává variabilitu v procentech. [3].3.3. Kvantilové charakteristiky Kvantilové míry variability mají obecně tu nevýhodu, že nezachycují variabilitu všech hodnot znaku a nelze je hlouběji analyzovat a rozkládat, mají však i mnoho dobrých vlastností a jsou v mnoha případech snadno interpretovatelné. 15 Míry absolutní variability mezikvartilové rozpětí: iqr = Q Q (7),75,5 Mezikvartilové rozpětí je rozdíl horního a dolního kvartilu. Jeho hodnota se využívá při výpočtu Galtonovi šikmosti a Moorsovi špičatosti. horní kvartilová diference a dolní kvartilová diference: uqd = Q Q (8),75,5 lqd = Q Q (9),5,5 Horní kvartilová diference poukazuje na rozdíl horního kvartilu od mediánu, dolní pak rozdíl mediánu od dolního kvartilu. Tyto hodnoty jsou důležité zejména pro výpočet kvantilových indexů špičatosti. Stejně tak se pro výpočet idnexů špičatosti využívá dolní a horní p- difference, která nám říká rozdíl námi zvoleného kvantilu od mediánu. dolní p-diference a horní p-diference: ld( p) = Q, 5 Q p, (1) 15 Jitka Bartošová, Volba a aplikace metod analýzy stavu rozdělení příjmů domácností v České republice po roce 199, Disertační práce. Praha: Fakulta informatiky a statistiky VŠE v Praze 6 13
23 ud( p) = Q Q (11) 1 p,5 kde Q p je p-ty kvantil a Q p kvantilové rozpětí a kvantilová odchylka: 1 je ( 1 p) - tý kvantil a p, 5 ipr( p) (1) = ud( p) + ld( p) = Q1 p Q p ipr( p) qo ( p) = (13) Kvantilové rozpětí se vypočte jako rozdíl horní a dolní p-difference. Tyto hodnoty se pak využívají při výpočtu Galtonova p-indexu šikmosti. [4] Míry relativní variability Mezi kvantilové relativní ukazatele variability se řadí relativní kvartilová odchylka, která se vypočítá podle vzorce Q,75 Q,5 Q rel =. (14) Q + Q,75, Další charakteristiky Nejjednodušší, ale i nejhrubší mírou v tomto případě je variační rozpětí. Můžeme ho definovat jako rozdíl největší a nejmenší hodnoty znaku tj. R= x max x min (15) Mezi přednosti variačního rozpětí můžeme zařadit snadnost a rychlost výpočtu a jednoduchou interpretaci. Na druhé straně jsou zde i nevýhody. Krajní hodnoty, na nichž je variační rozpětí založeno mohou být nahodilé. Výskyt jediné nahodilé extrémní hodnoty vyvolá ztrátu vypovídací schopnosti tohoto ukazatele. Další jeho nevýhodou je to, že nám neřekne nic o variabilitě hodnot uvnitř variačního rozpětí. Proto se dává přednost takovým mírám variability, které jsou závislé na variabilitě všech hodnot statistického souboru. [3] 14
24 .3.4 Charakteristiky tvaru rozdělení Ukazatele šikmosti Ukazatele šikmosti vypovídají o tom, zda jsou hodnoty statistického souboru rozloženy souměrně kolem svého středu, nebo jestli je rozdělení hodnot zešikmeno na jednu stranu. Rozeznáváme opět dva druhy ukazatelů šikmosti momentové a kvantilové. Je-li rozdělení souměrné, pak je ukazatel roven nule. Čím více je rozdělení šikmější, tím se tento ukazatel více vzdaluje od nuly. Je-li koeficient >, je rozdělení zešikmeno kladně a znamená to, že ve statistickém souboru je větší koncentrace menších hodnot oproti hodnotám vyšších než je střední hodnota. V druhém případě je to opačně. [7] Momentové charakteristiky Mezi nejpoužívanější momentové charakteristiky patří momentový koeficient šikmosti, který má tvar a x = 1 ns n ( xi x) 3 i= 1 3 (16) I přesto, že tato charakteristika má nepříznivé vlastnosti (není normovaná a je nerobustní), setkáváme se s ní nejčastěji. Kvantilové charakteristiky Kvartilová diference je dána jako qd = uqd lqd (17) a kvantilovou diferenci (p-diferenci) získáme jako pd( p) = ud( p) ld( p) = Q + Q Q. (18) 1 p p,5 Kvantilová diference se vypočte jako rozdíl horní a dolní p-diference a využívá se zejména pro výpočet Galtonovi šikmosti. 15
25 Dalšími známými kvantilovými ukazateli šikmosti jsou: Galtonova šikmost a Galtonův p-index šikmosti: pd( p) g( p) =, iqr pd( p) q *( p) =, (19), () ipr( p) Galtonova šikmost upozorňuje na zešikmení prostředních 5% hodnot. Šikmost v určitých velikostech prostřední části souboru je možné měřit Galtonovo p-indexem šikmosti. Pokud za p dosadíme,375, pak měříme šikmost 5% prostředních hodnot. Pokud,15, pak měříme šikmost pro 75% prostředních hodnot. [4].3.4. Ukazatele špičatosti Tato charakteristika udává, jaký průběh má rozdělení hodnot statistického souboru kolem zvoleného středu. Vychází se ze srovnání s normovaným normálním rozdělením. U normovaného normálního rozdělení je míra špičatosti rovna nule. Je-li u popisovaného rozdělení koeficient >, potom je toto rozdělení špičatější než normované normální rozdělení. A tedy, je-li koeficient <, je popisované rozdělení plošší než normované normální rozdělení. 16 Čím více je míra koeficientu vzdálená nule, tím je rozdělení špičatejší resp. plošší. Momentové charakteristiky momentový koeficient špičatosti: b x = 1 ns n 4 ( xi x) 3 4 x i= 1 (1) Kvantilové charakteristiky Moorsova špicatost: k = [( e e ) + ( e e )] iqr 1, () 16 M. Artlová, D. Bílková, E. Jarošová, Z. Pourová, Příklady k předmětu statistika A, Praha, OEconomica. 4 16
26 kde e...e 1 7 jsou hodnoty jednotlivých oktilů. Podle Moorsa medián, kvartilové rozpětí, Galtonův koeficient šikmosti a Moorsova špičatost ( Q, 5,iqr, g, k ) poskytují jednoduchou sumarizaci o tvaru rozdělení na bázi kvantilů, která je adekvátní Pearsonovo sumarizaci průměr, rozptyl, koeficient šikmosti a špičatosti na bázi momentových charakteristik. 17 [4].4 Rozdělení náhodné veličiny Náhodnou veličinu pokládáme za danou, pokud známe všechny její možné hodnoty a pravděpodobnosti výskytu. Zákon rozdělení náhodné veličiny je pravidlo, které říká, že každé hodnotě nebo množině hodnot z každého intervalu je přiřazena pravděpodobnost, kdy náhodná veličina nabude právě této hodnoty, nebo hodnoty z určitého intervalu. Existují čtyři způsoby funkčního definování rozdělení pravděpodobnosti náhodné proměnné. Je to: distribuční funkce funkce hustoty pravděpodobnosti kvantilová distribuční funkce kvantilová funkce hustoty. [3].5 Pravděpodobnostní modelování rozdělení Pravděpodobnostní modely rozdělení sledované veličiny umožňují jednoduchou aproximaci často značně komplikovaného výběrového rozdělení. 18 Typ modelu by měl vyplývat logicky z charakteru sledovaného znaku nebo z dlouhodobé zkušenosti. Pokud logická kritéria chybějí, je vhodné použít takovou distribuční funkci, která maximalizuje shodu empirického a 17 L ubica Sipková, Eva Sodomová, Modelovanie kvantilovými funkciami, Bratislava, Ekonóm 7, str Acta Oeconomica Pragensia, roč. 15,č. 1, 7, str. 7 17
27 teoretického rozdělení četností. Ke konstrukci pravděpodobnostních modelů lze přistupovat dvěma principiálně odlišnými způsoby. Můžeme: použít některé známé rozdělení, jako je rozdělení logaritmicko normální, Paterovo, Weibullovo, gama apod, aproximovat empirické rozdělení některou teoretickou křivkou z Pearsonova či Johnsonova systému nebo namodelovat jeho tvar vhodnou rychle konvergující řadou. 19 Při aproximaci empirického rozdělení pomocí známých rozdělení si můžeme vybrat jednu ze dvou cest vedoucích k cíli. Můžeme využít hodnoty: distribuční funkce F(x) (případně její derivace), kvantilové funkce Q(p) (popřípadě její derivace). Já ve své práci použiji prvně zmiňované známé rozdělení viz. kapitola.6. a pro aproximaci distribuční funkci, avšak méně známou a používanou kvantilovou funkci využiji při zjišťování vhodnosti modelu pomocí Q-Q grafů. [6].5.1 Grafické metody Grafické kvantilové metody Základem všech kvantilových metod jsou vzestupně seřazené empirické údaje. V dalším textu budeme vycházet z předpokladu: Příslušná i-tá p-hodnota odpovídá i-tému pořadí zjištěné hodnoty ( x i) náhodné proměnné X ve výběrovém souboru. 1 Definiční obor hodnot pro p je interval (,1). Pro systematické umístění hodnot p v tomto uvedeném intervalu a jeho rozdělení na n stejných částí, kde n znamená rozsah souboru použijeme vztah: 19 Acta Oeconomica Pragensia, roč. 15,č. 1, 7, str. 7 Acta Oeconomica Pragensia, roč. 15,č. 1, 7, str. 8 1 L ubica Sipková, Eva Sodomová, Modelovanie kvantilovými funkciami, Bratislava, Ekonóm 7, str
28 ( i,5) p= (3) n Uspořádané dvojice x i,, p i, je možno znázornit graficky jako p v závislosti na x, nebo jako x v závislosti na p. První zmíněný graf, tedy p v závislosti na x poukazuje na zvláštnosti rozmístění hodnot ve výběru. Odpovídá distribuční funkci rozdělení a ukazuje nám, jak se mění proporcionální postavení proměnné v souvislosti s její velikostí. Druhý graf, tedy x v závislosti na p odpovídá grafu kvantilové funkce. Poukazuje na to, jak se mění hodnota proměnné v závislosti na proporcionálním postavení. Kombinace těchto dvou grafů často odhalí rozdílné črty rozložení empirických hodnot a intenzitu růstu. Diferenci, tj. vzdálenost mezi sousedními hodnotami proměnné X udává rozdíl D x = xi xi 1 a D p = pi pi 1, což je rozdíl jejich p-hodnot. Pomocí těchto hodnot můžeme sestrojit další dva grafy, které poukazují na místa výskytu nejvyšších změn, posunutí D vrcholu a přiblížení konců rozdělení. Grafickým znázorněním směrnic růstu D p x vzhledem ke středu příslušné diference D, dostaneme tvar, charakterizující funkci hustoty. Nejméně x obvyklé je grafické znázornění směrnice růstu Dx vzhledem ke středu p D p D, což charakterizuje kvantilovou funkci hustoty. [4].5.1. Ostatní grafické metody K těmto grafickým kvantilovým metodám je dobré také sestrojit klasické grafy, kterými mohou být např. histogram, krabičkový diagram či polygon. Krabičkový diagram je alternativní typ grafického zobrazení, které jednoduše znázorňuje odlehlé extrémní hodnoty a poskytuje přehled o středu a rozptýlenosti dat v souboru. 3 Krabičkový diagram ukazuje hodnotu L ubica Sipková, Eva Sodomová, Modelovanie kvantilovými funkciami, Bratislava, Ekonóm 7, str Jitka Bartošová, Základy statistiky pro manažery, Oeconomica 6, str. 5 19
29 variačního rozpětí, kvantilového rozpětí, mediánu. Tento graf se vyskytuje i v různých obměnách, kdy pozorování, která lze považovat za odlehlá, či extrémní, jsou znázorněna zvláštními body. 4 Za hodnotu extrémně nízkou je považována hodnota, která odpovídá nerovnosti x< Q 1, 5iqr. Na druhé straně za,5 extrémně vysokou je považována hodnota, která splňuje nerovnost x> Q 1, 5iqr.,5 + Histogram, neboli sloupcový diagram, používáme pro grafické znázornění intervalového rozdělení četností. Šířka sloupce odpovídá šířce intervalu a jeho výška je dána zjištěnou četností. 5 Pro zjištění, kolik sloupců v histogramu vytvořit, je vhodné použít vztah kde [ ] znamená celočíselnou část [,46( 1) ],4 L = n, (4) Lorenzova křivka znázorňuje graficky stupeň příjmové nerovnosti (příjmové diferenciace). Tato grafická metoda spočívá v tom, že se vyznačí body, které odpovídají kumulativním podílům příjmů na jedné straně a kumulovaným podílům příjemců na druhé straně. 6 Lorenzovu křivku jsem sestrojil v programu Microsoft Excel. Pro kumulovaný podíl příjemců jsem použil vztah i,5 p=. (5) n Pro kumulativní podíl příjmů jsem použil vzorec i= n j x( ) = i i= 1 1 n 1 x ( i) x( i) x( j), (6) 4 Jitka Bartošová, Základy statistiky pro manažery, Oeconomica 6, str. 5 5 Jitka Bartošová, Základy statistiky pro manažery, Oeconomica 6, str. 5 6 Jiřina Moravcová, Sociální statistika, Vysoká škola ekonomická, 4, str. 7
30 kde (i) x je pořadová statistika, kde x( i) x( i+ 1)... x( n). V případě ideální rovnoměrnosti příjmů by body ležely na diagonále. To znamená, že např. 1% příjemců by se podílelo na objemu příjmů rovněž 1-ti procenty. V praxi tomu však v naprosté většině případů není, a proto se křivka prohnutě odklání od diagonály směrem dolů. [4], [5].6 Spojitá rozdělení.6.1 Normální rozdělení Parametrizované normální rozdělení se definuje vždy se dvěma parametry: s parametrem polohy, který se místo a značí zpravidla µ, a s parametrem škály, který se místo b značí zpravidla σ. 7 Toto rozdělení je charakterizováno hustotou pravděpodobnosti f X 1 ( x, µ, σ ) = e σ π ( x µ ) σ, (7) kde < x < <, µ <, < σ <, popř. distribuční funkcí F x ( x µ ) σ X ( 1 x, µ, σ ) = e dt (8) σ π Distribuční funkce, kvantilové funkce, ani funkce kvantilové hustoty nemají explicitní analytické vyjádření. Jsou vyjádřeny tabulkově. [1].6. Logaritmicko normální rozdělení V nejobecnější podobě se lognormální rozdělení definuje zpravidla se třemi parametry: s parametrem polohy (a), škály (b) a tvaru (c). Někdy se jako parametrizovaný tvar uvádí rozdělení s parametry škály a tvaru, tj. parametr polohy se položí roven nule. 8 7 Václav Čermák, Diskrétní a spojitá rozdělení, vzorce, grafy, tabulky, Praha, VŠE,
31 Funkce hustoty pravděpodobnosti je dána vztahem x a f X ( x, a, b, c) = exp (log ) π c x a c b, (9) kde x > a, < a<, b<, c> Distribuční funkce, kvantilová funkce ani funkce kvantilové hustoty nemají explicitní analytické tvary. [1].6.3 Paretovo rozdělení Rozdělení se dvěma parametry (s parametry polohy a tvaru). Funkce hustoty pravděpodobnosti je dána vztahem f X ( x, x, c) = c x x x c+ 1, (3) kde x> x >, c>, distribuční funkce má tvar F X c x ( x, x, c) = 1 x. (31) Kvantilovou funkci a funkci kvantilové hustoty lze vyjádřit jako Q U ( u, x 1/ c, c) x (1 u) = (3) q U c = x (33) 1+ 1/ c ( u, x, c) (1 u ) 8 Václav Čermák, Diskrétní a spojitá rozdělení, vzorce, grafy, tabulky, Praha, VŠE, 1993
32 Speciální, ale velmi často uváděný parametrizovaný tvar se získá volbou x = 1. Jedná se o x rozdělení definované hustotou f X ( x,1, c) = c+. 1 Střední hodnota je u takto x parametrizovaného tvaru rovněž o 1 větší. 9 [1].6.4 Weibullovo rozdělení V nejobecnější podobě se také rozdělení Weibullovo stejně jako většina ostatních definuje zpravidla se třemi parametry: s parametrem polohy (a), škály (b) a tvaru (c). Někdy se jako parametrizovaný tvar uvádí rozdělení s parametry škál a tvaru, tj. parametr polohy se předpokládá rovný nule. 3 Funkce hustoty pravděpodobnosti je dána jako f X c x a ( x, a, b, c,) = b b x a exp b c 1 c, (34) kde x a, < a<, (většinou se používá a, ), b, c> Distribuční funkce tohoto rozdělení má tvar F X c x a ( x, a, b, c) = 1 exp, x a b, (35) kvantilová funkce a funkce kvantilové hustoty: [1] 1/ c [ ln(1 u) ],< < 1 QU ( u, a, b, c) = a+ b u (36) c 1 1/ c qu ( u, a, b, c) = (1 u) [ ln(1 u) ], u 1 b (37) 9 Václav Čermák, Diskrétní a spojitá rozdělení, vzorce, grafy, tabulky, Praha, VŠE, Václav Čermák, Diskrétní a spojitá rozdělení, vzorce, grafy, tabulky, Praha, VŠE,
33 .6.5 Gama rozdělení V nejobecnější podobě se i rozdělení gama definuje zpravidla se třemi parametry: s parametrem polohy (a), škály (b) a tvaru (c). Někdy se při definování parametrizovaného tvaru zavedou jen parametr škály a parametr tvaru, tj. parametr polohy se položí roven nule. 31 Funkce hustoty pravděpodobnosti je dána obecně vztahem f 1 x a ( x, a, b, c) = bγ( c) b c 1 x a exp, b >, c> X x a b, (38) a distribuční funkce vztahem F X x a γ ( c, ) ( x, a, b, c) = b Γc (39) Kvantilové funkce ani funkce kvantilové hustoty nemají explicitní analytické tvary. Standardní tvar rozdělení gama získáme, když položíme a= a b = 1. Když položíme c= 1dostaneme rozdělení exponencionální. Je-li ve standardním tvaru c číslo přirozené, jedná se o rozdělení Erlangovo. 3 [1].7 χ test dobré shody χ testem dobré shody zjišťujeme, zda výběrový soubor pochází z populace s určitým typem rozdělení či nikoliv. 33 Tento test se vždy provádí jako oboustranný. Nulová a alternativní hypotézy jsou formulovány takto: H n i n i : = π versus H : n 1 i n π i (4) Nulová hypotéza říká, že empirické a teoretické četnosti je možné považovat za shodné. 31 Václav Čermák, Diskrétní a spojitá rozdělení, vzorce, grafy, tabulky, Praha, VŠE, Václav Čermák, Diskrétní a spojitá rozdělení, vzorce, grafy, tabulky, Praha, VŠE, Jitka Bartošová, Základy statistiky pro manažery, Oeconomica 6, str. 17 4
34 K testování nulové hypotézy se používá statistika: G= k ( n nπ ) i nπ i= 1 i i, (41) kde n i jsou absolutní četnosti výběrového rozdělení, nπ i jsou absolutní četnosti předpokládaného teoretického rozdělení. Statistika G se za platnosti H řídí χ rozdělením s ( h 1) k stupni volnosti, kde k je počet skupin, vzniklých setříděním výběru podle nějakého kritéria, a h je počet neznámých (odhadovaných) parametrů předpokládaného teoretického rozdělení. Pokud jsou všechny parametry teoretického rozdělení známé, je toto rozdělení plně specifikované a h =. 34 Jedná se o asymptotický test, a proto je potřeba dodržet podmínku, která je nutná pro dosažení dostatečné přesnosti výsledku. Tou je setřídění dat do dostatečně velkých tříd. Za dostatečně velikou třídu je považována i-tá třída, která splňuje nerovnost nπ > 5, (4) i kde π i je pravděpodobnostní obsazení i-té třídy za platnosti nulové hypotézy. Oborem nezamítání hypotézy H na hladině významnosti α je množina V { G : < G< ( k 1) }, = χ h (43) 1 α kritickým oborem je množina W { G : ( k h 1) }. χ 35 (44) = 1 α G [5] 34 Jitka Bartošová, Základy statistiky pro manažery, Oeconomica 6, str Jitka Bartošová, Základy statistiky pro manažery, Oeconomica 6, str
35 .8 Odhady parametrů základního modelu Pro odhad parametrů základního modelu existuje několik metod. Já jsem ve své práci použil tři metody. Konkrétně to je: metoda maximální věrohodnosti metoda momentů metoda kvantilů Každá z výše uvedených metod odhadu má své přednosti a nedostatky. O tom, která z nich je v dané situaci nejlepší, rozhodují vlastnosti metody odhadu a charakter výběrových souborů Metoda maximální věrohodnosti Metoda maximální věrohodnosti je jedna z nejpoužívanějších. Máme-li výběr { X,..., } 1 X n, r) ) ) r pak maximálně věrohodný odhad θ = θ,..., θ ) vektoru parametrů θ = θ,..., θ ) ( 1 k ( 1 k předpokládaného rozdělení, z něhož výběr pochází, spočívá ve vyhledání argumentu suprema r argsup L θ x1,..., x n x,..., věrohodnostní funkce (likelihood function), tj. hodnoty ( ) je realizace náhodného výběru. 37 V případě náhodného výběru { x,..., } funkce dána vztahem r, kde { } ( θ ) 1 x n 1 x n je věrohodnosti L r ( ) = n r θ x,..., x [ f ( ; θ ] 1 n x i ) i= 1. (45) Metoda maximální věrohodnosti je podle konzistentní a vydatná, avšak pro výběrové soubory s omezeným rozsahem nemusí být odhady kvalitní. Rovnice pro výpočet parametrů jednotlivých rozdělení zde neuvádím z důvodu použití statistického programu Statgraphics. 36 Jitka Bartošová, Volba a aplikace metod analýzy stavu rozdělení příjmů domácností v České republice po roce 199, Disertační práce. Praha: Fakulta informatiky a statistiky VŠE v Praze 6 37 Jitka Bartošová. Volba a aplikace metod analýzy stavu rozdělení příjmů domácností v České republice po roce 199, Disertační práce. Praha: Fakulta informatiky a statistiky VŠE v Praze 6 6
36 Tato metoda je použita u odhadů parametrů Weibullova, gama, Erlangova, jednoparametrického Paretova a dvouparametrického lognormálního rozdělení. [8].8. Metoda momentů Za předpokladu, že náhodný výběr { X,..., } r θ = X n 1 pochází z rozdělení s vektorem parametrů r) ) ) θ,..., θ ), získáme momentový odhad θ = θ,..., θ ) řešením soustavy ( 1 k µ ) ) ( 1 k r ( θ 1,..., θ k ) = m r, r = 1,,..., k, (46) ) ) r kde µ ( θ 1,..., θ ) = E( X ), r = 1,..., k je prvních k obecných teoretických momentů, r k m 1 n r r = X i n i= 1 jsou odpovídající výběrové momenty. 38 Výhodou této metody je její jednoduchost rovnic i to, že výběrové momenty jsou konzistentními odhady teoretických momentů. Na druhou stranu tyto odhady nejsou robustní a jejich vydatnost klesá s růstem variability, což může způsobovat nepřesnost odhadu. [8].8..1 Odhady parametrů dvouparametrického Paretova rozdělení Odhad parametrů tohoto modelu vychází z těchto rovnic c x = E( X) = c 1 x, pro c > 1 (47) s c = D = x, (48) [ ] ( X) = E( X ) E( X) ( c 1) ( c ) 38 Jitka Bartošová. Volba a aplikace metod analýzy stavu rozdělení příjmů domácností v České republice po roce 199, Disertační práce. Praha: Fakulta informatiky a statistiky VŠE v Praze 6 7
37 neboli c x s = D( X) = (49) c c 1 Řešením soustavy první a třetí rovnice pak dostáváme vzorec pro výpočet parametru c. parametr x pak získáme dosazením do rovnice (47). x + s c= 1+, (5) s.8.3 Metoda kvantilů Kvantilová metoda vychází ze shody teoretických a výběrových kvantilů. Hledané odhady jsou tedy kořeny soustavy Q = Q, r = 1,,..., k, Pr Pr QPr r) Q, r = 1,..., k jsou teoretické kvantily, takže platí f ( x, θ ) dx= p r kde Pr 1, Q Pr jsou odpovídající kvantily výběrové 39 Kvantilové odhady jsou jednoduché na výpočet a nevyžadují velké výběrové soubory. Další jejich výhodou je konzistentnost a robustnost. Nevýhodou je jejich malá vydatnost. [8] Odhady parametrů tříparametrického lognormálního rozdělení Kvantilová metoda byla použita k odhadu parametrů lognormálního modelu. Q = e γ, (51) µ ˆ,5 + ˆ ˆ µ + σu p Q = e + ˆ γ, (5) p 39 Jitka Bartošová. Volba a aplikace metod analýzy stavu rozdělení příjmů domácností v České republice po roce 199, Disertační práce. Praha: Fakulta informatiky a statistiky VŠE v Praze 6 8
38 9 γ σ µ ˆ 1 ˆ ˆ 1 + = + p u p e Q. (53) p u je 1.p% kvantil normovaného normálního rozdělení N(;1). [9] Po úpravě předchozích rovnic dostáváme u p u p p p e e Q Q σ σ µ ˆ ˆ 1 ln ˆ =, (54) 1,5,5 ln ˆ = p p p u Q Q Q Q σ, (55) µ γ ˆ,5 ˆ e Q =. (56)
39 3 Data Pro následující analýzu a modelování příjmových ukazatelů jsem se rozhodl použít data z Českého a Slovenského statistického úřadu. Jako nejlépe zpracované, věrohodné a pro moji práci nejužitečnější jsem zvolil údaje z podrobných statistických šetření nazvaných Mikrocensus a Silc. 3.1 Mikrocenzus ČR Účelem tohoto šetření bylo získat reprezentativní údaje o úrovni a struktuře příjmů a základní sociálně demografické charakteristiky nejen domácností, ale také jejich členů. Příjmové údaje jsou publikovány za nejmenší ekonomickou jednotku, čili domácnosti. Pro Mikrocenzus bylo vybráno 11 4 bytů, tj. zhruba,5% (v hl. m. Praze,5%) z celkové počtu trvale obydlených bytů. Za neobydlené byty se náhradní nevybírají. Jako důležité je třeba také zmínit, že výběrový plán byl založen na náhodném dvoustupňovém výběru. V průběhu šetření bylo zjištěné, že z 11 4 bytů bylo 351 bytů neobydlených. Jak je výše zmíněno, za neobydlené byty se náhradní nevybírají, proto šetření proběhlo v bytech. Jelikož se 311 bytových domácností nepodařilo vyšetřit, konečné číslo vyšetřených bytových domácností je Mikrocenzus SR 3 Při výběru bytových domácností pro Mikrocenzus 3 se použil dvojstupňový stratifikovaný systematický náhodný výběr. V prvním stupni byly vybrané jednotlivé obce. V druhém stupni se z vybraných obcí vykonal výběr bytů. Jednotkou výběru byl obývaný byt, jednotkou zjišťování byly všechny osoby, které bydlely v bytě k Jednotkou zpracování pak byla hospodařící domácnost. Rozdílem oproti českému Mikrocenzu bylo to, že pokud domácnost odmítla odpovědět na zjišťované údaje, tazatel měl možnost při dodržení 3
40 předepsaných pokynů najít náhradní domácnost. Z celkového počtu vyšetřených domácností bylo 5365 náhradních, tj. 7,4%. 3.3 Silc ČR 5 Šetření Silc ČR má velmi podobnou metodiku jako Mikrocenzus. Rozdíl je pouze v menším vzorku šetřených domácností a ve větším počtu zjišťovaných údajů. Šetření proběhlo v dubnu a květnu roku 5. Zjišťování se uskutečnilo ve všech krajích. Celkem bylo pro šetření vybráno 7 bytů. Výběrový plán byl založen na náhodném dvoustupňovém výběru pro každý kraj nezávisle tak, aby celkový počet vybraných bytů byl úměrný velikosti jednotlivých krajů. 4 Za neobydlené byty se náhradní nevybíraly. Ze 7 vybraných domácností se podařilo vyšetřit 4351, což je 64,8%. 3.4 Silc SR 5 Výběrové šetření EU SILC 5 bylo realizované na vzorku 616 domácností s použitím jednostupňového stratifikovaného výběru. Z celkového počtu 616 domácností se jich podařilo vyšetřit 5147, což je 85,5%
41 4 Použité programy 4.1 Microsoft Excel Microsoft Excel je tabulkový procesor od firmy Microsoft. Je možné ho charakterizovat jako účinný nástroj pro analýzy, sdílení a správu informací napomáhající činit informovanější rozhodnutí.tento program jsem použil, protože ho používám již několik let a mám s ním velmi dobré zkušenosti. Oproti ostatním specializovaným statistickým programům má další výhodu v jeho velké dostupnosti. Využil jsem hlavně jeho statistické funkce a grafické výstupy. 4. Statgraphics Statgraphics je specializovaný statistický program. V současné době se analýza dat v praxi provádí téměř výhradně pomocí statistického softwaru. Tento program jsem si opět vybral z důvodu jeho znalosti, jelikož při výuce statistických předmětů na fakultě managementu se používal právě tento software. Pomocí tohoto paketu lze sumarizovat a prezentovat data v podobě různých tabulek, grafů a charakteristik, hledat kvantily či hodnoty distribuční funkce nebo provádět induktivní výsledky. 41 Já jsem tento software využil zejména pro výpočet parametrů jednotlivých rozdělení, pro výpočet kvantilů, a poté při prezentaci výsledků ve formě Q-Q grafů. 41 M. Artlová, D. Bílková, E. Jarošová, Z. Pourová, Příklady k předmětu statistika A, Praha, OEconomica. 4 3
42 5 Praktická část 5.1 Analýza a modelování celkových příjmů domácností v České Republice za rok Analýza a interpretace kvantilových grafů Vstupními daty jsou celkové příjmy domácností z Mikrocenzu. Nejdříve jsem seřadil vzestupně všechny hodnoty příjmů a postupně vypočetl hodnoty ukazatelů uvedených v oddílu Pro všechny výpočty jsem použil tabulkový program Excel. Všechny následující grafické výstupy jsou vytvořeny v tomto programu. V tabulce č. 1 uvádím ukázku výsledných výpočtů. Tabulka č. 1 ukázka výpočtu pro grafickou analýzu Distribuční funkce První částí grafické analýzy budou grafy ukazující závislost p na celkových příjmech (dále jen CP) tedy znázornění distribuční funkce. 33
43 Graf č. 1 Zobrazení hodnot p v závislosti na CP domácností p 1,9,8,7,6,5,4,3,,1,5 1 1,5,5 3 3,5 4 4,5 5 5,5 Miliony CP Z grafu je možné zpozorovat velmi krátký levý konec rozdělení oproti konci pravému. To je možné zdůvodnit minimální výší mzdy, důchodu a také různými příspěvky státu osobám, které jsou v těžké sociální situaci. Naopak pravý konec je velmi dlouhý a v jeho koncích je možné vidět velké diference. Před transformací před rokem 1989 zcela určitě takové rozdíly nebyly a postupem času lze předpokládat prodlužování pravého konce. Největší hodnotu směrnice je možné najít mezi 7 až 5 tis. Kč, která poukazuje na nejvyšší pravděpodobnost hodnot v tomto intervalu. Od hodnoty 5 tis. Kč hodnoty narůstají, hodnota směrnice klesá a hodnoty jsou čím dál tím méně pravděpodobné. Pro podrobnější znázornění a důkladnější analýzu jsem sestrojil grafy jen v určitých kvantilech grafy č
44 Graf č. 1.1 a 1. Zobrazení p v závislosti na CP domácností v prvním kvartilu,5,,15 p,1, CP Závislost p na CP domácností v posledním kvartilu 1,95,9 p,85,8,75,5 1 1,5,5 3 3,5 4 4,5 5 5,5 Miliony CP Zobrazení prvního kvartilu prokázalo menší pravděpodobnost hodnot do 7 tis. Kč, ale zároveň také poukázalo na opětovný pokles směrnice od cca 1 tis. Kč, na který se zaměřím v následujícím grafu. Obrovské rozdíly v CP nám ukazuje graf č. 3. Mezi 1,5 až 5,1 mil. Kč se vešlo pouze,15% domácností. Jsou to tedy extrémní hodnoty, které budou výrazně zkreslovat např. průměr. 35
45 Graf č. 1.3 Závislost p na CP od patého do čtyřicátého percentilu,4,35,3,5 p,,15,1, CP Zobrazení od pátého do čtyřicátého percentilu je záměrné z důvodu opětovného poklesu směrnice, jak jsem naznačil výše. Graf č. 1.3 nám ukazuje menší pravděpodobnost hodnot od 1 do 16 tis. Kč. Je těžké tento fakt zdůvodnit, ale podle mého osobního názoru se v tomto intervalu nachází jednočlenné a dvoučlenné domácnosti důchodců a jednočlenné domácnosti zaměstnaných Kvantilová funkce Druhou částí grafické analýzy je výstup, který ukazuje závislost celkových příjmů na hodnotě p. Poukazuje na to, jak se mění hodnota celkových příjmů v závislosti na proporcionálním postavení. 36
46 Graf č. CP v závislosti na p CP 3 1,1,,3,4,5,6,7,8,9 1 p Graf č. nám pouze dokazuje, že pokud bychom neudělali podrobnější zobrazení v dolním intervalu, ani bychom nepostřehli levostranné zakřivení, které je opravdu extrémně krátké. Na druhé straně pravostranné zakřivení je velmi zřetelně vidět i bez detailnějšího náhledu, který už nebudu pro kvantilovou funkci dále rozvádět, jelikož by potvrdil závěry z funkce distribuční Funkce hustoty Dalším grafickým výstupem je zobrazení směrnic růstu Dp/Dx vzhledem ke středu příslušné diference Dx. Rychlost změny Dp je nejvyšší v intervalu od 8 do 5 tisíc Kč. Většina relativních přírůstků je do, % celkových příjmů. Ojediněle se v tomto intervalu objevují hodnoty dosahující až,13%. Velice zajímavé je, že větší přírůstky jsou v dolní a střední části rozdělení, zatímco u vyšších hodnot jsou přírůstky skoro nulové. Pro lepší zobrazení jsem omezil výběr Mid x do milionů Kč. 37
47 Graf č. 3 Funkce hustoty Dp/Dx,14,1,1,8,6,4,,5,5,75 1 1,5 1,5 1,75 Mid x Miliony Kvantilová funkce hustoty Posledním grafem tohoto druhu je zobrazení směrnice Dx/Dp vzhledem ke středu příslušné diference Dp (graf č. 4). Pokud se podíváme na oba konce rozdělení, je patrné, že v pravém konci jsou hodnoty relativních přírůstků o dost vyšší než v levém. Dále je možné postřehnout, že ve střední částí jsou tyto přírůstky menší a s vyšší intenzitou než v obou koncích. Proto je možné považovat rozdělení za asymetrické s prodlouženým pravým koncem. Pro lepší znázornění jsem opět omezil výběr, tentokrát na ose Y do 6. Graf č. 4 Kvantilová funkce hustoty 6 5 Dx/Dp 4 3 1,1,,3,4,5,6,7,8,9 1 Mid p 38
48 Ostatní grafické analýzy Histogram pouze potvrdil výsledky dřívějšcích analýz. Opět zde vidíme useknutou levou část rozdělení a ubývání četností s výškou čistých příjmů. Nejvíce domácností se nachází v intervalu od 15 do tis. a překvapivě druhým nejčetnějším intervalem je 5-1 tis. Kč. Podle doplňující křivky normálního rozdělení v histogramu bych se přiklonil k levostrannému zešikmení. Ale to prokážou až výpočty v následující kapitole. Pro lepší zobrazení jsem použil data čistých příjmů do 1 mil. Kč. Graf č. 5 Graf č. 6 Lorenzova křivka Lorenzova křivka % příjmů 1,9,8,7,6,5,4,3,,1,1,,3,4,5,6,7,8,9 1 % domácností 39
49 Tento graf nám ukazuje, jak se skutečná křivka rozdělení příjmů domácností v ČR odchyluje od ideální rovnoměrnosti. Můžeme zde vypozorovat, že např. 1% domácností s nejmenšími příjmy se podílí na celkových příjmech pouze ze 3,%. A % domácností s nejnižšími příjmy nedostává zdaleka ani 1% (přesně to je 7,3%). Na druhé straně 1% nejvíce vydělávajících domácností inkasuje 5% celkových příjmů. Zajímavé bude určitě srovnání s hodnotami ve SR Statistické ukazatele Tabulka č. Průměr 34, Horní kvartilová dif. 974 Medián 1993, Dolní kvartilová dif. 649 Modus 84, Galtonův koef. šikmosti, Rozptyl,91187E1 Moorsova špičatost,81 Směrodatná odchylka 1764, Galtonova p šikmost Minimum 135, p=,375,8 Maximum 5,1163E6 p=,15,51 Koeficient šikmosti 6,5763 Koeficient špičatosti 13,169 Kromě standardních charakteristik vypočítaných v programu Statgraphics Plus jsem vypočítal i méně známé kvantilové charakteristiky v programu Microsoft Excel. Z důvodu obsáhlosti těchto charakteristik uvádím jen některé jejich hodnoty, ostatní jsou uveřejněny v příloze č Interpretace charakteristik Nejnižší zjištěný příjem u 797 domácností byl 13 5 Kč, nejvyšší pak Kč. Variační rozpětí je tedy pak Kč. Tato výše je však ovlivněna extrémními příjmy a je pro nás nevypovídající. Průměrný příjem domácností za rok byl 3 4 Kč. Na průměr dosáhlo 38% domácností. Proto je reprezentativnější hodnotou medián, který činil Kč. To znamená, že přesně polovina domácností má příjem menší než je tato hodnota. Medián je tedy oproti průměru nižší o Kč. První decil má hodnotu Kč, což znamená, že 1% domácností má nižší příjem než je tato hodnota. Pokud se podíváme na opačný konec můžeme říct, že v České Republice je 1% domácností, které mají větší příjem než
50 Kč, což odpovídá devátému decilu. Směrodatná odchylka, která je Kč nám říká, že většina domácností se neodchýlila od průměru o více než tuto hodnotu v obou směrech. Koeficient šikmosti je 6,58 a je tedy kladný. Z toho můžeme usuzovat, že rozdělení není symetrické a jedná se o kladné zešikmení, což znamená, že převažují domácnosti s menšími příjmy než domácnosti s příjmy vyššími. Z vypočítané hodnoty míry špičatosti, která je 13,17 můžeme usuzovat, že rozdělení je výrazně špičatější než normované normální rozdělení. Rozdíl horního kvartilu a mediánu horní kvartilová diference (uqd = 97 4) je větší než dolní kvartilová diference (lqd = 649). Z toho vyplývá, že kvartilový podíl je větší než 1. Galtonův koeficient šikmosti je tedy pak kladný a má hodnotu, což potvrzuje kladné, pravostranné zešikmení příjmů domácností. Tento ukazatel se liší oproti výše vypočtenému koeficientu šikmosti tím, že měří zešikmení prostřední poloviny s vrcholem rozdělení. Nebere tedy v úvahu extrémní hodnoty a je přesnější. Tato velikost střední části lze měnit. Galtonova p-šikmost pro prostředních 5% hodnot (p=,375) je kladná a má hodnotu (g(p)=,8). Galtonova p-šikmost pro prostředních 75% hodnot (p=,15) má pak hodnotu (g(p)=,51) Čím větší část rozdělení bereme v úvahu, tím je Galtonův koeficient šikmosti větší. Moorsova špičatost je chápána jako vlastnost výšky vrcholu rozdělení s vyloučením vlivu konců rozdělení od dolního oktilu dolů a horního oktilu nahoru. Spočtenou nízkou hodnotu (k=,81) je tedy možné charakterizovat jako malou odlišnost špičatosti vrcholu empirického rozdělení příjmů domácností v porovnání se špičatostí normálního rozdělení. Zde je tedy možné vidět rozdíl s vypočtenou hodnotou koeficientu špičatosti z programu Statgraphics, kde tento koeficient evidentně ovlivňují odlehlé hodnoty Modelování jednoduchými pravděpodobnostními funkcemi Při hledání jednoduchého tvaru rozdělení čistých reálných ročních příjmů domácností jsem použil programy Statgraphics a Microsoft Excel. Při hledání parametrů jednotlivých rozdělení byla použita metoda maximální věrohodnosti. Poté jsem testoval shodu empirického a teoretického rozdělení pomocí χ testu a zejména pomocí grafických metod, které nám často napoví více. 41
51 Při výpočtu χ testu se vyskytla komplikace. Program Statgraphics nedovedl u většiny rozdělení tento test vypočítat.(obr. č. 1) Při tomto testu se totiž jednotlivé hodnoty seskupují do tříd a porovnává se četnost empirického rozdělení s četností s teoretickým tvarem. Program Statgraphics seskupuje třídy podle velikosti příjmu a ne podle četnosti. Pak vzniká problém, že není splněna podmínka dostatečně velkých tříd (4). Důvodem byl velký počet odlehlých hodnot, jak ukazuje krabičkový diagram. (příloha č. ). Pokusil jsem se tedy odlehlé hodnoty vyloučit a vypočítat χ test bez nich. Po té sice Statgraphics u většiny rozdělení test vypočetl, ale nebylo možné měnit počet stupňů volnosti. Jelikož byl podle mého názoru počet tříd pro tak velkou oblast hodnot příliš nízký, rozhodl jsem se vypočítat χ test dobré shody v programu Microsoft Excel. Pro počet tříd jsem použil vzorec (4). Obr. č. 1 4
veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.
Vybraná rozdělení spojitých náhodných veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Třídění Základním zpracováním dat je jejich třídění. Jde o uspořádání získaných dat, kde volba třídícího
Číselné charakteristiky a jejich výpočet
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz charakteristiky polohy charakteristiky variability charakteristiky koncetrace charakteristiky polohy charakteristiky
Statistika pro geografy
Statistika pro geografy 2. Popisná statistika Mgr. David Fiedor 23. února 2015 Osnova 1 2 3 Pojmy - Bodové rozdělení četností Absolutní četnost Absolutní četností hodnoty x j znaku x rozumíme počet statistických
Praktická statistika. Petr Ponížil Eva Kutálková
Praktická statistika Petr Ponížil Eva Kutálková Zápis výsledků měření Předpokládejme, že známe hodnotu napětí U = 238,9 V i její chybu 3,3 V. Hodnotu veličiny zapíšeme na tolik míst, aby až poslední bylo
10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.
0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti
Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III
Vysoká škola báňská - Technická univerzita Ostrava 27. listopadu 2017 Typy statistických znaků (proměnných) Typy proměnných: Kvalitativní proměnná (kategoriální, slovní,... ) Kvantitativní proměnná (numerická,
Základy popisné statistiky
Základy popisné statistiky Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 8. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 26 Obsah 1 Základy statistického zpracování dat 2
Charakteristika datového souboru
Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex
MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci
MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci Matematická statistika Matematická statistika se zabývá matematickým
Zápočtová práce STATISTIKA I
Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru
Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík
Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012 Tutoriál č. 4: Exploratorní analýza Jan Kracík jan.kracik@vsb.cz Statistika věda o získávání znalostí z empirických dat empirická
Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.
Zpracování náhodného výběru popisná statistika Ing. Michal Dorda, Ph.D. Základní pojmy Úkolem statistiky je na základě vlastností výběrového souboru usuzovat o vlastnostech celé populace. Populace(základní
STATISTICKÉ CHARAKTERISTIKY
STATISTICKÉ CHARAKTERISTIKY 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č. CZ.1.07/2.2.00/28.0021)
UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.
UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace
Číselné charakteristiky
. Číselné charakteristiky statistických dat Průměrný statistik se během svého života ožení s 1,75 ženami, které se ho snaží vytáhnout večer do společnosti,5 x týdně, ale pouze s 50% úspěchem. W. F. Miksch
Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability
I Přednáška Statistika Diskrétní data Spojitá data Charakteristiky polohy Charakteristiky variability Statistika deskriptivní statistika ˆ induktivní statistika populace (základní soubor) ˆ výběr parametry
1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou
Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1
Náhodná proměnná Náhodná proměnná může mít rozdělení diskrétní (x 1, x 2,,x n ) spojité () Poznámky: 1. Fyzikální veličiny jsou zpravidla spojité, ale změřené hodnoty jsou diskrétní. 2. Pokud
TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce Statistický rozbor dat z dotazníkového šetření školní zadání Skupina: 51 Vypracovaly: Pavlína Horná, Nikola Loumová, Petra Mikešová,
Charakterizace rozdělení
Charakterizace rozdělení Momenty f(x) f(x) f(x) μ >μ 1 σ 1 σ >σ 1 g 1 g σ μ 1 μ x μ x x N K MK = x f( x) dx 1 M K = x N CK = ( x M ) f( x) dx ( xi M 1 C = 1 K 1) N i= 1 K i K N i= 1 K μ = E ( X ) = xf
Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,
P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.
P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod. Matematický přístup k výsledkům únavových zkoušek Náhodnost výsledků únavových zkoušek. Únavové
Základní statistické charakteristiky
Základní statistické charakteristiky Základní statistické charakteristiky slouží pro vzájemné porovnávání statistických souborů charakteristiky = čísla, pomocí kterých porovnáváme Základní statistické
KGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 5. Odhady parametrů základního souboru Mgr. David Fiedor 16. března 2015 Vztahy mezi výběrovým a základním souborem Osnova 1 Úvod, pojmy Vztahy mezi výběrovým a základním
PRAVDĚPODOBNOST A STATISTIKA 1 Metodický list č 1.
Metodický list č 1. Název tématického celku: Elementární statistické zpracování 1 - Kolekce a interpretace statistických dat, základní pojmy deskriptivní statistiky. Cíl: Základním cílem tohoto tematického
7. Rozdělení pravděpodobnosti ve statistice
7. Rozdělení pravděpodobnosti ve statistice Statistika nuda je, má však cenné údaje, neklesejte na mysli, ona nám to vyčíslí Jednou z úloh statistiky je odhad (výpočet) hodnot statistického znaku x i,
Analýza dat na PC I.
CENTRUM BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita Analýza dat na PC I. Popisná analýza v programu Statistica IBA výuka Základní popisná statistika Popisná statistika
Popisná statistika. Statistika pro sociology
Popisná statistika Jitka Kühnová Statistika pro sociology 24. září 2014 Jitka Kühnová (GSTAT) Popisná statistika 24. září 2014 1 / 31 Outline 1 Základní pojmy 2 Typy statistických dat 3 Výběrové charakteristiky
Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek
Základy popisné statistiky Anotace Realitu můžeme popisovat různými typy dat, každý z nich se specifickými vlastnostmi, výhodami, nevýhodami a vlastní sadou využitelných statistických metod -od binárních
Jednofaktorová analýza rozptylu
I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých
Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Výsledky některých náhodných pokusů jsou přímo vyjádřeny číselně (např. při hodu kostkou padne 6). Náhodnou veličinou
Základy teorie odhadu parametrů bodový odhad
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Odhady parametrů Úkolem výběrového šetření je podat informaci o neznámé hodnotě charakteristiky základního souboru
Výběrové charakteristiky a jejich rozdělení
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový
Statistické vyhodnocování ankety pilotního projektu Kvalita výuky na Západočeské univerzitě v Plzni
Statistické vyhodnocování ankety pilotního projektu Kvalita výuky na Západočeské univerzitě v Plzni Kvantifikace dat Pro potřeby statistického zpracování byly odpovědi převedeny na kardinální intervalovou
marek.pomp@vsb.cz http://homel.vsb.cz/~pom68
Statistika B (151-0303) Marek Pomp ZS 2014 marek.pomp@vsb.cz http://homel.vsb.cz/~pom68 Cvičení: Pavlína Kuráňová & Marek Pomp Podmínky pro úspěšné ukončení zápočet 45 bodů, min. 23 bodů, dvě zápočtové
Popisná statistika. Jaroslav MAREK. Univerzita Palackého
Popisná statistika Jaroslav MAREK Univerzita Palackého Přírodovědecká fakulta Katedra matematické analýzy a aplikací matematiky Tomkova 40, 779 00 Olomouc Hejčín tel. 585634606 marek@inf.upol.cz pondělí
ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY
zhanel@fsps.muni.cz ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY METODY DESKRIPTIVNÍ STATISTIKY 1. URČENÍ TYPU ŠKÁLY (nominální, ordinální, metrické) a) nominální + ordinální neparametrické stat. metody b) metrické
MATEMATICKÁ STATISTIKA - XP01MST
MATEMATICKÁ STATISTIKA - XP01MST 1. Úvod. Matematická statistika (statistics) se zabývá vyšetřováním zákonitostí, které v sobě obsahují prvek náhody. Zpracováním hodnot, které jsou výstupem sledovaného
Diskrétní náhodná veličina
Lekce Diskrétní náhodná veličina Výsledek náhodného pokusu může být vyjádřen slovně to vede k zavedení pojmu náhodného jevu Výsledek náhodného pokusu můžeme někdy vyjádřit i číselně, což vede k pojmu náhodné
Základy biostatistiky
Základy biostatistiky Veřejné zdravotnictví 3.LF UK Viktor Hynčica Úvod se statistikou se setkáváme denně ankety proč se statistika začala používat ve zdravotnictví skupinový přístup k léčení celé populace
I. D i s k r é t n í r o z d ě l e n í
6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme
Chyby měření 210DPSM
Chyby měření 210DPSM Jan Zatloukal Stručný přehled Zdroje a druhy chyb Systematické chyby měření Náhodné chyby měření Spojité a diskrétní náhodné veličiny Normální rozdělení a jeho vlastnosti Odhad parametrů
Statistika. cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací!
Statistika aneb známe tři druhy lži: úmyslná neúmyslná statistika Statistika je metoda, jak vyjádřit nejistá data s přesností na setinu procenta. den..00..00 3..00..00..00..00..00..00..00..00..00..00 3..00..00..00..00..00..00..00
Popisná statistika kvantitativní veličiny
StatSoft Popisná statistika kvantitativní veličiny Protože nám surová data obvykle žádnou smysluplnou informaci neposkytnou, je žádoucí vyjádřit tyto ve zhuštěnější formě. V předchozím dílu jsme začali
TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Studentská 2 461 17 Liberec 1 SEMESTRÁLNÍ PRÁCE STATISTICKÝ ROZBOR DAT Z DOTAZNÍKOVÝCH ŠETŘENÍ Gabriela Dlasková, Veronika Bukovinská Sára Kroupová, Dagmar
Mnohorozměrná statistická data
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistický znak, statistický soubor Jednotlivé objekty nebo subjekty, které jsou při statistickém
p(x) = P (X = x), x R,
6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme
Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.
Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost
Jevy a náhodná veličina
Jevy a náhodná veličina Výsledky některých jevů jsou vyjádřeny číselně -na hrací kostce padne číslo 1, 4, 6.., jiným jevům můžeme čísla přiřadit (stupeň školního vzdělání: ZŠ, SŠ, VŠ) Data jsme rozdělili
Předmět studia: Ekonomická statistika a analytické metody I, II
Předmět studia: Ekonomická statistika a analytické metody I, II Typ a zařazení předmětu: povinný předmět bakalářského studia, 1. ročník Rozsah předmětu: 2 semestry, celkem 24/0 hodin v kombinované formě
TECHNICKÁ UNIVERZITA V LIBERCI
TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce Statistický rozbor dat z dotazníkového šetření Počet stran: 10 Datum odevzdání: 13. 5. 2016 Pavel Kubát Obsah Úvod... 3 1 Charakterizujte
Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"
Tématické okruhy pro státní závěrečné zkoušky bakalářské studium studijní obor "Management jakosti" školní rok 2010/2011 Management jakosti A 1. Pojem jakosti a význam managementu jakosti v současném období.
Testování statistických hypotéz
Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné
Základy teorie pravděpodobnosti
Základy teorie pravděpodobnosti Náhodná veličina Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 12. února 2012 Statistika by Birom Základy teorie
PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)
PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA) Reprezentativní náhodný výběr: 1. Prvky výběru x i jsou vzájemně nezávislé. 2. Výběr je homogenní, tj. všechna x i jsou ze stejného
Mnohorozměrná statistická data
Mnohorozměrná statistická data Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Mnohorozměrná
Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1
Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA 2018 4. dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Typy proměnných nominální (nominal) o dvou hodnotách lze říci pouze
Úvod do problematiky měření
1/18 Lord Kelvin: "Když to, o čem mluvíte, můžete změřit, a vyjádřit to pomocí čísel, něco o tom víte. Ale když to nemůžete vyjádřit číselně, je vaše znalost hubená a nedostatečná. Může to být začátek
Náhodné (statistické) chyby přímých měření
Náhodné (statistické) chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně
STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA... 2 2. Sylabus pro předmět STATISTIKA... 3 3. Pomůcky... 7
Inovace předmětu STATISTIKA Obsah 1. Inovace předmětu STATISTIKA... 2 2. Sylabus pro předmět STATISTIKA... 3 3. Pomůcky... 7 1 1. Inovace předmětu STATISTIKA Předmět Statistika se na bakalářském oboru
Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží
Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží Zdeněk Karpíšek Jsou tři druhy lží: lži, odsouzeníhodné lži a statistiky. Statistika je logická a přesná metoda, jak nepřesně
Obecné, centrální a normované momenty
Obecné, centrální a normované momenty Obsah kapitoly 4. Elementární statistické zpracování - parametrizace vhodnými empirickými parametry Studijní cíle Naučit se počítat centrální a normované momenty pomocí
Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.
Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině
23. Matematická statistika
Projekt: Inovace oboru Mechatronik pro Zlínský kraj Registrační číslo: CZ.1.07/1.1.08/03.0009 23. Matematická statistika Statistika je věda, která se snaží zkoumat reálná data a s pomocí teorii pravděpodobnosti
POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica
POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica Program Statistica I Statistica je velmi podobná Excelu. Na základní úrovni je to klikací program určený ke statistickému zpracování dat.
Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:
Úloha č. 1 - Kvantily a typická hodnota (bodově tříděná data): Určete typickou hodnotu, 40% a 80% kvantil. Tabulka hodnot: Varianta Četnost 0 4 1 14 2 17 3 37 4 20 5 14 6 7 7 11 8 20 Typická hodnota je
Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"
Tématické okruhy pro státní závěrečné zkoušky bakalářské studium studijní obor "Management jakosti" školní rok 2013/2014 Management jakosti A 1. Pojem jakosti a význam managementu jakosti v současném období.
Pojem a úkoly statistiky
Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Pojem a úkoly statistiky Statistika je věda, která se zabývá získáváním, zpracováním a analýzou dat pro potřeby
Renáta Bednárová STATISTIKA PRO EKONOMY
Renáta Bednárová STATISTIKA PRO EKONOMY ZÁKLADNÍ STATISTICKÉ POJMY Statistika Statistický soubor Statistická jednotky Statistický znak STATISTIKA Vědní obor, který se zabývá hromadnými jevy Hromadné jevy
Pravděpodobnost a matematická statistika
Pravděpodobnost a matematická statistika Příklady k přijímacím zkouškám na doktorské studium 1 Popisná statistika Určete aritmetický průměr dat, zadaných tabulkou hodnot x i a četností n i x i 1 2 3 n
Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy
Popisná statistika úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy Úvod užívá se k popisu základních vlastností dat poskytuje jednoduché shrnutí hodnot proměnných
8. Normální rozdělení
8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, 2 ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) 2 e 2 2, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá
Definice spojité náhodné veličiny zjednodušená verze
Definice spojité náhodné veličiny zjednodušená verze Náhodná veličina X se nazývá spojitá, jestliže existuje nezáporná funkce f : R R taková, že pro každé a, b R { }, a < b, platí P(a < X < b) = b a f
mezi studenty. Dále bychom rádi posoudili, zda dobrý výsledek v prvním testu bývá doprovázen dobrým výsledkem i v druhém testu.
Popisná statistika Slovní popis problému Naším cílem v této úloze bude stručně a přehledně charakterizovat rozsáhlý soubor dat - v našem případě počty bodů z prvního a druhého zápočtového testu z matematiky.
Náhodná veličina a rozdělení pravděpodobnosti
3.2 Náhodná veličina a rozdělení pravděpodobnosti Bůh hraje se světem hru v kostky. Jsou to ale falešné kostky. Naším hlavním úkolem je zjistit, podle jakých pravidel byly označeny, a pak toho využít pro
E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =
Základní rozdělení pravděpodobnosti Diskrétní rozdělení pravděpodobnosti. Pojem Náhodná veličina s Binomickým rozdělením Bi(n, p), kde n je přirozené číslo, p je reálné číslo, < p < má pravděpodobnostní
TLOUŠŤKOVÁ A VÝŠKOVÁ STRUKTURA A JEJÍ MODELOVÁNÍ
TLOUŠŤKOVÁ A VÝŠKOVÁ STRUKTURA A JEJÍ MODELOVÁNÍ 1 Vlastnosti tloušťkové struktury porostu tloušťky mají vyšší variabilitu než výšky světlomilné dřeviny mají křivku početností tlouštěk špičatější a s menší
V 1. pololetí 2011 rostly mzdy jen ve mzdové sféře
V 1. pololetí 2011 rostly mzdy jen ve mzdové sféře Výdělky ve mzdové a platové sféře Z údajů obsažených v Informačním systému o průměrném výdělku (ISPV) vyplývá, že v 1. pololetí 2011 vzrostla hrubá měsíční
1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Testy hypotéz na základě více než 2 výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů Na analýzu rozptylu lze pohlížet v podstatě
Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která
Náhodná veličina a její charakteristiky Náhodná veličina a její charakteristiky Představte si, že provádíte náhodný pokus, jehož výsledek jste schopni ohodnotit nějakým číslem. Před provedením pokusu jeho
KGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 4. Teoretická rozdělení Mgr. David Fiedor 9. března 2015 Osnova Úvod 1 Úvod 2 3 4 5 Vybraná rozdělení náhodných proměnných normální rozdělení normované normální rozdělení
pravděpodobnosti, popisné statistiky
8. Modelová rozdělení pravděpodobnosti, popisné statistiky Rozdělení pravděpodobnosti Normální rozdělení jako statistický model Přehled a aplikace modelových rozdělení Popisné statistiky Anotace Klasickým
31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě
31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě Motto Statistika nuda je, má však cenné údaje. strana 3 Statistické charakteristiky Charakteristiky polohy jsou kolem ní seskupeny ostatní hodnoty
Průzkumová analýza dat
Průzkumová analýza dat Proč zkoumat data? Základ průzkumové analýzy dat položil John Tukey ve svém díle Exploratory Data Analysis (odtud zkratka EDA). Často se stává, že data, se kterými pracujeme, se
Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"
Tématické okruhy pro státní závěrečné zkoušky bakalářské studium studijní obor "Management jakosti" školní rok 2009/2010 Management jakosti A 1. Pojem jakosti a význam managementu jakosti v současném období.
EXPERIMENTÁLNÍ MECHANIKA 2 Přednáška 5 - Chyby a nejistoty měření. Jan Krystek
EXPERIMENTÁLNÍ MECHANIKA 2 Přednáška 5 - Chyby a nejistoty měření Jan Krystek 9. května 2019 CHYBY A NEJISTOTY MĚŘENÍ Každé měření je zatíženo určitou nepřesností způsobenou nejrůznějšími negativními vlivy,
UKAZATELÉ VARIABILITY
UKAZATELÉ VARIABILITY VÝZNAM Porovnejte známky dvou studentek ze stejného předmětu: Studentka A: Studentka B: Oba soubory mají stejný rozsah hodnoty, ale liší se známky studentky A jsou vyrovnanější, jsou
MÍRY ZÁVISLOSTI (KORELACE A REGRESE)
zhanel@fsps.muni.cz MÍRY ZÁVISLOSTI (KORELACE A REGRESE) 2.5 MÍRY ZÁVISLOSTI 2.5.1 ZÁVISLOST PEVNÁ, VOLNÁ, STATISTICKÁ A KORELAČNÍ Jednorozměrné soubory - charakterizovány jednotlivými statistickými znaky
STATISTIKA 1. Adam Čabla Katedra statistiky a pravděpodobnosti VŠE
STATISTIKA 1 Adam Čabla Katedra statistiky a pravděpodobnosti VŠE KONTAKTY WWW: sites.google.com/site/adamcabla E-mail: adam.cabla@vse.cz Telefon: 777 701 783 NB367 na VŠE, konzultační hodiny: Pondělí
ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK
ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz POPISNÉ STATISTIKY - OPAKOVÁNÍ jedna kvalitativní
Statistické vyhodnocení průzkumu funkční gramotnosti žáků 4. ročníku ZŠ
Statistické vyhodnocení průzkumu funkční gramotnosti žáků 4. ročníku ZŠ Ing. Dana Trávníčková, PaedDr. Jana Isteníková Funkční gramotnost je používání čtení a psaní v životních situacích. Nejde jen o elementární
2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat
2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat Anotace Realitu můžeme popisovat různými typy dat, každý z nich se specifickými vlastnostmi,
Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.
Střední hodnota a rozptyl náhodné veličiny, vybraná rozdělení diskrétních a spojitých náhodných veličin, pojem kvantilu Ing. Michael Rost, Ph.D. Príklad Předpokládejme že máme náhodnou veličinu X která
y = 0, ,19716x.
Grafické ověřování a testování vybraných modelů 1 Grafické ověřování empirického rozdělení Při grafické analýze empirického rozdělení vycházíme z empirické distribuční funkce F n (x) příslušné k náhodnému
Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2
Na úloze ukážeme postup analýzy velkého výběru s odlehlými prvky pro určení typu rozdělení koncentrace kyseliny močové u 50 dárců krve. Jaká je míra polohy a rozptýlení uvedeného výběru? Z grafických diagnostik
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica
JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu
Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze
Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Pravděpodobnost a učení Doc. RNDr. Iveta Mrázová,