STATISTIKA PRO EKONOMY

Podobné dokumenty
STATISTIKA PRO EKONOMY

Deskriptivní statistika 1

P2: Statistické zpracování dat

Pro statistické šetření si zvolte si statistický soubor např. všichni žáci třídy (několika tříd, školy apod.).

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

Statistika je vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter.

12. N á h o d n ý v ý b ě r

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

13 Popisná statistika

Základy statistiky. Zpracování pokusných dat Praktické příklady. Kristina Somerlíková

Pravděpodobnost a aplikovaná statistika

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

Popisná statistika - zavedení pojmů. 1 Jednorozměrný statistický soubor s kvantitativním znakem

Závislost slovních znaků

Statistika. Statistické funkce v tabulkových kalkulátorech MSO Excel a OO.o Calc

Odhady parametrů 1. Odhady parametrů

Elementární zpracování statistického souboru

2 STEJNORODOST BETONU KONSTRUKCE

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

Parametr populace (populační charakteristika) je číselná charakteristika sledované vlastnosti

Náhodný výběr 1. Náhodný výběr

Tento projekt je spolufinancován Evropským sociálním fondem a Státním rozpočtem ČR InoBio CZ.1.07/2.2.00/

6. P o p i s n á s t a t i s t i k a

vají statistické metody v biomedicíně

1 ROVNOMĚRNOST BETONU KONSTRUKCE

vají statistické metody v biomedicíně Literatura Statistika v biomedicínsk nském výzkumu a ve zdravotnictví

VYSOCE PŘESNÉ METODY OBRÁBĚNÍ

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

Intervalové odhady parametrů některých rozdělení.

veličiny má stejný řád jako je řád poslední číslice nejistoty. Nejistotu píšeme obvykle jenom jednou

Mezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby.

1.3. POLYNOMY. V této kapitole se dozvíte:

1. Základy počtu pravděpodobnosti:

1. ZÁKLADY VEKTOROVÉ ALGEBRY 1.1. VEKTOROVÝ PROSTOR A JEHO BÁZE

III/2 Inovace a zkvalitnění výuky prostřednictvím ICT

(Teorie statistiky a aplikace v programovacím jazyce Visual Basic for Applications)

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

10.3 GEOMERTICKÝ PRŮMĚR

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

Tržní ceny odrážejí a zahrnují veškeré informace předpokládá se efektivní trh, pro cenu c t tedy platí c t = c t + ε t.

8. Základy statistiky. 8.1 Statistický soubor

základním prvkem teorie křivek v počítačové grafice křivky polynomiální n

České vysoké učení technické v Praze. Fakulta dopravní. Semestrální práce. Statistika

Intervalové odhady parametrů

} kvantitativní znaky. korelace, regrese. Prof. RNDr. Jana Zvárov. Obecné principy

MATICOVÉ HRY MATICOVÝCH HER

2. Náhodná veličina. je konečná nebo spočetná množina;

Pravděpodobnostní modely

STATISTIKA. Základní pojmy

Základní požadavky a pravidla měření

Statistika pro metrologii

Co je to statistika? Statistické hodnocení výsledků zkoušek. Úvod statistické myšlení. Úvod statistické myšlení. Popisná statistika

6. Posloupnosti a jejich limity, řady

Popisná statistika. Zdeněk Janák 9. prosince 2007

8.2.1 Aritmetická posloupnost I

Náhodu bychom mohli definovat jako součet velkého počtu drobných nepoznaných vlivů.

Při sledování a studiu vlastností náhodných výsledků poznáme charakter. podmínek různé výsledky. Ty odpovídají hodnotám jednotlivých realizací

Zhodnocení přesnosti měření

Doc. Ing. Dagmar Blatná, CSc.

14. Testování statistických hypotéz Úvod statistické hypotézy Definice 14.1 Statistickou hypotézou parametrickou neparametrickou. nulovou testovanou

8.2.1 Aritmetická posloupnost

9. Měření závislostí ve statistice Pevná a volná závislost

Komplexní čísla. Definice komplexních čísel

4 DOPADY ZPŮSOBŮ FINANCOVÁNÍ NA INVESTIČNÍ ROZHODOVÁNÍ

Přednáška VI. Intervalové odhady. Motivace Směrodatná odchylka a směrodatná chyba Centrální limitní věta Intervaly spolehlivosti

1.2. NORMA A SKALÁRNÍ SOUČIN

8. Analýza rozptylu.

2.4. INVERZNÍ MATICE

Intervalový odhad. nazveme levostranným intervalem pro odhad parametru Θ. Statistiku. , kde číslo α je blízké nule, nazveme horním

Pravděpodobnost a aplikovaná statistika

NEPARAMETRICKÉ METODY

Spojitost a limita funkcí jedné reálné proměnné

Úloha III.S... limitní

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

7. P o p i s n á s t a t i s t i k a

Pravděpodobnost a statistika - absolutní minumum

4. B o d o v é o d h a d y p a r a m e t r ů

Sekvenční logické obvody(lso)

Matematika 1. Katedra matematiky, Fakulta stavební ČVUT v Praze. středa 10-11:40 posluchárna D / 13. Posloupnosti

17. Statistické hypotézy parametrické testy

U klasifikace podle minimální vzdálenosti je nutno zvolit:

DERIVACE FUNKCÍ JEDNÉ REÁLNÉ PROM

f x a x DSM2 Cv 9 Vytvořující funkce Vytvořující funkcí nekonečné posloupnosti a0, a1,, a n , reálných čísel míníme formální nekonečnou řadu ( )

IAJCE Přednáška č. 12

14. B o d o v é o d h a d y p a r a m e t r ů

8.1.3 Rekurentní zadání posloupnosti I

PŘÍKLAD NA PRŮMĚRNÝ INDEX ŘETĚZOVÝ NEBOLI GEOMETRICKÝ PRŮMĚR

Matematika I, část II

11. P o p i s n á s t a t i s t i k a

Úloha II.S... odhadnutelná

1. Měření ve fyzice, soustava jednotek SI

3. Lineární diferenciální rovnice úvod do teorie

Pravděpodobnost vs. statistika. Data. Teorie pravděpodobnosti pracuje s jednou nebo více teoretickými náhodnými

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

4.2 Elementární statistické zpracování Rozdělení četností

PE 301 Podniková ekonomika 2. Garant: Eva KISLINGEROVÁ. Téma Metody mezipodnikového srovnávání. Téma 12. Eva Kislingerová

Přednáška VIII. Testování hypotéz o kvantitativních proměnných

Kvantová a statistická fyzika 2 (Termodynamika a statistická fyzika)

Transkript:

EDICE UČEBNÍCH TEXTŮ STATISTIKA PRO EKONOMY EDUARD SOUČEK V Y S O K Á Š K O L A E K O N O M I E A M A N A G E M E N T U

Statistika pro ekoomy

Eduard Souček Statistika pro ekoomy VYSOKÁ ŠKOLA EKONOMIE A MANAGEMENTU Praha 2007

Úvodem Cílem této učebí pomůcky je podat výklad základích statistických metod, s kterými ekoom přichází v praxi do styku a které acházejí široké uplatěí při zpracováí, prezetaci a aalýze hospodářských a sociálích jevů. Výběr metod a způsob jejich objasěí je podříze zájmu a zdůrazěí postupů a aplikací, které jsou typické pro aalytickou a rozhodovací čiost ekoomů a maažerů. Obecě platí, že ideové zvládutí statistického přístupu k hodoceí čísel zobrazujících reálý svět má dvojí výzam. V prvé řadě je předpokladem pro kvalifikovaé využíváí číselých iformací, s kterými se v ekoomickém prostředí deě setkáváme. V druhé řadě je to ezbytý prví krok pro racioálí uplatěí výpočetí techiky v práci se statistickými daty. I v oblasti aplikace statistických metod existuje bohatá abídka specializovaého statistického softwaru, jehož účelé využíváí však vyžaduje dobrou zalost statistických procedur a zejméa jejich cílů a podmíek jejich použití. Skriptum je kocipováo tak, aby obsáhlo všecha základí témata stadardího kurzu statistiky. Výklad jedotlivých partií eí příliš zatíže popisem teorie a důkazy a akcetuje objasňováí praktické stráky statistických metod, jejich použitelosti při řešeí typických statistických úloh a také při řešeí problémů spojeých s iterpretací a hodoceím výsledků. Doc. Ig. Eduard Souček, CSc. Vysoká škola ekoomie a maagemetu

Statistika pro ekoomy Eduard Souček Copyright Vysoká škola ekoomie a maagemetu 2007. Vydáí prví dotisk. Všecha práva vyhrazea. ISBN 978-80-86730-06-6 Vysoká škola ekoomie a maagemetu www.vsem.cz Žádá část této publikace esmí být publikováa ai šířea žádým způsobem a v žádé podobě bez výslového svoleí vydavatele.

Obsah Obsah 1 Popisá statistika 3 1.1 Základí statistické pojmy 5 1.1.1 Statistický soubor a statistická jedotka 5 1.1.2 Statistický zak 5 1.2 Zjišťováí a prezetace statistických dat 6 1.3 Kvatily 9 1.4 Statistické charakteristiky 11 1.4.1 Charakteristiky úrově 11 1.4.2 Charakteristiky variability 14 1.4.3 Charakteristiky tvaru rozděleí 17 2 Teorie pravděpodobosti 29 2.1 Základí pojmy 30 2.2 Pravidla pro počítáí s pravděpodobostmi 31 2.3 Náhodá veličia 33 2.3.1 Rozděleí pravděpodobostí áhodé veličiy 33 2.3.2 Popisé charakteristiky rozděleí pravděpodobostí 36 2.3.3 Některá rozděleí diskrétích áhodých veliči 37 2.3.4 Některá rozděleí spojitých áhodých veliči 40 2.3.5 Sdružeé rozděleí ěkolika áhodých veliči 43 3 Výběrové metody 53 3.1 Záměrý výběr 54 3.2 Náhodý výběr 54 4 Teorie odhadu 61 4.1 Základí pricipy odhadu 62 4.2 Bodové odhady 63 4.3 Bodový odhad průměru, relativí četosti rozptylu základího souboru 64 4.4 Itervalové odhady 66 4.4.1 Iterval spolehlivosti pro průměr 67 4.4.2 Iterval spolehlivosti pro relativí četost 71 4.4.3 Určeí rozsahu výběru 72 4.4.4 Itervalový odhad rozptylu 74

Edice učebích textů Statistika pro ekoomy 5 Testováí statistických hypotéz 87 5.1 Základí pojmy 88 5.2 Testovací procedura 91 5.3 Parametrické testy 92 5.3.1 Testy hypotéz o průměru 92 5.3.2 Testy hypotéz o relativí četosti 96 5.3.3 Testy hypotéz o shodě dvou průměrů 97 5.3.4 Testy hypotéz o shodě dvou relativích četostí 102 5.4 Aalýza rozptylu 103 5.5 Test dobré shody 107 6 Korelačí a regresí aalýza 119 6.1 Vícerozměré statistické soubory 120 6.2 Prezetace dvourozměrých souborů 120 6.3 Statistická a korelačí závislost 122 6.4 Hlaví úkoly regresí a korelačí aalýzy 123 6.5 Regresí aalýza 124 6.5.1 Volba regresí fukce a výpočet jejích parametrů 125 6.5.2 Kvalita regresí aalýzy 133 6.6 Korelačí aalýza 135 6.6.1 Poměr determiace 136 6.6.2 Idex determiace 137 6.6.3 Koeficiet determiace 139 6.7 Itervalový odhad a testy hypotéz o korelačím koeficietu 142 6.7.1 Test výzamosti korelačího koeficietu r 143 6.8 Dílčí (parciálí) korelace 145 6.9 Víceásobá závislost 146 6.10 Závislost kvalitativích zaků 149 6.10.1 Míry kotigece 152 6.11 Spearmaův koeficiet pořadové korelace 153 7 Časové řady 167 7.1 Časové řady okamžikových a itervalových hodot 168 7.2 Základí kocepce modelováí časových řad 170 7.3 Popis tredové složky 173 7.3.1 Jedoduché popisé charakteristiky dyamiky 173 7.3.2 Regresí aalýza tredu 174 7.3.3 Kriteria pro volbu vhodého modelu tredu 180

Obsah 7.4 Adaptiví přístupy k modelováí tredu časových řad 181 7.4.1 Expoeciálí vyrováváí 181 7.4.2 Klouzavé průměry 183 7.5 Periodické časové řady 189 7.5.1 Popis periodické složky 189 7.5.2 Popis cyklického kolísáí 189 7.5.3 Popis sezóího kolísáí 190 7.6 Sezóí očišťováí 194 7.6.1 Použití sezóích odchylek a sezóích idexů 194 7.7 Korelace časových řad 196 7.8 Metody předpovědí 197 7.8.1 Kauzálí předpovědí modely 197 7.8.2 Extrapolačí předpovědí modely 198 8 Idexy 215 8.1 Základí pojmy 216 8.2 Idexy řetězové a bázické 217 8.3 Idexy extezitích a idexy itezitích veliči 218 8.4 Klasifikace idexů 219 8.5 Idividuálí idexy jedoduché 219 8.6 Idividuálí idexy složeé 222 8.7 Souhré idexy 225 8.7.1 Souhré idexy ceové 225 8.7.2 Souhré idexy objemové 230 8.7.3 Souhré idexy jako ástroj aalýzy 232 8.8 Statistická deflace 235 Přílohy Glosář 247 Literatura 255 Statistické tabulky 256

Edice učebích textů Statistika pro ekoomy Jak používat tuto učebici Tuto kihu můžete jedoduše přečíst od začátku do koce, ale mohem užitečější vám bude s perem a papírem. Nejefektivější formou učeí je aktiví učeí, a proto jsme aplili text cvičeími, abyste se přesvědčili, jak učivo zvládáte. Každá kapitola také obsahuje cíle, souhr kapitoly a rychlý kviz. Následující body vám objasí, jak s kihou pracovat co ejefektivěji: a) Vyberte si kapitolu, kterou budete studovat, přečtěte si úvod a cíle a začátku kapitoly. b) Potom si přečtěte souhr kapitoly a jejím koci (před rychlým kvizem a odpověďmi ke cvičeím). Neočekávejte, že teto krátký závěr zameá v této fázi příliš moho, ale zkuste, zda můžete spojit ěkterý z probraých bodů s ěkterým z cílů. c) Poté si přečtěte samotou kapitolu. Vyřešte jedotlivá cvičeí tak, jak jdou za sebou. Největší prospěch ze cvičeí získáte, pokud si své odpovědi apíšete předem a poté je zkotrolujete s odpověďmi a koci kapitoly. d) Při čteí používejte pozámkový sloupec a přidávejte vlastí kometáře, odkazy a další materiál atd. Pokuste se formulovat své vlastí ázory. V ekoomii je moho věcí otázkou výkladu a často je zde prostor pro alterativí ázory. Čím hlubší dialog s kihou provedete, tím více ze svého studia získáte. e) Až dočtete kapitolu, zovu si přečtěte souhr kapitoly. Poté se vraťte k cílům a začátku kapitoly a položte si otázku, zda jste jich dosáhli. f) Nakoec upevěte své zalosti tím, že písemě vyřešíte příklady v závěru kapitoly. Své odpovědi si můžete zkotrolovat tak, že se podíváte zpět do textu. Návrat k textu a hledáí výzamých detailů dále zlepší pochopeí předmětu. g) Nakoec si zkotrolujte svá řešeí v přehledu správých odpovědí, který alezete v závěru publikace.

Pokyy pro práci s učebicí Začky a symboly v učebím textu Struktura distačích učebích textů je rozdílá již a prví pohled, a to apř. v zařazováí grafických symbolů začek. Specifické grafické začky umístěé a okraji stráky upozorňují a defiice, cvičeí, příklady s postupem řešeí, klíčová slova a shrutí kapitol. Začky by měly studeta ituitivě vést tak, aby se již po krátkém sezámeí s distačí učebicí dokázal v textu rychle a sado orietovat. Pozámky Ozačuje místo pro pozámky (vždy a začátku stráky v širším okraji). Defiice Upozorňuje a defiici ebo poučku pro daé téma. Cvičeí Ozačuje jedotlivá číslovaá cvičeí, jejichž řešeí je uvedeo a koci kapitoly. Příklad - případová studie Ozačuje příklady s postupem řešeí a koci kapitoly. Klíčová slova Upozorňuje a důležité výrazy či odboré termíy ezbyté pro orietaci v daém tématu. Shrutí kapitoly Shrutí kapitoly se zařazuje a koec daé kapitoly. Přehledě, ve strukturovaých bodech shruje to ejpodstatější z předchozího textu.

kapitola 1 Popisá statistika

Popisá statistika Kapitola 1 1. kapitola Popisá statistika Studium této kapitoly objasí Úvod Cíle popisu statistického souboru popisými charakteristikami. Způsoby prezetace dat v tabulkových a grafických formách. Výpočet a použití charakteristik úrově. Výpočet a použití charakteristik variability. Výpočet a použití charakteristik symetrie rozděleí. Statistický přístup ke zkoumáí sociálě-ekoomické reality vychází z potřeby získáí základích číselých popisých charakteristik statistického souboru, a základě kterých by bylo možo v přehledé podobě jedozačě specifikovat vlastosti hodoceého souboru. K tomuto účelu slouží především dvě základí kategorie popisých měr: míry úrově a míry variability hodot. Zalost těchto měr je eje výchozím bodem každé věcé aalýzy, ale i podmíkou pro případé komparace více statistických souborů. Vzik statistiky Termí statistika je odvoze od latiského status, což v latiě zameá stav a ve slovím spojeí status rei republicae je to stav věci veřejé eboli stát. Od tohoto výzamu vzikla v 16. a 17. století italská slova statistica pro ozačeí souhru zalostí o státích záležitostech. Teto termí se pak rozšířil v podobém výzamu i meziárodě. Čiosti blízké statistice však mají daleko starší historii. Zámá jsou sčítáí lidí před ěkolika tisíciletími v Egyptě a v Číě. Běžá byla zjišťováí pro účely vojeské a daňové ve starém Římě. S prvími badatelskými aplikacemi statistiky se setkáváme v Aglii (Joh Graut, 1620 1674, a William Petty, 1623 1687), kdy byla shromažďováa data pro zkoumáí pravidelostí v úmrtosti a porodosti obyvatelstva. Graut a Petty již usilovali o zobecěí výzamu jedotlivých případů tím, že zkoumali skutečosti, které mají povahu hromadého jevu. Svůj postup zkoumáí ozačil Petty jako politickou aritmetiku, aby tak vyjádřil fakt, že zkoumá skutečosti důležité pro stát a současě, že jde o číselé charakterizováí hodoceých jevů. Výzamým vkladem pro teoretické zázemí statistických metod byl rozvoj počtu pravděpodobosti. Prví kroky počtu pravděpodobosti jsou spojey s matematickými výpočty u hazardích her. Další vývoj teorie pravděpodobosti je spoje se jméy slavých matematiků (B. Pascal, J. Beroulli, T. Bayes, P. S. Laplace, K. F. Gauss, P. L. Čebyšev, A. A. Markov a další). 3

Kapitola 1 Edice učebích textů Statistika pro ekoomy Pojetí statistiky Pojem statistika se v současosti používá ve třech výzamech: a) pro vyjádřeí souhru dat o hromadých jevech, b) pro čiost směřující k získáváí statistických dat, jejich uspořádáí a zpracováí a ásledou prezetaci, c) pro metodologickou vědu, jejímž cílem je zkoumáí zákoitostí hromadých jevů a kterou tvoří metodologie zjišťováí, zpracováí a aalýzy dat. Chápeme-li statistiku v uvedeém třetím výzamu, tedy jako metodologickou vědu, zjistíme, že jsou pro i přízačé dvě skutečosti: 1. Jejím předmětem jsou hromadé jevy, e jevy jediečé a eopakovatelé. Zameá to, že statistiku ezajímá kokrétí jediec (předmět, objekt, událost) sám o sobě, ale je jako součást souboru jediců. Cílem statistiky je geeralizace založeá a zkoumáí souborů případů. 2. Zkoumaé pozatky o hromadých jevech vyjadřuje statistickými daty. V tomto pojetí, jež chápe statistiku jako metodologickou disciplíu, která zkoumá svými specifickými metodami hromadé jevy, se bude statistikou zabývat teto učebí text. 4

Popisá statistika Kapitola 1 1.1 Základí statistické pojmy 1.1.1 Statistický soubor a statistická jedotka Zkoumáí hromadých jevů předpokládá defiováí z hlediska účelu zkoumáí vymezeé možiy objektů, prvků zkoumáí eboli statistického souboru (soubor podiků, soubor obyvatelstva, soubor událostí apod.). Jedotlivé objekty, prvky statistického souboru, ozačujeme jako statistické jedotky. Jsou ositeli vlastostí daého souboru. Počet jedotek statistického souboru se azývá rozsah souboru. Soubory, které jsou předmětem zkoumáí, ozačujeme jako základí soubor (ěkdy se základí soubor ozačuje jako populace). V praxi často z růzých důvodů epracujeme s celým rozsahem statistického souboru, ale je se vzorkem statistických jedotek eboli s výběrovým souborem. K tomu dochází buď proto, že zkoumáí celého statistického souboru by bylo ákladé, časově zdlouhavé ebo z jiých praktických ohledů euskutečitelé, a dále proto, že zobecěí provedeé z dat výběrového souboru považujeme pro daý účel zkoumáí za dostatečě přesé a z hlediska pozáí za reprezetativí. 1.1.2 Statistický zak Zkoumaé vlastosti statistického souboru sleduje statistika prostředictvím měřitelých vlastostí statistických jedotek, které vyjadřuje tzv. statistickými zaky. Statistický zak abývá slovích ebo číselých hodot a je zjišťová u každé statistické jedotky statistického souboru. Jestliže ve statistickém souboru pracujeme je s jedím zakem (s jedou proměou), říkáme, že se jedá o jedorozměrý soubor, máme-li současě více zaků, jde o dvou-, tří-, resp. obecě vícerozměrý soubor. Základím tříděím statistických zaků je rozlišováí zaků číselých (kvatitativích, umerických) a zaků slovích (kvalitativích, alfabetických, kategoriálích). Číselé statistické zaky bezprostředě vyjadřují sledovaé vlastosti čísly (apř. při zkoumáí souboru pracovíků podiku jsou to zaky jako mzda, věk, doba praxe). Rozlišujeme zaky spojité (kotiuálí), které mohou teoreticky abývat libovolých reálých číselých hodot v určitém itervalu (průtok vody, hmotost výrobku, výška, peěží obrat apod.) a zaky espojité (diskrétí), které mohou abývat pouze určitých číselých hodot v oboru reálých čísel (počet pracovíků, počet prodaých výrobků, počet čleů domácosti apod.). Jsou-li hodoty statistického zaku vyjádřey slově, azývá se takový zak sloví (apř. u osob je to vzděláí, odvětví čiosti, árodost, pohlaví). Zvláští skupiou slovích statistických zaků jsou ordiálí (pořadové) zaky. Ty jsou takové, že jejich obměy lze podle ějakého objektivího kritéria seřadit od ejmeší obměy do ejvětší, apř. a základě ějakého expertího ohodoceí. Taková situace vziká kupř. při posuzováí kvality výrobku, kdy výrobky jsou a základě hodoceí expertů seřazey od ejlepšího k ejhoršímu. Namísto slovího popisu obmě pak u ordiálích zaků můžeme pracovat s pořadovými čísly jako s určitou formou kvatifikace těchto obmě. 5

Kapitola 1 Edice učebích textů Statistika pro ekoomy 1.2 Zjišťováí a prezetace statistických dat Statistické zkoumáí prochází postupě ěkolika pracovími etapami. Výchozí etapou je statistické zjišťováí (statistické šetřeí). Cílem je získáváí ezámých statistických dat o hodotách statistických zaků u jedotlivých statistických jedotek, které tvoří statistický soubor. Každé statistické zjišťováí má určitý kokrétí účel, z kterého vyplývá, jaké proměé statistické zaky budeme zjišťovat, co zvolíme za statistickou jedotku a jak vymezíme statistický soubor. Orgaizace statistického zjišťováí musí obsahovat prostorové, věcé a časové vymezeí statistického souboru a statistických zaků. Např. při zjišťováí ekoomických výsledků průmyslových podiků musí orgaizátor šetřeí staovit, zda bude prostorově vymeze okruh průmyslových podiků územím České republiky ebo ějakým jiým regioem a zda o zařazeí podiku do kokrétího území bude rozhodovat umístěí sídla podiku ebo ějaké jié hledisko. Věcé vymezeí musí defiovat, co považujeme za průmyslový podik a jakými ukazateli budeme charakterizovat ekoomické výsledky každého podiku (objem produkce, retabilita, produktivita práce, zisk apod.). Při časovém vymezeí půjde o staoveí kokrétího časového itervalu ebo rozhodého časového okamžiku, ke kterému se budou jedotlivé zjišťovaé údaje vztahovat. Elemetárí zpracováí výsledků statistického zjišťováí Výsledky statistického zjišťováí mají obvykle povahu velkého a epřehledého možství číselých údajů, které je třeba pro aalýzu vhodě uspořádat a utřídit. Tříděím rozumíme rozděleí jedotek souboru do skupi tak, aby vyikly charakteristické vlastosti zkoumaých jevů. Provádíme-li tříděí podle obmě jedoho statistického zaku, mluvíme o tříděí jedostupňovém. Tříděí podle více statistických zaků ajedou ozačujeme jako tříděí vícestupňové. Je-li třídicím zakem číselý (kvatitativí) zak s malým počtem obmě, pak vhodým uspořádáím statistických dat je tabulka rozděleí četostí, kdy apozorovaé hodoty ejprve uspořádáme podle velikosti a ke každé variatě přiřadíme počty statistických jedotek, které udávají, s jakou četostí se jedotlivé variaty hodot vyskytují. Ozačíme-li obměy číselého statistického zaku x i a četosti i a předpokládáme-li, že tříděím vziklo k obmě, pak tabulku rozděleí četostí lze formálě vyjádřit takto: TABULKA 1.1 Rozděleí četostí Obměa hodoty zaku Četost x i i x 1 1 x 2 2 x k Celkem k k Souhr četostí za k řádků 1 + 2 + + k je rove rozsahu souboru : i =. Tímto způsobem lze především vyjadřovat rozděleí četostí espojitého statistického zaku. Např. při prezetaci velikostí struktury souboru domácostí budou obměami hodot zaku jedotlivé vyskytující se variaty počtu čleů domácostí a četostmi jsou údaje o počtu domácostí u jedotlivých obmě. i 1 6

Popisá statistika Kapitola 1 Sledujeme-li espojitý statistický zak s velkým počtem obmě ebo pracujeme-li se spojitým statistickým zakem, pak uvedeý způsob prezetace výsledků statistického šetřeí by epřiesl žádoucí zpřehleděí statistických dat. V takových případech amísto obmě jedotlivých číselých hodot přecházíme a itervaly hodot a přehledost výsledků regulujeme počtem a šířkou zvoleých itervalů. Výsledá tabulka je ozačováa jako itervalové rozděleí četostí. Při sestavováí itervalového rozděleí četostí je třeba především vyřešit problém staoveí počtu a tím velikosti itervalů. Obvykle volíme řešeí, které eohrožuje příliš iformačí hodotu výsledků. Příliš široké itervaly sižují kvalitu prezetace, příliš úzké aopak zhoršují přehledost a zvyšují rozsah tabulky. Dalším problémem itervalového rozděleí četostí je volba hraic itervalů, aby edocházelo k ejasostem, do kterého itervalu se mají jedotlivé jedotky zařadit. Nejčastěji se hraice itervalů volí tak, aby se itervaly epřekrývaly. Např. při charakterizováí věkové struktury obyvatelstva pětiletými věkovými skupiami se používají itervaly 0 4, 5 9, 10 14, 15 19 atd. V praxi se často eobejdeme bez tzv. otevřeých itervalů, při jejich použití bychom však měli být opatrí a používat je je pro itervaly s malou četostí, kde ehrozí ebezpečí příliš velké iformačí ztráty. Např. u již zmíěé věkové struktury obyvatelstva to může být otevřeý iterval: 85 a více let. Při výpočtech statistických charakteristik vziká problém, jaká hodota by ve výpočtu měla zastoupit (reprezetovat) jedotlivé itervaly. Za tuto zastupitelou hodotu se zpravidla volí střed itervalu. Grafy rozděleí četostí Nejzámějším grafem rozděleí četostí je tzv. polygo (řecky mohoúhelík), který v pravoúhlém souřadicovém systému používá osu x pro obměy zaku x a osu y pro četosti 1. Pro grafické vyjádřeí itervalového rozděleí četostí se používá histogram. Velikost četostí je vyjádřea sloupci, jejichž základa je rova šířce itervalu. A. Polygo četostí Příklad: Rozděleí četostí počtu žáků podle zámky z matematiky OBRÁZEK 1.1 Polygo četosti Zámka Počet žáků 1 8 2 18 3 14 4 6 5 4 Celkem 50 7

Kapitola 1 Edice učebích textů Statistika pro ekoomy B. Histogram četostí Příklad: Itervalové rozděleí četostí počtu škol podle průměrého počtu žáků a 1 třídu OBRÁZEK 1.2 Histogram četosti Průměrý počet žáků a třídu Počet škol Střed itervalu 16 17,99 6 17 18 19,99 10 19 20 21,99 22 21 22 23,99 16 23 24 25,99 10 25 26 27,99 4 27 28 29,99 2 29 Celkem 70 X V případě, že jedotlivé itervaly zastoupíme středy itervalů, můžeme itervalové rozděleí četostí graficky vyjádřit i polygoem. Relativí a kumulativí četosti Abychom mohli vzájemě porovávat růzá rozděleí četostí a jejich struktury v růzě velkých statistických souborech, používáme amísto absolutích četostí relativí četosti p i, které získáme jako poměr dílčích četostí a rozsahu souboru: i p i =. (1.1) U souboru většího rozsahu se relativí četosti zpravidla vyjadřují v procetech. Pro aalýzy struktury souboru z hlediska určité vlastosti může být také užitečé zjistit, jaký podíl jedotek má hodotu meší ebo rovou příslušé variatě. K tomu používáme tzv. kumulativí četosti (absolutí ebo relativí). Získáme je postupým ačítáím četostí po sobě ásledujících tříd. 8

Popisá statistika Kapitola 1 PŘÍKLAD 1.1 Za podik máme k dispozici itervalové rozdìleí èetostí hodiových mezd v èleìí a muže a žey. Iterval hodiových mezd v Kč Počet pracovíků Relativí četosti v % Kumulativí relativí četosti v % Muži Žey Muži Žey Muži Žey 20 29,9 40 24 8 12 8 12 30 39,9 80 36 16 18 24 30 40 49,9 100 60 20 30 44 60 50 59,9 150 48 30 24 74 84 60 69,9 90 20 18 10 92 94 70 79,9 25 12 5 6 97 100 80 a více 15 3 100 100 Celkem 500 200 100 100 X X Pøíklad ilustruje, jak je možo øešit problém epøekrýváí itervalù. Iterval v posledím øádku ozaèujeme jako otevøeý iterval. 1.3 Kvatily Kvatil je hodota proměé určeá tak, že odděluje určitý podíl jedotek, které jsou meší ež tato hodota. Např. dvacetipětiprocetí kvatil ~ x 25 odděluje 25 % malých hodot a současě 75 % velkých hodot. Tímto způsobem můžeme pak, kupř. při hodoceí úrově mezd pracovíků v árodím hospodářství, charakterizovat, jaká mzdová hraice odděluje 25 % pracovíků s ejižšími mzdami. V praxi se používají zejméa tyto skupiy kvatilů: Kvartily (x ~ ~ ~ 25, x 50, x 75 ) patří mezi kvatily, které rozdělují uspořádaou řadu hodot a 4 stejé části: prví (dolí) kvartil x ~ 25, který odděluje 25 % jedotek s ejižšími hodotami, druhý (prostředí) kvartil ~ x 50, který odděluje 50 % jedotek s ízkými hodotami a 50 % hodot s vysokými hodotami. Teto padesátiprocetí kvatil se také ozačuje jako mediá (o d latiského medius prostředí). Třetí kvartil (horí) x ~ 75 odděluje 75 % jedotek s ízkými hodotami od 25 % jedotek s vyššími hodotami. Decily (x ~ ~ ~ 10, x 20,..., x 90 ) rozdělují uspořádaou řadu a 10 stejých částí. Cetily, resp. percetily ( ~ x ~ ~ 1, x 2,..., x 99 ) rozdělují uspořádaou řadu hodot a 100 stejě početých částí. Nejužívaějším kvatilem je mediá, který představuje prostředí hodotu uspořádaého souboru, a je tedy svou vypovídací hodotou blízký aritmetickému průměru. Je-li rozsah souboru udá sudým číslem, obsahuje soubor dvě prostředí hodoty. V tomto případě bývá zvykem volit za mediá průměr z těchto dvou prostředích hodot a mediá pak eí kokrétí hodotou původího souboru. Mediáu dáváme předost před aritmetickým průměrem v těch situacích, kdy aritmetický průměr je výrazě ovlivě existecí extrémích hodot v souboru a poskytuje zkresleý obraz o úrovi hodot, zatímco hodota, která v daém souboru je co do velikosti prostředí, je vůči extrémům imuí. 9

Kapitola 1 Edice učebích textů Statistika pro ekoomy Z povahy kvatilů je zřejmé, že prvím krokem při jejich výpočtu je uspořádáí všech hodot sledovaého zaku podle velikosti. Pak staovíme pořadové číslo statistické jedotky, jejíž hodota je hledaým kvatilem. Ozačíme-li toto pořadové číslo z p, pak platí: z p = p + 0,5, (1.2) kde je rozsah souboru a p je relativí četost ejižších hodot. Např. pořadové číslo z p pro 1. kvartil ( ~ x 25 ) v souboru = 80 zjistíme takto: z 25 = 80. 0,25 + 0,5 = 20,5. Při odvozováí pořadového čísla z p z četostí vyjádřeých v procetech se hodota 0,5 ve vzorci obvykle zaedbává. Poěkud složitější je výpočet kvatilů z itervalového rozděleí četostí. Pokud se spokojíme pouze s určeím itervalu, v ěmž hledaý kvatil leží, je postup stejý jako v předchozím případě. Chceme-li kvatil odhadout jedím kokrétím číslem, je třeba použít při výpočtu lieárí iterpolaci založeou a předpokladu, že ve stejých proporcích, v jakých rozděluje pořadové číslo hledaého kvatilu iterval četostí, rozděluje kvatil iterval hodot. Teto postup hypoteticky předpokládá, že v itervalu, kde leží hledaý kvatil, jsou hodoty rozděley rovoměrě. PŘÍKLAD 1.2 Hledáme hodotu všech tøí kvartilù (~x 25, ~x 50, ~x 75 ) v rozdìleí èetostí hodiových mezd v ávazosti a údaje z pøíkladu 1.1. Výpoèet provedeme zvláš za muže a žey. Využijeme k tomu posledí dva sloupce obsahující v procetech vyjádøeé kumulativí èetosti: Iterval hodiových mezd v Kč Relativí četosti v % Kumulativí relativí četosti v % Muži Žey Muži Žey 20 29,9 8 12 8 12 30 39,9 16 18 24 30 40 49,9 20 30 44 60 50 59,9 30 24 74 84 60 69,9 18 10 92 94 70 79,9 5 6 97 100 80 a více 3 100 100 Celkem 100 100 X X Pro staoveí jedotlivých kvartilù potøebujeme zjistit k poøadovým èíslùm z 25, z 50 a z 75 odpovídající hodoty mezd: Hodiové mzdy mužů Ze sloupce kumulativích èetostí zjistíme, že poøadové èíslo 25 patøí do tøetího itervalu s hodotami 40 až 49,9 Kè, chápaé vždy zaokrouhleì jako 50 Kè. Z tìchto podkladù mùžeme pro pøibližý výpoèet prvího kvartilu použít lieárí iterpolaci, pøi které bude jeho hodota rozdìlovat teto iterval ve stejém pomìru, jako poøadové èíslo 25 rozdìluje odpovídající iterval èetostí: ~ x25 40 25 24 =. 50 40 44 24 Z toho pak sado odvodíme, že: 1 ~ x25 = 40 + 10 = 40,5. 20 6 1 Podobì zjistíme, že: ~ x 50 = 50 + a ~ x 75 = 60 + 10 = 60,6. 30 18 10

Popisá statistika Kapitola 1 Hodiové mzdy že ~x 25 = 37,2 ~x 50 = 46,7 ~x 75 = 56,2. 1.4 Statistické charakteristiky 1.4.1 Charakteristiky úrově Úroveň jevů vyjadřovaých kvatitativími zaky vyjadřují středí hodoty. Ty v kocetrovaé podobě shrují iformaci obsažeou v údajích o statistickém zaku. Hlaví skupiu středích hodot tvoří průměry (aritmetický průměr, geometrický průměr, harmoický průměr), jejichž společou vlastostí je, že jsou určováy ze všech aměřeých hodot zaku. Druhou skupiu středích hodot tvoří tzv. pozičí středí hodoty (mediá a modus), které jsou určey pozicí ěkterých jedotek souboru. Mediá ~ x je urče hodotou zaku, kterou má jedotka statistického souboru s hodotou co do velikosti prostředí. Modus ^x je urče hodotou zaku u jedotek, které jsou v souboru ejčastěji zastoupey, jiak řečeo, tou hodotou souboru, která má ejvětší četost. A. Průměry Aritmetický průměr x _ Je ejzámějším a ejužívaějším typem průměru. Ze zjištěých hodot x 1, x 2,... x za -čleý statistický soubor jej lze vypočítat takto: _ 1 x = x. (1.3) i i =1 Tuto formu aritmetického průměru azýváme prostý aritmetický průměr. Výpočet epředpokládá žádé předběžé uspořádáí hodot. Aritmetický průměr je použitelý všude tam, kde má ějaký iformačí smysl součet hodot. Pokud jsou hodoty statistického souboru uspořádáy do rozděleí četostí, což je zejméa případ velkých souborů a souborů, kde stejé obměy hodot statistického zaku má vždy více statistických jedotek, předchozí vzorec upravujeme do tvaru, který se ozačuje jako vážeý aritmetický průměr. Při jeho použití využíváme skutečost, že k úhru všech hodot můžeme dospět přes staoveí pomocých součiů x i i pro k obmě zaku. Vzorec vážeého aritmetického průměru pak zapisujeme takto: k x i i _ i =1 1 x =, resp. jako x _ = x. (1.4) k i i i =1 i =1 i k 11

Kapitola 1 Edice učebích textů Statistika pro ekoomy Četosti 1, 2,..., k zde vystupují jako váhy k jedotlivým obměám hodot. Máme-li k dispozici itervalové rozděleí četostí, bereme při výpočtu aritmetického průměru za hodoty zaku středy odpovídajících itervalů. Chceme porovat aritmetický průměr hodiových mezd mužů a že v ávazosti a údaje z příkladu 1.2: PŘÍKLAD 1.3 Iterval hodiových mezd v Kč Relativí četosti v % i Středy itervalů x i i x i Muži Žey Muži Žey 20 29,9 8 12 25 200 300 30 39,9 16 18 35 560 630 40 49 20 30 45 900 1 530 50 59 30 24 55 1 650 1 100 60 69,9 18 10 65 1 170 650 70 79,9 5 6 75 375 450 80 a více 3 _ 85 255 _ Celkem 100 100 X 5 110 4 460 Pro výpoèet aritmetického prùmìru z itervalového rozdìleí èetostí použijeme vážeý aritmetický prùmìr, v kterém jsou hodoty zaku zastoupey støedy itervalù: x i i _ i =1 5 110 4 660 x = muži = = 51,10 žey = k = 46,60. 100 100 Použití vážeého aritmetického průměru přichází v úvahu i tam, kde váhy ejsou odvozey z četostí, ale z relativího výzamu (důležitosti) jedotlivých hodot. Např. při hodoceí likvidity podiku musíme počítat s tím, že jedotlivá aktiva podiku mají růzou schopost využití pro spláceí krátkodobých závazků. Proto se v této oblasti setkáváme s tím, že k jedotlivým aktivům jsou a základě expertího oceěí přiřazováy váhy, určující důležitost daé skupiy aktiv z hlediska likvidity podiku. Celkový (průměrý) ukazatel likvidity je pak vážeým aritmetickým průměrem z objemů peěžích prostředků, vázaých v jedotlivých skupiách aktiv, kdy jako váhy vystupují ějaké koeficiety kvality aktiv z hlediska stupě likvidity. PŘÍKLAD 1.4 Pøi souhrém hodoceí studijích výsledkù z urèitého pøedmìtu chceme použít bodových výsledkù ze tøí testù, dvou prùbìžých a jedoho závìreèého. Bodùm z prùbìžých testù dáváme stejou 25% váhu a závìreèému testu 50% váhu. Pøedpokládejme, že studet získal v prùbìžých testech 60 a 80 bodù a v závìreèém 52 bodù. Celkový prùmìr _ x = 1/100 (60. 25 + 80. 25 + 52. 50) = 61 bodù. 12

Popisá statistika Kapitola 1 K důležitým vlastostem aritmetického průměru patří: 1. Součet odchylek jedotlivých hodot od jejich aritmetického průměru je ulový. 2. Součet čtverců odchylek jedotlivých hodot od průměru je miimálí. 3. Trasformace jedotlivých hodot přičteím (ebo odečteím) kostaty zvýší (ebo síží) aritmetický průměr o tuto kostatu. 4. Při trasformaci jedotlivých hodot ásobeím (ebo děleím) eulovou kostatou je i aritmetický průměr zásobe (ebo vyděle) touto kostatou. Geometrický průměr Je defiová pro kladé hodoty x jako -tá odmocia ze součiu těchto hodot: x G = x, x,... x. (1.5) 1 2 Má uplatěí tam, kde má iformačí smysl souči hodot. K použití geometrického průměru při výpočtu průměrého koeficietu růstu se vrátíme v kapitole věovaé časovým řadám. Harmoický průměr Je defiová jako poměr mezi rozsahem souboru a součtem převratých hodot: x H =. 1 i =1 x i (1.6) Má uplatěí tam, kde má iformačí smysl součet převratých hodot. B. Ostatí středí hodoty Do této skupiy řadíme mediá a modus jako tzv. pozičí středí hodoty. Mediá x Je padesátiprocetím kvatilem, který charakterizuje hodotu souboru co do velikosti prostředí. Odděluje poloviu hodot meších od poloviy hodot větších. Mediá je a rozdíl od aritmetického průměru ecitlivý k extrémím hodotám, protože závisí pouze a jedé, ejvýše dvou prostředích hodotách souboru. Nemůže být tedy zkresle ai přítomostí ějaké chybé extrémí hodoty. Výhodou mediáu je i to, že jej můžeme staovit i u itervalových rozděleí četostí s otevřeými itervaly u miimálích a maximálích hodot. Modus ^x Představuje hodotu, která je v rámci šetřeého souboru ejtypičtější. Jiak řečeo, jde o ejčetější hodotu zaku. Také modus eí ovlivě extrémími hodotami. V případě itervalového rozděleí četostí se při staoveí modu spokojujeme buď s určeím modálího (ejčetějšího) itervalu, ebo v rámci tohoto itervalu modus odhadujeme, apř. středem itervalu. Existují však i přesější postupy, které vycházejí z rekostrukce vrcholu souboru podle rozděleí četostí v okolí modálího itervalu. Pokud se spokojíme je s určeím modálího itervalu, pak je třeba si uvědomit, že má smysl jej určovat pouze tehdy, jsou-li všechy itervaly stejě velké. Modus považujeme za důležitou doplňkovou charakteristiku k aritmetickému průměru. Pokud se obě míry úrově výzaměji liší, pak to zameá, že aritmetický průměr evyjadřuje dobře typickou úroveň hodot souboru, apř. pro existeci extrémích hodot ebo pro asymetrické rozložeí četostí. 13

Kapitola 1 Edice učebích textů Statistika pro ekoomy 1.4.2 Charakteristiky variability Variabilitou (mělivostí) kvatitativího statistického zaku rozumíme kolísáí hodot této veličiy. Pokud soubor obsahuje všechy hodoty stejé ( x i = kostata), mluvíme o ulové variabilitě. Kolísáí hodot v souboru můžeme posuzovat buď jako vzájemou rozdílost jedotlivých hodot sledovaé veličiy, ebo jako rozdílost jedotlivých hodot od aritmetického průměru. Teto druhý pricip měřeí variability převažuje. Měřeí variability lze využít k hodoceí stejorodosti (homogeity) souboru a také k posuzováí kvality iformace, kterou o úrovi hodot v souboru poskytla ěkterá ze středích hodot.vycházíme přitom z úvahy, že čím je soubor stejorodější, s meší variabilitou, tím je apř. aritmetický průměr výstižější z hlediska hodoceí úrově hodot souboru. V ekoomické praxi mají míry variability uplatěí apř. při hodoceí rovoměrosti dodávek, prodeje ebo výroby, při hodoceí stability ukazatele v časové řadě. Hlavě však se s mírami variability setkáme při zkoumáí závislosti mezi jevy. K základím charakteristikám variability patří variačí rozpětí, rozptyl (a jeho odmocia směrodatá odchylka) a variačí koeficiet. Variačí rozpětí R Variačí rozpětí je rychlou, jedoduchou, ale je orietačí charakteristikou variability založeou a iformaci o maximálí a miimálí hodotě v souboru: R = x max x mi. (1.7) Při použití variačího rozpětí si musíme vždy být vědomi toho, že hodoty miima a maxima v souboru mohou mít charakter ahodilých extrémů a tím epřiměřeě zvětší aši představu o míře variability ve zkoumaém souboru. Rozptyl a směrodatá odchylka Rozptyl je ejzámější a ejužívaější mírou variability. Je defiová jako aritmetický průměr ze čtverců odchylek jedotlivých hodot od průměru: ( x i _ x ) 2 2 i = 1 s x =. (1.8) Teto vzorec používáme při počítáí rozptylu z euspořádaého souboru všech hodot souboru, kdy u každé jedotlivé hodoty souboru zjišťujeme její odchylku od průměru a čtverec této odchylky. Mluvíme pak o výpočtu tzv. prostého rozptylu. Při výpočtu z rozděleí četostí, kdy přihlížíme k četostem jedotlivých obmě, používáme vážeý rozptyl: k ( x i x _ ) 2 i i =1 2 1 k _ 2 s x =, resp. s x = ( x x i )2 i. k i =1 i i =1 (1.9) 14

Popisá statistika Kapitola 1 Pro praktické výpočty se ěkdy oba vzorce rozptylu upravují do formy tzv. výpočtových tvarů. Způsob této úpravy si ukážeme a vzorci prostého rozptylu. 1 _ 1 2 1 _ 1 _ 1 _ 1 2 2 i =1 i =1 i =1 i =1 ( x i x ) 2 = x i ( 2x x i + _ x 2 ) = x i 2x x i + x = x i x 2. i =1 i =1 2 _ (1.10) Podobou úpravou je možo odvodit růzé podoby výpočtových tvarů i pro vážeý rozptyl, ejpoužívaější je tato úprava: 1 k 1 k 2 s x = x 2 i i x i i. i =1 i =1 (1.11) Rozptyl sám o sobě eí iterpretovatelou veličiou, protože výsledek je dá ve čtvercích měrých jedotek. Proto se při hodoceí variability dává předost druhé odmociě rozptylu, tzv. směrodaté odchylce s x (braé s kladým zamékem). PŘÍKLAD 1.5 Z výsledkù pøijímacích zkoušek jsme u 12 studetù z urèitého gymázia zjiš ovali dosažeé bodové výsledky z testu z matematiky (zak x) a agliètiy (zak y). Chceme porovat úroveò a variabilitu bodových výsledkù u obou pøedmìtù: Studet x i y i ( x i x _ )2 ( y i y _ )2 1 60 50 100 25 2 40 30 100 625 3 20 60 900 25 4 40 60 100 25 5 55 55 25 6 50 55 7 80 55 900 8 40 55 100 9 80 50 900 25 10 10 60 1 600 25 11 100 80 2 500 625 12 25 50 625 25 Celkem 600 660 7 850 1 400 _ 1 600 _ 660 x = x i = = 50, y = = 55, i =1 12 12 ( x _ i x ) 2 i = 1 7 850 1 400 2 2 s x = = = 654,2 sy = = 116,7. 12 12 Z výsledkù jedozaèì vyplývá, že matematika vykazuje podstatì vyšší míru estejorodosti bodových výsledkù ež agliètia. 15

Kapitola 1 Edice učebích textů Statistika pro ekoomy Variačí koeficiet Při srováváí variability více souborů arážíme a problém rozdílých měrých jedotek a rozdílé úrově hodot v souborech. V takových případech je pro potřeby srováí ejvhodější charakteristikou variability variačí koeficiet V x : s x V x =. (1.12) x Patří mezi relativí míry variability, protože evyjadřuje variabilitu v původích měrých jedotkách, ale jako poměr směrodaté odchylky a průměru. Obvykle teto poměr prezetujeme v procetech. Pak udává, z kolika procet se v průměru odchylují jedotlivé hodoty od aritmetického průměru. Sadá iterpretace hodot variačího koeficietu jej řadí mezi ejpoužívaější charakteristiky variability. Z ásledujících dat za odvìtví chceme porovat variabilitu hodiových mezd mužù a že pomocí variaèího koeficietu. Vzhledem k tomu, že výchozí data jsou k dispozici ve formì itervalového PŘÍKLAD 1.6 rozdìleí èetostí, bude tøeba pro výpoèet prùmìru a rozptylu pracovat se støedy itervalù: Iterval hodiových mezd v Kč Relativí četosti v % muži žey 1 Středy itervalů x 1 muži žey muži žey 2 x 1 1 x 1 1 20 29,9 8 12 25 200 300 5 000 7 500 30 39,9 16 18 35 560 630 19 600 22 050 40 49,9 20 30 45 900 1 530 40 500 68 850 50 59,9 30 24 55 1 650 1 100 90 750 60 500 60 69,9 18 10 65 1 170 650 76 050 42 250 70 79,9 5 6 75 375 450 28 125 33 750 80 a více 3 85 255 21 675 Celkem 100 100 x 5 110 4 660 281 700 234 900 k _ i =1 x i i 5 110 4 660 aritmetický prùmìr x = muži = = 51,1, žey = k = 46,5. 100 100 i =1 i 1 k 1 k 2 2 Pro výpoèet použijeme vzorec vážeého rozptylu: s x = xi2 i x i i, i =1 i =1 16

Popisá statistika Kapitola 1 281 700 2 s x muži = 51,10 2 = 205,8 205,8 V x = = 0,281, 100 51,10 234 900 177,44 s x 2 žey = 46,6 2 = 177,44 V x = = 0,286. 100 46,6 I když z èíselých hodot variaèích koeficietù vyplývá, že vìtší stejorodost hodiových mezd (vìtší kocetraci kolem prùmìru) mají muži, elze považovat zjištìý malý rozdíl v difereciaci mezd za pøíliš výzamý. K důležitým vlastostem rozptylu patří: 1. Rozptyl lze vyjádřit jako průměr čtverců hodot zmešeý 2 o čtverec průměru ( s x = x 2 x 2 ). 2. Přičte-li se ke všem hodotám kostata a, pak se rozptyl ezměí ( s 2 x+a = s 2 x). 3. Násobí-li se všechy hodoty souboru kostatou k, pak rozptyl je zásobe čtvercem této kostaty ( s 2 kx = k 2 s 2 x). 1.4.3 Charakteristiky tvaru rozděleí Zázoríme-li jedorozměrá rozděleí četostí pomocí polygou, získáme možost posoudit tvar rozděleí, apř. polohu vrcholu, symetrii rozděleí, míru kocetrace hodot v určité části variačího rozpětí apod. Z těchto aspektů má ejvětší praktický výzam zjištěí míry symetrie (souměrosti) rozděleí četostí, protože tím lze výzamě obohatit hodoceí vypovídací cey všech popisých charakteristik souboru. Souměrá symetrická rozděleí jsou v ekoomické praxi spíše vzácostí. Zřetelým projevem asymetrie rozděleí je především odlišost hodot aritmetického průměru od mediáu a modu. Pro zcela symetrické rozděleí je aopak charakteristické, že všechy hlaví charakteristiky úrově jsou totožé: _ x = ~ x = ^x. U esymetrických rozděleí tato idetita eplatí. Graf A charakterizuje kladě zešikmeé rozděleí, pro které je obvyklé, že aritmetický průměr je meší ež mediá a modus: _ x > ~ x > ^x. Je to rozděleí s velkým akupeím hodot meších ež průměr. Teto typ rozděleí je v praxi typický apř. pro rozděleí mezd. GRAF A Rozděleí s kladou šikmostí 17

Kapitola 1 Edice učebích textů Statistika pro ekoomy GRAF B Záporě zešikmeé rozděleí, kde platí x > ~ x > ^x Jedoduchou charakteristikou šikmosti je Pearsoův koeficiet, který využívá k hodoceí stupě šikmosti vztah mezi velikostí aritmetického průměru a mediáu: 3 ( x _ ~ x ) =. (1.13) s x Pro symetrická rozděleí má ulovou hodotu. Velikost koeficietu a jeho zaméko pak ukazuje stupeň a charakter zešikmeí. Jiý přístup k měřeí šikmosti je založe a aplikaci tzv. mometových charakteristik. Při práci s daty uspořádaými do rozděleí četostí je vhodá tzv. mometová míra šikmosti (ozačovaá také jako třetí momet směrodaté proměé) se vzorcem: 1 k _ xi x 3 i. (1.14) i =1 s x Opět platí, že ulová hodota charakterizuje symetrická rozděleí a kladé a záporé hodoty vyjadřují růzý stupeň tzv. kladé a záporé šikmosti. 18

Popisá statistika Kapitola 1 Shrutí Tato kapitola byla věováa praktickým problémům zpracováí, prezetace a vstupí aalýzy dat získaých statistickým zjišťováím, kde je třeba vymezit statistickou jedotku, statistický zak (proměou, ukazatel) a statistický soubor. Pokud pracujeme s proměou, jejíž hodoty se ve statistickém souboru vyskytují opakovaě, je výhodé pro další aalýzu uspořádat hodoty zkoumaého souboru ve formě rozděleí četostí. To má za ásledek, že je třeba upravit i způsob výpočtu charakteristik, kterými popisujeme vlastosti statistického souboru. Rozlišujeme pak apř. prostý a vážeý aritmetický průměr, prostý a vážeý rozptyl. Má-li zkoumaý kvatitativí statistický zak (proměá) charakter spojité veličiy ebo příliš moho obmě, prezetujeme statistický soubor ve formě itervalového rozděleí četostí. Grafickým vyjádřeím rozděleí četostí je polygo. Grafickým vyjádřeím itervalového rozděleí četostí je histogram. O rozložeí hodot zkoumaé proměé ve statistickém souboru ás iformují kvatily. Typy kvatilů jsou rozlišey stupěm podrobosti, v kterém rozdělují soubor do stejě obsazeých částí. V praxi se ejčastěji setkáme s mediáem, kterým je soubor rozděle do dvou částí, a je tedy urče hodotou, která rozděluje soubor a 50 % prvků meších a 50 % prvků větších. Pro základí deskripci statistického souboru kvatitativího zaku používáme systém popisých charakteristik, který tvoří: míry úrově hodot souboru (míry polohy rozděleí četostí), míry variability hodot, míry šikmosti (asymetrie) rozděleí. K ejužívaějším mírám úrově patří aritmetický průměr, mediá a modus. V situacích, kdy hodota aritmetického průměru reprezetujícího statistický soubor je výrazě ovlivěa existecí extrémích hodot, je vhodé jako charakteristiku úrově použít mediá. Způsob výpočtu popisých charakteristik je odlišý, pracujeme-li s etříděými hodotami a s hodotami uspořádaými do rozděleí četostí. V případě, kdy údaje statistického souboru máme k dispozici ve formě rozděleí četostí, používáme vzorce vážeého aritmetického průměru a vážeého rozptylu, v ichž jako váhy vystupují četosti jedotlivých obmě statistického zaku. Při uspořádáí hodot statistického souboru ve formě itervalového rozděleí četostí je třeba počítat se ztrátou možosti získat přesou hodotu popisých charakteristik. K ejužívaějším mírám variability patří variačí rozpětí, rozptyl, směrodatá odchylka a variačí koeficiet. Pro porováváí variability ěkolika souborů dáváme předost variačímu koeficietu jako relativí míře variability. O souborech, kde úroveň všech hodot souboru je stejá, říkáme, že mají ulovou variabilitu. Pro hodoceí stupě asymetrie (šikmosti) rozděleí ás může iformovat jedak vzájemá poloha aritmetického průměru, mediáu a modu, jedak tzv. mometová míra šikmosti. V souborech zcela symetrických mají aritmetický průměr, mediá i modus totožou hodotu. U souborů, které jsou výrazě asymetrické, je třeba počítat s tím, že aritmetický průměr evyjadřuje typickou úroveň hodot souboru a při hodoceí dáváme předost iformaci získaé z mediáu. 19

Kapitola 1 Edice učebích textů Statistika pro ekoomy Klíčová slova aritmetický průměr modus mediá rozděleí četostí polygo itervalové rozděleí četostí histogram kvatily variabilita rozptyl variačí koeficiet směrodatá odchylka variačí rozpětí statistická jedotka statistický soubor statistický zak Řešeé příklady Příklad 1 Máme k dispozici údaje o hodiových mzdách 10 pracovíků jedoho odděleí firmy: 51, 58, 70, 64, 60, 50, 58, 55, 66 a 138. Chceme charakterizovat vhodou charakteristikou úroveň mezd v daém odděleí. Řešeí: Nabízí se především zjištěí aritmetického průměru hodiové mzdy: x _ i 670 x = = = 67 Kč. 10 Z kofrotace získaé hodoty aritmetického průměru s výchozími daty vyplývá, že prakticky všichi pracovíci až a jedoho mají podprůměrý plat. Přitom je zřejmé, že a výši průměru se výrazě podepsala evyšší hodiová mzda 138 Kč, která je však v daém souboru etypická (říkáme také odlehlá, extrémí). Charakteristikou, která by ás v daém případě lépe iformovala o typické úrovi mezd v souboru, je mediá, protože te obecě eí ovlivě extrémími hodotami v souboru. Pro jeho výpočet v prvím kroku seřadíme jedotlivé hodoty souboru podle velikosti a ke každé přiřadíme pořadové číslo: Pořadí 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. x i 50 51 55 58 58 60 64 66 70 138 + 1 11 Pořadové číslo prostředí hodoty staovíme jako = = 5,5. Z toho vyplývá, že 2 2 hodota mediáu ebude dáa ěkterou kokrétí hodotou zkoumaého souboru, ale odhademe ji jako průměr ze dvou prostředích hodot (z 5. a 6. hodoty): 58 + 60 ~ x = = 59. 2 Zjištěá hodota mediáu 59 Kč ám v ašem případě daleko výstižěji charakterizuje typickou úroveň platů v odděleí. 20