STATISTIKA PRO EKONOMY



Podobné dokumenty
Deskriptivní statistika 1

Pro statistické šetření si zvolte si statistický soubor např. všichni žáci třídy (několika tříd, školy apod.).

P2: Statistické zpracování dat

Statistika je vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter.

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

STATISTIKA PRO EKONOMY

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

12. N á h o d n ý v ý b ě r

13 Popisná statistika

Statistika. Statistické funkce v tabulkových kalkulátorech MSO Excel a OO.o Calc

Pravděpodobnost a aplikovaná statistika

Elementární zpracování statistického souboru

Základy statistiky. Zpracování pokusných dat Praktické příklady. Kristina Somerlíková

Popisná statistika - zavedení pojmů. 1 Jednorozměrný statistický soubor s kvantitativním znakem

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

Parametr populace (populační charakteristika) je číselná charakteristika sledované vlastnosti

2 STEJNORODOST BETONU KONSTRUKCE

Odhady parametrů 1. Odhady parametrů

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

Závislost slovních znaků

6. P o p i s n á s t a t i s t i k a

VYSOCE PŘESNÉ METODY OBRÁBĚNÍ

veličiny má stejný řád jako je řád poslední číslice nejistoty. Nejistotu píšeme obvykle jenom jednou

Náhodný výběr 1. Náhodný výběr

vají statistické metody v biomedicíně

vají statistické metody v biomedicíně Literatura Statistika v biomedicínsk nském výzkumu a ve zdravotnictví

Tento projekt je spolufinancován Evropským sociálním fondem a Státním rozpočtem ČR InoBio CZ.1.07/2.2.00/

1 ROVNOMĚRNOST BETONU KONSTRUKCE

8. Základy statistiky. 8.1 Statistický soubor

Mezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby.

Intervalové odhady parametrů některých rozdělení.

1.3. POLYNOMY. V této kapitole se dozvíte:

1. Základy počtu pravděpodobnosti:

MATICOVÉ HRY MATICOVÝCH HER

4 DOPADY ZPŮSOBŮ FINANCOVÁNÍ NA INVESTIČNÍ ROZHODOVÁNÍ

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

III/2 Inovace a zkvalitnění výuky prostřednictvím ICT

1. ZÁKLADY VEKTOROVÉ ALGEBRY 1.1. VEKTOROVÝ PROSTOR A JEHO BÁZE

STATISTIKA. Základní pojmy

České vysoké učení technické v Praze. Fakulta dopravní. Semestrální práce. Statistika

Základní požadavky a pravidla měření

10.3 GEOMERTICKÝ PRŮMĚR

Co je to statistika? Statistické hodnocení výsledků zkoušek. Úvod statistické myšlení. Úvod statistické myšlení. Popisná statistika

Intervalové odhady parametrů

Statistika pro metrologii

(Teorie statistiky a aplikace v programovacím jazyce Visual Basic for Applications)

Popisná statistika. Zdeněk Janák 9. prosince 2007

Tržní ceny odrážejí a zahrnují veškeré informace předpokládá se efektivní trh, pro cenu c t tedy platí c t = c t + ε t.

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

2. Náhodná veličina. je konečná nebo spočetná množina;

Zhodnocení přesnosti měření

Mod(x) = 2, Med(x) = = 2

Sekvenční logické obvody(lso)

Pravděpodobnostní modely

L A B O R A T O R N Í C V I Č E N Í Z F Y Z I K Y

Intervalový odhad. nazveme levostranným intervalem pro odhad parametru Θ. Statistiku. , kde číslo α je blízké nule, nazveme horním

Mendelova univerzita v Brně Statistika projekt

Náhodu bychom mohli definovat jako součet velkého počtu drobných nepoznaných vlivů.

17. Statistické hypotézy parametrické testy

Vzorový příklad na rozhodování BPH_ZMAN

základním prvkem teorie křivek v počítačové grafice křivky polynomiální n

8.2.1 Aritmetická posloupnost I

6. Posloupnosti a jejich limity, řady

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Komplexní čísla. Definice komplexních čísel

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

4.2 Elementární statistické zpracování Rozdělení četností

Doc. Ing. Dagmar Blatná, CSc.

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

} kvantitativní znaky. korelace, regrese. Prof. RNDr. Jana Zvárov. Obecné principy

Kvantová a statistická fyzika 2 (Termodynamika a statistická fyzika)

Při sledování a studiu vlastností náhodných výsledků poznáme charakter. podmínek různé výsledky. Ty odpovídají hodnotám jednotlivých realizací

f x a x DSM2 Cv 9 Vytvořující funkce Vytvořující funkcí nekonečné posloupnosti a0, a1,, a n , reálných čísel míníme formální nekonečnou řadu ( )

Přednáška VI. Intervalové odhady. Motivace Směrodatná odchylka a směrodatná chyba Centrální limitní věta Intervaly spolehlivosti

7. P o p i s n á s t a t i s t i k a

2.4. INVERZNÍ MATICE

Matematika 1. Katedra matematiky, Fakulta stavební ČVUT v Praze. středa 10-11:40 posluchárna D / 13. Posloupnosti

Pojem času ve finančním rozhodování podniku

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE

Matematika I, část II

1. Měření ve fyzice, soustava jednotek SI

8.2.1 Aritmetická posloupnost

Úloha III.S... limitní

DERIVACE FUNKCÍ JEDNÉ REÁLNÉ PROM

2. Znát definici kombinačního čísla a základní vlastnosti kombinačních čísel. Ovládat jednoduché operace s kombinačními čísly.

Úloha II.S... odhadnutelná

U klasifikace podle minimální vzdálenosti je nutno zvolit:

Pravděpodobnost a statistika - absolutní minumum

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

11. P o p i s n á s t a t i s t i k a

IAJCE Přednáška č. 12

14. Testování statistických hypotéz Úvod statistické hypotézy Definice 14.1 Statistickou hypotézou parametrickou neparametrickou. nulovou testovanou

Veterinární a farmaceutická univerzita Brno. Základy statistiky. pro studující veterinární medicíny a farmacie

Modelování jednostupňové extrakce. Grygar Vojtěch

z možností, jak tuto veličinu charakterizovat, je určit součet

Spojitost a limita funkcí jedné reálné proměnné

PODNIKOVÁ EKONOMIKA A MANAGEMENT (2-letý) (písemný test, varianta B)

NEPARAMETRICKÉ METODY

3. Lineární diferenciální rovnice úvod do teorie

Transkript:

EDICE UČEBNÍCH TEXTŮ STATISTIKA PRO EKONOMY EDUARD SOUČEK V Y S O K Á Š K O L A E K O N O M I E A M A N A G E M E N T U

Eduard Souček Statistika pro ekoomy UČEBNÍ TEXT VYSOKÁ ŠKOLA EKONOMIE A MANAGEMENTU Praha 006

Úvod Úvod Úvod Cílem této učebí pomůcky je podat výklad základích statistických metod, s kterými ekoom přichází v praxi do styku a které acházejí široké uplatěí při zpracováí, prezetaci a aalýze hospodářských a sociálích jevů. Výběr metod a způsob jejich objasěí je podříze zájmu a zdůrazěí postupů a aplikací, které jsou typické pro aalytickou a rozhodovací čiost ekoomů a maažerů. Obecě platí, že ideové zvládutí statistického přístupu k hodoceí čísel zobrazujících reálý svět má dvojí výzam. V prvé řadě je předpokladem pro kvalifikovaé využíváí číselých iformací, s kterými se v ekoomickém prostředí deě setkáváme. V druhé řadě je to ezbytý prví krok pro racioálí uplatěí výpočetí techiky v práci se statistickými daty. I v oblasti aplikace statistických metod existuje bohatá abídka specializovaého statistického softwaru, jehož účelé využíváí však vyžaduje dobrou zalost statistických procedur a zejméa jejich cílů a podmíek jejich použití. Skriptum je kocipováo tak, aby obsáhlo všecha základí témata stadardího kurzu statistiky. Výklad jedotlivých partií eí příliš zatíže popisem teorie a důkazy a akcetuje objasňováí praktické stráky statistických metod, jejich použitelosti při řešeí typických statistických úloh a také při řešeí problémů spojeých s iterpretací a hodoceím výsledků. Doc. Ig. Eduard Souček, CSc. Vysoká škola ekoomie a maagemetu 5

kapitola 1 Popisá statistika

Popisá statistika Kapitola 1 1. kapitola Popisá statistika Úvod Statistický přístup ke zkoumáí sociálě-ekoomické reality vychází z potřeby získáí základích číselých popisých charakteristik statistického souboru, a základě kterých by bylo možo v přehledé podobě jedozačě specifikovat vlastosti hodoceého souboru. K tomuto účelu slouží především dvě základí kategorie popisých měr: míry úrově a míry variability hodot. Zalost těchto měr je eje výchozím bodem každé věcé aalýzy, ale i podmíkou pro případé komparace více statistických souborů. Studium této kapitoly objasí Cíle popisu statistického souboru popisými charakteristikami. Způsoby prezetace dat v tabulkových a grafických formách. Výpočet a použití charakteristik úrově. Výpočet a použití charakteristik variability. Výpočet a použití charakteristik symetrie rozděleí. Vzik statistiky Termí statistika je odvoze od latiského status, což v latiě zameá stav a ve slovím spojeí status rei republicae je to stav věci veřejé eboli stát. Od tohoto výzamu vzikla v 16. a 17. století italská slova statistica pro ozačeí souhru zalostí o státích záležitostech. Teto termí se pak rozšířil v podobém výzamu i meziárodě. Čiosti blízké statistice však mají daleko starší historii. Zámá jsou sčítáí lidí před ěkolika tisíciletími v Egyptě a v Číě. Běžá byla zjišťováí pro účely vojeské a daňové ve starém Římě. S prvími badatelskými aplikacemi statistiky se setkáváme v Aglii (Joh Graut, 160 1674, a William Petty, 163 1687), kdy byla shromažďováa data pro zkoumáí pravidelostí v úmrtosti a porodosti obyvatelstva. Graut a Petty již usilovali o zobecěí výzamu jedotlivých případů tím, že zkoumali skutečosti, které mají povahu hromadého jevu. Svůj postup zkoumáí ozačil Petty jako politickou aritmetiku, aby tak vyjádřil fakt, že zkoumá skutečosti důležité pro stát a současě, že jde o číselé charakterizováí hodoceých jevů. Výzamým vkladem pro teoretické zázemí statistických metod byl rozvoj počtu pravděpodobosti. Prví kroky počtu pravděpodobosti jsou spojey s matematickými výpočty u hazardích her. Další vývoj teorie pravděpodobosti je spoje se jméy slavých matematiků (B. Pascal, J. Beroulli, T. Bayes, P. S. Laplace, K. F. Gauss, P. L. Čebyšev, A. A. Markov a další). 9

Kapitola 1 Edice učebích textů Statistika pro ekoomy Pojetí statistiky Pojem statistika se v současosti používá ve třech výzamech: a) pro vyjádřeí souhru dat o hromadých jevech, b) pro čiost směřující k získáváí statistických dat, jejich uspořádáí a zpracováí a ásledou prezetaci, c) pro metodologickou vědu, jejímž cílem je zkoumáí zákoitostí hromadých jevů a kterou tvoří metodologie zjišťováí, zpracováí a aalýzy dat. Chápeme-li statistiku v uvedeém třetím výzamu, tedy jako metodologickou vědu, zjistíme, že jsou pro i přízačé dvě skutečosti: 1. Jejím předmětem jsou hromadé jevy, e jevy jediečé a eopakovatelé. Zameá to, že statistiku ezajímá kokrétí jediec (předmět, objekt, událost) sám o sobě, ale je jako součást souboru jediců. Cílem statistiky je geeralizace založeá a zkoumáí souborů případů.. Zkoumaé pozatky o hromadých jevech vyjadřuje statistickými daty. V tomto pojetí, jež chápe statistiku jako metodologickou disciplíu, která zkoumá svými specifickými metodami hromadé jevy, se bude statistikou zabývat teto učebí text. 10

Popisá statistika Kapitola 1 1.1 Základí statistické pojmy 1.1.1 Statistický soubor a statistická jedotka Zkoumáí hromadých jevů předpokládá defiováí z hlediska účelu zkoumáí vymezeé možiy objektů, prvků zkoumáí eboli statistického souboru (soubor podiků, soubor obyvatelstva, soubor událostí apod.). Jedotlivé objekty, prvky statistického souboru, ozačujeme jako statistické jedotky. Jsou ositeli vlastostí daého souboru. Počet jedotek statistického souboru se azývá rozsah souboru. Soubory, které jsou předmětem zkoumáí, ozačujeme jako základí soubor (ěkdy se základí soubor ozačuje jako populace). V praxi často z růzých důvodů epracujeme s celým rozsahem statistického souboru, ale je se vzorkem statistických jedotek eboli s výběrovým souborem. K tomu dochází buď proto, že zkoumáí celého statistického souboru by bylo ákladé, časově zdlouhavé ebo z jiých praktických ohledů euskutečitelé, a dále proto, že zobecěí provedeé z dat výběrového souboru považujeme pro daý účel zkoumáí za dostatečě přesé a z hlediska pozáí za reprezetativí. 1.1. Statistický zak Zkoumaé vlastosti statistického souboru sleduje statistika prostředictvím měřitelých vlastostí statistických jedotek, které vyjadřuje tzv. statistickými zaky. Statistický zak abývá slovích ebo číselých hodot a je zjišťová u každé statistické jedotky statistického souboru. Jestliže ve statistickém souboru pracujeme je s jedím zakem (s jedou proměou), říkáme, že se jedá o jedorozměrý soubor, máme-li současě více zaků, jde o dvou-, tří-, resp. obecě vícerozměrý soubor. Základím tříděím statistických zaků je rozlišováí zaků číselých (kvatitativích, umerických) a zaků slovích (kvalitativích, alfabetických, kategoriálích). Číselé statistické zaky bezprostředě vyjadřují sledovaé vlastosti čísly (apř. při zkoumáí souboru pracovíků podiku jsou to zaky jako mzda, věk, doba praxe). Rozlišujeme zaky spojité (kotiuálí), které mohou teoreticky abývat libovolých reálých číselých hodot v určitém itervalu (průtok vody, hmotost výrobku, výška, peěží obrat apod.) a zaky espojité (diskrétí), které mohou abývat pouze určitých číselých hodot v oboru reálých čísel (počet pracovíků, počet prodaých výrobků, počet čleů domácosti apod.). Jsou-li hodoty statistického zaku vyjádřey slově, azývá se takový zak sloví (apř. u osob je to vzděláí, odvětví čiosti, árodost, pohlaví). Zvláští skupiou slovích statistických zaků jsou ordiálí (pořadové) zaky. Ty jsou takové, že jejich obměy lze podle ějakého objektivího kritéria seřadit od ejmeší obměy do ejvětší, apř. a základě ějakého expertího ohodoceí. Taková situace vziká kupř. při posuzováí kvality výrobku, kdy výrobky jsou a základě hodoceí expertů seřazey od ejlepšího k ejhoršímu. Namísto slovího popisu obmě pak u ordiálích zaků můžeme pracovat s pořadovými čísly jako s určitou formou kvatifikace těchto obmě. 11

Kapitola 1 Edice učebích textů Statistika pro ekoomy 1. Zjišťováí a prezetace statistických dat Statistické zkoumáí prochází postupě ěkolika pracovími etapami. Výchozí etapou je statistické zjišťováí (statistické šetřeí). Cílem je získáváí ezámých statistických dat o hodotách statistických zaků u jedotlivých statistických jedotek, které tvoří statistický soubor. Každé statistické zjišťováí má určitý kokrétí účel, z kterého vyplývá, jaké proměé statistické zaky budeme zjišťovat, co zvolíme za statistickou jedotku a jak vymezíme statistický soubor. Orgaizace statistického zjišťováí musí obsahovat prostorové, věcé a časové vymezeí statistického souboru a statistických zaků. Např. při zjišťováí ekoomických výsledků průmyslových podiků musí orgaizátor šetřeí staovit, zda bude prostorově vymeze okruh průmyslových podiků územím České republiky ebo ějakým jiým regioem a zda o zařazeí podiku do kokrétího území bude rozhodovat umístěí sídla podiku ebo ějaké jié hledisko. Věcé vymezeí musí defiovat, co považujeme za průmyslový podik a jakými ukazateli budeme charakterizovat ekoomické výsledky každého podiku (objem produkce, retabilita, produktivita práce, zisk apod.). Při časovém vymezeí půjde o staoveí kokrétího časového itervalu ebo rozhodého časového okamžiku, ke kterému se budou jedotlivé zjišťovaé údaje vztahovat. Elemetárí zpracováí výsledků statistického zjišťováí Výsledky statistického zjišťováí mají obvykle povahu velkého a epřehledého možství číselých údajů, které je třeba pro aalýzu vhodě uspořádat a utřídit. Tříděím rozumíme rozděleí jedotek souboru do skupi tak, aby vyikly charakteristické vlastosti zkoumaých jevů. Provádíme-li tříděí podle obmě jedoho statistického zaku, mluvíme o tříděí jedostupňovém. Tříděí podle více statistických zaků ajedou ozačujeme jako tříděí vícestupňové. Je-li třídicím zakem číselý (kvatitativí) zak s malým počtem obmě, pak vhodým uspořádáím statistických dat je tabulka rozděleí četostí, kdy apozorovaé hodoty ejprve uspořádáme podle velikosti a ke každé variatě přiřadíme počty statistických jedotek, které udávají, s jakou četostí se jedotlivé variaty hodot vyskytují. Ozačíme-li obměy číselého statistického zaku a četosti i a předpokládáme-li, že tříděím vziklo k obmě, pak tabulku rozděleí četostí lze formálě vyjádřit takto: TABULKA 1.1 Rozděleí četostí Obměa hodoty zaku Četost i x 1 1 x M M x k Celkem k k Souhr četostí za k řádků 1 + + + k je rove rozsahu souboru : i =. Tímto způsobem lze především vyjadřovat rozděleí četostí espojitého statistického zaku. Např. při prezetaci velikostí struktury souboru domácostí budou obměami hodot zaku jedotlivé vyskytující se variaty počtu čleů domácostí a četostmi jsou údaje o počtu domácostí u jedotlivých obmě. i 1 1

Popisá statistika Kapitola 1 Sledujeme-li espojitý statistický zak s velkým počtem obmě ebo pracujeme-li se spojitým statistickým zakem, pak uvedeý způsob prezetace výsledků statistického šetřeí by epřiesl žádoucí zpřehleděí statistických dat. V takových případech amísto obmě jedotlivých číselých hodot přecházíme a itervaly hodot a přehledost výsledků regulujeme počtem a šířkou zvoleých itervalů. Výsledá tabulka je ozačováa jako itervalové rozděleí četostí. Při sestavováí itervalového rozděleí četostí je třeba především vyřešit problém staoveí počtu a tím velikosti itervalů. Obvykle volíme řešeí, které eohrožuje příliš iformačí hodotu výsledků. Příliš široké itervaly sižují kvalitu prezetace, příliš úzké aopak zhoršují přehledost a zvyšují rozsah tabulky. Dalším problémem itervalového rozděleí četostí je volba hraic itervalů, aby edocházelo k ejasostem, do kterého itervalu se mají jedotlivé jedotky zařadit. Nejčastěji se hraice itervalů volí tak, aby se itervaly epřekrývaly. Např. při charakterizováí věkové struktury obyvatelstva pětiletými věkovými skupiami se používají itervaly 0 4, 5 9, 10 14, 15 19 atd. V praxi se často eobejdeme bez tzv. otevřeých itervalů, při jejich použití bychom však měli být opatrí a používat je je pro itervaly s malou četostí, kde ehrozí ebezpečí příliš velké iformačí ztráty. Např. u již zmíěé věkové struktury obyvatelstva to může být otevřeý iterval: 85 a více let. Při výpočtech statistických charakteristik vziká problém, jaká hodota by ve výpočtu měla zastoupit (reprezetovat) jedotlivé itervaly. Za tuto zastupitelou hodotu se zpravidla volí střed itervalu. Grafy rozděleí četostí Nejzámějším grafem rozděleí četostí je tzv. polygo (řecky mohoúhelík), který v pravoúhlém souřadicovém systému používá osu x pro obměy zaku x a osu y pro četosti 1. Pro grafické vyjádřeí itervalového rozděleí četostí se používá histogram. Velikost četostí je vyjádřea sloupci, jejichž základa je rova šířce itervalu. A. Polygo četostí Příklad: rozděleí četostí počtu žáků podle zámky z matematiky OBRÁZEK 1.1 Polygo četosti Zámka Počet žáků 1 8 18 3 14 4 6 5 4 Celkem 50 Počet žáků 0 15 10 5 0 1 3 4 5 Zámka 13

Kapitola 1 Edice učebích textů Statistika pro ekoomy B. Histogram četostí Příklad: itervalového rozděleí četostí počtu škol podle průměrého počtu žáků a 1 třídu OBRÁZEK 1. Histogram četosti Průměrý počet žáků a třídu Počet škol Střed itervalu 16 17,99 6 17 18 19,99 10 19 0 1,99 1 3,99 16 3 4 5,99 10 5 6 7,99 4 7 8 9,99 9 Celkem 70 X V případě, že jedotlivé itervaly zastoupíme středy itervalů, můžeme itervalové rozděleí četostí graficky vyjádřit i polygoem. Relativí a kumulativí četosti Abychom mohli vzájemě porovávat růzá rozděleí četostí a jejich struktury v růzě velkých statistických souborech, používáme amísto absolutích četostí relativí četosti p i, které získáme jako poměr dílčích četostí a rozsahu souboru: i p i =. (1.1) U souboru většího rozsahu se relativí četosti zpravidla vyjadřují v procetech. Pro aalýzy struktury souboru z hlediska určité vlastosti může být také užitečé zjistit, jaký podíl jedotek má hodotu meší ebo rovou příslušé variatě. K tomu používáme tzv. kumulativí četosti (absolutí ebo relativí). Získáme je postupým ačítáím četostí po sobě ásledujících tříd. 14

Popisá statistika Kapitola 1 PŘÍKLAD 1.1 Za podik máme k dispozici itervalové rozdìleí èetostí hodiových mezd v èleìí a muže a žey. Iterval hodiových Počet pracovíků Relativí četosti v % Kumulativí relativí četosti v % mezd v Kč Muži Žey Muži Žey Muži Žey 0 9,9 40 4 8 1 8 1 30 39,9 80 36 16 18 4 30 40 49,9 100 60 0 30 44 60 50 59,9 150 48 30 4 74 84 60 69,9 90 0 18 10 9 94 70 79,9 5 1 5 6 97 100 80 a více 15 3 100 100 Celkem 500 00 100 100 X X Pøíklad ilustruje, jak je možo øešit problém epøekrýváí itervalù. Iterval v posledím øádku ozaèujeme jako otevøeý iterval. 1.3 Kvatily Kvatil je hodota proměé určeá tak, že odděluje určitý podíl jedotek, které jsou meší ež tato hodota. Např. dvacetipětiprocetí kvatil ~ x 5 odděluje 5 % malých hodot a současě 75 % velkých hodot. Tímto způsobem můžeme pak, kupř. při hodoceí úrově mezd pracovíků v árodím hospodářství, charakterizovat, jaká mzdová hraice odděluje 5 % pracovíků s ejižšími mzdami. V praxi se používají zejméa tyto skupiy kvatilů: Kvartily (x ~ ~ ~ 5, x 50, x 75 ) patří mezi kvatily, které rozdělují uspořádaou řadu hodot a 4 stejé části: prví (dolí) kvartil x ~ 5, který odděluje 5 % jedotek s ejižšími hodotami, druhý (prostředí) kvartil ~ x 50, který odděluje 50 % jedotek s ízkými hodotami a 50 % hodot s vysokými hodotami. Teto padesátiprocetí kvatil se také ozačuje jako mediá (od latiského medius prostředí). Třetí kvartil (horí) ~ x 75 odděluje 75 % jedotek s ízkými hodotami od 5 % jedotek s vyššími hodotami. Decily (x ~ ~ ~ 10, x 0,..., x 90 ) rozdělují uspořádaou řadu a 10 stejých částí. Cetily, resp. percetily ( ~ x ~ ~ 1, x,..., x 99 ) rozdělují uspořádaou řadu hodot a 100 stejě početých částí. Nejužívaějším kvatilem je mediá, který představuje prostředí hodotu uspořádaého souboru, a je tedy svou vypovídací hodotou blízký aritmetickému průměru. Je-li rozsah souboru udá sudým číslem, obsahuje soubor dvě prostředí hodoty. V tomto případě bývá zvykem volit za mediá průměr z těchto dvou prostředích hodot a mediá pak eí kokrétí hodotou původího souboru. Mediáu dáváme předost před aritmetickým průměrem v těch situacích, kdy aritmetický průměr je výrazě ovlivě existecí extrémích hodot v souboru a poskytuje zkresleý obraz o úrovi hodot, zatímco hodota, která v daém souboru je co do velikosti prostředí, je vůči extrémům imuí. 15

Kapitola 1 Edice učebích textů Statistika pro ekoomy Z povahy kvatilů je zřejmé, že prvím krokem při jejich výpočtu je uspořádáí všech hodot sledovaého zaku podle velikosti. Pak staovíme pořadové číslo statistické jedotky, jejíž hodota je hledaým kvatilem. Ozačíme-li toto pořadové číslo z p, pak platí: z p = p + 0,5, (1.) kde je rozsah souboru a p je relativí četost ejižších hodot. Např. pořadové číslo z p pro 1. kvartil ( ~ x 5 ) v souboru = 80 zjistíme takto: z 5 = 80. 0,5 + 0,5 = 0,5. Při odvozováí pořadového čísla z p z četostí vyjádřeých v procetech se hodota 0,5 ve vzorci obvykle zaedbává. Poěkud složitější je výpočet kvatilů z itervalového rozděleí četostí. Pokud se spokojíme pouze s určeím itervalu, v ěmž hledaý kvatil leží, je postup stejý jako v předchozím případě. Chceme-li kvatil odhadout jedím kokrétím číslem, je třeba použít při výpočtu lieárí iterpolaci založeou a předpokladu, že ve stejých proporcích, v jakých rozděluje pořadové číslo hledaého kvatilu iterval četostí, rozděluje kvatil iterval hodot. Teto postup hypoteticky předpokládá, že v itervalu, kde leží hledaý kvatil, jsou hodoty rozděley rovoměrě. PŘÍKLAD 1. Hledáme hodotu všech tøí kvartilù (~x 5, ~x 50, ~x 75 ) v rozdìleí èetostí hodiových mezd v ávazosti a údaje z pøíkladu 1.1. Výpoèet provedeme zvlášś za muže a žey. Využijeme k tomu posledí dva sloupce obsahující v procetech vyjádøeé kumulativí èetosti: Iterval hodiových mezd v Kč Relativí četosti v % Kumulativí relativí četosti v % Muži Žey Muži Žey 0 9,9 8 1 8 1 30 39,9 16 18 4 30 40 49,9 0 30 44 60 50 59,9 30 4 74 84 60 69,9 18 10 9 94 70 79,9 5 6 97 100 80 a více 3 100 100 Celkem 100 100 X X Pro staoveí jedotlivých kvartilù potøebujeme zjistit k poøadovým èíslùm z 5, z 50 a z 75 odpovídající hodoty mezd: Hodiové mzdy mužù Ze sloupce kumulativích èetostí zjistíme, že poøadové èíslo 5 patøí do tøetího itervalu s hodotami 40 až 49,9 Kè, chápaé vždy zaokrouhleì jako 50 Kè. Z tìchto podkladù mùžeme pro pøibližý výpoèet prvího kvartilu použít lieárí iterpolaci, pøi které bude jeho hodota rozdìlovat teto iterval ve stejém pomìru, jako poøadové èíslo 5 rozdìluje odpovídající iterval èetostí: ~ x5 40 5 4 =. 50 40 44 4 Z toho pak sado odvodíme, že: 1 ~ x5 = 40 + 10 = 40,5. 0 6 1 Podobì zjistíme, že: ~ x 50 = 50 + a ~ x 75 = 60 + 10 = 60,6. 30 18 16

Popisá statistika Kapitola 1 Hodiové mzdy že ~x 5 = 37, ~x 50 = 46,7 ~x 75 = 56,. 1.4 Statistické charakteristiky 1.4.1 Charakteristiky úrově Úroveň jevů vyjadřovaých kvatitativími zaky vyjadřují středí hodoty. Ty v kocetrovaé podobě shrují iformaci obsažeou v údajích o statistickém zaku. Hlaví skupiu středích hodot tvoří průměry (aritmetický průměr, geometrický průměr, harmoický průměr), jejichž společou vlastostí je, že jsou určováy ze všech aměřeých hodot zaku. Druhou skupiu středích hodot tvoří tzv. pozičí středí hodoty (mediá a modus), které jsou určey pozicí ěkterých jedotek souboru. Mediá ~ x je urče hodotou zaku, kterou má jedotka statistického souboru s hodotou co do velikosti prostředí. Modus ^x je urče hodotou zaku u jedotek, které jsou v souboru ejčastěji zastoupey, jiak řečeo, tou hodotou souboru, která má ejvětší četost. A. Průměry Aritmetický průměr x Je ejzámějším a ejužívaějším typem průměru. Ze zjištěých hodot x 1, x,... x za -čleý statistický soubor jej lze vypočítat takto: _ 1 x = x. (1.3) i i =1 Tuto formu aritmetického průměru azýváme prostý aritmetický průměr. Výpočet epředpokládá žádé předběžé uspořádáí hodot. Aritmetický průměr je použitelý všude tam, kde má ějaký iformačí smysl součet hodot. Pokud jsou hodoty statistického souboru uspořádáy do rozděleí četostí, což je zejméa případ velkých souborů a souborů, kde stejé obměy hodot statistického zaku má vždy více statistických jedotek, předchozí vzorec upravujeme do tvaru, který se ozačuje jako vážeý aritmetický průměr. Při jeho použití využíváme skutečost, že k úhru všech hodot můžeme dospět přes staoveí pomocých součiů i pro k obmě zaku. Vzorec vážeého aritmetického průměru pak zapisujeme takto: _ i =1 1 x =, resp. jako x _ = x. (1.4) k i i i =1 i =1 i k 17

Kapitola 1 Edice učebích textů Statistika pro ekoomy Četosti 1,,..., k zde vystupují jako váhy k jedotlivým obměám hodot. Máme-li k dispozici itervalové rozděleí četostí, bereme při výpočtu aritmetického průměru za hodoty zaku středy odpovídajících itervalů. Chceme porovat aritmetický průměr hodiových mezd mužů a že v ávazosti a údaje z příkladu 1.: PŘÍKLAD 1.3 Iterval hodiových mezd v Kč Relativí četosti v % i Středy itervalů i xi Muži Žey Muži Žey 0 9,9 8 1 5 00 300 30 39,9 16 18 35 560 630 40 49 0 30 45 900 1 530 50 59 30 4 55 1 650 1 100 60 69,9 18 10 65 1 170 650 70 79,9 5 6 75 375 450 80 a více 3 _ 85 55 _ Celkem 100 100 X 5 110 4 460 Pro výpoèet aritmetického prùmìru z itervalového rozdìleí èetostí použijeme vážeý aritmetický prùmìr, v kterém jsou hodoty zaku zastoupey støedy itervalù: k _ i =1 i 5 110 4 660 x = muži = = 51,10 žey = k = 46,60. 100 100 i =1 i Použití vážeého aritmetického průměru přichází v úvahu i tam, kde váhy ejsou odvozey z četostí, ale z relativího výzamu (důležitosti) jedotlivých hodot. Např. při hodoceí likvidity podiku musíme počítat s tím, že jedotlivá aktiva podiku mají růzou schopost využití pro spláceí krátkodobých závazků. Proto se v této oblasti setkáváme s tím, že k jedotlivým aktivům jsou a základě expertího oceěí přiřazováy váhy, určující důležitost daé skupiy aktiv z hlediska likvidity podiku. Celkový (průměrý) ukazatel likvidity je pak vážeým aritmetickým průměrem z objemů peěžích prostředků, vázaých v jedotlivých skupiách aktiv, kdy jako váhy vystupují ějaké koeficiety kvality aktiv z hlediska stupě likvidity. PŘÍKLAD 1.4 Pøi souhrém hodoceí studijích výsledkù z urèitého pøedmìtu chceme použít bodových výsledkù ze tøí testù, dvou prùbìžých a jedoho závìreèého. Bodùm z prùbìžých testù dáváme stejou 5% váhu a závìreèému testu 50% váhu. Pøedpokládejme, že studet získal v prùbìžých testech 60 a 80 bodù a v závìreèém 5 bodù. Celkový prùmìr _ x = 1/100 (60. 5 + 80. 5 + 5. 50) = 61 bodù. 18

Popisá statistika Kapitola 1 K důležitým vlastostem aritmetického průměru patří: 1. Součet odchylek jedotlivých hodot od jejich aritmetického průměru je ulový.. Součet čtverců odchylek jedotlivých hodot od průměru je miimálí. 3. Trasformace jedotlivých hodot přičteím (ebo odečteím) kostaty zvýší (ebo síží) aritmetický průměr o tuto kostatu. 4. Při trasformaci jedotlivých hodot ásobeím (ebo děleím) eulovou kostatou je i aritmetický průměr zásobe (ebo vyděle) touto kostatou. Geometrický průměr Je defiová pro kladé hodoty x jako -tá odmocia ze součiu těchto hodot: x G = x, x,... x. (1.5) 1 Má uplatěí tam, kde má iformačí smysl souči hodot. K použití geometrického průměru při výpočtu průměrého koeficietu růstu se vrátíme v kapitole věovaé časovým řadám. Harmoický průměr Je defiová jako poměr mezi rozsahem souboru a součtem převratých hodot: x H =. 1 (1.6) i =1 Má uplatěí tam, kde má iformačí smysl součet převratých hodot. B. Ostatí středí hodoty Do této skupiy řadíme mediá a modus jako tzv. pozičí středí hodoty. Mediá ~ x Je padesátiprocetím kvatilem, který charakterizuje hodotu souboru co do velikosti prostředí. Odděluje poloviu hodot meších od poloviy hodot větších. Mediá je a rozdíl od aritmetického průměru ecitlivý k extrémím hodotám, protože závisí pouze a jedé, ejvýše dvou prostředích hodotách souboru. Nemůže být tedy zkresle ai přítomostí ějaké chybé extrémí hodoty. Výhodou mediáu je i to, že jej můžeme staovit i u itervalových rozděleí četostí s otevřeými itervaly u miimálích a maximálích hodot. Modus ^x Představuje hodotu, která je v rámci šetřeého souboru ejtypičtější. Jiak řečeo, jde o ejčetější hodotu zaku. Také modus eí ovlivě extrémími hodotami. V případě itervalového rozděleí četostí se při staoveí modu spokojujeme buď s určeím modálího (ejčetějšího) itervalu, ebo v rámci tohoto itervalu modus odhadujeme, apř. středem itervalu. Existují však i přesější postupy, které vycházejí z rekostrukce vrcholu souboru podle rozděleí četostí v okolí modálího itervalu. Pokud se spokojíme je s určeím modálího itervalu, pak je třeba si uvědomit, že má smysl jej určovat pouze tehdy, jsou-li všechy itervaly stejě velké. Modus považujeme za důležitou doplňkovou charakteristiku k aritmetickému průměru. Pokud se obě míry úrově výzaměji liší, pak to zameá, že aritmetický průměr evyjadřuje dobře typickou úroveň hodot souboru, apř. pro existeci extrémích hodot ebo pro asymetrické rozložeí četostí. 19

Kapitola 1 Edice učebích textů Statistika pro ekoomy 1.4. Charakteristiky variability Variabilitou (mělivostí) kvatitativího statistického zaku rozumíme kolísáí hodot této veličiy. Pokud soubor obsahuje všechy hodoty stejé ( = kostata), mluvíme o ulové variabilitě. Kolísáí hodot v souboru můžeme posuzovat buď jako vzájemou rozdílost jedotlivých hodot sledovaé veličiy, ebo jako rozdílost jedotlivých hodot od aritmetického průměru. Teto druhý pricip měřeí variability převažuje. Měřeí variability lze využít k hodoceí stejorodosti (homogeity) souboru a také k posuzováí kvality iformace, kterou o úrovi hodot v souboru poskytla ěkterá ze středích hodot.vycházíme přitom z úvahy, že čím je soubor stejorodější, s meší variabilitou, tím je apř. aritmetický průměr výstižější z hlediska hodoceí úrově hodot souboru. V ekoomické praxi mají míry variability uplatěí apř. při hodoceí rovoměrosti dodávek, prodeje ebo výroby, při hodoceí stability ukazatele v časové řadě. Hlavě však se s mírami variability setkáme při zkoumáí závislosti mezi jevy. K základím charakteristikám variability patří variačí rozpětí, rozptyl (a jeho odmocia směrodatá odchylka) a variačí koeficiet. Variačí rozpětí R Variačí rozpětí je rychlou, jedoduchou, ale je orietačí charakteristikou variability založeou a iformaci o maximálí a miimálí hodotě v souboru: R = x max x mi. (1.7) Při použití variačího rozpětí si musíme vždy být vědomi toho, že hodoty miima a maxima v souboru mohou mít charakter ahodilých extrémů a tím epřiměřeě zvětší aši představu o míře variability ve zkoumaém souboru. Rozptyl a směrodatá odchylka Rozptyl je ejzámější a ejužívaější mírou variability. Je defiová jako aritmetický průměr ze čtverců odchylek jedotlivých hodot od průměru: ( _ x ) i = 1 s x =. (1.8) Teto vzorec používáme při počítáí rozptylu z euspořádaého souboru všech hodot souboru, kdy u každé jedotlivé hodoty souboru zjišťujeme její odchylku od průměru a čtverec této odchylky. Mluvíme pak o výpočtu tzv. prostého rozptylu. Při výpočtu z rozděleí četostí, kdy přihlížíme k četostem jedotlivých obmě, používáme vážeý rozptyl: k ( x i x _ ) i i =1 1 k _ s x =, resp. s x = ( x ) i. k i =1 i i =1 (1.9) 0

Popisá statistika Kapitola 1 Pro praktické výpočty se ěkdy oba vzorce rozptylu upravují do formy tzv. výpočtových tvarů. Způsob této úpravy si ukážeme a vzorci prostého rozptylu. 1 _ 1 1 _ 1 _ 1 _ 1 i =1 i =1 i =1 i =1 ( x ) = ( x + _ x ) = x + x = x. i =1 i =1 _ (1.10) Podobou úpravou je možo odvodit růzé podoby výpočtových tvarů i pro vážeý rozptyl, ejpoužívaější je tato úprava: 1 k k 1 s x = x i i x i i. i =1 i =1 (1.11) Rozptyl sám o sobě eí iterpretovatelou veličiou, protože výsledek je dá ve čtvercích měrých jedotek. Proto se při hodoceí variability dává předost druhé odmociě rozptylu, tzv. směrodaté odchylce s x (braé s kladým zamékem). PŘÍKLAD 1.5 Z výsledkù pøijímacích zkoušek jsme u 1 studetù z urèitého gymázia zjišśovali dosažeé bodové výsledky z testu z matematiky (zak x) a agliètiy (zak y). Chceme porovat úroveò a variabilitu bodových výsledkù u obou pøedmìtù: Studet y i ( x _ ) ( y i y _ ) 1 60 50 100 5 40 30 100 65 3 0 60 900 5 4 40 60 100 5 5 55 55 5 6 50 55 7 80 55 900 8 40 55 100 9 80 50 900 5 10 10 60 1 600 5 11 100 80 500 65 1 5 50 65 5 Celkem 600 660 7 850 1 400 _ 1 600 _ 660 x = = = 50, y = = 55, i =1 1 1 ( x _ i x ) i = 1 7 850 1 400 s x = = = 654, sy = = 116,7. 1 1 1

Kapitola 1 Edice učebích textů Statistika pro ekoomy Z výsledkù jedozaèì vyplývá, že matematika vykazuje podstatì vyšší míru estejorodosti bodových výsledkù ež agliètia. Variačí koeficiet Při srováváí variability více souborů arážíme a problém rozdílých měrých jedotek a rozdílé úrově hodot v souborech. V takových případech je pro potřeby srováí ejvhodější charakteristikou variability variačí koeficiet V x : s x V x =. (1.1) x Patří mezi relativí míry variability, protože evyjadřuje variabilitu v původích měrých jedotkách, ale jako poměr směrodaté odchylky a průměru. Obvykle teto poměr prezetujeme v procetech. Pak udává, z kolika procet se v průměru odchylují jedotlivé hodoty od aritmetického průměru. Sadá iterpretace hodot variačího koeficietu jej řadí mezi ejpoužívaější charakteristiky variability. PŘÍKLAD 1.6 Z ásledujících dat za odvìtví chceme porovat variabilitu hodiových mezd mužù a že pomocí variaèího koeficietu. Vzhledem k tomu, že výchozí data jsou k dispozici ve formì itervalového rozdìleí èetostí, bude tøeba pro výpoèet prùmìru a rozptylu pracovat se støedy itervalù: Iterval hodiových mezd v Kč Relativí četosti v % muži žey 1 Středy itervalů x 1 muži žey muži žey x 1 1 x 1 1 0 9,9 8 1 5 00 300 5 000 7 500 30 39,9 16 18 35 560 630 19 600 050 40 49,9 0 30 45 900 1 530 40 500 68 850 50 59,9 30 4 55 1 650 1 100 90 750 60 500 60 69,9 18 10 65 1 170 650 76 050 4 50 70 79,9 5 6 75 375 450 8 15 33 750 80 a více 3 85 55 1 675 Celkem 100 100 x 5 110 4 660 81 700 34 900 k _ i =1 i 5 110 4 660 aritmetický prùmìr x = muži = = 51,1, žey = k = 46,5. 100 100 i =1 i 1 k 1 k Pro výpoèet použijeme vzorec vážeého rozptylu: s x = xi i x, i i i =1 i =1

Popisá statistika Kapitola 1 81 700 s x muži = 51,10 = 05,8 05,8 V x = = 0,81, 100 51,10 34 900 177,44 s x žey = 46,6 = 177,44 V x = = 0,86. 100 46,6 I když z èíselých hodot variaèích koeficietù vyplývá, že vìtší stejorodost hodiových mezd (vìtší kocetraci kolem prùmìru) mají muži, elze považovat zjištìý malý rozdíl v difereciaci mezd za pøíliš výzamý. K důležitým vlastostem rozptylu patří: 1. Rozptyl lze vyjádřit jako průměr čtverců hodot zmešeý o čtverec průměru ( s x = x x ).. Přičte-li se ke všem hodotám kostata a, pak se rozptyl ezměí ( s x+a = s x). 3. Násobí-li se všechy hodoty souboru kostatou k, pak rozptyl je zásobe čtvercem této kostaty ( s k = k s x). 1.4.3 Charakteristiky tvaru rozděleí Zázoríme-li jedorozměrá rozděleí četostí pomocí polygou, získáme možost posoudit tvar rozděleí, apř. polohu vrcholu, symetrii rozděleí, míru kocetrace hodot v určité části variačího rozpětí apod. Z těchto aspektů má ejvětší praktický výzam zjištěí míry symetrie (souměrosti) rozděleí četostí, protože tím lze výzamě obohatit hodoceí vypovídací cey všech popisých charakteristik souboru. Souměrá symetrická rozděleí jsou v ekoomické praxi spíše vzácostí. Zřetelým projevem asymetrie rozděleí je především odlišost hodot aritmetického průměru od mediáu a modu. Pro zcela symetrické rozděleí je aopak charakteristické, že všechy hlaví charakteristiky úrově jsou totožé: _ x = ~ x = ^x. U esymetrických rozděleí tato idetita eplatí. Graf A charakterizuje kladě zešikmeé rozděleí, pro které je obvyklé, že aritmetický průměr je meší ež mediá a modus: _ x > ~ x > ^x. Je to rozděleí s velkým akupeím hodot meších ež průměr. Teto typ rozděleí je v praxi typický apř. pro rozděleí mezd. GRAF A Rozděleí s kladou šikmostí 5 0 mediá 15 průměr 10 5 0 1 3 4 5 6 7 8 9 10 3

Kapitola 1 Edice učebích textů Statistika pro ekoomy GRAF B Záporě zešikmeé rozděleí, kde platí x > ~ x > ^x Jedoduchou charakteristikou šikmosti je Pearsoův koeficiet α, který využívá k hodoceí stupě šikmosti vztah mezi velikostí aritmetického průměru a mediáu: 3 ( x _ ~ x ) α =. (1.13) s x Pro symetrická rozděleí má ulovou hodotu. Velikost koeficietu a jeho zaméko pak ukazuje stupeň a charakter zešikmeí. Jiý přístup k měřeí šikmosti je založe a aplikaci tzv. mometových charakteristik. Při práci s daty uspořádaými do rozděleí četostí je vhodá tzv. mometová míra šikmosti (ozačovaá také jako třetí momet směrodaté proměé) se vzorcem: 3 1 k _ xi x i. (1.14) s i =1 x Opět platí, že ulová hodota charakterizuje symetrická rozděleí a kladé a záporé hodoty vyjadřují růzý stupeň tzv. kladé a záporé šikmosti. 4