BIVŠ. Pravděpodobnost a statistika



Podobné dokumenty
Doc. Ing. Dagmar Blatná, CSc.

Mendelova univerzita v Brně Statistika projekt

4.2 Elementární statistické zpracování Rozdělení četností

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

Ilustrativní příklad ke zkoušce z B_PS_A léto 2013.

Metody zkoumání závislosti numerických proměnných

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i

Nejistoty měření. Aritmetický průměr. Odhad směrodatné odchylky výběrového průměru = nejistota typu A

Deskriptivní statistika 1

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

Téma 6: Indexy a diference

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

P2: Statistické zpracování dat

a další charakteristikou je četnost výběrového souboru n.

jsou varianty znaku) b) při intervalovém třídění (hodnoty x

SOUKROMÁ VYSOKÁ ŠKOLA EKONOMICKÁ ZNOJMO. Statistika I. distanční studijní opora. Milan Křápek

Elementární zpracování statistického souboru

12. N á h o d n ý v ý b ě r

11. Časové řady Pojem a klasifikace časových řad

9. Měření závislostí ve statistice Pevná a volná závislost

Pro statistické šetření si zvolte si statistický soubor např. všichni žáci třídy (několika tříd, školy apod.).

Test dobré shody se používá nejčastěji pro ověřování těchto hypotéz:

Statistika. Jednotlivé prvky této množiny se nazývají prvky statistického souboru (statistické jednotky).

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

Úvod do korelační a regresní analýzy

[ jednotky ] Chyby měření

11. Popisná statistika

P1: Úvod do experimentálních metod

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

1 Popis statistických dat. 1.1 Popis nominálních a ordinálních znaků

5.5. KOMPLEXNÍ ODMOCNINA A ŘEŠENÍ KVADRATICKÝCH A BINOMICKÝCH ROVNIC

S1P Popisná statistika. Popisná statistika. Libor Žák

3. Hodnocení přesnosti měření a vytyčování. Odchylky a tolerance ve výstavbě.

Přednáška č. 2 náhodné veličiny

Statistika je vědní obor zabývající se zkoumáním jevů, které mají hromadný charakter.

APLIKOVANÁ STATISTIKA

VY_52_INOVACE_J 05 01

Chyby přímých měření. Úvod

ZÁKLADY PRAVDĚPODOBNOSTI A STATISTIKY

Odhady parametrů 1. Odhady parametrů

, jsou naměřené a vypočtené hodnoty závisle

1. Základy měření neelektrických veličin

10.3 GEOMERTICKÝ PRŮMĚR

Univerzita Karlova v Praze Pedagogická fakulta

Střední hodnoty. Aritmetický průměr prostý Aleš Drobník strana 1

Náhodný výběr 1. Náhodný výběr

Přednáška č. 10 Analýza rozptylu při jednoduchém třídění

1.1 Rozdělení pravděpodobnosti dvousložkového náhodného vektoru

Popisná statistika - zavedení pojmů. 1 Jednorozměrný statistický soubor s kvantitativním znakem

LABORATORNÍ CVIČENÍ Z FYZIKY. Měření objemu tuhých těles přímou metodou

1 Měření závislosti statistických znaků. 1.1 Dvourozměrný statistický soubor

Matematika I, část II

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

PODNIKOVÁ EKONOMIKA 3. Cena cenných papírů

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

Generování dvojrozměrných rozdělení pomocí copulí

Mod(x) = 2, Med(x) = = 2

MATICOVÉ HRY MATICOVÝCH HER

2 STEJNORODOST BETONU KONSTRUKCE

Spolehlivost a diagnostika

1.1 Definice a základní pojmy

Statistické charakteristiky (míry)

13 Popisná statistika

UNIVERZITA JANA EVANGELISTY PURKYNĚ V ÚSTÍ NAD LABEM PEDAGOGICKÁ FAKULTA Katedra tělesné výchovy

Pravděpodobnostní modely

Pravděpodobnost a aplikovaná statistika

Soustava momentů. k s. Je-li tedy ve vzorci obecného momentu s = 1, získáme vzorec aritmetického průměru.

Testování statistických hypotéz

Téma 11 Prostorová soustava sil

STATISTICKÉ MINIMUM PRO STUDENTY BAKALÁŘSKÉHO STUDIA NA TECHNICKÝCH OBORECH BOHUMIL MINAŘÍK

České vysoké učení technické v Praze. Fakulta dopravní. Semestrální práce. Statistika

Statistika - vícerozměrné metody

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

Základy statistiky. Zpracování pokusných dat Praktické příklady. Kristina Somerlíková

Intervalové odhady parametrů některých rozdělení.

Úvod do teorie měření

8. Základy statistiky. 8.1 Statistický soubor

Základy statistiky. Petr Kladivo

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

veličiny má stejný řád jako je řád poslední číslice nejistoty. Nejistotu píšeme obvykle jenom jednou

T e c h n i c k á z p r á v a. Pokyn pro vyhodnocení nejistoty měření výsledků kvantitativních zkoušek. Technická zpráva č.

1 EXPLORATORNÍ ANALÝZA PROMĚNNÝCH. Čas ke studiu kapitoly: 120 minut. Cíl: Po prostudování této kapitoly budete umět použít

Náhodné jevy, jevové pole, pravděpodobnost

12. Neparametrické hypotézy

Výukový modul III.2 Inovace a zkvalitnění výuky prostřednictvím ICT

2. Vícekriteriální a cílové programování

Statistika. Statistické funkce v tabulkových kalkulátorech MSO Excel a OO.o Calc

9.3.5 Korelace. Předpoklady: 9304

Chyby měření: 1. hrubé chyby - nepozornost, omyl, únava pozorovatele... - významně převyšuje rozptyl náhodné chyby 2. systematické chyby - chybné

6. P o p i s n á s t a t i s t i k a

PRAVDĚPODOBNOST A STATISTIKA

STATISTIKA. Základní pojmy

PŘÍKLAD NA PRŮMĚRNÝ INDEX ŘETĚZOVÝ NEBOLI GEOMETRICKÝ PRŮMĚR

NEPARAMETRICKÉ METODY

- metody, kterými lze z napozorovaných hodnot NV získat co nejlepší odhady neznámých parametrů jejího rozdělení.

FUNKCÍ JEDNÉ REÁLNÉ PROMĚNNÉ PRVNÍ DIFERENCIÁL

Časová hodnota peněz. Metody vyhodnocení efektivnosti investic. Příklad

VYSOCE PŘESNÉ METODY OBRÁBĚNÍ

9. Základní statistické pojmy.

Komplexní čísla. Definice komplexních čísel

Transkript:

BIVŠ Pravděpodobost a statstka

Úvod Skrpta Pravděpodobost a statstka jsou učebím tetem pro stejojmeý kurz magsterského studa Bakovího sttutu vysoké školy Kurzy Pravděpodobost a statstka a avazující kurz Statstcké metody svým obsahem a rozsahem odpovídají stadardům výuky základů statstky a vysokých školách ekoomckého zaměřeí Skrpta, která dostáváte do rukou výzamě rozšřují a prohlubují pozatky ze statstky získaé v kurzu statstky a bakalářském stup studa Skrpta jsou rozdělea do čtyř kaptol I kaptola se zabývá elemetárí popsou statstkou, obsahuje základí statstcké pojmy, metody popsu a charakterstky jedorozměrých statstckých souborů a její zalost je ezbytým základem př dalším studu statstky II kaptola je věováa metodám statstckého srováváí, a lze j zařadt ke statstckým metodám využtelým zejméa v ekoomcké oblast uvádí základí typy deů III kaptola obsahuje základy teore pravděpodobost, sezamuje s ejdůležtějším rozděleím áhodých velč a je ezbytým teoretckým základem pro IV kaptolu věovaou metodám statstcké dukce, kterou bychom mohl uvést také pod ázvem matematcká statstka Jsou zde vyložey základy teore odhadu a testováí statstckých hypotéz a uvedey základí jedovýběrové a dvouvýběrové parametrcké testy a eparametrcké testy hypotéz o rozděleí Výklad je kocpová tak, aby studet pochopl podstatu metod statstcké dukce a uměl v pra použít a terpretovat výsledky dalších testů, které ejsou ve skrptech uvedey Zalost prcpů teore odhadů a testováí statstckých hypotéz je ezbytá pro úspěšou aplkac aalytckých statstckých metod, s mž se sezámíte v kurzu Statstcké metody Pro lepší porozuměí vykládaé problematce jsou ve všech kaptolách u každého tematckého okruhu (v případě matematcké statstky u každého testu) uvedey řešeé příklady s terpretací získaých výsledků Příklady je uto chápat jako lustratví, jsou vědomě zjedodušeé, slouží především k pochopeí látky a výpočetích postupů Řešeí příkladů uvedeých v tetu je prováděo bez použtí počítače, větša statstckých programů ale obsahuje procedury potřebé k jejch provedeí (uvedeme alespoň SAS, STATGRAPHICS, SPPS, STATISTICA, S-Plus, apod), příklady lze řešt pomocí tabulkových kalkulátorů, apř MS EXCEL Ve srováí s předchozím učebím tetem Statstka a pravděpodobost určeém pro studety BIVŠ, jsou tato skrpta upravea a rozšířea tak, aby více vyhovovala potřebám studetů kombovaého studa U každé kaptoly jsou zařazey kotrolí otázky a příklady k procvčeí vysvětleé látky K příkladům jsou uvedey výsledky, v ěkterých případech postup řešeí U každé kaptoly je rověž uvede aglcko-český slovík základích statstckých pojmů a výrazů používaých v příslušé kaptole, eboť lze předpokládat, že př aplkac statstckých postupů v pra se studet setkají s počítačovým programy, v chž budou použty aglcké výrazy V přílohové část jsou přpojey základí statstcké tabulky Sezam lteratury uvádí vybraé české zahračí publkace, které je možo využít k doplěí a rozšířeí metod a postupů uvedeých ve skrptech Doc Ig Dagmar Blatá, CSc Úvod

Bakoví sttut vysoká škola Obsah I KAPITOLA ELEMENTÁRNÍ POPISNÁ STATISTIKA I Základí statstcké pojmy I Zpracováí hodot umercké proměé I3 Charakterstky jedorozměrých statstckých souborů I3 Charakterstky úrově hodot I3 Středí hodoty I3 Další charakterstky polohy I3 I33 Charakterstky varablty Charakterstky škmost a špčatost KONTROLNÍ OTÁZKY PŘÍKLADY K PROCVIČENÍ VÝSLEDKY PŘÍKLADŮ ZÁKLADNÍ VÝRAZY II KAPITOLA STATISTICKÉ SROVNÁVÁNÍ II II Poměrá čísla Idey II II II3 Idvduálí dey Souhré dey Příklady používaých deů II3 Ide spotřebtelských ce a měřeí fl ace II3 Příklady používaých deů kurzů akcí KONTROLNÍ OTÁZKY PŘÍKLADY K PROCVIČENÍ VÝSLEDKY PŘÍKLADŮ ZÁKLADNÍ VÝRAZY 4 Obsah

Pravděpodobost a statstka III KAPITOLA ZÁKLADY TEORIE PRAVDĚPODOBNOSTI III Úvod do teore pravděpodobost III III Def ce pravděpodobost Pravdla pro počítáí s pravděpodobostm III Pravdlo o ásobeí pravděpodobostí III Pravdlo o sčítáí pravděpodobostí III3 Úplá pravděpodobost III Náhodé velčy III Pops rozděleí áhodých velč III Dskrétí áhodé velčy III Spojté áhodé velčy III Charakterstky áhodých velč III Charakterstky dskrétích áhodých velč III Charakterstky spojtých áhodých velč III3 Některá rozděleí áhodých velč III3 Některá rozděleí espojtých áhodých velč III3 Některá rozděleí spojtých áhodých velč III4 Lmtí věty III4 Záko velkých čísel (ZVČ) III4 Cetrálí lmtí věta (CLV) KONTROLNÍ OTÁZKY ŘÍKLADY K PROCVIČENÍ VÝSLEDKY PŘÍKLADŮ ZÁKLADNÍ VÝRAZY IV KAPITOLA METODY STATISTICKÉ INDUKCE IV Výběrová zjšťováí IV Náhodé výběry IV Statstcké odhady IV Bodové odhady Obsah 5

Bakoví sttut vysoká škola IV IV3 Itervalové odhady Odhady ěkterých parametrů základího souboru IV3 Odhad středí hodoty ormálího rozděleí μ IV3 Odhad relatví četost základího souboru (parametru alteratvího rozděleí) IV33 Odhad rozptylu základího souboru IV3 Testováí statstckých hypotéz IV3 IV3 Základí pojmy Testy hypotéz o parametrech rozděleí IV3 Test hypotézy o středí hodotě μ ormálího rozděleí IV3 Test hypotézy o rozptylu ormálího rozděleí IV33 Test hypotézy o parametru alteratvího rozděleí (test hypotézy o relatví četost) IV34 Testy hypotézy o rovost dvou středích hodot ezávslých výběrů IV35 Test hypotézy o rovost dvou rozptylů IV36 Testy rovost středích hodot dvou závslých výběrů IV33 Neparametrcké testy IV33 Neparametrcké testy o tvaru rozděleí (testy shody) KONTROLNÍ OTÁZKY PŘÍKLADY K PROCVIČENÍ VÝSLEDKY PŘÍKLADŮ ZÁKLADNÍ VÝRAZY Sezam lteratury V Přílohy Statstcké tabulky 6 Obsah

Pravděpodobost a statstka I KAPITOLA ELEMENTÁRNÍ POPISNÁ STATISTIKA I Základí statstcké pojmy Statstka se zabývá hromadým jevy Hromadý jev je takový jev, který se může mohokrát opakovat a týká se skutečostí velkého počtu prvků Protkladem hromadého jevu je dvduálí jev, tj jedo pozorováí jedotlvého prvku Prvky, které sleduje statstka, se azývají statstcké jedotky Statstckou jedotkou může být osoba, věc, událost, orgazace apod Statstcká jedotka musí být jedozačě vymezea po stráce věcé, místí (prostorové) a časové Například statstckou jedotkou může být f rma zabývající se obchodováím s akcem, mající sídlo v ČR k 39 Souhr statstckých jedotek tvoří statstcký soubor Počet jedotek statstckého souboru vyjadřuje rozsah souboru U statstckých jedotek zkoumáme jejch vlastost, které charakterzují statstcké zaky Mírou vlastost statstckého zaku u každé jedotky statstckého souboru je hodota (sloví ebo číselá) daého zaku Pokud je hodota zaku shodá u všech jedotek souboru, mluvíme o detfkačím zaku Zaky, které abývají růzých obmě azýváme proměé Ty jsou pak hlavím předmětem statstckého zkoumáí Statstcký soubor všech statstckých jedotek, které jsou předmětem statstckého zkoumáí, se azývá základí soubor (populace) Jeho rozsah může být koečý ebo ekoečý, zpravdla je velký Proto se často provádí šetřeí je a část základího souboru vybraé ze základího souboru, které říkáme výběrový soubor Výsledky získaé z výběrového souboru pak slouží k úsudkům o celém základím souboru Nejčastější je tříděí statstckých zaků (proměých) a číselé a sloví Číselé (umercké, kvattatví) zaky jsou takové, jejchž varaty (hodoty) lze vyjádřt číselě Číselé zaky rozdělujeme a espojté (dskrétí) a spojté podle toho, jestl zak abývá obmě, které lze vyjádřt celým čísly (apř zámky ve škole, počet dětí v rodě) ebo jestl může v určtém tervalu abýt moha růzých hodot a lze jej vyjádřt reálým (apř výška mez 5 6 cm může abýt hodot růzých hodot pokud měříme s přesostí a cm, ale růzých hodot, pokud měříme s přesostí a mm apod) Nespojté číselé zaky tedy abývají pouze ěkterých celočíselých hodot v určtém tervalu, spojté mohou abývat v rámc určtého tervalu lbovolých hodot U slovího (kategorálího, kvaltatvího) zaku je možé jejch obměy vyjádřt je slově Pokud mohou abýt pouze dvou obmě, mluvíme o zaku alteratvím (apř pohlaví), může-l abýt více obmě, jedá se o zak možý (apř dosažeé vzděláí, rodý stav, typ dluhopsu) STATISTICKÉ TABULKY Tabulky patří k základím statstckým prostředkům Používají se ve všech fázích statstcké práce (zjšťováí, zpracováí, prezetace výsledků) Ve statstcké pra používáme tabulky prosté, skupové a kombačí Prosté tabulky obsahují etříděé statstcké údaje Prosté tabulky bývají zpravdla podkladem pro další zpracováí Tabulky skupové obsahují údaje tříděé podle jedoho zaku, kombačí tabulky jsou výsledkem tříděí podle dvou ebo více zaků Elemetárí popsá statstka 7

Bakoví sttut vysoká škola Každá statstcká tabulka zpravdla obsahuje tyto základí prvky: ázev tabulky, hlavčku, legedu, pozámky, očíslováí sloupců a řádků, číselé pole, součtový řádek a součtový sloupec, jak je zřejmé z uvedeého vzoru Název tabulky Název legedy Hlavčka tabulky Součtový sloupec Legeda tabulky () () (3) (4) () () (políčko) (3) Součtový řádek (4) Název tabulky se umísťuje ad tabulku a musí výstžě vysthovat obsah tabulky Hlavčka vyjadřuje obsah sloupců, legeda pak obsah řádků Měré jedotky se uvádějí u jedotlvých ukazatelů ebo se mohou vztahovat k celé tabulce Pozámky doplňují obsah tabulky Ozačují se buď hvězdčkou ebo malým číslcem v tabulce a jejch vysvětleí je umístěo pod tabulkou Pozámky se vztahují buď k celému obsahu tabulky (obecé pozámky) ebo je k ěkteré její část (zvláští pozámky) Políčko je průkem řádku a sloupce Každé políčko statstcké tabulky má být vyplěo a to buď zjštěou (ebo vypočteou) hodotou ebo smluveou začkou Uvedeme alespoň ejpoužívaější začky používaé ve statstckých tabulkách: - (pomlčka) ozačuje ulový počet případů, (ula) ozačuje číselou hodotu meší ež polova jedotky, (ležatý křížek) udává, že záps by v daém místě eměl smysl (byl by elogcký), (tečka) v políčku ozačuje ezámý údaj Pokud je v součtovém řádku ebo v součtovém sloupc údaj v závorce, evyjadřuje součet, ale průměr hodot příslušého řádku ebo sloupce GRAFICKÉ ZOBRAZOVÁNÍ Graf cké zázorňováí je jede ze způsobů sdělováí výsledků statstckého zkoumáí Nejčastěj bývá doplňující přehledou formou výsledků vyjádřeých v tabulce Prot tabulce a slovímu vyjádřeí je jeho výhodou přehledost a ázorost, umožňuje rychlou oretac a má začý popularzačí a propagačí výzam Nevýhodou je meší podrobost a přesost zobrazeých výsledků Výzam grafckého zobrazováí se zvyšuje možostm používáí výpočetí techky, protože větša počítačových programů má graf cké zázorňováí sledovaých a aalyzovaých jevů Př graf ckém zobrazováí musíme dodržovat určté áležtost graf ckých prostředků Každý graf musí mít srozumtelý ázev vyjadřující jeho obsah Název grafu může být umístě ad, pod ebo méě často do obrázku, ale vždy tak, aby ezasahoval do grafu Často je třeba do grafu zařadt vysvětlvky, které blíže vysvětlí obsah jedotlvých částí grafu Ty zařazujeme do obrázku tak, aby bylo jasé, k čemu se vztahují Někdy s můžeme pomoc špkam, které míří k vysvětlovaé část V případě, kdy estuje větší počet vysvětlvek, umístíme je a jedo místo do tzv klíče Vždy ale musíme umístt vysvětlvky tak, aby ezasahovaly do grafu Zakreslujeme-l do grafu více formací (zaků), odlšujeme je růzým typy čar (plě, čárkovaě, čerchovaě, tečkovaě), růzým barvam ebo růzým šrafováím, začkam (tečky, křížky, hvězdčky apod) 8 Elemetárí popsá statstka

Pravděpodobost a statstka I když počítače umožňují používáí růzých souřadc, ejběžější je používáí pravoúhlých souřadc Na vodorovou poloosu vyášíme ejčastěj časová období ebo obměy sledovaého zaku, a svslou poloosu hodoty sledovaého zaku ebo četost Na jedotlvých poloosách musí být vyzačey stupce Body a stupc ozačujeme krátkým čáram - kótam Vzdáleost mez jedotlvým body stupce azýváme délkou graf ckého tervalu Délka graf ckého tervalu v cm, která odpovídá jedotkovému číselému tervalu se azývá modul stupce Volba modulu je důležtá, eboť evhodou volbou modulu můžeme získat zkresleou představu o zázorňovaém jevu Moduly a obou osách emusí být stejé Musíme s ale uvědomt, že sko čáry se zvětšuje, zmešujeme-l modul délky a vodorové ose a současě jej zvětšujeme a svslé ose a aopak sko čáry je povlovější, zvětšujeme-l modul a vodorové ose a zmešujeme-l jej a svslé ose Itervaly a jedé stupc mají být stejě dlouhé Stupce většou číslujeme od uly, která je umístěa v průsečíku obou os Pokud máme údaje, které jsou hodě vzdáleé od uly, použjeme přerušeí stupce Grafů estuje ve statstce velké možství, popíšeme s je ty ejjedodušší, ejčastěj používaé, které obsahuje větša počítačových programů Estuje (a ěkteré počítačové programy abízejí) s celou řadu dalších růzých obmě jedotlvých typů grafů, které s yí popíšeme Jedím z ejčastěj používaých grafů je spojcový graf (v počítačových paketech většou ozačovaý Le charts) Je jím čára, která je složea z úseček, které spojují vždy dva body, odpovídající hodotám sledovaého zaku ve dvou za sebou ásledujících skupách ebo obdobích Spojcové grafy se používají ejčastěj ke sledováí vývoje v časových řadách (blíže v kurzu Statstcké metody) a k zobrazováí rozděleí četostí (vz dále v této kaptole) Ke zázorěí struktury (složeí) ebo ke srováí malého počtu jevů se používají sloupkové grafy (Barcharts) Sloupky jsou umístěé buď svsle ebo vodorově, mají stejou základu a růzou výšku K provedeí srováí s ějakým jým obdobím, bychom mohl vedle akresleých sloupků akreslt barevě ebo šrafováím odlšé sloupky ze srovávaého období Jý druh grafů používaý ke zázorěí struktury je kruhový ebol výsečový graf (Pecharts) Základem grafu je kruh zobrazující celek rozděleý a kruhové výseče odpovídající struktuře Jedotlvé výseče se pro přehledost ozačují růzým šrafováím ebo růzým barvam Změu ve složeí v časovém vývoj umoží zobrazt povrchové grafy (Compoet Le Charts) Pro graf cké zobrazeí územě rozložeých jevů se často používají mapy, v chž se růzým barvam, šrafováím, zakresleím obrázků růzé velkost apod zázorňuje velkost sledovaého zaku Grafům říkáme kartogramy ebo kartodagramy Počítače umožňují šroké používáí jých druhů grafů, apř schematckých obrázků (pktogramů), prostorových grafů apod S využtím ěkterých grafů se blíže sezámíme v dalších kaptolách Některé specelí grafy budou uvedey až u příslušé statstcké metod ve skrptech Metody statstcké aalýzy I Zpracováí hodot umercké proměé Statstcké zkoumáí lze rozdělt do tří etap, které a sebe bezprostředě avazují: statstcké zjšťováí (šetřeí), statstcké zpracováí a statstcké vyhodocováí (rozbor) Jako další etapa se ěkdy uvádí prezetace (publkováí) výsledků statstckého šetřeí V kurzu statstky se budeme zabývat především metodam zpracováí a vyhodocováí statstckých dat Cílem statstckého zpracováí je získat představu o vlastostech a souvslostech zkoumaých jevů Růzost povahy jevů a účelů jejch zkoumáí s vyžaduje použít ejrůzější metody a postupy statstckého zpracováí a rozboru Údajů, které získáme statstckým zjšťováím většou elze použít rovou k provedeí rozboru, eboť podávají epřehledou a euspořádaou formac o souboru statstckých jedotek Elemetárí popsá statstka 9

Bakoví sttut vysoká škola Důležtým, většou prvím krokem zpracováí získaých statstckých údajů je jejch tříděí Úkolem tříděí je vytvořeí stejorodých skup (tříd) statstckých jedotek podle obmě sledovaého statstckého zaku, kterému říkáme třídící zak Roztříděí souboru umoží pozat složeí zkoumaých jevů a odhalovat vzájemé vztahy a souvslost mez m Volba třídícího zaku vychází z potřeb kokrétího statstckého zkoumáí a je ejdůležtější otázkou tříděí Nesprávě provedeé tříděí může zcela zehodott další výsledky statstckého rozboru Třídící zak může být buď sloví (kvaltatví) ebo číselý (kvattatví) Pokud provádíme tříděí podle jedoho třídícího zaku, mluvíme o jedostupňovém ebo také prostém tříděí Tříděí podle více třídících zaků azýváme vícestupňové (kombačí) Vícestupňové tříděí umoží hlouběj pozat složeí a vzájemé vztahy Př větším počtu třídících zaků se ale tříděí stává epřehledé a ztrácí svou účost Proto je ejčastějším případem vícestupňového tříděí dvoustupňové tříděí Skupy vzklé roztříděím podle číselého zaku se azývají třídy, skupám vzklým př tříděí podle slovího zaku říkáme kategore Počet tříd vzklých př tříděí podle espojtého zaku je dá počtem obmě zkoumaého zaku V případě třídícího zaku spojtého (ebo espojtého s velkým počtem obmě) vytvoříme tervaly (skupy) hodot třídícího zaku Počet skup je potom daý počtem vytvořeých tervalů Počet skup je urče povahou zkoumaého jevu a účelem tříděí Itervaly je ejjedodušší volt stejě velké, ale v případech, kdy by tímto způsobem vzkly esourodé skupy, se používají tervaly estejé velkost (apř cey akcí a burze, příjmové skupy obyvatelstva) Hrace (meze) tervalů musí být vždy staovey tak, aby edošlo k ejasost, do kterého tervalu jedotlvé jedotky zařadt Četost Počtu jedotek, které jsou př tříděí zahruty do jedotlvých tříd ebo tervalů říkáme třídí (skupová) četost a ozačujeme j písmeem Celková četost je souhr skupových četostí () k k ozačuje počet skup (tervalů) Počet tervalů určíme ejjedodušej jako k tzv Sturgesova pravdla jako k = + 3,3 log ebo pomocí Strukturu souboru vyjadřují relatví četost p, které se získají jako podíl jedotlvých absolutích četostí k celkové četost (rozsahu souboru): (3) p přčemž platí k p Elemetárí popsá statstka

Pravděpodobost a statstka Část souboru, která má varatu zaku meší ebo ejvýše rovou daé -té obměě, se azývá kumulatví absolutí četost daé -té obměy Kumulatví četost relatví udávají, jaká poměrá část souboru má varatu zaku meší ebo rovou daé obměě Kumulatví četost se vypočítají postupým ačítáím hodot od prví do -té obměy Tabulku rozděleí četostí udává ásledující tabulka Tabulka - Tabulka jedorozměrého rozděleí četostí Obměy Zaku Četost Kumulatví četost Absolutí Relatví Absolutí Relatví p p p p + p + p 3 3 p 3 + + 3 p + p + p 3 k k p k p Ke graf ckému zázorěí rozděleí četostí, můžeme použít ěkolk obvyklých typů grafů Hstogram rozděleí četostí se skládá z obdélíků s plocham přímo úměrým třídím četostem Itervaly tříd jsou zobrazey a horzotálí ose Polygo rozděleí četostí je graf vzklý spojeím cetrálích bodů jedotlvých vrcholů sousedích sloupců lomeou čarou Koláčový (výsečový) graf je rozděle a výseče reprezetující relatví četost jedotlvých tříd Příklad Máme k dspozc soubor studetů, sledovaý statstcký zak je zámka ze zkoušky Zkostruujte tabulku rozděleí četostí a graf cky je zázorěte Tabulka - Tabulka jedorozměrého rozděleí četostí zámek souboru studetů Obměy Zaku Četost Kumulatví četost Absolutí Relatví Absolutí Relatví p 7,545 7,545 38,3455 55,5 3 4,377 96,877 4 4,73 X p Elemetárí popsá statstka

Bakoví sttut vysoká škola Obr - Hstogram zámek studetů Obr - Koláčový graf zámek studetů 5 4,73% 5,45% Cetost 3 X 37,7% 3 4 34,55% I3 Charakterstky jedorozměrých statstckých souborů Roztříděím souboru podle hodot sledovaého statstckého zaku získáme zalost o obměách zaku a o jejch četostech (počtu jedotek) v jedotlvých skupách (třídách) Většou je tato formace edostatečá a je uto j doplt dalším vypočteým charakterstkam, které by zhuštěou formou popsaly celý soubor z hledska sledovaých zaků Někdy je takovou postačující formací součet hodot všech jedotek souboru, který ale epodává formac o úrov hodot, protože jeho velkost závsí a počtu sčítaých jedotek Kromě toho mohdy a emá smysl ěkteré údaje sčítat (apř věk osob, ceu výrobků apod) Lepší souhrou formac dá charakterstka, která vyjadřuje úroveň (polohu), kolem které se pohybují hodoty sledovaého ukazatele Takovou charakterstku azýváme středí hodota Mez středí hodoty patří průměry, modus a medá Mohou ale estovat soubory, které mají stejou středí hodotu, ale graf rozděleí četostí je zcela odlšý, eboť soubory se mohou lšt rozptýleostí jedotlvých hodot kolem středí hodoty ebo od sebe avzájem říkáme, že se lší varabltou Ale soubory se stejou polohou a varabltou se mohou podstatě lšt co do esouměrost rozděleí hodot zaku (což může být zřejmé z graf ckého zázorěí) v takovém případě mluvíme o růzé škmost Míry polohy, varablty a škmost je ale třeba doplt formací o míře kocetrace hodot kolem středí hodoty této míře budeme říkat špčatost Shreme-l výše uvedeé, můžeme kostatovat, že rozděleí hodot sledovaého statstckého zaku ve statstckém souboru lze charakterzovat z hledska: - polohy, - varablty, - škmost, - špčatost I3 I3 Charakterstky úrově hodot Středí hodoty Nejčastěj používaým středím hodotam jsou průměry Estuje jch ěkolk druhů a mají společé, že se vypočítávají ze všech hodot zkoumaého zaku u všech jedotek souboru Elemetárí popsá statstka

Pravděpodobost a statstka Nejjedodušší a ejpoužívaější je artmetcký průměr, který umožňuje porovávat údaje o srovatelém ukazatel v růzých souborech ebo u růzých jedotek Artmetcký průměr vypočítáme jako součet hodot zaku všech jedotek souboru děleý jejch počtem Například artmetcký průměr počtu f lálek u čtyř f rem ve městě, které jsou,3,,, vypočítáme [(+3++)/4] =,75 Vypočítaý průměr charakterzuje úroveň počtu f lálek a emusí mít hodotu, kterou by ěkterá f rma ěkdy mohla mít Takto vypočítaý průměr azýváme prostý artmetcký průměr Používáme ho, když máme k dspozc eroztříděý soubor hodot Artmetcký průměr ozačujeme (čteme s pruhem) a můžeme ho vypočítat podle vzorce (4) Když se obměy hodot sledovaého zaku ve statstckém souboru opakují, můžeme provést roztříděí jedotek do tříd (ebo tervalů) a zjstt četost jedotlvých obmě Četost zaků azýváme váhy, protože vyjadřují váhu jedotlvých skup a celkovém souboru Průměru budeme říkat vážeý artmetcký průměr a vypočítáme ho podle vzorce: k (5) k k Vyskytují-l se hodoty v k růzých varatách s relatvím četostm p, potom def ujeme vážeý artmetcký průměr jako k (6) k p k Máme-l hodoty sledovaého zaku rozděleé do tervalů, pak artmetcký průměr všech hodot vypočítáme pomocí dílčích průměrů jedotlvých skup (skupových průměrů) podle vzorce k (7) k k Pokud ezáme jedotlvé hodoty uvtř skup (tervalů), musíme použít přblžý výpočet, v ěmž místo hodot použjeme ve vzorc (7) středy tervalů U otevřeých tervalů buď počítáme se stejou délkou tervalů jako u ostatích tervalů ebo pokud jedotlvé hodoty záme, použjeme prostředí hodotu tohoto tervalu (medá) Elemetárí popsá statstka 3

Bakoví sttut vysoká škola Protože je artmetcký průměr ejpoužívaějším průměrem, sezámíme se s jeho základím vlastostm: Součet odchylek jedotlvých hodot od artmetckého průměru je rove ule (8) Artmetcký průměr kostaty je rove této kostatě (9) k k 3 Přpočteme-l ke každé hodotě tutéž kostatu, artmetcký průměr hodot se zvýší o tuto kostatu () k k 4 Vyásobíme-l všechy hodoty stejou kostatou k, artmetcký průměr se zvýší k-krát () k k 6 Artmetcký průměr se ezměí, vyásobíme-l všechy váhy stejou kostatou k Uvedeé vlastost s ukážeme a jedoduchém příkladu Příklad Tř zaměstac obdržel odměu 4, 8 a 9 Kč Průměrě tedy dostal každý z ch 7 Kč Rozdíly jejch hotovost od celkového průměru jsou -3, + a +, součet je ula Za dobré výkoy dostal všch přdáo ještě 5 Kč Měl yí 9, 3 a 4 Kč, průměrě tedy Kč, což je o 5 Kč více ež předtím Kdyby dostal každý dvojásobek své částky, měl by 8, 6 a 8 Kč, to je v průměru 4 Kč, tedy dvakrát více Kromě artmetckého průměru se ve statstce používají jé druhy průměrů, které mají ale smysl používat vždy pouze ve specf ckých stuacích Geometrcký průměr se počítá odlšě ež artmetcký průměr U artmetckého průměru jsme hodoty sčítal a děll jejch počtem, př výpočtu geometrckého průměru jedotlvé hodoty ásobíme a odmocňujeme takovou odmocou, kolk je jedotek Geometrcký průměr je tedy def ová jako tá odmoca souču všech hodot: (), resp ve vážeém tvaru (3) k G G Nejčastější používáí geometrckého průměru je př výpočtu průměrého koef cetu růstu za sledovaé období k k 4 Elemetárí popsá statstka

Pravděpodobost a statstka Harmocký průměr je def ová jako počet jedotek děleý součtem převráceých hodot Jeho použtí je tedy omezeo a případy, kde má smysl převráceá hodota ukazatele Nejčastěj se používá př výpočtu průměré rychlost, průměré pracost apod Prostý harmocký průměr je defová (4) h, vážeý harmocký průměr (5) h k k k k k Příklad 3 Pět pracovc zpracovává stejý formulář, každá a to potřebuje jou dobu Vypočtete průměrou dobu a zpracováí formuláře Potřebé údaje výpočty jsou v tabulce 3 Tabulka 3 - Výpočet průměré doby a zpracováí formuláře pracovce Doba zpracováí m/ks Rozhodá doba m Počet ks za rozhodou Dobu 6 m ks/6 m 6 3 3 6 3 4 6 5 4 5 6 5 6 6-3 87 Pokud bychom použl k výpočtu artmetcký průměr, dostal bychom esprávý výsledek 4 m 5 Úlohu bychom mohl řešt logckou úvahou bez zalost harmockého průměru: Každé pracovc poskyteme stejou dobu (tzv rozhodou dobu, apř 6 mut) a vypočítáme počet zpracovaých dokumetů za tuto dobu Pak průměrou dobu a zpracováí jedoho formuláře vypočítáme jako artmetcký průměr 3 87 3, 45 m Výpočet přímo použtím harmockého průměru podle vzorce (4): h 5 5 435 3 4 5 6 3 3, 45 m Elemetárí popsá statstka 5

Bakoví sttut vysoká škola Příklad 4 Výpočet průměré rychlost: Auto jede vzdáleost 3 km Prvých km rychlostí 3 km/hod, druhých km rychlostí 8 km/hod a posledích km rychlostí km/hod km rychlostí 3 km/hod m km 8 km/hod 7,5 m km km/ hod6 m -------------------------------------------------------------------- 3 km 33,5 m= 33,5/6 =,5583 hod Výpočet pomocí artmetckého průměru: 3, 5583 53,73 km/hod Přímý výpočet pomocí harmockého průměru: h 3 3, 5583 53,73 km/hod 3 8 Mez uvedeým třem typy průměrů počítaým ze stejých dat, platí erovost (6) Hlaví evýhodou průměrů jako charakterstk polohy je jejch ctlvost a odlehlá pozorováí Z toho důvodu byly kostruováy jé charakterstky ve saze elmovat tuto evýhodu I3 Další charakterstky polohy Medá je hodota prostředí jedotky souboru uspořádaého podle velkost sledovaého zaku Medá ozačujeme ~ ( s vlovkou) Př jeho výpočtu musíme ejdříve všechy jedotky seřadt od ejmeší po ejvětší a ajít tu, která rozdělí soubor a polovy V případě lchého počtu jedotek, je medá přímo hodota prostředí jedotky, pokud je počet jedotek sudý, ajdeme dvě prostředí jedotky a medá vypočítáme jako artmetcký průměr jejch hodot Modus je ejčetější hodota souboru Modus začíme ˆ ( se stříškou) Obecě se mohou vyskytovat soubory, u chž modus eestuje, eboť je v souboru více vrcholů (vícemodálí soubory) Srováí středích hodot Průměry jsou vypočtey ze všech hodot souboru Modus a medá charakterzují typcké hodoty souboru a ezávsí a všech hodotách souboru To může být ěkdy výhodou, protože ejsou ovlvěy hodotam, které se hodě odlšují od ostatích (takovým hodotám říkáme odlehlá pozorováí) a výpočet průměru by mohly zkreslt Příklad 5 Př sledováí počtu dopravích ehod ve městě během týde byly zjštěy údaje: 3, 5,, 36, 7, 5, 9 Modus je 5 ehod, medá také 5, ale artmetcký průměr je 9,57 Průměr byl ovlvě výskytem hromadé haváre ve čtvrtek a epopsuje ejlépe typckou dopraví stuac ve městě 6 Elemetárí popsá statstka

Pravděpodobost a statstka Kvatly jsou hodoty zaků, které rozdělují soubor v určtém procetím poměru; p% kvatl p je hodota umerckého zaku, který odděluje p% jedotek s ejžším hodotam sledovaého zaku Z této def ce plye, že medá je 5% kvatl ( ~ = ~ ) Mez další používaé kvatly patří kvartly, 5 decly a percetly Dolí kvartl ~ odděluje 5 % ejžších hodot zaku, horí kvartl ~ 5 75 potom 75 % ejžších hodot Podobě jsou def ováy decly ~, ~,, ~ a percetly 9 ~, ~,, ~ 99 Pořadí jedotky, jejíž hodotou je p% kvatl určíme podle vzorce (7) p zp, 5 K přehledému zázorěí kvatlů, průměru, rozsahu hodot souboru (případě odlehlých pozorováí) lze použít krabcový graf (Bo-ad-Whskers Plot) Příklad 6 Vypočítejte základí charakterstky polohy zámek souboru studetů z příkladu Tabulka 4 - Potřebé hodoty k výpočtu charakterstk souboru zámek studetů Obměy zaku Četost Kumulatví četost výpočetí sloupec absolutí relatví absolutí relatví p 7,545 7,545 7 38,3455 55,5 76 3 4,377 96,877 3 4 4,73, 56, 7 p 7, 477, modus = 3 medá ~ (55) (56) 3 dolí kvartl z 5 5, 5 8 ~ 5 horí kvartl z 75 75,5 5 83 ~ 75 3 Elemetárí popsá statstka 7

Bakoví sttut vysoká škola Obr 3 - Krabcový graf zámek studetů,5,5 3 3,5 4 X Na Obr 3 je zobraze krabcový graf rozděleí zámek Levá hraa krabce zázorňuje dolí kvartl, pravá hraa pak horí kvartl, tlustá čára uprostřed vyzačuje medá, zaméko + hodotu artmetckého průměru I3 Charakterstky varablty Artmetcký průměr ebo já středí hodota může dobře charakterzovat úroveň hodot ve stejorodém souboru Pokud se ale hodoty v souboru od sebe odlšují, eí samotá formace o středí hodotě postačující a je třeba j doplt Například máme údaje o věku sedm studetů a sedmčleé rody s dětm: věk studetů: 9, 9,,,,, věk rody: 6, 35, 3, 7, 5,, Artmetcký průměr věku obou souborů je stejý ( =), ale soubory se výrazě odlšují z hledska stejorodost hodot Skupa žáků je z hledska věku zjevě stejorodějším souborem ež roda Odlšost jedotek od sebe avzájem ebo od ějaké středí hodoty azýváme varablta (ěkdy se používá ázev mělvost hodot) Na prví pohled vdíme, že mělvost věku v rodě je větší ež u skupy žáků Mělvost můžeme měřt růzým míram varablty Nejjedodušší mírou mělvost je varačí rozpětí, které vypočítáme jako rozdíl ejvětší a ejmeší hodoty v souboru (8) R = ma - m Varačí rozpětí věku skupy žáků je roky, varačí rozpětí věku rody je 59 let Velkost varačího rozpětí je edokoalou míry varablty, protože závsí pouze a dvou okrajových hodotách a může být ovlvěa výskytem jedé etrémí hodoty, která se výrazě odlšuje od všech ostatích Tuto evýhodu odstraňuje apř mezkvartlové rozpětí, def ovaé jako rozdíl horího a dolího kvartlu: (9) ~ M 5 ~ 7 5 8 Elemetárí popsá statstka

Pravděpodobost a statstka Vhodější mírou varablty jsou míry, jejchž velkost závsí a hodotách všech jedotek souboru Uvedeme s průměrou odchylku a rozptyl Průměrá odchylka se vypočítá jako artmetcký průměr odchylek všech hodot od artmetckého průměru, přčemž se epřhlíží ke zamékům těchto odchylek (bereme absolutí hodoty) () d d V případě, když máme soubor roztříděý do skup, musíme vypočítat vážeou průměrou odchylku () d k k k k Nejčastěj používaou mírou varablty je rozptyl, který ozačujeme Rozptyl je defová jako artmetcký průměr čtvercových odchylek jedotlvých hodot pozorováí od artmetckého průměru: s () s Počítáme-l ze souboru roztříděého do skup, pak použjeme vážeý rozptyl (3) s k k resp k Protože je rozptyl vyjádře ve čtvercích (druhých mocách) měřcích jedotek, používá se často druhá odmoca z rozptylu, která se azývá směrodatá odchylka a začí se s (4) s s s Mohdy je výhodé použít tzv výpočtového tvaru vzorce rozptylu Elemetárí popsá statstka 9

Bakoví sttut vysoká škola (5) s k k k k Uvedeme s také základí vlastost rozptylu Jsou-l všechy hodoty souboru stejé, rozptyl je ulový Zvětšíme-l všechy hodoty souboru o kostatu k, rozptyl se ezměí 3 Vyásobíme-l všechy hodoty souboru kostatou k, rozptyl se zvýší k krát 4 Rozklad rozptylu Skládá-l se soubor z k dílčích souborů (skup) s četostm, se skupovým průměry a skupovým rozptyly s, pak můžeme celkový rozptyl s rozložt a součet dvou rozptylů, z chž jede charakterzuje varabltu mez skupam a druhý varabltu uvtř skup: (6) s k k k k kde s s s s s s, vyjadřuje celkový rozptyl hodot sledovaého zaku, se azývá rozptyl skupových průměrů (charakterzuje varabltu mez skupam) je průměr skupových rozptylů (charakterzuje varabltu uvtř skup) Příklad 7 Soubor jedotek je rozděle do 3 skup se skupovým četostm, 3 a 6 jedotek V každé skupě byly vypočtey pro hodoty sledovaého zaku X skupové průměry a skupové rozptyly Celkový rozptyl hodot zaku X celého souboru jedotek pak vypočteme použtím rozkladu rozptylu (vzorec (5)) Potřebé výpočty jsou uvedey v tabulce 5 Tabulka 5 - Výpočet celkového rozptylu pomocí rozkladu rozptylu Skupa s s ( ) 8 9 8 9-44 3 4 6 3 6 5 3 3 4 5 68 ) Elemetárí popsá statstka