6. Pravděpodobnost a statistika. 6.1. Pravděpodobnost



Podobné dokumenty
Pravděpodobnost je. Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava

7. Rozdělení pravděpodobnosti ve statistice

Matematika III. 27. září Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

2. přednáška - PRAVDĚPODOBNOST

Pravděpodobnost a statistika

Náhodné jevy. Teorie pravděpodobnosti. Náhodné jevy. Operace s náhodnými jevy

Inženýrská statistika pak představuje soubor postupů a aplikací teoretických principů v oblasti inženýrské činnosti.

Pravděpodobnost a statistika

Teorie pravěpodobnosti 1

pravděpodobnosti Pravděpodobnost je teorií statistiky a statistika je praxí teorie pravděpodobnosti.

Pojem a úkoly statistiky

Intuitivní pojem pravděpodobnosti

Pravděpodobnost a její vlastnosti

PRAVDĚPODOBNOST Náhodné pokusy. Náhodný jev

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Diskrétní matematika. DiM /01, zimní semestr 2016/2017

23. Matematická statistika

Základy teorie pravděpodobnosti

Diskrétní matematika. DiM /01, zimní semestr 2018/2019

1. Statistická analýza dat Jak vznikají informace Rozložení dat

Tomáš Karel LS 2012/2013

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Pravděpodobnost a aplikovaná statistika

IB112 Základy matematiky

Náhodný pokus Náhodným pokusem (stručněji pokusem) rozumíme každé uskutečnění určitého systému podmínek resp. pravidel.

5. Náhodná veličina. 2. Házíme hrací kostkou dokud nepadne šestka. Náhodná veličina nabývá hodnot z posloupnosti {1, 2, 3,...}.

Náhodné (statistické) chyby přímých měření

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

Matematika I 2a Konečná pravděpodobnost

Statistika. pro žáky 8. ročníku. úterý, 26. března 13

TEORIE PRAVDĚPODOBNOSTI. 2. cvičení

Náhodné chyby přímých měření

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Pro zvládnutí této kapitoly budete potřebovat 4-5 hodin studia.

2. Definice pravděpodobnosti

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Pravděpodobnost a aplikovaná statistika

Náhodný jev a definice pravděpodobnosti

Někdy lze výsledek pokusu popsat jediným číslem, které označíme X (nebo jiným velkým písmenem). Hodíme dvěma kostkami jaký padl součet?

Renáta Bednárová STATISTIKA PRO EKONOMY

a) 7! 5! b) 12! b) 6! 2! d) 3! Kombinatorika

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

Určeno studentům středního vzdělávání s maturitní zkouškou, 4. ročník, okruh Základy počtu pravděpodobnosti

Statistika I (KMI/PSTAT)

Základy popisné statistiky

KOMBINATORIKA. 1. cvičení

Statistika pro geografy

2. Statistická terminologie a vyjadřovací prostředky Statistická terminologie. Statistická jednotka

letní semestr Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

Úvod do teorie pravděpodobnosti

STATISTIKA 1. Adam Čabla Katedra statistiky a pravděpodobnosti VŠE

Diskrétní náhodná veličina

Matematika I (KMI/PMATE)

ZÁKLADY STATISTICKÉHO ZPRACOVÁNÍ ÚDAJŮ 5. hodina , zapsala Veronika Vinklátová Revize zápisu Martin Holub,

Informační a znalostní systémy

Náhodná veličina a rozdělení pravděpodobnosti

NÁHODNÁ VELIČINA. 3. cvičení

Rozdělení náhodné veličiny. Distribuční funkce. Vlastnosti distribuční funkce

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od podzimu 2016

5.1. Klasická pravděpodobnst

Matematika (KMI/PMATE)

2. Bodové a intervalové rozložení četností

Chyby měření 210DPSM

Základní pojmy a úvod do teorie pravděpodobnosti. Ing. Michael Rost, Ph.D.

III/2 Inovace a zkvalitnění výuky prostřednictvím ICT

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Třídění statistických dat

0.1 Úvod do matematické analýzy

KGG/STG Statistika pro geografy

Pravděpodobnost Podmíněná p. Úplná p. III. Pravděpodobnost. III. Pravděpodobnost Statistika A (ZS 2015)

Jana Vránová, 3. lékařská fakulta UK

Populace vs. data. popisná (deskriptivní) popis konkrétních dat. letní semestr

Základy teorie pravděpodobnosti

Cvičení ze statistiky - 5. Filip Děchtěrenko

Základní pojmy a cíle statistiky 1

Mnohorozměrná statistická data

Náhodný pokus každá opakovatelná činnost, prováděná za stejných nebo přibližně stejných podmínek, jejíž výsledek je nejistý a závisí na náhodě.

PRAVDĚPODOBNOST A STATISTIKA

Tomáš Karel LS 2012/2013

10. N á h o d n ý v e k t o r

ROZDĚLENÍ NÁHODNÝCH VELIČIN

3. Podmíněná pravděpodobnost a Bayesův vzorec

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady

Popisná statistika kvantitativní veličiny

MĚŘENÍ, TYPY VELIČIN a TYPY ŠKÁL

4. ZÁKLADNÍ TYPY ROZDĚLENÍ PRAVDĚPODOBNOSTI DISKRÉTNÍ NÁHODNÉ VELIČINY

2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat

1 Náhodný výběr a normální rozdělení 1.1 Teoretická a statistická pravděpodobnost

Základy biostatistiky

0.1 Funkce a její vlastnosti

Přednáška 3: Limita a spojitost

Diskrétní náhodná veličina. November 12, 2008

Mnohorozměrná statistická data

Obsah. Základy teorie pravděpodobnosti Náhodný jev Pravděpodobnost náhodného jevu Pravděpodobnost. Pravděpodobnost. Děj pokus jev

Základy popisné statistiky

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

2. Množiny, funkce. Poznámka: Prvky množiny mohou být opět množiny. Takovou množinu, pak nazýváme systém množin, značí se

Transkript:

6. Pravděpodobnost a statistika 6.1. Pravděpodobnost Pravděpodobnost (hovorově šance; značka je P z anglického probability) je hodnota vyčíslující jistotu resp. nejistotu výskytu určité události. K pojmu pravděpodobnost dospějeme zobecněním a abstraktním vyjádřením empirických zkušeností z různých oblastí lidské činnosti. Pravděpodobnostní hodnotu nabývají náhodné proměnné. Příbuzným pojmem k pravděpodobnosti je pojem šance, který vyjadřuje poměr relativních četností výskytu příznivých a nepříznivých případů zatímco pravděpodobnost padnutí např. líce na minci je 0,5, šance tohoto jevu je 1 : 1. Pojmem, který nás bude v tomto předmětu často provázet, je i pojem riziko. Riziko je pravděpodobnost toho, že nastane jiný než očekávaný výsledek. Riziko tedy nelze ztotožňovat pouze s hrozbou nějaké ztráty či neúspěchu. Pravděpodobnost má více téměř ekvivalentních definic. Pravděpodobností se zabývá a zkoumá ji teorie pravděpodobnosti. Teorie pravděpodobnosti Teorie pravděpodobnosti je odvětví matematiky, které umožňuje podle pravděpodobností jedněch náhodných událostí nacházet jiné náhodné události, které nějakým způsobem souvisí s prvými. Ve vědě existuje několik koncepcí práce s náhodou (např. teorie hromadné obsluhy). Pravděpodobnost je jenom jednou z nich. Intuitivní chápání pravděpodobnosti Intuitivní - laické chápání pravděpodobnosti je spojené s každodenní lidskou činností, kdy hovoříme např. o počasí (na 100 % bude pršet) nebo šanci, že stihneme autobus HMD, když jsme zaspali anebo o naší šanci vyhrát některou z cen na zakoupený los. 1

Příklady 1. Hod mincí. Při hodu nepoškozenou mincí z dostatečné výšky na rovnou pevnou plochu existuje stejná možnost, že padne kterákoli z obou stran mince. Stejný předpoklad platí, jestliže se tento experiment za stejných podmínek opakuje. V tomto případě se stejná možnost padnutí každé strany projeví (přibližně) stejnou absolutní i relativní četností padnutí každé strany mince. Očekáváme, že při rostoucím počtu pokusů se relativní četnost bude ustalovat na hodnotě 0,5. Hod mincí mnohokrát opakujeme, značíme si kolikrát padne hlava a do grafu vynášíme poměr mezi počtem hlav a počtem hodů Relativní četnost = počet hlav / počet hodů 1.00 0.75 Experiment 1 Experiment 2 0.50 0.25 0.00 Počet hodů mincí 0 25 50 75 100 125 2. Sportka. Jakou možnost uhodnutí 5 čísel má hráč, který na tiketu Sportky zatrhl 6 čísel z nabízených 49? Zřejmě existuje 258 způsobů jak uhodnout právě 5 čísel z 6 bez ohledu na pořadí a při tom neuhodnout právě jedno číslo ze zbývajících 43 (exaktně je to vyjádřeno 6 43 6! součinem kombinačních čísel 5 1 43 258 ). 5!(6 5)! Existuje tedy 258 příznivých případů. Vyjádřeme jejich relativní četnost mezi všemi možnými případy, kterých je tolik, kolik šestic se dá vytvořit ze 49 čísel: 49 49! 6 13983816. Relativní četnost příznivých případů mezi všemi 6!(49 6)! 258 možnými je tedy 0, 0000184. Toto číslo je zároveň pravděpodobností 13983816 výhry 5 čísel z pět. 2

3. Sebeklam hazardního hráče Jako sebeklam hazardního hráče označujeme jeho mylný dojem, že šance vyhrát (pravděpodobnost výhry), stoupají anebo klesají na základe předcházejících výsledků. V Kalifornii existuje státní loterie, která se jmenuje Superlotto, v které je třeba uhádnout 6 čísel z 51. Zní to jednoduše, ale jaká je pravděpodobnost (šance vyhrát), že se to stane? Toto je příklad obyčejného víkendu: 25. července 1998 byly vylosované čísla: 5,7,21,32,44,46. V banku (jackpot) bylo 16 miliónů dolarů. Na žádném tiketu nebylo všech šest čísel. 170 tiketů uhádlo 5 čísel a každý vyhrál po 1 588 dolarů, 9 715 hráčů mělo 4 z 6 čísel a dostalo po 72 dolarů a 176 657 hráčů uhádlo 3 z 6-ti při odměně 5 dolarů pro každého. Když byste naprogramovali počítač, aby každou sekundu náhodně generoval šest čísel od 1 do 51, museli byste čekat asi 7 měsíců, než by vám vyšla ta správná kombinace aspoň jednou. Pravděpodobnost uhádnutí: všech 6 čísel je 1 ku 18 009 460, pro 5 z 6 je 1 k 66 702, pro 4 z 6 je 1 k 1 213, a pro 3 z 6 je 1 ku 63. Teda šance cosi vyhrát je jedna ku šedesát. Když si každý týden koupíte 100 tiketů, můžete očekávat, že vyhrajete jackpot průměrně každých 3 463 roků. Když koupíte každý týden tikety za 25 000 dolarů, vaše pravděpodobnost výhry se zkrátí na každých 14 roků. Když očekáváte, že budete žít ještě dalších 50 roků, měli byste si týdenně kupovat tikety za 6927 dolarů. Kdybyste se uspokojili s pěti čísly ze šesti, budete to mít mnohem lehčí. Je pravděpodobné, že 5 z 6tich uhádnete průměrně každých 12.8 roků za podmínky, že si týdenně koupíte 100 tiketů. Možná si ještě stále myslíte, že můžete pomoci štěstí tím, že si zvolíte čísla, které nebyly vybrané v minulých kolech, anebo čísla, které vycházejí častěji. Právě teď propadáte falešné iluzi falešného hráče. Pravděpodobnost je vždy stejná, bez ohledu na čísla, které vyhrály v minulosti. Této iluzi běžně propadají hráči, kteří, například, staví při ruletě na červenou, když se předtím třikrát objevila černá. Pravděpodobnost, že se znova objeví černá zůstává stejná bez ohledu na to, jaká barva se objevila předtím. Zdá se, že loterie mají něco společné s podvodnými pyramidovými hrami - na to, aby někdo skutečně hodně vyhrál, musí mnoho lidí ztratit téměř všechno, co vsadili. 3

Klasická definice pravděpodobnosti (Pierre Simone de Laplace) Pravděpodobnost = počet relevantních případů/počet všech možných případů. Příklad Otázka: "Jaká je pravděpodobnost, že v Bratislavě za den někoho zrazí auto?" Jinými slovy: "Jaký je očekávaný podíl počtu sražených lidí (za den) na všech lidech přítomných v Bratislavě"? Řešení: Počet relevantních = počet zrazených lidí v Bratislavě za den (například průměr podia historických záznamů policie = 97,25 Počet všech možných případů = počet lidí přítomných v Bratislavě (například průměrný počet obyvatel + počet turistů + počet lidí docházejících za prací podle historických záznamů = 507 250) Výsledek: P = 97,25 / 507250 = 0,000192 (neboli 0.0192%) Statistická definice pravděpodobnosti (Richard von Mises) Táto definice je vlastně jakési upřesnění klasické definice. Pravděpodobnost = číslo (přesněji limita), ke které se při mnohonásobném opakovaní "pokusu" blíži relativní frekvence jevu (t. j. poměr počet relevantních případů/počet všech možných případů) Příklad Otázka: "Jaká je pravděpodobnost, že v Bratislavě za den někoho srazí auto?" Řešení: Urobíme následující "výpočet" (v ideálním případě pro velmi mnoho dní) se zadanými údaji o počtu havárií a obyvatelů Bratislavy: Den Počet sražených lidí Počet lidí v Bratislavě Relativní frekvence pravděpodobnost srážky dnes 85 490000 85/490000 = 0,000173 včera 96 510000 96/510000 = 0,000188 předevčírem 105 530000 105/500000 = 0,00021 předpředevčírem 103 499000 103/499000 = 0,000206............ Za všechny zkoumané dny 389 2029000 0,000192 Zjednodušeně se počítá tzv. průměrná relativní frekvence: P = (85 + 96 + 105 + 103) / (490000 + 510000 + 530000 + 499000) = 0,000192 4

Pravděpodobnost jako míra důvěry (Thomas Bayes) Táto, na prvý pohled velmi nevědecká, definice hovoří, že pravděpodobnost je číslo mezi 0 a 1, které je mírou pro naši víru v realizaci (vznik) nějakého jevu nebo víra v pravdivost nějakého tvrzení. Pod realizací jevu tu můžeme mít na mysli například výhru domácích ve fotbale, pod pravdivostí nějakého tvrzení zase pravděpodobnost, že hmotnost Saturnu se nachází v nějakém dopředu zvoleném intervale. Zvlášť druhá možnost je při fyzikálním výzkumu častá (experimentálně hledáme hodnoty různých konstant, hmotností elementárních částic, atd.). Se Saturnem totiž nemůžeme udělat víc pokusů - jeho hmotnost je daná a v daném intervale buď leží, nebo neleží - problém je jen v tom, že my nepoznáme odpověď. Axiomatická definice (Andrej Nikolajevič Kolmogorov) Pravděpodobnost P (A) náhodné události A je v tomto případe reálna funkce, která každé náhodné události A přiradí určité číslo P (A), přičemž platí tyto axiómy: P(A) 0 P (E)=1, když E je jistá událost když A1, A2,, An, je postupnost disjunktních náhodných událostí (nemohou současně nastat). Pravděpodobnost, že aspoň jedna z nich při náhodném pokuse nastane, se tedy rovná součtu jejich pravděpodobností: P(A1 U A2 U... U An U... ) = P(A1) + P(A2) +... + P(An) +... Vlastnosti P leží vždy mezi 0 a 1 (resp. vyjádřené v procentech: mezi 0% a 100%) P jevu nemožného je 0 (0%), P jevu jistého je 1 (100%) Součet jednotlivých P všech možných případů je 1 (100%) P že nastane len A, anebo jen B, anebo A i B současné = P, že nastane A + P, že nastane B - P, že nastane A i B současně Z předcházejících tvrzení je zřejmé, že pravděpodobnost je možné vyjádřit čtyřmi základními způsoby: klasicky - jako číslo v intervale [0-1], v procentech [%], poměrem, např. 1 : 1, zlomkem, např.. Pravděpodobnost, že při hode mincí padne rub je tedy možné identicky vyjádřit jako 0,5 ~ 50% ~ ½ ~ 1:1. 5

6.2. Náhodný jev a náhodný experiment Nechť je definován komplex podmínek, za kterých je sledována možnost nastoupení nějakého jevu (např. přeměna vody v páru při dané teplotě, tlaku apod.). Pak: Jev, který za těchto podmínek nemůže nikdy nastat, nazveme jevem nemožným (např. přeměna vody v páru při normálním tlaku a teplotě 10 C). Jev, který za těchto podmínek nutně musí nastat, nazveme jevem jistým (např. přeměna vody v páru při normálním tlaku a teplotě 100 C). Jev, který i při striktním dodržení podmínek může, ale nemusí nastat, případně nastává s různou intenzitou, nazveme jevem náhodným. Nemožný jev označíme symbolem V, jistý jev symbolem I, pro náhodné jevy máme vyhrazena velká písmena ze začátku latinské abecedy, např. A, B, C, event. A 1, A 2, A 3, A n a pod. Náhodný jev tedy není bezezbytku určen komplexem podmínek, ale o jeho nastoupení či nenastoupení spolurozhoduje náhoda. Každý děj, který v sobě obsahuje prvek náhody a jehož výsledek má charakter náhodného jevu, nazýváme náhodný experiment. Tento pojem je v počtu pravděpodobnosti široce využíván i tam, kde se v běžném životě nevyskytuje (tedy nejen házení kostkou nebo střelba do terče, ale i výroba výrobku, léčení pacienta atd.). Příklady o hodu mincí či kostkou, střelbě do terče apod. se vzhledem k jednoduchosti a všeobecné znalosti podmínek těchto náhodných experimentů používají zcela běžně. Stromový diagram vyjadřuje graficky průběh a možné výsledky náhodného experimentu. Příklad průběh a výsledek semestrální zkoušky. Řádný termín Uspěl Neuspěl První opravný termín Uspěl Neuspěl Druhý opravný termín Uspěl Neuspěl Základní jednotkou označující výsledek náhodného experimentu je možný případ. Skončí-li náhodný experiment nastoupením nějakého náhodného jevu A, říkáme, že nastal příznivý případ pro jev A (v opačném případě nastal nepříznivý případ). Neurčitost (entropie) je měřítkem komplikovanosti náhodného experimentu. Jednotkovou míru neurčitosti dosahuje náhodný experiment se dvěma stejně možnými výsledky. 6

6.3. Elementární jev, základní prostor jevů, opačné jevy Každý z možných výsledků náhodného experimentu nazýváme možným případem nebo elementárním jevem. Elementární jevy značíme symboly e 1, e 2,. Elementární jev má tyto vlastnosti: je neslučitelný (disjunktní) s libovolným jiným elementárním jevem padne-li na kostce např. jednička, nemůže současně padnout žádné jiné číslo, tvoří úplnou skupinu jevů (jeden z nich musí nutně nastat) nějaké číslo mezi jednou a šesti padnout musí. může nastat právě jedním způsobem, je nerozložitelný každé číslo na kostce může padnout jen jedním způsobem. Množina všech elementárních jevů určitého náhodného experimentu se nazývá základní prostor jevů a označuje se. Do základního prostorů jevů patří vždy jev jistý I i jev nemožný V. Je-li elementárních jevů konečný počet, bude poslední z nich e n a máme co do činění s konečným základním prostorem jevů. Elementárních jevů může být i nekonečně mnoho. Pokud k očíslování všech elementárních jevů postačí přirozená čísla, označujeme jejich počet za spočetně nekonečný, jinak jde o nespočetně nekonečný počet. Příklady Hod mincí. Základní prostor jevů je tvořen jevem jistým (padne líc nebo rub), jevem nemožným (nepadne ani líc ani rub) a dvěma elementárními jevy (padne líc, padne rub). Celkový počet jevů je 2 2 4. Hod kostkou. Základní prostor jevů je tvořen jevem jistým a nemožným, šesti elementárními jevy a 56 složenými jevy (např. padnutí sudého čísla, padnutí čísla menšího než 4, atd. atd.). Celkový počet jevů je 2 6 64. Všimněme si, že v obou případech je exponent u čísla 2 tvořen počtem elementárních jevů. Celkový počet jevu konečného je roven 2 n, kde n je počet elementárních jevů. Opačné jevy Při házení kostkou bude jevem E padnutí sudého čísla, který obsahuje elementární jevy e 2, e 4, e 6. Opačným jevem E = padnutí lichého čísla bude taký, který obsahuje všechny zbývající elementární jevy e 1, e 3, e 5. Opačné jevy tvoří úplnou skupinu neslučitelných (disjunktních) jevů. 7

6.4. Pravděpodobnost a statistika Pravděpodobnost vztahujeme v statistických projektech na očekávané obměny: jednoho statistického znaku, dvou statistických znaků tří a více statistických znaků Základní statistickou metodou na zkoumání pravděpodobnosti statistických znaků je třídění statistických dat uvedené v kapitole 4. Třídíme a hledáme pravděpodobnost výskytu: jednotlivých obměn jednoho statistického znaku - jednoduché třídění, skupin (intervalů) obměn jednoho statistického znaku - skupinové třídění, vzájemných obměn dvou statistických znaků - třídění podle dvou statistických znaků, tří a více statistických znaků. Na vyjádření pravděpodobnosti používáme relativní početnost v pravděpodobnostním tvaru, která se může pohybovat v intervalu [0,1]. Hodnota vyjadřuje, s jakou pravděpodobností je možné očekávat výskyt statistické jednotky s příslušnou obměnou statistického znaku. Základní podmínkou zkoumání pravděpodobnosti je reprezentativnost statistického souboru, použitého na její zjišťování (kapitola 3.2). Reprezentativnost základního statistického souboru se dosahuje výběrem statistických jednotek podle dopředu stanovených kritérií (věk, vzdělání, ). Pravděpodobnostní vyjádření relativní početnosti je bezrozměrné. 8

6.4.1. Pravděpodobnost při jednoduchém třídění Jednoduché třídění statistických jednotek je možné použít na výpočet pravděpodobnosti výskytu obměn: kvalitativních (slovních) znaků anebo kvantitativních diskrétních (nespojitých) číselných znaků s malou obměnou hodnot statistického znaku. Třídění se uskutečňuje podle jednotlivých obměn statistického znaku. Pořadí obměn volíme prvotně podle následujících možností: obměny je možné seřadit podle významu (např. podle úrovně školy) obměny je možné vystupňovat (např. hodnocení studentů) obměny seřadíme podle abecedy, obměny seřadíme náhodně (barvy aut), obměny seřadíme náhodně podle subjektivního názoru řešitele. Obměny můžeme seřadit druhotně podle absolutní početnosti sestupně anebo vzestupně Na třídění statistického znaku používáme třídící tabulku (5.1), která má standardní postup, zásady a strukturu podle kapitoly 4. Příklad na pravděpodobnost výskytu typu střední školy u absolventů středních škol je v tabulce 5.1. Podmínkou správné interpretace je reprezentativnost základního souboru 155 studentů středních škol. Třída k (pořadové číslo) Pravděpodobnost výskytu typu střední školy u absolventů středních škol Třídící znak (typ střední školy) Absolutní četnost n i (počet studentů) Relativní četnost p i (pravděpodobnost absolvované střední školy) Kumulativní četnost kn i (součtový počet studentů) 1 OU 36 0,232 36 0,232 2 OUM 29 0,187 65 0,419 3 SŠ 29 0,187 94 0,606 4 G 30 0,194 124 0,800 5 RG 31 0,200 155 1,000 SUMA X 155 1,000 X X Tab. 5.1 Kumulativní relativní četnost kp i (součtová pravděpodobnost absolvované střední školy) 9

Tabulková forma jednoduchého třídění kvalitativních (slovních) znaků se při zobrazení pravděpodobnosti doplňuje většinou: spojnicovým grafem relativních četností (obr. 5.1) anebo, kruhovým výsečovým grafem relativních četností. Jednotlivé sloupce nebo výseče je vhodné doplnit konkrétní hodnotou. Obr. 5.1. Pravděpodobnost výskytu absolventů středních škol podle typu školy Obr. 5.2. Pravděpodobnost výskytu absolventů středních škol podle typu školy 10

6.4.2. Pravděpodobnost při skupinovém (intervalovém) třídění Skupinové (intervalové) třídění statistických jednotek je možné použít na výpočet pravděpodobnosti v případě kvantitativních číselných znaků. Skupinové (intervalové) třídění používáme v případě, že číselné znaky (spojité i nespojité) vykazují velké množství obměn. Skupinové třídění spočívá ve vytvoření k tříd (skupin, intervalů) ve variačním rozpětí R souboru od minimální x i, min až po maximální x imax, hodnotu znaku podle postupu uvedeného v kapitole 4.1.3. Původní data se zařazují do tříd (skupin, intervalů) a zjišťují se relativní početnosti jednotlivých tříd vyjádřené pravděpodobnostně. Příklad na pravděpodobnost výskytu domácností v jednotlivých příjmových skupinách je uvedený v tabulce 5.2. Podmínkou správné interpretace by měla znova být reprezentativnost výběru domácností. Pravděpodobnost výskytu domácností podle příjmových skupin Tab. 5.2 Třída Hranice měsíčních příjmů [Čk] Střed příjmové hranice [Čk] Počet domácností Pravděpodobnost výskytu domácností v příslušné příjmové skupině Součtová četnost domácností absolutní relativní k x d - x h x i n i p i kn i kp i 1. <15 až 20) 17,5 12 0,15 12 0,15 2. <20 až 25) 22,5 32 0,40 44 0,55 3. <25 až 30) 27,5 20 0,25 64 0,80 4. <30 až 35) 32,5 8 0,10 72 0,90 5. <35 až 40) 37,5 6 0,08 78 0,98 6. <40 až 45) 42,5 2 0,02 80 1,00 80 1,00 11

Tabulková forma pravděpodobnosti skupinového třídění se při zobrazení pravděpodobnosti doplňuje: histogramem anebo bodovým grafem relativních četností, výsečovým grafem relativních četností. Histogram pravděpodobnosti je sloupcový graf tvořený pravidelnými rovnoběžníky, který přiřazuje příslušnou pravděpodobnost celému intervalu (skupině). Základy sloupců na ose x mají délku intervalů (šířky třídy) h, pro všechny stejnou a příslušné výšky mají velikost odpovídající pravděpodobnosti. Obr. 5.3. Pravděpodobnost výskytu domácností v jednotlivých příjmových skupinách Obr. 5.4. Pravděpodobnost výskytu domácností v jednotlivých příjmových skupinách vztažená na středy příjmových skupin (intervalů) 12

Obr. 5.5. Pravděpodobnost výskytu domácností v jednotlivých příjmových skupinách 13

6.4.3. Pravděpodobnost při třídění podle dvou statistických znaků Třídění podle dvou statistických znaků je možné použít na výpočet pravděpodobnosti výskytu jednotlivých kombinací jejich obměn. Výsledkem třídění jsou kombinační tabulky. Podle charakteru tříděných znaků rozlišujeme tyto kombinační tabulky: korelační tabulka třídění podle dvou číselných znaků, kontingenční tabulka třídění podle dvou slovních znaků, asociační tabulka třídění podle dvou alternativních slovních znaků. Příklad na pravděpodobnost výskytu rodin podle počtu dětí a počtu místností v bytě je uvedený v tabulce 5.3. Podmínkou správné interpretace by měla být opět reprezentativnost výběru rodin. Tab. 5.3 Pravděpodobnost výskytu rodin podle počtu dětí a bytových místností Počet dětí Pravděpodobnost výskytu rodin podle počtu Celkem (proměnná x) dětí a místností (proměnná y) 1 2 3 4 0 0,10 0,12 0,08-0,30 1-0,18 0,12-0,30 2 - - 0,20 0,10 0,30 3 - - - 0,10 0,10 Celkem 0,10 0,30 0,40 0,20 1,00 V případě, že je počet obměn některého číselného (kvantitativního) statistického znaku velký, musí být konkrétní obměny nahrazeny skupinami (intervaly). Konstrukce intervalů je identická jako u skupinového třídění (4.1.3) Na zobrazení pravděpodobnosti je praktické použít sloupcový pseudo 3D graf. Obr. 5.5. Pravděpodobnost výskytu rodin podle počtu dětí a počtu místností v bytě 14

Další příklad na pravděpodobnost výskytu dvou kvalitativních znaků je uvedený v tabulce 5.4 a v grafu 5.6. Jaká je pravděpodobnost počtu vykradení domu v obci XY za 50 let podle druhu jeho zabezpečení? Statistická metoda: Třídění podle dvou statistických znaků (počet vykradení domu za posledních 50 let a typ zabezpečení domu). Četnost domácností vyjádřená jako relativní četnost v pravděpodobnostním vyjádření. Na grafické znázornění použijeme prostorový sloupcový graf v pseudo 3D zobrazení. Tab. 5.4 Pravděpodobnost počtu vykradení domu v obci XY za 50 let podle typu jeho zabezpečení Druh zabezpečení domu Pravděpodobnost vykradení domu 0 x 1 x 2 x 3 x 4 x 5 x Kontrolní součet Bez zabezpečení 0,47 0,125 0,025 0,01 0,01 0,005 0,645 Bezpečnostní zámek 0,15 0,025 0,015 0,005 0,005 0,005 0,205 Bezpečnostní dveře 0,05 0,015 0,01 0 0 0 0,075 Bezpečnostní okna a dveře 0,02 0,005 0,005 0 0 0 0,03 Kamerový systém 0,02 0,005 0 0 0 0 0,025 Komplexní zabezpečení 0,02 0 0 0 0 0 0,02 Kontrolní součet 0,73 0,175 0,055 0,015 0,015 0,01 1 Obr. 5.6 Pravděpodobnost vykradení domu v obci XY za 50 roků podle typu zabezpečení 15

Interpretace výsledků: V jednotlivých datových polích tabulky a sloupcích grafu je ve formě relativní početnosti zobrazená pravděpodobnost s jakou je možné očekávat vykradení domu ve vazbě na obměny obou statistických znaků uvedených v záhlaví a řádcích tabulky. Rozhodující výpovědnou hodnotu má v tomto případě kontrolní součet pravděpodobnosti v posledním sloupci tabulky, který vyjadřuje kumulovanou pravděpodobnost pro jednotlivé typy zabezpečovacího zařízení. Výsledky prokázali, že v případě komplexního zabezpečení domu je pravděpodobnost vykradení domu nejnižší (0,02). Odpověď na otázku Pravděpodobnost vykradení domu za 50 roků je přímo závislá na typu zabezpečovacího zařízení domu. Při domu bez zabezpečení se jedná o pravděpodobnost p = 0,645, při komplexním zabezpečení jen p = 0,02. Stupeň závislosti by bylo vhodné ověřit dalšími metodami. 16