VUT BRNO FAKULTA STROJNÍHO INŽENÝRSTVÍ Jaroslav Michálek PRAVDĚPODOBNOST A STATISTIKA BRNO 2006 preprint
Kapitola 1 Úvod Prudký rozvoj výpočetní techniky, jehož jsme v posledních desetiletích svědky, podstatně zasahuje a ovlivňuje všechny stránky našeho života V současné době je velmi snadné pořídit a shromáždit velké množství údajů o prvcích rozsáhlých souborů, které jsou středem našeho zájmu či výzkumu Takové údaje často mají charakter hromadných dat Říkáme, že hromadná data jsou výsledkem pozorování tzv hromadných jevů, tedy jevů, které sledujeme na velkých skupinách prvků, přičemž není naším cílem analyzovat, jaký jev byl pozorován u toho kterého prvku, ale naopak popsat sledovaný jev z hlediska anonymního prvku uvažovaného souboru Je-li např předmětem našeho zájmu sledování nezaměstnanosti v daném souboru obyvatel, nezajímá nás při zkoumání tohoto hromadného jevu, zda daná osoba sledovaného souboru je či není nezaměstnaná, ale zajímáme se o to, jakou šanci má daná anonymní osoba v tomto souboru být zaměstnána K získání určitých poznatků a vyslovení závěrů o zkoumaném jevu nestačí jednotlivá pozorování, ale jsou nutná pozorování hromadná, jejichž výsledkem je hromadný jev Analýzou hromadných jevů o sledovaném souboru je možné získat velké množství informace, kterou lze využít při dalším rozhodování Snahu shromažd ovat hromadná data a analyzovat hromadné jevy lze pozorovat již v dávné historii Jedny z prvních hromadných jevů, které byly v minulosti sledovány, byly údaje o popisu státu, tedy údaje spočívající ve zobrazení daného zeměpisného, hospodářského a politického stavu Protože status je stav, ale také stát (stav společenství), ujal se pojem statistika pro činnosti, související se shromažd ováním hromadných dat a analýzou hromadných jevů Jedno z prvních státovědných děl, kde je možno pozorovat vznik statistiky jako oboru lidské činnosti, je dílo Francesca Sansoviny: Del governo et amministratione di diversi regni (O vládě a správě v různých královstvích), které vyšlo v Benátkách v roce 1562 V 17 a 18 století vznikla řada státovědných děl zejména v Německu (Veit Ludwig von Seckendorff, Hermann Conring, Gottfried Achenwall) Tito autoři přistupovali ke statistice jako k popisné státovědě Jejich přístupy ke statistice lze dodnes najít ve statistických ročenkách 1
2 řady států, kde se nejdříve uvádí řada geografických údajů (např rozloha, hustota populace, nejvyšší vrcholy apod) Jiný přístup ke statistice vznikal paralelně v této době v Anglii Graunt a Petty založili směr statistiky zvaný politická aritmetika Jejím cílem byla evidence údajů o narozeních a úmrtích obyvatel a snaha provádět srovnání těchto údajů a popsat číselný vývoj obyvatelstva pro delší časové období V 18 století byl další rozvoj statistiky ovlivněn rozvojem matematiky a zejména pravděpodobnosti První myšlenkové koncepce směrem k moderní statistice lze nalézt v díle belgického autora Adolpha Quételeta, kde z hromadných biologických dat o lidské populaci stanovil typ průměrného člověka ( homme moyen ) a nastínil tak základ pro budoucí statistiku - koncepci normálního rozdělení, střední hodnoty a rozptylu V 18 a 19 století byl další vývoj statistiky zásadně ovlivněn pracemi významných matematiků, zejména pracemi bratří Bernoulliů, Eulera, Laplace, de Moivrea, Gausse a Bayese Jejich výsledky měly pro další rozvoj tzv matematické statistiky zásadní význam Úsilí statistiků v 19 a v první polovině 20 století bylo věnováno analýze hromadných jevů a zaměřeno na statistickou indukci, tedy na statistické usuzování z výběrového souboru na základní soubor, z něhož byl výběr pořízen U zrodu matematických metod pořizovaných k provádění statistické indukce stáli ruští matematici Čebyšev, Ljapunov a Markov Zásadním způsobem pak vývoj statistiky ovlivnila anglo americká škola, zejména práce R A Fishera, J Neymanna a E S Pearsona Metody zpracování statistických dat, které vycházejí z jejich prací, jsou dodnes hojně využívány a s jejich jmény je možno se setkat v prakticky každém kurzu moderní statistiky Vývoj moderních statistických metod ve druhé polovině minulého století byl orientován do rozvoje speciálních oborů statistiky Jedním z těchto oborů jsou tzv neparametrické statistické metody, jehož spoluzakladatelem je český matematik statistik J Hájek Konečně poslední rozvoj a použití statistických technik je vázáno na rozvoj počítačů, rychle se rozvíjí poměrně nový obor počítačová statistika (computional statistics) Důsledkem je, že k dispozici je velká řada softwareových produktů, obsahujících velmi širokou paletu statistických metod, určených různým uživatelům podle stupně jejich statistické vyspělosti Z uvedeného stručného historického přehledu vývoje statistiky je dobře patrné její členění Statistika vznikla jako státověda, ale v současné době slovo statistika chápeme ve více významech Statistikou především rozumíme: a) číselné údaje o hromadných jevech b) praktickou činnost spočívající ve sběru, zpracování a vyhodnocování statistických údajů
c) teoretickou vědní disciplínu, která se zabývá metodami pro analýzu hromadných jevů a statistickou indukcí, tedy statistickým usuzováním, jak informaci získanou náhodným výběrem ze základního souboru zpět zobecnit na základní soubor V těchto skriptech budeme především vycházet z pojetí statistiky uvedené v předcházejícím bodě c) a statistiku budeme chápat jako vědní obor Jeho součástí je tzv popisná statistika, která se především zabývá popisem statistických dat pomocí různých tabulek, grafů, diagramů a pomocí různých funkcionálních charakteristik, které lze z datových souborů snadno stanovit pomocí elementárních matematických prostředků Cílem tohoto statistického popisu je zpřehlednění informace obsažené v datových souborech (často velmi rozsáhlých) Další součástí statistiky jako vědního oboru je tzv matematická statistika, která matematickými prostředky, zejména pomocí teorie pravděpodobnosti, systematicky buduje metody pro analýzu statistických dat a pro provádění statistické indukce Součástí matematické statistiky je a) teorie odhadu, která se zabývá metodami přibližného stanovení (odhadem) parametrů základního souboru (výchozí populace) pomocí dat získaných náhodným výběrem Studují se různé přístupy ke získání těchto odhadů a konstruují se odhady bodové a intervalové b) testování statistických hypotéz, kde jsou vytvářeny matematické postupy pro ověření hypotéz o základním souboru a rozvíjí se metody pro srovnání statistických souborů z různých hledisek c) statistická predikce, kde se rozvíjejí statistické techniky umožňující na základě sledované dynamiky nějakého hromadného jevu kvalifikovaně odhadnout jeho budoucí vývoj Konečně dalšími důležitými speciálními statistickými obory, s nimiž se čtenář těchto skript jistě setká, je ekonomická statistika, která se zabývá metodami popisné statistiky a matematické statistiky pro zpracování především národohospodářských dat Dále výpočetní statistika, která se zabývá rozvojem výpočetních metod matematické statistiky a konstrukcí počítačově orientovaných nových statistických postupů např konstrukce nových algoritmů pro získání informace z dat (tzv data mining technologie) a konečně vytvářením nových velkých softwareových produktů pro statistickou analýzu rozsáhlých statistických dat nebo statistických dat speciálních vlastností Jak bylo řečeno slouží soudobá statistika k získávání informací z rozsáhlých datových souborů Používá přitom postupů, které vycházejí z matematické statistiky a jsou zaměřeny na získání optimální informace z dat a široká je také nabídka softwareových produktů, které zpřístupňují tyto poměrně složité statistické metody prakticky všem 3
4 zájemcům o jejich použití V této situaci je lehce možné zvolit pro zpracování daného souboru dat metodu, která není optimální nebo dokonce metodu, která informaci o datovém souboru zkreslí Může se to stát tak, že uživatel těchto metod dostatečně nerozumí používané metodě či vstupům a výstupům používaného softwareového produktu nebo dokonce záměrně a s ohledem na sledování vlastních cílů, komentuje výsledek statistického zkoumání tak, aby tento výsledek podpořil jeho argumenty Příkladů použití statistiky ke získávání zkreslených závěrů je celá řada Zde uvedeme ilustrativní příklad z knihy [17, str45-47], která přibližuje bohatost a krásu statistiky čtenáři s menší nebo žádnou představou o statistice Příklad je také stručně popsán v úvodu citované knihy na str 9, autorem úvodu je R Frische, nositel Nobelovy ceny Z tohoto úvodu cituji: Příběh muže, který zamýšlí koupit ve Zbohatlíkově pozemek Tento muž dostane různé, vzájemně zcela si odporující údaje o průměrném ročním příjmu obyvatel Zbohatlíkova Zprostředkovatel uvedl 82 320 tolarů a vysvětloval, že 20% obyvatel prý má průměrný roční příjem 309 400 tolarů Bankovní ředitel informoval, že více než polovina obyvatel má roční příjem přes 29 000 a nejčastější roční příjem je asi 18 000 tolarů Místní učitel, velmi zběhlý ve statistice, tvrdil, že většina obyvatel má příjem nižší než 7 500 tolarů A nakonec statistický úřad na dotaz sdělil, že všechny tyto zdánlivě si tak odporující údaje jsou pravdivé Vysvětlilo se to tím, že v tomto malém městě bydlel milionář a že matematické vlastnosti mediánu, aritmetického průměru, harmonického průměru, geometrického průměru a nejčetnější hodnoty souboru se navzájem podstatně liší V souvislosti s uvedeným příkladem je účelné uvést často parafrázovaný více než 100 roků starý výrok o statistice, nejčastěji přisuzovaný Benjaminu Disraelimu: Jsou tři druhy lží: lži, odsouzenihodné lži a statistiky Je s podivem, že se často tento výrok cituje nekriticky, bez znalosti nebo téměř bez znalosti toho, co vlastně statistika je Navíc uvedený příklad velmi názorně ukazuje, že statistická data lze interpretovat různými subjektivními způsoby a aby se čtenář dobře orientoval v různých možnostech takové interpretace, má smysl zabývat se statistickou teorií hlouběji Cílem těchto skript je uvést čtenáře do základních technik popisné statistiky a pomocí ní motivovat základní pojmy pravděpodobnostního počtu Dále vyložit základy teorie pravděpodobnosti v rozsahu, který umožní studovat moderní metody matematické statistiky a umožní zvládnutí základních postupů používaných při vyhodnocování zejména národohospodářských dat a dat v oblasti sociálně správní Tedy studovat bez problému metody a postupy ekonomické statistiky a umět je užít při řešení konkrétních praktických úloh
Kapitola 2 Pravděpodobnost a četnost 21 Náhodný pokus a náhodný jev Základním pojmem, z něhož budeme vycházet, je pojem pokus Pokusem budeme rozumět uskutečnění určitého souboru podmínek Podle toho, zda výsledek pokusu je možné z realizovaných podmínek pokusu jednoznačně určit nebo nikoliv, rozdělujeme pokusy na pokusy deterministické a na pokusy stochastické neboli náhodné Deterministické pokusy jsou takové pokusy, kdy očekávaný výsledek se dostaví vždy, když jsou správně dodrženy podmínky pokusu Typickými příklady takových pokusů jsou školské pokusy prováděné ve fyzice nebo chemii Např při zahřátí vody na 100 C při atmosférickém tlaku 760 torrů vždy pozorujeme, že voda vře Nebo při ponoření elektrod do roztoku CuSO 4, začne se na katodě hromadit měd Očekávaný výsledek se nedostaví jen tehdy, když nejsou správně dodrženy podmínky pokusu Naproti tomu náhodné (stochastické) pokusy jsou takové pokusy, kdy realizace podmínek pokusu může vyvolat různé následky, výsledek pokusu není jednoznačně určen jeho podmínkami Při opakovaném provádění daného náhodného pokusu, se získané výsledky chaoticky mění, nelze je předpovědět ani přesto, že podmínky takového pokusu jsou přísně dodržovány Na výsledek pokusu mají vliv také náhodní činitelé, kteří jsou mimo naši kontrolu Takové pokusy se velmi podobají úkonům z hazardních her jako je házení hracími kostkami nebo mincemi, rozdávání karet, tahání losů z osudí či roztáčení kola rulety Pokusy z uvedené oblasti se pro ilustraci základních principů pravděpodobnostní teorie zvlášt hodí pro malý počet možných výsledků, jejich jednoduchý a přesný popis a dokonalou znalost podmínek pokusu V mnoha odvětvích lidské činnosti bývá představa pokusu nejčastěji spojována s výzkumnou činností My budeme pojem pokusu, zejména náhodného pokusu, chápat mnohem šířeji, např nabídka zboží zákazníkovi, stanovení délky fronty u nějakého zařízení hromadné obsluhy, poskytnutí služby, zjištění hodnoty kurzu koruny k euru, 5
6 výběr respondenta pro průzkum poptávky, velikost úrody v dané oblasti apod Dále budeme uvažovat pevně daný náhodný pokus Jakékoliv tvrzení o výsledku náhodného pokusu, o kterém lze po uskutečnění pokusu jednoznačně rozhodnout, zda při dané realizaci pokusu je či není pravdivé, nazveme náhodným jevem Spočívá-li náhodný pokus v nabídce zboží zákazníkovi, může být příkladem náhodného jevu skutečnost, že zákazník nabízené zboží zakoupil Je-li uvažovaným náhodným pokusem zjištění hodnoty kurzu korunu k euru, může být náhodným jevem tvrzení, že kurz překročil hodnotu 30 korun za 1 euro apod V teorii pravděpodobnosti je cílem číselně ohodnotit náhodné jevy tak, abychom se mohli při opakovaném provádění pokusu lépe orientovat v tvrzeních typu jev nastává velmi často nebo jev prakticky nenastává či jev nastává poměrně často apod Číselnou kvantifikaci náhodných jevů chceme provést v souladu s našimi zkušenostmi Budeme předpokládat, že daný pokus lze libovolněkrát nezávisle opakovat Jednotlivé realizace pokusů mohou působit zcela chaoticky, ale při pozorování velkého počtu těchto realizací, tedy při tzv hromadném pozorování, se mohou objevit zjevné zákonitosti Tak například, když budeme opakovaně házet mincí, zjistíme, že líc padá přibližně v padesáti procentech hodů Budeme-li opakovaně házet kostkou, zjistíme, že číslo 6 padá přibližně v 16,66% hodů Budeme-li sledovat počty narozených chlapců v daném státě, bude jejich poměr k počtu všech narozených dětí kolísat kolem dané hodnoty (třeba blízké jedné polovině) Viz Tab 21 převzatá z [4] Rok 1927 1928 1929 1930 1931 1932 Celkový počet 958 733 990 993 994 101 1 022 811 964 573 934 663 narozených dětí Počet narozených 496 544 513 654 514 765 528 072 496 986 482 431 chlapců Relativní četnost 0,5179 0,5183 0,5178 0,5163 0,5152 0,5162 Tabulka 21: Tabulka Přehled dětí narozených v Polsku v letech 1927 1932 Když pro uvažovaný náhodný jev platí, že při dlouhodobých nezávislých opakováních pokusu se relativní četnost nastoupení daného jevu, tj poměr počtu nastoupení sledovaného jevu a počtu opakování pokusu, ustaluje kolem pevných hodnot, říkáme, že relativní četnosti tohoto jevu jsou statisticky stabilní Jsou-li statisticky stabilní relativní četnosti všech v daném pokusu uvažovaných náhodných jevů, mluvíme o statisticky stabilním náhodném pokuse V teorii pravděpodobnosti se potom zabýváme matematickým modelováním statisticky stabilních pokusů V první řadě jde o číselné ohodnocení jednotlivých statisticky stabilních jevů, které by bylo
v souhlasu s vlastnostmi relativních četností Toto kvantitativní ohodnocení povede k zavedení pravděpodobnosti Dříve než přikročíme k definici pravděpodobnosti náhodných jevů, popíšeme základní operace, které můžeme s náhodnými jevy provádět 7 22 Operace s náhodnými jevy V předchozím odstavci jsme zavedli náhodný jev jako tvrzení o výsledku náhodného pokusu, o němž lze po provedení pokusu jednoznačně říci, zda je pravdivé či nikoliv V tomto textu budeme dále s náhodnými jevy pracovat Pro stručnější vyjadřování budeme místo úsloví náhodný jev říkat pouze jev Dále budeme jevy značit velkými písmeny ze začátku abecedy, případně s indexy Např A, B, A 1, A 2,,A n, B 0, C apod V další práci s jevy budeme potřebovat zavést dva speciální jevy: Jev jistý, který nutně nastane při každém provedení pokusu Budeme jej značit Ω Jev nemožný, který nemůže v daném pokusu nikdy nastat, označíme jej Dále zavedeme dva vztahy mezi jevy: Implikace řekneme, že jev A implikuje jev B nebo ekvivalentně, že jev A má za následek jev B, jestliže jev B nastane vždy, když nastane jev A Vztah jev A má za následek jev B označíme A B Ekvivalence řekneme, že jevy A a B jsou si rovny nebo též, že jevy A a B jsou ekvivalentní, když A B a zároveň B A Rovnost jevů A a B označíme A = B Protože jevy představují výroky o výsledcích pokusu, lze vytvářet nové výroky tedy jevy pomocí logických spojek Zavádíme tak následující jevy: Sjednocení jevů Jsou-li A 1, A 2,,A n jevy, pak jev, který nastane, právě když nastane alespoň jeden z jevů A 1, A 2,,A n, nazveme sjednocením jevů A 1, A 2,,A n a budeme jej značit A 1 A 2 A n nebo též n i=1 A i Sjednocení jevů může obsahovat i nekonečný počet jevů Je-li jich spočetný počet, tj lze je uspořádat do nekonečné posloupnosti A 1, A 2,, budeme jejich sjednocení označovat i=1 A i Průnik jevů Jsou-li A 1, A 2,,A n jevy, pak jev, který nastane, právě když v realizaci pokusu nastane každý z jevů A 1, A 2,, A n, nazveme průnikem jevů A 1, A 2,,A n a označíme jej A 1 A 2 A n nebo též n i=1 A i Tedy
8 průnik jevů A 1, A 2,, A n značí současný výskyt všech jevů A 1, A 2,,A n Pro spočetnou posloupnost jevů A 1, A 2,, označme i=1 A i jejich průnik Rozdíl jevů Jsou-li A 1 a A 2 jevy, pak rozdílem jevů A 1 a A 2 rozumíme jev, který nastane, právě když jev A 1 nastane a zároveň jev A 2 nenastane Rozdíl jevů A 1 a A 2 označíme A 1 A 2 Dále zavedeme: Jev opačný k jevu A Je to jev, který nastane právě tehdy, když nenastane jev A Budeme jej značit A Jev opačný se někdy nazývá jev komplementární nebo též jev doplňkový Neslučitelné jevy Řekneme, že jevy A 1 a A 2 jsou neslučitelné, jestliže nemohou nastat současně, tj v případě, že jejich průnik je nemožný jev Tedy platí, že A 1 A 2 = Někdy místo rčení, že A 1 a A 2 jsou neslučitelné jevy říkáme, že jevy A 1 a A 2 se vzájemně vylučují nebo že jsou disjunktní Rozklad jevu A Řekneme, že jevy A 1, A 2,,A n tvoří rozklad jevu A, jestliže každé dva jsou neslučitelné tj A i A j = pro i j, i, j = 1, 2,, n a jejich sjednocení tvoří jev A, tj n i=1 A i = A Při práci s jevy lze často s výhodou použít některý z následujících vzorců Vyjádření opačného jevu k průniku Pro libovolné jevy A 1, A 2,,A n platí n A i = i=1 n i=1 A i Vyjádření opačného jevu ke sjednocení Pro libovolné jevy A 1, A 2,,A n platí n n A i = i=1 Poslední dva uvedené vzorce platí i pro spočetné sjednocení a spočetný průnik jevů V teorii množin se tyto vzorce nazývají de Morganova pravidla Dále lze snadno nahlédnout, že při práci s jevy lze s výhodou používat i=1 A i Komutativní zákony: A 1 A 2 = A 2 A 1 a A 1 A 2 = A 2 A 1 Asociativní zákony: (A 1 A 2 ) A 3 = A 1 (A 2 A 3 ) a (A 1 A 2 ) A 3 = A 1 (A 2 A 3 )
9 Distributivní zákony: (A 1 A 2 ) A 3 = (A 1 A 3 ) (A 2 A 3 ) a (A 1 A 2 ) A 3 = (A 1 A 3 ) (A 2 A 3 ) Vyjádření rozdílu pomocí průniku: A 1 A 2 = A 1 A 2 Pozorný čtenář si jistě všimnul, že terminologie použitá při práci s jevy důsledně odpovídá množinové terminologii a rovněž užité označení jevových operací je stejné jako běžně užívané označení množinových operací V dalším textu ukážeme, že tato shoda není náhodná, zavedeme pojem elementárního jevu a přejdeme k množinovému vyjádření (náhodného) jevu Elementární jev Jev A nazveme elementárním jevem, jestliže neexistují jevy B a C různé od A takové, že A = B C To znamená, že jev A nelze vyjádřit jako sjednocení dvou jiných jevů různých od A Jinými slovy, elementární jev A nelze dále rozložit a rozumí se jím nejjednodušší možný výsledek pokusu Elementární jevy budeme značit řeckým písmenem ω případně s indexem (např ω 1 nebo ω i apod) Prostor elementárních jevů Množinu všech elementárních jevů, které mohou nastat jako výsledek daného náhodného pokusu, nazýváme prostorem elementárních jevů Budeme jej značit Ω Prostor elementárních jevů může být konečná množina, tedy Ω = {ω 1, ω 2,, ω n } nebo nekonečná spočetná množina tvořená posloupnostmi prvků, tedy Ω = {ω 1, ω 2, ω 3, } nebo nekonečná nespočetná množina daná nějakou vlastností V elementárních jevů, pak píšeme Ω = {ω : ω mají vlastnost V } Je-li Ω prostor elementárních jevů, pak libovolný jev A lze chápat jako podmnožinu množiny Ω tj A Ω Dříve provedené jevové operace (sjednocení, průnik, rozdíl, komplement) přesně odpovídají známým množinovým operacím (sjednocení, průnik, rozdíl, komplement), jev nemožný odpovídá prázdné množině, tedy množině, která nemá žádné prvky, jev jistý je roven prostoru elementárních jevů Ω Proto v dalším lze na náhodné jevy pohlížet jako na podmnožiny prostoru elementárních jevů Ω a lze nimi provádět všechny známé množinové operace Vybrané pojmy budeme ilustrovat na příkladech Příklad 21 Náhodný pokus spočívá v jednom hodu ideální hrací kostkou Budeme uvažovat následující náhodné jevy A 1 padne sudé číslo A 2 padne liché číslo B 2 padne číslo menší než dva B 3 padne číslo menší než tři C nepadne liché číslo
10 E i padne číslo i, i = 0, 1, 2, 6, 7 Lze snadno vzhlénout, že pro uvedené jevy platí: E 0 a E 7 jsou jevy nemožné Ω = E 1 E 2 E 3 E 4 E 5 E 6 = 6 i=1 E i je jev jistý B 2 B 3, tj B 2 má za následek B 3 B 2 = E 3 E 4 E 5 E 6 padne číslo větší nebo rovno než 3 B 3 = E 4 E 5 E 6 padne číslo větší nebo rovno než 4 B 3 B 2 tj B 3 má za následek B 2 B 2 = E 1 B 2 a E 1 jsou ekvivalentní, B 1 E 1 a zároveň E 1 B 2 A 1 = C tj A 1 a C jsou ekvivalentní jevy, protože A 1 C a C A 1 A 2 B 2 = E 1 tj A 2 B 2 je jev, že padne číslo 1 A 1 A 2 = tj A 1 a A 2 nemohou nastat současně, tedy A 1 a A 2 jsou neslučitelné jevy A 1 A 2 = Ω tj sjednocení jevů A 1 a A 2 je jev jistý, A 1, A 2 tvoří rozklad jistého jevu, podobně E 1,,E 6 také tvoří rozklad jistého jevu Ω A 1 B 2 = A 1 B 2 = E 4 E 6 tj rozdíl jevů A 1 B 2 je jev, že padne sudé číslo větší než 2 A 2 B 2 = A 2 B 2 = Ω E 1 = E 2 E 3 E 4 E 5 E 6 je jev, že nepadne číslo 1 A 2 B 2 = A 2 B 2 = E 3 E 5 je jev, že padne liché číslo větší než 2 (A 1 A 2 ) B 2 = (A 1 B 2 ) (A 2 B 2 ) = (A 2 B 2 ) = A 2 B 2 = E 1 je jev, že padne číslo 1 E 1, E 2,,E 6 jsou elementární jevy, protože je nelze dále rozložit V uvedeném označení můžeme psát, že ω 1 = E 1, ω 2 = E 2,,ω 6 = E 6 a prostor elementárních jevů Ω = {ω 1, ω 2, ω 3, ω 4, ω 5, ω 6 } Jednotlivé jevy uvedené dříve lze zapsat v množinovém tvaru A 1 = {ω 2, ω 4, ω 6 } A 2 = {ω 1, ω 3, ω 5 } B 2 = {ω 1 } = ω 1 B 3 = {ω 1, ω 2 } C = {ω 2, ω 4, ω 6 } E 0 = {} =, E 7 = {} = Příklad 22 Náhodný pokus spočívá v trojnásobném hodu mincí Zavedeme náhodné jevy A i v i-tém hodu padne líc, i = 1, 2, 3 B j líc padne právě j krát, j = 0, 1, 2, 3 Pak zřejmě možné výsledky pokusu elementární jevy jsou jevy ω 1 = [L, L, L] jev, že ve všech hodech padl líc ω 2 = [L, L, R] jev, že v prvních dvou hodech padl líc a ve 3 hodu padl rub
ω 7 = [L, R, R] jev, že v prvním hodu padl líc a v ostatních rub ω 8 = [R, R, R] jev, že ve všech hodech padl rub Použití hranatých závorek v předchozím označení naznačuje, že jde o výsledky uspořádané posloupnosti hodů Tedy výsledek pokusu [L, R, L] značí, že v 1 hodu padl líc, ve druhém rub a ve třetím líc 11 Prostor elementárních jevů Ω je množina Ω = {ω 1,,ω 8 } = {[L, L, L],, [R, R, R]} a uvažované jevy lze množinově zapsat ve tvaru A 1 = {[L, L, L], [L, L, R], [L, R, L], [L, R, R]} A 2 = {[L, L, L], [L, L, R], [R, L, L], [R, L, R]} A 3 = {[L, L, L], [R, L, L], [L, R, L], [R, R, L]} Zřejmě A 1 A 2 A 3 = {[L, L, L]} = {ω 1 } = ω 1 B 0 = {[R, R, R]} = ω 8 B 1 = {[L, R, R], [R, L, R], [R, R, L]} B 2 = {[L, L, R], [L, R, L], [R, L, L]} B 3 = {[L, L, L]} = ω 1 Je zřejmé, že B 0, B 1, B 2 a B 3 tvoří rozklad jistého jevu Ω A 1 B 1 = {[L, R, R]} = ω 7 je jev, že líc padne právě jednou a to v prvním hodu A 1 A 2 A 3 = B 0 je jev, že padne aspoň v jednom hodu líc tedy jev, že nepadne v každém hodu rub V předchozích dvou příkladech byl prostor elementárních jevů Ω konečnou množinou Jak ukazují následující dva příklady, nemusí tomu tak být vždycky Příklad 23 Náhodný pokus spočívá v opakovaném hodu mincí a pokus končí, jakmile padne rub Pak zřejmě prostor elementárních jevů Ω je spočetná množina Ω = {ω, ω 1, ω 2, ω 3, }, kde elementární jev ω i značí, že rub padl poprvé v hodu číslo i, i = 1, 2, 3 a ω je elementární jev, že vždy padne líc a rub nepadne nikdy Jednotlivé elementární lze zapsat ve tvaru: ω 1 = [R], ω 2 = [L, R], ω 3 = [L, L, R],,ω i = [L, L,, L, R],,ω } {{ } = [L, L, L, ] (i 1) L Jako příklad náhodných jevů, které lze uvažovat spolu s tímto pokusem uvedeme: A 1 = {ω 1, ω 2,,ω 10 } rub padne nejpozději v desátém hodu A 2 = {ω 1, ω 2 } v prvním nebo ve druhém hodu padne rub A 3 = {ω, ω 3, ω 4, } = A 2 v prvních dvou hodech rub nepadne A 4 = {ω 1, ω 3, ω 5, } poprvé padne rub, když počet hodů bude liché číslo Příklad 24 Předpokládejme, že sledujeme situaci v dané pojišt ovně, sledování začínáme v čase t = 0 a výsledkem sledování je přesně měřený časový okamžik (např
12 v hodinách), kdy byla nahlášena první pojistná událost Výsledek takového sledování můžeme (v rozšířeném chápání slova pokus) považovat za realizaci náhodného pokusu Za předpokladu, že provoz pojišt ovny sledujeme neomezenou dobu a její provoz je stále v ustáleném režimu, lze si představit, že tento pokus je statisticky stabilní Množina možných výsledků tohoto pokusu pak může být množina všech časových okamžiků, kdy mohla být nahlášena první pojistná událost, tedy interval 0, ) Proto prostor elementárních jevů Ω = 0, ) je množina, která má nekonečný počet prvků a není ani spočetná Příkladem náhodných jevů mohou být množiny (intervaly) A 1 = 0, 10) první pojistná událost nastane do deseti hodin od začátku sledování A 2 = 15, 25 první pojistná událost nastane mezi 15 a 25 hodinou A 3 = (10, ) první pojistná událost nastane až po desáté sledované hodině Je zřejmé, že libovolný časový interval odpovídá nějakému náhodnému jevu Dokonce každá podmnožina intervalu 0, ) představuje nějaký náhodný jev Z posledního uvedeného příkladu je patrné, že v případě, kdy množina určitých výsledků daného pokusu není konečná a není ani spočetná, lze uvažovat velké množství náhodných jevů, které z praktického hlediska mají pramalý význam Proto je užitečné v případě, kdy prostor elementárních jevů Ω není spočetná množina, omezit se na nějaký systém náhodných jevů tedy na vhodný systém podmnožin množiny Ω, který je z praktického hlediska dostačující, obsahuje s danými jevy také jevy, které vzniknou pomocí výše uvedených jevových operací V uvedeném příkladě 24 je možné omezit se jenom na jevy, které lze vytvořit z intervalů pomocí množinových operací sjednocení, průnik, rozdíl, doplněk Naznačeným způsobem lze postupovat obecně Pro každý systém jevů spojených s daným pokusem který je uzavřený vzhledem k zavedeným množinovým operacím se zavádí název jevová algebra případně σ algebra Dále ji budeme formálně definovat Definice 21 Necht Ω je prostor elementárních jevů přiřazených danému pokusu a A systém náhodných jevů (systém podmnožin množiny Ω), které v souvislosti s daným pokusem uvažujeme Pak říkáme, že systém jevů A tvoří jevovou algebru, jestliže platí následující axiomy: 1 Ω A tj jev jistý patří do systému A 2 A A A A, tj pro každý jev z A platí, také jev k němu opačný patří do A 3 A 1, A 2 A A 1 A 2 A, tj sjednocení dvou jevů z A je také jevem z A (Tj systém A je uzavřený vzhledem ke sjednocení jevů) V případě, že platí axiomy 1 a 2 a navíc platí axiom 3 pro spočetnou posloupnost jevů A 1, A 2, tj platí axiom
3* A i A, i = 1, 2 i=1 A i A Pak systém jevů A nazýváme jevovou σ-algebrou že jde o spočetné sjednocení jevů) 13 (Řecké písmeno σ naznačuje, Dvojici (Ω, A) pak nazýváme jevové pole Když se při provádění daného pokusu omezíme na jevy z dané jevové σ-algebry A, je potřeba zaručit, že při konstrukci nových jevů, kterou provádíme aplikováním operací konečné nebo spočetné sjednocení, konečný nebo spočetný průnik, rozdíl apod na posloupnosti jevů z A, dostaneme opět jevy z jevové σ-algebry A Tato skutečnost plyne z vlastnosti jevové σ-algebry A viz [13] Kromě jiného odtud plyne, že pro posloupnost jevů A 1, A 2, z A platí, že n i=1 A i A, i=1 A i A, A 1 A 2 A, A apod Z praktického hlediska představuje jevové pole (Ω, A) matematický model náhodného pokusu Ω je množina všech možných výsledků pokusu a A systém náhodných jevů, které jsou v souvislosti s konáním pokusu prakticky užitečné V případě, že množina Ω je konečná, obvykle se za A volí jevová σ-algebra, která obsahuje všechny podmnožiny množiny Ω V případě, že Ω je množina nespočetná a je tvořena intervalem reálných čísel (jako tomu bylo v případě 24), lze příslušnou σ-algebru jevů vytvořit pomocí polouzavřených intervalů typu (a, b Ω, a < b Takováto σ-algebra se potom nazývá borelovská σ-algebra a odpovídající jevové pole se nazývá borelovské jevové pole Kromě naznačených praktických důvodů pro redukci systému všech náhodných jevů na jevovou σ-algebru A, je třeba zdůraznit, že existují také další teoretické důvody k této redukci Jedním z podstatných teoretických důvodů této redukce je, že na jevovém poli (Ω, A) lze pomocí vhodně zvolených axiómů, snadno definovat pravděpodobnost Zavedená pravděpodobnost, která dobře popisuje reálné situace je po matematické stránce zvlášt elegantní a jednoduchá v situaci, když možné jevové pole je borelovské Zavedením pravděpodobnosti náhodných jevů se budeme věnovat v dalším odstavci 23 Pravděpodobnost a četnost V tomto odstavci budeme vycházet ze statisticky stabilního náhodného pokusu Matematickým modelem tohoto pokusu bude jevové pole (Ω, A), kde Ω je množina všech možných výsledků pokusu (prostor elementárních jevů) a A je jevová σ- algebra, tedy množina všech náhodných jevů, kterou v souvislosti s prováděným pokusem uvažujeme Cílem bude jednotlivé jevy číselně ohodnotit, tj přiřadit každému jevu číslo, které by postihlo možnost nastoupení toho jevu (jeho šanci) při daném provádění pokusu Takové numerické ohodnocení jednotlivých jevů z hlediska mož-
14 nosti jejich nastoupení se nazývá pravděpodobností Zavedení pravděpodobnosti by měly být v souladu s empirickými zkušenostmi, tedy pravděpodobnost nastoupení jevu A v daném pokuse by měla odpovídat relativní četnosti jevu A ve velkém počtu nezávislých opakováních tohoto pokusu Uvedenou souvislost relativní četnosti a pravděpodobnosti budeme nejdříve ilustrovat na situaci známé z výzkumu veřejného mínění Při zkoumání veřejného mínění v daném souboru např dospělých obyvatel státu se vyšetřuje malá skupina náhodně vybraných obyvatel a z jejich odpovědí na dané otázky se potom usuzuje za názory všech dospělých obyvatel státu V této souvislosti mluvíme o souboru všech obyvatel státu jako o základním souboru a o souboru vybraných obyvatel, kteří byli náhodně vybráni a dotazováni, jako o souboru výběrovém Budeme předpokládat, že základní soubor má N prvků a počet prvků výběrového souboru označíme n Budeme uvažovat dva základní přístupy k pořízení výběrového souboru: a) výběr s opakováním postupně náhodně vybíráme (po jednom) prvky základního souboru a vybrané prvky před dalším výběrem do základního souboru vracíme b) výběr bez opakování postupně náhodně vybíráme prvky základního souboru a vybrané prvky do základního souboru nevracíme Je zřejmé, že v případě, kdy je rozsah výběrového souboru n malý ve srovnání s rozsahem základního souboru N, je málo pravděpodobné, že by se při výběru s opakováním některý prvek ve výběru opakoval Budeme proto pro v dalších úvahách vycházet z výběrového souboru, který byl získán náhodným výběrem s opakováním Výběry bez opakování se budeme zabývat později Předpokládejme pro jednoduchost, že prvky základního souboru, který je tvořen všemi dospělými obyvateli státu rozdělíme podle pohlaví na soubor mužů, předpokládejme, že jich je K 1 a na soubor žen, kterých je N K 1 Podle názoru jednotlivých obyvatel, můžeme základní soubor rozdělit na dva podsoubory, v prvním podsouboru je K 2 občanů levicově smýšlejících a N K 2 občanů pravicově smýšlejících Platí tedy, že v základním souboru je podíl mužů p 1 = K 1 a podíl levicově smýšlejících N občanů p 2 = K 2 Podíl p N 1 lze interpretovat jako pravděpodobnost tedy numerické ohodnocení možnosti, že náhodně vybraná osoba ze základního souboru bude muž Podobně lze interpretovat podíl p 2 Bude-li náhodný pokus spočívat v náhodném vylosování jedné osoby ze základního souboru, můžeme s tímto pokusem uvažovat následující jevy: A 1 náhodně vylosovaná osoba je muž A 2 náhodně vylosovaná osoba je levicově smýšlející A 1 A 2 náhodně vybraná osoba je muž levicově smýšlející
A 1 A 2 náhodně vybraná osoba je muž nebo osoba pravicově smýšlející Čísla p 1 a p 2 pak lze interpretovat jako pravděpodobnosti jevů A 1 a A 2, tedy budeme psát p 1 = P(A 1 ) a p 2 = P(A 2 ) Odhad pravděpodobností lze získat pomocí četností stanovených z výběrového souboru Je-li výběrový soubor (pořízený výběrem s opakováním) rozsahu n označíme n(a 1 ) četnost mužů ve výběru, tj počet mužů ve výběru a n(a 2 ) četnost levicově smýšlejících občanů ve výběru Dále označíme f n (A 1 ) = n(a 1) a f n n (A 2 ) = n(a 2) odpovídající relativní četnosti Ze zkušenosti lze usoudit, že pro velká n bude relativní četnost n f n (A 1 ) kolísat kolem p 1 = P(A 1 ) a relativní četnost f n (A 2 ) kolem P(A 2 ) Při provádění rozsáhlých výběrových šetření se skutečně neznámé pravděpodobnosti p 1 a p 2 odhadují relativními četnostmi f n (A 1 ) a f n (A 2 ) Snadno lze také stanovit relativní četnosti f n (A 1 A 2 ) nebo f n (A 1 A 2 ) a odhadnout příslušné pravděpodobnosti P(A 1 A 2 ) a P(A 1 A 2 ) apod Podobné chování relativních četností jevů lze pozorovat také při opakovaném provádění libovolného statisticky stabilního náhodného pokusu Bude-li např pokus spočívat v hodu kostkou, pak za předpokladu, že kostka, kterou házíme je ideálně symetrická, lze očekávat, že s rostoucím počtem hodů n bude relativní četnost f n (A) jevu A = po hodu padne číslo 6, kolísat kolem čísla p = 1 6 Číslo p = P(1) = 1 lze interpretovat jako pravděpodobnost nastoupení jevu A (tj 6 pravděpodobnost, že po hodu padne číslo 6) V situaci, kdy kostka není ideálně symetrická se relativní četnosti f n (A) opět budou pro velká n ustalovat kolem nějakého čísla p = P(A), které ovšem může být neznámé a četnost f n (A) bude jeho odhadem Lze si tedy pravděpodobnost představit jako limitní hodnotu relativní četnosti, když nekonečně roste počet opakování pokusu n Tedy pravděpodobnost jevu A je v tomto pojetí zavedena vztahem p = P(A) = lim n f n (A) Uvedený vztah představuje tzv statistickou definici pravděpodobnosti a v minulosti se s touto definicí pravděpodobnosti často pracovalo viz [14] Její nevýhodou je, že není možné ověřit existenci uvedené limity Nicméně podstatná je skutečnost, že pravděpodobnost by měla při velkém počtu opakování pokusu korespondovat s relativní četností a proto se také moderní axiomatická definice pravděpodobnosti o vlastnosti relativní četnosti podstatně opírá Dříve než budeme pravděpodobnost axiomaticky definovat, připomeňme vlastnosti relativní četnosti Vyjdeme ze statisticky stabilního náhodného pokusu, jemuž odpovídá jevové pole (Ω, A) a budeme uvažovat jevy A, A 1, A 2 A, jev nemožný a jev jistý Ω Relativní četnost jevu A, kterou získáme z n nezávislých opakováních pokusu označíme f n (A) Pak lze snadno nahlédnout, že relativní četnost má následující vlastnosti: 15 V1 f n ( ) = 0 tedy četnost nemožného jevu je 0
16 V2 f n (Ω) = 1 tedy četnost jistého jevu je 1 V3 f n (A) 0 pro každý jev A A tedy četnost je nezáporná V4 f n (A) 1 pro každý jev A A V5 f n (A 1 A 2 ) = f n (A 1 ) + f n (A 2 ) f n (A 1 A 2 ) V6 f n (A 1 A 2 ) = f n (A 1 ) + f n (A 2 ), když jevy A 1 a A 2 jsou neslučitelné V7 f n (A 1 ) f n (A 2 ), když A 1 A 2 V8 f n (A 2 A 1 ) = f n (A 2 ) f n (A 1 ), když A 1 A 2 Axiomatická definice pravděpodobnosti potom přiřazuje každému jevu A A reálné číslo P(A), které vyjadřuje možnost nastoupení jevu A v daném pokusu a toto přiřazení musí být v souladu s vlastnostmi relativní četnosti V1-V8 Lze ukázat, že rozhodující pro axiomatické zavedení pravděpodobnosti jsou vlastnosti relativních četností V2,V3 a V6 Další vlastnosti pravděpodobnosti, analogické zbylým vlastnostem relativní četnosti, lze odvodit ze základních axiomů Dále uvedená axiomatická definice pravděpodobnosti pochází od Kolmogorova viz [9] Definice 22 Axiomatická definice pravděpodobnosti Necht (Ω, A) je jevové pole příslušné uvažovanému pokusu Potom zobrazení P, které každému jevu A A přiřazuje číslo P(A) nazveme pravděpodobností na jevovém poli (Ω, A), když toto zobrazení vyhovuje následujícím axiomům: A1 P(A) 0 pro každý jev A A (Pravděpodobnost je nezáporná) A2 P(Ω) = 1 (Pravděpodobnost je normovaná) A3 Je-li A 1, A 2, A 3, konečná nebo spočetná posloupnost po dvou disjunktních jevů z A (tj A i A, A i A j = pro i j, i, j = 1, 2 ), pak pro konečnou posloupnost jevů A 1, A 2, A 3, A n platí P( n i=1a i ) = n i=1 P(A i) (Pravděpodobnost je aditivní) Pro spočetnou posloupnost jevů A 1, A 2, platí P( i=1 A i) = i=1 P(A i) (Pravděpodobnost je σ-aditivní) Pro daný jev A pak číslo P(A) nazýváme pravděpodobností jevu A Trojici (Ω, A, P) pak nazýváme pravděpodobnostní prostor Poznamenejme, že axiomy A1, A2 a A3 není pravděpodobnost P určena jednoznačně, to je ale její výhoda, protože pro konkrétní pokus můžeme volbu pravděpodobnosti P zavést tak, aby dobře korespondovala s relativní četností Ukážeme si to na příkladě:
Příklad 25 Pokus spočívá v hodu mincí Pak Ω = {L, R} a A = {, {L}, {R}, Ω} Podle toho, zda mince je ideálně symetrická nebo ne, lze pravděpodobnost na jevovém poli (Ω, A) zavést dvojím způsobem: a) Předpokládejme, že mince je ideální Pak lze položit P( ) = 0, P({L}) = P({R}) = 1 a P(Ω) = 1 Je zřejmé, že zvolené zobrazení P vyhovuje axiomům 2 A1, A2, A3, jde tedy o pravděpodobnost na jevovém poli (Ω, A) Uvedená pravděpodobnost přiřazuje jevu padne líc pravděpodobnost 1 tedy stejnou 2 jako jevu padne rub b) Předpokládejme, že mince není ideální a pomocí opakovaných hodů touto mincí bylo vypozorováno, že líc padá v 55 % všech hodů Pak lze na (Ω, A) zavést pravděpodobnost, která tuto skutečnost respektuje, stačí položit P( ) = 0, P({L}) = 0, 55, P({R}) = 0, 45, P(Ω) = 1 Snadno lze opět ověřit, že zvolené zobrazení P vyhovuje axiomům A1, A2, A3 a jde tedy o pravděpodobnost Dále se budeme zabývat vlastnostmi axiomatické pravděpodobnosti Vlastnosti, které uvedeme lze snadno odvodit z axiomů A1-A3 Viz [13] Čtenář si může ověřit, že tyto vlastnosti odpovídají vlastnostem relativních četností V1-V8 Vlastnosti pravděpodobnosti Pro libovolné jevy A, A 1, A 2,,A n z A platí VP1 P( ) = 0 VP2 0 P(A) 1 VP3 Je-li A 1 A 2, pak P(A 1 ) P(A 2 ) VP4 Je-li A 1 A 2, pak P(A 2 A 1 ) = P(A 2 ) P(A 1 ) VP5 P(A) = 1 P(A) VP6 P(A 1 A 2 ) = P(A 1 ) P(A 1 A 2 ) VP7 P(A 1 A 2 ) = P(A 1 ) + P(A 2 ) P(A 1 A 2 ) VP8 n P( A i ) = i=1 + n 2 n P(A i ) i=1 n 1 n i=1 j=i+1 k=j+1 n 1 VP9 P( n i=1 A i) n i=1 P(A i) n i=1 j=i+1 P(A i A j ) P(A i A j A k ) + ( 1) n 1 P(A 1 A 2 A n ) Uvedené vlastnosti pravděpodobnosti budou potřebné při dalším výkladu, hojně se používají ve statistických úvahách V dalším odstavci ukážeme jejich použití při řešeních pravděpodobnostních úloh 17
18 24 Specifické případy axiomatické pravděpodobnosti Ve vybraných experimentálních situacích (jak bylo naznačeno v příkladu 25) lze pravděpodobnost P na daném jevovém poli (Ω, A) vybrat tak, aby co nejlépe odpovídala podmínkám pokusu Touto volbou pak dospíváme ke speciálním případům axiomatické pravděpodobnosti Klasická pravděpodobnost Předpokládáme, že prostor elementárních jevů Ω je konečná množina, obsahující N prvků a všechny elementární jevy ω Ω jsou stejně možné Pak lze libovolnému jevu A Ω přiřadit pravděpodobnost P(A) = card(a) card(ω) = card(a) N, kde card(a) značí počet prvků množiny A Uvedené přiřazení vyhovuje axiomům A1, A2 a A3 z definice axiomatické pravděpodobnosti Takto zkonstruované zobrazení je tedy speciálním případem axiomatické pravděpodobnosti definované na σ-algebře A, která je tvořena všemi podmnožinami Ω Tato pravděpodobnost přiřazuje každému elementárnímu jevu ω pravděpodobnost P(ω) = 1 Když elementární jev ω A N nazveme výsledek pokusu příznivý jevu A, pak lze zavedenou pravděpodobnost jevu A definovat jako podíl počtu výsledků pokusu příznivých jevu A a počtu všech možných výsledků pokusu Pravděpodobnost zavedená tímto způsobem se nazývá klasická pravděpodobnost Její použití si ukážeme na několika příkladech Zdůrazněme, že její použití je možné, když množina možných výsledků pokusu je konečná a jednotlivé elementární jevy mají stejnou pravděpodobnost Příklad 26 Hodíme ideální hrací kostkou Jaká je pravděpodobnost, že a) padne sudé číslo? b) padne liché číslo? Řešení: Protože uvažujeme ideální hrací kostku, použijeme klasickou pravděpodobnost Položíme Ω = {ω 1, ω 6 }, kde ω i je elementární jev, že padne číslo i, i = 1, 2,, 6 Zavedeme jevy A padne sudé číslo a B padne liché číslo Pak A = {ω 2, ω 4, ω 6 }, Card(Ω)= N = 6, Card(A) = 3 a užitím klasické pravděpodobnosti dostaneme P(A) = 3 = 1 Protože B = A dostaneme užitím vlastnosti pravděpodobnosti VP5 P(B) = P(A) = 1 P(A) = 1 1 = 1 2 6 2 2 Příklad 27 Házíme dvěma stejnými mincemi, které nedovedeme rozlišit Jaká je pravděpodobnost jevu A, že na obou mincích padne líc Řešení:
a) Zavedeme elementární jevy ω 1 na obou mincích padne líc ω 2 na obou mincích padne rub ω 3 na jedné minci padne líc a na jedné rub Pak Ω = {ω 1, ω 2, ω 3 }, A = ω 1 a užitím klasické pravděpodobnosti bychom dostali P(A) = 1 3 b) Mince formálně očíslujeme, abychom je byli schopni rozlišit a zavedeme elementární jevy ω1 = [L, L] na první minci padne líc a na druhé líc ω2 = [L, R] na první minci padne líc a na druhé rub ω3 = [R, L] na první minci padne rub a na druhé líc ω4 = [R, R] na první minci padne rub a na druhé rub 19 Pak Ω = {ω 1, ω 2, ω 3, ω 4 }, A = ω 1 a klasická pravděpodobnost jevu A je P(A) = 1 4 Důvodem rozdílných výsledků v řešení a) a b) je neoprávněné použití klasické pravděpodobnosti v bodě a) Ze zkušenosti víme, že elementární jev ω 3 nastává při opakovaném hodu dvěma mincemi přibližně dvakrát častěji než elementární jev ω 1 Příklad 28 Hodíme n krát ideální hrací kostkou Jaká je pravděpodobnost, že a) šestka padne právě jednou (náhodný jev A 1 ) b) šestka padne v každém hodu (náhodný jev B) c) šestka padne právě i krát (náhodný jev A i ) i = 1, 2,, A i d) šestka padne aspoň jednou (náhodný jev A) e) šeska nepadne (náhodný jev A 0 ) Řešení: Protože jde o nezávisle opakované hody ideální kostkou, použijeme klasickou pravděpodobnost V každém hodu je 6 možných výsledků, tudíž v n hodech je 6 n možných a stejně pravděpodobných výsledků a tedy card(ω) = 6 n a) Zavedeme jev B i, že šestka padne v hodu číslo i a v ostatních hodech nepadne, i = 1, 2, n Zřejmě card(b i ) = 5 n 1, protože v i-tém hodu musí padnout číslo 6 a v ostatních n 1 hodech může padnout kterékoliv z čísel 1,2,3,4,5 Jevy B 1,,B n jsou neslučitelné A 1 = B 1 B 2 B n a P(B i ) = card(b i) = 5n 1 Proto užitím axiomu A3 card(ω) 6 n dostaneme n P(A 1 ) = P( B i ) = i=1 n P(B i ) = i=1 n i=1 5 n 1 6 n = n5n 1 6 n
20 b) Zřejmě B je elementární jev a proto P(B) = 1 6 n c) Počet příznivých výsledků jevu A i stanovíme tak, že nejdříve ( n i) způsoby vybereme z n hodů i hodů, v nichž padne číslo 6 a v ostatních n i hodech může padnout kterékoliv z čísel 1, 2,, 5 Tedy v těchto n i hodech může nastat 5 n i různých výsledků a když tyto výsledky kombinujeme s výběrem i-hodů, kde padnou šestky dostaneme ( ) n card(a) = 5 n i i Odtud i = 1, 2,,n P(A i ) = i=1 ( n ) i 5 n i = 6 n i=1 ( n i ) ( 1 6 i=1 ) i ( ) n i 5, 6 d) Protože B = A 1 A 2 A n a jevy A 1,,A n jsou po dvou neslučitelné dostaneme užitím axiomu A3 n n n ( ) ( ) i ( ) n i n 1 5 P(B) = P( A i ) = P(A i ) = i 6 6 Odtud pomocí binomické věty dostaneme P(B) = n i=0 ( n i ) ( 1 6 ) i ( ) n i 5 6 ( ) n ( 5 1 = 6 6 + 5 ) n 6 ( ) n 5 = 1 6 ( ) n 5 6 e) Počet příznivých výsledků jevu A 0 je 5 n, protože v každém hodu může padnout kterékoliv číslo 1, 2,, 5, aby nastal výsledek příznivý jevu A 0 Proto P(A 0 ) = 5 n 6 n = ( 5 6 )n Srovnáním výsledků v bodě d) a e) je vidět, že pravděpodobnost jevu B bylo možné počítat jednodušeji Protože B = A 0 dostaneme užitím vlastnosti VP5, že P(B) = P(A 0 ) = 1 P(A 0 ) = 1 ( 5 6 )n Příklad 29 Urna obsahuje N koulí, K bílých a N K černých Z urny náhodně bez opakování vybereme n koulí Jaká je pravděpodobnost, že mezi vybranými je právě x koulí bílých (jev A x ) Řešení: a) Předpokládejme, že koule vybíráme po jedné Pak prostor elementárních jevů Ω je tvořen variacemi bez opakování n-té třídy vybraných z N prvků a tedy cardω = N(N 1) (N n + 1) = N! Jev A (N n)! x nastane, když v dané posloupnosti vybraných n prvků bude právě v x tazích vytažena bílá koule a
v n x tazích vytažena černá koule Čísla tahů x bílých koulí lze vybrat z n tahů ( n x) způsoby V uvedených x tazích lze vytáhnout bílé koule K(K 1) (K x+1) = K! způsoby a černé koule v n x tazích lze vybrat (K x)! (N K)(N K 1) (N K (n x)+1) = (N K)! způsoby Je proto card(a x ) = ( n x ) K! (K x)! (N K)! (N K (n x))! a P(A X ) = ( n (N k (n x))! ) K! (N K)! x (K x)! (N K (n x))! (N n)! N! b) Předpokládejme, že zároveň náhodně vybereme z urny n koulí Pak Ω je tvořeno množinou kombinací bez opakování K-té třídy z N prvků a tedy card(ω) = ( ( N k) Dále výběr x bílých koulí z K bílých lze provést K x) způsoby a výběr n x černých koulí z N k černých koulí lze provést ( n k n x) způsoby Tedy celkem dostáváme Card(A x ) = ( )( k n k x n x) a pro pravděpodobnost P(AX ) máme P(A x ) = x)( (K n k n x) ( N x) Úpravou výsledku uvedeného v bodě a) postupně dostaneme P(A X ) = ( ) n K! (N K)! (N n)! = K! (N K)! x (K x)! (N K (n x))! N! x!(k x)! = x)( (K N K n x ) ( N n) (n x)!(n K (n x))! n!(n n)! N! = A tedy výsledky v bodě a) a b) jsou shodné Je lhostejno, zda v daném pokuse koule vybíráme zároveň nebo po jedné a nevracíme Uvedený model se využívá v teorii výběrových šetření Jeho speciální případ pro N = 49, K = 6 a n = 6 odpovídá losování ve Sportce, jev A 6 odpovídá výhře v prvním pořadí, A 5 ve druhém pořadí atd Jev A 2 A 1 A 0 odpovídá situaci, kdy daná sázenka nevyhrává Příklad 210 Urna obsahuje a koulí bílých a b koulí černých Dvakrát po sobě vytáhneme po jedné kouli, přičemž první vytaženou kouli nevracíme zpět Jaká je pravděpodobnost, že druhá vytažená koule je bílá Řešení: Zavedeme jevy A 1 první vytažená koule je bílá a A 2, že druhá vytažená koule je bílá Pak postupnými úpravami dostaneme P(A 2 ) = P(A 2 Ω) = P(A 2 (A 1 A 1 )) = P((A 2 A 1 ) (A 2 A 1 )) = = P(A 1 A 2 ) + P(A 1 A 2 ) a(a 1) Snadno zjistíme, že P(A 1 A 2 ) = a P(A b a (a+b)(a+b 1) 1 A 2 ) = Odtud (a+b)(a+b 1) dosazením do vztahu pro P(A 2 ) dostaneme P(A 2 ) = a(a 1) + a b = a (a+b)(a+b 1) (a+b)(a+b 1) a+b Všimněme si, že platí P(A 2 ) = a = P(A a+b 1) a tedy pravděpodobnost vytažení bílé koule ve druhém tahu je stejná, jako pravděpodobnost vytažení bílé koule v prvním tahu Příklad 211 Někdo napsal m dopisů pro m různých osob, vložil do obálek pak na obálky náhodně napsal m odpovídajících adres Jaká je pravděpodobnost, že ani jeden dopis nepřijde osobě, jíž byl napsán? 21
22 Řešení: Označme A náhodný jev, že ani jeden dopis nepřijde osobě, jíž byl napsán Budeme počítat pomocí opačného jevu A = aspoň jededen dopis přijde osobě jíž byl napsán, který vyjádříme pomocí náhodných jevů A j = j-tý dopis přijde osobě, jíž byl napsán,j = 1, 2,, m, ve tvaru A = m j=1 A j Pak P(A) = 1 P(A) = 1 P( m j=1 A j) Pro výpočet P( m j=1 A j) využijeme vlastnosti pravděpodobnosti VP8, protože náhodné jevy A 1, A 2,A m nejsou neslučitelné Nejdřív pomocí klasické pravděpodobnosti vypočteme pravděpodobnosti P(A i ) pro i = 1, 2,, m P(A i A j ) pro 1 i < j m, P(A i A j A k ) pro 1 i < j < k m, P(A 1 A 2 A m ) Elementární jevy jsou uspořádané m-tice, j-tý člen této m-tice obsahuje adresu přiřazenou j-tému dopisu Počet těchto m-tic je roven počtu permutací všech m adres, a tedy počet elementárních jevů je m! Náhodnému jevu A j jsou příznivé ty elementární jevy, kdy j-tému dopisu je přiřazena adresa osoby, jíž byl dopis určen a zbylých m 1 adres může být zbylým m 1 dopisům přiřazeno libovolně Je tedy počet příznivých elementárních jevů A j roven card(a j ) = (m 1)!, j = 1, 2,, m Podobně náhodnému jevu A i A j, 1 i < j m, jsou příznivé ty elementární jevy, kdy i-tému a j-tému dopisu jsou přiřazeny adresy osob, jímž byly dopisy určeny a zbylých m 2 adres je zbylým m 2 dopisům přiřazeno libovolně Je tedy card(a i A j ) = (m 2)! Analogicky snadno stanovíme, že card(a i A j A k ) = (m 3)! pro 1 i < j < k m,,card(a i A j A m ) = (m m)! = 0! = 1 Protože adresy byly dopisům přiřazeny náhodně, lze předpokládat, že všechny elementární jevy jsou stejně pravděpodobné a užitím klasické pravděpodobnosti dostáváme P(A i ) = (m 1)! m! pro i = 1, 2,, m P(A i A j ) = (m 2)! m! pro 1 i < j m P(A i A j A k ) = (m 3)! m! pro 1 i < j < k m P(A 1 A 2 A m ) = (m m)! m! = 0! m! Dosadíme-li odtud do vlastnosti VP8, dostaneme P( m i=1 A i) = m i=1 P(A i) m 1 m i=1 j=i+1 P(A i A j ) + + m 2 m 1 m i=1 j=i+1 k=j+1 P(A i A j A k ) +( 1) m 1 P(A 1 A m ) = m (m 1)! i=1 m 1 m (m 2)! m! i=1 j=i+1 + m! + m 2 m 1 m (m 3)! i=1 j=i+1 k=j+1 + ( 1) m 1) (m m)! m! m!
23 = ( ) m (m 1)! ( ) m (m 2)! + ( m 1 m! 2 m! 3 = m i=1 ( 1)i 1( ) m (m i)! i m! = m i=1 ( 1)i 1 1 i! ) (m 3)! m! + ( 1) m 1( m m ) (m m)! m! Odtud P(A) = 1 P( m i=1 A i) = 1 m i=1 ( 1) i 1 ( 1) i i! = m i! i=0 Snadno lze nahlédnout, že s rostoucím m konverguje uvedená pravděpodobnost k číslu e 1 = 0, 368 Geometrická pravděpodobnost Geometrickou pravděpodobnost je možné považovat za zobecnění klasické pravděpodobnosti pro případ, že prostor elementárních jevů Ω není konečná množina, ale je tvořena nějakým intervalem na přímce s kladnou délkou nebo množina v rovině s kladným obsahem nebo množina v prostoru (trojrozměrném) s kladným objemem apod Označme symbolem m(a) délku respektive obsah respektive objem množiny A, je-li A interval na přímce respektive podmnožina roviny respektive podmnožina prostoru Obecně se m(a) nazývá mírou množiny A Pak geometrickou pravděpodobost jevu A Ω zavádíme v případě, že 0 < m(ω) < vztahem P(A) = m(a) pro A A, přičemž jevová σ-algebra A je borelovská (viz odstavec m(ω) 22 pro případ, že Ω je interval na přímce nebo viz [13] v obecném případě) Z vlastnosti m(a) plyne, že zavedená geometrická pravděpodobnost vyhovuje axiomům A1, A2, A3 a je tedy speciálním případem axiomatické pravděpodobnosti Její použití ukážeme na příkladech Příklad 212 Dvě osoby X a Y se domluvily, že se setkají na smluveném místě Přitom každá z nich přijde na toto místo nezávisle na druhé v náhodném okamžiku mezi 19 a 20 hodinou, počká 20 minut, a jestliže se druhá osoba během této doby nedostaví, odejde Nalezněte pravděpodobnost a) že se osoby setkají (jev A) b) že přijdou zároveň (jev B) Řešení: Úlohu budeme řešit pomocí geometrické pravděpodobnosti Necht x je okamžik příchodu osoby X na smluvené místo, měřeno v minutách od 19 hodiny a necht y značí tutéž veličinu pro osobu Y Potom prostor elementárních jevů Ω je zřejmě tvaru Ω = {(x, y) : 0 x 60, 0 y 60} Potom jev A= osoby se setkají lze zapsat ve tvaru A = {(x, y) Ω : x y 20} a jev B= osoby přijdou zároveň lze zapsat ve tvaru B = {(x, y) Ω : x = y} Jevy A a B jsou znázorněny na obr 21 Snadno stanovíme obsahy m(a) = 60 2 40 2, m(b) = 0 a m(ω) = 60 2 Odtud dostaneme P(A) = m(a) = 5 a P(B) = 0 m(ω) 9