ZÁKOY ROZDĚLEÍ PRAVDĚPODOBOSTI Různá rozdělení pravděpodobnosti náhodných veličin jsou popsána pomocí distribuční funkce, funkce hustoty pravděpodobnosti nebo pravděpodobnostní funkce. Za nejdůležitější typy pravděpodobnostních rozdělení náhodných veličin jsou považována rozdělení binomické, hypergeometrické a eponenciální (Poissonovo). ormální rozdělení je pak zřejmě vůbec nejdůležitějším rozdělením náhodných veličin. BIOMICKÉ ROZDĚLEÍ PRAVDĚPODOBOSTI PŘÍKLAD: Získání zakázky V příštím roce může firma potenciálně získat až šest zakázek. Pravděpodobnost získání zakázky je u všech zakázek padesátiprocentní. áhodná veličina X představuje počet získaných zakázek. Obor hodnot, kterých tato X 0;;;3;4;5; Tato náhodná veličina náhodná veličina může nabývat je přitom { } potom podléhá binomickému rozdělení pravděpodobnosti Bi ( ;0,5) a předpis její f P X 0,5 0,5 a) Jaká je pravděpodobnost toho, že podnik získá zakázky? 4 P ( X ) f ( ) 0,5 0,5 0,5 0, 34 Pravděpodobnost toho, že firma získá právě dvě zakázky je 3,4 % pravděpodobnostní funkce je ve tvaru ( ) ( ) b) Jaká je pravděpodobnost toho, že podnik získá alespoň jednu zakázku? alespoň jednu zakázku znamená jednu nebo více, v tomto případě jednu, nebo dvě, nebo tři, nebo čtyři, nebo pět, nebo šest zakázek tady pak máme dvě možnosti, jak pravděpodobnost vypočítat, a to: i. cestou sčítání pravděpodobností (spojka nebo ) P X P X + P X + P X 3 + P X 4 + P X 5 + P X ( ) ( ) ( ) ( ) ( ) ( ) ( ) f () + f ( ) + f ( 3) + f ( 4) + f ( 5) + f ( ) 0,5 + 0,5 + 0,5 3 + 0,5 4 + 0,5 5 + 0,5 0,9884 ii. pomocí jevu opačného jevem opačným k alespoň jednu zakázku je žádnou zakázku P ( X ) P( X 0) f ( 0) 0,5 0, 9884 0 Pravděpodobnost toho, že firma získá alespoň jednu zakázku je přibližně 99 %. c) Jaká je pravděpodobnost toho, že podnik získá maimálně jednu zakázku? maimálně jednu zakázku znamená jednu, nebo žádnou zakázku, takže P ( X ) P( X 0) + P( X ) f ( 0) + f ( ) 0,5 + 0,5 0, 09 0 Pravděpodobnost toho, že podnik získá nanejvýš jednu zakázku je přibližně %.
d) Určete, jaký počet zakázek firma získá s největší pravděpodobností. ejvětší pravděpodobnost, tj. hodnotu náhodné veličiny, která se při náhodném pokusu vyskytne nejčastěji, prezentuje číselná charakteristika modus ˆ. Pro náhodné veličiny, podléhající binomickému zákonu rozdělení pravděpodobnosti má modu tvar ( n + ) p ˆ ( n + ) p když teď máme určit, jaký počet zakázek získá podnik s největší pravděpodobností, použijeme právě tuto charakteristiku, takže + 0,5 ˆ + 0,5 ( ) ( ) 7 0,5 ˆ 7 0,5,5 ˆ 3,5 Počet zakázek je diskrétní náhodná veličina, to znamená, že ˆ 3. Společnost tedy s největší pravděpodobností získá tři zakázky. PŘÍKLAD: Vstávej, semínko, holala Pravděpodobnost vypěstování zdravé rostliny ze semena je 40 %. Když zasadíme semen, jaký je nepravděpodobnější počet vzrostlých zdravých rostlin a jaká je pravděpodobnost tohoto počtu? áhodná veličina X je definována jako počet vzrostlých zdravých rostlin z dvanácti zasazených semen, to znamená, že tato náhodná veličina může nabývat hodnot X { 0;; K}, přičemž pravděpodobnost výskytu těchto hodnot náhodné veličiny je rozdělena podle binomického zákona Bi ( ;0,4). Předpis pravděpodobností funkce této náhodné veličiny má tvar f ( ) P( X ) 0,4 0, ejpravděpodobnější počet vypěstovaných zdravých rostlin z těchto semen určíme podle číselné charakteristiky modus, v tomto případě n + p ˆ n + p ( ) ( ) ( + ) 0,4 ˆ ( + ) 4, ˆ 5, 0,4 ˆ 5 Ze zasazených dvanácti semen s největší pravděpodobností vzejde pět zdravých rostlin. Pravděpodobnost tohoto počtu zdravých rostlin z dvanácti semen je pak 5 7 P ( X 5) f ( 5) 0,4 0, 0, 7 5 ejvyšší pravděpodobnost, tj. pravděpodobnost, že se podaří vypěstovat pět rostlin je,7 %. Kromě toho můžeme určit další číselné charakteristiky, tj. střední hodnotu, rozptyl a směrodatnou odchylku, které mají u binomického rozdělení pravděpodobnosti tvar E X n p E X 0,4 4,8 D δ ( ) ( X ) n p q ( X ) D( X ) v tomto případě: D δ ( ) ( X ) 0,4 0, ( X ),88, 97,88 Úkol: Interpretujte vypočítané hodnoty číselných charakteristik.
PŘÍKLAD: Daňová přiznání Z celkového počtu odevzdaných daňových přiznání je podle zkušeností správců daně 5 % formulářů vyplněných nesprávně. Při prvotní namátkové kontrole byla vybrána daňová přiznání tří plátců. Jak je zde definována náhodná veličina? apište předpis její pravděpodobnostní funkce a určete rozdělení její pravděpodobnosti. áhodná veličina X tady představuje počet nesprávně vyplněných přiznání mezi třemi vybranými. Může tudíž nabývat hodnot X { 0;;;3 } Tato náhodná veličina podlého binomickému zákonu rozdělení Bi ( 3;0, 05) a její 3 3 pravděpodobnostní funkce má tvar f ( ) P( X ) 0,05 0,0,95 určit rozdělení pravděpodobnosti náhodné veličiny potom znamená vypočítat, s jakou pravděpodobností náhodná veličina nabude určité hodnoty ze svého oboru hodnot 3 0 3 P( X 0) f ( 0) 0,05 0,95 0,8573 0 3 P( X ) f ( ) 0,05 0,95 0,354 3 P( X ) f ( ) 0,05 0,95 0,0075 3 3 0 P( X 3) f ( 3) 0,05 0,95 0, 0005 3 nejpřehlednější je potom uspořádání do tabulky 0 3 Σ f() 0,8573 0,354 0,0075 0,0005 F() 0,8573 0,997 0,99985 Úkol: Interpretujte vypočítané hodnoty distribuční funkce. HYPERGEOMETRICKÉ ROZDĚLEÍ PRAVDĚPODOBOSTI PŘÍKLAD: Když zmetek projde kontrolou Součástky jsou dodávány v sériích po 00 kusech. Kontrola prohlíží vždy 5 součástek z každé série a tuto sérií přijímá pouze v případě, že žádná z vybraných součástek není zmetková. Jeli mezi vybranými součástkami zmetek, pak se série kontroluje celá. Jaká je pravděpodobnost toho, že série nebude kontrolována celá, jestliže zkušenosti ukazují, že zmetkovost je 5 %? Pětiprocentní zmetkovost znamená, že ve stokusové sérii je 5 zmetků. áhodná veličina je tady definována jako počet zmetků ve výběru pěti součástek a H 00;5;5 odpovídá hypergeometrickému zákonu rozdělení ( ) Série nebude stoprocentně kontrolována pouze tehdy, když mezi pěti vybranými součástkami nebude zmetek. Máme tedy zjistit pravděpodobnost toho, že náhodná veličina nabude hodnoty 0.
5 95 0 5 P ( X 0 ) f ( 0) 0, 77 00 5 Pravděpodobnost toho, že série nebude kontrolována celá, přesto, že obsahuje 5 zmetků, je 77 %. Jestliže by nás dále zajímalo, jaký je například průměrný počet zmetků, odhalených výběrovými kontrolami, a do jaké míry se pak zjištěné hodnoty nejčastěji odchylují od průměru, použijeme číselné charakteristiky, které jsou pro popis náhodných veličin, podléhajících hypergeometrickému rozdělení pravděpodobnosti, v následujícím tvaru E X n M tedy ( X ) D ( ) n ( X ) n M ( M ) E 5 5 0,5 00 00 5 ( ) 5 5 ( 5 D X ) 0, 79 00 00 00 Úkol: Interpretujte vypočítané číselné charakteristiky. PŘÍKLAD: Třeba to vyjde (a nebo spíš ne) Ve Sportce vybíráme čísel ze 49. Abychom získali výhru v prvním pořadí, je třeba uhodnout všech šest čísel. S jakou pravděpodobností se nám to povede? áhodná veličina počet správně typovaných čísel odpovídá hypergeometrickému zákonu rozdělení H ( 49;; ) Z množiny všech čísel ( 49) má čísel tu vlastnost, že jsou výherní ( M ). Z množiny všech čísel je vylosováno čísel ( n ). Otázkou tady je, jaká je pravděpodobnost, že všech vylosovaných výherních čísel P X. P budou čísla, která sázející tipoval na tiketu ( ) ( X ) f ( ) 70 00834750 49 43 0 49 49 0,000000075 49!!43!!43!!43! 49! 43!44 45 4 47 48 49 Vzhledem k tomu, že za hranici jevu prakticky nemožného se považuje pravděpodobnost 5%, tak z výsledku je více než patrná naprosto mizivá šance na výhru v prvním pořadí Sportky.
Hypergeometrické rozdělení pravděpodobnosti lze za určitých podmínek nahradil rozdělením binomickým, a to v případě: je-li velké a n a M se nemění. Prakticky se postupuje tak, že se vypočítá poměr n a je-li tento poměr větší než 0,05 lze hypergeometrické rozdělení pravděpodobnosti nahradit rozdělením binomický s parametry n a M. Zároveň by ale poměr M, tj. parametr p (pravděpodobnost jevu příznivého) měl být menší než 0,. H ( n; M ; ) Bi( n; M ) Sportka: pokračování H ( 49;; ) Bi( n; p) p M 0, 449 nesplňuje podmínku M < 0, 49 0 Bi ( ;0,449) P( X ) 0,449 0,887755 0, 00000337 Úkol: Pokuste se vysvětlit rozdíl ve vypočítaných pravděpodobnostech výhry ve Sportce v prvním pořadí. POISSOOVO/EXPOECIÁLÍ ROZDĚLEÍ PRAVDĚPODOBOSTI Eponenciální a Poissonovo rozdělení jsou založená víceméně na velmi podobném základě. Obě rozdělení používají parametr λ. Rozdíl mezi těmito dvěma rozděleními spočívá především v tom, že Poissonovo rozdělení je rozdělením diskrétní náhodné veličiny, pokud potom mluvíme o eponenciálním rozdělení, zabýváme se náhodnou veličinou spojitou. Poissonovo a eponenciální rozdělení spolu úzce souvisí. Parametr λ eponenciálního rozdělení je totiž průměrný počet výskytů sledovaného jevu během jednotkového časového intervalu. Počet výskytů sledovaného jevu v tomto intervalu má Poissonovo rozdělení Po (parametr), do jehož parametru λ vstupuje. EXPOECIÁLÍ ROZDĚLEÍ závisí na parametru λ, který je převrácenou hodnotou střední hodnoty doby čekání na nastoupení sledovaného jevu; funkční charakteristiky λ hustota pravděpodobnosti: f ( ) P( X ) λ e pro 0 0 pro < 0 P X λ distribuční funkce: ( ) ( ) číselné charakteristiky střední hodnota: ( ) λ F E X D X rozptyl: ( ) λ e pro 0 0 pro < 0
POISSOOVO ROZDĚLEÍ závisí na parametru λ, který vyjadřuje průměrný počet výskytů sledovaného jevu v daném intervalu nebo oblasti pravděpodobnostní funkce: ( ) ( λ t) λ p e! kde λ intenzita proudu, tj. počet událostí připadajících na jednotku (času, plochy, prostoru atd.) t velikost úseku (čas, plocha, prostor atd.) λ t parametr Eponenciálním rozdělením se řídí náhodná veličina, která je charakteristická jako pauza. V podstatě to znamená, že eponenciální rozdělení popisuje mezeru (pauzu) mezi dvěma událostmi. Eponenciální rozdělení má tedy spojitá náhodná veličina představující dobu čekání do nastoupení (poissonovského) náhodného jevu, nebo délku intervalu (časového i délkového) mezi takovými dvěma jevy (např. doba čekání na obsluhu, doba bezporuchového chodu zařízení, vzdálenost mezi dvěma body apod.) Poissonovo rozdělení je charakteristické pro náhodnou veličinu, která vyjadřuje intenzitu proudu. Toto rozdělení má diskrétní náhodná veličina, která vyjadřuje počet výskytů sledovaného jevu v určitém časovém intervalu, nebo v určité oblasti (např. počet zákazníků za den, počet chyb na formuláři atd.) PŘÍKLAD: Myčka aut Určete rozdělení počtu zákazníků, kteří si v pondělí ráno, v době od 8 do 9 hodin přijedou k myčce umýt auto. Z dlouhodobých pozorování se ví, že ve středu dopoledne jezdí průměrně zákazníků za hodinu. áhodnou veličinou X je počet zákazníků, kteří přijedou ve středu ráno, v době 8-9 hod. k myčce umýt auto. Tento počet není nijak omezen. Počet zákazníků je ale diskrétní náhodnou veličinou, proto může být hodnota náhodné veličiny pouze celé číslo a kladné číslo. Obor hodnot náhodné veličiny je tedy D { 0;;;3K } intenzitu proudu λ charakterizuje frekvence zákazníků na myčce, tj. λ aut/hod. sledovaným časovým úsekem je jedna hodina, tzn. t náhodná veličina X tady má Poissonovo rozdělení s parametrem λ t Po ( ) pravděpodobností funkce této náhodné veličina má pak tvar p ( ) P( X ) e! nejpřehlednější uspořádání rozdělení náhodné veličiny představuje tabulka 0 3 4 Σ p() 0 3 4 e 0! e! e! e 3! e 4! 0,005 0,049 0,044 0,089 0,3385 F() 0,005 0,074 0,0 0,5 0,8505 Majitele myčky by zajímalo, jaká je pravděpodobnost toho, že: a) v době od 8 do 9 hod. přijedou pouze 3 auta; b) v době od 8 do 9.30 hod. přijedou jen 3 auta
Pravděpodobnost toho, že v době 8-9 hod přijedou právě 3 auta, je rovna 3 P ( X 3) p( 3) e 0, 089 (viz také tabulka rozdělení náhodné veličiny) 3! V době od 8 do 9 hodin přijedou k myčce 3 auta s pravděpodobností přibližně 8,9 %. Jestliže nás ale dál zajímá pravděpodobnost toho, že k myčce přijedou 3 auta v době 8-9.30 hod., pak před sebou sice máme pořád náhodnou veličinu, která je podřízena Poissonovu rozdělení, ale toto rozdělení už bude mít jiný parametr, protože sledovaný interval už není jedna hodina, ale hodina a třicet minut, tzn. t,5 a parametr Poissonovo rozdělení λ t,5 9. Počet aut, které přijedou k myčce v pondělí ráno v době 8-9.30 hod. se tedy řídí Poissonovým rozdělením Po ( 9), jejíž pravděpodobností funkce je ve tvaru Takže p 9 9 ( ) P( X ) e 3 9 9 P ( X 3) p( 3) e 0, 0499 3! To znamená, že tři auta přijedou k myčce v době od 8 do 9.30 hod. s pravděpodobností asi,5 %. PŘÍKLAD: Myčka aut podruhé áhodná veličina X je doba mezi příjezdy vozidel k myčce aut v pondělí dopoledne. Z dlouhodobých pozorování se ví, že v pondělí dopoledne bývá průměrná doby mezi příjezdy jednotlivých vozidel k myčce minut. Jaká je pravděpodobnost toho, že pracovník myčky bude ve středu ráno čekat na dalšího zákazníka nejvýše 3 minuty? áhodná veličina X je doba mezi příjezdy vozidel k myčce aut, tzn. že se jedná o spojitou náhodnou veličinu, pauzu mezi dvě výskyty jevu, kterým je příjezd zákazníka k myčce. Tato náhodná veličina se řídí eponenciálním zákonem rozdělení E ( λ) Průměrná doby čekání na zákazníka je minut a parametr λ je převrácenou hodnotou průměrné doby prodlevy (pauzy, čekání), tj. λ Tuto náhodnou veličinu tedy popisuje funkce hustoty pravděpodobnosti ve tvaru a distribuční funkce, která má tvar f ( ) e ( ) e F Potom pravděpodobnost toho, že doba mezi příjezdy dvou zákazníků bude nejvýše 3 minuty je rovna ( 3) ( 3) 3 P X F e e 0,053 0, 39347 e Pravděpodobnost toho, že obsluha myčky na dalšího zákazníka bude v pondělí ráno čekat maimálně 3 minuty je přibližně 39 %-ní.!
PŘÍKLAD: Daňová přiznání Správce daně za hodinu zkontroluje průměrně 5 plátců daně. Jaká je pravděpodobnost toho, že za 4 minuty zkontroluje alespoň a nejvýše 5 daňových přiznání. Počet zkontrolovaných daňových přiznání je diskrétní náhodná veličina, která vyjadřuje intenzitu, s jakou správce daně kontroluje daňová přiznání, tj. 5 přiznání/hod., tzn. že 5 λ 0 4 Převést hodinu na 0 minut je tady více než žádoucí, protože řešíme počet zkontrolovaných daňových přiznání za 4 minuty. Zkoumaný interval je tudíž t 4 Tato náhodná veličina se potom řídí Poissonovým zákonem rozdělení s parametrem λ t 4, tedy Po() s pravděpodobnostní funkcí ve tvaru 4 ( ) P( X ) e f! Pravděpodobnost toho, že správce daně za 4 minuty zkontroluje minimálně a maimálně 5 daňových přiznání je tedy rovna P X 5 f + f 3 + f 4 + f 5 P X + P X 3 + P X 4 + P X 5 ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) e! 3 + e 3! 4 + e 4! 5 + e 5! e! + 3! + 4! + 0,347 5! Správce daně za 4 minuty zkontroluje minimálně a maimálně 5 daňových přiznání s pravděpodobností přibližně,4%. PŘÍKLAD: Bez práce není hrozinka v koláči a zadělávání tisíce koláčů se dává 5000 hrozinek. Popište tuto náhodnou veličinu příslušnou funkcí. Určete rozdělení počtu hrozinek v náhodně vybraném koláči a vypočítejte pravděpodobnost toho, že v tomto koláči bude 5 až 0 hrozinek. áhodnou veličinu, kterou je počet hrozinek v koláči, také můžeme považovat za jistou formu intenzity, a to za intenzitu výskytu hrozinek v koláči. Tato intenzita je dána pěti tisíci hrozinek na jeden tisíc koláčů, tj. λ 5000 5, 000 přičemž zkoumaným úsekem (intervalem) je tady jeden koláč, to znamená t Rozdělení počtu hrozinek v koláči se tedy řídí Poissonovým rozdělením s parametrem λ t 5 5, tj. Po 5, a je popsáno pravděpodobností funkcí ve tvaru () f 5 5 ( ) P( X ) e Úkol: Určete rozdělení počtu hrozinek v náhodně vybraném koláči a vypočítejte pravděpodobnost toho, že v tomto koláči bude 5 až 0 hrozinek.!
ORMÁLÍ ROZDĚLEÍ PRAVDĚPODOBOSTI PŘÍKLAD: ápojový automat ápojový automat je seřízen tak, že plní kelímky po 00 ml požadovaného nápoje s odchylkou 5 ml. áhodná veličina X je zde definována jako množství nápoje v kelímku. Tato náhodná 00;5, tedy veličina má pak normální rozdělení pravděpodobnosti ( ) F µ δ 00 5 ( ) Φ Φ a) Kolik procent kelímků bude obsahovat více než 4 ml nápoje? tj. máme určit pravděpodobnost toho, že 4, tedy 4 00 P 5 0,0548 íce než 4 ml nápoje bude obsahovat přibližně 5,5% kelímků. ( 4) P( < 4) F( 4) Φ Φ(, ) b) Kolik procent kelímků bude obsahovat 9-09 ml nápoje? tady se ptáme na pravděpodobnost toho, že 9 < < 09, tzn. 09 00 9 00 P 9 < < 09 F 09 F 9 Φ Φ Φ 0, 5 5 Φ 0, Φ 0, Φ 0, 0,7575 0, 0,945 V ( ) ( ) ( ) ( ) Φ( 0,) ( ) [ ( )] ( ) 455 Množstvím nápoje v rozmezí 9-09 ml nápoje bude naplněno asi 45,% kelímků. c) Kolik z tisíce kelímků přeteče, budou-li používány kelímky o objemu 30 ml? kelímek přeteče, jestliže > 30, takže se ptáme na pravděpodobnost 30 00 P( > 30) P( 30) F( 30) Φ Φ( ) 0,9775 5 0,075 Pravděpodobnost toho, že kelímek o objemu 30 ml přeteče, je asi,3%. Z tisíce kelímků jich potom přeteče 0,03 000 3 d) Jaké maimální množství nápoje obsahuje 0 % méně naplněných kelímků, tj. kelímků ve kterých je méně něž udávané průměrné množství nápoje? jinak můžeme tuto otázku zformulovat také: Jaké maimální množství nápoje bude kelímek obsahovat s 0 %-ní pravděpodobností? to znamená, máme určit tak, aby platilo P X 0, ( ) 0 00 0,0 F ( ) Φ 5 Vzhledem k tomu, že ve většině tabulek hodnot distribuční funkce normovaného normálního rozdělení jsou uvedeny pouze pravděpodobnosti kladných hodnot parametru u a tyto odpovídají pravděpodobnosti minimálně 50 %, potom platí Z toho vyplývá, že pro Φ u ( ) < 0, 50 ( u) Φ( u) Φ platí u p < 0,50 u( p ( ) )
Potom 00 u( 0,0) u( 0,90), 8 5 00,8 5 80,8 Deset procent méně naplněných (ošizených) kelímků bude obsahovat maimálně asi 8 ml nápoje. PŘÍKLAD: Životnost přístroje Střední hodnota životnosti přístroje je 0 let s dvouletou odchylkou. áhodná veličina X je tady definována jako doba života přístrojů, která má normální 0 rozdělení ( 0; ), takže F ( ) Φ a) Kolik procent přístrojů se porouchá do osmi let? máme určit pravděpodobnost, že < 8 8 0 P ( < 8 ) F( 8) Φ Φ( ) Φ( ) 0,8435 0, 585 Do osmi let se pokazí přibližně 5,9 % přístrojů. b) Do jaké doby se porouchá 75 % přístrojů? tato otázka znamená, že se ptáme, pro jakou hodnotu potom 0 Φ 0,75 7,44 Deset procent přístrojů se porouchá asi do 7 a půl let. c) U kolika procent přístrojů bude doba životnosti 7-3 let? úkolem je určit pravděpodobnost toho, že 7 3 3 0 7 0 P 7 3 F 3 F 7 Φ Φ Φ,5 Φ(,5) [ Φ(,5) ] Φ(,5) 0, 8 Délku života v rozmezí 7 až 3 let bude mít asi 87 % přístrojů. platí P ( X ) 0, 75 takže ( ) ( ) ( ) ( ) Φ(,5 ) d) Určete délku záruční doby tak, aby reklamaci podléhala maimálně 3% porouchaných přístrojů. otázkou tedy je, do jaké doby se porouchají maimálně 3 % přístrojů to znamená, že máme určit hodnotu takovou, aby platilo P X 0,, tedy ( ) 03 0 0 F ( ) 0,03 Φ 0, 03 potom u( 0,97) u, 88 0,88,4 Záruční doba by v tomto případě měla být maimálně let a přibližně 8 dnů.