3.3 Vybraná rozdělení náhodné veličiny 0,16 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0 Rozdělení Z 3 4 5 6 7 8 9 10 11 12 13 14 15 Život je umění vytvářet uspokojivé závěry na základě nedostatečných předpokladů. Samuel Butler
Co se dozvíte Rovnoměrné rozdělení. Binomické a hypergeometrické rozdělení. Poissonovo rozdělení. Normální rozdělení. Normované normální rozdělení, tabulky normálního rozdělení. Aproximace binomického rozdělení. 2
Proč používat modely rozdělení jsou jednodušší než realita jsou důkladně popsané lépe se s nimi počítá výsledky se blíží skutečnosti? SKUTEČNOST náhodná veličina (teoretický model) statistický znak (výběrový soubor) 3
Rovnoměrné rozdělení rozdělení diskrétní veličiny, která má pro všechny hodnoty 1 až n stejnou pravděpodobnost výskytu pravděpodobnostní funkce střední hodnota E( X ) = n + 1 2 rozptyl D( X ) = 2 n 1 12 7 E( X ) = = 3,5 2 35 D( X ) = = 2,92 σ ( X ) = 2,92 = 1,71 12 4
Binomické (Bernoulliho) rozdělení Bi(n,p) rozdělení diskrétní veličiny, která představuje počet úspěšných výsledků při n nezávislých pokusech se stejnou pravděpodobností p výběr s vracením pravděpodobnostní funkce Binomické rozdělení Bi(10;0,4) 0,3 střední hodnota E( X ) = n p 0,25 0,2 rozptyl D( X ) = n p 1 p ( ) 0,15 0,1 0,05 0 0 1 2 3 4 5 6 7 8 9 10 5
Hypergeometrické rozdělení HG(N,M,n) rozdělení diskrétní veličiny, která představuje výběr bez vracení: N velikost základního souboru M počet prvků s danou vlastností v základním souboru n velikost vzorku x počet prvků s danou vlastností ve vzorku N n x M 6
Hypergeometrické rozdělení pravděpodobnostní funkce střední hodnota E( X ) = n p rozptyl D( X ) = n p 1 p ( ) N N n 1 7
Zamyslete se Připomínají Vám vzorce pro pravděpodobnostní funkci binomického a hypergeometrického rozdělení výpočty pravděpodobnosti z příkladů, které už jste řešili? V těchto příkladech jste skutečně počítali hodnoty pravděpodobnostních funkcí těchto rozdělení, i když jste o tom nevěděli. Brankář chytí puk s pravděpodobností 0,6. S jakou pravděpodobností dostane při třech po sobě jdoucích střelách nejvýše 1 gól? rozdělení Bi(3 ; 0,6) P = P(2) + P(3) 8
Poissonovo rozdělení řídkých jevů Po(λ) rozdělení diskrétní veličiny, která představuje počet výskytu jevu v daném časovém intervalu λ průměrný počet výskytu jevů v intervalu pravděpodobnostní podobnostní funkce střední hodnota E( X ) = λ 0,35 0,3 Poissonovo rozdělení Po(1,8) 0,25 0,2 rozptyl D( X ) = λ 0,15 0,1 0,05 0 0 1 2 3 4 5 6 7 8 9 10 9
Podmínky pro použití Poissonova rozdělení počet výskytu jevu v daném intervalu je nezávislý na počtu výskytu v jiných intervalech střední hodnota počtu výskytu jevu je přímo úměrná délce intervalu jev je řídký vyskytuje se s malou četností (při vhodně zvolené délce intervalu se v něm vyskytuje maximálně jednou) 10
Příklad Do opravny přijde za deset hodin v průměru 24 zákazníků. S jakou pravděpodobností přijde během hodiny do opravny nejvýše jeden zákazník? rozdělení Po(2,4) proč λ = 2,4??? 0 2,4 2,4 e P(0) = = 0, 091 0! 1 2,4 2, 4 e P(1) = = 0, 218 1! Nejvýše jeden zákazník za hodinu přijde do prodejny s pravděpodobností cca 31 %. 11
Normální rozdělení N (µ, σ 2 ) náhodná veličina kolísá kolem průměru µ s rozptylem σ 2 vlivem působení velkého množství malých a navzájem nezávislých vlivů NORMÁLNÍ ROZDĚLENÍ 0,05 0,04 Gaussova křivka 0,03 0,02 N(100;100) graf hustoty pravděpodobnosti normálního rozdělení 0,01 0 50 60 70 80 90 100 110 120 130 140 150 12
Přečtěte si Normální rozdělení je nejdůležitějším rozdělením spojité náhodné proměnné, které statistika zná. Slouží jako pravděpodobnostní model chování velkého množství jevů v technice, přírodních vědách i ekonomii, například: rozložení hodnot IQ v populaci rozložení hmotnosti výrobků v sériové (pásové) výrobě rozložení týdenního počtu zákazníků v restauraci rozložení výsledků zápočtového testu ze statistiky 13
Vlastnosti Gaussovy křivky má maximum v bodě x = µ, který je současně střední hodnotou a mediánem rozdělení je symetrická kolem střední hodnoty x = µ NORMÁLNÍ ROZDĚLENÍ v bodech x = µ ± σ má inflexní body, σ je směrodatná odchylka rozdělení 0,05 0,04 0,03 N(100;100) 0,02 pro x ± se asymptoticky blíží k ose x 0,01 0 50 60 70 80 90 100 110 120 130 140 150 14
Centrální limitní věta vysvětluje výjimečnost normálního rozdělení Součet (nebo aritmetický průměr) náhodně vytvořených nezávislých hodnot veličiny s libovolným rozdělením se s rostoucím počtem sčítanců blíží k náhodné veličině in s normálním rozdělením. důsledek: Budeme-li mít veličinu, jejíž chování je způsobeno vlivem většího množství malých nezávislých vlivů, bude se svým chováním blížit veličině s normálním rozdělením. 15
Normované normální rozdělení Z Z N (0 ; 1) E(Z) = 0 D(Z) = 1 distribuční funkce Φ(z) najdeme ve statistických kvantil z p tabulkách z = 1,28 Φ(z) = 0,89973 z = -1,28 Φ(z) = 1 0,89973 = 0,10027 0 z z 0 16
Výpočet pravděpodobnosti v normálním rozdělení jednostranný interval omezený zprava P(X<x) f(x) µ x jednostranný interval omezený zleva + = 1 oboustranný interval = 17
Výpočet kvantilu x p p 0 x p p z p 1. najdeme v tabulkách nejbližší hodnotu p 2. odečteme příslušné z p pro p < 0,5 platí: 3. provedeme odnormování veličiny z p x p 18
Normální rozdělení v Excelu normované normální rozdělení Z NORMSDIST (z) p = Φ(z) NORMSINV (p) z p normální rozdělení N (µ ; σ 2 ) NORMDIST (x ; µ ; σ ; 1) p = F(x) NORMINV (p ; µ ; σ ) x p Není třeba provádět normování ani přepočty pro záporné z (p < 0,5). 19
Příklad Výrobní linka produkuje kilogramové balíčky rýže. Sledováním bylo zjištěno, že balíčky mají průměrnou hmotnost µ = 996 g a směrodatnou odchylku σ = 18 g. Předpokládejte, že hmotnost balíčku je normální náhodná veličina. a) Určete pravděpodobnost, že náhodně vybraný balíček bude mít hmotnost vyšší než 980 g tabulky: 980 996 P( X > 980) = 1 F(980) = 1 Φ = 1 Φ( 0,89) = Φ (0,89) = 0,813 18 MS Excel: P( X > 980) = 1 F(980) = 1 NORMDIST (980;996;18;1) =... 20
Příklad - pokračování b) Vymezte symetrický interval, ve kterém se bude nacházet hmotnost 90% všech vyrobených balíčků. symetrický 90% interval je vymezen kvantily 5% a 95% tabulky: z 0,95 = 1,645 z 0,05 = -1,645 (symetrie) x % 0,05 = 996 + ( 1,645) 18 = 966, 4 x % 0,95 = 996 + 1,645 18 = 1025,6 Excel: NORMINV (0, 05;996;18) = 966, 4 NORMINV (0,95;996;18) = 1025, 6 21
Moivre Laplaceova věta S rostoucím počtem prvků n konverguje binomické rozdělení Bi(n,p) k normálnímu rozdělení se střední hodnotou n.p a rozptylem n.p.(1 (1-p). empirické pravidlo pro aproximaci: n.p.(1.(1-p) > 9 pokud n < 50, provádí se korekce na spojitost P(x < 5) P(x < 4,5) P(x 5) P(x < 5,5) 3 4 5 6 7 8 Bi 3 4 5 6 7 8 N 22
Nevěříte? Binomické rozdělení - n = 5 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 binomické rozdělení Bi(5;0,3) E(X) = np = 1,5 D(X) = np(1-p) = 1,05 0 0 1 2 3 4 5 Binomické rozdělení - n = 20 0,25 0,2 0,15 0,1 0,05 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 binomické rozdělení Bi(20;0,3) E(X) = np = 6 D(X) = np(1-p) = 4,2-0,05 23
Příklad: Pravděpodobnost, že zákazník zakoupí daný výrobek, je 0,4. Jaká je pravděpodobnost, že výrobek zakoupí více než 15 zákazníků z 50? binomické rozdělení Bi(50 ; 0,4) N(20 ; 12) P = 1 F(15,5) = 1 NORMDIST (15,5; 20; ODMOCNINA(20)) = = 1 0, 097 = 0,903 přesný výsledek: P = 1 F(15) = 1 BINOMDIST (15;50;0, 4;1) = 1 0, 096 = 0,904 24
Co Vás čeká příště 4.1 Výběrové statistické metody Výběr vzorku, náhodný výběr. Odhady parametrů, bodový a intervalový odhad. Intervalový odhad střední hodnoty, Studentovo rozdělení. Základní pojmy z testování hypotéz hypotéza, testová statistika, významnost testu. Test hypotéz o střední hodnotě a podílu. 25