Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz
Úvod do teorie pravděpodobnosti Náhoda a pravděpodobnost, náhodný jev, náhodná veličina rozdělení pravděpodobnosti a jeho souvislost s histogramem pravidla pro počítání s pravděpodobností podmíněná pravděpodobnost závislost náhodných veličin využití závislosti při stanovení pravděpodobnosti - věta o úplné pravděpodobnosti a Bayesova věta
Úvod do teorie pravděpodobnosti Náhodný pokus = činnost, která může skončit různým výsledkem a my dopředu nevíme kterým Náhodný jev = výsledek náhodného pokusu, o kterém dopředu nevíme, zda nastane či ne Pravděpodobnostní prostor (, F,P) (Kolmogorov, 1933) Ω - množina elemetárních náhodných jevů F - jevové pole (σ-algebra náhodných jevů) (a) (b) pokud (c) pokud Ø, 2 F 2 F, potom platí C 2 F 1, 2, 2 F, potom platí P - pravděpodobnostní míra na F S 1 i=1 i 2 F
Úvod do teorie pravděpodobnosti Definice pravděpodobnosti 1. Klasická definice pravděpodobnosti: P () = µ() µ() =počet elementárních jevů v jevu µ() = míra jevu µ() 2. xiomatická definice pravděpodobnosti (a) 8 2 F : P () 2h0, 1i (b) P (Ø) = 0, P() =1 (c) jsou-li 1, 2, 2 F, po dvou disjunktní, potom P ( S 1 i=1 i)= P 1 i=1 P ( i) 3. Statistická definice pravděpodobnosti: lim j!1 n j n j
Úvod do teorie pravděpodobnosti Pravidla pro počítání s pravděpodobností 1) 2) 3) P () 2h0, 1i P (Ø) = 0, P() =1 P ( S 1 i=1 i)= P 1 i=1 P ( i) C B 4) 5) P ( [ B) =P ()+P (B) P ( \ B) P ( B) =P () P ( \ B) 6) P ( C )=1 P ( \ B) =? P ()
Podmíněná pravděpodobnost P ( \ B) =P ().P (B ) P (B ) = P ( \ B) P () B Příklad: Je známo, že v dlouhodobém průměru je mezi 1000 dodaných komponent 2,34% vadných výrobků výrobce, 1,08% vadných výrobků výrobce B, 65,97% bezvadných výrobků výrobce a zbytek (30,6%) jsou bezvadné výrobky od výrobce B. Lze považovat jev, že výrobek je vadný, za stochasticky závislý na výrobci?
Podmíněná pravděpodobnost P ( \ B) =P ().P (B ) P (B ) = P ( \ B) P () B Příklad: Jevy a V jsou stochasticky nezávislé právě když P (V ) =P (V ) P ( V )=P () P ( \ V )=P ().P (V ) B vada (V) 2,34 1,08 bez vady 65,98 30,6 celkem 3,42 96,58 celkem 68,32 31,68 100
30,60 = 96,58. 31,68 o.k. Podmíněná pravděpodobnost P ( \ B) =P ().P (B ) P (B ) = P ( \ B) P () B Příklad: Jev, že výrobek je vadný, lze považovat za stochasticky nezávislý na výrobci. 2,34 = 3,42. 68,32 B celkem 1,08 = 3,42. 31,68 65,98 = 96,58. 68,32 vada (V) 2,34 1,08 bez vady 65,98 30,6 3,42 96,58 celkem 68,32 31,68 100
Podmíněná pravděpodobnost P ( \ B) =P ().P (B ) P (B ) = P ( \ B) P () B Příklad: Z šetření obchodního řetězce vyplývá, že 34% zákazníků nakupuje pivo Pardál a současně dámské kalhotky. 28% zákazníků nakupuje dámské kalhotky, ale nenakupuje pivo Pardál, 19% nakupuje Pardála a nekupuje dámské kalhotky. Ostatních 19% nekupuje ani jednu z komodit. Lze považovat nákup piva Pardál stochasticky nezávislý na nákupu dámských kalhotek?
Podmíněná pravděpodobnost P ( \ B) =P ().P (B ) P (B ) = P ( \ B) P () B Příklad: 0,62. 0,53 = 0,3286 P(K) = 0,62 P P C celkem P(K P) = 0,42/0,62 K 0,42 0,2 0,62 = 0,677 > P(K) Nákup dámských kalhotek je stochasticky závislý na nákupu piva Pardál K C 0,19 0,19 0,38 celkem 0,53 0,47 1
Věta o úplné pravděpodobnosti je náhodný jev, {H 1,H 2,H 3,H 4 } je úplné pokrytí H i \ H j =Ø, H 1 [ H 2 [ H 3 [ H 4 = P () =P ( H 1 ).P (H 1 ) +P ( H 2 ).P (H 2 ) +P ( H 3 ).P (H 3 ) +P ( H 4 ).P (H 4 ) H 1 H 2 H 3 H 4 Příklad: Na trhu jsou výrobky od čtyř výrobců v pořadí, B, C a D v poměru 1:2:4:5. Zmetkovitost je u těchto výrobců po řadě 0,5%, 0,8%, 0,3% a 0,3%. Jaká je pravděpodobnost, že náhodně vybraný výrobek na trhu bude vadný? bude-li vadný, jaká je pravděpodobnost, že byl vyroben výrobcem?
Věta o úplné pravděpodobnosti je náhodný jev, {H 1,H 2,H 3,H 4 } je úplné pokrytí H i \ H j =Ø, H 1 [ H 2 [ H 3 [ H 4 = P () =P ( H 1 ).P (H 1 ) +P ( H 2 ).P (H 2 ) +P ( H 3 ).P (H 3 ) +P ( H 4 ).P (H 4 ) H 1 H 2 H 3 H 4 Příklad: P (H1) = 1/12, P ( H1) = 0,005 P (H2) = 2/12, P ( H2) = 0,008 P (H3) = 4/12, P ( H3) = 0,003 P (H4) = 5/12, P ( H4) = 0,003 P () = ( 5 + 16 + 12 + 15)/12000 = 0,004
Bayesova věta je náhodný jev, {H 1,H 2,H 3,H 4 } je úplné pokrytí H i \ H j =Ø, H 1 [ H 2 [ H 3 [ H 4 = P (H 1 ) = H 1 H 2 H 3 H 4 P ( H 1 ).P (H 1 ) P ()
Bayesova věta je náhodný jev, {H 1,H 2,H 3,H 4 } je úplné pokrytí H i \ H j =Ø, H 1 [ H 2 [ H 3 [ H 4 = P (H 1 ) = P ( H 1 ).P (H 1 ) P 4 i=1 P ( H i).p (H i ) H 1 H 2 H 3 H 4 Příklad: P (H1) = 0,08333, P ( H1) = 0,005 P (H2) = 0,16667, P ( H2) = 0,008 P (H3) = 0,33333, P ( H3) = 0,003 P (H4) = 0,41667, P ( H4) = 0,003 P (H1 ) = 0,005.0,08333/0,004 = 0,10417
Bayesova věta Příklad: Tělo kompresoru musí být 100% hermeticky uzavřeno. V průměru jeden ze sta kompresorů trochu netěsní a je třeba jej rozložit a znovu složit. Zkouška těsnosti odhalí vadný výrobek s pravděpodobností 0,8. Naproti tomu, s pravděpodobností 0,05 označí jako vadný bezvadný výrobek. Jaká je pravděpodobnost vady u výrobku, který zkouška označila jako vadný? kompreso 0,01 V 0,80 0,20 + - 0,008 0,002 0,008 P (V +) = 0,008+0,0495 0,99 B 0,05 + 0,0495 0,95-0,9405
Bayesova věta Příklad: Tělo kompresoru musí být 100% hermeticky uzavřeno. V průměru jeden ze sta kompresorů trochu netěsní a je třeba jej rozložit a znovu složit. Zkouška těsnosti odhalí vadný výrobek s pravděpodobností 0,8. Naproti tomu, s pravděpodobností 0,05 označí jako vadný bezvadný výrobek. Jaká je pravděpodobnost vady u výrobku, který zkouška označila jako vadný? kompreso 0,01 0,99 V B 0,80 0,20 0,05 + - + 0,008 0,002 0,0495 0,008 P (V +) = 0,008+0,0495 = 0,1391 0,95-0,9405
Bayesova věta Příklad: Tělo kompresoru musí být 100% hermeticky uzavřeno. V průměru jeden ze sta kompresorů trochu netěsní a je třeba jej rozložit a znovu složit. Zkouška těsnosti odhalí vadný výrobek s pravděpodobností 0,8. Naproti tomu, s pravděpodobností 0,05 označí jako vadný bezvadný výrobek. Jaká je pravděpodobnost vady u výrobku, který zkouška označila jako vadný? kompreso 0,139 0,861 V B 0,80 0,20 0,05 + - + 0,0111 0,0028 0,0042 0,0111 P2(V +) = 0,0111+0,0042 = 0,7255 Při opakovaném testu 0,95-0,8179
Náhodná veličina Náhodná veličina je funkce X :! R Přesněji: měřitelná funkce X :(, F)! (R, B) 8x 2 R : {! 2 : X(!) apple x} 2 F P ({! 2 : X(!) apple x}) =F (x), x 2 R Distribuční funkce náhodné veličiny: F (x) =P (X apple x), x 2 R Distribuční funkce odpovídá na otázku: S jakou pravděpodobností náhodná veličina nepřekročí hodnotu x?
Náhodná veličina Náhodná veličina je funkce z do a) spočetné podnmožiny S R b) souvislé podnmožiny Q R diskrétní náhodná veličina spojitá náhodná veličina Diskrétní náhodná veličina: obor hodnot = {x1, x2,, xn, } pravděpodobnostní funkce: P(xi) = pi, i=1, 2, vždycky musí platit, že p i 2h0, 1i, 1X i=1 potom je F (x) =P (X apple x) = X i=:x i applex p i =1 p i, x 2 R
Náhodná veličina Spojitá náhodná veličina: obor hodnot = (a,b) či a, ) nebo celé R nutně platí: P(x) = 0, 8x 2 (a, b) zavádíme nezápornou, zpravidla spojitou funkci f(x) tak, Z že platí: x F (x) = vždycky musí platit, že 1 f(t)dt, Z +1 1 8x 2 R f(t)dt =1 hustota pravděpodobnosti
Charakteristiky náhodné veličiny Kvantily: Často se ptáme: Jakou hodnotu sledovaná náhodná veličina nepřekročí s danou pravděpodobností? tedy pro zadané 2 (0, 1) hledáme x 2 R tak, že F (x ) apple α - kvantil je-li F(x) spojitá a prostá, potom je x = F 1 ( ) v případě diskrétní (po částech konstantní) F(x) je to taková maximální hodnota veličiny X, pro niž platí P (X apple x ) a zároveň P (X <x ) apple. Patří sem: minimum, medián, maximum, dolní a horní decily, horní a dolní kvartily,.
Charakteristiky náhodné veličiny Momenty: střední hodnota E(X) = E(X) = 1X i=1 Z 1 1 Vlastnosti střední hodnoty: - aditivita: - homogenita: x i p i diskrétní náhodné veličiny xf(x)dx spojité náhodné veličiny E(X + Y )=E(X)+E(Y ) E(kX) =ke(x), k 2 R linearita Střední hodnota tvoří jakési těžiště náhodné veličiny.
Charakteristiky náhodné veličiny Momenty: k-tý obecný moment náhodné veličiny m k = E(X k ) k-tý centrální moment náhodné veličiny k = E(X EX) k rozptyl (míra variability) šikmost (míra symetrie) špičatost (míra koncentrace) Var(X) =E(X EX) 2 Skew(X) = E(X EX)3 (Var(X)) 3/2 Kurt(X) = E(X EX)4 (Var(X)) 2
Charakteristiky náhodné veličiny Další charakteristiky modus, rozpětí, typ rozdělení,