Podmíněná pravděpodobnost, náhodná veličina a způsoby jejího popisu Ing. Michael Rost, Ph.D.
Podmíněná pravděpodobnost Pokud je jev A vázán na uskutečnění jevu B, pak tento jev nazýváme jevem podmíněným jevu B a značíme jej A B. Při určování podmíněné pravděpodobnosti se množina všech možných výsledků náhodného pokusu omezí pouze na ty výsledky, jež vyhovují dané podmínce. Pravděpodobnost podmíněného jevu pak definujeme takto: P (A B) = P (A B) P (B) kde P (B) > 0. Z výše uvedeného vztahu plyne následující rovnice: P (A B) = P (A B) P (B) Zaměníme-li pak formálně A a B P (B A) = P (B A) P (A)
Tyto vzorce slouží pro výpočet současného výskytu jevů A a B a bývají označovány jako věty o násobení pravděpodobností. Pokud se bude jednat o nezávislé jevy, pak se věta o násobení pravděpodobností zjednoduší, nebot platí: a tedy P (A B) = P (A) P (B A) = P (B) P (A B) = P (A) P (B). Obdobně pak pro n nezávislých jevů.
Příklad Ve sklepě máte 70 kompotů: 35 hruškových, 20 jablkových a 15 třešňových. Pošlete svého slabšího sourozence (stejně jako vždy) pro 3 kompoty. Pokud přinese všechny hruškové, budete maximálně spokojeni a sourozenec bude pochválen. Pokud přinese všechny třešňové, půjde znova. V jiném případě to,,kousnete. Sourozenc pochopitelně neví, na co máte chut. Jaká je pravděpodobnost, že: sourozenec bude pochválen, to kousneme, půjde znova chudák.
Bayesův vzorec Pokud mají náhodné jevy B 1, B 2, B 3,, B n nenulové pravděpodobnosti a zároveň tvoří úplný rozklad pravděpodobnostního prostoru Ω, tj. Ω = n i=1 B i, přičemž B i B j = pro i j, lze libovolný jev A vyjádřit pomocí jevů B j pro j = 1, 2,, n takto: A = (A B 1 ) (A B 2 ) (A B n ). Postupným užitím věty o sčítání pravděpodobností pro neslučitelné náhodné jevy a věty o násobení pravděpodobností získáme předpis pro výpočet pravděpodobnosti jevu A, někdy také nazývaný vzorec úplné pravděpodobnosti. P (A) = n j=1 P (A B j ) P (B j )
Bayesův vzorec Pokud je i P (A) > 0, pak pro každý index i {1, 2,, n} bude platit: P (B i A) = P (A B i) P (B i ) nj=1 P (A B j ) P (B j ) Tento vztah budeme nazývat Bayesovým vzorcem.
Praktický příklad Studiem odborných časopisů jsme zjistili relativní četnosti mozkových příhod a vysokého krevního tlaku u starých osob. Známe tyto informace: 1 Deset procent lidí ve veku 70 let utrpí mozkovou příhodu v následujících pěti letech. P (MP ) = 0, 1 a tedy P (MP c ) = 0, 9 2 Dále víme, že 40 procent lidí kteří utrpěli mozkovou příhodu v pěti letech po 70 trpí (trpělo) vysokým krevním tlakem. P (KT MP ) = 0, 4 3 Z lidí kteří neměli mozkovou příhodu do 75 let mělo pouze 20 procent lidí vysoký krevní tlak. P (KT MP c ) = 0, 2
Zajímají nás dvě otázky: 1 Jaká je pravděpodobnost, že 70 letý pacient má vysoký krevní tlak? P (KT ) =? 2 Jaká je pravděpodobnost, že 70 letý pacient s vysokým krevním tlakem utrpí mozkovou příhodu v následujících pěti letech? P (MP KT ) =? Řešení: P (KT ) = P (KT MP )P (MP ) + P (KT MP c )P (MP c ) = 0, 4 0, 1 + 0, 2 0, 9 = 0, 22 P (MP KT ) = P (MP KT ) P (KT ) = P (KT MP ).P (MP ) P (KT ) = 0, 4 0, 1 0, 22 = 0, 182
NÁHODNÁ VELIČINA
Náhodná veličina Základní paradigma: Představme si, že je každému prvku ω, ω Ω přiřazeno nějaké reálné číslo. Jinými slovy to znamená, že je dána určitá funkce, která nám,,pomáhá zobrazit Ω do R. X : Ω R Necht tedy X(ω) je číslo přiřazené funkcí X(.) elementárnímu jevu ω. Na funkci X(.) jsou kladeny určité požadavky: Vzorem množiny B R je X 1 (B) = {ω : X(ω) B} O funkci X(.) řekneme, že je měřitelná, platí-li X 1 (B) A pro každé B R. Takovouto měřitelnou funkci X(.) označíme za náhodnou veličinu X
Distribuční funkce F(.) Snahou je pochopit chování námi sledované náhodné veličiny. Pro každé x R se definuje funkce F(x) takto F(x) = P({ω : X(ω) x}) = P(X x) Funkci F(x) nazveme distribuční funkcí náhodné veličiny X. Umíme-li určit tyto pravděpodobnosti, pak známe tzv. rozdělení pravděpodobnosti náhodné veličiny X.
Vlastnosti distribuční funkce Distribuční funkce je definována na předem daném intervalu. Její základní vlastnosti jsou: 0 F(x) 1 F(x i ) F(x j ) pro každou dvojici čísel x i < x j lim F(x) = F( ) = 0 x lim F(x) = F(+ ) = 1 x + P (a < X b) = F(b) F(a) Distribuční funkce F(x) je zprava spojitá a má nejvýš spočetně bodů nespojitosti.
Diskrétní a spojitá náhodná veličina Diskrétní náhodná veličina Náhodná veličina X nabývá jen konečně nebo spočetně mnoha hodnot. Řekneme tedy, že X nabývá jen hodnot x 1, x 2,..., přičemž P({ω : X(ω) = x i }) = P(X = x i ) = p i i = 1, 2,... V takovém případě říkáme, že X má diskrétní rozdělení. Její distribuční funkce F() je skokovitá. Skoky jsou v bodech x 1, x 2,..., přičemž velikost skoku v bodě x i má velikost p i, i = 1, 2,... Distribuční funkce diskrétní náhodné veličiny je tedy nespojitá. Platí pro ni: F(x i ) = P (X x i ) = j i p j
Spojitá náhodná veličina Náhodná veličina X je spojitá, může-li nabývat všech hodnot z konečného nebo nekonečného intervalu. Předpokládejme že máme spojitou náhodnou veličinu X, nabývající všech hodnot z intervalu x ( ; ). Existuje-li taková funkce f(), že F(x i ) = xi f(t)dt, pak říkáme, že X má spojité rozdělení a že f() je její hustota, resp.hustota pravděpodobnosti
Hustota pravděpodobnosti f() Funkci definovanou vztahem f(x) = df(x) = F (x) (1) dx nazýváme tedy hustotou pravděpodobnosti, nebo v případě diskrétní náhodné veličiny frekvenční funkcí. Základní vlastnosti této funkce jsou: f(x) 0 lim x f(x)dx = 0 lim f(x)dx = 0 x + b a f(x)dx = 1 pro x [a; b] P (a < X b) = b a f(x)dx
Příklad Diskrétní náhodná veličina X je zadána řadou rozdělení (tabulkou rozdělení pravděpodobností): x i 3 4 7 10 p i 0,2 0,1 0,4 0,3 Určeme distribuční funkci této náhodné veličiny. S jakými pravděpodobnostmi nabývá X hodnot z intervalů: 5; 3, 1), 3, 5; 9) a 11; 15)? Nebot platí: F(x i ) = P (X x i ) = j i p j
Příklad Pak tedy: F(x) = 0 x < 3 0, 2 3 x < 4 0, 3 4 x < 7 0, 7 7 x < 10 1 x 10 např. F(7) = 0, 7 P(X 5; 3, 1)) = P( 5 X < 3, 1) = F(3, 1) F( 5) = 0, 2 0 = 0, 2 P(X 3, 5; 9)) = P(3, 5 X < 9) = F(9) F(3, 5) = 0, 7 0, 2 = 0, 5 P(X 11; 15)) = P(11 X < 15) = F(15) F(11) = 1 1 = 0
Graf distribuční funkce
Graf distribuční funkce F(x) 0.0 0.2 0.4 0.6 0.8 1.0 0 2 4 6 8 10 12 x
Ostatní způsoby popisu náhodných veličin Chování náhodné veličiny lze postihnout i prostřednictvím tabulky rozdělení pravděpodobností x i 3 4 7 10 p i 0,2 0,1 0,4 0,3 polygonu rozdělení pravděpodobností.
α100%ní kvantil Ve statistice je velmi důležitý je pojem kvantilu. α-kvantilem nebo α100%-ním kvantilem náhodné veličiny X, která má jisté spojité rozdělení náhodné veličiny s distribuční funkcí F(x) a hustotu pravděpodobnosti f(), je číslo x α pro které platí F(x α ) = P(X x α ) = x α f(x)dx = α
Príklad Předpokládejme že máme náhodnou veličinu X která má hustotu pravděpodobnosti definovanou takto: f(x) = 1 x (a, b) b a 0 x jinak Distribuční funkci získáme snadno jako F(x) = x f(t)dt = x 1 b a dt = 0 x a x a a x < b b a 1 x b Necht pro naší X platí a = 0 b = 2. Pak tedy:
Príklad a F(x) = x f(x) = f(t)dt = x 1 x (0, 2) 2 0 x jinak 1 2 dt = 0 x 0 x 2 0 x < 2 1 x 2
Střední hodnota náhodné veličiny Nejčastěji používanou číselnou charakteristikou polohy je první obecný moment, který se nazývá střední hodnota náhodné veličiny X. Budeme jej označovat symbolem E(X). Pro diskrétní náhodnou veličinu X, x [a; b] s pravděpodobnostní funkcí P(X = x) je E(X) definována jako: E(X) = n i=1 x i P(X = x i ) = n i=1 x i p i. Pro spojitou náhodnou veličinu X s hustotou pravděpodobnosti f(x) je E(X) definována jako: E(X = x) = b a xf(x)dx.
Rozptyl náhodné veličiny Popis polohy je třeba často doplnit o informaci, jak se rozptylují jednotlivé hodnoty náhodné veličiny kolem nějaké charakteristiky polohy (nejčastěji kolem střední hodnoty). Tuto informaci podávají charakteristiky variability. Mezi ně patří rozptyl D(X). Ten je stanoven jako druhý centrální moment: D(X) = E{[X E(X)] 2 } V případě diskrétní náhodné veličiny X je definován jako: D(X) = n i=1 [x i E(X)] 2 p i. V případě spojité náhodné veličiny X je definován jako: D(X) = b [x i E(X)] 2 f(x)dx. a
Příklad Předpokládejme, že náhodná veličina X popisující podíl jisté reklamní společnosti na tuzemském trhu, během jistého týdne, může být popsána následující hustotou pravděpodobnosti: f(x) = 3 2 (1 x2 ) 0 x 1 0 jinak Určeme: Distribuční funkci, střední hodnotu, medián, a rozptyl. Distribuční funkce F(x) = x 0 3 2 (1 y2 )dy = 3 [ [y] x y 2 0 3 ]x 0 = 3 2 [ x x3 3 ].
Příklad Medián získáme jednoduše: F(x α ) = F(x 0,5 ) = 1 2 = 3 2 [ x x3 3 získáme x 3 3x + 1 = 0. Kořeny této kubické rovnice jsou přibližně: 1, 879, 0,34729 a 1, 5320. ] Hodnota mediánu je tedy 0, 34729. Střední hodnota: E(X) = 1 0 x 3 2 (1 x2 )dx = 3 2 [ x 2 2 ]1 0 [ x 4 4 ]1 0 = 3 8.
Příklad Rozptyl: K výpočtu rozptylu naší náhodné veličiny X využijeme známého vzorce D(X) = E(X 2 ) [E(X)] 2. E(X 2 ) = 1 0 x 23 2 (1 x2 )dx = 3 2 [ x 3 3 ]1 0 [ x 5 5 ]1 0 = 1 5. Pak již jednoduše: D(X) = 1 [ ] 3 2 5 = 1 8 5 9 64 = 19 320 = 0, 05937.