Pravděpodobnost (pracovní verze)
1. Definice pojmů Jednoduchý/náhodný pokus (simple experiment) Akt vedoucí k jednomu výsledku - např. hod kostkou, zatočení ruletou, vytažení karty z balíčku, výběr osoby na ulici Výsledkem je výskyt jednoduchého jevu/události Jednoduchý jev (elementary event) člen základní množiny výsledek jednoduchého pokusu - např. hodnota 1 na kostce, 0 na ruletě, sedmička srdcová, modrooká paní Jev/třída jevů (event, event class) sada jednoduchých jevů - např. lichá čísla, srdce, piky Základní množina/prostor (S) (Sample space) sada všech jednoduchých jevů Spojené jevy (joint events) nastávají když výsledek pokusu spadá pod jevy A( srdce ) i B( král ) např. srdcový král, popřípadě A nebo B např. srdce nebo král Průnik ( ) (intersection) např. průnik jevů A a B = A B nebo-li A a B současné nastání dvou nebo více jevů Sjednocení (U) (union) - např. sjednocení jevů = A U B nebo-li A nebo B sečtení dvou nebo více jednoduchých jevů bez průniku Doplněk (~A) (complement) doplňkem jevu A je sada všech zbývajících jevů z S Vzájemně vylučující se/neslučitelné (mutual exclusive) jevy nemohou nastat současně, jejich = 0 Vyčerpávající (exhaustive) jevy jevy vyplňují celý S, jejich U = S Pravděpodobnost (p) (probability) míra jistoty nastání každého jevu ze základního prostoru - např. pravděpodobnost že padne 1 na kostce Podmíněná pravděpodobnost (p (A B)) (conditional probability) pravděpodobnost výskytu jevu A za předpokladu, že zároveň nastane jev B např. experiment: hod dvěma kostkami, událost: součet hodnot, otázka: jaká je pravděpodobnost výskytu události 4 když na jedné kostce padne 5? Statistická nezávislost (statistical independence) nepodmíněná pravděpodobnost jevu A a podmíněná pravděpodobnost jevu A stane-li se zároveň B jsou si rovny tj. p(a) = p(a B) nebo když p (A B) = p (A) * p (B)
Definice pravděpodobnosti p(a) = pravděpodobnost jevu A za předpokladu, že máme konečný počet jednoduchých jevů v S a každý jednoduchý jev z S má stejnou pravděpodobnost nastání pak platí, že p(a) = n (A) / n (S) Př. Krabička 10 kuliček 5 bílých, 3 červené, 2 černé experiment: bez dívání vybereme jednu kuličku jednoduchý jev: jedna konkrétní kulička, máme tedy 10 jednoduchých jevů tvořících S, jevy jsou vzájemně se vylučující a každý má pravděpodobnost 1/10 zajímají nás události: bílá, červená, černá Otázka: Jaká je p že vytáhnu červenou? p(červená)= n (červená) / n (S) = 3 / 10 =.30 Podobně p (bílá) =.50 a p (černá) =.20 p(červená a bílá) = 0 Pravděpodobnostní funkce přisuzuje každému jevu A z S číslo p(a), pravděpodobnost jevu A, tak že platí ( axiomy /zákony): 1. p (A) 0 pro každé A 2. p (S) = 1 3. Pokud (A 1,, A 2,., A n ) jsou vzájemně neslučitelné, pak p(a 1 U A 2 ) = p(a 1 ) + p(a 2 )
Pravidla pravděpodobnosti 1. p(~a) = 1 p(a) ( doplňková pravděpodobnost ) Př. Jaká je pravděpodobnost že vyberu ne červenou kuličku tj. jinou než červenou? p(~červená) = 1 - p (červená) =.7 2. 0 p(a) 1 ( rozsah pravděpodobnosti ) (důkaz: pokud by nějaký jev měl p větší než 1 pak by podle pravidla 1 měl doplněk jevu p zápornou a to by odporovalo axiomu 1) 3. p(ø) = 0, pro jakékoli S ( nemožný jev ) Př. Jaká je pravděpodobnost že vyberu bezbarvou kuličku tj. jinou než červenou nebo bílou nebo černou? p(bez barvy)=0 4. p (A U B) = p (A) + p (B) p (A B) (tzv. nebo pravidlo) Př. Balíček 52 karet. Jaká je pravděpodobnost krále nebo srdce? P (král) = 1/13, p(srdce)=1/4, p (král srdce)=1/52 (jeden z králů je srdcový) p (král nebo srdce) = 1/13 + 1/4 1/52 = 16/52 = 4/13 Speciální případ: když jsou jevy vzájemně se vylučující, pak p (A B) =0 a proto p (A U B) = p (A) + p (B) Př. p(červená nebo bílá) =.30 +.50 =.80 5. Pokud A,., L tvoří segmenty S, pak p (A U... U L) = p (A) + p (L) = 1 Pokud jsou jevy A až L vylučující se a vyčerpávající, pak tvoří celý prostor S a součet jejich pravděpodobností musí být 1 Př. p(červená nebo bílá nebo černá kulička) =.30 +.20 +.50 = 1.00
Ilustrace: doplněk S(52) ~A (nekrál) A (král)
Průnik a sjednocení S(52 karet) A U B = A + B - A B = 13 + 4 1 = 16/52 A(král) B(srdce) 3 A ~B (pikový + listový + kárový král) 1 A B (srdcový král) 12
A, B a C jsou vzájemně se vylučující jevy S(52) A(král) B (dáma) C (eso)
S(10 kuliček) A, B a C jsou vzájemně se vylučující a vyčerpávající jevy A (bílá) B (červená) C (černé)
Podmíněná pravděpodobnost p (A B) nebo-li p(a když B) = n (A B) / n (B) = n (A B) / n (S) / n (B) / n (S) = p (A B) / p (B) Př. Výběr vzorku dětí ve škole limitujeme pouze na dívky. Vznikne nám nový základní prostor S nový zahrnující pouze část jednoduchých jevů z původního S. V novém prostoru S nový zahrnujícím pouze dívky jaká je pravděpodobnost výběru levorukého člověka? Přičemž víme že 51% studentů je dívek, 35% studentů je levorukých, a 10% studentů jsou levoruké dívky. Otázka: p(levoruký, když dívka) = počet levorukých dívek / celkový počet dívek p(levoruká a dívka)= počet levorukých dívek / celkový počet studentů=.10 p(dívka)=celkový počet dívek / celkový počet studentů=.51 p(levoruký, když dívka) = p(levoruký a dívka) / p(dívka) =.10 /.51 =.196 p(dívka, když levoruký) =.10 /.35 =.29
Statistická nezávislost Výskyty jevů A a B jsou statisticky nezávislé pokud výskyt jevu A neovlivňuje výskyt jevu B a opačně Tedy když pravděpodobnost výskytu jevu A a pravděpodobnost výskytu jevu A když B jsou si rovny tj. p (A) = p (A B) př. p (dívka) =.51 P(dívka, když levoruký)=.29 Výsledek:.51.29, proto jevy nejsou nezávislé (souvisí spolu) nebo alternativně když p (A B) = p (A) * p (B) př. p (dívka a levoruký) =.10 p (dívka) =.51 p (levoruký) =.35 výsledek:.10.51 *.35, proto jevy nejsou nezávislé Pozor! Nezávislost vzájemná výlučnost (neslučitelnost) (Pro nadšence matematický důkaz: pokud A a B jsou vzájemně neslučitelné, pak p (A B) = 0. Pokud by A a B byly zároveň nezávislé, pak p (A B) = p(a)*p(b), a protože p (A B) = 0, tak to nemůže být pravda pokud p(a) nebo p(b) není nula) (Pro nadšence intuitivní důkaz: Předpokládejme že všichni muži jsou buďto plešatící nebo hustovlasí (dva vzájemně se vylučující jevy). Pokud by plešatící a hustovlasí byli na sobě nezávislé jevy, pak by mezi plešatícími byla stejná proporce hustovlasých jako je celková proporce hustovlasých mezi muži, tedy p(a B) = p(a), což je těžké si představit )
Prezentace spojených jevů v tabulkách Př. Základní množina S = studenti kampusu v Bohunicích, každý student je buďto dívka nebo chlapec, a odpověděl buďto ano nebo ne na otázku zda chodí každé ráno rád do školy. Chlapec (chlapec a ano ) (chlapec a ne ) Dívka (dívka a ano ) (dívka a ne ) Ano Ne Nechť v tomto kampusu pravděpodobnosti vybrat chlapce je.55 a dívku.45, a pravděpodobnost odpovědi ano je.40 a ne.60. P (chlapec)=.55 (chlapec a ano ) (chlapec a ne ) P(Dívka) =.45 (dívka a ano ) (dívka a ne ) P(Ano) =.40 P(Ne) =.60 p(chlapec),p(dívka),p(ano),p(ne) = marginální pravděpodobnosti (neboť se vyskytují na okraji tabulky) Každá marginální p = suma (Σ) všech spojených pravděpodobností v určitém konkrétním řádku nebo sloupci tabulky Př. p(chlapec) = p(chlapec a ano ) + p (chlapec a ne ) p(dívka) = p (dívka a ano ) + (dívka a ne ) p (ano) = p(chlapec a ano ) + p(dívka a ano ) p (ne) = p(chlapec a ne ) + p(dívka a ne )
P (chlapec)=.55 (chlapec a ano ) (chlapec a ne ) P(Dívka) =.45 (dívka a ano ) (dívka a ne ) P(Ano) =.40 P(Ne) =.60 Jevy/třídy jevů vyskytující se podél okraje jsou vzájemně neslučitelné a vyčerpávající (sada těchto jevů tedy formuje S) = dimenze Př. 2 dimenze: jevy ano a ne a jevy chlapec a dívka Statistická nezávislost : každá kategorie nebo jev podél jednoho okraje musí být nezávislý na každém jevu podél druhého okraje = pravděpodobnost každého spojeného jevu se musí rovnat součinu pravděpodobností korespondujících (v řádku a sloupci) marginálních jevů - p (A B) = p (A) * p (B) Př. Pokud dimenze pohlaví a odpověď ano/ne jsou nezávislé, pak p(chlapec a ano ) = p(chlapec) * p( ano ) =.55 *.40 =.22 Stejně postupujeme v ostatních případech a vznikne tabulka: P (chlapec)=.55 P(Dívka) =.45 p(chlapec)p ( ano ) =.55 *.40 =.22 p(dívka)p( ano ) =.45 *.40 =.18 p(chlapec)p( ne ) =.55 *.60 =.33 p(dívka)p( ne ) =.45 *.60 =.27 P(Ano) =.40 P(Ne) =.60
Pro závislé dimenze pravděpodobnosti spojených jevů součiny marginálních pravděpodobností: P (chlapec)=.55 P(Dívka) =.45 p(chlapec)p ( ano ) =.10 p(dívka)p( ano ) =.30 p(chlapec)p( ne ) =.45 p(dívka)p( ne ) =.15 P(Ano) =.40 P(Ne) =.60 Pro tuto základní množinu S (např. odpovědi dívek poté co dostali od svého milého kytici růží) pohlaví a odpověď spolu souvisejí Prozkoumáme-li podmíněné pravděpodobnosti, P(ano chlapec) =.10 /.55 =.18 P(ano dívka) =.30 /.45 =.67 pak vidíme že dívky mnohem pravděpodobněji/častěji odpovídají ano v porovnání s chlapci Pokud by ale obě dimenze byly nezávislé (jako v 1.tabulce) pak by tyto podmíněné pravděpodobnosti měly být stejné, P(ano chlapec) =.22 /.55 =.40 P(ano dívka) =.18 /.45 =.40 takže znám-li pohlaví nedává mi to informaci o tom jak bude student odpovídat