Cvičení 3 Přednášející: Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení technické v Praze Rudolf Blažek 2011 BI-PST, LS 2010/11 Evropský sociální fond Praha & EU: Investujeme do vaší budoucnos@
Bayesova věta Cvičení Věta o úplném rozkladu pravděpodobnosti Soubor náhodných jevů B 1, B 2,...,B n se nazývá rozkladem množiny jestliže = [ n i=1 B i (disjunktní sjednocení: B i \ B j =? pro každé i 6= j). Věta (Věta o úplném rozkladu pravděpodobnosti) Nechť B 1, B 2,...,B n je rozklad množiny takový, že P(B i ) > 0 pro každé i. Pak Bayesova formule pro každý náhodný jev A. Věta (Bayes) Důkaz. P(A) = nx Podmíněná pravděpodobnost i=1 Bayesova formule P(A B i )P(B i ) ZNechť definice B 1, podmíněné B 2,...,B n je pravděpodobnosti rozklad a aditivity, P n i=1 P(A B i)p(b i )= P množiny takový, že P(B i ) > 0 pro každé ia nechť Anáhodný jev s P(A) n> 0. i=1 P(A Pak \ B i)=p(a). P(B k A) = P(B k)p(a B k ) P n i=1 P(B i)p(a B i ). Roman Kotecký, Rudolf Blažek (FIT ČVUT) Podmíněná pravděpodobnost a nezávislost BI-PST, LS 2010/11, Přednáška 2 8 / 18 2
(a) Spočtěte pravděpodobnost, že vyrobený obvod projde testem jako akceptovatelný. Odpověd : Cvičení (b) Splní nyní firma požadavek zákazníka? Rada: Jaká je podmíněná pravděpodobnost, že obvod je plně funkční za předpokladu, že prošel testem jako akceptovatelný? Bayesova věta 2. Dle odhadu 90% vyrobených integrovaných obvodů je plně funkčních. Požadavek zákazníka je však 99% plně funkčních obvodů. Vyrobené obvody jsou proto otestovány. Studie ukázala, že testem projde jako akceptovatelný přibližně 80% plně funkčních a 10% vadných obvodů. (a) Spočtěte pravděpodobnost, že vyrobený obvod projde testem jako akceptovatelný. Odpověd : (b) Splní nyní firma požadavek zákazníka? Rada: Jaká je podmíněná pravděpodobnost, že obvod je plně funkční za předpokladu, že prošel testem jako akceptovatelný? Odpověd : (c) Výroba obvodu stojí 2Kč a jeho test stojí 0.2Kč. Obvody, které neprojdou testem jsou skartovány. Kolik pak celkem stojí dodavatele jeden dodaný obvod? Odpověd : 3
Stromový diagram Cvičení,B n of events is called a partition of Example if = [ n i=1 B i (it means nd B i \ B j =? whenever i 6= j). distinction formula) be a partition of such that P(B i ) > 0 for all i. Then bability P(A) = Nakreslete stromový diagram pro příklad Bayes formula \ B i ), by definition of conditional probability and by aditivity, P (A 1 ) P (A c 2 A 1 ) i) = P(A \ B k) P(A) nx i=1 Použijte základní vzorce P(A B i )P(B i ) i) = P n i=1 P(A \ B i)=p(a). = P(B k A) What is the probability that in the sequence of there are no hearts? A i = {i-th card is not he P(A 1 \ A 2 \ A 3 )=P(A 1 )P(A 2 A 1 )P(A 3 A 1 Illustration of the computation with the help of A 1 P (A 2 A 1 ) P (A c 1) P (A 3 A 1 \ A 2 ) IT ČVUT) Statistika pro informatiku MI-SPI, ZS 2011/12, Přednáška 2 6 / 23 A 2 The probability in a given vertex of the tree is Pravděpodobnost values ona the statistika path stemmingbi-pst, from LS2010/11 the root. A 3 P (A 1 \ A 2 \ A 3 ) P (A c 3 A 1 \ A 2 ) P (A 1 \ A 2 \ A c 3) 39/52 4
Cvičení Bayesova věta Z analýzy našeho účtu elektronické pošty jsme zjistili, že 30% dosud přijatých zpráv byl spam (nevyžádaná pošta). V 65% spamových zpráv se vyskytuje slovo "kopie". Z legitimních zpráv je slovo "kopie" obsaženo pouze v 15%. Uvažujme nově příchozí zprávu obsahující slovo "kopie". Spočtěte pravděpodobnost, že tato zpráva je spam. Poznámka: Bayesovské filtry spamu opravdu fungují na podobném principu 5
Bayesova věta Cvičení Věta o úplném rozkladu pravděpodobnosti Soubor náhodných jevů B 1, B 2,...,B n se nazývá rozkladem množiny jestliže = [ n i=1 B i (disjunktní sjednocení: B i \ B j =? pro každé i 6= j). Věta (Věta o úplném rozkladu pravděpodobnosti) Nechť B 1, B 2,...,B n je rozklad množiny takový, že P(B i ) > 0 pro každé i. Pak Bayesova formule pro každý náhodný jev A. Věta (Bayes) Důkaz. P(A) = nx Podmíněná pravděpodobnost i=1 Bayesova formule P(A B i )P(B i ) ZNechť definice B 1, podmíněné B 2,...,B n je pravděpodobnosti rozklad a aditivity, P n i=1 P(A B i)p(b i )= P množiny takový, že P(B i ) > 0 pro každé ia nechť Anáhodný jev s P(A) n> 0. i=1 P(A Pak \ B i)=p(a). P(B k A) = P(B k)p(a B k ) P n i=1 P(B i)p(a B i ). Roman Kotecký, Rudolf Blažek (FIT ČVUT) Podmíněná pravděpodobnost a nezávislost BI-PST, LS 2010/11, Přednáška 2 8 / 18 6
Cvičení Jak spravit falešnou minci? (Úplný rozklad pravděpodobnosti) Hoď 2x mincí (Head / Tail; Panna / Orel): HT - Ty vyhraješ & TH - Já vyhraji HH or TT - zopakuj oba hody HT a TH mají stejnou pravděpodobnost: P(H)P(T) Dokažte: P(Já vyhraji) = 1/2... není to zcela lehké Zopakovat musíme OBA hody, nikoliv přidat jeden Správný postup: (HH)(TT)(TT)(TH) Chybný postup: HHT...výhra Pokud první hod je H, tak takonec vyhraji já! Jinak prohraji. 7
Cvičení Jak spravit falešnou minci? (Úplný rozklad pravděpodobnosti) Předpokládejme P(H) = p, P(T)=1-p V každém páru hodů: P(HT) = p (1 p) P(TH) = (1 p) p P(HH or TT) = p 2 + q 2 Spočtěte P(Já vyhraji) a P(Ty vyhraješ) Důležitý trik Úplný rozklad pravděpodobnosti N=počet párů (náhodný stopping time ) P (já vyhraji) = 1X n=1 P (já vyhraji,n = n) 8
Cvičení Zajímavost: Jak napálit protivníka? 1)+Postavte minci na hranu na stůl + Udeřte zespodu na desku stolu + Jedna strana je obvykle padne častěji Otestujte si vlastní minci. Navrhněte jak ji otestovat! (Probereme ve statistice) 2)+Držte minci ukazováčkem postavenou na hraně + Roztočte minci na stole cvrnknutím + Naučte se, aby přistála nahoru stranou, do které cvrnkete 9