Tomáš Kroupa 1 Kombinatorika Náhodně vybereme 7-místné číslo Jaká je pravděpodobnost, že se v zápise čísla žádná cifra neopakuje? Pečlivě formulujte úlohu v Kolmogorovově modelu pravděpodobnosti Elementární jevy tvoří množinu Ω = {1 000 000,, 9 999 999} Množina možných jevů A je množina všech podmnožin A Ω Protože se jedná o náhodný výběr a všechna čísla z Ω mají stejnou šanci vybrání, pravděpodobnost spočteme jako P (A) = A Ω = A 9 10 6, A Ω Stačí tedy určit velikost množiny B všech 7-místných čísel s různými ciframi První cifru lze vybrat právě 9 způsoby (0 to být nemůže), zbylých 6 cifer pak můžeme vybrat právě 9 8 7 6 5 4 = 9! 3! způsoby Dostáváme tak P (B) = 9 9! 3! 9 10 6 = 9! 6 10 6 = 6048 10 = 006 Podmíněná pravděpodobnost V kapse máme dvě mince: symetrickou (rub i líc padá stejně často) a falešnou (na obou stranách rub) Náhodně vytáhneme jednu z nich a n- krát hodíme mincí, přičemž padne vždy rub Jaká je pravděpodobnost, že vybraná mince je falešná? Označme S jev byla vybrána symetrická mince a F jev byla vybrána symetrická mince, A n značí rub padnul n-krát v řadě Hledáme podmíněnou pravděpodobnost P (F A n ), kterou spočítáme pomocí Bayesova vzorce: P (F A n ) = P (A n F )P (F ) P (A n S)P (S) + P (A n F )P (F ) Apriorní pravděpodobnosti výběru mincí jsou zřejmě shodné: P (S) = P (F ) = 1 Strana 1 z 10
Dále Z toho plyne Přirozeně, P (A n F ) = 1 a P (A n S) = n P (F A n ) = 1 1 n + 1 lim P (F A n) = 1 n = n n + 1 3 Náhodná veličina X má rozdělení popsané hustotou pravděpodobnosti { xe x x 0, f X (x) = 0 x < 0 Stanovte její distribuční funkci, medián, modus a pravděpodobnost P [ < X 3] Zřejmě F X (x) = 0 pro x < 0 Pokud je x 0, platí F X (x) = x 0 x 0 te t dt = e y dy = e y dy = [ e y] 0 = 1 e x, 0 x x kde integrál řešíme substitucí y = t Medián určíme řešením rovnice F X (x) = 1, tedy hledáme x 0 splňující 1 = 1 e x Snadno nalezneme medián q X ( 1 ) = ln Modus je bodem maxima fx : derivace je f (x) = e x 4x e x = e x (1 x ), a proto je hodnota modu ˆx = 1 Nakonec, P [ < X 3] = P [X 3] = F X (3) = 1 e 9 4 Pravděpodobnost vypěstování zdravé rostliny ze semena je 04 Zasadíme 1 semen a předpokládáme, že jejich růst je nezávislý Náhodnou veličinou X je počet vypěstovaných zdravých rostlin Určete: (a) střední hodnotu a rozptyl, Strana z 10
(b) nejpravděpodobnější počet zdravých rostlin a pravděpodobnost takového počtu, (c) kolik je nutno zasadit semen, aby pravděpodobnost vypěstování zdravé rostliny nebyla menší než 099 Veličina X má zřejmě binomické rozdělení s parametry n = 1 a p = 04: ( ) 1 p X (x) = 04 x 06 1 x, x {0, 1,, 1} x Proto lze využít k řešení (a) známých vzorců: EX = np = 48 a DX = np(1 p) = 88 V úloze (b) hledáme modus, neboli ˆx {0, 1,, 1} takové, že platí p X (ˆx) p X (x), pro každé x {0, 1,, 1} Snadno se přesvědčíme, že ˆx / {0, 1} Nutnou podmínkou je tak splnění nerovností p X (ˆx) p X (ˆx 1) a p X (ˆx) p X (ˆx + 1) (1) Vzorec odvodíme pro obecné n a p Vztahy (1) vyjádříme po dosazení vzorce pro p X a vydělení jednou stranou takto: ˆx n ˆx + 1 1 p p 1 a n ˆx ˆx + 1 p 1 p 1 Řešením nerovnic určíme modus jako celé číslo ˆx z intervalu np + p 1, np + p V našem případě je ˆx 4, 5 a proto ˆx = 5 Zřejmě ( ) 1 p X (5) = 04 5 06 7 = 07 5 V poslední úloze (c) hledáme parametr n binomického rozdělení s parametrem p = 04 tak, aby platilo 1 p X (0) } {{ } 06 n 099 Stačí tedy vyřešit nerovnici 001 06 n Jejím řešením je libovolné n 901, a proto stanovíme nutný počet rostlin jako n = 10 5 Počet chyb ve dvou programových modulech je náhodný vektor (X, Y ), jehož sdružené rozdělení p XY je popsáno touto tabulkou: Strana 3 z 10
Určete: p XY (x, y) y = 0 y = 1 y = y = 3 x = 0 00 00 005 005 x = 1 00 010 010 010 (a) marginální rozdělení obou náhodných veličin X a Y, (b) pravděpodobnost, že první modul neobsahuje žádnou chybu, (c) zda jsou veličiny X a Y nezávislé, (d) rozdělení veličiny Z = X + Y, (e) korelační koeficient ρ(x, Y ) Úlohu (a) vyřešíme snadno, neboť p X (x) = 3 y=0 p XY (x, y) a analogicky pro p Y Dostaneme tak tabulku p XY (x, y) y = 0 y = 1 y = y = 3 p X (x) x = 0 00 00 005 005 050 x = 1 00 010 010 010 050 p Y (y) 040 030 015 015 Řešením (b) je p X (0) = 050 V části (c) stačí ověřit, zda platí rovnost p XY (x, y) = p X (x)p Y (y) pro všechna možná x a y Ovšem to není pravda, neboť např 00 = p XY (0, 1) p X (0)p Y (1) = 015, a proto nejsou X a Y nezávislé V (d) hledáme rozdělení popsané pravděpodobnostní funkcí p Z (z) = x,y z=x+y p XY (x, y), z = 0,, 4 Zřejmě p Z (0) = p XY (0, 0) = 00 a p Z (1) = p XY (1, 0) + p XY (0, 1) = 040 Podobně dostaneme p Z () = p Z (3) = 015 a p Z (4) = 010 K výpočtu (e) použijeme vztah Platí ρ(x, Y ) = cov(x, Y ) σ X σ Y E(XY ) = x,y = E(XY ) EX EY σ X σ Y xy p XY (x, y) = (1 + + 3) 010 = 06 a EX = 05, EY = 105 Tedy cov(x, Y ) = 0075, což nám znovu potvrzuje, že veličiny nejsou nezávislé Dále σ X = E(X ) (EX) = 05 05 = 05 a σ Y = 1071 Strana 4 z 10
Dostaneme ρ(x, Y ) = 0075 05 1071 = 014 6 Systém se skládá ze 3 nezávisle fungujících komponent Každá z nich má životnost X i popsanou exponenciálním rozdělením se střední hodnotou τ i = 1, kde i = 1,, 3 Celý i systém je funkční, jen pokud fungují alespoň komponenty Určete funkci spolehlivosti R X := 1 F X, kde X je životnost systému a F X je distribuční funkce životnosti Díky předpokladu platí F Xi (x) = 1 e ix, pro x 0 a i = 1,, 3 Hledáme R X (x) = 1 F X (x) = P [X > x] Označme si jevy popisující funkčnost jednotlivých komponent: A i = [X i > x] Hledanou funkci R X (x) pak spočítáme takto (využijeme princip inkluze a exkluze spolu s předpokladem nezávislosti jevů A 1, A a A 3 ): P ((A 1 A ) (A 1 A 3 ) (A A 3 )) = P ((A 1 A )) + P ((A 1 A 3 )) + P ((A A 3 )) 3P (A 1 A A 3 ) + P (A 1 A A 3 ) = P (A 1 )P (A ) + P (A 1 )P (A 3 ) + P (A )P (A 3 ) P (A 1 )P (A )P (A 3 ) Jelikož P (A i ) = P [X i > x] = 1 F Xi (x) = e ix, po roznásobení dostaneme R X (x) = e 3x + e 4x + e 5x e 6x 7 Kniha má 500 stran Pravděpodobnost tiskové chyby na 1 stránce je p = 10 3 Výskyty chyb na jednotlivých stránkách považujeme za nezávislé, celkový počet chyb v knize označme jako X Za těchto předpokladů určete přesně rozdělení veličiny X a pravdpěpodobnost P [X < ] Stejnou pravděpodobnost aproximujte pomocí Poissonova a normálního rozdělení Veličina X má binomické rozdělení s parametry n = 500 a p = 10 3 Proto platí P [X < ] = P [X = 0] + P [X = 1] = 0998 500 + 500 10 3 0998 499 = 0735959 Jelikož n je velké a p je relativně malé, lze rozdělení X aproximovat Poissonovým rozdělením s parametrem λ = np = 1 Proto můžeme psát P [X < ] e 1 = 0735759 Strana 5 z 10
Konečně, využijeme Moivre-Laplaceovu limitní větu, podle níž má veličina přibližně rozdělení N(0, 1) Proto X 1 0998 P [X < ] P [ X 1 0998 < 1 0998 ] = Φ(1) = 08413 8 Při detekci neautorizovaného přístupu k počítači se měří doba mezi stisknutím kláves při zadávání hesla Byly naměřeny tyto doby v sekundách: 046 038 031 04 00 031 034 04 009 018 046 01 Stanovte 90% interval spolehlivost pro střední dobu stisku kláves a uveďte použité předpoklady Předpoklad: data pocházejí z normálního rozdělení N(µ, σ ) Hledáme tedy intervalový odhad střední hodnoty µ při neznámém rozptylu σ Ten vypadá takto: X n S n q t(n 1) (1 α ), X n + S n q t(n 1) (1 α ), přičemž rozsah výběru je n = 1, spolehlivost 1 α = 09 Z dat dopočteme výběrový průměr a výběrovou směrodatnou odchylku: X n = 03, S = 01183 Hodnota kvantilu Studentova rozdělení je q t(11) (095) = 1796 Získáme tak interval 03 ± 00613 = 0387, 03613 9 Na základě náhodného výběru X 1,, X n odhadněte parametr ϑ > 0 rovnoměrného rozdělení na intervalu ϑ, ϑ pomocí metody momentů Pokud má veličina X rovnoměrné rozdělení na intervalu ϑ, ϑ, potom EX = 1 (ϑ ϑ) = 0 Strana 6 z 10
a proto nelze využít k odhadu 1 obecný moment Zkusíme tedy spočítat obecný moment: ϑ E(X x ) = ϑ dx = 1 ( ) ϑ 3 ϑ 3 + ϑ3 = ϑ 3 3 Ten položíme roven výběrovému momentu n Xi i=1 n ϑ ϑ 3 = n i=1 X i n, a dostaneme tak rovnici jejímž řešením je odhad ˆϑ = 3 n n Xi i=1 10 Na základě náhodného výběru X 1,, X n odhadněte parametr ϑ > 0 rovnoměrného rozdělení na intervalu 0, ϑ pomocí metody maximální věrohodnosti a metody momentů Každá veličina X i má rovnoměrné rozdělení s hustotou { ϑ 1 x 0, ϑ, f Xi (x) = 0 jinak Pokud uvažujeme hodnoty setříděné podle velikosti tak, že X (1) X (n), potom dostaneme věrohodnostní funkci { ϑ n 0 < X (1) X (n) ϑ, L(ϑ) = 0 jinak Protože je L(ϑ) funkcí klesající v proměnné ϑ, maxima se nabývá pro pozorování s nejvyšší hodnotou: ˆϑ ML = X (n) Proveďme odhad metodou momentů Platí EX = ϑ / a výběrový moment je X n = n i=1 X i Proto řešením rovnice n ϑ = X n dostáváme odhad ˆϑ = X n Strana 7 z 10
11 30 uživatelů testovalo notebooky na výdrž baterie při připojeném/odpojeném externím disku: 18 uživatelů bez připojeného disku pracovalo na baterii v průměru 53 h při směrodatné odchylce 14 h, zbylých 1 uživatelů mělo připojený disk a baterie jejich notebooku vydržela v průměru 48 h při směrodatné odchylce 16 h Použijte vhodný test na hladině α = 005 k rozhodnutí, zda připojení disku snižuje výkon baterie a uveďte použité předpoklady Použijeme dvouvýběrový test pro porovnání středních hodnot dvou normálních rozdělení Předpoklady: náhodné výběry X 1,, X 18 a Y 1,, Y 1 pocházejí z normálních rozdělení se stejným (neznámým) rozptylem a veličiny X 1,, X 18, Y 1,, Y 1 jsou navíc nezávislé Testujeme nulovou hypotézu µ X = µ Y na hladině významnosti α = 005 Použijeme testovou statistiku T = X Y S, 1/m + 1 /n kde m = 18, n = 1, X = 53, Y = 48 a (m 1)SX S = + (n 1)S Y m + n Po dosazení dostaneme realizaci testové statistiky t = 53 48 14818 1 /18 + 1 /1 = 09054 Tuto hodnotu porovnáme s kvantilem Studentova rozdělení q t(m+n ) (0975) = q t(8) (0975) = 05 Nelze zamítnout hypotézu, že výkony baterií jsou stejné při zapojeném i bez zapojeného externího disku Lze tedy tvrdit, že připojením disku se průměrná výdrž baterie nesníží 1 Klasifikujte stavy Markovova řetězce s pravděpodobnostmi přechodu 0 1 0 P = q 0 p 0 1 0 a určete stacionární rozdělení Strana 8 z 10
Zřejmě q = 1 p pro nějaké p 0, 1 Lze rozlišit 3 případy Je-li p = 0, potom jsou stavy 1 a trvalé, stav 3 je přechodný Pokud je p (0, 1), potom jsou všechny stavy trvalé a řetězec je tudíž nerozložitelný V případě p = 1 jsou stavy a 3 trvalé a stav 1 je přechodný Ve všech případech jsou trvalé stavy periodické s periodou Stacionární rozdělení p = (p 1, p, p 3 ) určíme řešením soustavy pp = p s dodatečnou podmínkou p 1 + p + p 3 = 1 a p 1, p, p 3 0 Snadno tak zjistíme, že pro libovolné p 0, 1 existuje pouze jedno stacionární rozdělení ( 1 p p =, 1, p ) Pro žádné p 0, 1 však není p rozdělením limitním díky periodicitě stavů: lim p ij(n) p j, i, j = 1,, 3 n 13 (Bernoulliho-Laplaceův model difúze) Uvažujme 3 bílé a 3 černé koule, které jsou náhodně rozmístěny do dvou nádob, přičemž každá nádoba obsahuje právě 3 koule Stav systému je určen počtem bílých koulí X n v první nádobě V každém kroku n náhodně vybereme kouli v první nádobě i v druhé nádobě a vzájemně je prohodíme Najděte matici přechodu takto zadaného markovského řetězce, klasifikujte jeho stavy a spočtěte stacionární rozdělení Stavy jsou z množiny {0, 1,, 3, 4} Protože jsou oba výběry nezávislé, dostáváme p 0i = { 1 i = 1, P = 0 i 1, 1 /9 i = 0, 4 /9 i = 1, p 1i = 4 /9 i =, 0 i = 3 Ostatní podmíněné pravděpodobnosti dopočteme podobně a dostaneme tak matici přechodu 0 1 0 0 1/9 4/9 4/9 0 0 4 /9 4 /9 1 /9 0 0 1 0 Tento řetězec má všechny stavy trvalé a ergodické, je tedy nerozložitelný aperiodický Strana 9 z 10
Proto existuje právě jedno stacionární rozdělení p R 4 a platí p lim n Pn = p p p Rozdělení p získáme řešením soustavy rovnic pp = p To je p = (005, 045, 045, 005) 14 Určete rychlost entropie markovského řetězce z příkladu 13 a stanovte maximální počet bitů, který uspoříme ve srovnání s bezpaměťovým zdrojem majícím stejnou množinu stavů Rychlost entropie stanovíme jako H((X n ) n N ) = H(X X 1 ) = 3 p i H(X X 1 = i) = 045 H( 1, 4, 4) 9 9 9 i=0 Jelikož H( 1 9, 4 9, 4 9 ) = 1 9 log 9 + 8 9 (log 9 log 4) = log 9 16 9, dostaneme H((X n ) n N ) = 9 10 log 9 8 5 = 15 Bezpaměťový zdroj nad stejnou množinou stavů může mít maximální rychlost entropie log 4 = bity Úspora tak činí až 075 na 1 znak generovaný markovským zdrojem Strana 10 z 10