STP022 PŘÍKLADY LS 2004/2005 Příklady jsou většinou převzaté ze skript Dupač & Hušková (1999), Zvára & Štěpán (2002) a ze sbírky Potocký et al. (1986). Některé příklady a protipříklady pocházejí z knihy Romano & Siegel (1986). Jsou členěny do sekcí podle jednotlivých cvičení. Většina sekcí obsahuje úlohu, která slouží jednak k procvičení a jednak k nahrazení absencí podle pravidel uvedených na stránkách cvičení http://www.karlin.mff.cuni.cz/~kraus/stp022/. 1. Přímý výpočet pravděpodobnosti (24.2.2005) 1. V antikvariátu má 20 % knih vytrženou stranu, 30 % je popsaných a 60 % je bez poškození. Jaká je pravděpodobnost, že náhodně vybraná kniha je popsaná, ale má všechny strany? 2. Z kartiček s čísly 1, 2, 3, 4, 5 náhodně vybereme tři a položíme je v pořadí, v němž jsme je vybrali. Jaká je pravděpodobnost, že vzniklé trojciferné číslo je sudé? 3. Skupina 10 studentů, z nichž 3 jsou z MFF, se náhodně seřadí do fronty. Určete pravděpodobnost, že 3 z MFF budou vedle sebe. 4. Hodíme 6 kostkami. Určete pravděpodobnost, že (i) padnou vesměs různá čísla, (ii) padnou pouze lichá čísla. 5. V krabici je 8 bílých, 8 červených a 8 modrých koulí. Náhodně vytáhneme jednu, zapíšeme si její barvu a vrátíme ji do krabice. Pak vytáhneme druhou kouli. (1) Jaká je pravděpodobnost, že bude mít stejnou barvu jako první koule? (2) Jak to bude v případě, že první kouli nevrátíme? 6. Ve sportce se sází 6 čísel, losuje se 6 ze 49. Spočtěte pravděpodobnost, že právě 4 čísla vsadíme správně. 7. Skupina n a lidí, z nichž dva jsou naši známí, se rozdělí náhodně do n skupina po a osobách. Jaká je pravděpodobnost, že se naši dva známí dostanou do stejné skupiny? 8. Jaká je pravděpodobnost, že ve třídě n žáků existuje dvojice, která má narozeniny ve stejný den? Jaká je pravděpodobnost, že existuje žák, který má narozeniny ve stejný den jako učitel? 9. (Maxwell Boltzmann.) Náhodně rozmístíme n rozlišitelných kuliček do r přihrádek. Stavem systému je seznam adres jednotlivých kuliček (tj. pro každou kuličku udáme přihrádku, v níž se nachází). Všechny stavy jsou stejně pravděpodobné. (i) Kolik je stavů? (ii) Jaká je pravděpodobnost p n,r,k, že v první přihrádce je právě k kuliček? (iii) Jaká je limita této pravděpodobnosti, když n a současně r = r n, a to tak, že n/r n λ (0, )? (k je pevné.) (iv) Jaká je pravděpodobnost, že aspoň jedna přihrádka je prázdná? Úloha 1. n dopisů různým adresátům umístíme do n obálek a zalepíme. Když si uvědomíme, že jsme zapomněli napsat na obálky adresy, rozhodneme se napsat je náhodně. Jaká je pravděpodobnost, že aspoň na jednom dopisu je správná adresa? Určete limitu této pravděpodobnosti při n. 1
2. Přímý výpočet pravděpodobnosti, podmíněná pravděpodobnost (3.3.2005) 10. (Bose Einstein.) Náhodně rozmístíme n nerozlišitelných kuliček do r přihrádek. Stavem systému jsou počty kuliček v jednotlivých přihrádkách (tj. pro každou z r přihrádek udáme, kolik je v ní kuliček). Všechny stavy jsou stejně pravděpodobné. (i) Kolik je stavů? (ii) Jaká je pravděpodobnost p n,r,k, že v první přihrádce je právě k kuliček? (iii) Jaká je limita této pravděpodobnosti, když n a současně r = r n, a to tak, že n/r n λ (0, )? (k je pevné.) (iv) Jaká je pravděpodobnost, že aspoň jedna přihrádka je prázdná? 11. Tenista má první podání úspěšné s pravděpodobností 0.6, druhé s pravděpodobností 0.8. Jaká je pravděpodobnost dvojchyby? 12. Máme tři karty: jedna má obě strany černé, druhá obě červené, třetí jednu černou a jednu červenou. Potmě vybereme náhodně jednu kartu a položíme ji náhodnou stranou na stůl. Po rozsvícení vidíme červenou. Jaká je pravděpodobnost, že karta je na druhé straně černá? 13. Hráči A, B a C střídavě házejí mincí do té doby, než někomu padne líc. V tom okamžiku hra končí a tento hráč je vítězem. Jaká je pravděpodobnost výhry hráče A, B, C? 14. V krabici je 15 tenisových míčků: 9 nových a 6 starých. Náhodně vybereme 3 a hrajeme s nimi (čímž se stanou nebo zůstanou starými). Pak je vrátíme a opět náhodně vybereme 3. Jaká je pravděpodobnost, že pro druhou hru máme právě k = 0, 1, 2, 3 nových? 15. K disposici máme N uren, v i-té je a i bílých a b i černých koulí. Náhodně vybereme jednu urnu a z ní jednu kouli. Zjistíme, že je bílá. Jaká je pravděpodobnost, že jsme táhli z k-té urny? Úloha 2. E-mailem vám chodí 70 % běžných (řekněme vyžádaných nebo nevadících) zpráv, zbývajících 30 % je spam. Připadá vám to moc a tak se rozhodnete nainstalovat si poštovního klienta, který třídí poštu. Jeho výrobce udává, že klient chybně označí vyžádanou zprávu jako spam s pravděpodobností 0.04, zatímco skutečný spam správně klasifikuje jako spam s pravděpodobností 0.8. Zanedlouho po instalaci přijde první e-mail a vidíme, že byl klientem označen jako spam. Jaká je pravděpodobnost, že je to skutečně spam? 3. Podmiňování, nezávislost, geometrická pravděpodobnost (10.3.2005) 16. Máme N uren, v i-té je a i bílých a b i černých koulí. Náhodně s pravděpodobnostmi p 1,..., p N ( N 1 p i = 1) vybereme jednu urnu. Z té pak náhodně taháme koule s vracením. (a) Uvažujme jevy A k = [v k-tém tahu je tažena bílá] (k = 1, 2,... ). Ukažte, že A k nejsou po dvou nezávislé. (b) Určete pravděpodobnost, že při n tazích bude právě k-krát tažena bílá. (c) Určete pravděpodobnost, že bílá bude poprvé tažena v k-tém tahu. 17. Hodíme modrou a zelenou kostkou. Uvažujme jevy A := [na modré je sudé číslo], B := [na zelené je liché číslo], C := [součet na obou kostkách je lichý]. Jsou tyto jevy nezávislé? Jsou po dvou nezávislé? 18. Třikrát po sobě hodíme mincí. Rub (R) i líc (L) mají pravděpodobnost 1/2. Uvažujme jevy A = RRR, LRR, RLL, LLL}, B = RRL, RLR, LLR, LLL}, C = RRL, RLR, LRL, LLL}. Ukažte, že A, B, C nejsou nezávislé, ale přitom platí Pr(A B C) = Pr(A) Pr(B) Pr(C). 19. Opakovaně házíme současně dvěma kostkami. Jaká je pravděpodobnost, že součet 5 padne dřív než součet 7? 20. Hráče A porazím s pravděpodobností p 1, hráče B s pravděpodobností p 2 ; p 1 > p 2. Hraji tři hry. Pokud se mi podaří vyhrát aspoň dvě za sebou, získám odměnu. Mám na výběr dvě strategie: 2
(I) hrát nejprve s A, pak s B, nakonec s A, (II) hrát nejprve s B, potom s A, pak s B. Která strategie je pro mě výhodnější? 21. Tyč délky l se náhodně rozláme na tři kusy. Jaká je pravděpodobnost, že z nich lze sestavit trojúhelník? 22. Náhodně zvolíme čísla x, y (0, 1). S jakou pravděpodobností je jejich součet menší než 1 a součin menší než 0.09? Úloha 3. Uvažujme pravděpodobnostní prostor (Ω, A, P ) = ([0, 1], B, λ), kde B je σ-algebra borelovských množin na intervalu [0, 1] a λ je Lebesgueova míra. Ukažte, že jevy jsou nezávislé. A n = [ 0, 1 2 n ) [ 2 2 n, 3 2 n ) [ 2 n 2 2 n, 2n 1 2 n ), n = 1, 2,... 4. Náhodné veličiny, diskretní rozdělení (17.3.2005) 23. Na měřitelném prostoru (Ω, A), kde Ω = 1, 2, 3, 4} a A =, 1, 2}, 3, 4}, Ω}, uvažujme funkce X a Y s hodnotami v R definované takto: X(1) = X(2) = 1, X(3) = X(4) = 2, Y (1) = Y (2) = Y (3) = 1, Y (4) = 2. Rozhodněte, zda jsou tyto funkce náhodnými veličinami. 24. Na pravděpodobnostním prostoru (Ω, A, P ), kde Ω = 1, 2}, A =, 1}, 2}, Ω} a P (1}) = P (2}) = 1/2, je definována náhodná veličina X. Dále uvažujme pravděpodobnostní prostor (Ω, A, P ), kde Ω = [0, 1], A = B([0, 1]) jsou borelovské množiny na [0, 1] a P = λ je Lebesgueova míra. Na (Ω, A, P ) jsou definovány veličiny Y, Z, V. Definice X, Y, Z, V jsou následující 0, ω = 1, X(ω) = 1, ω = 2, 0, ω [0, 1/4] [3/4, 1], Z(ω) = 1, ω (1/4, 3/4), 0, ω [0, 1/2], Y (ω) = 1, ω (1/2, 1], 0, ω [0, 1/2] \ 0.1}, V (ω) = 1, ω (1/2, 1] 0.1}. Rozmyslete si, že X, Y, Z, V mají všechny stejné rozdělení (alternativní s parametrem 1/2), ačkoli jsou jinak definované, dokonce i na různých pravděpodobnostních prostorech. 25. Nechť X má binomické rozdělení s parametry n, p, tj. p k = Pr[X = k] = ( n k) p k (1 p) n k, k = 0,..., n (p k = 0, k > n). Spočtěte vytvořují funkci pravděpodobností A(t) = k=0 p kt k = E t X a pomocí ní určete E X a var X. K témuž můžete využít i momentovou vytvořující funkci M(t) = E exptx}. 26. Pro p (n) k = ( n k) p k (n) (1 p (n) ) n k, k = 0,..., n ukažte, že lim n p(n) k = e jestliže p (n) 0 tak, že np (n) λ (0, ). λ λk, k = 0, 1,..., k! 27. Nechť X má Poissonovo rozdělení s parametrem λ, tj. p k = Pr[X = k] = e k!, k = 0, 1,... Spočtěte E X a var X (pomocí vytvořují funkce pravděpodobností, momentové vytvořující funkce nebo přímým výpočtem). 28. V kolejní síti je 923 počítačů, jeden z nich je váš a provozujete na něm FTP server. Každý počítač dá během hodiny na váš server požadavek s pravděpodobností 0.01. Spočtěte pravděpodobnost, že k vám během hodiny přijde požadavek (a) právě z 6, (b) nejvýše z 6 počítačů. Jednak počítejte tyto pravděpodobnosti přesně, tzn. v binomickém rozdělení, a jednak s použitím aproximace Poissonovým rozdělením. 29. Na server přijde za hodinu průměrně 60 požadavků. Jaká je pravděpodobnost, že po dobu 2 minut, kdy je server restartován, nepřijde žádný požadavek? 3 λ λk
30. Nechť veličina X má hypergeometrické rozdělení dané pravděpodobnostmi ( M )( N M ) p (N) k n k k = Pr[X = k] = ( N pro k = 0,..., n, n) kde parametry N, M, n splňují M N, 0 n min(m, N M). Nechť N a M, a to takovým způsobem, že M/N p pro nějaké p (0, 1). Naopak n a k nechť zůstávají pevná. Ukažte, že lim N p(n) k = ( ) n p k (1 p) n k, k = 0,..., n. k 31. S použitím některé vytvořující funkce nebo přímo spočítejte střední hodnotu a rozptyl veličiny s geometrickým rozdělením, tj. p k = Pr[X = k] = q k p, k = 0, 1,... (q = 1 p). Úloha 4. Na sledovaném úseku dálnice se denně stane průměrně 8 nehod. Jaká je pravděpodobnost, že se dnes stanou více než 4 nehody? 5. Diskretní a spojitá rozdělení (24.3.2005) 32. Dva hráči střídavě házejí na koš, první se trefí s pravděpodobností p 1, druhý s p 2. Hra končí, když se někdo trefí. Označme X 1 počet hodů prvního hráče během celé hry, X 2 totéž pro druhého. Určete Pr[X 1 = k], Pr[X 2 = k]. 33. Dokažte, že pro nezápornou veličinu X s diskretním rozdělením jsou následující tvrzení ekvivalentní: (i) X má geometrické rozdělení, (ii) Pr[X = k + n X k] = Pr[X = n] pro všechna k, n = 0, 1,... 34. Určete střední hodnotu a rozptyl náhodné veličiny s rovnoměrným rozdělením na intervalu [a, b]. 35. Nechť veličina X má spojité rozdělení s hustotou f(x) = cx 3 pro x 1, f(x) = 0 jinak. Určete konstantu c, distribuční funkci, střední hodnotu, rozptyl, Pr[0 < X < 2]. 36. Určete distribuční funkci, střední hodnotu a rozptyl veličiny s exponenciálním rozdělením s intensitou λ (tj. f(x) = λe λx 1 (0, ) (x)). (Momenty počítejte pomocí momentové vytvořující funkce M(t) nebo přímo.) 37. Dokažte, že pro nezápornou veličinu X se spojitým rozdělením jsou následující tvrzení ekvivalentní: (i) X má exponenciální rozdělení, (ii) Pr[T > s + t T > s] = Pr[T > t] pro všechna s, t 0. 38. Veličina X má Cauchyho rozdělení s hustotou 1 f(x) = π(1 + x 2 ), x R. Povšimněte si, že veličina nemá střední hodnotu. Ukažte, že Y = 1/X má opět Cauchyho rozdělení. Úloha 5. Nechť X N(0, 1), zaveďme veličinu Y = e X (tzn. Y má lognormální rozdělení). Určete její distribuční funkci, hustotu, střední hodnotu a median. 6. Náhodné veličiny a vektory (31.3.2005) 39. Nechť F je nějaká spojitá rostoucí distribuční funkce, F 1 její inverse. Mějme veličinu U R(0, 1). Ukažte, že veličina X = F 1 (U) má distribuční funkci F. (Poznámka: Tvrzení platí i bez předpokladu, že F je spojitá rostoucí. V tom případě je definováno F 1 (u) = infx : F (x) u}.) Uvědomte si význam pro simulace. Jak nasimulujete veličinu například s exponenciálním či Cauchyovým rozdělením, jestliže máte k disposici generátor (pseudo)náhodných čísel s rovnoměrným rozdělením? 4
40. Užitím Fubiniovy věty dokažte, že pro nezápornou náhodnou veličinu s konečnou střední hodnotou můžeme počítat E X = 0 Pr[X > t]dt. Použijte na výpočet střední hodnoty exponenciálního rozdělení. 41. Má-li veličina X střední hodnotu µ a rozptyl σ 2, pak Y = a + bx (b 0) má střední hodnotu a + bµ a rozptyl b 2 σ 2. Ukažte, že je-li rozdělení X normální, pak i Y je normální (tj. Y N(a + bµ, b 2 σ 2 )). Zejména platí (X µ)/σ N(0, 1). 42. Náhodný vektor (X, Y ) T má hustotu c, x 0, y 0, x + y 1, f(x, y) = 0 jinde (rovnoměrné rozdělení na uvedené množině). Najděte konstantu c, marginální hustoty X a Y, střední hodnoty, kovarianční a korelační matici. Rozhodněte, zda X a Y jsou nezávislé. 43. Pro veličinu X R(1, 2) určete cov(x, 1/X) a cor(x, 1/X) (a porovnejte jejich vypovídací hodnotu o vztahu veličin). 44. Nezávisle hodíme dvěma symetrickými mincemi. Pro každou minci zaznamenáme výsledek 1, když padne panna, 0, když padne orel. Označme S součet výsledků na obou mincích, R jejich rozdíl. Jaké je rozdělení vektoru (S, R) T? (Zapište tabulku pravděpodobností.) Jsou S a R nezávislé? Určete korelaci. Úloha 6. Hustota náhodného vektoru (X, Y, Z) T je cx 3 y 2 z pro 0 x 1, 0 y x, 0 z xy, f(x, y, z) = 0 jinde. Najděte konstantu c a hustotu podvektoru (X, Y ) T. Rozhodněte o nezávislosti X, Y, Z. 7. Náhodné vektory, konvoluce (7.4.2005) 45. Uvažujme dva náhodné vektory: (U, V ) T s rozdělením s hustotou a (X, Y ) T s hustotou g(u, v) = 1 2π exp 1 2 (u2 + v 2 )}, (u, v) R 2, h(x, y) = 2g(x, y) pro xy 0, 0 jinak. Určete marginální rozdělení U a V v rozdělení (U, V ) T a totéž pro X a Y v rozdělení (X, Y ) T. Povšimněte si, že sdružené rozdělení není marginálními rozděleními určeno. 46. Nechť veličiny X 1,..., X n jsou nezávislé stejně rozdělené s distribuční funkcí F a hustotou f. Označme U = minx 1,..., X n }, V = maxx 1,..., X n }. Najděte rozdělení (distribuční funkci, hustotu) veličin U a V. Určete E U a E V pro případ, že X 1,..., X n mají rozdělení R(0, 1). 47. Pro nezávislé veličiny X Exp(λ 1 ) a Y Exp(λ 2 ) (i) určete rozdělení Z = min(x, Y ), (ii) spočtěte Pr[X < Y ]. 48. Určete rozdělení S = X + Y, jestliže X Po(λ 1 ), Y Po(λ 2 ) a X, Y jsou nezávislé. 49. Najděte rozdělení součtu veličin U 1, U 2, jestliže tyto jsou nezávislé a (a) U 1 R(0, 1), U 2 R(0, 1), (b) U 1 R(0, 1), U 2 R(0, 2). Určete střední hodnotu a rozptyl U 1 + U 2. 5
50. Krajta průměrně naklade λ = 40 vajec (počet vajec N Po(λ)). Z každého se vylíhne krajta s pravděpodobností p = 0.6. Určete rozdělení počtu nových krajt a střední počet nových krajt. Úloha 7. Nechť náhodný vektor (X, Y ) T má rovnoměrné rozdělení na trojúhelníku jako v příkladu 42. Určete rozdělení X + Y. (Pozor: Veličiny X, Y nejsou nezávislé, při počítání hustoty součtu je potřeba použít sdruženou hustotu vektoru.) 8. Borel Cantelliho lemma, zákony velkých čísel (14.4.2005) 51. Pro nekonečnou posloupnost nezávislých hodů kostkou určete (a) Pr[nekonečně krát padne šestka], (b) Pr[nekonečně krát padne 1000 šestek za sebou]. 52. Nechť X n, n 1 jsou nezávislé veličiny s Pr[X n = n λ ] = Pr[X n = n λ ] = 1 2 (kde λ < 1 2 je konstanta). Dokažte, že pro posloupnost X n, n 1} platí silný zákon velkých čísel. 53. Nechť X n, n 1} je posloupnost nezávislých stejně rozdělených veličin s konečným rozptylem. Uvažujme posloupnost Y n, n 1} s Y n = n 1/3 X n. Platí pro ni SZVČ? 54. Veličiny X 1, X 2,... nechť jsou nezávislé s rozdělením daným pravděpodobnostmi Pr[X n = 1] = Pr[X n = 1] = 1 2 1 2 n+1, Pr[X n = 2 n ] = Pr[X n = 2 n ] = 1 2 n+1. Dokažte, že pro posloupnost X n } platí silný zákon velkých čísel. 55. Nechť X 1, X 2,... jsou nezávislé veličiny s rozdělením R(1, 2). Dokažte, že 1 n n k=1 a s.j. kx k 3a/2, jestliže platí 1 n n k=1 a kx k a < a k=1 a2 k /k2 <. Krátká písemka. (Varianta A) Pro čtverec s náhodnou délkou strany X R(0, 3) najděte rozdělení (distribuční funkci a hustotu) jeho obvodu a obsahu. (Varianta B) Pro X R(0, 1) určete cov(x, X 2 ). Úloha 8. Jestliže X n značí euklidovskou vzdálenost dvou náhodně umístěných bodů v n-rozměrné krychli jednotkové krychli. Ukažte, že X n / n 1/ 6 s.j. 9. Zákony velkých čísel, centrální limitní věta (21.4.2005) 56. Nechť X k, k 1} jsou nezávislé s hustotami f k (x) = 1 2 k λ exp k λ x } pro x R, k = 1, 2,... ; λ < 1 2. Ukažte, že X n = 1 n n k=1 X k konverguje k 0 skoro jistě. 57. Životnost součástky má exponenciální rozdělení s intensitou 1/10. Pomocí centrální limitní věty řešte následující. (a) Máme 100 součástek. Jakmile se jedna porouchá, nahradíme ji další. Jaká je pravděpodobnost, že celková životnost bude mezi 900 a 1050 hodinami? (b) Kolik máme koupit součástek, aby nám celkově vydržely aspoň 600 hodin s pravděpodobností aspoň 95 %? 58. Na server má přístup 100 uživatelů. Z dřívějších zkušeností víme, že uživatel má na serveru průměrně µ = 120 MB dat, směrodatná odchylka množství dat je σ = 30 MB. Jak velký diskový prostor potřebujeme, aby s pravděpodobností 99 % nedošlo k jeho přeplnění? (Užijte CLV.) 59. Pojišťovna má 1000 pojištěnců stejného věku. Každý z nich během roku zemře s pravděpodobností 0.01. Roční pojistné každého z nich je 1200 Kč. V případě smrti pojišťovna vyplatí 80 000 Kč. Určete (s využitím CLV) přibližnou pravděpodobnost, že pojišťovna utrpí ztrátu. 60. Generováním náhodných čísel odhadneme π. Nechť (X 1, Y 1 ),..., (X n, Y n ) jsou nezávislé vektory s nezávislými složkami s rovnoměrným rozdělením na [0, 1]. Označme U i = 1 [X 2 i +Yi 2 1], tedy U i je rovno 1 právě tehdy, když (X i, Y i ) leží ve čtvrtkruhu se středem 0 a poloměrem 1, jinak je U i rovno 0. Podle silného zákona velkých čísel Ūn = 1 n n i=1 U s.j. i E U 1 = Pr[U 1 = 1] = π/4. Tudíž n číslo π odhadneme hodnotou ˆπ n = 4Ūn. Určete přibližně (použitím CLV) Pr[3.1 ˆπ 1000 3.2]. 6
Úloha 9. Označme ν n poměrnou četnost líců v n hodech symetrickou mincí. Kolik musíme provést hodů, aby ν n 1 2 0.05 s pravděpodobností alespoň 0.95? Řešte pomocí (a) Čebyševovy nerovnosti, (b) centrální limitní věty. 10. Centrální limitní věta, bodové odhady parametrů (28.4.2005) 61. (Pokračování příkladu 60.) Určete n tak, aby ˆπ n π 0.01 s pravděpodobností alespoň 0.9. Použijte jednak Čebyševovu nerovnost a jednak CLV. 62. Ukažte, že pro prosloupnost X 1, X 2,... nezávislých veličin, jež mají rozdělení Pr[X k = k λ ] = Pr[X k = k λ ] = 1/2 (kde λ > 0 je nějaká konstanta), platí centrální limitní věta. 63. Je-li X 1,..., X n výběr z Poissonova rozdělení s parametrem λ, najděte maximálně věrohodný odhad ˆλ tohoto parametru a zdůvodněte jeho nestrannost a konsistenci. Spočtěte Fisherovu informaci pro parametr λ, spočtěte rozptyl ˆλ a ukažte, že odhad ˆλ je eficientní (jeho rozptyl dosahuje Rao Cramérovy dolní meze). Dále si povšimněte, že λ = Sn 2 = 1 n n 1 k=1 (X k X n ) 2 je rovněž nestranným a konsistentním odhadem λ. 64. Pro X 1,..., X n výběr z Po(λ) ukažte, že ˆp 0 = (1 1 n )n X n je nestranným a konsistentním odhadem p 0 = Pr[X = 0] = e λ. 65. Pro X 1,..., X n výběr z Po(λ) ukažte, že ( X n ) 2 není nestranným odhadem λ 2. 66. Ukažte, že nemůže být současně T nestranným odhadem θ a T 2 nestranným odhadem θ 2. Přesněji: Jestliže E T = θ a E T 2 = θ 2, pak T je roven konstantě skoro jistě. Úloha 10. Nechť X 1, X 2,... je posloupnost nezávislých veličin, pro něž Pr[X k = log k] = Pr[X k = log k] = 1/2. Ukažte, že pro tuto posloupnost platí CLV. Zapište explicitně tvrzení CLV pro tento případ. 11. Bodové odhady parametrů (5.5.2005) 67. Ukažte, že pro výběr o rozsahu n z alternativního rozdělení s parametrem p (0, 1) neexistuje nestranný odhad parametrické funkce 1/p. 68. Uvažujme výběr X 1,..., X n z rozdělení s hustotou f(x; θ) = 3θ 3 x 4 1 (θ, ) (x), x R. (Povšimněte si, že nosič rozdělení závisí na parametru a nejsou tedy splněny předpoklady Rao Cramérovy věty.) (i) Najděte maximálně věrohodný odhad ˆθ parametru θ. (ii) Ukažte, že θ = 3n 1 3n minx 1,..., X n } je nestranný odhad θ. (iii) Ověřte, že θ = 2 X 3 n je nestranný odhad θ. (iv) Najděte rozptyl θ a θ a porovnejte rychlost konvergence rozptylů k 0 při n. 69. Najděte nestranné odhady parametrických funkcí e 2λ a e 3λ, máme-li k disposici výběr o rozsahu 1 z Poissonova rozdělení s parametrem λ > 0. Všimněte si podivnosti těchto odhadů: srovnejte hodnoty, kterých tyto odhady mohou nabývat, s hodnotami, které odhadují. Úloha 11. Je-li X 1,..., X n výběr z exponenciálního rozdělení s intensitou λ (s hustotou f(x; λ) = λe λx 1 (0, ) (x)), odhadněte λ metodou maximální věrohodnosti. Ukažte, že získaný odhad ˆλ není nestranný (s využitím rozvoje v geometrickou řadu ukažte, že E λ ˆλ > λ). 12. Bodové a intervalové odhady (12.5.2005) 70. Mějme výběr o rozsahu n z normálního rozdělení N(µ 0, σ 2 ), kde µ 0 R je známá hodnota a σ 2 > 0 neznámý parametr. Nalezněte metodou maximální věrohodnosti odhad σ 2 parametru σ 2. Vyšetřete nestrannost a konsistenci. Je σ 2 nejlepším nestranným odhadem σ 2? (Spočtěte rozptyl tohoto odhadu a Rao Cramérovu dolní mez pro rozptyl nestranného odhadu.) 71. Najděte maximálně věrohodný odhad ˆp parametru p pro výběr X 1,..., X n z Ge(p). Ukažte, že není nestranný (s využitím rozvoje v geometrickou řadu ukažte, že E p ˆp > p). 7
72. Hmotnost výrobku má normální rozdělení s neznámou střední hodnotou a s rozptylem σ 2 = 16 g 2. Bylo zváženo 6 výrobků s výsledky 105, 95, 100, 99, 93, 101 (v gramech). Najděte oboustranný a dolní intervalový odhad střední hmotnosti výrobku o spolehlivosti 95 %. Úloha 12. Uvažujte výběr X 1,..., X n z normálního rozdělení N(µ 0, σ 2 ), kde µ 0 je známé, σ 2 > 0 neznámé. Najděte intervalový odhad rozptylu σ 2 o spolehlivosti 1 α. (Nejprve si uvědomte, jaké je rozdělení vhodně standardisovaného bodového odhadu rozptylu σ 2 = 1 n n i=1 (X i µ 0 ) 2. Pozor na stupně volnosti, střední hodnota je známá.) 13. Intervalové odhady, Neyman Pearsonovo lemma (19.5.2005) 73. Předpokládejme, že spotřeba elektrické energie stroje má normální rozdělení, jehož střední hodnotu ani rozptyl neznáme. Sledovali jsme spotřebu 12 strojů. Průměr naměřených hodnot byl 14.31 kw, výběrový rozptyl 0.33 (kw) 2. Najděte oboustranný a horní intervalový odhad střední spotřeby o spolehlivosti 95 %. Dále najděte oboustranný interval o spolehlivosti 95 % pro rozptyl spotřeby. 74. Máme-li výběr X 1,..., X n z rozdělení s neznámou distribuční funkcí F, můžeme ji odhadnou pomocí empirické distribuční funkce ˆF n (x) = 1 n n i=1 1[X i x], x R. Zvolme pevné x 0 R. Najděte na základě centrální limitní věty intervalový odhad hodnoty F (x 0 ) o přibližné (asymptotické) spolehlivosti 1 α. 75. Uvažujme výběr o rozsahu n z alternativního rozdělení s neznámým parametrem p (0, 1). Podle Neyman Pearsonova lemmatu sestrojte test (najděte jeho kritický obor) hypotesy H 0 : p = p 0 proti alternativě H 1 : p = p 1, který je mezi všemi testy s hladinou nejvýše α nejsilnější. (Hodnoty p 0, p 1 jsou známé, předem dané, a splňují p 0 < p 1.) Lze v tomto případě vždy nalézt test, který má hladinu přesně α? Úloha 13. Je-li X 1,..., X n výběr z exponenciálního rozdělení s intensitou λ > 0 (s hustotou f(x; λ) = λe λx 1 (0, ) (x)), sestavte na základě Neyman Pearsonova lemmatu test nulové hypotesy H 0 : λ = λ 0 proti alternativě H 1 : λ = λ 1. (λ 0 < λ 1 jsou známé konstanty.) 14. Testování hypotes (26.5.2005) 76. Máme podezření, že nás v hospodě okrádají. Proto koupíme 8 piv a změříme jejich objem: 0.51, 0.462, 0.491, 0.466, 0.461, 0.503, 0.495, 0.488 (v litrech). Prokazují naše data, že hostinský je nepoctivý? Zformulujte hypotesu a alternativu, doplňte předpoklady a testujte na hladině α = 5 %. 77. Přesnost stroje je charakterisována rozptylem délky vyrobených předmětů. Stroj je špatně seřízen, pokud délka výrobku má rozptyl větší než 400 (µm) 2. Vybereme náhodně 15 výrobků, výběrový rozptyl jejich délek je 680 (µm) 2. Je třeba stroj seřídit? Zformulujte hypotesu a alternativu, doplňte předpoklady a testujte na hladině 0.1, 0.01. 78. Ve dvou městech byla měřena tvrdost vody. V místě A bylo analysováno 40 vzorků, průměrná tvrdost vyšla 4.0 s výběrovým rozptylem 0.25. Ve městě B bylo zkoumáno 50 vzorků, průměr naměřených hodnot zde byl 3.8, výběrový rozptyl 0.24. Liší se tvrdost v těchto dvou městech? Zformulujte hypotesu a alternativu, doplňte předpoklady a testujte na hladině 0.05. 79. Firma provedla test znalostí angličtiny u vých sedmi zaměstnanců. Poté jim zaplatila jazykový kurs a po něm opět otestovala jejich znalosti. Počty bodů získané jednotlivými zaměstnanci před a po kursu zachycuje tabulka: Zaměstnanec 1 2 3 4 5 6 7 Před kursem 175 133 143 133 132 105 101 Po kursu 172 133 147 135 133 113 109 Došlo k významnému zlepšení? Zformulujte hypotesu a alternativu, doplňte předpoklady a testujte na hladině 0.05 a 0.1. 8
80. Před francouzským referendem o euroústavě (29.5.2005) nechal list Le Figaro 20. a 21. května provést průzkum 1 veřejného mínění. Z 950 dotázaných se 53 % vyslovilo proti euroústavě. Prokazují výsledky, že většína je proti? Zformulujte hypotesu a alternativu, doplňte předpoklady a testujte na asymptotické hladině 0.05 (s využitím CLV). Úloha 14. Dva stroje vyrábějí výrobky s rozměry s chybami s normálním rozdělením. Výběrový rozptyl určený na vzorku 9 výrobků stroje 1 je 5.9. Výběrový rozptyl ve vzorku 11 výrobků stroje 2 je 23.3. Jsou stroje stejně přesné? Zformulujte hypotesu a alternativu, doplňte předpoklady a testujte na hladině 10 %. Reference Dupač, V. & Hušková, M. (1999). Pravděpodobnost a matematická statistika. Karolinum, Praha. Potocký, R., Kalas, J., Komorník, J. & Lamoš, F. (1986). Zbierka úloh z pravdepodobnosti a matematickej štatistiky. SNTL/Alfa, Praha/Bratislava. Romano, J. P. & Siegel, A. F. (1986). Counterexamples in probability and statistics. Wadsworth & Brooks, Monterey. Zvára, K. & Štěpán, J. (2002). Pravděpodobnost a matematická statistika. Matfyzpress, Praha. 1 http://www.lefigaro.fr/cgi/perm/diaporama/diapo?offs=0&cle=20050524.fig0334 9