Příklady k procvičení z Matematické statistiky Poslední úprava. listopadu 207. Konvergence posloupnosti náhodných veličin. Necht X, X 2... jsou nezávislé veličiny s rovnoměrným rozdělením na [0, ]. Definujme Y n = min{x,..., }. Ukažte, že pro n platí (a) Y n D 0, (b) Y n P 0. 2. Necht X je nějaká náhodná veličina a = X( + /n). Ukažte, že P X. 3. Necht X N(0, ) a = ( ) n X. Ukažte, že D X ale neplatí P X. 4. Necht jsou nezávislé náhodné veličiny a necht má alternativní rozdělení Alt(/n), tj. P( = ) = /n a P( = 0) = /n. Ukažte, že X P s.j. n 0, ale neplatí 0. 5. Necht má exponenciální rozdělení se střední hodnotou /n. Ukažte, že P 0. 6. Necht { } je posloupnost náhodných veličin takových, že má geometrické rozdělení s parametrem λ/n. Definujme Y n = /n. Vyšetřete konvergenci v distribuci veličin {Y n } pro n. 7. Uvažujte posloupnost náhodných veličin { }, kde má distribuční funkci F n (x) = Vyšetřete konvergenci v distribuci veličin { }. { ( n) nx, x 0, 0 x < 0. 8. Uvažujte posloupnost náhodných veličin Bi(n, λ/n). Vyšetřete konvergenci v distribuci posloupnosti { } pro n. 9. Necht má distribuční funkci a F n (x) = 0 pro x <. F n (x) = en(x ), x, + en(x ) (a) Vyšetřete konvergenci v distribuci { }. (b) Vyšetřete konvergenci v pravděpodobnosti { }. 0. Nech X, X 2,... tvoria náhodný výber z rozdelenia N(0, ). Vyšetrite konvergenciu postupnosti { } v zmysle (a) skoro iste, (b) v pravdepodobnosti, (c) v distribúcii.
(( ) ( )) 0 0. Nech (X, X 2 ) T je náhodný vektor s rozdelením N 2,. 0 0 (a) Nájdite rozdelenie náhodného vektoru (X, X ) T. (b) Ukážte, že obe marginálne rozdelenia vektorov (X, X 2 ) T a (X, X ) T sú identické. (c) Z výsledkov v častiach (a) a (b) usúd te, že z konvergencie Y n D Y a Z n D Z neplynie (Y n, Z n ) T D (Y, Z) T. (d) Môžeme povedat niečo viac ak v časti (c) navyše predpokladáme nezávislost náhodných veličín Y n a Z n pre každé n? 2. Necht pro každé n N je náhodná veličina s normálním rozdělením N(µ, σ 2 n), kde σ n > 0. Dále předpokládejte, že σ n σ. (a) Dokažte, že pokud σ > 0, potom D N(µ, σ 2 ). (b) Dokažte, že pokud σ = 0, potom D δ µ, kde δ µ je Diracova míra v bodě µ. 2 Vlastnosti a asymptotické rozdělení odhadů 3. Necht X,..., je náhodný výběr z Poissonova rozdělení Po(λ), λ > 0. Podrobně dokažte, že ( ( n lim P Xn λ ) ) u α/2 u α/2 = α, n Xn kde = n i= X i a u β je β-kvantil normovaného normálního rozdělení. 4. Necht X,..., je náhodný výběr z geometrického rozdělení, tj. P(X = k) = p ( p) k, k = 0,, 2,... (a) Najděte odhad T n parametru p metodou maximální věrohodnosti. Prověřte jeho konzistenci a odvod te asymptotické rozdělení. Umíte rozhodnout i o nestrannosti? (b) Rozhodněte, zda U n = I{ = 0} je nestranný a konzistentní odhad parametru p. (c) Rozhodněte, zda V n = n n i= I{X i = 0} je nestranný a konzistentní odhad parametru p. (d) Jaké je přesné rozdělení nv n? Jaké je asymptotické rozdělení V n? n + (e) Rozhodněte, zda W n = n + i= X je konzistentní odhad parametru p. i 5. Necht X,..., je náhodný výběr z alternativního rozdělení s parametrem p (0, ). (a) Uvažujte odhad rozptylu Var X = p( p) ve tvaru U n = ( ). Vyšetřete jeho nestrannost, konzistenci a odvod te asymptotické rozdělení. (b) Rozhodněte, zda je odhad V n = X ( ) nestranný a konzistentní odhad parametru p( p). (c) Uvažujte výběrový rozptyl S 2 n. Rozepište si, jak se S 2 n liší od U n pro tento případ alternativního rozdělení. 2
6. Necht X je diskrétní náhodná veličina s useknutým Poissonovým rozdělením, tj. λ k e λ P(X = k) =, k =, 2, 3,... e λ k! (a) Dokažte, že T (X) = + ( ) X je nestranný odhad parametru θ X = e λ. (b) Dokažte, že T (X) = + ( ) X je jediný nestranný odhad parametru θ X = e λ. (c) Zamyslete se nad užitečností tohoto odhadu. 7. Necht X,..., je náhodný výběr z binomického rozdělení Bi(m, p), p (0, ). (a) Ukažte, že p n = n n m i= X i je nestranný odhad parametru p. (b) Ukažte, že neexistuje nestranný odhad parametru θ X =. p( p) 8. Necht X,..., je náhodný výběr z Poissonova rozdělení Po(λ), λ > 0. Uvažujte parametr θ X = P(X = 0) = e λ. (a) Rozhodněte, zda je odhad θ n = e Xn nestranný a konzistentní odhad parametru θ X. Pokud není nestranný, spočítejte jeho vychýlení. (b) Rozhodněte, zda je odhad θ n = n i= I{X i = 0} nestranný a konzistentní odhad parametru θ X. Pokud není nestranný, spočítejte jeho vychýlení. (c) Porovnejte odhady θ n a θ n na základě jejich středních čtvercových chyb. (d) Porovnejte odhady θ n a θ n na základě jejich asymptotických rozptylů. 9. Mějme náhodný výběr X,..., z exponenciálního rozdělení Exp(λ), λ > 0. (a) Rozhodněte, zda λ n = n i= X i je nestranný a konzistentní odhad parametru λ. (b) Rozhodněte, zda θ n = n i= X i je nestranný a konzistentní odhad parametru θ X = λ. 20. Mějme náhodný výběr X,..., z rovnoměrného rozdělení na [0, θ], kde θ > 0. Uvažujte odhad θ ve tvaru T n = max i n X i. Najděte asymptotické rozdělení n(t n θ). Návod: Konvergenci v distribuci vyšetřujte na základě její definice. 2. Mějme náhodný výběr X,..., z rozdělení { λ e λ(x δ), x (δ, ), f X (x) = 0, jinak, kde δ R je neznámý parametr a λ > 0 je známá konstanta. (a) Rozhodněte, zda δ n = min i n X i je nestranný a konzistentní odhad parametru δ. Pokud není, spočtěte jeho vychýlení. (b) Spočtěte střední čtvercovou chybu odhadu δ n. (c) Rozhodněte, zda odhad δ n = max i n X i je konzistentní odhad parametru δ. (d) Rozhodněte, zda odhad = n i= X i je nestranný a konzistentní odhad parametru δ. 22. Necht X,..., je náhodný výběr z rovnoměrného rozdělení R(a, b) s hustotou f(x) = b, a b < x < a + b, 2 2 0, jinak, 3
kde a < b. Označme X () = min i n X i a X (n) = max i n X i. (a) Rozhodněte, zda â n = X ()+X (n) 2 je nestranný a konzistentní odhad parametru a. Pokud není, spočtěte jeho vychýlení. (b) Spočtěte střední čtvercovou chybu odhadu â n. (c) Rozhodněte, zda b n = X (n) X () je nestranný a konzistentní odhad parametru b. Pokud není, spočtěte jeho vychýlení. (d) Spočtěte střední čtvercovou chybu odhadu b n. Návod. Uvědomte si, že náhodný výběr X,..., můžeme vyrobit pomocí lineární transformace jako X i = a+b ( Y i 2), i =,..., n, kde Y,..., Y n je náhodný výběr z rovnoměrného rozdělení R(0, ). Sdružená hustota náhodného vektoru (Y (), Y (n) ) pak je f (Y(),Y (n) )(y, y 2 ) = n(n )(y 2 y ) n 2 I { 0 < y < y 2 < }. 23. Necht (X, Y ) T,..., (, Y n ) T je náhodný výběr z dvourozměrného rozdělení s regulární varianční maticí. Dokažte, že odhad i= ρ n = (X i ) (Y i Y n ) n i= (X i ) 2 n i= (Y i Y n ) 2 je konzistentním odhadem korelačního koeficientu ρ = Cov (X,Y ). Var (X ) Var (Y ) 3 Intervalové odhady 24. Necht X,..., je náhodný výběr z alternativního rozdělení s parametrem p (0, ). (a) Najděte asymptotické rozdělení a pomocí tohoto rozdělení sestavte oboustranný (a pravostranný) interval spolehlivosti pro p. (b) Najděte asymptotické rozdělení arcsin ( Xn ) a pomocí tohoto rozdělení sestavte oboustranný (a levostranný) interval spolehlivosti pro p. 25. Mějme náhodný výběr X,..., z exponenciálního rozdělení s hustotou { λ e λx, x (0, ), f X (x) = 0, jinak, kde λ > 0. (a) Najděte asymptotické rozdělení výběrového průměru a pomocí něj zkonstruujte intervalový odhad pro parametr λ. (b) Najděte asymptotické rozdělení odhadu parametru λ daného předpisem λ n = a pomocí tohoto rozdělení sestavte intervalový odhad pro parametr λ. (c) Najděte transformaci, která stabilizuje asymptotický rozptyl náhodné veličiny a pomocí této transformace sestavte intervalový odhad pro parametr λ. 26. Necht X,..., je náhodný výběr z geometrického rozdělení, tj. P(X = k) = p ( p) k, k = 0,, 2,... 4
(a) Najděte asymptotické rozdělení odhadu p n = a na základě tohoto rozdělení odvod te klasický asymptotický interval spolehlivosti pro p. + (b) Najděte asymptotické rozdělení odhadu p n = n n i= I{X i = 0} a na základě tohoto rozdělení odvod te klasický asymptotický interval spolehlivosti pro p. (c) Porovnejte intervaly z (a) a (b). Který vám příjde vhodnější? 27. Necht X,..., je náhodný výběr z exponenciálního rozdělení s parametrem λ X > 0 a Y,..., Y n je náhodný výběr z exponenciálního rozdělení s parametrem λ Y > 0. Předpokládejte, že oba náhodné výběry jsou na sobě nezávislé. (a) S využitím asymptotického rozdělení Y n sestavte oboustranný intervalový odhad pro λ X λ Y. (b) Najděte asymptotické rozdělení náhodné veličiny log ( Y n ) a využijte této znalosti ke konstrukci oboustranného intervalového odhadu pro λ X λ Y. 28. Necht (X, Y ) T,..., (, Y n ) T je náhodný výběr z dvourozměrného normálního rozdělení s regulární varianční maticí a korelačním koeficientem ρ. Označme ρ n = n i= (X i ) (Y i Y n ) i= (X i ) 2 i= (Y i Y n ) 2 odhad korelačního koeficientu. Potom se dá pomocí -metody dokázat, že n ( ρn ρ ) D N ( 0, ( ρ 2 ) 2). (a) Pro parametr ρ sestavte klasický asymptotický intervalový odhad. (b) Pro parametr ρ nalezněte spolehlivostní množinu B n. (c) Najděte transformaci, která stabilizuje asymptotický rozptyl odhadu korelačního koeficientu ρ n a pomocí této transformace sestavte intervalový odhad pro parametr ρ. 29. Mějme náhodný výběr X,..., z rozdělení s hustotou { λ e λ(x δ), x (δ, ), f X (x) = 0, jinak, kde δ R je neznámý parametr a λ > 0 je známá konstanta. (a) Ověřte, že Z n = min i n X i δ je pivotální statistika. (b) Pomocí Z n najděte oboustranný intervalový odhad pro parametr δ. 4 Empirické odhady 30. Necht X,..., je náhodný výběr z exponenciálního rozdělení Exp(λ), λ > 0. Naším cílem je odhadnout hodnotu distribuční funkce v nějakém daném bodě y, tj. θ X = e λ y. Uvažujte 5
následující dva odhady θ n = n n i= I{X i y} θn = e λ n y, kde λn =. Který z odhadů se Vám zda vhodnější a proč? 3. V následující tabulce jsou zachyceny porodní hmotnosti chlapců (narozených v daném roce v daném regionu). Hmotnost [kg] (.5, 2.0] (2.0, 2.5] (2.5, 3.0] (3.0, 3.5] (3.5, 4.0] (4.0, 4.5] (4.5, 5.0] (5.0, 5.5] Počet 4 0 769 904 65 369 37 3 4 838 (a) Bodově i intervalově odhadněte o kolik je větší pravděpodobnost, že se narodí chlapec s hmotností do 4 kg (včetně) než pravděpodobnost že se narodí chlapec s hmotností do 3 kg (včetně). (b) Bodově i intervalově odhadněte, kolikrát je větší pravděpodobnost, že se narodí chlapec s hmotností do 4 kg (včetně) než pravděpodobnost že se narodí chlapec s hmotností do 3 kg (včetně). (c) Bodově i intervalově odhadněte, o kolik je větší pravděpodobnost, že se narodí chlapec s hmotností do 3 kg (včetně) než pravděpodobnost že se narodí chlapec s hmotností větší než 4 kg. (d) Bodově i intervalově odhadněte, kolikrát je větší pravděpodobnost, že se narodí chlapec s hmotností do 3 kg (včetně) než pravděpodobnost že se narodí chlapec s hmotností větší než 4 kg. 32. Necht X,..., je náhodný výběr. (a) Najděte asymptotické rozdělení třetího centrálního momentu µ 3 = n i= (X i ) 3. (b) Na základě znalosti z (a) sestavte intervalový odhad pro µ 3. (c) Najděte asymptotické rozdělení třetího centrálního momentu µ 3 za předpokladu, že X i má normální rozdělení N(µ, σ 2 ). Návod. Všimněte si, že v (a) můžete bez újmy na obecnosti předpokládat, že EX = 0. 33. Necht X,..., je náhodný výběr z normálního rozdělení N(µ, σ 2 ). (a) Najděte asymptotické rozdělení empirického odhadu šikmosti γ 3 = n i= (X i ) 3 ( n i= (X i ) 2 ) 3/2. (b) Zkuste promyslet, jak by se informace z (a) dala využít k testování normality (tj. testování, že náhodný výběr pochází z normálního rozdělení). Návod. Všimněte si, že v (a) můžete bez újmy na obecnosti předpokládat, že µ = 0 a σ 2 =. 34. Necht X,..., je náhodný výběr z rozdělení se spojitou distribuční funkcí F X. Necht u X (β) je β-kvantilem rozdělení F X a û n (α) je empirický (výběrový) α-kvantil. (a) Pro α = 0.25, β = 0.30 a n = 00 spočtěte (přibližně) pravděpodobnost P ( û n (α) > u X (β) ). (b) Jaká bude pravděpodobnost z (a) pro n = 000? 6
35. Necht X,..., je náhodný výběr z rozdělení se spojitou distribuční funkcí F X. Označme m medián rozdělení F X. Najděte největší možné přirozené číslo k a nejmenší možné přirozené číslo k 2 takové, že P ( X (k ) > m ) α 2, P( X (k2 ) < m ) α 2. Ukažte, že ( X (k ), X (k2 )) je intervalový odhad pro m se spolehlivostí alespoň α. 7