0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti pro rozptyl σ 2 Interval spolehlivosti pro rozptyl určíme ze statistiky T = (n ) S2 X σ 2, má rozdělení χ 2 (n ), kde n = 6 je rozsah výběru a SX 2 je výběrový rozptyl Oboustranný symetrický α = 95% interval spolehlivosti pro realizaci t veličiny T je Po úpravě máme q χ 2 (n ) ( α 2 ) Realizace výběrového průměru a rozptylu jsou a příslušné kvantily jsou Po dosazení dostáváme hledaný interval (n ) s2 x σ 2 q χ 2 (n ) ( α 2 ) (n ) s ( 2 x q χ 2 (n ) α ) σ 2 2 (n ) s ( 2 x ) α q χ 2 (n ) 2 x = 6 x i = 457 = 767 6 6 ( 6 ) s 2 x = x 2 i 5 6 (x)2 = 34787 = 68358 5 2664 = 34787 283 q χ 2 (5)(0025) = 083 q χ 2 (5)(0975) = 283 σ 2 34787 083 = 4296 02 (intervalový odhad pro rozptyl) Deset opakovaných měření obsahu alkoholu ve vzorku krve má průměrnou hodnotu x = 05 promile (alkoholu v krvi) a směrodatnou odchylku s x = 00 promile (alkoholu v krvi) Jakou hodnotu σ 0 překročí chyba metody (tj směrodatná odchylka) s pravděpodobností nejvýše α = %? Uved te použité předpoklady U veličiny Y = naměřený obsah alkoholu v krvi (v promilích) budeme předpokládat normální rozdělení N(µ, σ 2 ) Naše veličina X = chyba měření obsahu alkoholu v krvi (v promilích) bude tedy určena jako X = Y µ s rozdělením N(0, σ 2 ) Jednotlivá měření považujeme za nezávislá Hledáme horní α = 99% intervalový odhad pro parametr rozptylu σ 2, který bude tvaru (0, σ 2 0 Pro statistiku T = (n ) S2 X σ 2
s χ 2 -rozdělením s n = 9 stupni volnosti máme, že dolní α = 99% interval spolehlivosti pro realizaci t veličiny T je: takže a hledaná hranice tak je q χ 2 (n ) (α) t = (n ) s2 x σ 2 σ 2 n σ 0 = s x q χ 2 (n ) (α) = 00 (n ) s2 x q χ 2 (n ) (α) =: σ2 0 9 003 = q χ 2 (9) (00) = 002076 20879 03 (metoda momentů a max věrohodnosti - diskrétní rozdělení) Odhadněte parametr w (0, ) veličiny X s geometrickým rozdělením p X (i; w) = w i ( w), i N 0 na základě realizace s následujícími četnostmi výsledků: hodnota i 0 2 3 pozorovaná četnost n i 20 0 7 3 Použijte metodu momentů i metodu maximální věrohodnosti Součet pravděpodobností všech hodnot je Hledáme hodnotu w, která maximalizuje funkci věrohodnosti n 3 L(w) = P (X = x,, X n = x n; w) = P (X j = x j ; w) = p X (i; w) n i = }{{} j= i=0 p X (x j ; w) ( ) 20 ( ) 0 ( ) 7 ( ) 3 = w w( w) w 2 ( w) w 3 ( w) = w 33 ( w) 40 kde X j jsou jednotlivé nezávislé veličiny (odpovídající jednotlivým pokusům) a x j naměřené hodnoty Funkce L je nezáporná a spojitá na uzavřené množině 0,, takže zde nabývá maxima To nemůže být v krajních bodech (tam je funkce nulová) a proto je nabyto uvnitř dané množiny To tedy odpovídá hledání maxima funkce l(w) = ln ( L(w) ) = 33 ln (w) + 40 ln ( w) na otevřeném intervalu (0, ) Protože maximum existuje, musí pro něj platit neboli což vyhovuje zadání Metoda momentů: 0 = l (q) = 33 w 40 w w = 33 = 045205 73 Porovnáváme teoretické k-té momenty E(X k ) s jejich odhady m k = n n xk i pro prvních několik k =, 2, Střední hodnota je E(X) = iw i ( w) = iw i iw i+ = iw i (i )w i = i=0 i=2 Page 2
a její odhad z realizace je x = i n i = n i Porovnáním dostaneme což dává opět řešení jako v předchozí metodě = w + (i i + )w i = w i = w w i = w w i=2 33 (0 20 + 0 + 2 7 + 3 3) = 20 + 0 + 7 + 3 40 w 33 = E(X) = x = w 40 w = 33 = 045205 73 Jak je snadno vidět, v případě geometrického rozdělení dostáváme pro jeho parametr w vždy stejné výsledky pro obě metody 04 (metoda momentů a max věrohodnosti - diskrétní rozdělení) Náhodná veličina X nabývá hodnot s pravděpodobnostmi dle tabulky, kde c, q jsou reálné parametry rozdělení Z četností hodnot v náhodném výběru, uvedených v tabulce, odhadněte parametry c a q hodnota i 2 3 pravděpodobnost p X (i; c, q) c q c c + q četnost n i 8 0 5 Protože součet pravděpodobností všech hodnot je, musí být = (c q) + c + (c + q) = 3c tedy c = 3 Současně musí být pravděpodobnosti nezáporné, tj 0 c q = 3 q a 0 c + q = + q, takže 3 q Zbývá tedy odhadnout parametr q 3 Hledáme hodnotu q, která maximalizuje funkci věrohodnosti L(q) = P (X = x,, X n = x n; n 3, q) = P (X j = x j ; 3, q) j= }{{} p X (x j ; 3,q) ( ) 8 ( ) 0 ( ) 5 = 3 q 3 3 + q kde X j jsou jednotlivé nezávislé veličiny (v pokusech) a x j naměřené hodnoty Funkce L je nezáporná a spojitá na uzavřené množině 3, 3, takže zde nabývá maxima To nemůže být v krajních bodech (tam je nulová) a proto je nabyto uvnitř dané množiny To odpovídá hledání maxima funkce l(q) = ln ( L(q) ) = 8 ln ( 3 q ) + 5 ln na intervalu ( 3, ) Protože maximum existuje, musí pro něj platit 3 0 = l (q) = 8 3 q + 5 3 + q Odhad parametru q je q = = 007692 3 Odhady pravděpodobností hodnot, 2, 3 jsou tedy p X () = 6 39 = 0403 p X (2) = 3 ( ) 3 + q + konst = 03333 p X (3) = 0 39 = 02564 Page 3
což vyhovuje zadání Metoda momentů: Střední hodnota je její odhad z realizace je Porovnáním dostaneme což odpovídá hodnotě q = 3 46 Odhady pravděpodobností hodnot, 2, 3 jsou tedy p X () = 55 38 což opět vyhovuje zadání ( ) E(X) = 3 q + 2 ( ) 3 + 3 3 + q = 2 + 2 q x = 43 i n i = ( 8 + 2 0 + 3 5) = n 8 + 0 + 5 23 i 2 + 2q = E(X) = x = 43 23 = 03986 p X (2) = 3 = 006522 = 03333 p X (3) = 37 38 = 0268 05 (metoda momentů a max věrohodnosti - směs) V urně je mnoho hracích kostek, z nichž některé jsou správné, některé falešné Na falešných padá šestka s pravděpodobností /2, zbývající čísla mají stejnou pravděpodobnost Opakovaně jsme vytáhli kostku, hodili jí a vrátili ji zpět Četnost výsledků udává tabulka: Odhadněte, kolik procent kostek je falešných hodnota i 2 3 4 5 6 četnost n i 8 20 2 5 0 25 Podíl falešných kostek označme c 0, Naše náhodná veličina je X = hodnota, která padne na dané kostce a můžeme ji vyjádřit jako směs X = Mix c(x, X 2 ) složenou z náhodných veličin a X = hodnota, která padne na falešné kostce X : množina falešných kostek R X 2 = hodnota, která padne na správné kostce X 2 : množina správných kostek R Metoda momentů: Máme a z definice směsi tak dostaneme E(X ) = 0 ( + + 5) + 2 6 = 9 2 E(X 2 ) = 6 ( + + 6) = 7 2 E(X) = c E(X ) + ( c) E(X 2 ) = c 9 7 + ( c) 2 2 = c + 7 2 Realizace výběrového průměru je i x = n i i 8 + 20 2 + 2 3 + 5 4 + 0 5 + 25 6 i n = = 354 i 8 + 20 + 2 + 5 + 0 + 25 00 = 354 Srovnáním dostaneme což dává p = 004 0,, a to vyhovuje zadání p + 35 = E(X) = x = 354, Page 4
Z definice směsi máme pro její pravděpodobnostní funkci, že c 0 + ( c) 6 = 5 2 c, i =,, 5, 30 p X (i) = c p X (i) + ( c) p X2 (i) = c 2 + ( c) 6 = +2 c, i = 6 6 Ve směsi rozdělení šestka padla 25, ostatní čísla padla 75 (není třeba mezi nimi rozlišovat, protože mají stejnou pravděpodobnost) Tedy věrohodnostní funkce je ( ) 5 2 c 75 ( ) + 2 c 25 L(c) =, 30 6 Maximum nastává pro ĉ takové, že l(c) = ln(l(c)) = 75 ln(5 2 c) + 25 ln( + 2 c) + konst 0 = l (ĉ) = 50 5 2 ĉ + 50 + 2 ĉ = 50 2 8ĉ (5 2 ĉ)( + 2 ĉ), ĉ = 0, 4 protože na intervalu 0, 4 ) je l > 0 a na ( 4, je l < 0 Tato hodnota je i v souladu s počátečními omezujícími podmínkami 06 (metoda momentů a max věrohodnosti - směs) Dvě diskrétní náhodné veličiny X, Y mají pravděpodobnostní funkce dané tabulkou Odhadněte koeficient c směsi Z = Mix c (X, Y ) z četností jejích realizací uvedených v tabulce hodnota 2 3 4 p X 0 02 02 05 p Y 05 02 02 0 četnost 30 20 5 35 Z definice směsi máme pro parametr c nutnou podmínku 0 c Metoda momentů: Z definice směsi Z = Mix c(x, Y ) dostaneme Pro střední hodnoty X a Y máme Takže dostaneme Hodnota realizace výběrového průměru je Jejich srovnáním dostáváme takže výsledek je E(Z) = c E(X) + ( c) E(Y ) E(X) = 0 + 2 02 + 3 02 + 4 05 = 3 E(Y ) = 05 + 2 02 + 3 02 + 4 0 = 9 E(Z) = c E(X) + ( c) E(Y ) = 9 + 2 c z = 30 + 2 20 + 3 5 + 4 35 00 9 + 2 c = E(Z) = z = 255 c = 3 = 0547 24 = 5 20 = 255 Z definice Z = Mix c(x, Y ) pro pravděpodobnostní funkci dostaneme p Z = c p X + ( c) p Y Page 5
Pro funkci věrohodnosti pak máme hodnota 2 3 4 p Z 05 04 c 02 02 0 + 04 c L(c) = (05 04 c) 30 02 20+5 (0 + 04 c) 35 Funkce L je nezáporná a spojitá na uzavřené množině 0,, takže zde nabývá maxima To odpovídá hledání maxima funkce l(c) = ln L(c) = 30 ln ( 05 04 c ) + 35 ln ( 0 + 04 c ) + konst na stejném intervalu 0, Poznamenejme, že tento interval je uvnitř většího definičního oboru daného podmínkami 05 04 c > 0 a 0 + 04 c > 0, tj jde o otevřený interval ( 4, 5 4 ) Derivace 0 = l 30 04 35 04 (ĉ) = + 05 04 ĉ 0 + 04 ĉ = 58 04 ĉ (05 04 ĉ)(0 + 04 ĉ) je nulová ve stacionárním bodě ĉ = 29 = 05577 52 V intervalu ( 4, ĉ) je l evidentně kladná (o znaménku rozhoduje jen výraz v čitateli, výraz ve jmenovateli je kladný) a v intervalu ( ĉ, 5 ) 4 je l zase záporná Takže v bodě ĉ = 29 = 05577 je skutečně věrohodnost maximální 52 07 (metoda momentů a max věrohodnosti - spojité rozdělení) Datový soubor x = ( 4, 3, 2, 5, 05,, 25, 3) je realizací náhodné veličiny X, která má spojité rovnoměrné rozdělení v intervalu h, h Metodou momentů a metodou maximální věrohodnosti určete odhad parametru h (a ověřte, zda odhad odpovídá zadání) Rozsah souboru je n = 8 Realizované výsledky musí spadat do oboru hodnot, což je interval h, h Tedy musí být x i h pro všechna i, neboli musí platit, že h max{ x,, x n } = 4 V metodě max věrohodnosti pro spojité rozdělení nahrazujeme pravděpodobnostní funkci p X (která by zde byla vždy nulová) hustotou f X, u které požadujeme, aby byla spojitá na oboru hodnot veličiny X (taková hustota už je pak jen jedna) Naše zadání toto splňuje, protože, x h, 2h f X (x; h) = 0, x > h Naším cílem je maximalizovat funkci Λ(h) = n ( ) n f Xi (x i ; h) = }{{} 2h f X (x i ; h) pro h 4, + ) Tato funkce je klesající v proměnné h, takže nabývá maxima pro největší přípustnou hodnotu parametru ĥ = 4 Hledaný interval h, h je tedy nejmenší takový, který obsahuje všechna x i, pro i =,, n Metoda momentů: Opět porovnáváme teoretické k-té momenty E(X k ) s jejich odhady m k = n n xk i pro prvních několik k =, 2, Protože hustota f X je sudá, bude E(X k ) = 0 pro k liché Speciálně, střední hodnota je E(X) = 0 a tedy požadavek 0 = E(X) = x nám žádnou podmínku pro h nedává Dokonce tuto rovnost ani není možno pro naše zadání splnit, protože: x = n x i = 35 n 8 = 04375 0 Page 6
To nám ale nemusí vadit, protože jen těžko můžeme očekávat, že se aritmetickým průměrem při konečném počtu měření trefíme právě do hodnoty nula Proto musíme použít další momenty Odhad druhého momentu je m 2 = n Odhad parametru získáme jako řešení rovnice h E(X 2 ) = x 2 [ x 3 ] h 2h dx = 6h = h2 h 3 h n ĥ 2 3 = E(X2 ) = m 2 = 4775 8 x 2 i = 4775 8 = 596875 = ĥ = 790625 = 4236 Protože všechny hodnoty ze souboru leží v intervalu h, h = 4236, 4236, můžeme nalezenou hodnotu h tudíž považovat za hledaný odhad parametru rozdělení 08 (metoda momentů a max věrohodnosti - spojité rozdělení) Náhodná veličina X s oborem hodnot a, + ) má hustotu { 0, t (, a), f X (t) = e a t, t a, ), kde a R je parametr Pomocí metody maximální věrohodnosti i metody momentů odhadněte parametr a Úlohu vyřešte obecně pro realizaci x = (x, x 2,, x n ) a také pro konkrétní realizaci rozsahu n = 7 x = (, 2, 2, 2, 3, 3, 4) Realizované výsledky musí spadat do oboru hodnot, tj pro všechna i =,, n neboli musí platit, že x i a, + ) a min{x,, x n} Dále si všimněme, že funkce f X je posunutá hustota exponenciálního rozdělení s parametrem τ = (neboli veličina Y = X a má exponenciální rozdělení Exp(), což se snadno odvodí) Tedy je to opět hustota Ale to, že f X je hustota můžeme ukázat i přímo: funkce f X je nezáporná a platí, že f X (t) dt = a e a t dt = e a [ e t] t= t=a = ea e a = Metoda max věrohodnosti pro spojité rozdělení je podobná jako pro diskrétní rozdělení Pravděpodobnostní funkci zde nahradíme hustotou, která ale (jak víme) není jednoznačně definována Aby tedy metoda měla vůbec smysl, uvažuje se zde jen případ, kdy hustota f X je spojitá na oboru hodnot veličiny X (taková hustota už je pak jen jedna) Naše zadání toto splňuje Naším cílem je maximalizovat funkci n n Λ(a) = f Xi (x i ; a) = e a x i = e n a e i x i }{{} f X (x i ) pro a (, min{x,, x n} Tato funkce je rostoucí v proměnné a, takže nabývá maxima pro největší přípustnou hodnotu parametru â = min{x, x n} Page 7
Pro konkrétní zadání je to pak â = min{, 2, 2, 2, 3, 3, 4} = Metoda momentů: Porovnáme teoretickou střední hodnotu E(X) = t f X (t) dt = t e a t dt = [ t e a t ] t=a + e a t dt = a a = a + [ e a t ] t=a = a + a výběrový průměr x Odtud tak pro parametr â dostaneme POKUD je ovšem splněno, že a min{x,, x n}! â = x, Pro konkrétní zadání je x = +2+2+2+3+3+4 7 = 7 7 a tedy â = 7 7 = 43, což ale NENÍ menší než min{, 2, 2, 2, 3, 3, 4} = V tomto případě tedy metoda momentů NEDÁVÁ žádný odhad Page 8