4. Itervalové odhady parametrů rozděleí. Jedou ze základích úloh mtematické statistiky je staoveí hodot parametrů rozděleí, ze kterého máme k dispozici áhodý výběr. Nejčastěji hledáme odhady dvou druhů: -bodový odhad (poit estimate, estimator) je odhad parametru pomocí statistiky (fukce áhodého výběru), jejíž hodotu pro datový soubor považujeme za hledaou hodotu ezámého parametru rozděleí (či jeho fukce); -itervalový odhad (kofidečí iterval) (cofidece iterval) je iterval, ve kterém se hodota ezámého parametru vyskytuje s požadovaou pravděpodobostí, pochopitelě s hodotou blízkou jedé. Itervalový odhad. Jestliže je θ ezámý parametr zkoumaého rozděleí a τ(θ) je fukce parametru, kterou odhadujeme, pak hledáme statistiky T d a T h takové, že pro koeficiet spolehlivosti (cofidece level) ( ) platí: P (T d τ(θ) T h ) =, (oboustraý odhad) (two-tailed) přičemž obvykle ještě požadujeme P (τ(θ) < T d ) = P (τ(θ) > T h ) =. Itervalovým odhadem (oboustraým) fukce τ(θ) je iterval (T d, T h ). Někdy hledáme pouze jedostraé odhady (oe-tailed). Je pak: τ(θ) (T d, ), kde P (τ(θ) T d ) = a P (τ(θ) < T d ) = ; τ(θ) (, T h ), kde P (τ(θ) T h ) = a P (τ(θ) > T h =. Obvykle volíme = 0, ; 0, 05, 0, 0. Spolehlivost odhadu (level of sigificace) je pak ( ) = 0, 9, 0, 95, 0, 99. To zameá, že po řadě v 90%, v 95% ebo v 99% případech je áš odhad pro parametr správý. Itervalové odhady parametrů ěkterých rozděleí.. Normálí rozděleí. A) Odhad parametru µ (středí hodoty) rozděleí N(µ, σ ) při zámém rozptylu σ. Zde použijeme statistiku X (výběrový průměr) jako jeho odhad. Víme, že áhodá veličia U = X µ má ormovaé ormálí rozděleí N(0, ). Potom σ je P ( U u ) = u X µ u σ, kde symbolem u p, 0 < p < ozačujeme p kvatil ormovaého or- 39
málího rozděleí N(0, ). Odtud dostaeme, že T d = X σ u µ T h = X + σ u. µ T h = X + σ u, resp. µ T d = X σ u. Jedostraými odhady jsou itervaly (levostraý), resp. (pravostraý) B) Odhad parametru σ při zámé středí hodotě µ. Zde použijeme skutečosti, že má áhodá veličia U i = X i µ ormovaé ormálí σ rozděleí N(0, ). Potom má áhodá veličia V = ( ) Xi µ rozděleí χ (). Je i= σ pak s = i= (X i µ) = σ i= ( Xi µ σ ) = σ V. Má tudíž statistika V = s dostaeme σ rozděleí χ (). Pro oboustraý odhad P (v V v ) = v = χ () a v = χ (), kde symbolem χ p() ozačujeme p kvatil rozděleí χ (). Odtud plye odhad χ () s σ χ () s () σ s (). χ Obdobě dostaeme jedostraé odhady (pravostraý) resp. (levostraý) σ s χ (), resp. s χ () σ. C) Odhad středí hodoty µ za podmíky, že rozptyl σ uvažovaého rozděleí eí zám. Ke staoveí itervalu spolehlivosti použijeme statistiku T = X µ, o které víme, že má Studetovo t rozděleí t( ) S 40 χ
o ( ) stupích volosti. Je totiž a T = X µ σ S σ U = X µ σ N(0; ), eboť X N(µ; σ /). Dále je a Z = ( ) S σ = i= T = X X i σ U Z má tedy Studetovo rozděleí t( ). Iterval spolehlivosti určíme z podmíky χ ( ) Odtud je tudíž P ( T t ( )) =. t X µ t S, X S t µ X + S t je oboustraý iterval spolehlivosti pro parametr µ. Obdobě dostaeme jedostraé itervaly (pravostraý), resp. (levostraý) ve tvaru: µ X + S t, µ X S t, kde symbolem t ozačujeme kvatil uvažovaého rozděleí. D) Odhad parametru σ při ezámé středí hodotě µ. Zde použijeme statistiku Y = S, která má rozděleí χ ( ). Je totiž σ Y = i= X X i σ 4 χ ( )
a dále vycházíme ze skutečosti, že pro statistiku S je E(S ) = σ a může tedy sloužit jako vhodý odhad parametru σ. Oboustraý iterval spolehlivosti dostaeme z podmíky P (v Y v ) = v = χ ( ), v = χ ( ) jsou odpovídající kvatily rozděleí χ. Odtud plye pro oboustraý iterval spolehlivosti v ( )S σ v ( ) S σ ( ) S. v v Jedoduchou úpravou získáme jedostraé itervaly spolehlivosti (pravostraý), resp. (levostraý) ve tvaru σ ( ) v S, ( ) v S σ, kde v a v jsou zde po řadě kvatily χ ( ), v = χ ( ) rozděleí chí-kvadrát o ( ) stupích volosti.. Expoeciálí rozděleí. Uvedeme iterval spolehlivosti pro rozděleí Exp(0; δ), kde využijeme skutečosti, že je středí hodota E(X) = δ. Statistika T = X má δ totiž rozděleí χ (). O tom se sado přesvědčíme pomocí charakteristické fukce. Jestliže uvážíme, že áhodá veličia X, která má uvažovaé expoeciálí rozděleí, má charakteristickou fukci ψ X (t) = jtδ, pak pro statistiku T dostaeme charakteristickou fukci ψ T (t) = ( jt). To je ovšem charakteristická fukce áhodé veličiy, která má rozděleí χ(). Je totiž X = i X i ψ X = E e jt i= x i = = E ( e jtx ).E ( e jtx )... E ( e jtx ) = (ψx (t)). Pro expoeciálí rozděleí Exp(0; δ) je ψ X (t) = δ 0 e jtx e x/δ dx = δ 0 e x(/δ jt) dx = 4
Je tedy Dále je tedy = δ δ [ e x(/δ jt ] δjt = 0 δjt ψ X(t) = ( δjt). ψ X (t) = E ( e jtx ) = ψ X (t), ψ T (t) = ψ( X( δ t) = jt), což je charkteristická fukce rozděleí χ (). Iterval spolehlivosti získáme z idetity P (v T v ) = v X δ v X δ X, v v kde v = χ () a v = χ () kvatil rozděleí chí-kvadrát. Obdobě dostaeme jedostraé itervaly spolehlivosti ve tvaru X v δ, δ X v, kde v = χ () a v = χ () jsou kvatily rozděleí chí-kvadrát. Pro rozsáhlé výběry při velkém můžeme použít důsledku cetrálí limití věty. Protože pro áhodou veličiu s expoeciálím rozděleí je E(X) = δ a D(X) = δ, je pro výběrový průměr áhodého výběru z tohoto rozděleí E(X) = δ a D(X) = δ. Potom má áhodá veličia U = X δ δ v limitě ormovaé ormálí rozděleí N(0; ). Itervaly spolehlivosti můžeme určit pomocí kvatilů ormálího rozděleí obdobě jako v odstavci A. V áhodé veličiě U použijeme odhadu δ = X a pro staoveí itervalu spolehlivosti vycházíme z áhodé veličiy U = X δ X 43,
u které předpokládáme ormovaé ormálí rozděleí N(0; ). Z idetity P X δ X dostaeme iterval spolehlivosti ve tvaru < u = X u X < δ < X + u X, kde symbolem u ozačujeme kvatil ormovaého ormálího rozděleí. Pokud je áhodý výběr výběrem s obecého expoeciálího rozděleí Ex(A; δ), pak staovíme odhad parametru A pomocí metod uvedeých v odstavci 4 a zpracováváme soubor Y i = X i A, i. 3. Alterativí rozděleí. Odhadujeme hodotu parametru p, kde využíváme skutečosti, že pro áhodý výběr z alterativího rozděleí má výběrový úhr X = i= X i biomické rozděleí Bi(, p). Podle cetrálí limití věty lze pro dostatečě rozsáhlý výběr předpokládat, že součet má ormálí rozděleí. Protože je E( X) = p a D( X) = p( p), má pro p( p) > 9 výběrový úhr X ormálí rozděleí N(p, p( p)). Náhodá veličia Z = X p p( p) = X p p( p) má ormovaé ormálí rozděleí. Potom je P ( Z u ) = u Odtud plye, že pro parametr p platí X u p( p) p( p) p X + u N(0; ) X p u p( p). p( p). Itervalový odhad parametru p obsahuje ale hodotu rozptylu, která X( X) závisí a p. Hodotu rozptylu ahradíme jeho odhadem. Pro 44
parametr p dostaeme itervalový odhad X u X( X) p X + u X( X). 4. Geometrické rozděleí s parametrem p má pravděpodobostí fukci p(k) = p( p) k, k =,,..., a odhadujeme parametr p. Pro áhodou veličiu X s tímto rozděleím je E(X) = p a D(X) = ( ) p p, tedy pro áhodý výběr z tohoto rozděleí dostaeme, že E(X) = p a D(X) = ( ) p p. Pro základí číselé charakteristiky je: E(X) = kp( p) k = p ( ( p) k ) p = p = ( p) = k= k= E(X ) = k= k(k )p( p) k + = p( p) k= ( ) = p p = p p = p ; k p( p) k = [k(k ) + k]p( p) k = k= ( p) ( p) k= kp( p) k = p( p) k= ( ( p) k ) + p = = p( p) ( p + p ) + p = = p( p) p 3 + p = p p ; D(X) = E(X ) (E(X)) = p p p = p p = ( ) p p. Je-li (X, X,..., X ) áhodý výběr z geometrického rozděleí, pak pro výběrový úhr X a výběrový průměr X platí: E( X) = p, E(X) = p, D( X) = ( ) p p, D(X) = ( ) p p. Pro velké hodoty rozsahu výběru má podle cetrálí limití věty áhodá veličia X p U = ( ) p p 45
v limitě ormálí rozděleí N(0; ). Pro iterval spolehlivosti k daé hodotě dostaeme iterval spolehlivosti ve tvaru X p p Jestliže použijeme odhadu p pro parametr p ve tvaru ( p ) ( p ) u..= X(X ), pak dostaeme iterval X u X(X ) p X + u X(X ). Příklad: Při hodech hrací kostkou sledujeme počet hodů, které musíme provést, dokud epade šestka. Je tedy p = 6 = 0, 6666, p = 6. Pro = 0, je z tabulek u 0,95 =, 64485. Pro áhodé výběry jsme dostali: = 30, X = 4, 63333, tedy 3, 4083 p 5, 8655 0, 705 p 0, 94. = 0, X = 5, 65, tedy 4, 88 p 6, 4 0, 558 p 0, 05. = 80, X = 5, 8555, tedy 5, 08 p 6, 5093, tedy 0, 536 p 0, 94. 46
Příklady. Určete itervaly spolehlivosti, oboustraé i jedostraé pro zadaé hodoty, = 0,, 0, 05, 0, 0.. Normálí rozděleí. Ukážeme si použití a datech ze souborů, které jsou přehledem výšek v cm a vah v kg ve skupiách studetů. Příslušé výběrové charakteristiky vždy uvedeme u řešeé úlohy. V tabulkách jsou zadáy hodoty výběrových statistik pro áhodý výběr z ormálího rozděleí. Písmeem X je ozače soubor výšek posluchačů v cm a písmeem Y je ozače soubor vah v kg. Písmeo M začí muže, písmeo Ž žey. je rozsah souboru, X je hodota výběrového průměru a SX je hodota výběrového rozptylu pro áhodý výběr. soubor výb. průměr výb. rozptyl počet hodot rozpětí 990,M X = 80 SX = 38, 8 = 7 65, 00 990,Ž X = 65, 55 SX = 47, 7 = 5, 78 990,M+Ž X = 79, SX = 58, 875 = 8 5, 00 000(+) X = 8, 673 SX = 68, 489 = 5 65, 0 000() X = 8, 607 SX = 94, 04 = 8 65, 0 000() X = 8, 75 SX = 38, 687 = 4 7, 96 990,M Y = 7, 5 SY = 55, 9 = 7 60, 95 990,Ž Y = 56, 78 SY = 4, 07 = 45, 67 990,M+Ž Y = 7, 57 SY = 67, 975 = 8 45, 95 000(+) Y = 77, 93 SY = 06, 48 = 5 60, 05 000() Y = 75, 893 SY = 8, 3 = 8 60, 05 000() Y = 80, 9 SY = 69, 873 = 4 6, 95 rozsah souboru, X výběrový průměr, S výběrový rozptyl, V S výška v cm, V H váha v kg. 47
X S X S VS- 35 8, 6, VH- 35 75, 4 0, 78 VS- 30 83 64, 97 VH- 30 77, 4 0, 59 VS-3 34 83, 35 7, 48 VH-3 34 77, 53 34, 6 VS-4 7 8 74, 77 VH-4 7 76, 74 59, 74.. Výběr je áhodým výběrem z ormálího rozděleí N(µ; σ ) z daými parametry. Určete iterval spolehlivosti pro středí hodotu µ. Ke staoveí itervalů spolehlivosti použijeme statistiku T = X µ t( ), S která má t rozděleí o stupích volosti. Pozameejme, že pro 30 je t rozděleí již shodé z ormovaým ormálím rozděleím N(0; ). Je pak: oboustraý iterval spolehlivosti ( ) X S t µ X + S t ; jedostraé itervaly spolehlivosti ( ) µ X + S t, µ X S t. a) Soubor 990(M): Jedá se o soubor výšek v cm, X = 80, S = 38, 8, = 7, rozpětí 65, 00. Ke staoveí itervalů použijeme vzorce ( ) a ( ). oboustraý iterval t S/ µ 0,, 64485, 6 78, 78 < µ < 8, 6 0, 05, 95996, 4489 78, 55 < µ < 8, 449 0, 00, 57583, 904 78, < µ < 8, 904 jedostraé itervaly t S/ µ µ 0,, 86 0, 9474 µ < 80, 95 µ > 79, 05 0, 05, 64485, 6 µ < 8, µ > 78, 78 0, 00, 364, 95996 µ < 8, 7 µ > 78, 8 48
b) Soubor 990(Ž): Jedá se o soubor výšek v cm, X = 65, 55, S = 47, 7, =, rozpětí 5, 78. Ke staoveí itervalů použijeme vzorce ( ) a ( ). oboustraý iterval t S/ µ 0,, 85 3, 7573 6, 79 < µ < 69, 3 0, 05, 8 4, 6885 60, 93 < µ < 70, 7 0, 00, 76383 6, 5699 58, 98 < µ < 7, jedostraé itervaly t S/ µ µ 0,, 37, 8446 µ < 68, 39 µ > 6, 70 0, 05, 85 3, 7573 µ < 69, 3 µ > 6, 79 0, 00, 7638 5, 794 µ < 7, 8 µ > 59, 8 c) Soubor 990(M): Jedá se o soubor vah v kg, Y = 7, 5, S = 55, 9, = 7, rozpětí 60, 95. Ke staoveí itervalů použijeme vzorce ( ) a ( ). oboustraý iterval t S/ µ 0,, 64485, 450 7, 07 < µ < 73, 97 0, 05, 95996, 78 70, 79 < µ < 74, 5 0, 00, 57583, 7 70, 5 < µ < 74, 79 jedostraé itervaly t S/ µ µ 0,, 86, 99 µ < 73, 65 µ > 7, 39 0, 05, 64485, 450 µ < 73, 97 µ > 7, 07 0, 00, 364, 05 µ < 74, 57 µ > 70, 47 49
d) Soubor 990(Ž): Jedá se o soubor vah v kg, Y = 56, 78, S = 4, 07, =, rozpětí 45, 77. Ke staoveí itervalů použijeme vzorce ( ) a ( ). oboustraý iterval t S/ µ 0,, 85 3, 499 53, 8 < µ < 60, 8 0, 05, 8 4, 30 5, 48 < µ < 6, 08 0, 00, 76383 6, 99 47, 66 < µ < 65, 90 jedostraé itervaly t S/ µ µ 0,, 37, 6497 µ < 59, 43 µ > 54, 3 0, 05, 85 3, 4999 µ < 60, 8 µ > 53, 8 0, 00, 7638 5, 3374 µ < 6, µ > 5, 44.. Výběr je áhodým výběrem z ormálího rozděleí N(µ; σ ) z daými parametry. Určete iterval spolehlivosti pro rozptyl σ. Ke staoveí itervalů spolehlivosti použijeme statistiku Y = σ S, která má rozděleí χ ( ). Vycházíme ze skutečosti, že pro statistiku S je E(S ) = σ a může tedy sloužit jako vhodý odhad parametru σ. Oboustraý iterval spolehlivosti dostaeme ve tvaru ( ) ( ) χ S < σ < ( ) χ S. Jedostraé itervaly spolehlivosti dostaeme ve tvaru ( ) σ > ( ) χ S, σ < ( ) χ S. 50
a) Soubor 990(M): Jedá se o soubor výšek v cm, X = 80, S = 38, 8, = 7, rozpětí 65, 00. Ke staoveí itervalů použijeme vzorce ( ) a ( ). oboustraý iterval χ χ σ 0, 90, 53 5, 739 30 < σ < 5, 49 0, 05 95, 03 48, 758 8, 58 < σ < 55, 70 0, 00 04, 43, 75 6, 06 < σ < 6, 76 jedostraé itervaly χ χ σ σ 0, σ < σ > 0, 05 90, 53 5, 739 σ < 5, 49 σ > 30 0, 00 00, 43 45, 44 σ < 59, 77 σ > 7, 04 b) Soubor 990(Ž): Jedá se o soubor výšek v cm, X = 65, 55, S = 47, 7, =, rozpětí 5, 78. Ke staoveí itervalů použijeme vzorce ( ) a ( ). oboustraý iterval χ χ σ 0, 8, 307 3, 9403 5, 8 < σ < 9, 96 0, 05 0, 483 3, 47 3, 08 < σ < 45, 6 0, 00 5, 88, 559 8, 77 < σ < 98, 4 jedostraé itervaly χ χ σ σ 0, σ < σ > 0, 05 8, 307 3, 9403 σ < 9, 96 σ > 5, 8 0, 00 3, 09, 558 σ < 84, 78 σ > 0, 37 5
c) Soubor 990(M): Jedá se o soubor vah v kg, Y = 7, 5, S = 55, 9, = 7, rozpětí 60, 95. Ke staoveí itervalů použijeme vzorce ( ) a ( ). oboustraý iterval χ χ σ 0, 90, 53 5, 739 4, 68 < σ < 74, 67 0, 05 95, 03 48, 758 40, 66 < σ < 79, 4 0, 00 04, 43, 75 37, 07 < σ < 89, 8 jedostraé itervaly χ χ σ σ 0, σ < σ > 0, 05 90, 53 5, 739 σ < 74, 67 σ > 4, 68 0, 00 00, 43 45, 44 σ < 85, 0 σ > 38, 47 d) Soubor 990(Ž): Jedá se o soubor vah v kg, Y = 56, 78, S = 4, 07, =, rozpětí 45, 77. Ke staoveí itervalů použijeme vzorce ( ) a ( ). oboustraý iterval χ χ σ 0, 8, 307 3, 9403, 4 < σ < 04, 0, 05 0, 483 3, 47 0, 0 < σ < 6, 3 0, 00 5, 88, 559 6, 8 < σ < 90, 5 jedostraé itervaly χ χ σ σ 0, σ < σ > 0, 05 8, 307 3, 9403 σ < 04, σ >, 4 0, 00 3, 09, 558 σ < 60, 33 σ > 7, 67 5
. Expoeciálí rozděleí... Výběr je áhodým výběrem z expoeciálího rozděleí Exp(0; δ) z daými parametry. Určete iterval spolehlivosti pro středí hodotu δ. Zde využijeme skutečosti, že je středí hodota E(X) = δ. a toho, že statistika T = X δ má rozděleí χ (). Iterval spolehlivosti získáme ve tvaru X v < δ < X v, kde v = χ () a v = χ () kvatil rozděleí chí-kvadrát. Obdobě dostaeme jedostraé itervaly spolehlivosti ve tvaru X v < δ, δ < X v, kde v = χ () a v = χ () kvatil rozděleí chí-kvadrát. a) Soubor byl geerová z expoeciálího rozděleí Exp(0; δ) a má parametry: X =, 094, = 40. Potom je X = 80., 094 = 87, 538. Odtud dostaeme oboustraý iterval spolehlivosti χ χ δ 0, 0, 88 60, 39 0, 86 < δ <, 45 0, 05 06, 63 57, 53 0, 8 < δ <, 53 0, 00 6, 3 5, 7 0, 75 < δ <, 7 jedostraý iterval spolehlivosti χ χ δ δ 0, - - - - 0, 05 0, 88 60, 39 0, 86 < δ δ >, 45 0, 00 06, 63 57, 53 0, 8 < δ δ >, 53 53
3. Alterativí rozděleí. V tabulce jsou hodoty, které odpovídají výběru z alterativího rozděleí pro p =. 6 = 0, 667. Jsou to počty, kolikrát při hodech hrací kostkou padou čísla,,...,6. Podmíka pro aproximaci pomocí ormálího rozděleí je p( p) > 9, tedy > 65. X X X X X X 6 90 0 4 5 3 6 5 0 7 9 0 8 5 0 50 4 5 8 9 5 80 3 5 9 7 34 34 30 40 39 39 40 34 49 39 40 300 47 53 5 40 6 48 50 V další tabulce jsou uvedey výběrové průměry X, tedy odhady parametru p =. 6 = 0, 667. X X X X X X 90 0, 0,556 0,667 0,444 0,444 0,778 0 0,47 0,583 0,667 0,5 0,083 0,75 50 0,6 0,466 0,667 0,467 0,867 0,933 80 0,7 0,389 0,6 0,5 0,889 0,889 40 0,65 0,65 0,667 0,47 0,04 0,65 300 0,567 0,767 0,7 0,33 0,033 0,6 Iterval spolehlivosti pro parametr p určíme ze vzorce X u X( X) p X + u X( X) a příslušé výsledky jsou uvedey v tabulce. Pro kvatily u dostaeme z tabulek hodoty: u 0,95 =, 64485, u 0,975 =, 95996, u 0,995 =, 57583. Pro kvatily u, resp, u dostaeme: u 0,9 =, 855, u 0,95 =, 64485, u 0,99 =, 3635. 54
< p < < p < < p < 90 0,057-0,655 0,098-0,88 0,0-0,33 0 0,0894-0,994 0,035-0,3 0,08-0,6 50 0,08-0,09 0,099-0,94 0,67-0,67 80 0,6-0,84 0,0965-0,83 0,6-0,06 40 0,34-0,06 0,34-0,06 0,7-0,063 300 0,59-0,975 0,405-0,9 0,343-0,057 < p < < p < < p < 90 0,934-0,954 0,699-0,389 0,5-0,44 0 0,573-0,593 0,547-0,69 0,79-0,3 50 0,099-0,94 0,344-0,369 0,403-0,463 80 0,06-0,939 0,409-0,369 0,409-0,369 40 0,047-0,787 0,64-0,47 0,34-0,06 300 0,008-0,65 0,65-0,45 0,5-0,949 4. Geometrické rozděleí. Iterval spolehlivosti pro parametr p má tvar X u X(X ) p X + u X(X ). Jeho vyjádřeí si ukážeme pro data jsou ze souboru z geometrickým rozděleím s parametrem p = 6, tedy p = 6. Jedá se o počet hodů hrací kostkou, které musíme provést, aby padlo zvoleé číslo, apř. šestka. Pro hodotu = 0, je u 0,95 =, 64485 a pro hodoty ze souboru máme: X < p < < p < 30 4,633 3, 4 < p < 5, 87 0, 7 < p < 0, 9 0 5,65 4, 88 < p < 6, 4 0, 56 < p < 0, 05 80 5,86 5, < p < 6, 5 0, 54 < p < 0, 9 55