Odhady parametrů 1 Odhady parametrů Na statistický soubor (x 1,..., x, který dostaeme statistickým šetřeím, se můžeme dívat jako a výběrový soubor získaý realizací áhodého výběru z áhodé veličiy X. Obdobě: Na dvourozměrý statistický soubor ( (x 1, y 1,..., (x, y, který dostaeme statistickým šetřeím, se můžeme dívat jako a výběrový soubor získaý realizací áhodého výběru z áhodého vektoru (X, Y. Nyí se abízí otázka: Nelze pomocí parametru statistického souboru (x 1,..., x, resp. ( (x 1, y 1,..., (x, y přesě určit parametry áhodé veličiy X, resp. áhodého vektoru (X, Y? 1. Pozámka Parametry, které ás ejvíce zajímají jsou číselé charakteristiky áhodé veličiy (áhodého vektoru, apř. středí hodota E(X, rozptyl D(X, koeficiet korelace ϱ (X,Y apod. Odpověď a výše položeou otázku je e, parametry áhodé veličiy X či áhodého vektoru (X, Y elze přesě určit, ale lze je odhadout. 2. Příklad Jestliže zám hmotosti 50 hřídelí stejého typu vyrobeých za stejých podmíek emohu přesě určit středí hodotu áhodé veličiy X, která reprezetuje hmotost všech hřídelí vyrobeých za stejých podmíek. Ale mohu středí hodotu této veličiy odhadout. Bodové odhady V techické praxi se ejčastěji používají bodové odhady parametrů áhodé veličiy. 3. Pojmy Odhadem T parametru ϑ je statistika T (X 1,..., X, která a celém parametrickém prostoru abývá hodot blízkých parametru ϑ. Používáme zejméa tyto odhady: 1. Odhad T parametru ϑ je estraý (evychýleý, jestliže jeho středí hodota E(T = ϑ. Pokud je E(T ϑ, jde o straý (vychýleý odhad. 2. Je-li rozptyl estraého odhadu T ejmeší z rozptylů všech estraých odhadů téhož parametru ϑ, je T ejlepší estraý odhad. 3. Odhad T je kozistetí, jestliže lim P ( T ϑ < ε = 1 pro libovolé reálé číslo ε > 0. 4. Bodové odhady základích číselých charakteristik áhodé veličiy X a základě výběrových charakteristik: a X je estraý kozistetí odhad středí hodoty E(X; b 1 S2 je estraý kozistetí odhad rozptylu D(X. Odhady a a b jsou pro ormálí rozděleí X také ejlepší. 5. Bodové odhady základích číselých charakteristik áhodé veličiy X resp. áhodého vektoru (X,Y a základě empirických charakteristik statistického souboru: a x je bodovým odhadem středí hodotye (X; b 1 s2 je bodovým odhadem rozptylu D (X; c 1s je bodovým odhadem směrodaté odchylkyσ (X; d r je bodovým odhadem korelačího koeficietu ϱ (X, Y ; kde x, s 2, s resp. r jsou empirické charakteristiky získaé ze statistického souboru (x 1,..., x resp. ((x 1, y 1,..., (x, y.
Odhady parametrů 2 Itervalové odhady 6. Pozámka V dalším textu symbol = mezi parametrem áhodé veličiy ϑ a odhadem T ezačí ekvivaleci, ale odhad. Tedy apř. E (X = x, čteme jako, středí hodota E (X je odhaduta aritmetickým průměrem x. Nevýhodou je, že spolehlivost bodových odhadů (pravděpodobost, že určíme parametr áhodé veličiy přesě je ulová. Proto zavádíme itervalové odhady. 7. Pojmy Iterval spolehlivosti (kofidečí iterval pro parametr ϑ se spolehlivostí 1 α, kde α 0; 1, je dvojice takových statistik (T 1 ; T 2, že P (T 1 ϑ T 2 = 1 α pro libovolou hodotu parametru ϑ. Itervalový odhad parametru ϑ se spolehlivostí 1 α je iterval t 1 ; t 2 a píšeme ϑ t 1 ; t 2, kde t 1, t 2 jsou hodoty statistik T 1, T 2 a daém statistickém souboru (x 1,..., x. Spolehlivost 1 α volíme blízkou jedé, podle kovece obvykle 0, 95 ebo 0, 99, a uvádíme ji také v %. Spolehlivost 1 α zameá, že při moha opakovaých výběrech s kostatím rozsahem z daého základího souboru zhruba (1 α100 % všech itervalových odhadů obsahuje skutečou hodotu parametru ϑ a aopak α100 % jich tuto hodotu eobsahuje. Situaci ilustruje počítačově simulovaý příklad a Obrázku 1, kde ϑ = 0 a tučě jsou vyzačey případy odpovídající riziku chybého odhadu α, tj. itervalové odhady, které ezachytily hodotu parametru ϑ. Obrázek 1: 6 itervalových odhadu ze 100 provedeých itervalových odhadů se spolehlivostí 0,95 eobsahují odhadovaou hodotu 0 S rostoucí spolehlivostí roste i rozpětí itervalového odhadu, takže pokud chceme itervalový odhad zúžit je možé sížit spolehlivost tohoto odhadu (viz Obrázek 2. Teto přístup ovšem edoporučujeme, protože chceme udržet relativě vysokou spolehlivost. Podstatě lepší je zvětšit rozsah souboru, ovšem s ohledem a kletbu statistiky, eboť velikost itervalového odhadu se zmeší víceméě úměrě (viz Obrázek 3.
Odhady parametrů 3 Obrázek 2: Itervalové odhady středí hodoty se spolehlivostí 0,99, 0,95, a 0,9 pro stejý statistický soubor Obrázek 3: Itervalové odhady středí hodoty pro áhodé výběry růzého rozsahu
Odhady parametrů 4 Odhady parametrů ormálího rozděleí 8. Předpokládáme, že pozorovaá áhodá veličia X, resp. áhodý vektor (X, Y, má ormálí rozděleí pravděpodobosti s parametry µ, σ 2, resp. ϱ. Bodové odhady jsou µ = x, σ 2 = 1 s2, σ = 1 s, ϱ = r. Itervalový odhad středí hodoty µ se spolehlivostí 1 α, při ezámém rozptylu σ 2 je s s x t 1 α/2 ; x + t 1 α/2, 1 1 kde t 1 α/2 je ( 1 α 2 - kvatil Studetova rozděleí S(k s k = 1 stupi volosti. Kvatily tohoto rozděleí jsou uvedey v tabulce T2 Statistických tabulek, které jsou k dispozici a Matematice Olie. 9. Itervalový odhad rozptylu σ 2 se spolehlivostí 1 α je s 2 s 2 ;, χ 2 1 α/2 kde χ 2 P je P - kvatil Pearsoova rozděleí χ2 (k s k = 1 stupi volosti. Kvatily tohoto rozděleí jsou uvedey v tabulce T3. Z uvedeého itervalového odhadu získáme po odmocěí jeho mezí itervalový odhad směrodaté odchylky σ se spolehlivostí 1 α. 10. Příklad Měřeím délky 10 válečků byl získá statistický soubor s empirickými charakteristikami x = 5, 37mm, s 2 = 0, 0019mm 2 a s = 0, 044mm. Určete bodové odhady středí hodoty, rozptylu a směrodaté odchylky. Za předpokladu, že aměřeá délka X má ormálí rozděleí pravděpodobosti, určete itervalové odhady těchto číselých charakteristik se spolehlivostí 0,95. Řešeí Bodové odhady jsou: středí délka válečku µ = 5, 37mm, rozptyl délky válečku σ 2 = 10 9 0, 0019 = 0, 00211mm2, směrodatá odchylka délky válečku σ = 0, 00211 0, 046mm. Itervalový odhad středí délky válečku µ se spolehlivostí 0,95 je, eboť t 0,975 = 2,262 pro 9 stupňů volosti z tabulky T2, µ 5, 37 2, 262 0,0019 10 1 ; 5, 37 + 2, 262 0,0019 10 1 5, 337; 5, 403 mm. Itervalový odhad rozptylu délky válečku σ 2 se spolehlivostí 0,95 je, eboť χ 2 0,025 = 2, 700 a χ 2 0,975 = 19, 023 pro 9 stupňů volosti z tabulky T3, σ 2 10.0,0019 19,023 ; 10.0,0019 2,700 0, 00100; 0, 00704 mm 2, χ 2 α/2 takže itervalový odhad směrodaté odchylky délky válečku σ je σ 0, 00100; 0, 00704 0, 0316; 0, 0839 mm. Itervalový odhad koeficietu korelace ϱ se spolehlivostí 1 α pro 10 je tgh z 1 ; tgh z 2, kde z 1 = w u 1 α/2 3, z 2 = w + u 1 α/2, w = 1 ( l 1 + r 3 2 1 r + r, tgh z = ez e z 1 e z + e z = e2z 1 e 2z + 1
Odhady parametrů 5 a u 1 α/2 je ( 1 α 2 - kvatil ormovaého ormálího rozděleí N(0;1, jehož hodoty lze získat z tabulky T1 s hodotami distribučí fukce Φ(u. Pro 1 α = 0, 95 je u 0,975 = 1, 960 a pro 1 α = 0, 99 je u 0,995 = 2, 576. Uvedeý odhad je pouze přibližý, avšak jeho přesost je v praktických úlohách postačující (přesý odhad eí zám. 11. Příklad Sledováím ákladů a cey stejého výrobku u 10 výrobců byl získá dvourozměrý statistický soubor s koeficietem korelace r = 0, 82482. Určete bodový odhad a itervalový odhad se spolehlivosti 0,99 koeficietu korelace ϱ základího souboru. Řešeí Bodový odhad koeficietu korelace ákladů a cey je ϱ = 0, 82482. Po dosazeí je w = 1 ( 1 + 0, 82482 0, 82482 l + 1, 21753. 2 1 0, 82482 10 1 Z tabulky T1 je u 0,995 = 2, 576, takže z 1 = 1, 21753 2, 576 2, 576 0, 24397, z 2 = 1, 21753 + 2, 19110 10 3 10 3 a itervalový odhad koeficietu korelace ákladů a cey ϱ se spolehlivostí 0,99 je ϱ tgh 0, 24397; tgh 2, 19110 0, 239242; 0, 975313.