Intervalové odhady parametrů

Itervalové odhady parametrů Petr Pošík Části dokumetu jsou převzaty (i doslově) z Mirko Navara: Pravděpodobost a matematická statistika, https://cw.felk.cvut.cz/lib/ee/fetch.php/courses/a6m33ssl/pms_prit.pdf s laskavým svoleím autora. Itervalové odhady 2 Itervalové odhady................................................................................................. 4 Odhad, zámé................................................................................................. 5 Iterpretace........................................................................................................ 6 Souvislosti......................................................................................................... 8 Rozsah výběru...................................................................................................... 9 Odhad, ez................................................................................................... 10 t-rozděleí........................................................................................................ 11 Př: odhad....................................................................................................... 12 Odhad rozptylu................................................................................................... 13 Odhad q.......................................................................................................... 14 Př: Odhad q....................................................................................................... 15 Shrutí........................................................................................................... 16 1

Itervalové odhady 2 / 16 Itervalový odhad Víte, kolik statistiků je potřeba k výměě ˇzárovky? 1 aˇz 3. Se spolehlivostí 95 %. P. Pošík c 2017 A6M33SSL: Statistika a spolehlivost v lékařství 3 / 16 Itervalové odhady Dosud jsme skutečou hodotu parametru θ ahrazovali bodovým odhadem Θ (coˇz je áhodá veličia). Obvykle se sado spočítá, ale kdo ví, jak dobrý je to odhad? Jak moc se můˇze změit, vypočteme-li jej z jié realizace áh. výběru? Nyí budeme hledat itervalový odhad, tzv. iterval spolehlivosti I, coˇz je miimálí iterval takový, ˇze P[θ I] 1 α, tj. pravděpodobost, ˇze iterval I pokryje skutečou (ezámou) hodotu parametru θ, je 1 α, kde α (0, 1) je pravděpodobost, ˇze iterval I epokryje skutečou hodotu θ, a 1 α je koeficiet spolehlivosti. Hledáme jedostraé odhady, dolí (levostraý), resp. horí (pravostraý), kdy I = q Θ (α), ), resp. I = (, q Θ (1 α), ebo (symetrický) oboustraý odhad ( α ( I = q Θ, 2) q Θ 1 α ). 2 K tomu potřebujeme zát rozděleí odhadu Θ. P. Pošík c 2017 A6M33SSL: Statistika a spolehlivost v lékařství 4 / 16 2

Normálí rozděleí: itervalový odhad při zámém Mějme realizaci áhodého výběru = ( 1,..., ) z ormálího rozděleí N(, ). Rozptyl záme, chceme odhadout. Středí hodotu odhademe výběrovým průměrem s rozděleím N(, σ2 ). Pro kvatilovou fukci ormálího rozděleí platí: q N(, ) (α) = +q N(0, ) (α) = +σφ 1 (α) Z defiice kvatilové fukce platí pro [ ( ] [ ] P, q ( ) (1 α) = P q ( ) (1 α) = 1 α = N, σ2 N, σ2 ] [ = P q ( ) (1 α) N 0, σ2 [ = P σ Φ 1 (1 α), coˇz stačí v době počítačů, a dále ], coˇz je uté pro hledáí v tabulkách. Pro dolí, horí, resp. oboustraý itervalový odhad pak dostáváme σ ) Φ 1 (1 α),, (, + σ Φ 1 (1 α), resp. σ Φ 1( 1 α ), + σ Φ 1( 1 α 2 2). Při výpočtu pak ahradíme výběrový průměr jeho realizací. P. Pošík c 2017 A6M33SSL: Statistika a spolehlivost v lékařství 5 / 16 Iterpretace itervalových odhadů Příklad: Náhodá veličia N(, ), záme, chceme odhadout pomocí áhodého výběru. Defiujme maimálí chybu odhadu jako = σ Φ 1( 1 α 2). Iterval, v ěmˇz se bude acházet (1 α) 100 % hodot.v. : + Iterval, v ěmˇz se bude acházet (1 α) 100 % hodot výběrových průměrů : + Pro m růzých realizací. výběrů : + m růzých realizací itervalu spolehlivosti: + + + + + + + + + Cca v αm případech bude leˇzet uvitř tohoto itervalu. Toto eí iterval spolehlivosti! Iterval spolehlivosti je áhodý v tom smyslu, ˇze je urče áhodou veličiou! Toto jsou itervaly spolehlivosti! P. Pošík c 2017 A6M33SSL: Statistika a spolehlivost v lékařství 6 / 16 3

Iterpretace itervalových odhadů (pokr.) Příklad (pokr.): Pro itervalový odhad středí hodoty můˇzeme před provedeím eperimetu (získáím realizace áhodého výběru) říci: Výsledý 95% iterval spolehlivosti bude skutečou (ezámou, ale kostatí) středí hodotu rozděleí obsahovat (překrývat) s pravděpodobostí 95 %. Po provedeí eperimetu můˇzeme dostat výsledek apř.: 95% iterval spolehlivosti pro středí hodotu je (0.1, 0.4). Platí ásledující výroky? Skutečá středí hodota leˇzí mezi 0.1 a 0.4 s 95% pravděpodobostí. Skutečá středí hodota leˇzí mezi 0.1 a 0.4 s 95% pravděpodobostí. Můˇzeme si být a 95 % jistí, ˇze skutečá středí hodota leˇzí mezi 0.1 a 0.4. Můˇzeme si být a 95 % jistí, ˇze skutečá středí hodota leˇzí mezi 0.1 a 0.4. Kdybychom opakovali eperimet zovu a zovu, pak by v 95 % případů skutečá středí hodota leˇzela mezi 0.1 a 0.4. Kdybychom opakovali eperimet zovu a zovu, pak by v 95 % případů skutečá středí hodota leˇzela mezi 0.1 a 0.4. Proč eplatí? Skutečá hodota parametru je kostatí; bud uvitř itervalu jistě je ebo jistě eí, ˇzádá jiá moˇzost eeistuje. Nemá smysl mluvit o pravděpodobosti. Iterval spolehlivosti eí vlastostí parametru (abychom mohli říct, ˇze skutečá hodota parametru se achází uvitř itervalu s pstí... ), ale je vlastostí procedury odhadu (estimátoru). Spíše umoˇzňuje posoudit chybu odhadu. P. Pošík c 2017 A6M33SSL: Statistika a spolehlivost v lékařství 7 / 16 Souvislost rozsahu výběru, ma. chyby odhadu a spolehlivosti Ve vztahu pro oboustraý iterval spolehlivosti P [ + ] = 1 α, kde = σ Φ 1( 1 α 2), vystupují ásledující proměé: koeficiet spolehlivosti P = 1 α, tj. míra aší důvěry ve výrok o poloze, chyba odhadu středí hodoty (pro oboustraý iterval spolehlivosti I = 2 ), tj. ejistota při určeí hodoty parametru, a rozsah výběru. Tyto proměé spolu souvisí ásledujícím způsobem: P kostatí kostattí kostattí ր ց ր Pր P ր ր P. Pošík c 2017 A6M33SSL: Statistika a spolehlivost v lékařství 8 / 16 4

Výpočet potřebého rozsahu výběru Pro oboustraý iterval spolehlivosti I =, + platí, ˇze P [ + ] 1 α, kde = σ Φ 1( 1 α 2). Staovíme-li maimálí přípustou chybu odhadu ma, můˇzeme určit potřebý rozsah výběru mi při poˇzadovaé spolehlivosti 1 α: ma = σ Φ 1( 1 α ), 2 ( σ Φ 1( 1 α ) ) 2 = mi. ma 2 Pro jedostraé itervaly spolehlivosti lze postupovat obdobě, apř. pro horí itervalový odhad I = (, + platí, ˇze P [ + ] 1 α, kde = σ Φ 1 (1 α). Staovíme-li maimálí přípustou chybu odhadu ma, můˇzeme určit potřebý rozsah výběru mi při poˇzadovaé spolehlivosti 1 α: ma = σ Φ 1 (1 α), ( ) σ 2 Φ 1 (1 α) = mi. ma P. Pošík c 2017 A6M33SSL: Statistika a spolehlivost v lékařství 9 / 16 Normálí rozděleí: itervalový odhad při ezámém Středí hodotu odhademe výběrovým průměrem s rozděleím N(, σ2 ). Rozptyl odhademe výběrovým rozptylem S 2 ; ( 1)S2 má rozděleí χ 2 ( 1). Pouˇzití odhadu rozptylu místo skutečé hodoty rozptylu je další zdroj eurčitosti; abychom zachovali koeficiet spolehlivosti 1 α, musíme rozšířit iterval spolehlivosti, tj. pouˇzít kvatily jiého rozděleí: Studetovo t-rozděleí s 1 stupi volosti, t( 1). Z toho vyplývají ásledující itervalové odhady: S ) q t( 1) (1 α),, (, + S q t( 1) (1 α), S ( q t( 1) 1 α ), + S ( q 2 t( 1) 1 α 2). Při výpočtu ahradíme výběrový průměr jeho realizací a výběrovou směrodatou odchylku S její realizací s. P. Pošík c 2017 A6M33SSL: Statistika a spolehlivost v lékařství 10 / 16 5

Studetovo rozděleí Studetovo t-rozděleí s η stupi volosti, t(η) je rozděleí áhodé veličiy kde U Vη, U má rozděleí N(0, 1), V má rozděleí χ 2 (η) a U a V jsou ezávislé. Hustota: 0.4 0.35 0.3 0.25 f t() () 0.2 0.15 Normálí rozděleí vs. t-rozděleí N(0, 1) t(1) t(2) t(3) t(5) t(10) t(50) Pro velký počet stupňů volosti se ahrazuje ormálím rozděleím. 0.1 0.05 0 3 2 1 0 1 2 3 V případě odhadu středí hodoty při ezámém rozptylu U = ( ) má N(0, 1), σ V = ( 1)S2 má χ 2 ( 1), η = 1, σ ( ) = S 2 U Vη = S ( ) má t( 1), z čehoˇz vyplývají odhady a předchozím slidu. P. Pošík c 2017 A6M33SSL: Statistika a spolehlivost v lékařství 11 / 16 Příklad: itervalové odhady při ezámém Zadáí: Vliv alkoholismu matky a iteligeci dítěte. Nalezeo 6 ˇze, které byly v době těhoteství chroickými alkoholičkami. IQ jejich dětí bylo změřeo v 7 letech: = 6, = 78, i=1 ( i ) 2 = 1805. Vypočtěte horí a oboustraý 95% iterval spolehlivosti pro středí hodotu rozděleí IQ dětí alkoholiček. Řešeí: Předpokládáme, ˇze výběr alkoholiček byl áhodý. Protoˇze výběrový rozptyl odhadujeme a rozsah výběru je malý, pouˇzijeme kvatily Studetova rozděleí. Pro výběrovou směrodatou odchylku a oboustraý iterval spolehlivosti platí 1 s = 1 i=1 = ± s ( q t( 1) 1 α 2 a pro horí odhad 1805 ( i ) 2 = = 19 5 ) = 78± 19 6 2.57 = 78±19.94 = 58.06, 97.94, + s q t( 1) (1 α) = 78+ 19 6 2.02 = 78+15.63 = 93.63. Závěry: 1. S pravděpodobostí 95 % středí hodota rozděleí IQ dětí alkoholiček leˇzí v58.06, 97.94. 2. S pravděpodobostí 95 % středí hodota rozděleí IQ dětí alkoholiček epřekročí 93.96. 3. Kdybychom eperimet prováděli opakovaě a itervaly spolehlivosti kostruovali výše uvedeým způsobem, pak by v cca 95 % případů iterval obsahoval skutečou středí hodotu. P. Pošík c 2017 A6M33SSL: Statistika a spolehlivost v lékařství 12 / 16 6

Itervalový odhad rozptylu Rozptyl odhademe výběrovým rozptylem S 2 ;.v. ( 1)S2 P[ ( 1)S 2 ( 1)S 2 = P[ [ = P ] (, q χ 2 ( 1) (1 α) = 1 α = ] [ q χ 2 ( 1) (1 α) = P ( 1)S 2 q χ 2 ( 1) (1 α), )] Dostali jsme dolí odhad, ostatí obdobě. ( 1)S 2 σ2 q χ 2 ( 1)(1 α) Dolí, horí a oboustraý itervalové odhady rozptylu jsou ) ( ( 1)S 2 q χ 2 ( 1) (1 α), ( 1)S 2,, q χ 2 ( 1) (α), ( 1)S 2 ( 1)S ( ) 2 q χ 2 ( 1) 1 α, ( 2 q α2 ). χ 2 ( 1) Při výpočtu ahradíme výběrový rozptyl S 2 jeho realizací s2. má rozděleí χ 2 ( 1). Všiměte si: oboustraý odhad rozptylu eí symetrický kolem bodového odhadu S 2! P. Pošík c 2017 A6M33SSL: Statistika a spolehlivost v lékařství 13 / 16 ] = Alterativí rozděleí: odhad populačí pravděpodobosti q Mějme áhodý výběr rozsahu, = { 1,..., }, kde i {0, 1}, i Ber(q). Populačí pravděpodobost q odhademe výběrovou relativí četostí = 1 i=1 i. Pro dostatečě velký rozsah výběru ( > 100) lze rozděleí výběrových relativích četostí aproimovat ormálím rozděleím, ( N q, q(1 q) ) ( N q, ) (1 ), a pouˇzít itervaly spolehlivosti pro středí hodotu ormálího rozděleí: (1 ) Φ 1 (1 α), (1 ),, + Φ 1 (1 α), (1 ) resp. Φ 1( 1 α ) (1 ), + Φ 1( 1 α 2 2). Při výpočtu pak ahradíme výběrovou relativí četost její realizací. Při malém rozsahu výběru ( < 100) je třeba hledat kvatily rozděleí výběrových relativích četostí ve speciálích tabulkách. P. Pošík c 2017 A6M33SSL: Statistika a spolehlivost v lékařství 14 / 16 7

Příklad: Odhad populačí pravděpodobosti q Zadáí: V roce 1973 bylo a Berkeley přijato 3700 z 8300 uchazečů muˇzského pohlaví a 1500 z 4300 uchazečů ˇzeského pohlaví. Vypočtete 95% oboustraé itervaly spolehlivosti (α = 0.05) pro pravděpodobosti přijetí u muˇzů, q M a u ˇze q Z. Řešeí: Itervaly spolehlivosti pro populačí pravděpodobosti přijetí u muˇzů a u ˇze: M = 3700 8300 = 0.4458 Z = 1500 4300 = 0.3488 q M = M ± Φ 1( 1 α ) M (1 M ) = 2 M 0.4458(1 0.4458) = 0.4458±1.96 = 44.58±1.07% 8300 q Z = Z ± Φ 1( 1 α ) Z (1 Z ) = 2 Z 0.3488(1 0.3488) = 0.3488±1.96 = 34.88±1.42% 4300 Co můˇzete říct o rozdílu mezi pravděpodobostmi přijetí? Je to důkaz pohlaví diskrimiace? Odpovědi v příštích předáškách. P. Pošík c 2017 A6M33SSL: Statistika a spolehlivost v lékařství 15 / 16 Shrutí: Odhady parametrů Výběrové statistiky (apř., S 2, apod.), resp. jejich realizace (, s2, apod.), se pouˇzívají k odhadu populačích parametrů (,, apod.). Jsou to bodové odhady. Itervalové odhady jsou lepší eˇz bodové odhady v tom smyslu, ˇze umoˇzňují posoudit epřesost procedury odhadu. P. Pošík c 2017 A6M33SSL: Statistika a spolehlivost v lékařství 16 / 16 8