Intervalové odhady parametrů

Podobné dokumenty
Intervalové odhady parametrů některých rozdělení.

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

Odhady parametrů 1. Odhady parametrů

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

V. Normální rozdělení

Náhodný výběr 1. Náhodný výběr

PRAVDĚPODOBNOST A STATISTIKA

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

8. Odhady parametrů rozdělení pravděpodobnosti

12. N á h o d n ý v ý b ě r

Teorie odhadů 2 Teorie odhadů... 3 Odhad parametrů... 4

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

0,063 0,937 0,063 0, P 0,048 0,078 0,95. = funkce CONFIDENCE.NORM(2α; p(1 p)

Intervalový odhad. nazveme levostranným intervalem pro odhad parametru Θ. Statistiku. , kde číslo α je blízké nule, nazveme horním

veličiny má stejný řád jako je řád poslední číslice nejistoty. Nejistotu píšeme obvykle jenom jednou

VYSOCE PŘESNÉ METODY OBRÁBĚNÍ

Pravděpodobnostní model doby setrvání ministra školství ve funkci

Úloha II.S... odhadnutelná

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika

Přednáška VI. Intervalové odhady. Motivace Směrodatná odchylka a směrodatná chyba Centrální limitní věta Intervaly spolehlivosti

Mezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby.

14. B o d o v é o d h a d y p a r a m e t r ů

Kvantily. Problems on statistics.nb 1

Popisná statistika. Zdeněk Janák 9. prosince 2007

Číselné charakteristiky náhodných veličin

Úloha III.S... limitní

vají statistické metody v biomedicíně Literatura Statistika v biomedicínsk nském výzkumu a ve zdravotnictví

PRAVDĚPODOBNOST A STATISTIKA

4. B o d o v é o d h a d y p a r a m e t r ů

8. Analýza rozptylu.

Závislost slovních znaků

Přednáška VIII. Testování hypotéz o kvantitativních proměnných

vají statistické metody v biomedicíně

jako konstanta nula. Obsahem centrálních limitních vět je tvrzení, že distribuční funkce i=1 X i konvergují za určitých

14. Testování statistických hypotéz Úvod statistické hypotézy Definice 14.1 Statistickou hypotézou parametrickou neparametrickou. nulovou testovanou

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

7. Odhady populačních průměrů a ostatních parametrů populace

MOŽNOSTI STATISTICKÉHO POSOUZENÍ KVANTITATIVNÍCH VÝSLEDKŮ POŽÁRNÍCH ZKOUŠEK PRO POTŘEBY CERTIFIKACE A POSUZOVÁNÍ SHODY VÝROBKŮ

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Fakulta strojního inženýrství. Matematika IV. Semestrální práce

P2: Statistické zpracování dat

Testování statistických hypotéz

a další charakteristikou je četnost výběrového souboru n.

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

Testujeme hypotézu: proti alternativě. Jednoduché třídění:

UPLATNĚNÍ ZKOUŠEK PŘI PROHLÍDKÁCH MOSTŮ

2. Náhodná veličina. je konečná nebo spočetná množina;

EKONOMETRIE 9. přednáška Zobecněný lineární regresní model

17. Statistické hypotézy parametrické testy

Teorie chyb a vyrovnávací počet. Obsah:

Pravděpodobnost a aplikovaná statistika

Odhad parametru p binomického rozdělení a test hypotézy o tomto parametru. Test hypotézy o parametru p binomického rozdělení

Nejistoty měření. Aritmetický průměr. Odhad směrodatné odchylky výběrového průměru = nejistota typu A

Pravděpodobnostní modely

Při sledování a studiu vlastností náhodných výsledků poznáme charakter. podmínek různé výsledky. Ty odpovídají hodnotám jednotlivých realizací

PRAVDĚPODOBNOST A STATISTIKA. Bodové a intervalové odhady

Zhodnocení přesnosti měření

Seriál XXX.II Zpracování dat fyzikálních měření

Deskriptivní statistika 1

Pravděpodobnost vs. statistika. Data. Teorie pravděpodobnosti pracuje s jednou nebo více teoretickými náhodnými

Náhodný výběr, statistiky a bodový odhad

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

základním prvkem teorie křivek v počítačové grafice křivky polynomiální n

} kvantitativní znaky. korelace, regrese. Prof. RNDr. Jana Zvárov. Obecné principy

NEPARAMETRICKÉ METODY

7. cvičení 4ST201-řešení

3. Hodnocení přesnosti měření a vytyčování. Odchylky a tolerance ve výstavbě.

n-rozměrné normální rozdělení pravděpodobnosti

3. Lineární diferenciální rovnice úvod do teorie

3. VYBRANÉ ZÁKONY ROZDĚLENÍ POUŽÍVANÉ VE SPOLEHLIVOSTI

FUNKCÍ JEDNÉ REÁLNÉ PROMĚNNÉ PRVNÍ DIFERENCIÁL

Přednášky část 7 Statistické metody vyhodnocování dat

Interval spolehlivosti pro podíl

Pevnost a životnost - Hru III 1. PEVNOST a ŽIVOTNOST. Hru III. Milan Růžička, Josef Jurenka, Zbyněk Hrubý.

PRAVDĚPODOBNOST A STATISTIKA

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE

8.2.1 Aritmetická posloupnost

Odhad parametrů normálního rozdělení a testy hypotéz o těchto parametrech * Věty o výběru z normálního rozdělení

Základní požadavky a pravidla měření

8.2.1 Aritmetická posloupnost I

PRAVDĚPODOBNOST A STATISTIKA

Dynamická pevnost a životnost Statistika

Test dobré shody se používá nejčastěji pro ověřování těchto hypotéz:

Statistika pro metrologii

3. Charakteristiky a parametry náhodných veličin

Užití binomické věty

8 DALŠÍ SPOJITÁ ROZDĚLENÍ PRAVDĚPODOBNOSTI

Pravděpodobnost a statistika Výpisky z cvičení Ondřeje Chocholy

6. P o p i s n á s t a t i s t i k a

,6 32, ,6 29,7 29,2 35,9 32,6 34,7 35,3

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor nezávislost, funkce náhodného vektoru

Základy statistiky. Zpracování pokusných dat Praktické příklady. Kristina Somerlíková

Náhodu bychom mohli definovat jako součet velkého počtu drobných nepoznaných vlivů.

Statistika. Statistické funkce v tabulkových kalkulátorech MSO Excel a OO.o Calc

FITOVÁNÍ ROZDĚLENÍ PRAVDĚPODOBNOSTI PRO APLIKACE

Transkript:

Itervalové odhady parametrů Petr Pošík Části dokumetu jsou převzaty (i doslově) z Mirko Navara: Pravděpodobost a matematická statistika, https://cw.felk.cvut.cz/lib/ee/fetch.php/courses/a6m33ssl/pms_prit.pdf s laskavým svoleím autora. Itervalové odhady 2 Itervalové odhady................................................................................................. 4 Odhad, zámé................................................................................................. 5 Iterpretace........................................................................................................ 6 Souvislosti......................................................................................................... 8 Rozsah výběru...................................................................................................... 9 Odhad, ez................................................................................................... 10 t-rozděleí........................................................................................................ 11 Př: odhad....................................................................................................... 12 Odhad rozptylu................................................................................................... 13 Odhad q.......................................................................................................... 14 Př: Odhad q....................................................................................................... 15 Shrutí........................................................................................................... 16 1

Itervalové odhady 2 / 16 Itervalový odhad Víte, kolik statistiků je potřeba k výměě ˇzárovky? 1 aˇz 3. Se spolehlivostí 95 %. P. Pošík c 2017 A6M33SSL: Statistika a spolehlivost v lékařství 3 / 16 Itervalové odhady Dosud jsme skutečou hodotu parametru θ ahrazovali bodovým odhadem Θ (coˇz je áhodá veličia). Obvykle se sado spočítá, ale kdo ví, jak dobrý je to odhad? Jak moc se můˇze změit, vypočteme-li jej z jié realizace áh. výběru? Nyí budeme hledat itervalový odhad, tzv. iterval spolehlivosti I, coˇz je miimálí iterval takový, ˇze P[θ I] 1 α, tj. pravděpodobost, ˇze iterval I pokryje skutečou (ezámou) hodotu parametru θ, je 1 α, kde α (0, 1) je pravděpodobost, ˇze iterval I epokryje skutečou hodotu θ, a 1 α je koeficiet spolehlivosti. Hledáme jedostraé odhady, dolí (levostraý), resp. horí (pravostraý), kdy I = q Θ (α), ), resp. I = (, q Θ (1 α), ebo (symetrický) oboustraý odhad ( α ( I = q Θ, 2) q Θ 1 α ). 2 K tomu potřebujeme zát rozděleí odhadu Θ. P. Pošík c 2017 A6M33SSL: Statistika a spolehlivost v lékařství 4 / 16 2

Normálí rozděleí: itervalový odhad při zámém Mějme realizaci áhodého výběru = ( 1,..., ) z ormálího rozděleí N(, ). Rozptyl záme, chceme odhadout. Středí hodotu odhademe výběrovým průměrem s rozděleím N(, σ2 ). Pro kvatilovou fukci ormálího rozděleí platí: q N(, ) (α) = +q N(0, ) (α) = +σφ 1 (α) Z defiice kvatilové fukce platí pro [ ( ] [ ] P, q ( ) (1 α) = P q ( ) (1 α) = 1 α = N, σ2 N, σ2 ] [ = P q ( ) (1 α) N 0, σ2 [ = P σ Φ 1 (1 α), coˇz stačí v době počítačů, a dále ], coˇz je uté pro hledáí v tabulkách. Pro dolí, horí, resp. oboustraý itervalový odhad pak dostáváme σ ) Φ 1 (1 α),, (, + σ Φ 1 (1 α), resp. σ Φ 1( 1 α ), + σ Φ 1( 1 α 2 2). Při výpočtu pak ahradíme výběrový průměr jeho realizací. P. Pošík c 2017 A6M33SSL: Statistika a spolehlivost v lékařství 5 / 16 Iterpretace itervalových odhadů Příklad: Náhodá veličia N(, ), záme, chceme odhadout pomocí áhodého výběru. Defiujme maimálí chybu odhadu jako = σ Φ 1( 1 α 2). Iterval, v ěmˇz se bude acházet (1 α) 100 % hodot.v. : + Iterval, v ěmˇz se bude acházet (1 α) 100 % hodot výběrových průměrů : + Pro m růzých realizací. výběrů : + m růzých realizací itervalu spolehlivosti: + + + + + + + + + Cca v αm případech bude leˇzet uvitř tohoto itervalu. Toto eí iterval spolehlivosti! Iterval spolehlivosti je áhodý v tom smyslu, ˇze je urče áhodou veličiou! Toto jsou itervaly spolehlivosti! P. Pošík c 2017 A6M33SSL: Statistika a spolehlivost v lékařství 6 / 16 3

Iterpretace itervalových odhadů (pokr.) Příklad (pokr.): Pro itervalový odhad středí hodoty můˇzeme před provedeím eperimetu (získáím realizace áhodého výběru) říci: Výsledý 95% iterval spolehlivosti bude skutečou (ezámou, ale kostatí) středí hodotu rozděleí obsahovat (překrývat) s pravděpodobostí 95 %. Po provedeí eperimetu můˇzeme dostat výsledek apř.: 95% iterval spolehlivosti pro středí hodotu je (0.1, 0.4). Platí ásledující výroky? Skutečá středí hodota leˇzí mezi 0.1 a 0.4 s 95% pravděpodobostí. Skutečá středí hodota leˇzí mezi 0.1 a 0.4 s 95% pravděpodobostí. Můˇzeme si být a 95 % jistí, ˇze skutečá středí hodota leˇzí mezi 0.1 a 0.4. Můˇzeme si být a 95 % jistí, ˇze skutečá středí hodota leˇzí mezi 0.1 a 0.4. Kdybychom opakovali eperimet zovu a zovu, pak by v 95 % případů skutečá středí hodota leˇzela mezi 0.1 a 0.4. Kdybychom opakovali eperimet zovu a zovu, pak by v 95 % případů skutečá středí hodota leˇzela mezi 0.1 a 0.4. Proč eplatí? Skutečá hodota parametru je kostatí; bud uvitř itervalu jistě je ebo jistě eí, ˇzádá jiá moˇzost eeistuje. Nemá smysl mluvit o pravděpodobosti. Iterval spolehlivosti eí vlastostí parametru (abychom mohli říct, ˇze skutečá hodota parametru se achází uvitř itervalu s pstí... ), ale je vlastostí procedury odhadu (estimátoru). Spíše umoˇzňuje posoudit chybu odhadu. P. Pošík c 2017 A6M33SSL: Statistika a spolehlivost v lékařství 7 / 16 Souvislost rozsahu výběru, ma. chyby odhadu a spolehlivosti Ve vztahu pro oboustraý iterval spolehlivosti P [ + ] = 1 α, kde = σ Φ 1( 1 α 2), vystupují ásledující proměé: koeficiet spolehlivosti P = 1 α, tj. míra aší důvěry ve výrok o poloze, chyba odhadu středí hodoty (pro oboustraý iterval spolehlivosti I = 2 ), tj. ejistota při určeí hodoty parametru, a rozsah výběru. Tyto proměé spolu souvisí ásledujícím způsobem: P kostatí kostattí kostattí ր ց ր Pր P ր ր P. Pošík c 2017 A6M33SSL: Statistika a spolehlivost v lékařství 8 / 16 4

Výpočet potřebého rozsahu výběru Pro oboustraý iterval spolehlivosti I =, + platí, ˇze P [ + ] 1 α, kde = σ Φ 1( 1 α 2). Staovíme-li maimálí přípustou chybu odhadu ma, můˇzeme určit potřebý rozsah výběru mi při poˇzadovaé spolehlivosti 1 α: ma = σ Φ 1( 1 α ), 2 ( σ Φ 1( 1 α ) ) 2 = mi. ma 2 Pro jedostraé itervaly spolehlivosti lze postupovat obdobě, apř. pro horí itervalový odhad I = (, + platí, ˇze P [ + ] 1 α, kde = σ Φ 1 (1 α). Staovíme-li maimálí přípustou chybu odhadu ma, můˇzeme určit potřebý rozsah výběru mi při poˇzadovaé spolehlivosti 1 α: ma = σ Φ 1 (1 α), ( ) σ 2 Φ 1 (1 α) = mi. ma P. Pošík c 2017 A6M33SSL: Statistika a spolehlivost v lékařství 9 / 16 Normálí rozděleí: itervalový odhad při ezámém Středí hodotu odhademe výběrovým průměrem s rozděleím N(, σ2 ). Rozptyl odhademe výběrovým rozptylem S 2 ; ( 1)S2 má rozděleí χ 2 ( 1). Pouˇzití odhadu rozptylu místo skutečé hodoty rozptylu je další zdroj eurčitosti; abychom zachovali koeficiet spolehlivosti 1 α, musíme rozšířit iterval spolehlivosti, tj. pouˇzít kvatily jiého rozděleí: Studetovo t-rozděleí s 1 stupi volosti, t( 1). Z toho vyplývají ásledující itervalové odhady: S ) q t( 1) (1 α),, (, + S q t( 1) (1 α), S ( q t( 1) 1 α ), + S ( q 2 t( 1) 1 α 2). Při výpočtu ahradíme výběrový průměr jeho realizací a výběrovou směrodatou odchylku S její realizací s. P. Pošík c 2017 A6M33SSL: Statistika a spolehlivost v lékařství 10 / 16 5

Studetovo rozděleí Studetovo t-rozděleí s η stupi volosti, t(η) je rozděleí áhodé veličiy kde U Vη, U má rozděleí N(0, 1), V má rozděleí χ 2 (η) a U a V jsou ezávislé. Hustota: 0.4 0.35 0.3 0.25 f t() () 0.2 0.15 Normálí rozděleí vs. t-rozděleí N(0, 1) t(1) t(2) t(3) t(5) t(10) t(50) Pro velký počet stupňů volosti se ahrazuje ormálím rozděleím. 0.1 0.05 0 3 2 1 0 1 2 3 V případě odhadu středí hodoty při ezámém rozptylu U = ( ) má N(0, 1), σ V = ( 1)S2 má χ 2 ( 1), η = 1, σ ( ) = S 2 U Vη = S ( ) má t( 1), z čehoˇz vyplývají odhady a předchozím slidu. P. Pošík c 2017 A6M33SSL: Statistika a spolehlivost v lékařství 11 / 16 Příklad: itervalové odhady při ezámém Zadáí: Vliv alkoholismu matky a iteligeci dítěte. Nalezeo 6 ˇze, které byly v době těhoteství chroickými alkoholičkami. IQ jejich dětí bylo změřeo v 7 letech: = 6, = 78, i=1 ( i ) 2 = 1805. Vypočtěte horí a oboustraý 95% iterval spolehlivosti pro středí hodotu rozděleí IQ dětí alkoholiček. Řešeí: Předpokládáme, ˇze výběr alkoholiček byl áhodý. Protoˇze výběrový rozptyl odhadujeme a rozsah výběru je malý, pouˇzijeme kvatily Studetova rozděleí. Pro výběrovou směrodatou odchylku a oboustraý iterval spolehlivosti platí 1 s = 1 i=1 = ± s ( q t( 1) 1 α 2 a pro horí odhad 1805 ( i ) 2 = = 19 5 ) = 78± 19 6 2.57 = 78±19.94 = 58.06, 97.94, + s q t( 1) (1 α) = 78+ 19 6 2.02 = 78+15.63 = 93.63. Závěry: 1. S pravděpodobostí 95 % středí hodota rozděleí IQ dětí alkoholiček leˇzí v58.06, 97.94. 2. S pravděpodobostí 95 % středí hodota rozděleí IQ dětí alkoholiček epřekročí 93.96. 3. Kdybychom eperimet prováděli opakovaě a itervaly spolehlivosti kostruovali výše uvedeým způsobem, pak by v cca 95 % případů iterval obsahoval skutečou středí hodotu. P. Pošík c 2017 A6M33SSL: Statistika a spolehlivost v lékařství 12 / 16 6

Itervalový odhad rozptylu Rozptyl odhademe výběrovým rozptylem S 2 ;.v. ( 1)S2 P[ ( 1)S 2 ( 1)S 2 = P[ [ = P ] (, q χ 2 ( 1) (1 α) = 1 α = ] [ q χ 2 ( 1) (1 α) = P ( 1)S 2 q χ 2 ( 1) (1 α), )] Dostali jsme dolí odhad, ostatí obdobě. ( 1)S 2 σ2 q χ 2 ( 1)(1 α) Dolí, horí a oboustraý itervalové odhady rozptylu jsou ) ( ( 1)S 2 q χ 2 ( 1) (1 α), ( 1)S 2,, q χ 2 ( 1) (α), ( 1)S 2 ( 1)S ( ) 2 q χ 2 ( 1) 1 α, ( 2 q α2 ). χ 2 ( 1) Při výpočtu ahradíme výběrový rozptyl S 2 jeho realizací s2. má rozděleí χ 2 ( 1). Všiměte si: oboustraý odhad rozptylu eí symetrický kolem bodového odhadu S 2! P. Pošík c 2017 A6M33SSL: Statistika a spolehlivost v lékařství 13 / 16 ] = Alterativí rozděleí: odhad populačí pravděpodobosti q Mějme áhodý výběr rozsahu, = { 1,..., }, kde i {0, 1}, i Ber(q). Populačí pravděpodobost q odhademe výběrovou relativí četostí = 1 i=1 i. Pro dostatečě velký rozsah výběru ( > 100) lze rozděleí výběrových relativích četostí aproimovat ormálím rozděleím, ( N q, q(1 q) ) ( N q, ) (1 ), a pouˇzít itervaly spolehlivosti pro středí hodotu ormálího rozděleí: (1 ) Φ 1 (1 α), (1 ),, + Φ 1 (1 α), (1 ) resp. Φ 1( 1 α ) (1 ), + Φ 1( 1 α 2 2). Při výpočtu pak ahradíme výběrovou relativí četost její realizací. Při malém rozsahu výběru ( < 100) je třeba hledat kvatily rozděleí výběrových relativích četostí ve speciálích tabulkách. P. Pošík c 2017 A6M33SSL: Statistika a spolehlivost v lékařství 14 / 16 7

Příklad: Odhad populačí pravděpodobosti q Zadáí: V roce 1973 bylo a Berkeley přijato 3700 z 8300 uchazečů muˇzského pohlaví a 1500 z 4300 uchazečů ˇzeského pohlaví. Vypočtete 95% oboustraé itervaly spolehlivosti (α = 0.05) pro pravděpodobosti přijetí u muˇzů, q M a u ˇze q Z. Řešeí: Itervaly spolehlivosti pro populačí pravděpodobosti přijetí u muˇzů a u ˇze: M = 3700 8300 = 0.4458 Z = 1500 4300 = 0.3488 q M = M ± Φ 1( 1 α ) M (1 M ) = 2 M 0.4458(1 0.4458) = 0.4458±1.96 = 44.58±1.07% 8300 q Z = Z ± Φ 1( 1 α ) Z (1 Z ) = 2 Z 0.3488(1 0.3488) = 0.3488±1.96 = 34.88±1.42% 4300 Co můˇzete říct o rozdílu mezi pravděpodobostmi přijetí? Je to důkaz pohlaví diskrimiace? Odpovědi v příštích předáškách. P. Pošík c 2017 A6M33SSL: Statistika a spolehlivost v lékařství 15 / 16 Shrutí: Odhady parametrů Výběrové statistiky (apř., S 2, apod.), resp. jejich realizace (, s2, apod.), se pouˇzívají k odhadu populačích parametrů (,, apod.). Jsou to bodové odhady. Itervalové odhady jsou lepší eˇz bodové odhady v tom smyslu, ˇze umoˇzňují posoudit epřesost procedury odhadu. P. Pošík c 2017 A6M33SSL: Statistika a spolehlivost v lékařství 16 / 16 8