Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Podobné dokumenty
Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

Testování statistických hypotéz

KGG/STG Statistika pro geografy

Testování statistických hypotéz

Statistika. Základní pojmy a cíle statistiky. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

STATISTICKÉ ODHADY Odhady populačních charakteristik

Pravděpodobnost a aplikovaná statistika

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové Odhady Parametrů

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Charakteristika datového souboru

Tomáš Karel LS 2012/2013

Testy. Pavel Provinský. 19. listopadu 2013

Základy teorie pravděpodobnosti

Testování statistických hypotéz. Obecný postup

PRAVDĚPODOBNOST A STATISTIKA

Pravděpodobnost a matematická statistika

Ing. Michael Rost, Ph.D.

STATISTICKÉ ZJIŠŤOVÁNÍ

Statistika. Testování hypotéz - statistická indukce Parametrické testy. Roman Biskup

6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový.

Intervalové Odhady Parametrů II Testování Hypotéz

Cvičení ze statistiky - 8. Filip Děchtěrenko

Výběrové charakteristiky a jejich rozdělení

Odhady parametrů základního souboru. Cvičení 6 Statistické metody a zpracování dat 1 (podzim 2016) Brno, říjen listopad 2016 Ambrožová Klára

STATISTICKÉ HYPOTÉZY

5. Odhady parametrů. KGG/STG Zimní semestr

Zápočtová práce STATISTIKA I

Normální (Gaussovo) rozdělení

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Příklady na testy hypotéz o parametrech normálního rozdělení

Náhodné veličiny, náhodné chyby

LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR

8. Normální rozdělení

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

4EK211 Základy ekonometrie

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

12. prosince n pro n = n = 30 = S X

Základy teorie pravděpodobnosti

Téma 22. Ondřej Nývlt

Statistika. Testování hypotéz statistická indukce Neparametrické testy. Roman Biskup

Aproximace binomického rozdělení normálním

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

12. cvičení z PST. 20. prosince 2017

Limitní věty teorie pravděpodobnosti. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

5 Parametrické testy hypotéz

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

= = 2368

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Testy statistických hypotéz

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

15. T e s t o v á n í h y p o t é z

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Regresní analýza 1. Regresní analýza

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

prosince oboustranný symetrický 95% interval spolehlivosti pro střední hodnotu životnosti τ. X i. X = 1 n.. Podle CLV má veličina

Testování statistických hypotéz

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

PRAVDĚPODOBNOST A STATISTIKA

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

4ST201 STATISTIKA CVIČENÍ Č. 7

Test z teorie VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

MATEMATICKÁ STATISTIKA

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace

Charakterizace rozdělení

15. T e s t o v á n í h y p o t é z

1. (18 bod ) Náhodná veli ina X je po et rub p i 400 nezávislých hodech mincí. a) Pomocí ƒeby²evovy nerovnosti odhadn te pravd podobnost

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

Normální (Gaussovo) rozdělení

INTERVALOVÉ ODHADY PARAMETRŮ ZÁKLADNÍHO SOUBORU

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Ranní úvahy o statistice

Úvod do problematiky měření

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Bodové a intervalové odhady parametrů v regresním modelu

Pravděpodobnost a statistika

Hodnocení vlastností materiálů podle ČSN EN 1990, přílohy D

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení

Matematika III. 3. prosince Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

IDENTIFIKACE BIMODALITY V DATECH

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj.

Odhady Parametrů Lineární Regrese

Transkript:

Statistika Teorie odhadu statistická indukce Intervalový odhad µ, σ 2 a π Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 21. února 2012 Statistika by Birom Statistika by Birom Intervalový odhad 1 / 20

Obsah Definice Interpretace Matematická statistika a rozdělení parametrů rozdělení Výsledky matematické statistiky Statistika by Birom Statistika by Birom Intervalový odhad 2 / 20

Definice Intervalový odhad I Oboustranný intervalový odhad P(T D < θ < T H ) = 1 α P(θ (T D ; T H )) = 1 α 1 α označujeme jako koeficient spolehlivosti (konfidence), spolehlivost α označujeme jako riziko odhadu (hladina významnosti) 1 α = 0,9; 0,95; 0,99 a 0,999 TH T D se nazývá přesnost odhadu U symetricky konstruovaných intervalů spolehlivosti (µ, π) se T H T D značí 2 a nazývá se maximální přípustná chyba odhadu Bodový odhad lze považovat za extrémní případ intervalového odhadu s nulovou šířkou. Je sice přesný, ale ztrácí spolehlivost 1 α 0. Jednostranný interval omezený zdola (levostranný) P(T D < θ) = 1 α P(θ (T D ; )) = 1 α 1 α označujeme jako koeficient spolehlivosti (konfidence), spolehlivost α označujeme jako riziko podhodnocení (hladina významnosti) 1 α = 0,9; 0,95; 0,99 a 0,999 Statistika by Birom Statistika by Birom Intervalový odhad 3 / 20

Definice Intervalový odhad II Jednostranný interval omezený shora (pravostranný) P(θ < T H ) = 1 α P(θ ( ; T H )) = 1 α 1 α označujeme jako koeficient spolehlivosti (konfidence), spolehlivost α označujeme jako riziko nadhodnocení (hladina významnosti) 1 α = 0,9; 0,95; 0,99 a 0,999 Statistika by Birom Statistika by Birom Intervalový odhad 4 / 20

Interpretace Interpretace intervalového odhadu Správná interpretace (1 α) 100 % intervalů obsahuje parametr θ. Každý interval překryje odhadovaný parametr s (1 α) 100% pravděpodobností. Interval spolehlivosti je plácačka, která s danou spolehlivostí (1 α) připlácne mouchu (přilepenou) parametr. Nesprávná interpretace Interval spolehlivosti obsahu (1 α) 100 % všech možných hodnot odhadovaného parametru θ. Parametr θ padne do (1 α) 100% intervalu spolehlivosti právě s pravděpodobností 1 α. Parametr θ je šíp, který se spolehlivostí (1 α) zasáhne terč interval spolehlivosti. Náhodný je interval spolehlivosti nikoliv parametr, proto se výroky o pravděpodobnosti MUSÍ týkat intervalu a nikoliv parametru rozdělení, který je daný, neměnný, neznámý a proto jej odhadujeme. Statistika by Birom Statistika by Birom Intervalový odhad 5 / 20

Matematická statistika a rozdělení parametrů rozdělení Matematická statistika a rozdělení parametrů rozdělení I Podstatná tvrzení pro určení intervalových odhadů parametru normálního rozdělení O rozdělení náhodného výběru z N(µ; σ 2 ) Má-li populace normální rozdělení s parametry µ a σ 2 pak náhodný výběr má též normální rozdělení s parametry µ a σ 2 X 1, X 2,..., X n i.i.d. N ( µ; σ 2) O rozdělení náhodné veličiny sledující N(µ; σ 2 ) opakování Má-li náhodná veličina normální rozdělení s parametry µ a σ 2, pak náhodná veličina U = X µ σ má normální normované rozdělení N(0; 1). U = X µ σ N(0; 1) Statistika by Birom Statistika by Birom Intervalový odhad 6 / 20

Matematická statistika a rozdělení parametrů rozdělení Matematická statistika a rozdělení parametrů rozdělení II Podstatná tvrzení pro určení intervalových odhadů parametru normálního rozdělení O rozdělení střední hodnoty náhodného výběru z N(µ; σ 2 ) Má-li populace normální rozdělení s parametry µ a σ 2, pak výběrový průměr X má normální rozdělení s parametry µ a σ 2 /n X N ( µ; σ 2 /n ) O rozdělení rozptylu náhodného výběru z N(µ; σ 2 ) Má-li populace normální rozdělení s parametry µ a σ 2, pak náhodná veličina χ 2 = s2 (n 1) σ sleduje χ 2 (n 1) rozdělení. 2 χ 2 = s2 (n 1) σ 2 χ 2 (n 1) Statistika by Birom Statistika by Birom Intervalový odhad 7 / 20

Matematická statistika a rozdělení parametrů rozdělení Matematická statistika a rozdělení parametrů rozdělení III Podstatná tvrzení pro určení intervalových odhadů parametru normálního rozdělení O studentovo rozdělení opakování Jsou-li U a χ 2 takové nezávislé náhodné veličiny, že U N(0; 1) a χ 2 χ 2 (n) a definujeme-li: T = U t(n 1), χ 2 pak T má studentovo rozdělení o n stupních volnosti. n Statistika by Birom Statistika by Birom Intervalový odhad 8 / 20

Intervalový odhad střední hodnoty populace sledující normální rozdělení při známém rozptylu Oboustranný intervalový odhad P ( x n σ u 1 α/2 < µ < x + n σ ) u 1 α/2 = 1 α Jednostranný interval omezený zdola (levostranný) ( P x σ ) u 1 α < µ = 1 α n Jednostranný interval omezený shora (pravostranný) P (µ < x + n σ ) u 1 α = 1 α Hodnota σ n je směrodatná odchylka výběrového průměru a říká se jí standardní chyba. Hodnota = s n u 1 α/2 je maximální přípustnou chybou intervalového odhadu střední hodnoty. Přesnost intervalového odhadu (šířka intervalu) pro střední hodnotu závisí přímo na variabilitě a spolehlivosti a nepřímo na rozsahu výběru. Statistika by Birom Statistika by Birom Intervalový odhad 9 / 20

Související otázky s intervalovým odhadem střední hodnoty populace sledující normální rozdělení při známém rozptylu vedle vymezení samotného intervalu spolehlivosti je výsledkem jeho šířka, tj. přesnost odhadu = 2, variabilita dat je svým způsobem konstantní, přesnost odhadu lze zvýšit buďto: zvýšením rozsahu souboru, snížením spolehlivosti. někdy je předepsána přesnost odhadu prostřednictvím maximální přípustné chyby nechceme-li přesáhnout jak předepsanou přesnost, tak spolehlivost 1 α, nesmí rozsah výběru klesnout pod: ( σ u1 α/2 ) 2 n = n nutno zaokrouhlit na nejbližší vyšší cele číslo! nechceme-li přesáhnout předepsanou přesnost a nelze-li zvýšit rozsah souboru je spolehlivost odhadu nejvýše: ( n 1 α = 2Φ σ ) 1 Statistika by Birom Statistika by Birom Intervalový odhad 10 / 20

Dvoufázový výběr Postup určení rozsahu výběrového souboru pro dosažení předepsané přesnosti a spolehlivosti odhadu 1. Provedení rozumně velikého výběrového šetření m, 2. Vypočtení nutného rozsahu pro dosažení předepsané přesnosti a spolehlivosti odhadu ( σ u1 α/2 ) 2 n = n nutno zaokrouhlit na nejbližší vyšší cele číslo!, 3. Je-li n m, je vytvořený výběr dostačující, je-li n > m, je třeba výběr doplnit o (n m) dodatečných pozorování. Statistika by Birom Statistika by Birom Intervalový odhad 11 / 20

Intervalový odhad střední hodnoty populace sledující normální rozdělení při neznámém rozptylu Oboustranný intervalový odhad ( P x s n t 1 α/2 (n 1) < µ < x + s ) t 1 α/2 (n 1) = 1 α n Jednostranný interval omezený zdola (levostranný) ( P x s ) t 1 α (n 1) < µ = 1 α n Jednostranný interval omezený shora (pravostranný) ( P µ < x + s ) t 1 α (n 1) = 1 α n Hodnota s n je odhadem směrodatné odchylky výběrového průměru a říká se jí standardní chyba. Hodnota = s n t 1 α/2 (n 1) je maximální přípustnou chybou intervalového odhadu střední hodnoty. Přesnost intervalového odhadu (šířka intervalu) pro střední hodnotu závisí přímo na variabilitě a spolehlivosti a nepřímo na rozsahu výběru. Statistika by Birom Statistika by Birom Intervalový odhad 12 / 20

Související otázky s intervalovým odhadem střední hodnoty populace sledující normální rozdělení při neznámém rozptylu vedle vymezení samotného intervalu spolehlivosti je výsledkem jeho šířka, tj. přesnost odhadu = 2, variabilita dat je svým způsobem konstantní, přesnost odhadu lze zvýšit buďto: zvýšením rozsahu souboru, snížením spolehlivosti. někdy je předepsána přesnost odhadu prostřednictvím maximální přípustné chyby nechceme-li přesáhnout jak předepsanou přesnost, tak spolehlivost 1 α, nesmí rozsah výběru klesnout pod: ( ) s t1 α/2 (m 1) 2 n = n nutno zaokrouhlit na nejbližší vyšší cele číslo! nechceme-li přesáhnout předepsanou přesnost a nelze-li zvýšit rozsah souboru je spolehlivost odhadu nejvýše: ( ) n 1 α = 2F 1 s Statistika by Birom Statistika by Birom Intervalový odhad 13 / 20

Dvoufázový výběr Postup určení rozsahu výběrového souboru pro dosažení předepsané přesnosti a spolehlivosti odhadu 1. Provedení rozumně velikého výběrového šetření m, 2. Vypočtení nutného rozsahu pro dosažení předepsané přesnosti a spolehlivosti odhadu ( ) 2 s t1 α/2 (m 1) n = n nutno zaokrouhlit na nejbližší vyšší cele číslo!, 3. Je-li n m, je vytvořený výběr dostačující, je-li n > m, je třeba výběr doplnit o (n m) dodatečných pozorování. Statistika by Birom Statistika by Birom Intervalový odhad 14 / 20

Intervalový odhad rozptylu populace sledující normální rozdělení Oboustranný intervalový odhad ( ) (n 1) s 2 P χ 2 1 α/2 (n 1) < (n 1) σ2 s2 < = 1 α (n 1) χ 2 1 α χ 2 α/2 Jednostranný interval omezený zdola (levostranný) ( ) (n 1) s 2 P < σ2 = 1 α (n 1) Jednostranný interval omezený shora (pravostranný) P (σ 2 < ) (n 1) s2 χ 2 = 1 α α(n 1) Přesnost intervalového odhadu (šířka intervalu) pro rozptyl závisí přímo na variabilitě a rozsahu výběru a nepřímo na spolehlivosti. Statistika by Birom Statistika by Birom Intervalový odhad 15 / 20

Intervalový odhad směrodatné odchylky populace sledující normální rozdělení Oboustranný intervalový odhad P (n 1) s < σ < χ 2 1 α/2 (n 1) (n 1) s χ 2 α/2 (n 1) Jednostranný interval omezený zdola (levostranný) P (n 1) s < σ = 1 α χ 21 α (n 1) = 1 α Jednostranný interval omezený shora (pravostranný) ( ) (n 1) s P σ < = 1 α χ 2 α (n 1) Přesnost intervalového odhadu (šířka intervalu) pro rozptyl závisí přímo na variabilitě a rozsahu výběru a nepřímo na spolehlivosti. Statistika by Birom Statistika by Birom Intervalový odhad 16 / 20

Intervalový odhad populační pravděpodobnosti (poměru) alternativního rozdělení Oboustranný intervalový odhad ( P p u 1 α/2 p(1 p) n < π < p + u 1 α/2 Jednostranný interval omezený zdola (levostranný) ( ) p(1 p) P p u 1 α < π = 1 α n Jednostranný interval omezený shora (pravostranný) ( ) p(1 p) P π < p + u 1 α = 1 α n Hodnota p(1 p) n p(1 p) n ) = 1 α je odhadem směrodatné odchylky výběrového poměru. p(1 p) n Hodnota = u 1 α je maximální přípustnou chybou intervalového odhadu populačního poměru. Přesnost intervalového odhadu (šířka intervalu) pro populačního poměru závisí přímo na variabilitě a spolehlivosti a nepřímo na rozsahu výběru. Statistika by Birom Statistika by Birom Intervalový odhad 17 / 20

Související otázky s intervalovým odhadem populační pravděpodobnosti I vedle vymezení samotného intervalu spolehlivosti je výsledkem jeho šířka, tj. přesnost odhadu = 2, variabilita dat je svým způsobem konstantní, přesnost odhadu lze zvýšit buďto: zvýšením rozsahu souboru snížením spolehlivosti někdy je předepsána přesnost odhadu prostřednictvím maximální přípustné chyby nechceme-li přesáhnout jak předepsanou přesnost, tak spolehlivost 1 α, nesmí rozsah výběru klesnout pod: ( ) 2 p(1 p) u1 α/2 n = n nutno zaokrouhlit na nejbližší vyšší cele číslo! Statistika by Birom Statistika by Birom Intervalový odhad 18 / 20

Související otázky s intervalovým odhadem populační pravděpodobnosti II nechceme-li přesáhnout předepsanou přesnost a nelze-li zvýšit rozsah souboru je spolehlivost odhadu nejvýše: ( n ) 1 α = 2Φ 1 p(1 p) Statistika by Birom Statistika by Birom Intervalový odhad 19 / 20

Dvoufázový výběr Postup určení rozsahu výběrového souboru pro dosažení předepsané přesnosti a spolehlivosti odhadu 1. Provedení rozumně velikého výběrového šetření m, 2. Vypočtení nutného rozsahu pro dosažení předepsané přesnosti a spolehlivosti odhadu ( ) 2 p(1 p) u1 α/2 n = n nutno zaokrouhlit na nejbližší vyšší cele číslo! 3. Je-li n m, je vytvořený výběr dostačující, je-li n > m, je třeba výběr doplnit o (n m) dodatečných pozorování. Statistika by Birom Statistika by Birom Intervalový odhad 20 / 20