Waldovy testy, vlastnosti a Operační charakteristika

Podobné dokumenty
PRAVDĚPODOBNOST A STATISTIKA. Odhady parametrů Postačující statistiky

Ing. Michael Rost, Ph.D.

Kapitola 1. Úvod. 1.1 Značení. 1.2 Výroky - opakování. N... přirozená čísla (1, 2, 3,...). Q... racionální čísla ( p, kde p Z a q N) R...

Testování statistických hypotéz

Přijímací zkouška na navazující magisterské studium 2014

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

PRAVDĚPODOBNOST A STATISTIKA

15. T e s t o v á n í h y p o t é z

Základy matematické analýzy

PŘEDNÁŠKA 2 POSLOUPNOSTI

Testování statistických hypotéz

α β ) právě tehdy, když pro jednotlivé hodnoty platí β1 αn βn. Danou relaci nazýváme relace

Apriorní rozdělení. Jan Kracík.

Přijímací zkouška na navazující magisterské studium 2017

Stručný úvod do testování statistických hypotéz

1. Posloupnosti čísel

IV. Základní pojmy matematické analýzy IV.1. Rozšíření množiny reálných čísel

Univerzita Karlova v Praze procesy II. Zuzana. funkce

LWS při heteroskedasticitě

Intervalové Odhady Parametrů II Testování Hypotéz

Projekty - Úvod do funkcionální analýzy

Normální (Gaussovo) rozdělení

Cvičení 10. Přednášející: Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc.

LIMITA A SPOJITOST FUNKCE

15. T e s t o v á n í h y p o t é z

Formální jazyky a gramatiky Teorie programovacích jazyků

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně

Lineární programování

1 Klasická pravděpodobnost. Bayesův vzorec. Poslední změna (oprava): 11. května 2018 ( 6 4)( 43 2 ) ( 49 6 ) 3. = (a) 1 1 2! + 1 3!

17. Posloupnosti a řady funkcí

Pravděpodobnost a statistika

Lineární algebra : Lineární prostor

5. T e s t o v á n í h y p o t é z

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Diferenˇcní rovnice Diferenciální rovnice Matematika IV Matematika IV Program

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Zavedení a vlastnosti reálných čísel

Přednáška 6, 6. listopadu 2013

7. Analýza rozptylu.

Pravděpodobnost a statistika

NMAI059 Pravděpodobnost a statistika

prof. RNDr. Roman Kotecký DrSc., Dr. Rudolf Blažek, PhD Pravděpodobnost a statistika Katedra teoretické informatiky Fakulta informačních technologií

Aproximace binomického rozdělení normálním

Testování statistických hypotéz

Dnešní látka Variačně formulované okrajové úlohy zúplnění prostoru funkcí. Lineární zobrazení.

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testy statistických hypotéz

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

PRAVDĚPODOBNOST A STATISTIKA

Primitivní funkce a Riemann uv integrál Lineární algebra Taylor uv polynom Extrémy funkcí více prom ˇenných Matematika III Matematika III Program

Číselné posloupnosti

Úvod do teorie her

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

TEORIE MÍRY V některých předchozích kapitolách jste se setkali s měřením velikostí množin a víte, jaké byly těžkosti s měřením množin i na reálné ose.

Normální (Gaussovo) rozdělení

Téma 22. Ondřej Nývlt

Limitní věty teorie pravděpodobnosti. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

9. přednáška 26. listopadu f(a)h < 0 a pro h (0, δ) máme f(a 1 + h, a 2,..., a m ) f(a) > 1 2 x 1

PRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady

DMA Přednáška Rekurentní rovnice. takovou, že po dosazení odpovídajících členů do dané rovnice dostáváme pro všechna n n 0 + m pravdivý výrok.

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

Intervalové Odhady Parametrů

Intuitivní pojem pravděpodobnosti

8. Normální rozdělení

Základy teorie odhadu parametrů bodový odhad

Pravděpodobnost a statistika

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Lineární algebra : Báze a dimenze

Definice 1.1. Nechť je M množina. Funkci ρ : M M R nazveme metrikou, jestliže má následující vlastnosti:

PŘEDNÁŠKA 5 Konjuktivně disjunktivní termy, konečné distributivní svazy

Interpolace, ortogonální polynomy, Gaussova kvadratura

Opakování: Nominální proměnná více hodnotová odpověď.

PRIMITIVNÍ FUNKCE. Primitivní funkce primitivní funkce. geometrický popis integrály 1 integrály 2 spojité funkce konstrukce prim.

Pro každé formule α, β, γ, δ platí: Pro každé formule α, β, γ platí: Poznámka: Platí právě tehdy, když je tautologie.

Základy elementární teorie čísel

5 Parametrické testy hypotéz

STATISTICKÉ HYPOTÉZY

Hypergrafové removal lemma a Szemérediho

S T E R E O M E T R I E ( P R O S T O R O V Á G E O M E T R I E ) Z Á K L A D N Í G E O M E T R I C K É Ú T VA R Y A J E J I C H O Z N A

1 Topologie roviny a prostoru

ALGEBRA. Téma 5: Vektorové prostory

Matematika 2 pro PEF PaE

Kapitola 9. Rezidua. Matematická analýza 4. KMA/MA o12. Definice 9.1. ( izolovaná singularita )

y = 0, ,19716x.

Pravděpodobnostní algoritmy

3 Lineární kombinace vektorů. Lineární závislost a nezávislost

PRIMITIVNÍ FUNKCE DEFINICE A MOTIVACE

3. Podmíněná pravděpodobnost a Bayesův vzorec

Základy elementární teorie čísel

4EK211 Základy ekonometrie

PROSTORY SE SKALÁRNÍM SOUČINEM. Definice Nechť L je lineární vektorový prostor nad R. Zobrazení L L R splňující vlastnosti

3. Přednáška: Line search

pro bakalářské studijní programy fyzika, informatika a matematika 2018, varianta A

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

3 Bodové odhady a jejich vlastnosti

Transkript:

Waldovy testy, vlastnosti a Operační charakteristika Adéla Zavřelová 11. března 2018 Adéla Zavřelová Waldovy testy 11. března 2018 1 / 21

Úvod Úloha H 0 : náhodná veličina X má rozdělení s hustotou f 0 (x), H 1 : náhodná veličina X má rozdělení s hustotou f 1 (x). Chyba 1. a 2. druhu: P(zamítnutí H 0 H 0 platí) = α P(zamítnutí H 1 H 1 platí) = β Klasické testování hypotézy: Zvolíme rozsah n a α. Nelsilnější test: zamítneme H 0, jestliže n f 1 (x i ) i=1 f 0 (x i ) c, nezamítneme H 0, jestliže n f 1 (x i ) i=1 f 0 (x i ) < c. Kde c je určeno tak, aby pravděpodobnost chyby 1. druhu byla nejvýše α. Adéla Zavřelová Waldovy testy 11. března 2018 2 / 21

Waldův test Waldův test Zvolíme A, B, tak aby pradědodobnosti chyb byly rovny α, β. Náhodný výběr X 1, X 2,... n f 1 (x i ) i=1 f 0 (x i ) B: přijmeme H 0. n i=1 f 1 (x i ) f 0 (x i ) A: přijmeme H 1. B < n f 1 (x i ) i=1 f 0 (x i ) < A: pokračujeme ve výběru. Adéla Zavřelová Waldovy testy 11. března 2018 3 / 21

Waldův test Rozsah výběru N je náhodný: { N = min n : n i=1 f 1 (x i ) f 0 (x i ) / (B, A) } Aproximace A, B: B = β 1 α, A = 1 β α Adéla Zavřelová Waldovy testy 11. března 2018 4 / 21

Příklad Úloha testování hypotézy: H 0 : náhodná veličina X má rozdělení N(µ 0, 1), H 1 : náhodná veličina X má rozdělení N(µ 1, 1), kde µ 0 < µ 1 a požadujeme pravděpodobnosti chyb α, β. Platí: n f 1 (x i ) i=1 { f 0 (x i ) = exp n } i=1 x i(µ 1 µ 0 ) + µ2 0 µ2 1 2 n. [ ( ) ] u1 α +u 2 1 β µ 1 µ 0 + 1 Nesekvenční postup: Zvolíme n = Zamítneme H 0, jestliže 1 n n i=1 (X i µ 0 ) u 1 α, jinak přijmeme H 0. Sekvenční postup na základě X 1,..., X n : přijmeme H 0, jestliže n i=1 X i přijmeme H 1, jestliže n i=1 X i jinak pokračujeme ve výběru. ( log β 1 α + µ2 1 µ2 0 ( log 1 β α + µ2 1 µ2 0 2 n ) 2 n 1 µ 1 µ 0, ) 1 µ 1 µ 0, Adéla Zavřelová Waldovy testy 11. března 2018 5 / 21

Obecný sekvenční test X 1, X 2,... iid náhodné veličiny s hustotou f (., θ) závisející na neznámém parametru θ = (θ 1,..., θ k ) Θ. Úloha H 0 : θ Θ 0, H 1 : θ Θ 1, kde Θ 0 a Θ 1 jsou disjunkní podmnožiny Θ. Zavedeme posloupnosti borelovských množin {B i } i=1, { Bi 0 } i=1, { Bi 1 } takové, že i=1 B i, Bi 0, B1 i jsou navzájem disjunktní množiny R = B 1 B 0 1 B1 1 B 1 R = B 2 B 0 2 B1 2 R2. B i 1 R = B i B 0 i B 1 i R i Adéla Zavřelová Waldovy testy 11. března 2018 6 / 21

Obecný sekvenční test Test hypotézy H 0 proti hypotéze H 1 X 1,..., X n je náhodný výběr. Test S se řídí pravidlem: 1 (X 1,..., X n ) B 0 n: přijmeme H 0 2 (X 1,..., X n ) B 1 n: přijmeme H 1 3 jinak pokračujeme v náhodném výběru n=1 B0 n... oblast přijetí H 0 n=1 B1 n... oblast přijetí H 1 Adéla Zavřelová Waldovy testy 11. března 2018 7 / 21

Obecný sekvenční test Test s pevným rozsahem výběru Jestliže pro posloupnosti množin {B i } i=1, { Bi 0 } i=1, { Bi 1 } i=1 existuje n N takové, že B i = R i, i = 1,..., n 1; B 0 n B 1 n = R n mluvíme o testu s pevným rozsahem výběru. Ostatní testy se nazývají sekvenční. Řekneme, že sekvenční test skončí s pravděpodobností 1, jestliže lim P ((X 1,..., X n ) B n ; θ) = 0, pro všechna θ Θ. n Adéla Zavřelová Waldovy testy 11. března 2018 8 / 21

Obecný sekvenční test Operační charakteristika Funkce proměnné θ, která udává pravděpodobnost přijetí hypotézy H 0, je-li skutečná hodnota parametru θ, se nazývá operační charakterstika testu S hypotézy H 0 proti alternativě H 1. Označení: L S (θ) L S (θ) = P (přijetí H 0 na základě testu S; θ) = ( ) { = P (X1,..., X i ) Bi 0 } ; θ = = i=1 P ( (X 1,..., X i ) Bi 0 ; θ ). i=1 Síla testu: P S (θ) = P (zamítnutí H 0 ; θ) = n P ( (X 1,..., X i ) Bi 1 ; θ ). i=1 Adéla Zavřelová Waldovy testy 11. března 2018 9 / 21

Obecný sekvenční test Rozsah výběru Náhodnou veličinu N = min{n : (X 1,..., X n ) B 0 n B 1 n} nazveme rozsahem výběru. E(N; θ) se nazývá střední rozsah výběru. Adéla Zavřelová Waldovy testy 11. března 2018 10 / 21

Kritérium optimality Úloha H 0 : θ Θ 0, H 1 : θ Θ 1, Test lze charakterizovat třemi veličinami: chyba 1. druhu chyba 2. druhu střední rozsah výběru Adéla Zavřelová Waldovy testy 11. března 2018 11 / 21

Kritérium optimality Kritérium pro porovnávání sekvenčních testů Úloha: H 0 : θ Θ 0, H 1 : θ Θ 1. Označme C(α, β) třídu testů splňujících: test skončí s pravděpodobností 1, 1 L S (θ) α, pro všechny θ Θ 0, L S (θ) β, pro všechny θ Θ 1. Adéla Zavřelová Waldovy testy 11. března 2018 12 / 21

Kritérium optimality Eficientnější test Test S C(α, β) nazveme eficientnější (vydatnější), než test S C(α, β) na množině A Θ, jestliže Stejnoměrně eficientní test E S (N; θ) < E S (N; θ), pro všechna θ A. Test S C(α, β) nazveme stejnoměrně eficientním testem na množině A Θ, jestliže inf E S(N; θ) = E S (N; θ), pro všechna θ A. S C(α,β) Adéla Zavřelová Waldovy testy 11. března 2018 13 / 21

Kritéruim optimality Uvažujme případ jednoduchých hypotéz: H 0 : θ = θ 0, H 1 : θ = θ 1. Waldův (sekvenční) test (X 1,..., X n ) náhodný výběr z rozdělení s hustotou f (x, θ). Waldův test (ozn. S(b, a)): přijmeme H 0, jestliže Q n (θ 0, θ 1 ) b, přijmeme H 1, jestliže Q n (θ 0, θ 1 ) a jinak pokračujeme v náhodném výběru kde Q n (θ 0, θ 1 ) = n i=1 log f (X i,θ 1 ) f (X i,θ 0 ). Též nazýván sevenční test poměru pravděpodobnosti. Adéla Zavřelová Waldovy testy 11. března 2018 14 / 21

Kritérium optimality Věta: Existence a tvar eficientního testu Uvažujme úlohu H 0 : θ = θ 0, H 1 : θ = θ 1. Nechť {X i } i=1 je posloupnost iid veličin s hustotou f (x, θ), θ Θ. Pak mezi všemi testy S z C(α, β), pro které E S (N; θ i ) <, i = 0, 1, je Waldův sekvenční test S (b, a) stejnoměrně eficientní v bodech θ 0 a θ 1, tj. E S (b,a)(n; θ i ) = min E S(N; θ i ), i = 0, 1. S C(α,β) V případě složených hypotéz obecně neexistuje stejnoměrně eficientní test. Adéla Zavřelová Waldovy testy 11. března 2018 15 / 21

Vlastnosti Waldova sekvenčního testu Označme Lemma P(přij. H 0 na základě S(b, a); θ 1 ) = β, P(přij. H 1 na základě S(b, a); θ 0 ) = α. Pro Waldův sekvenční test S(b, a) platí: a log 1 β α, b log β 1 α. Hodnoty b, a obvykle aproximujeme hodnotami a = log 1 β α, β b = log 1 α. Adéla Zavřelová Waldovy testy 11. března 2018 16 / 21

Vlastnosti Waldova sekvenčního testu Věta Nechť P ( ) ( ) f (X1, θ 1 ) f f (X 1, θ 0 ) > 1, θ (X1, θ 1 ) > 0, P f (X 1, θ 0 ) < 1, θ > 0, θ (θ, θ). Pak test S(b, a), < b < 0 < a <, skončí s pravděpodobností 1, E(N k, θ) < pro libovolné k > 0 a θ (θ, θ) a existuje číslo t 0 (θ) > 0 takové, že E(exp{t N}, θ) < pro všechna t t 0 (θ). Důkaz: Využití Waldových nerovností. Adéla Zavřelová Waldovy testy 11. března 2018 17 / 21

Vlastnosti Waldova sekvenčního testu Věta Nechť S(b, a) a S(b, a ) jsou Waldovy testy, slpňující P(θ 0 ) > P (θ 0 ), L(θ 1 ) > L (θ 1 ). Pak platí b b < a a, kde aspoň jedna nerovnost b b, a a je ostrá a E(N, θ) E(N, θ), pro všechny θ (θ, θ). Adéla Zavřelová Waldovy testy 11. března 2018 18 / 21

Aproximace Označme: Z i = log f (X i,θ 1 ) f (X i,θ 0 ), Q n = n i=1 log f (X i,θ 1 ) f (X i,θ 0 ). Aproximace operační charakteristiky Nechť ( E[exp{tZ 1 }; ) θ] <, ( pro všechna t ) R a platí P f (X1,θ 1 ) f (X 1,θ 0 ) > 1, θ > 0, P f (X1,θ 1 ) f (X 1,θ 0 ) < 1, θ > 0, θ (θ, θ). Pak existuje funkce h(θ) definovaná na (θ, θ), rovna nule jen v bodě θ, pro který E[tZ 1 ; θ ] = 0 a platí: pro všechna θ (θ, θ). E(exp{h(θ)Q N }, θ) = 1, Adéla Zavřelová Waldovy testy 11. března 2018 19 / 21

Aproximace Aproximace operační charakteristiky L S (θ) = P (přijetí H 0 na základě testu S; θ) ˆL S (θ) = ˆL S (θ ) = lim θ θ 1 eh(θ)a e h(θ)b e h(θ)a, jestliže E(Z 1, θ) 0. 1 e h(θ)a e h(θ)b e h(θ)a = a a b, jestliže E(Z 1, θ ) = 0. Adéla Zavřelová Waldovy testy 11. března 2018 20 / 21

Aproximace Aproximace průměrného rozsahu výběru Jestliže E(Z 1, θ) 0: E S (N, θ) = E(Q N, θ) E(Z 1, θ) Ê S (N, θ) = L S(θ)b + (1 L S (θ))a E(Z 1, θ) ˆL S (θ)b + (1 ˆL S (θ))a. E(Z 1, θ) Jestliže E(Z 1, θ ) = 0 : E S (N, θ) = E(Q2 N, θ ) E(Z 2 1, θ ) Ê S (N, θ) = L S(θ )b 2 + (1 L S (θ ))a 2 E(Z 2 1, θ ) ab E(Z 2 1, θ). Adéla Zavřelová Waldovy testy 11. března 2018 21 / 21