PRAVDĚPODOBNOST A STATISTIKA

Podobné dokumenty
PRAVDĚPODOBNOST A STATISTIKA

Testování statistických hypotéz

PRAVDĚPODOBNOST A STATISTIKA. Testování hypotéz o rozdělení

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

12. cvičení z PST. 20. prosince 2017

Testování statistických hypotéz

4ST201 STATISTIKA CVIČENÍ Č. 7

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Testování statistických hypotéz

Testy statistických hypotéz

Stručný úvod do testování statistických hypotéz

Normální (Gaussovo) rozdělení

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Normální (Gaussovo) rozdělení

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

Příklady na testy hypotéz o parametrech normálního rozdělení

Testování hypotéz. 4. přednáška

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Základní statistické metody v rizikovém inženýrství

15. T e s t o v á n í h y p o t é z

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

Testy. Pavel Provinský. 19. listopadu 2013

5. T e s t o v á n í h y p o t é z

5 Parametrické testy hypotéz

12. prosince n pro n = n = 30 = S X

= = 2368

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Tomáš Karel LS 2012/2013

15. T e s t o v á n í h y p o t é z

Ing. Michael Rost, Ph.D.

Aproximace binomického rozdělení normálním

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

Náhodné veličiny, náhodné chyby

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Cvičení ze statistiky - 8. Filip Děchtěrenko

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Regresní analýza 1. Regresní analýza

2 ) 4, Φ 1 (1 0,005)

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Regresní a korelační analýza

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

You created this PDF from an application that is not licensed to print to novapdf printer (

Pravděpodobnost a aplikovaná statistika

STATISTICKÉ HYPOTÉZY

Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj.

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Jednostranné intervaly spolehlivosti

Téma 22. Ondřej Nývlt

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Regresní a korelační analýza

prosince oboustranný symetrický 95% interval spolehlivosti pro střední hodnotu životnosti τ. X i. X = 1 n.. Podle CLV má veličina

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

Regresní a korelační analýza

Pravděpodobnost a aplikovaná statistika

Testování statistických hypotéz. Obecný postup

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

4EK211 Základy ekonometrie

7. Analýza rozptylu.

Statistika II. Jiří Neubauer

Regresní a korelační analýza

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

KGG/STG Statistika pro geografy

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Intervalové Odhady Parametrů

populace soubor jednotek, o jejichž vlastnostech bychom chtěli vypovídat letní semestr Definice subjektech.

Co je to statistika? Úvod statistické myšlení. Základy statistického hodnocení výsledků zkoušek. Petr Misák

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

STATISTICKÉ TESTY VÝZNAMNOSTI

Statistika pro každého. Párový test Test shody dvou rozptylů Dvouvýběrový t-test Porovnání středních hodnot při nestejných rozptylech

Regresní a korelační analýza

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

Charakteristika datového souboru

Pravděpodobnost a matematická statistika

Bodové a intervalové odhady parametrů v regresním modelu

Příklad datového souboru. Pravděpodobnost vs. statistika. Formální definice. Teorie odhadu

Transkript:

PRAVDĚPODOBNOST A STATISTIKA

Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr ϑ. Na základě měření (pokusů) chceme odhadnou neznámý parametr ϑ. Provedeme n pokusů (n měření). Výsledky těchto pokusů jsou popsány náhodným výběrem X ( X 1,, X n ) a jeho realizací x x,, x ). ( 1 n Opět předpokládáme, že složky náhodného vektoru jsou nezávislé a mají stejné rozdělení jako náhodná proměnná X. Odhad parametru ϑ budeme provádět pomocí vhodné statistiky X,, X ) a její realizace. T t T x,, x ) ( 1 n ( 1 n

Testování hypotéz Požadavek na vybrané statistiky je, aby byly nestranné, konzistentní a pokud možno nejlepší nestranné. Budeme využívat hlavně statistiky: výběrový průměr: X 1 n n i1 X i vývěrový rozptyl (modifikovaný): Výběrový koeficient korelace: Sˆ 1 n 1 i1 n 1 X i X Yi Y n i1 R S( X ) S( Y ) n X i X

Testování hypotéz Statistická hypotéza H je tvrzení o vlastnostech rozdělení pravděpodobnosti pozorované náhodné veličiny X s distribuční funkcí F(x, ϑ) nebo náhodného vektoru (X, Y ) se simultánní distribuční funkcí F(x,y, ϑ) apod. Postup, jímž ověřujeme danou hypotézu, se nazývá test statistické hypotézy. Proti testované hypotéze H, nazývané také nulová hypotéza - H 0, stavíme tzv. alternativní hypotézu - H A, kterou volíme dle požadavku úlohy. Jestliže H je hypotéza, že parametr ϑ má hodnotu ϑ 0, píšeme H: ϑ = ϑ 0. Případ H A : ϑ ϑ 0 je dvoustranná alternativní hypotéza a H A : ϑ > ϑ 0, resp. H A : ϑ < ϑ 0, je jednostranná alternativní hypotéza.

Testování hypotéz Pro testování hypotézy H: ϑ = ϑ 0 proti nějaké zvolené alternativní hypotéze H A se konstruuje vhodná statistika T X,, X ),tzv. testové kritérium. ( 1 n Při hledání statistiky T se vychází z požadavků na zamítnutí hypotézy H: Za jakých podmínek lze hypotézu zamítnout. K tomu se konstruuje množina možných hodnot realizace statistiky T. Tato množina se nazývá kritický obor a označuje se α. Velikost této množiny závisí na spolehlivosti našeho tvrzení. Pokud realizace zvolené statistiky T: t T ( x 1,, x n ) padne do kritického oboru α ( t ) říkáme, že hypotézu zamítáme na hladině významnosti α. U většiny testů se místo kritického oboru udává doplněk kritického oboru: R \. Pokud realizace zvolené statistiky T padne do doplňku kritického oboru ( t ) říkáme, že hypotézu nezamítáme na hladině významnosti α.

Testování hypotéz Hladinu významnosti α volíme opět nejčastěji α = 0.1, 0.05, 0.01 Nezamítnutí hypotézy H, resp. H A, neznamená ještě prokázání její platnosti, neboť jsme na základe realizace náhodného výběru získali pouze informace, které nestačí na její zamítnutí. Je-li to možné, je vhodné před přijetím dané hypotézy zvětšit rozsah statistického souboru a znovu hypotézu H testovat.

Testování hypotéz Předpokládejme, že máme hypotézu H: ϑ ϑ 0, a H A : ϑ > ϑ 0. Pak lze pravděpodobnosti α a β zobrazit:

Testování hypotéz p hodnota V některých statistických programech se místo testovacího kritéria a doplňku kritického oboru používá tzv.p-hodnota. P-hodnota je hodnota distribuční funkce příslušné statistiky pro testovací kritérium. Pokud p-hodnota je větší rovna zvolenému alfa pak nulovou hypotézu nezamítáme na hladině alfa. Pokud p-hodnota je menší než zvolené alfa pak nulovou hypotézu zamítáme na hladině alfa. P-hodnota udává, pro jaké alfa lze ještě lze nulovou hypotézu nezamítnout (či zamítnout).

Hypotézy pro Binomické rozdělení Nechť X je náhodná proměnná, která má Binomické rozdělení Bi(1,p). Neznámý parametr je p pravděpodobnost úspěchu při jednom pokuse. Pokus je úspěšný, pokud náhodně vybraný prvek má sledovanou vlastnost. Provedeme n -měření n-pokusů. Nechť je náhodný výběr, kde pro realizaci i-té složky X i platí: x i =0, pokud vybraný prvek nemá sledovanou vlastnost a x i =1, pokud vybraný prvek má sledovanou vlastnost. x Označme. Pak realizace výběrového průměru je a tedy bodový odhad parametru p je. ( X1,, X n ) n x x i i1 n x p n

Hypotézy pro Binomické rozdělení Testujeme hypotézu H: p = p 0 vzhledem k alternativní hypotéze: H A : p p 0 : testovací kritérium: doplněk kritického oboru: t x p0 n p 1 p u 0 ( 0 Pro hypotézu H: p = p 0 (H: p p 0 ) vzhledem k alternativní hypotéze: H A : p > p 0 je doplněk : Pro hypotézu H: p = p 0 (H: p p 0 ) vzhledem k alternativní hypotéze: H A : p < p 0 je doplněk : u kde, jsou kvantily normovaného normálního rozdělení. 1 u 1 n ) 1, u 1, u1, u 1

Hypotézy pro Binomické rozdělení Příklad 1: Hodíte 100x kostkou. 6 vám padla 0x. Otestujte hypotézu, že pravděpodobnost padnutí 6 je 1/6 vzhledem k alternativní hypotéze, že je větší než 1/6. Otestujte hypotézu (na hladině významnosti α=0,05), že pravděpodobnost padnutí 6 větší rovno než 1/6 vzhledem k alternativní hypotéze, že je menší než 1/6. Příklad : Strana XYZ nechá udělat průzkum její volitelnosti. Vybraná agentura udělá průzkum u reprezentativního vzorku obyvatelstva. Osloví 107 respondentů. Z nich 81 by danou stranu volilo. Otestujte hypotézu (na hladině významnosti α=0,05), že pravděpodobnost volební preference strany větší rovno 30% vzhledem k alternativní hypotéze, že je menší než 30%.

Hypotézy pro Binomické rozdělení Nechť X1 je náhodná proměnná, která má Binomické rozdělení Bi(1,p1).. Provedeme n1-pokusů a nechť x1 je úspěšných. Bodový odhad pravděpodobnosti p1 je: Nechť X je náhodná proměnná, která má Binomické rozdělení Bi(1,p).. Provedeme n-pokusů a nechť x je úspěšných. Bodový odhad pravděpodobnosti p je:. p1 p x1 n1 x n

Hypotézy pro Binomické rozdělení Testujeme hypotézu H: p1 = p vzhledem k alternativní hypotéze: H A : p1 p : testovací kritérium: doplněk kritického oboru: u 1, u 1 Pro hypotézu H: p1 = p (H: p1 p) vzhledem k alternativní hypotéze: H A : p1 > p je doplněk : Pro hypotézu H: p1 = p (H: p1 p ) vzhledem k alternativní hypotéze: H A : p1 < p je doplněk : u kde, jsou kvantily normovaného normálního rozdělení. 1 u 1 t x1 x n1 n n1* n f (1 f ) n1 n, u1 u 1, x1 x f n1 n

Hypotézy pro Binomické rozdělení Příklad 3: Strana XYZ nechá udělat průzkum její volitelnosti. Vybraná agentura udělá průzkum u reprezentativního vzorku obyvatelstva. Osloví 107 respondentů. Z nich 81 by danou stranu volilo. 10 000 000 je stála předvolební kampaň. Po předvolební kampani si zadali další průzkum. Z 138 respondentů by 403 danou stranu volilo. Otestujte hypotézu (na hladině významnosti α=0,05), že 10 000 000 byly vhodně investované peníze.

Hypotézy pro Normální rozdělení Nechť X je náhodná proměnná, která má Normální rozdělení N(μ, σ ). Neznámé parametry jsou: μ, σ Při testování hypotéz budeme vycházet z výběrového průměru a výběrového rozptylu: Nechť X, S je výběrový průměr a výběrový rozptyl. Pak platí: X n n 1 S je nejlepší nestranný konzistentní odhad parametru E(X) = μ je nejlepší nestranný konzistentní odhad parametru D(X) = σ Provedeme n pokusů (n měření). Výsledky těchto pokusů jsou popsány náhodným výběrem X ( X,, ) a jeho realizací 1 X n. x ( x 1,, x n )

Hypotézy pro jeden výběr z Normální rozdělení Testujeme hypotézu H: μ = μ 0 vzhledem k alternativní hypotéze: H A : μ μ 0 : testovací kritérium: t x s 0 n 1 doplněk kritického oboru: t 1, t 1 Pro hypotézu H: μ = μ 0 (H : μ μ 0 ) vzhledem k alternativní hypotéze: H A : μ > μ 0 je doplněk : Pro hypotézu H: μ = μ 0 (H: μ μ 0 ) vzhledem k alternativní hypotéze: H A : μ < μ 0 je doplněk : t kde, jsou kvantily Studentova rozdělení s k=n-1 stupni volnosti. 1 t 1, t1 t 1,

Hypotézy pro jeden výběr z Normální rozdělení Testujeme hypotézu H: σ =σ 0 vzhledem k alternativní hypotéze: H A : σ σ 0 : testovací kritérium: t n s 0 doplněk kritického oboru:, 1 Pro hypotézu H: σ = σ 0 (H: σ σ 0 ) vzhledem k alternativní hypotéze: H A : σ > σ 0 je doplněk : Pro hypotézu H: σ = σ 0 (H: σ σ 0 ) vzhledem k alternativní hypotéze: H A : σ < σ 0 je doplněk :,, 0, 1, kde, jsou kvantily Pearsonovarozdělení s k=n-1 stupni 1 1 volnosti.

Hypotéza pro párové dvojice z Normální rozdělení Nechť (X,Y) je náhodný vektor, který má Normální rozdělení N (μ, σ ), kde μ= (μ(x), μ(y)) je vektor. Chceme porovnat μ(x) a μ(y). Zavedeme novou náhodnou proměnnou D=X-Y. Náhodná proměnná D má opět normální rozdělení se střední hodnotou μ = μ(x) - μ(y). Z naměřených hodnot (x i, y i ) vytvoříme nový soubor d: kde d i = x i, - y i K tomuto souboru spočítáme d, s( d) Testujeme hypotézu H: μ = μ 0 vzhledem k alternativní hypotéze: H A : μ μ 0 : testovací kritérium: doplněk kritického oboru: t kde, jsou kvantily Studentova rozdělení s k=n-1 stupni volnosti. 1 t 1 t d s( d) t 0 n 1 1, t 1

Hypotéza pro párové dvojice z Normální rozdělení Test na koeficient korelace Nechť (X,Y) je náhodný vektor, který má Normální rozdělení N (μ, σ ), Chceme odhadnou korelaci složek náhodného vektoru ρ(x,y). Nechť r je bodový odhad. Předpokládejme: n 10, r <1, ρ 0 <1. Testujeme hypotézu H: ρ = ρ 0 vzhledem k alternativní hypotéze: H A : ρ ρ 0 : testovací kritérium: doplněk kritického oboru: u u 1, u 1 kde, jsou kvantily normovaného normálního rozdělení 1 u 1

Hypotéza pro párové dvojice z Normální rozdělení Test na nulový koeficient korelace Nechť (X,Y) je náhodný vektor, který má Normální rozdělení N (μ, σ ), Chceme zjisti, lineární závislost či nezávislost složek náhodného vektoru (X,Y). Testujeme ρ(x,y) na 0. Nechť r je bodový odhad. Testujeme hypotézu H: ρ = 0 vzhledem k alternativní hypotéze: H A : ρ 0 : testovací kritérium: doplněk kritického oboru: kde t 1 0, t 1 je kvantily Studentova rozdělení s k=n- stupni volnosti

Hypotéza pro dva výběry z Normální rozdělení Nechť X, Y jsou náhodné veličiny, které mají Normální rozdělení: X N(μ(X), σ (X), Y N(μ(Y), σ (Y). Chceme porovnat μ(x) a μ(y). Provedeme n1 měření pro náhodnou proměnnou X. Výsledky těchto pokusů jsou popsány náhodným výběrem ( X,, ) a jeho realizací. 1 X n1 ( x1,, xn 1) Spočítáme x, s( x) Provedeme n měření pro náhodnou proměnnou Y. Výsledky těchto pokusů jsou popsány náhodným výběrem ( Y1,, Yn ) a jeho realizací ( y1,, yn ). Spočítáme y, s( y). Testujeme hypotézu H: μ(x) - μ(y) = :μ 0 vzhledem k alternativní hypotéze: H A : : μ(x) - μ(y) μ 0. Tento test má dvě varianty: pro stejné rozptyly a pro různé rozptyly.

Hypotéza pro dva výběry z Normální rozdělení Test rovnosti rozptylů Nechť X, Y jsou náhodné veličiny, které mají Normální rozdělení: X N(μ(X), σ (X), Y N(μ(Y), σ (Y). Testujeme hypotézu H: σ (X) = σ (Y) vzhledem k alternativní hypotéze: H A : σ (X) σ (Y) : testovací kritérium: 1, F1 / ( k1, k) doplněk kritického oboru:, F ( 1 k1, k) kde /, je kvantil Fischerova-Snedecorova rozdělení s k1 a k stupni volnosti. k1=n1-1, k=n-1 pro k1=n-1, k=n1-1 pro

Hypotéza pro dva výběry z Normální rozdělení Test rovnosti středních hodnot za podmínky σ (X) = σ (Y) Nechť X, Y jsou náhodné veličiny, které mají Normální rozdělení: X N(μ(X), σ (X), Y N(μ(Y), σ (Y). Testujeme hypotézu H: μ(x) - μ(y) = μ 0 vzhledem k alternativní hypotéze: H A : μ(x) - μ(y) μ 0 testovací kritérium: 1, t 1 doplněk kritického oboru:, t t kde, jsou kvantily Studentova rozdělení s k=n-1 stupni volnosti. 1 t 1

Hypotéza pro dva výběry z Normální rozdělení Test rovnosti středních hodnot za podmínky σ (X) σ (Y) Nechť X, Y jsou náhodné veličiny, které mají Normální rozdělení: X N(μ(X), σ (X), Y N(μ(Y), σ (Y). Testujeme hypotézu H: μ(x) - μ(y) = μ 0 vzhledem k alternativní hypotéze: H A : μ(x) - μ(y) μ 0 : testovací kritérium: doplněk kritického oboru:, kde, a t(x), t(y) jsou kvantily Studentova rozdělení s k x =n1-1, k y =n-1 stupni volnosti.