Intervalové Odhady Parametrů II Testování Hypotéz

Podobné dokumenty
Intervalové Odhady Parametrů

Cvičení 10. Přednášející: Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc.

Odhady Parametrů Lineární Regrese

Cvičení 11. Přednášející: Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc.

Cvičení 1. Přednášející: Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc.

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Mgr. Rudolf Blažek, Ph.D. prof. RNDr. Roman Kotecký Dr.Sc.

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

4EK211 Základy ekonometrie

Normální (Gaussovo) rozdělení

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Cvičení ze statistiky - 8. Filip Děchtěrenko

Tomáš Karel LS 2012/2013

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

prof. RNDr. Roman Kotecký DrSc., Dr. Rudolf Blažek, PhD Pravděpodobnost a statistika Katedra teoretické informatiky Fakulta informačních technologií

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Ing. Michael Rost, Ph.D.

KGG/STG Statistika pro geografy

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

15. T e s t o v á n í h y p o t é z

Příklady na testy hypotéz o parametrech normálního rozdělení

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

5. T e s t o v á n í h y p o t é z

PRAVDĚPODOBNOST A STATISTIKA

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

12. cvičení z PST. 20. prosince 2017

Příklad datového souboru. Pravděpodobnost vs. statistika. Formální definice. Teorie odhadu

Testování statistických hypotéz

15. T e s t o v á n í h y p o t é z

Testy statistických hypotéz

Pravděpodobnost a aplikovaná statistika

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

12. prosince n pro n = n = 30 = S X

Testy. Pavel Provinský. 19. listopadu 2013

Testování statistických hypotéz

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Normální (Gaussovo) rozdělení

STATISTICKÉ HYPOTÉZY

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Stručný úvod do testování statistických hypotéz

Testování statistických hypotéz

Cvičení 5. Přednášející: Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc.

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

prosince oboustranný symetrický 95% interval spolehlivosti pro střední hodnotu životnosti τ. X i. X = 1 n.. Podle CLV má veličina

STATISTICKÉ ODHADY Odhady populačních charakteristik

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Testování statistických hypotéz. Obecný postup

7. Analýza rozptylu.

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

STATISTICKÉ ZJIŠŤOVÁNÍ

Zápočtová práce STATISTIKA I

Matematická statistika. Testy v. v binomickém. Test pravděpodobnosti. Test homogenity dvou. Neparametrické testy. statistika. Testy v.

Aproximace binomického rozdělení normálním

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

5. Odhady parametrů. KGG/STG Zimní semestr

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

STATISTIKA VĚDA O USUZOVÁNÍ NA ZÁKLADĚ DAT. Patrícia Martinková Ústav informatiky AV ČR

6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový.

Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj.

Ranní úvahy o statistice

Charakteristika datového souboru

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

5 Parametrické testy hypotéz

LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR

Bodové a intervalové odhady parametrů v regresním modelu

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

Testování hypotéz Biolog Statistik: Matematik: Informatik:

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Testování hypotéz o parametrech regresního modelu

UNIVERZITA PARDUBICE CHEMICKO-TECHNOLOGICKÁ FAKULTA KATEDRA ANALYTICKÉ CHEMIE

Přednáška X. Testování hypotéz o kvantitativních proměnných

1. (18 bod ) Náhodná veli ina X je po et rub p i 400 nezávislých hodech mincí. a) Pomocí ƒeby²evovy nerovnosti odhadn te pravd podobnost

Testování hypotéz o parametrech regresního modelu

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

PRAVDĚPODOBNOST A STATISTIKA

Výběrové charakteristiky a jejich rozdělení

Vybraná rozdělení náhodné veličiny

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

Opakování. Neparametrické testy. Pořadí. Jednovýběrový Wilcoxonův test. t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN

Transkript:

Parametrů II Testování Hypotéz Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení technické v Praze Rudolf Blažek & Roman Kotecký, 011 Pravděpodobnost a statistika BI-PST, LS 010/11, Přednáška 10 Evropský sociální fond Praha & EU: Investujeme do vaší budoucnos@

Odhad střední hodnoty Intervalové Odhady Konfidenční Intervaly, Intervaly spolehlivosti (Confidence Intervals)

Odhad střední hodnoty Bodové odhady populačního průměru μ a rozptylu σ Bodové odhady μ a σ Nechť X1, X, X3,..., Xn je náhodný výběr (i.i.d. náhodné veličiny) se střední hodnotou μ a rozptylem σ (konečnými). Jako bodový odhad μ použijeme výběrový průměr Jako bodový odhad σ použijeme výběrový rozptyl s n = 1 n 1 X n = 1 n P n i=1 X i P n i=1 (X i X n ) i.i.d....* independent and identically distributed * * * nezávislé a stejně rozdělené 3

Odhad střední hodnoty Intervalový odhad popul. průměru μ Intervalový odhad střední hodnoty μ Nechť X1, X, X3,..., Xn je náhodný výběr (i.i.d. náhodné veličiny) se střední hodnotou μ a rozptylem σ (konečnými). (1 α)100% Oboustranný konfidenční interval pro μ: Při známém σ: Při neznámém σ: X n ± z / / n X n ± t /,n 1 s/ n zα/ * *... kritická hodnota rozdělení N(0,1) tα/,n-1*... kritická hodnota Studentova t-rozdělení tn-1 Pozn.: Pro malé n rozdělení Xi musí být normální 4

Odhad střední hodnoty Intervalový odhad popul. průměru μ Přibližné rozdělení je známo pomocí CLV Z = X n µ / p n N(0, 1) α/ 1 α α/ 0 - -zα/ zα/ 5

Odhad střední hodnoty Intervalový odhad popul. průměru μ Pro malé n rozdělení Xi musí být normální T = X n µ s/ p n t(n 1) α/ 1 α α/ -tα/,n-1 0 -.. tα/,n-1 6

Odhad střední hodnoty Intervalový odhad popul. průměru μ α/ 1 α α/ -zα/ 0 zα/ -.. -tα/,n-1 tα/,n-1 7

Odhad střední hodnoty Intervalový odhad popul. průměru μ Intervalový odhad střední hodnoty μ Nechť X1, X, X3,..., Xn je náhodný výběr (i.i.d. náhodné veličiny) se střední hodnotou μ a rozptylem σ (konečnými). (1 α)100% Jednostranný konfidenční interval pro μ: Při známém σ: (X n z / p n, 1) ( 1, X n + z / p n) Při neznámém σ: (X n t,n 1 s/ p n, 1) ( 1, X n + t,n 1 s/ p n) zα* *... kritická hodnota rozdělení N(0,1) tα,n-1*... kritická hodnota Studentova t-rozdělení tn-1 8

Odhad střední hodnoty Intervalový odhad popul. průměru μ Přibližné rozdělení je známo pomocí CLV Z = X n µ / p n N(0, 1) 1 α α 0 zα 9

Odhad střední hodnoty Intervalový odhad popul. průměru μ Pro malé n rozdělení Xi musí být normální T = X n µ s/ p n t(n 1) 1 α α 0 tα,n-1 10

Odhad střední hodnoty Intervalový odhad popul. průměru μ T = X n µ s/ p n t(n 1) 1 α α 0 zα tα,n-1 11

Odhad střední hodnoty Pravidla použití normálního a t-rozdělení Kritickou hodnotu zα/ normálního rozdělení použijeme pokud známe přesně populační rozptyl σ pravděpodobnost pokrytí přesně (1 α) když výběr je z normálního rozdělení (i pro malé n) pravděpodobnost pokrytí přibližně (1 α) když výběr je dostatečně velký (CLV pro velké n) obvykle stačí n = 30 či n = 50 ale pro šikmá či vícemodální rozdělení n musí být veliké 1

Odhad střední hodnoty Pravidla použití normálního a t-rozdělení Kritickou hodnotu tα/ Studentova t-rozdělení použijeme když populační rozptyl σ odhadujeme pomocí s pravděpodobnost pokrytí přesně (1 α) pokud výběr je z normálního rozdělení (i pro malé n) pravděpodobnost pokrytí přibližně (1 α) pokud výběr je ze symetrického unimodálního rozdělení, bez odlehlých pozorování a velikost výběru je n 15 výběr je ze mírně šikmého, unimodálního rozdělení, bez odlehlých pozorování a velikost výběru je 16 n 40 výběr je velký (n > 40) a bez odlehlých pozorování 13

Odhad rozptylu Intervalový odhad popul. rozptylu σ Intervalový odhad rozptylu σ Nechť X1, X, X3,..., Xn je náhodný výběr (i.i.d. náhodné veličiny) z normálního rozdělení se střední hodnotou μ a rozptylem σ (konečnými). (1 α)100% Oboustranný konfidenční interval pro σ : (n 1)s 1 /, n 1 apple apple (n 1)s /, n 1 /, n 1 a 1 /, n 1 * * * * * * * *...* kvantily rozdělení chi-kvadrát 14

Odhad rozptylu Intervalový odhad popul. rozptylu σ Rozdělení Xi musí být normální (n 1)s n 1 1 α α/ α/ 0 /, n 1 1 /, n 1 15

Odhad rozptylu Intervalový odhad popul. rozptylu σ Rozdělení Xi musí být normální P /, n 1 apple (n 1)s apple 1 /, n 1 1 α α/ α/ 0 /, n 1 1 /, n 1 16

Odhad rozptylu Intervalový odhad popul. rozptylu σ Pravděpodobnost pokrytí parametru σ 1 = P /, n 1 apple (n 1)s apple 1 /, n 1! 1 = P 1 1 /, n 1 apple (n 1)s apple 1 /, n 1! 1 = P (n 1)s 1 /, n 1 apple apple (n 1)s /, n 1 17

Příklad: odhad střední hodnoty a rozptylu normálního rozdělení Příklad: odhad střední hodnoty a rozptylu normálního rozdělení Příklad Uvažujme následující výběr (iid) z normálního rozdělení: i 1 3 4 5 6 7 8 9 10 Xi 1.7 1.88 1.84 1.81 1.75 1.9 1.80 1.68 1.80 1.81 Najděte intervalové odhady pro střední hodnotu a rozptyl rozdělení veličin Xi. Bodové odhady: X n = 1 P n n i=1 X i = 1.80 s n = 1 P n n 1 i=1 (X i X n ) P 10 i=1 (X i 1.80) = 0.0051 = 1 9 18

Příklad: odhad střední hodnoty a rozptylu normálního rozdělení Příklad: odhad střední hodnoty a rozptylu normálního rozdělení Příklad 90% intervalový odhad pro střední hodnotu X n ± t /,n 1 s/ n 1.80 ± (1.833) p 0.0051/10 X n = 1.80 s = 0.0051 t /,n 1 = t 0.05,9 = 1.833 90% intervalový odhad pro střední hodnotu: [1.76, 1.84] 19

Příklad: odhad střední hodnoty a rozptylu normálního rozdělení Příklad: odhad střední hodnoty a rozptylu normálního rozdělení Příklad 90% intervalový odhad pro rozptyl (n 1)s 1 /, n 1 apple apple (n 1)s /, n 1 (9)(0.0051) 16.9189 apple apple (9)(0.0051) 3.351 90% intervalový odhad pro rozptyl [0.007, 0.0138] 0

Testování Hypotéz Testování Hypotéz (Hypotheses Testing) 1

Testování Hypotéz Úvod Bodové a intervalové odhady Vyberu náhodně 30 kuliček (s vracením) Vidím do dlaně: 0 z 30 je červených Kolik procent kuliček Nevidím do krabičky v krabičce je asi červených? Bodový odhad: cca /3 = 66.67% Intervalový odhad s 95% spolehlivostí: 48.76% 84.57%

Testování Hypotéz Úvod Testování hypotéz Vyberu náhodně 30 kuliček (s vracením) Vidím do dlaně: 0 z 30 je červených Nevidím do krabičky Je v krabičce 40% červených kuliček? Závěr s 95% jistotou: NE Protože na 95% věřím: 48.76% 84.57% 3

Testování Hypotéz Úvod Testování hypotéz Dá se provádět s použitím intervalů spolehlivosti. V předchozím případě uvažovali následující hypotézy: Nulová hypotéza* * * * * H0: μ = 0.4 Oboustranná alternativa* * * HA: μ 0.4 Všimněte si: μ = EX = 0.q + 1.p = p = P(červená kulička) Závěr testu: Založen na oboustranném 95% intervalovém odhadu pro střední hodnotu μ: [0.4876, 0.8457] 0.4 [0.4876, 0.8457] Zamítneme H0 P(chyby) = 0.05... podívejme se blíže co chyba znamená 4

Testování Hypotéz Chyby při testování hypotéz Chyby při testování hypotéz Uvažované hypotézy: Nulová hypotéza* * * * * H0: μ = 0.4 Oboustranná alternativa* * * HA: μ 0.4 Závěr testu: Zamítneme H0 P(chyby) = P(zamítnu chybně H0) * = P( rozhodnu H0 neplatí přestože H0 platí ) * = P( rozhodnu μ 0.4 μ = 0.4 ) * = P( μ = 0.4 leží mimo 95% interval pro μ = 0.4 μ = 0.4 ) 0.05... protože histogram je centrován v 0.4 5

Testování Hypotéz Chyby při testování hypotéz Chyby při testování hypotéz T = X n µ s/ p n t(n 1).5% 95%.5% -.045 0.045 -.. 6

Testování Hypotéz Chyby při testování hypotéz Chyby při testování hypotéz X n N(µ, /n).5% 95%.5% μ.045 -s μ=0.40 μ+.045 s / p n / p n 7

Testování Hypotéz Chyby při testování hypotéz Chyby při testování hypotéz X n N(µ, /n).5% 95%.5% X n = 0.6667 μ 0.179 - μ=0.40 μ+0.179 0.1 0.579 8

Testování Hypotéz Chyby při testování hypotéz Chyby při testování hypotéz Uvažované hypotézy: Nulová hypotéza* * * * * H0: μ = 0.4 Oboustranná alternativa* * * HA: μ 0.4 Opačný závěr testu: Nezamítneme H0 P(chyby) = P(chybně nezamítnu H0) * = P( rozhodnu H0 platí přestože H0 neplatí ) * = P( rozhodnu μ = 0.4 μ 0.4 ) * = P( 0.4 leží uvnitř 95% intervalu pro μ 0.4 μ 0.4 ) =?... protože histogram je centrován v neznámém μ 0.4 9

Testování Hypotéz Chyby při testování hypotéz Oboustranná alternativa Obecné hypotézy o střední hodnotě μ Nulová hypotéza* * * * * H0: μ = μ0 Oboustranná alternativa* * * HA: μ μ0 Test založen na oboustranném (1 α)100% intervalovém odhadu pro střední hodnotu μ μ0 konfidenční interval Zamítneme H0 P(chyby) = α... Chyba prvního druhu malá, nastavená μ0 konfidenční interval Nezamítneme H0 P(chyby) =??... Chyba druhého druhu je neznámá Zamítnutí H0 je silný výsledek! 30

Testování Hypotéz Chyby při testování hypotéz Jednostranné alternativy Obecné hypotézy o střední hodnotě μ Nulová hypotéza* * * * * H0: μ = μ0 Jednostranná alternativa** * HA: μ < μ0 Test založen na jedstranném (1 α)100% konf. intervalu pro μ Typ intervalu: (, A) μ0 konfidenční interval (A < μ0 ) Zamítneme H0 P(chyby) = α... Chyba prvního druhu malá, nastavená μ0 konfidenční interval Nezamítneme H0 P(chyby) =??... Chyba druhého druhu je neznámá Zamítnutí H0 je silný výsledek! 31

Testování Hypotéz Chyby při testování hypotéz Jednostranné alternativy Konfidenční interval pro jednostrannou alternativu HA: μ < μ0 1 ) X n + t,n X n Věřím HA: μ < μ0 (a zamítnu H0) pokud výběrový průměr je mnohem menší než μ0 1 s/ p n X n ) A μ0 P(chybné zamítnutí H0) = α 1 X n ) A μ0 3

Testování Hypotéz Chyby při testování hypotéz Jednostranné alternativy Obecné hypotézy o střední hodnotě μ Nulová hypotéza* * * * * H0: μ = μ0 Jednostranná alternativa** * HA: μ > μ0 Test založen na jedstranném (1 α)100% konf. intervalu pro μ Typ intervalu: (A, ) μ0 konfidenční interval (A < μ0 ) Zamítneme H0 P(chyby) = α... Chyba prvního druhu malá, nastavená μ0 konfidenční interval Nezamítneme H0 P(chyby) =??... Chyba druhého druhu je neznámá Zamítnutí H0 je silný výsledek! 33

Testování Hypotéz Chyby při testování hypotéz Volba jednostranné alternativy Zamítnutí H0 je silný výsledek! Pokud potřebuji evidenci, že průměrná hodnota je veliká Nulová hypotéza* * * * * H0: μ = μ0 Jednostranná alternativa** * HA: μ > μ0 Např. při dokazovnání, že továrna příliš zamořuje ovzduší Pokud potřebuji evidenci, že průměrná hodnota je malá Nulová hypotéza* * * * * H0: μ = μ0 Jednostranná alternativa** * HA: μ < μ0 Např. při dokazovnání, že továrna NEzamořuje ovzduší nad daný limit 34

Testování Hypotéz Chyby při testování hypotéz Oboustranná a jednostranné alternativy Jednostranná alternativa* * * HA: μ < μ0 X n ) X n + t,n 1 s/ p n Jednostranná alternativa* * * HA: μ > μ0* * (se stejnými daty) ( X n t,n 1 s/ p n X n Oboustranná alternativa* * * HA: μ μ0* * (se stejnými daty) ( X n t,n 1 s/ p n 1 X n ) X n + t,n 1 s/ p n 35

Testování Hypotéz Chyby při testování hypotéz Oboustranná a jednostranné alternativy Oboustranná alternativa Nulová hypotéza* * * * * * * H0: μ = μ0 Oboustranná alternativa* * * * * HA: μ μ0 Test založen na oboustranném (1 α)100% konf. intervalu Jednostranná alternativa Nulová hypotéza* * * * * * * H0: μ = μ0 Jednostranná alternativa** Buď * * HA: μ > μ0!!!!!!!!! Anebo * HA: μ > μ0) Test založen na jednostranném (1 α)100% konf. intervalu Anebo na oboustranném (1 α)100% konf. intervalu 36