STATISTICKÉ HYPOTÉZY

Podobné dokumenty
STATISTICKÉ ZJIŠŤOVÁNÍ

Ing. Michael Rost, Ph.D.

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování statistických hypotéz

Testování statistických hypotéz. Obecný postup

Aproximace binomického rozdělení normálním

Testování statistických hypotéz

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Testování statistických hypotéz

Testy. Pavel Provinský. 19. listopadu 2013

Testy statistických hypotéz

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Normální (Gaussovo) rozdělení

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Pravděpodobnost a aplikovaná statistika

Stručný úvod do testování statistických hypotéz

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Normální (Gaussovo) rozdělení

4EK211 Základy ekonometrie

PRAVDĚPODOBNOST A STATISTIKA

Charakteristika datového souboru

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

5 Parametrické testy hypotéz

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

4ST201 STATISTIKA CVIČENÍ Č. 7

= = 2368

Cvičení ze statistiky - 8. Filip Děchtěrenko

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

15. T e s t o v á n í h y p o t é z

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

15. T e s t o v á n í h y p o t é z

Náhodné veličiny, náhodné chyby

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

Zápočtová práce STATISTIKA I

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

12. cvičení z PST. 20. prosince 2017

Příklady na testy hypotéz o parametrech normálního rozdělení

5. T e s t o v á n í h y p o t é z

7.1. Podstata testu statistické hypotézy

Testování hypotéz. 4. přednáška

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

2 ) 4, Φ 1 (1 0,005)

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

12. prosince n pro n = n = 30 = S X

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

prosince oboustranný symetrický 95% interval spolehlivosti pro střední hodnotu životnosti τ. X i. X = 1 n.. Podle CLV má veličina

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

You created this PDF from an application that is not licensed to print to novapdf printer (

Testování hypotéz Biolog Statistik: Matematik: Informatik:

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Jednostranné intervaly spolehlivosti

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Intervalové Odhady Parametrů II Testování Hypotéz

STATISTICKÉ TESTY VÝZNAMNOSTI

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Regresní a korelační analýza

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Regresní a korelační analýza

Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj.

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Jana Vránová, 3. lékařská fakulta UK

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Test dobré shody v KONTINGENČNÍCH TABULKÁCH

Neparametrické metody

KGG/STG Statistika pro geografy

Tomáš Karel LS 2012/2013

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

KGG/STG Statistika pro geografy

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

KGG/STG Statistika pro geografy

TECHNICKÁ UNIVERZITA V LIBERCI. Statistický rozbor dat z dotazníkového šetření

Ekonomická statistika

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

TECHNICKÁ UNIVERZITA V LIBERCI

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA

Transkript:

STATISTICKÉ HYPOTÉZY

ZÁKLADNÍ POJMY Bodové/intervalové odhady Maruška řešila hodnoty parametrů (průměr, rozptyl atd.) Zde bude Maruška dělat hypotézy (předpoklady) ohledně parametrů Z.S. Výsledek nebude číslo, ale výrok!!! Výrok bude vyřčen s určitou spolehlivostí obsahuje určité riziko Maruška opět nebude muset provést vyčerpávající šetření Na základě výběrového souboru (50 chlapců) bude činit závěry Ohledně parametrů základního souboru

Testování hypotéz Maruška bude stát před 2 hypotézami (H 0 a H 1 ) Jejím cílem je učinit výrok, která hypotéza platí Například hypotéza jak je to s tím průměrem H 0 : μ=μ 0 (16cm) Proti stojí alternativní hypotéza H 1, která se snaží popřít H 0 H 1 může být dvoustranná, nebo jednostranná (jako u odhadů) H 1 : μ μ 0 - dvoustranná hypotéza H 1 : μ>μ 0 pravostranná hypotéza (průměr Z.S. je větší než μ 0 16cm) H 1 : μ<μ 0 levostranná hypotéza (průměr Z.S. je menší než μ 0 16cm) Důležité Test sestavíme tak, abychom dokázali platnost H 1, tedy zamítli platnost H 0

Chyby Řekl jsem: výrok je vyřčen s určitou spolehlivostí Maruška si musí být vědoma, že existuje určité riziko že výrok nebude správně Cílem je dokázat H 1 riziko přijmutí H 1 (průměr není 16cm), ale průměr bude 16 cm, platí H 0 Chyba prvního druhu (α) Maruška vše správně spočítá(uvidíme dále), zamítne tak H 0 a přijme H 1 Ale z nějakého důvodu bude platit H 0 Pravděpodobnost, že se dopustí této chyby (1-druhu) je α (5%,10%,) Chyba druhého druhu (β) Opak Maruška vše správně spočítá Vyjde jí, že H 0 platí nezamítne tak H 1 Ale ve skutečnosti bude platit H 1 a nebude platit H 0 Pravděpodobnost, že se dopustí této chyby (2-druhu) je β Síla testu 1- β pravděpodobnost, že se nedopustíme chyby 2 druhu Dopustíme 5% (β=0,05) nedopustíme 1- β 1-0,05 95% Na 95% se jí nedopustíme

Postup Více nás bude zajímat chyba 1 druhu 1) Před testem si zvolíme tzv. hladinu významnosti Pravděpodobnost, se kterou jsme ochotni nést riziko 1 druhu (přijmeme H 1, ale platí H 0 ) 2) Vybereme testové kritérium (T)(vzoreček) U 1 U 2 Testové kritérium nabývá hodnot množinu nazveme výběrový prostor (S) (všechny možné spočtené hodnoty) Množinu výběrového prostoru rozdělíme na dva podprostory a) Podprostor (V) obor přijetí Hodnoty obsažené ve (V) svedší pro přijetí H 0 b) Podprostor (W) kritický obor Hodnoty obsažené ve (W) svědčí pro přijetí H 1 My si vypočítáme T a následně zjišťujeme kam tato hodnota patří U 1 V zamítneme H 1 U 2 W přijmeme H 1 a zamítneme H 0 S V W=S Kritické hodnoty - Hranice (bodů) oddělující W a V W V

Specifikace Hypotéza H 0 má být jednoduchá jednoznačná specifikace (průměr je XX, rozptyl je YY, korelace existuje atd.) Hypotéza H 1 bývá složená dále nespecifikuje (průměr není takový, je větší, menší než XX, ale dále již nespecifikuje) Volba testového kritéria Musíme znát rozdělení testového kritéria(t) při platnosti H 0!!! Sestrojení kritického oboru (W) Interval do kterého spadnou hodnoty svědčící pro přijetí hypotézy H 1 Velikost W bude záviset na předem zvolené chybě 1 druhu Pravděpodobnost (1,5,10%), že výsledek z testového kritéria bude ležet ve W Ale přesto bude platit H 0 pamatovat to je to riziko Jinak na (1-α) (99,95,90%) můžeme říci, že H 1 bude platit

Z T vyjde číslo a musíme určit zda-li H 1 byla prokázána a nebo nebyla Pro H 1 svědčí nízké hodnoty testového kritéria T W=(T min ; T α ) Pro H 1 svědčí vysoké hodnoty testového kritéria T W=(T 1-α ;T max ) T α T 1-α Pro H 1 svědčí extrémně nízké, nebo extrémně vysoké hodnoty T W=(T min ; T α/2 ) (T 1-α/2 ;T max ) Co si z toho vzít: 1) Neplést si α a α/2 2) Neplést si kdy použít α a kdy 1-α T α/2 T 1-α/2 Předem zvolené (α) nám říká, jak vysoké riziko chyby 1 druhu jsme ochotni nést Závěr testu: T a) T W H 1 byla prokázána a neseme 100α% - že je výrok špatně b) T V H 1 nebyla prokázána Když navíc vyslovíme výrok, že H 0 platí vystavujeme se chybě 2 druhu

PARAMETRICKÉ TESTY Parametrické předpokládáme určité rozdělení základního souboru Cílem bude vytvářet výroky o charakteristikách (parametrech rozdělení) Z.S. Test hypotézy o průměru Nepřeskakovat důležité vysvětlím omáčku z minula!!! Maruška řeší průměrnou délku prstů na univerzitě Provede náhodný výběr a sestaví hypotézy H 0 : μ=μ 0 - průměr Z.S. je roven 16,5 cm Alternativy H 1 : μ μ 0 - dvoustranná hypotéza H 1 : μ>μ 0 pravostranná hypotéza (průměr Z.S. je větší než μ 0 16,5 cm) H 1 : μ<μ 0 levostranná hypotéza (průměr Z.S. je menší než μ 0 16,5 cm)

Maruška musí rozlišit: 1) Rozsah výběru a zvolené testové kritérium 2a) zná rozptyl Z.S. σ 2 2b) nezná rozptyl Z.S. a musí jej vypočítat z hodnot pořízených z náhodného výběru s 2 x 3) Jakou bude volit formulaci alternativní hypotézy (>< ) Z toho i volba kritického oboru

1) Maruška provede výběr o 40 chlapcích a zná rozptyl Z.S. σ 2 =4 2) Zvolí si s jakou P chce hypotézu prokázat 95% - (α=0,05) 3) Spočítá výběrový průměr x - =16,5 prostý aritmetický průměr 4) Maruška bude testovat hypotézu H 0 : μ=17 cm H 1 : μ 17 cm Spočítá testové kritérium Oboustranný test W=(T min ; T α/2 ) (T 1-α/2 ;T max ) NNR hledáme v tabulkách kvantily u 0,025 a u 0,975 Známe -u α =u 1-α V tabulkách u 0,975 = 1,960 Spočítám u 0,025 = -1,960 Kritický obor Když U padne Zamítáme H 0 S 95% P U neleží v kritickém oboru U leží v oboru přijetí, nemůžeme zamítnout H 0-1,581-1,960 17 0 1,960 x

1) Maruška provede výběr o 40 chlapcích a zná rozptyl Z.S. σ 2 =4 2) Zvolí si s jakou P chce hypotézu prokázat 95% - (α=0,05) 3) Spočítá výběrový průměr x - =17,7 prostý aritmetický průměr 4) Maruška bude testovat hypotézu H 0 : μ=17 cm H 1 : μ>17 cm Spočítá testové kritérium Jednostranná hypotéza W=(T 1-α ;T max ) NNR hledáme v tabulkách kvantil u 0,95 = 1,645 Protože je 2,2135>1,645 T W H 1 byla prokázána S 95% pravděpodobností bude platit Že průměr Z.S. bude větší než 17cm Maruška se může radovat Kritický obor Když U padne Zamítáme H 0 S 95% P 17 0 1,645

Známe rozptyl základního souboru a předpoklad při H 0 NNR H 0 H 1 Testovací statistika Kritický obor μ=μ 0 μ μ 0 T>u 1-α/2 ;T<u α/2 μ μ 0 μ>μ 0 T>u 1-α μ μ 0 μ<μ 0 T<-u α

Neznáme rozptyl základního souboru a předpoklad při H 0 NNR H 0 H 1 Testovací statistika Kritický obor μ=μ 0 μ μ 0 T>u 1-α/2 ;T<u α/2 μ μ 0 μ>μ 0 T>u 1-α μ μ 0 μ<μ 0 T<-u α

1) Maruška provede výběr o 20 chlapcích a nezná rozptyl Z.S. 2) Zvolí si s jakou P chce hypotézu prokázat 90% - (α=0,1) 3) Spočítá výběrový průměr x - =16,5 prostý aritmetický průměr 4) Spočítá výběrový rozptyl s x 2=3,9 - s x =1,974 4) Maruška bude testovat hypotézu H 0 : μ=17 cm H 1 : μ 17 cm Spočítá testové kritérium Při platnosti H 0 t-rozdělení Oboustranný test W=(T min ; T α/2 ) (T 1-α/2 ;T max ) t-rozdělení hledáme v tabulkách kvantily t α (n-1) Známe -t α =t 1-α V tabulkách t 0,95 (19)= 1,729 Spočítám t 0,05 (19)= -1,729 Protože je -1,113>-1,729!!! T V H 1 nebyla prokázána S ohledem na riziko chyby 2 druhu můžeme Přijmout H 0, že průměr je 17cm -1,729 Kritický obor Když t padne Zamítáme H 0 S 90% P -1,113 17 0 1,729

Neznáme rozptyl základního souboru a předpoklad při H 0 t-rozdělení (malý výběr) H 0 H 1 Testovací statistika Kritický obor μ=μ 0 μ μ 0 T>t 1-α (n-1) T<t α (n-1) μ μ 0 μ>μ 0 T>u 1-α μ μ 0 μ<μ 0 T<-u α x

Test hypotézy o rozptylu Maruška bude zkoumat rozptyl základního souboru (chlapci na univerzitě) Provede náhodný výběr a sestaví hypotézy H 0 : σ 2 =σ 2 0 - rozptyl Z.S. je 3,8cm Alternativy H 1 : σ 2 σ 2 0 - dvoustranná hypotéza H 1 : σ 2 >σ 2 0 pravostranná hypotéza (rozptyl Z.S. je větší než σ 2 0 3,8cm) H 1 : σ 2 <σ 2 0 levostranná hypotéza (rozptyl Z.S. je menší než σ 2 0 3,8cm) Testové kritérium: Statistika má při platnosti H 0 χ 2 -rozdělení s v=n-1 stupni volnosti

Kritické obory Stejná logika jako u průměru Kritické hodnoty opět na okrajích Oboustranná hypotéza χ 2 χ 2 χ 2 χ 2 χ 2 χ2 χ 2 χ 2 χ 2 α/2 Hodnota testového kritéria bude menší než daný kvantil s (n-1) stupni volnosti Nebo χ 2 χ 2 1-α/2 Hodnota testového kritéria bude menší než daný kvantil s (n-1) stupni volnosti Jednostranná hypotéza Přijmu H 1 zamítnu H 0 Zamítnu H 1 χ 2 χ 2 α χ 2 χ 2 1-α χ 2 α χ 2 1-α χ 2 α/2 Χ 2 0,1/2 χ 2 1-α/2 χ 2 1-0,1/2

Test o rozptylu - při H 0 χ 2 -rozdělení s (n-1) stupni volnosti H 0 H 1 Testovací statistika Kritický obor σ 2 =σ 2 0 σ 2 σ 2 T>χ 2 1-α/2(n-1) T<χ 2 α/2(n-1) σ 2 σ 2 0 σ 2 >σ 2 0 T>χ 2 1-α(n-1) σ 2 σ 2 0 σ 2 <σ 2 0 T<χ 2 α(n-1) x