Testování hypotéz. December 10, 2008

Podobné dokumenty
Aproximace binomického rozdělení normálním

Testování statistických hypotéz. Obecný postup

= = 2368

PRAVDĚPODOBNOST A STATISTIKA

Testování statistických hypotéz

Testování statistických hypotéz

Stručný úvod do testování statistických hypotéz

Ing. Michael Rost, Ph.D.

12. prosince n pro n = n = 30 = S X

χ 2 testy. Test nekorelovanosti.

Testy statistických hypotéz

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Testy. Pavel Provinský. 19. listopadu 2013

Statistika, Biostatistika pro kombinované studium. Jan Kracík

prosince oboustranný symetrický 95% interval spolehlivosti pro střední hodnotu životnosti τ. X i. X = 1 n.. Podle CLV má veličina

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Testování statistických hypotéz

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

4EK211 Základy ekonometrie

Alternativní rozdělení. Alternativní rozdělení. Binomické rozdělení. Binomické rozdělení

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

2 ) 4, Φ 1 (1 0,005)

Normální (Gaussovo) rozdělení

KMA/P506 Pravděpodobnost a statistika KMA/P507 Statistika na PC

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

5 Parametrické testy hypotéz

Cvičení ze statistiky - 8. Filip Děchtěrenko

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Příklady: - počet členů dané domácnosti - počet zákazníků ve frontě - počet pokusů do padnutí čísla šest - životnost televizoru - věk člověka

You created this PDF from an application that is not licensed to print to novapdf printer (

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Normální (Gaussovo) rozdělení

Charakteristika datového souboru

Tomáš Karel LS 2012/2013

STATISTICKÉ HYPOTÉZY

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

ANOVA. Analýza rozptylu při jednoduchém třídění. Jana Vránová, 3.lékařská fakulta UK, Praha

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

12. cvičení z PST. 20. prosince 2017

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

4ST201 STATISTIKA CVIČENÍ Č. 7

Intervalové Odhady Parametrů II Testování Hypotéz

Pravděpodobnost a aplikovaná statistika

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

Náhodné veličiny, náhodné chyby

Testování hypotéz. 4. přednáška

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Jednofaktorová analýza rozptylu

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

VŠB-TU OSTRAVA, FAKULTA ELEKTROTECHNIKY A INFORMATIKY, KATEDRA APLIKOVANÉ MATEMATIKY. Statistika. Vzorce a tabulky

Jednovýběrové testy. Komentované řešení pomocí MS Excel

MATEMATIKA. O paradoxech spojených s losováním koulí

Návrh a vyhodnocení experimentu

Příklad datového souboru. Pravděpodobnost vs. statistika. Formální definice. Teorie odhadu

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

Pravděpodobnost a statistika

ÚVOD DO TESTOVÁNÍ HYPOTÉZ. Martina Litschmannová

Vzorová prezentace do předmětu Statistika

Zápočtová práce STATISTIKA I

PRAVDĚPODOBNOST A STATISTIKA. Testování hypotéz o rozdělení

Příklady na testy hypotéz o parametrech normálního rozdělení

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj.

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Jednostranné intervaly spolehlivosti

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

NEPARAMETRICKÉ METODY

NUMP403 (Pravděpodobnost a Matematická statistika I)

KGG/STG Statistika pro geografy

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Matematika III. 3. prosince Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Buckinghamův Π-teorém (viz Barenblatt, Scaling, 2003)

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

KGG/STG Statistika pro geografy

5. T e s t o v á n í h y p o t é z

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

STATISTICKÉ TESTY VÝZNAMNOSTI

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA DOPRAVNÍ STATISTIKA. Semestrální práce

Zeptali jsme se 10 osob, kolik minut provolají měsíčně s rodinou a jejich odpovědi jsme zaznamenali do tabulky:

Transkript:

Testování hypotéz December, 2008

(Testování hypotéz o neznámé pravděpodobnosti) Jan a Františe mají pytlíy s uličami. Jan má 80 bílých a 20 červených, Františe má 30 bílých a 70 červených. Vybereme náhodně jeden pytlí a máme zjistit, omu patří. Napřílad tahle: Vytáhneme z pytlía uliče (po aždém tahu uliču vrátíme a přemícháme). Jestliže není mezi nimi víc červených uliče než 2, přisoudíme pytlí Janovi, v opačném případě Františovi. Jaá je pravděpodobnost omylu?

Je nutno si uvědomit, že se můžeme dopustit hned dvou omylů: pytlí patří Janovi, přisoudíme ho Františovi (chyba prvního druhu), pytlí patří Františovi, přisoudíme ho Janovi (chyba druhého druhu).

Chyba prvního druhu: Chyba nastane jestliže pytlí nepřisoudíme Janovi, ale je jeho. To se stane a p = 0.2, ale počet () červených uliče je aspoň 3. Zřejmě pravděpodobnost vytažení právě uliče z Janovho pytlía je ( ) P(X = ) = 0.2 0.8. Potom pravděpodobnost chyby prvního druhu je =3 ( ) 0.2 0.8 = 1 co je pomerně hodně. 2 =0 ( ) 0.2 0.8 = 0.3222,

Chyba druhého druhu: Chyba nastane jestliže pytlí přisoudíme Janovi, ale není jeho. To se stane a p = 0.7, ale počet () červených uliče je nejvíc 2. Zřejmě pravděpodobnost vytažení právě uliče z Ferovho pytlía je ( ) P(X = ) = 0.7 0.3. Potom pravděpodobnost chyby druhého druhu je 2 =0 ( ) 0.7 0.3 = 0.0016.

Zusíme pozměnit "testování": Pytlí přisoudíme Janovi jestliže počet červených uliče bude maximálně 3. Potom pro chybu prvního druhu platí =4 ( ) 0.2 0.8 = 1 a pro chybu druhého druhu platí 3 =0 3 =0 ( ) 0.2 0.8 = 0.12087, ( ) 0.7 0.3 = 0.060. Vidíme, že snížení chyby prvního druhu vedlo e zvýšení chyby druhého druhu. Pravděpodobnost chyby prvního druhu souvisí s hladinou významnostiα, hypotézu H 0 zamítneme na hladině významnosti α a je pravděpodobnost chyby prvního druhu právě α.

(Testování hypotéz - o střední hodnotě, v případě normality) Nechť naměřené údaje x 1, x 2,..., x n jsou výsledem náhodního výběru ze záladního souboru, na terém jsou hodnoty měřeného znau normálně rozdeleny N(µ,σ 2 ). Označme x výběrový průměr. Dá se doázat, že pro jeho disperzi platí D ( x) = σ2 n. Při dostatečně velém rozsahu výběru může být x spolehlivým uazatelem hodnoty µ. Jestliže x bude blízo předpoládané hodnotyµ 0, bude to ve prospěch hypotézy H 0, jestliže tato hodnota bude hodně menší, nebo hodně větší, bude to v neprospěch H 0.

(Testování hypotéz - o střední hodnotě, v případě normality) Známeσ 2. Náhodná veličina U = x µ σ n má rozdělení N(0, 1). Tuto veličinu použijeme jao testovací statistiu na ověření platnosti hypotézy. Zvolíme si hladinu významnosti α. Hladina významnosti je pravděpodobnost s jaou ještě připustíme, že můžeme zamítnout nulovou hypotézu, ačoliv ve sutečnosti platí. Nejčastěji se používá α = 0.05 nebo α = 0.01 Potom riticá oblast pro test oboustranné hypotézy proµ =µ 0 je určena nerovností: de U = x µ σ n> x, Φ(x ) = 1 α 2.

Přílad (Testování hypotéz - o střední hodnotě, v případě normality) Hmotnost studentů 2. ročníu FIT-u je normálně rozdělená, µ = 70g,σ 2 = 4g. Provedli jsme náhodný výběr a odvážili jsme se odvážit 30 studentů po zoušce z INM. Zjistili jsme, že jejich průměrná hmotnost je jenom 65g. Je tenhle poles hmotnosti statisticy významný na hladine α = 0.05? Má zouša z INM neblahý vliv na studenty?

Přílad (řešení) H 0 :µ=70 H 1 :µ 70 riterium... x poud platí H 0, ta x N 0 (µ = 70,σ 2 = 4) volmeα = 0.05 x = 1.96 x = 65 U = 65 70 2 30. = 13.693 ( 1.96, 1.96) H 0 zamítáme. Hubnutí je tedy štatisticy významní a tedy zouša z INM ma neblahý vliv. Co se naonec dalo očeávat. Kdyby U x, ta se jedná o případ, terý jsme za předpoladu, že H 0 je správná, očeávali s veliou pravděpodobností. Proto nulovou hypotézu nezamítáme a tvrdíme, že se nejedná o štatisticy významní rozdíl.

Nechť X je výslede testu pohybových schopností. Z dlouhodobého měření bylo zjištěno, že veličinu X lze popsat normálním rozdělením se střední hodnotou µ = 70, rozptylem σ 2 = 36. Chceme stat. testem ověřit hypotézu, že pohybové schopnosti leváů jsou lepší. U deseti náhodně vybraných leváů byl průměr pohybového testu 78 bodů. Je toto navýšení stat. významní na hladine α = 0.05?

H 0 :µ=70 H 1 :µ 70 riterium... x 36 poud platí H 0, ta x N 0 (µ = 70,σ2 x = = 3.6) riticé hodnoty vzhledem α = 0.05 jsou 1.96 a 1.96 U = 78 70. 3.6 = 4.22 ( 1.96, 1.96) H0 zamítáme.

(Síla testu) Určete sílu testu z předchozího příladu, poud ve sutečnosti je bodový průměr pohybového testu leváů 75 bodů.

(Síla testu) Síla testu = pravděpodobnost správného zamítnutí H 0 :µ=70, poud platí H 1 :µ=75. Nejprve převedeme riticé hodnoty 1.96, 1.96 normovaného normálního rozdělení na příslušné riticé hodnoty veličiny X. U = x µ σ x teda ±1.96 = x 70 3.6 x =±1.96 3.6 + 70 x m = 66.28, x v = 73.72. Síla testu: ) ( xv 75 1 F( x v ) = 1 Φ = 0.74857 3.6