Testování statistických hypotéz. Obecný postup

Podobné dokumenty
= = 2368

Testování statistických hypotéz

Testování statistických hypotéz

Testy statistických hypotéz

STATISTICKÉ HYPOTÉZY

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Charakteristika datového souboru

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Aproximace binomického rozdělení normálním

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Stručný úvod do testování statistických hypotéz

4ST201 STATISTIKA CVIČENÍ Č. 7

Náhodné veličiny, náhodné chyby

Testování hypotéz. 4. přednáška

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Testy. Pavel Provinský. 19. listopadu 2013

12. cvičení z PST. 20. prosince 2017

Ing. Michael Rost, Ph.D.

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Testování statistických hypotéz

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Příklady na testy hypotéz o parametrech normálního rozdělení

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Zápočtová práce STATISTIKA I

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Pravděpodobnost a aplikovaná statistika

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

5 Parametrické testy hypotéz

PRAVDĚPODOBNOST A STATISTIKA

STATISTICKÉ TESTY VÝZNAMNOSTI

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

12. prosince n pro n = n = 30 = S X

Neparametrické testy

Jednostranné intervaly spolehlivosti

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Cvičení ze statistiky - 8. Filip Děchtěrenko

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

15. T e s t o v á n í h y p o t é z

2 ) 4, Φ 1 (1 0,005)

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

Neparametrické metody

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

You created this PDF from an application that is not licensed to print to novapdf printer (

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

15. T e s t o v á n í h y p o t é z

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Testování hypotéz. December 10, 2008

Jednovýběrové testy. Komentované řešení pomocí MS Excel

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

5. T e s t o v á n í h y p o t é z

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

STATISTICKÉ TESTY VÝZNAMNOSTI

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

4EK211 Základy ekonometrie

Základní statistické metody v rizikovém inženýrství

Cvičení ze statistiky - 9. Filip Děchtěrenko

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Tomáš Karel LS 2012/2013

Opakování. Neparametrické testy. Pořadí. Jednovýběrový Wilcoxonův test. t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj.

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

KGG/STG Statistika pro geografy

ÚVOD DO TESTOVÁNÍ HYPOTÉZ. Martina Litschmannová

Statistika. Testování hypotéz - statistická indukce Parametrické testy. Roman Biskup

Pravděpodobnost a matematická statistika

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.

HODNOCENÍ VÝKONNOSTI ATRIBUTIVNÍCH ZNAKŮ JAKOSTI. Josef Křepela, Jiří Michálek. OSSM při ČSJ

Jednofaktorová analýza rozptylu

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

Matematika III. 3. prosince Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Přednáška X. Testování hypotéz o kvantitativních proměnných

KGG/STG Statistika pro geografy

TECHNICKÁ UNIVERZITA V LIBERCI

Lineární regrese. Komentované řešení pomocí MS Excel

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty

Transkript:

poznámky k MIII, Tomečková I., poslední aktualizace 9. listopadu 016 9 Testování statistických hypotéz Obecný postup (I) Vyslovení hypotézy O datech vyslovíme doměnku, kterou chceme ověřit statistickým testem. Její matematické vyjádření označíme hypotéza H 0. Negací H 0 je alternativní hypotéza označená H 1. A. Formulace H 0 : A = B }{{} nulová hypotéza H 1 : A B }{{} alternativní hypotéza (oboustranná varianta) Případně lze použít jednu z jednostranných alternativních hypotéz (záleží na významu testovaných dat) H 0 : A B H 1 : A < B nebo H 0 : A B H 1 : A > B. B. Volba hladiny významnosti α - pravděpodobnost chyby I. druhu (tedy pravděpodobnost, že zamítneme pravdivý výrok H 0 ). (II) Statistický test se provede dosazením do testovacího kritéria a porovnámín s příslušnou kritickou hodnotou. (Každý test má své předem známé testovací kritérium a příslušnou kritickou hodnotu, které určíme pomocí softwaru.) (III) Vyslovení závěru plyne z výsleku testu. Jsou možné dva. Hodnota testovacího kritéria buďto překročí kritickou hodnotu nebo ne. Jestliže hodnota testovacího kritéria nepřekročí stanovenou kritickou hodnotu, pak řekneme, že Hypotézu H 0 nelze zamítnout. (Pro zamítnutí H 0 není dostatek podkladů, protože neznáme velikost chyby II. druhu.) Jestliže hodnota testovacího kritéria překročí stanovenou kritickou hodnotu, pak řekneme, že Hypotézu H 0 na hladině významnosti α zamítáme ve prospěch alternativy H 1. 1. Rozptyl normálního rozdělení Přehled statistických testů χ -test o rozptylu σ. Tj. má skupina dat {x i } i požadovaný rozptyl roven zvolené hodnotě σ0? Předpoklady: {x i } i jedna skupina naměřených hodnot, má normální rozdělení pravděpodobnosti n počet hodnot {x i } i, σ0 očekávaný rozptyl zadané číslo,

poznámky k MIII, Tomečková I., poslední aktualizace 9. listopadu 016 10 s výběrový rozptyl (lze dopočítat) Hypotéza: H 0 : σ = σ0 H 1 : σ σ0 (oboustranná) Test: testovací kritérium: χ = (n 1) s σ 0 = (n-1)* s / σ0 pro s =var.s(hodnoty x i) kritický interval: je tvořen kvantily χ α (n 1) ; χ 1 α (n 1) levá mezní hodnota =chisq.inv( α / ;n-1) pravá mezní hodnota =chisq.inv(1- α / ;n-1) χ χ α (n 1); χ 1 α (n 1) pak zamítáme H 0 ve prospěch alternativy H 1 χ χ α (n 1); χ 1 α (n 1) H 0 nelze zamítnout Hypotéza: H 0 : σ = σ0 H 1 : σ < σ0 (jednostranná) kritická hodnota: χ α(n 1) =chisq.inv( α ;n-1) χ χ α(n 1) pak zamítáme H 0 ve prospěch alternativy H 1 χ > χ α(n 1) H 0 nelze zamítnout Hypotéza: H 0 : σ = σ0 H 1 : σ > σ0 (jednostranná) kritická hodnota: χ 1 α (n 1) =chisq.inv( 1-α ;n-1) χ χ 1 α (n 1) pak zamítáme H 0 ve prospěch alternativy H 1 χ < χ 1 α (n 1) H 0 nelze zamítnout Mají provedená měření požadovanou přesnost? Lze tvrdit, že směrodatná odchylka odpovídající daným hodnotám je rovna zadanému číslu? Literatura: Pracovní listy strana 6, řešený příklad strana 150 a neřešený příklad na 7. Dvouvýběrový F-test významnosti rozdílu dvou rozptylů. Tj. mají obě skupiny dat {x i } i a {y j } j stejný rozptyl? Předpoklady: {x i } i a {y j } j dvě skupiny naměřených hodnot, nemusí být párové, mají normální rozdělení pravděpodobnosti s 1 a s výběrové rozptyly (lze dopočítat)

poznámky k MIII, Tomečková I., poslední aktualizace 9. listopadu 016 11 indexy volíme tak, aby s 1 s, n 1 a n počty hodnot{x i } i a {y j } j, Hypotéza: H 0 : σ1 = σ H 1 : σ1 σ (oboustranná) Test: testovací kritérium: F = s 1 s = s 1^/ s ^) kritická hodnota: pro s 1 s =var.s(hodnoty x i) =var.s(hodnoty y j) F krit = F 1 α (n 1 1, n 1) =f.inv(1-α/;n 1-1;n -1) α...zvolená pravděpodobnost chyby I. druhu F F krit pak zamítáme H 0 ve prospěch alternativy H 1 F < F krit H 0 nelze zamítnout Hypotéza (pravostranná): H 0 : σ1 = σ H 1 : σ1 > σ Test: testovací kritérium: viz oboustranný test kritická hodnota: F krit = F 1 α (n 1 1, n 1) =f.inv( 1-α ;n 1-1;n -1) viz oboustranný test Jsou obě měřené skupiny stejně vyrovnané? Pracují dva měřící přístroje stejně přesně? Jsou výkony dvou skupin studentů při písemce stejně vyrovnané? Jsou výsledky obou měření kvalitativně stejné? Literatura: Skripta kap. 1..1 na straně 6, řešený příklad na straně 7. Pracovní listy strana 63, řešený příklad strana 151 a neřešený příklad na 8.. Střední hodnota normálního rozdělení Jednovýběrový t-test o střední hodnotě µ. Tj. má skupina dat {x i } i požadovaný průměr roven zvolené hodnotě µ 0? Předpoklady: {x i } i jedna skupina naměřených hodnot, má normální rozdělení pravděpodobnosti n počet hodnot {x i } i, µ 0 očekávaná střední hodnota zadané číslo, x výběrová střední hodnota (lze dopočítat) s výběrový rozptyl (lze dopočítat) Hypotéza: H 0 : µ = µ 0 H 1 : µ µ 0 (oboustranná) n Test: testovací kritérium: T = (x µ 0 ) s = (x-µ 0 ) * (n/s )^0,5

poznámky k MIII, Tomečková I., poslední aktualizace 9. listopadu 016 1 pro x =průměr(hodnoty x i) s =var.s(hodnoty x i) kritická hodnota: kvantil t krit = t 1 α (n 1) =t.inv.t(α;n-1) T t krit pak zamítáme H 0 ve prospěch alternativy H 1 T < t krit H 0 nelze zamítnout Hypotéza jednostranná: H 0 : µ = µ 0 H 1 : µ > µ 0 kritická hodnota: kvantil t krit = t 1 α (n 1) viz oboustranný test Hypotéza jednostranná: H 0 : µ = µ 0 H 1 : µ < µ 0 =t.inv.t(*α;n-1) kritická hodnota: kvantil t krit = t 1 α (n 1) viz oboustranný test =t.inv.t(*α;n-1) Mají naměřená data požadovaný průměr? Mají dodané výrobky slibovanou kvalitu? Je měřící přístroj přesný? Nevzniká náhodou při měření systematická chyba? Literatura: Skripta kap. 1.3.1 na straně 8, řešený příklad na straně 9. Pracovní listy strana 61, řešený příklad strana 149 a neřešený příklad na 6. Dvouvýběrový t-test významnosti rozdílu dvou výběrových průměrů Tj. mají obě skupiny dat {x i } i a {y j } j stejnou střední hodnotu? Výpočet se provádí podle toho, jak vyšel test Dvouvýběrový F-test významnosti rozdílu dvou rozptylů. Proto je potřeba F-test provést nejdříve. Předpoklady: {x i } i a {y j } j dvě skupiny naměřených hodnot, nepárové, mají normální rozdělení pravděpodobnosti n 1 a n počty hodnot{x i } i a {y j } j, indexy volíme tak, aby n 1 n, x 1 a x výběrové střední hodnoty (lze dopočítat) s 1 a s příslušné výběrové rozptyly (lze dopočítat) Hypotéza: H 0 : µ 1 = µ H 1 : µ 1 µ nebo jednostranné hypotézy H 0 : µ 1 = µ H 1 : µ 1 > µ Test: (a) pokud podle F-testu je σ 1 = σ H 0 : µ 1 = µ H 1 : µ 1 < µ

poznámky k MIII, Tomečková I., poslední aktualizace 9. listopadu 016 13 testovací kritérium: T = x 1 x n1 n (n 1 + n ) n1 s 1 + n s n 1 + n =(x 1 -x )/(n 1 *s 1 +n *s )^0.5 * ((n 1*n *(n 1 +n -))/(n 1 +n ))^0.5 pro x 1 = průměr(hodnoty x i), x = průměr(hodnoty y j) s 1 = var.s(hodnoty x i), s = var.s(hodnoty y j) kritická hodnota: pro oboustranný test kvantil t krit = t 1 α (n 1 + n ) =t.inv.t(α;n 1 +n -) s = var.s(hodnoty y j) kritická hodnota: pro jednostranné testy kvantil t krit = t 1 α (n 1 + n ) =t.inv.t(*α;n 1 +n -) (b) pokud podle F-testu je σ1 σ x 1 x testovací kritérium: T = (n1 (n 1)s 1 + (n 1)(n 1 1)s 1) =(x 1 -x )/((n -1)*s 1 +(n 1-1)*s )^0.5 * ((n 1-1)*(n -1))^0.5 kritická hodnota: pro oboustranný test t krit = (n 1) s 1 t 1 α (n 1 1) + (n 1 1) s t 1 α (n 1) (n 1)s 1 + (n 1 1)s =((n -1)*s 1 *t.inv.t(α;n 1-1)+(n 1-1)*s *t.inv.t(α;n -1))/((n -1)*s 1 +(n 1-1)*s ) kritická hodnota: pro jednostranné testy t krit = (n 1) s 1 t 1 α(n 1 1) + (n 1 1) s t 1 α(n 1) (n 1)s 1 + (n 1 1)s =((n -1)*s 1 *t.inv.t(*α;n 1-1)+(n 1-1)*s *t.inv.t(*α;n -1))/((n -1)*s 1 +(n 1-1)*s ) T t krit pak zamítáme H 0 ve prospěch alternativy H 1 T < t krit H 0 nelze zamítnout Je výkonnost dvou skupin kvantitativně stejná? Je bodový zisk při písemce studentů ze dvou různých skupin v průměru stejný? Literatura: Skripta kap. 1.3. na straně 10, řešené příklady na straně 11-13. Pracovní listy strana 64 a 65, řešený příklad strana 15 a neřešený příklad na 8. Studentův t-test pro párové hodnoty Předpoklady: {[x i, y i ]} i skupina naměřených párových hodnot mají normální rozdělení pravděpodobnosti {d i } rozdíly hodnot x i y i, n počet hodnot {d i } i, x d výběrová střední hodnota pro {d i } i (lze dopočítat) výběrový rozptyl pro {d i } i (lze dopočítat) s d Hypotéza: H 0 : µ 1 = µ (d = 0) H 1 : µ 1 µ (d 0) nebo jednostranné hypotézy H 0 : µ 1 = µ H 1 : µ 1 > µ H 0 : µ 1 = µ H 1 : µ 1 < µ

poznámky k MIII, Tomečková I., poslední aktualizace 9. listopadu 016 14 Test: testovací kritérium: T = n 1 x d s d =(n-1)^0,5 * abs(x d )/ (s d )^0,5 pro x d =průměr(hodnoty d) s d =var.s(hodnoty d) kritická hodnota: pro oboustranný test t krit = t 1 α (n 1) =t.inv.t(α;n-1) kritická hodnota: pro jednostranné testy t krit = t 1 α (n 1) =t.inv.t(*α;n-1) T t krit pak zamítáme H 0 ve prospěch alternativy H 1 T < t krit H 0 nelze zamítnout Došlo ke změně výkonnosti po seřízení stroje? Zabrali nové léky na tlak, jestliže jsme u jedné skupiny pacientů měřili t a po podání léků? Zvýšil se průměrný výnos očesaných jablek ze sadu, jestliže se provedl po škůdcům? Nevzniká náhodou při měření systematická chyba? Literatura: Skripta kap. 1.3.3 na straně 14, řešený příklad na straně 15. Pracovní listy strana 66, řešený příklad strana 153 a neřešený příklad na 9.