poznámky k MIII, Tomečková I., poslední aktualizace 9. listopadu 016 9 Testování statistických hypotéz Obecný postup (I) Vyslovení hypotézy O datech vyslovíme doměnku, kterou chceme ověřit statistickým testem. Její matematické vyjádření označíme hypotéza H 0. Negací H 0 je alternativní hypotéza označená H 1. A. Formulace H 0 : A = B }{{} nulová hypotéza H 1 : A B }{{} alternativní hypotéza (oboustranná varianta) Případně lze použít jednu z jednostranných alternativních hypotéz (záleží na významu testovaných dat) H 0 : A B H 1 : A < B nebo H 0 : A B H 1 : A > B. B. Volba hladiny významnosti α - pravděpodobnost chyby I. druhu (tedy pravděpodobnost, že zamítneme pravdivý výrok H 0 ). (II) Statistický test se provede dosazením do testovacího kritéria a porovnámín s příslušnou kritickou hodnotou. (Každý test má své předem známé testovací kritérium a příslušnou kritickou hodnotu, které určíme pomocí softwaru.) (III) Vyslovení závěru plyne z výsleku testu. Jsou možné dva. Hodnota testovacího kritéria buďto překročí kritickou hodnotu nebo ne. Jestliže hodnota testovacího kritéria nepřekročí stanovenou kritickou hodnotu, pak řekneme, že Hypotézu H 0 nelze zamítnout. (Pro zamítnutí H 0 není dostatek podkladů, protože neznáme velikost chyby II. druhu.) Jestliže hodnota testovacího kritéria překročí stanovenou kritickou hodnotu, pak řekneme, že Hypotézu H 0 na hladině významnosti α zamítáme ve prospěch alternativy H 1. 1. Rozptyl normálního rozdělení Přehled statistických testů χ -test o rozptylu σ. Tj. má skupina dat {x i } i požadovaný rozptyl roven zvolené hodnotě σ0? Předpoklady: {x i } i jedna skupina naměřených hodnot, má normální rozdělení pravděpodobnosti n počet hodnot {x i } i, σ0 očekávaný rozptyl zadané číslo,
poznámky k MIII, Tomečková I., poslední aktualizace 9. listopadu 016 10 s výběrový rozptyl (lze dopočítat) Hypotéza: H 0 : σ = σ0 H 1 : σ σ0 (oboustranná) Test: testovací kritérium: χ = (n 1) s σ 0 = (n-1)* s / σ0 pro s =var.s(hodnoty x i) kritický interval: je tvořen kvantily χ α (n 1) ; χ 1 α (n 1) levá mezní hodnota =chisq.inv( α / ;n-1) pravá mezní hodnota =chisq.inv(1- α / ;n-1) χ χ α (n 1); χ 1 α (n 1) pak zamítáme H 0 ve prospěch alternativy H 1 χ χ α (n 1); χ 1 α (n 1) H 0 nelze zamítnout Hypotéza: H 0 : σ = σ0 H 1 : σ < σ0 (jednostranná) kritická hodnota: χ α(n 1) =chisq.inv( α ;n-1) χ χ α(n 1) pak zamítáme H 0 ve prospěch alternativy H 1 χ > χ α(n 1) H 0 nelze zamítnout Hypotéza: H 0 : σ = σ0 H 1 : σ > σ0 (jednostranná) kritická hodnota: χ 1 α (n 1) =chisq.inv( 1-α ;n-1) χ χ 1 α (n 1) pak zamítáme H 0 ve prospěch alternativy H 1 χ < χ 1 α (n 1) H 0 nelze zamítnout Mají provedená měření požadovanou přesnost? Lze tvrdit, že směrodatná odchylka odpovídající daným hodnotám je rovna zadanému číslu? Literatura: Pracovní listy strana 6, řešený příklad strana 150 a neřešený příklad na 7. Dvouvýběrový F-test významnosti rozdílu dvou rozptylů. Tj. mají obě skupiny dat {x i } i a {y j } j stejný rozptyl? Předpoklady: {x i } i a {y j } j dvě skupiny naměřených hodnot, nemusí být párové, mají normální rozdělení pravděpodobnosti s 1 a s výběrové rozptyly (lze dopočítat)
poznámky k MIII, Tomečková I., poslední aktualizace 9. listopadu 016 11 indexy volíme tak, aby s 1 s, n 1 a n počty hodnot{x i } i a {y j } j, Hypotéza: H 0 : σ1 = σ H 1 : σ1 σ (oboustranná) Test: testovací kritérium: F = s 1 s = s 1^/ s ^) kritická hodnota: pro s 1 s =var.s(hodnoty x i) =var.s(hodnoty y j) F krit = F 1 α (n 1 1, n 1) =f.inv(1-α/;n 1-1;n -1) α...zvolená pravděpodobnost chyby I. druhu F F krit pak zamítáme H 0 ve prospěch alternativy H 1 F < F krit H 0 nelze zamítnout Hypotéza (pravostranná): H 0 : σ1 = σ H 1 : σ1 > σ Test: testovací kritérium: viz oboustranný test kritická hodnota: F krit = F 1 α (n 1 1, n 1) =f.inv( 1-α ;n 1-1;n -1) viz oboustranný test Jsou obě měřené skupiny stejně vyrovnané? Pracují dva měřící přístroje stejně přesně? Jsou výkony dvou skupin studentů při písemce stejně vyrovnané? Jsou výsledky obou měření kvalitativně stejné? Literatura: Skripta kap. 1..1 na straně 6, řešený příklad na straně 7. Pracovní listy strana 63, řešený příklad strana 151 a neřešený příklad na 8.. Střední hodnota normálního rozdělení Jednovýběrový t-test o střední hodnotě µ. Tj. má skupina dat {x i } i požadovaný průměr roven zvolené hodnotě µ 0? Předpoklady: {x i } i jedna skupina naměřených hodnot, má normální rozdělení pravděpodobnosti n počet hodnot {x i } i, µ 0 očekávaná střední hodnota zadané číslo, x výběrová střední hodnota (lze dopočítat) s výběrový rozptyl (lze dopočítat) Hypotéza: H 0 : µ = µ 0 H 1 : µ µ 0 (oboustranná) n Test: testovací kritérium: T = (x µ 0 ) s = (x-µ 0 ) * (n/s )^0,5
poznámky k MIII, Tomečková I., poslední aktualizace 9. listopadu 016 1 pro x =průměr(hodnoty x i) s =var.s(hodnoty x i) kritická hodnota: kvantil t krit = t 1 α (n 1) =t.inv.t(α;n-1) T t krit pak zamítáme H 0 ve prospěch alternativy H 1 T < t krit H 0 nelze zamítnout Hypotéza jednostranná: H 0 : µ = µ 0 H 1 : µ > µ 0 kritická hodnota: kvantil t krit = t 1 α (n 1) viz oboustranný test Hypotéza jednostranná: H 0 : µ = µ 0 H 1 : µ < µ 0 =t.inv.t(*α;n-1) kritická hodnota: kvantil t krit = t 1 α (n 1) viz oboustranný test =t.inv.t(*α;n-1) Mají naměřená data požadovaný průměr? Mají dodané výrobky slibovanou kvalitu? Je měřící přístroj přesný? Nevzniká náhodou při měření systematická chyba? Literatura: Skripta kap. 1.3.1 na straně 8, řešený příklad na straně 9. Pracovní listy strana 61, řešený příklad strana 149 a neřešený příklad na 6. Dvouvýběrový t-test významnosti rozdílu dvou výběrových průměrů Tj. mají obě skupiny dat {x i } i a {y j } j stejnou střední hodnotu? Výpočet se provádí podle toho, jak vyšel test Dvouvýběrový F-test významnosti rozdílu dvou rozptylů. Proto je potřeba F-test provést nejdříve. Předpoklady: {x i } i a {y j } j dvě skupiny naměřených hodnot, nepárové, mají normální rozdělení pravděpodobnosti n 1 a n počty hodnot{x i } i a {y j } j, indexy volíme tak, aby n 1 n, x 1 a x výběrové střední hodnoty (lze dopočítat) s 1 a s příslušné výběrové rozptyly (lze dopočítat) Hypotéza: H 0 : µ 1 = µ H 1 : µ 1 µ nebo jednostranné hypotézy H 0 : µ 1 = µ H 1 : µ 1 > µ Test: (a) pokud podle F-testu je σ 1 = σ H 0 : µ 1 = µ H 1 : µ 1 < µ
poznámky k MIII, Tomečková I., poslední aktualizace 9. listopadu 016 13 testovací kritérium: T = x 1 x n1 n (n 1 + n ) n1 s 1 + n s n 1 + n =(x 1 -x )/(n 1 *s 1 +n *s )^0.5 * ((n 1*n *(n 1 +n -))/(n 1 +n ))^0.5 pro x 1 = průměr(hodnoty x i), x = průměr(hodnoty y j) s 1 = var.s(hodnoty x i), s = var.s(hodnoty y j) kritická hodnota: pro oboustranný test kvantil t krit = t 1 α (n 1 + n ) =t.inv.t(α;n 1 +n -) s = var.s(hodnoty y j) kritická hodnota: pro jednostranné testy kvantil t krit = t 1 α (n 1 + n ) =t.inv.t(*α;n 1 +n -) (b) pokud podle F-testu je σ1 σ x 1 x testovací kritérium: T = (n1 (n 1)s 1 + (n 1)(n 1 1)s 1) =(x 1 -x )/((n -1)*s 1 +(n 1-1)*s )^0.5 * ((n 1-1)*(n -1))^0.5 kritická hodnota: pro oboustranný test t krit = (n 1) s 1 t 1 α (n 1 1) + (n 1 1) s t 1 α (n 1) (n 1)s 1 + (n 1 1)s =((n -1)*s 1 *t.inv.t(α;n 1-1)+(n 1-1)*s *t.inv.t(α;n -1))/((n -1)*s 1 +(n 1-1)*s ) kritická hodnota: pro jednostranné testy t krit = (n 1) s 1 t 1 α(n 1 1) + (n 1 1) s t 1 α(n 1) (n 1)s 1 + (n 1 1)s =((n -1)*s 1 *t.inv.t(*α;n 1-1)+(n 1-1)*s *t.inv.t(*α;n -1))/((n -1)*s 1 +(n 1-1)*s ) T t krit pak zamítáme H 0 ve prospěch alternativy H 1 T < t krit H 0 nelze zamítnout Je výkonnost dvou skupin kvantitativně stejná? Je bodový zisk při písemce studentů ze dvou různých skupin v průměru stejný? Literatura: Skripta kap. 1.3. na straně 10, řešené příklady na straně 11-13. Pracovní listy strana 64 a 65, řešený příklad strana 15 a neřešený příklad na 8. Studentův t-test pro párové hodnoty Předpoklady: {[x i, y i ]} i skupina naměřených párových hodnot mají normální rozdělení pravděpodobnosti {d i } rozdíly hodnot x i y i, n počet hodnot {d i } i, x d výběrová střední hodnota pro {d i } i (lze dopočítat) výběrový rozptyl pro {d i } i (lze dopočítat) s d Hypotéza: H 0 : µ 1 = µ (d = 0) H 1 : µ 1 µ (d 0) nebo jednostranné hypotézy H 0 : µ 1 = µ H 1 : µ 1 > µ H 0 : µ 1 = µ H 1 : µ 1 < µ
poznámky k MIII, Tomečková I., poslední aktualizace 9. listopadu 016 14 Test: testovací kritérium: T = n 1 x d s d =(n-1)^0,5 * abs(x d )/ (s d )^0,5 pro x d =průměr(hodnoty d) s d =var.s(hodnoty d) kritická hodnota: pro oboustranný test t krit = t 1 α (n 1) =t.inv.t(α;n-1) kritická hodnota: pro jednostranné testy t krit = t 1 α (n 1) =t.inv.t(*α;n-1) T t krit pak zamítáme H 0 ve prospěch alternativy H 1 T < t krit H 0 nelze zamítnout Došlo ke změně výkonnosti po seřízení stroje? Zabrali nové léky na tlak, jestliže jsme u jedné skupiny pacientů měřili t a po podání léků? Zvýšil se průměrný výnos očesaných jablek ze sadu, jestliže se provedl po škůdcům? Nevzniká náhodou při měření systematická chyba? Literatura: Skripta kap. 1.3.3 na straně 14, řešený příklad na straně 15. Pracovní listy strana 66, řešený příklad strana 153 a neřešený příklad na 9.