prosince oboustranný symetrický 95% interval spolehlivosti pro střední hodnotu životnosti τ. X i. X = 1 n.. Podle CLV má veličina

Podobné dokumenty
12. prosince n pro n = n = 30 = S X

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

12. cvičení z PST. 20. prosince 2017

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

= = 2368

Testování statistických hypotéz

Normální (Gaussovo) rozdělení

, 1. skupina (16:15-17:45) Jméno: se. Postup je třeba odůvodnit (okomentovat) nebo uvést výpočet. Výsledek bez uvedení jakéhokoliv

Testování statistických hypotéz

Cvičení ze statistiky - 8. Filip Děchtěrenko

Aproximace binomického rozdělení normálním

Normální (Gaussovo) rozdělení

PRAVDĚPODOBNOST A STATISTIKA

4ST201 STATISTIKA CVIČENÍ Č. 7

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Stručný úvod do testování statistických hypotéz

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33

KGG/STG Statistika pro geografy

Testy. Pavel Provinský. 19. listopadu 2013

2 ) 4, Φ 1 (1 0,005)

Ing. Michael Rost, Ph.D.

1. (18 bod ) Náhodná veli ina X je po et rub p i 400 nezávislých hodech mincí. a) Pomocí ƒeby²evovy nerovnosti odhadn te pravd podobnost

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Testování statistických hypotéz

Intervalové Odhady Parametrů

8. Normální rozdělení

Příklady na testy hypotéz o parametrech normálního rozdělení

Výběrové charakteristiky a jejich rozdělení

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Testy statistických hypotéz

Pravděpodobnost a aplikovaná statistika

5 Parametrické testy hypotéz

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Testování hypotéz. 4. přednáška

15. T e s t o v á n í h y p o t é z

STATISTICKÉ HYPOTÉZY

Náhodné veličiny, náhodné chyby

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Definice spojité náhodné veličiny zjednodušená verze

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

5. T e s t o v á n í h y p o t é z

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

15. T e s t o v á n í h y p o t é z

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Charakteristika datového souboru

, 4. skupina (16:15-17:45) Jméno: se. Postup je třeba odůvodnit (okomentovat) nebo uvést výpočet. Výsledek bez uvedení jakéhokoliv

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Regresní analýza 1. Regresní analýza

Náhodné (statistické) chyby přímých měření

You created this PDF from an application that is not licensed to print to novapdf printer (

populace soubor jednotek, o jejichž vlastnostech bychom chtěli vypovídat letní semestr Definice subjektech.

KGG/STG Statistika pro geografy

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Opakování. Neparametrické testy. Pořadí. Jednovýběrový Wilcoxonův test. t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Intervalové Odhady Parametrů II Testování Hypotéz

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

Cvičení ze statistiky - 9. Filip Děchtěrenko

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

Testování hypotéz. December 10, 2008

Vybraná rozdělení náhodné veličiny

Přijímací zkouška na navazující magisterské studium 2017

Pravděpodobnost a aplikovaná statistika

Tomáš Karel LS 2012/2013

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Odhad parametrů N(µ, σ 2 )

3 Bodové odhady a jejich vlastnosti

4EK211 Základy ekonometrie

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

ROZDĚLENÍ NÁHODNÝCH VELIČIN

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

y = 0, ,19716x.

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

MATEMATICKÁ STATISTIKA

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Testování statistických hypotéz. Obecný postup

Pravděpodobnost a matematická statistika

Rozdělení náhodné veličiny. Distribuční funkce. Vlastnosti distribuční funkce

7. Analýza rozptylu.

Náhodné chyby přímých měření

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení

Transkript:

10 cvičení z PSI 5-9 prosince 016 101 intervalový odhad Veličina X, představující životnost žárovky, má exponenciální rozdělení s parametrem τ Průměrná životnost n = 64 náhodně vybraných žárovek je x = 10 hodin Pomocí centrální limitní věty určete oboustranný symetrický 95% interval spolehlivosti pro střední hodnotu životnosti τ Pro veličinu X máme EX = τ a DX = τ Veličina průměrná životnost n = 64 žárovek je dána jako X = 1 n X i n Pro ni máme EX = τ a DX = τ n Podle CLV má veličina normx = X τ n τ přibližně normované normální rozdělení N0, 1 Pro α = 005 označme u 0975 = Φ 1 1 α = Φ 1 0975 = 196 Díky CLV můžeme přibližně psát 095 = P u 0975 normx u 0975 = P u 0975 X τ n u0975 = τ = P u 0975 X n τ 1 u 0975 X X = P τ n 1+ u0975 n 1 u0975 n Realizace veličiny X je x = 10 hodin Hledaný oboustranný symetrický 95% interval spolehlivosti v hodinách pro τ je tak přibližně x x 10 10, = 1+ u0975 n 1 u0975 n 1+ 196, 64 1 196 = 168675, 78146 64 10 odhad parametru - diskrétní rozdělení Náhodná veličina X nabývá hodnot z množiny {0, 1, } a pravděpodobnostmi PX = j = a+bj pro všechna j {0, 1, } Odhadněte metodou momentů parametry a, b na základě četností podle následující tabulky: hodnota 0 1 pozorovaná četnost 17 15 8

Protože hodnoty PX = j = a+bj musí být pravděpodobnosti, dostáváme podmínky a+b 0 0 a+b 1 0 a+b 0 1 = a+b 0+a+b 1+a+b = 3a+3b Dále budeme chtít, aby se rovnal první moment a jeho odhad: Pro střední hodnotu dostáváme EX = m X EX = 0 a+b 0+1 a+b 1+ a+b = 3a+5b Pro výběrový průměr tj odhad prvního momentu pak máme Celkově máme soustavu rovnic s řešením b = 9 80 = 0115 a a = 1 3 vycházejí jako m X = 0 17+1 15+ 8 17+15+8 3a+3b = 1 3a+5b = 31 40 b = 107 40 = 31 40 PX = 0 = a = 107 = 04459 44 = 04458 Jednotlivé pravděpodobnosti pak PX = 1 = a+b = 1 = 03333 3 PX = = a+b = 53 = 008 40 takže všechny podmínky máme splněny a našli jsme skutečně odhad parametru 103 odhad parametru - směs veličin V osudí jsou dva druhy kostek - na prvních jsou čísla 1,,6 a na druhých pouze čísla,4,6 U obou druhů jsou všechny možné výsledky na dané kostce vždy stejně pravděpodobné Vytáhli jsme 0 kostek a jednou jimi hodili Četnost výsledků udává tabulka: hodnota 1 3 4 5 6 pozorovaná četnost 3 4 4 4 3 Odhadněte v jakém poměru jsou jednotlivé druhy kostek mezi kostkami, které jsme vytáhli a kolik z vytažených kostek bylo prvního druhu Použijte metodu momentů i metodu maximální věrohodnosti Celkem jsem vytáhli 3+4+4+4++3 = 0 kostek Označme k počet kostek prvního druhu mezi těmito vytaženými Zřejmě tedy je k {0,1,,0} Protože liché hodnoty padají pouze na kostkách prvního druhu, musí být k 3+4+ = 9 Page

Označme si Ω = množina kostek, které jsme si vytáhli, Ω 1 = kostky 1druhu z Ω, Ω = kostky druhu z Ω Zřejmě je Ω = Ω 1 Ω, Ω = 0 a PΩ 1 = k 0 Naše veličina X : Ω R, X = hodnota, která padne na kostce z Ω je pak směsí veličin Y 1 : Ω 1 R a Y : Ω R Y 1 = hodnota, která padne na kostce z Ω 1 Y = hodnota, která padne na kostce z Ω ve tvaru X = Mix k Y 1,Y 0 Metoda maximální věrohodnosti: Z definice směsi máme p X i = k 0 p Y 1 i+ 1 k p Y i = 0 Takže pro věrohodnost dostáváme Lk = k 0 1 6 = k k 0 1 10, i = 1,3,5, 6 + 1 k 0 k 3+4+ 1 10 3 k 4+4+3 10 1 3 = 1 3 k 10, i =,4,6 k 40 k lk = lnlk = 9 ln +11 ln 10 10 kde k {9,,0} Pro nalezení maxima je jednodušší na chvíli předpokládat, že funkce l je dodefinována na vhodném intervalu Můžeme tedy postupovat jako při hledání maxima funkce na intervalu a to pomocí derivace l k = 9 k 11 40 k = 360 0k k40 k Z tvaru derivace l je ihned zřejmé, ze např na intervalu 0,40 má funkce l jediné maximum tam, kde je l nulová, tedy pro k = 360 0 = 18 Tato hodnota je i v souladu s počátečními omezujícími podmínkami Metoda momentů: Zřejmě EY 1 = 7 a EY = 4 Z definice směsi máme a výběrový průměr je EX = k 0 EY 1+ 1 k EY = k 0 0 7 1 + k 4 = 4 k 0 40 x = 3 1+4 +4 3+4 4+ 5+3 6 0 = 67 0 Page 3

Srovnáním dostaneme což dává 4 k 40 = EX = x = 67 0, k = 6 Tato hodnota ale NEODPOVÍDÁ počátečním omezujícím podmínkám Metoda momentů nám tedy v tomto případě žádný odhad NEPOSKYTUJE 104 odhad parametru - spojité rozdělení Náhodná veličina X s oborem hodnot a,+ má hustotu { 0, t,a, f X t = e a t, t a,, kde a R je parametr Pomocí metody maximální věrohodnosti i metody momentů odhadněte parametr a Úlohu vyřešte obecně pro realizaci x = x 1,x,,x n a také pro konkrétní realizaci rozsahu n = 7 x = 1,,,, 3, 3, 4 Funkce f X je posunutá hustota exponenciálního rozdělení s parametrem τ = 1 Je to tedy opět hustota, tj je nezáporná a platí R f Xt dt = 1 Realizované výsledky musí spadat do oboru hodnot, tj x i a,+ pro všechna i = 1,,n neboli musí platit, že a min{x 1,,x n } Metoda maximální věrohodnosti: Naším cílem je maximalizovat funkci n Λa = e a xi = e na e i xi Tato funkce nabývá maxima pro největší přípustnou hodnotu parametru â = min{x 1,x n } Pro konkrétní zadání je to pak â = min{1,,,,3,3,4}= 1 Metoda momentů: Porovnáme teoretickou střední hodnotu Page 4

EX = t f X tdt = a te a t dt = [ te a t ] t=a + e a t dt = = a+[ e a t ] t=a = a+1 a výběrový průměr x Odtud tak pro parametr â dostaneme â = x 1, POKUD je ovšem splněno, že a min{x 1,,x n }! Pro konkrétní zadání je x = 1++++3+3+4 7 = 17 7 a a tedy â = 17 7 1 = 143, což ale NENÍ menší než min{1,,,,3,3,4} = 1 V tomto případě tedy metoda momentů NEDÁVÁ žádný odhad 105 odhad parametru - spojité rozdělení Náhodná veličina X má biexponenciální rozdělení s hustotou f X t = c e a t, t R kde a,c > 0 Metodou momentů odhadněte parametry na základě realizace rozsahu n = 10, z níž jsme vypočítali realizaci výběrového průměru x = a realizaci výběrového rozptylu s x = 4 Aby funkce f X byla hustotou, musí být splněno, že [ e 1 = f X t dt = c e at at dt = c a 0 tedy c = a a zbývá odhadnout parametr a Hustota je sudá funkce a proto střední hodnota EX stejně jako všechny liché momenty bude nulová Příslušné nevlastní integrály existují, protože klesající exponenciála převáží jakýkoliv polynom v nekonečnu Porovnáním teoretické střední hodnoty a výběrového průměru dostaneme 0 = EX = x = což sice evidentně neplatí, ale nedává to žádné omezení na volbu parametrů a Navíc těžko můžeme čekat, že se měřením přesně trefíme do teoretické hodnoty Musíme proto použít další moment: ] t=0 = c a EX = t f X t dt = 0 ] [t e at = + a t=0 a }{{} =0 t ae at dt = [ t e at ] + t=0 }{{} =0 0 e at dt = a, 0 te at dt = který chceme srovnat s druhým vyběrovým momentem nikoliv s výběrovým rozptylem!: m = 1 n n x i Page 5

Ten se dá získat z hodnot x = a s x = 4 podobným vztahem jako máme pro rozptyl, tj, DX = EX EX jen si musíme dát pozor na to, že někde je 1 n a někde zase 1 n 1 Máme tedy takže Srovnáním dostaneme a celkem tak máme a = n 1 n s x = 1 n m = n 1 n 5 95 19 = 19 n x i x = m x s x +x = 9 10 4+ = 38 5 a = EX = m = 38 5 = 051989 a c = a 95 = 38 = 056495 106 test střední hodnoty při známém rozptylu Posud te na hladině významnosti α = 001 hypotézu, že mince je symetrická, jestliže a při n = 00 hodech padl líc 80, b při n = 100 hodech padl líc 40 tj v obou případech to bylo 40% výsledků Návod: Použijte vhodnou statistiku s přibližně normálním rozdělením odvozenou na základě centrální limitní věty pro náhodnou veličinu Xlíc = 1, Xrub = 0 Situace, kdy přesně známe rozptyl danéhonormálního rozdělení, není příliš obvyklá Většinou jej máme jen odhadnutý a pak musíme používat Studentovo rozdělení namísto normálního Výjimkou jsou ale případy, kdy rozptyl nějakého rozděleníalternativního, exponenciálního, Poissonova, atd je svázaný se střední hodnotou tohoto rozdělení prostřednictvím nějakého parametru Může se zdát, že pak se ale nedá použít obvyklý postup pro test střední hodnoty se známým rozptylem, protože nemáme normální rozdělení To si ale můžeme vyrobit přibližně pomocí CLV Výsledky hodu mincí představují náhodnou veličinu Xlíc = 1, Xrub = 0 s alternativním rozdělením s parametrem p, tj PX = 1 = p Naše nulová hypotéza tedy bude H 0 : p = p 0 proti alternativní hypotéze: H 1 : p p 0 kde p 0 = 1 Vezmeme si nezávislé náhodné veličiny kopie veličiny X { 1,při i-tém pokusu padl líc, X i = 0,při i-tém pokusu padl rub Page 6

Za předpokladu nulové hypotézy budeme pro veličinu X = 1 n mít EX = 1 a DX = 1 4n, takže podle CLV má normovaná statistika n X i T = X 1 1 4n = X 05 n, 05 přibližně normované normální rozdělení N0, 1 Poznámka: Tato statistika je analogií statistiky T = X µ 0 n, σ pro případ veličiny X s normálním rozdělením Nµ,σ a pro nulovou hypotézu H 0 : µ = µ 0 Pozor! Nenaznačujeme tím, že by naše původní veličina X s alternativním rozdělením snad měla vlastnosti nějaké jiné veličiny X s normálním rozdělením! Jde tu o to, ze při hledání kritického oboru pro X při dané hladině významnosti α je postup principiálně stejný jako pro případ, kdy X má normální rozdělení - viz dále Kritérium pro ZAMÍTNUTÍ je tvaru t > Φ 1 1 α zamítáme H 0 na dané hladině α Zdůvodnění tvaru zamítacího kritéria: Nulová hypotéza je tvaru H 0 : p = p 0 a hodnotu p aproximujeme pomocí xchceme siproto zvolittakovou dolníhraniciu 1 Ratakovou horníhraniciu R,aby pravděpodobnost, že je hodnota veličiny X překročí, byla nejvýše rovna hodnotě α = 1% zvolená hladina významnosti a navíc tak, že překročení směrem výše bude stejně pravděpodobně jako směrem níže neboli na každou stranu α/ Jinými slovy, má platit, že PX < u 1 = α = Pu < X neboli u 1 = q X α a u = q X 1 α u veličiny X předpokládáme normální rozdělení Pokud nastane jedno z překročení tj pro realizaci x máme x R\ u 1,u, budeme to považovat za přílišné porušení nulové hypotézy pro danou toleranci chyby a zamítneme ji Místo veličiny X a jejích kvantilů si ale raději vezmeme už zmíněnou statistiku T = X 05 05 n, která je jen transformací veličiny X, a problém pomocí ní ekvivalentně přeformulujeme Veličina T má přibližně rozdělení N0, 1, takže meze pro T snadno najdeme: neboli P T < Φ 1 α = α = P Φ 1 1 α < T Tedy kritériem pro ZAMÍTNUTÍ nulové hypotézy je případ, kdy pro realizaci t statistiky T nastane t < Φ 1 α nebo Φ 1 1 α < t protože máme rovnost Φ 1 α = Φ 1 1 α t > Φ 1 1 α, Nyní stačí už jen dosadit: Page 7

a Zde máme n = 00, x = 80 00 = 04 a 1 α t = x 05 n = 05 = 0995 takže 04 05 00 =,88 >,576 = Φ 1 0995 05 Hypotézu H 0 : p = 1 tedy ZAMÍTÁME na dané hladině α = 1% b Zde máme n = 100 a opět x = 40 100 = 04 a 1 α t = x 05 n = 05 = 0995 takže 04 05 100 =,576 = Φ 1 0995 05 Hypotézu H 0 : p = 1 tedy NEZAMÍTÁME na dané hladině α = 1% Jak je vidět, za předpokladu, že mince je symetrická se jen 40% úspěšných pokusů dá ještě tolerovat při n = 100 hodech, ale už ne při n = 00 hodech 107 test střední hodnoty normálního rozdělení při neznámém rozptylu Výrobce tvrdí, že spotřeba automobilu je µ 0 = 8 litrů na 100 km Průměrná spotřeba n = 49 uživatelů však byla x = 84 litru na 100 km s výběrovým rozptylem s x = 56 Testujte na hladině významnosti α = 5%, zda má výrobce pravdu, a uved te použité předpoklady K provedení testu střední hodnoty s neznámým rozptylem potřebujeme předpokládat, že testovaná veličina spotřeby X má normální rozdělení Nµ,σ a že měření odpovídají náhodnému výběru tj jsou nezávislá Protože předpokládáme přesné normální rozdělení, nemusíme jako u CLV mít zase tak velký rozsah souboru Podle zadání máme otestovat hypotézu o střední hodnotě H 0 : µ = µ 0 = 8 proti alternativní hypotéze: H 1 : µ µ 0 = 8 Hodnotu rozptylu neznáme, takže je nutné použít testovací statistiku, která obsahuje odhad směrodatné odchylky σ pomocí S X : T = X µ 0 S X n Kritérium pro ZAMÍTNUTÍ je tvaru t > q tn 1 1 α zamítáme H 0 na dané hladině α Zdůvodnění tvaru zamítacího kritéria: Za předpokladu platnosti nulové hypotézy, tj pokud EX = µ 0, bude mít statistika T tzv Studentovo t-rozdělení s n 1 stupni volnosti speciálně tedy bude platit ET = 0 a očekávané hodnoty takovéto statistiky by se měly pohybovat blízko nuly Pokud se příliš odchýlí více než bude dovolovat hladina α omezující chybu 1 druhu, bude to důvod k zamítnutí nulové hypotézy Odchýlení opět znamená, že realizované hodnoty t statistiky T spadnou do kritického oboru W pro statistiku T, který je symetrický vzhledem k 0 z hlediska pravděpodobnosti Bude tedy tvaru W :,u 0 u 1,, kde Page 8

PT < u 0 = α = Pu 1 < T což je omezení chyby 1 druhu, tj že bychom se spletli a zamítli něco, co platí Dostáváme tak u 0 = q α tn 1 = qtn 1 1 α = u1, tudíž W :, q tn 1 1 α q tn 1 1 α, a kritérium pro ZAMÍTNUTÍ je tak skutečně tvaru t > q tn 1 1 α zamítáme H 0 na dané hladině α Ted už tedy dosadíme konkrétní hodnoty Realizace testovací statistiky je Protože t = x µ 0 84 8 04 n = 49 = 7 = 175 s x 56 16 t = 175 011 = q t48 0975 = q tn 1 1 α, nulovou hypotézu NEZAMÍTÁME Naše měření tak nejsou dostačující na to, abychom mohli zamítnout tvrzení výrobce na hladině významnosti 5% Je dobré si ještě zjistit, jak moc bychom si museli dovolit být nejistí, abychom už tvrzení výrobce zamítli Tato hladina α 0 je určena jako q tn 1 1 α 0 = t, tedy α 0 = F tn 1 t = F tn 1 175 = 09567= 00866 Pokud tedy budeme posuzovat hypotézu na hladině významnosti VYŠŠÍ než 8, 66%, dojdeme k jejímu zamítnutí A naopak čím více si chceme být jistí, že jsme se nespletli tj zmenšujeme hodnoty α, tím víc prohřešků od výrobce budeme muset tolerovat Poznámka: Podle zadání jsme uvažovali případ, kde se ptáme na rovnost tj µ = µ 0 V této situaci máme jedinou možnost, jak zvolit nulovou hypotézu - a sice výše uvedeným způsobem Jako nulovou hypotézu není možné zvolit případ µ µ 0, protože množina {µ R µ µ 0 } není uzavřená V úvahu vzhledem k zadání by ale mohl ještě přicházet jednostranný test, protože výrobce určitě raději tvrdí, že µ µ 0 V tomto případě pak bud můžeme testovat H 0 : µ µ 0, ale mohli bychom také testovat H 0 : µ µ 0 V případě testu hypotézy H 0 : µ µ 0 se snažíme vyhnout tomu, že bychom omylem poškodili výrobce, a výsledek testu bude t = 175 > 1677 = q t48 095 = q tn 1 1 α takže hypotézu výrobce ZAMÍTNEME Pozor, jde o jednostranný test, takže kvantil je jiný! Veškerou chybu jsme spotřebovali jen na ty vysoké hodnoty A toto malé zvětšení, oproti oboustrannému testu, už stačilo na zamítnutí A v případě testu hypotézy H 0 : µ µ 0 se snažíme vyhnout tomu, že bychom omylem poškodili uživatele, a výsledek testu bude takže hypotézu uživatelů NEZAMÍTNEME t = 175 1677 = q t48 095 = q tn 1 α 108 test střední hodnoty normálního rozdělení při neznámém rozptylu Z n = 10 měření krevního tlaku u jednoho pacienta jsme obdrželi výběrový průměr x = 150 a výběrovou směrodatnou odchylku s x = 0 Rozhodněte na hladině významnosti α = 005, zda je středníhodnotakrevníhotlakunejvýšeµ 0 = 140Předpokládejte,ževýškakrevníhotlakumánormální rozdělení a jednotlivá měření jsou nezávislá Page 9

Hypotéza, že µ µ 0 = 140 by znamenala, že pacient je na tom asi dost špatně To ale předpokládat nechcemeledaže bychom k tomu měli zvláštní důvod a naopak budeme předpokládat, že by měl být spíš v pořádku a budeme proto testovat hypotézu H 0 : µ µ 0 proti hypotéze Opět použijeme testovací statistiku H 1 : µ > µ 0 T = X µ 0 n S X a kritérium pro ZAMÍTNUTÍ bude tvaru t > q tn 1 1 α zamítáme H 0 na dané hladině α Dosadíme opět konkrétní hodnoty Realizace testovací statistiky je Protože t = x µ 0 s x 150 140 n = 10 = 158 0 t = 158 183 = q t9 095 = q tn 1 1 α, nulovou hypotézu NEZAMÍTÁME Zdůvodnění tvaru zamítacího kritéria: Abychom si více uvědomili závislost veličiny X na parametru µ, budeme ji vyznačovat jako X µ a podobně pro statistiku T µ = Xµ µ 0 S n Protože předpokládáme H0 : µ µ 0, X µ a tedy EX µ = µ, budou očekávané hodnoty statistiky T µ především v intervalu,0 Jako kritický obor si proto zvolíme W : u 1,, kde požadujeme, aby u 1 R bylo nejmenší takové, aby chyba 1 druhu byla nejvýše α, tj µ µ 0 PT µ W = Pu 1 < T µ α Je nutné zdůraznit, že za předpokladu nulové hypotézy tj že µ µ 0 statistika T µ obecně NEMÁ Studentovo t-rozdělení t-rozdělení se objeví právě jen pokud µ = µ 0 Přesto ho ale nakonec použijeme, protože případ µ = µ 0 je za předpokladu H 0 ten nejhorší možný, jak je vidět z následujícího: tedy µ µ 0 T µ = Xµ µ 0 S Xµ n = X µ µ S Xµ n+ µ µ 0 S Xµ n P u 1 < T µ P u 1 < Vidíme tedy, že P u 1 < T µ P a kritérium pro ZAMÍTNUTÍ je tak skutečně tvaru Xµ µ n S Xµ }{{}}{{} 0 t rozdělení Xµ µ n = 1 F tn 1 u 1 = P u 1 < T µ0 S Xµ u 1 < T µ0 a hledané u 1 tak musí splňovat, že P u 1 < T µ0 = α u 1 = q tn 1 1 α t > q tn 1 1 α zamítáme H 0 na dané hladině α Page 10

109 test střední hodnoty normálního rozdělení při neznámém rozptylu Provádíme průzkum, jaký skutečný objem piva X točí v nejmenované restauraci Zakoupeno bylo n = 10 piv a jejich objem byl v litrech: x = 0510, 046, 0491, 0466, 0451, 0503, 0475, 0487, 051, 0505 Předpokládejte, že natočený objem piva X se řídí normálním rozdělením a jednotlivá měření jsou nezávislá a Pro zvolenou hladinu α = 005 odhadněte symetricky intervalově střední hodnotu objemu natočeného piva b Na hladině α = 005 otestujte hypotézu, že dostaneme natočeno alespoň µ 0 = 05 litru Rozptyl je neznámý Spočítáme si proto realizaci výběrového průměru x a výběrové směrodatné odchylky s x : x = 1 n n x i = 1 486 0510+046+ +0505 = = 0486, 10 10 s x = 1 n x i x = 1 [ n x i n x ] = n 1 n 1 = 1 [ 0510 +046 + +0505 10 0486 ] = 9 = 1 368154 3639044 = 0004496 = 47178 10 4, 9 9 s x = s x = 47178 10 = 173 10 a Veličina X má normální rozdělení Nµ,σ Statistika T = X µ S X n má pak Studentovo t-rozdělení s n 1 stupni volnosti Pokud chceme, aby T padlo MIMO interval u 0,u 1 s pravděpodobností α a to se stejnou pravděpodobností nad i pod, pak budeme mít u 0,u 1 = q tn 1 1 α, q tn 1 1 α Pro α = 005 tak úpravami dostaneme 095 = P q t9 0975 X µ n qt9 0975 = S X = P X SX q t9 0975 µ X + SX q t9 0975 n n Kvantil Studentova rozdělení je q tn 1 1 α = q t90975 = 6 a tedy s x n q t9 0975 = 173 10 10 6 = 00155 Hledaný oboustranný symetrický 95% interval spolehlivosti v litrech pro střední hodnotu µ je tak x s x q t9 0975, x+ s x = q t9 0975 0486 00155, 0486 + 00155 n n b Otestujeme nulovou hypotézu = 04707, 05017 Page 11

H 0 : µ 05 = µ 0 proti alternativní hypotéze: H 1 : µ < 05 na hladině významnosti α = 005 Opět použijeme statistiku a ZAMÍTACÍ kritérium T = X µ 0 S X n t < q tn 1 α zamítáme H 0 na dané hladině α Realizace testovací statistiky je a kvantil Studentova rozdělení je t = x µ 0 0486 05 n = 10 = 008 s x 173 10 q tn 1 α = q tn 1 1 α = q t9 095 = 183 Protože t = 008< 183 = q t9 005, nulovou hypotézu tedy ZAMÍTÁME V této hospodě bychom si tedy asi pivo dávat nechtěli Doplnění: Na druhé straně, pokud by přišla do této hospody kontrola a chtěla testovat správnou míru, tj hypotézu H 0 : µ = 05 = µ 0 také na hladině α = 005, dojde k jinému závěru: t = 008 6 = q t9 0975 = q tn 1 1 α a tudíž hypotézu H 0 NEZAMÍTNE 1010 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace x = 08, 1, 06, 14, 09 Posud te na hladině významnosti α = 005, zda směrodatná odchylka měření je nejvýše σ 0 = 01 promile alkoholu Předpokládejte, že obsah alkoholu X má normální rozdělení a jednotlivá měření jsou nezávislá Naše veličina X, udávající obsah alkoholu v krvi v promilích, má normální rozdělení Nµ,σ Místo testu směrodatné odchylky σ budeme ekvivalentně testovat rozptyl σ a sice nulovou hypotézu tvaru H 0 : σ 01 = σ 0 Page 1

proti alternativní hypotéze: H 1 : σ > 01 na hladině významnosti α = 005 Tentokrát budeme používat statistiku T = n 1S X σ 0, která má pro případ σ = σ 0 tzv χ -rozdělení s n 1 stupni volnosti Obecněji, teprve veličina σ 0 σ T budemítχ -rozdělenízapředpokladunulovéhypotézy,tj pro0 σ σ 0, budouočekávané hodnoty statistiky T především v intervalu, 1 ve skutečnosti to bude jen interval 0, 1, protože T je nezáporná veličina Kritický obor tak bude W : q χ n 11 α, a kritérium pro ZAMÍTNUTÍ proto bude tvaru t > q χ n 11 α zamítáme H 0 na dané hladině α Dosadíme opět konkrétní hodnoty: s x = 1 n 1 n Realizace testovací statistiky je x = 08+1+06+14+09 5 = 47 5 = 094, x i x = 014 +006 +034 +046 +004 4 = 035 4 = 0088 a hodnota kvantilu je Protože nulovou hypotézu ZAMÍTÁME t = n 1s x σ 0 = 4 0088 01 = 35 q χ n 11 α = q χ 4095 = 949 t = 35 949 = q χ 4095, Zdůvodnění tvaru kritického oboru: Opět si vyznačme závislost X a T na parametru σ jako Kritický obor má být tvaru T σ = n 1S X σ σ 0 W : u 1,, kde požadujeme, aby u 1 R bylo nejmenší takové, aby chyba 1 druhu byla nejvýše α, tj 0 σ σ 0 PT σ W = Pu 1 < T σ α Opět případ σ = σ 0 je za předpokladu H 0 ten nejhorší možný, jak je vidět z následujícího: σ σ 0 T σ = σ σ 0 }{{} 1 P u 1 < T σ P u 1 < n 1S X σ σ n 1S X σ σ n 1S X σ σ }{{} χ rozdělení = 1 F χ n 1 u 1 = P u 1 < T σ0 Page 13

Vidíme tedy, že P u 1 < T σ P u 1 < T σ0 a hledané u 1 tak musí splňovat P u 1 < T σ0 = α tedy a kritický obor je tak skutečně tvaru u 1 = q χ n 1 1 α, W : q χ n 1 1 α, Page 14