12. prosince n pro n = n = 30 = S X

Podobné dokumenty
12. cvičení z PST. 20. prosince 2017

prosince oboustranný symetrický 95% interval spolehlivosti pro střední hodnotu životnosti τ. X i. X = 1 n.. Podle CLV má veličina

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

= = 2368

PRAVDĚPODOBNOST A STATISTIKA

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Testování statistických hypotéz

Cvičení ze statistiky - 8. Filip Děchtěrenko

Testování statistických hypotéz

Aproximace binomického rozdělení normálním

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Normální (Gaussovo) rozdělení

4EK211 Základy ekonometrie

Normální (Gaussovo) rozdělení

15. T e s t o v á n í h y p o t é z

5. T e s t o v á n í h y p o t é z

Příklady na testy hypotéz o parametrech normálního rozdělení

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

1. (18 bod ) Náhodná veli ina X je po et rub p i 400 nezávislých hodech mincí. a) Pomocí ƒeby²evovy nerovnosti odhadn te pravd podobnost

Testy. Pavel Provinský. 19. listopadu 2013

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

15. T e s t o v á n í h y p o t é z

Stručný úvod do testování statistických hypotéz

2 ) 4, Φ 1 (1 0,005)

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

7. Analýza rozptylu.

Testování hypotéz o parametrech regresního modelu

Regresní analýza 1. Regresní analýza

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Testování statistických hypotéz. Obecný postup

4ST201 STATISTIKA CVIČENÍ Č. 7

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Testování hypotéz o parametrech regresního modelu

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Testování statistických hypotéz

5 Parametrické testy hypotéz

Ing. Michael Rost, Ph.D.

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Testy statistických hypotéz

Testování hypotéz. 4. přednáška

Statistika, Biostatistika pro kombinované studium. Jan Kracík

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Náhodné veličiny, náhodné chyby

KGG/STG Statistika pro geografy

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN

Pravděpodobnost a aplikovaná statistika

Testování hypotéz. December 10, 2008

Charakteristika datového souboru

STATISTICKÉ HYPOTÉZY

diskriminaci žen letní semestr = výrok, o jehož pravdivosti chceme rozhodnout tvrzení o populaci, o jehož platnosti rozhodujeme

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Cvičení ze statistiky - 9. Filip Děchtěrenko

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Výběrové charakteristiky a jejich rozdělení

Téma 22. Ondřej Nývlt

8. Normální rozdělení

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

Normální rozložení a odvozená rozložení

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

Jednofaktorová analýza rozptylu

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

STATISTICKÉ TESTY VÝZNAMNOSTI

Intervalové Odhady Parametrů

Příklad datového souboru. Pravděpodobnost vs. statistika. Formální definice. Teorie odhadu

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

Statistická analýza jednorozměrných dat

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33

You created this PDF from an application that is not licensed to print to novapdf printer (

Tomáš Karel LS 2012/2013

Cvičení 10. Přednášející: Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc.

Intervalové Odhady Parametrů II Testování Hypotéz

Tomáš Karel LS 2012/2013

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Úvod do analýzy rozptylu

Kontingenční tabulky, korelační koeficienty

Zápočtová práce STATISTIKA I

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

ADDS cviceni. Pavlina Kuranova

Transkript:

11 cvičení z PSI 1 prosince 018 111 test střední hodnoty normálního rozdělení při známém rozptylu Teploměrem o jehož chybě předpokládáme že má normální rozdělení se směrodatnou odchylkou σ = 3 jsme provedli 30 měření stejné teploty Průměrný výsledek byl 101 Otestujte na hladině významnosti 5 % zda teplota nepřesahuje 100 Naše veličina X = naměřená teplota v jednotkách má podle předpokladu rozdělení Nµσ kde σ = 3 Podle zadání máme otestovat hypotézu o střední hodnotě H 0 : µ µ 0 = 101 proti alternativní hypotéze: H 1 : µ > µ 0 = 101 Realizaci testovací statistiky T = X µ 0 σ t = x µ 0 σ n pro n = 30 101 100 n = 30 = 1857 3 porovnáme s kvantilem Φ 1 1 α = Φ 1 095 = 164 pro α = 005 je splněno zamítací kritérium tak nulovou hypotézu H 0 zamítáme Φ 1 1 α < t 11 test střední hodnoty normálního rozdělení při neznámém rozptylu Výrobce tvrdí že spotřeba automobilu je µ 0 = 8 litrů na 100 km Průměrná spotřeba n = 49 uživatelů však byla x = 84 litru na 100 km s výběrovým rozptylem s x = 56 Testujte na hladině významnosti α = 5% zda má výrobce pravdu a uved te použité předpoklady K provedení testu střední hodnoty s neznámým rozptylem potřebujeme předpokládat že testovaná veličina spotřeby X má normální rozdělení Nµσ a že měření odpovídají náhodnému výběru tj jsou nezávislá předpokládáme přesné normální rozdělení nemusíme jako u CLV mít zase tak velký rozsah souboru Podle zadání máme otestovat hypotézu o střední hodnotě H 0 : µ = µ 0 = 8 proti alternativní hypotéze: H 1 : µ µ 0 = 8 Hodnotu rozptylu neznáme takže je nutné použít testovací statistiku která obsahuje odhad směrodatné odchylky σ pomocí S X : T = X µ 0 S X n Kritérium pro ZAMÍTNUTÍ je tvaru t > q tn 1 1 α zamítáme H 0 na dané hladině α Zdůvodnění tvaru zamítacího kritéria: Za předpokladu platnosti nulové hypotézy tj pokud EX = µ 0 bude mít statistika T tzv Studentovo t-rozdělení s n 1 stupni volnosti speciálně tedy bude platit ET = 0 a očekávané hodnoty takovéto statistiky by se měly pohybovat blízko nuly Pokud se příliš odchýlí více než bude dovolovat hladina α omezující chybu 1 druhu bude to důvod k zamítnutí nulové hypotézy

Odchýlení opět znamená že realizované hodnoty t statistiky T spadnou do kritického oboru W pro statistiku T který je symetrický vzhledem k 0 z hlediska pravděpodobnosti Bude tedy tvaru W : u 0 u 1 kde PT < u 0 = α = Pu 1 < T což je omezení chyby 1 druhu tj že bychom se spletli a zamítli něco co platí = qtn 1 1 α Dostáváme tak u 0 = q tn 1 α W : q tn 1 1 α = u1 tudíž q tn 1 1 α a kritérium pro ZAMÍTNUTÍ je tak skutečně tvaru t > q tn 1 1 α zamítáme H 0 na dané hladině α Ted už tedy dosadíme konkrétní hodnoty Realizace testovací statistiky je t = x µ 0 84 8 04 n = 49 = 7 = 175 s x 56 16 t = 175 011 = q t48 0975 = q tn 1 1 α nulovou hypotézu NEZAMÍTÁME Naše měření tak nejsou dostačující na to abychom mohli zamítnout tvrzení výrobce na hladině významnosti 5% Je dobré si ještě zjistit jak moc bychom si museli dovolit být nejistí abychom už tvrzení výrobce zamítli Tato hladina α 0 je určena jako q tn 1 1 α 0 = t tedy α 0 = F tn 1 t = F tn 1 175 = 09567 = 00866 Pokud tedy budeme posuzovat hypotézu na hladině významnosti VYŠŠÍ než 8 66% dojdeme k jejímu zamítnutí A naopak čím více si chceme být jistí že jsme se nespletli tj zmenšujeme hodnoty α tím víc prohřešků od výrobce budeme muset tolerovat Poznámka: Podle zadání jsme uvažovali případ kde se ptáme na rovnost tj µ = µ 0 V této situaci máme jedinou možnost jak zvolit nulovou hypotézu - a sice výše uvedeným způsobem Jako nulovou hypotézu není možné zvolit případ µ µ 0 protože množina {µ R µ µ 0 } není uzavřená V úvahu vzhledem k zadání by ale mohl ještě přicházet jednostranný test protože výrobce určitě raději tvrdí že µ µ 0 V tomto případě pak bud můžeme testovat H 0 : µ µ 0 ale mohli bychom také testovat H 0 : µ µ 0 V případě testu hypotézy H 0 : µ µ 0 se snažíme vyhnout tomu že bychom omylem poškodili výrobce a výsledek testu bude t = 175 > 1677 = q t48 095 = q tn 1 1 α takže hypotézu výrobce ZAMÍTNEME Pozor jde o jednostranný test takže kvantil je jiný! Veškerou chybu jsme spotřebovali jen na ty vysoké hodnoty A toto malé zvětšení oproti oboustrannému testu už stačilo na zamítnutí A v případě testu hypotézy H 0 : µ µ 0 se snažíme vyhnout tomu že bychom omylem poškodili uživatele a výsledek testu bude takže hypotézu uživatelů NEZAMÍTNEME t = 175 1677 = q t48 095 = q tn 1 α 113 test rozptylu normálního rozdělení Generátor náhodných čísel s normovaným normálním rozdělením dal následující výsledky: 0503 0811 1078 0501 056 103 015 0859 0156 13 Posud te na hladině významnosti 5 % zda data odpovídají předpokládanému rozptylu Výběrový průměr je 03483 součet kvadrátů 9 387373 Předpokládaný rozptyl je 1 výběrový rozptyl je 0908 pro oboustranný odhad použijeme testovací statistiku n 1S X DX = 9 0908 = 8174 Page

která má rozdělení χ s 9 stupni volnosti porovnáme s kvantily q χ 9 005 = 7 q χ 9 0975 = 190 a nulovou hypotézu nezamítáme 114 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace x = 08 1 06 14 09 Posud te na hladině významnosti α = 005 zda směrodatná odchylka měření je nejvýše σ 0 = 01 promile alkoholu Předpokládejte že obsah alkoholu X má normální rozdělení a jednotlivá měření jsou nezávislá Naše veličinaxudávajícíobsah alkoholuvkrvivpromilíchmánormálnírozdělenínµσ Místotestu směrodatné odchylky σ budeme ekvivalentně testovat rozptyl σ a sice nulovou hypotézu tvaru H 0 : σ 01 = σ 0 proti alternativní hypotéze: H 1 : σ > 01 na hladině významnosti α = 005 Tentokrát budeme používat statistiku T = n 1S X σ 0 která má pro případ σ = σ 0 tzv χ -rozdělení s n 1 stupni volnosti Obecněji teprve veličina σ 0 σ T bude mít χ -rozdělení Za předpokladu nulové hypotézy tj pro 0 σ σ 0 budou očekávané hodnoty statistiky T především v intervalu 1 ve skutečnosti to bude jen interval 0 1 protože T je nezáporná veličina Kritický obor tak bude W : q χ n 1 1 α a kritérium pro ZAMÍTNUTÍ proto bude tvaru Dosadíme opět konkrétní hodnoty: t > q χ n 1 1 α zamítáme H 0 na dané hladině α x = 08+1+06+14+09 5 = 47 5 = 094 s x = 1 n x i x = 014 +006 +034 +046 +004 n 1 4 Realizace testovací statistiky je = 035 4 = 0088 a hodnota kvantilu je nulovou hypotézu ZAMÍTÁME t = n 1s x σ 0 = 4 0088 01 = 35 q χ n 1 1 α = q χ 4 095 = 949 t = 35 949 = q χ 4 095 Zdůvodnění tvaru kritického oboru: Opět si vyznačme závislost X a T na parametru σ jako Kritický obor má být tvaru T σ = n 1S X σ σ 0 W : u 1 Page 3

kde požadujeme aby u 1 R bylo nejmenší takové aby chyba 1 druhu byla nejvýše α tj 0 σ σ 0 PT σ W = Pu 1 < T σ α Opět případ σ = σ 0 je za předpokladu H 0 ten nejhorší možný jak je vidět z následujícího: σ σ 0 T σ = σ σ 0 }{{} 1 P u 1 < T σ P u 1 < n 1S X σ σ n 1S X σ σ n 1S X σ σ }{{} χ rozdělení = 1 F χ n 1 u 1 = P u 1 < T σ0 Vidíme tedy že P u 1 < T σ P u 1 < T σ0 a hledané u 1 tak musí splňovat P u 1 < T σ0 = α tedy a kritický obor je tak skutečně tvaru u 1 = q χ n 1 1 α W : q χ n 1 1 α 115 test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem Z realizací náhodných veličin X a Y s normálním rozdělením jsme z výběrů daného rozsahu obdrželi tyto realizace odhadů: Na hladině významnosti α = 005 X Y m = 11 n = 1 x = 10 y = 1 s x = s y = 3 a posud te hypotézu že rozptyly náhodných veličin X a Y jsou stejné b za předpokladu platnosti podmínky dle a posud te hypotézu že střední hodnoty náhodných veličin X a Y jsou stejné a Test stejného rozptylu: Předpokládáme že veličiny X a Y jsou nezávislé s normálními rozděleními po řadě Nµ 1 σ1 s Nµ σ Jednotlivá měření pro X a Y považujeme všechna navzájem za nezávislá Budeme testovat nulovou hypotézu o rovnosti rozptylů H 0 : σ 1 = σ proti alternativní hypotéze H 1 : σ 1 σ Testovací statistika je T = S X SY a má za předpokladu σ1 = σ tzv Fisherovo-Snedecorovo Fm 1n 1 - rozdělení s m 1 a n 1 stupni volnosti v tomto pořadí! Za předpokladu nulové hypotézy H 0 je očekávaná hodnota statistiky T rovna 1 a kritický obor tak podobně jako v některých předchozích příkladech bude W : α q Fm 1n 1 q Fm 1n 1 1 α Page 4

Kritérium pro ZAMÍTNUTÍ je proto tvaru [ α t < q Fm 1n 1 nebo q Fm 1n 1 1 α ] < t zamítáme H 0 na dané hladině α Realizace testovací statistiky je a hodnoty kvantilů jsou a q Fm 1n 1 α t = s x s = 4 = 0444 y 9 = q F100 005 = 1 q F010 0975 = 1 34 q Fm 1n 1 1 α = q F100 0975 = 77 t = 0444 094 77 hypotézu H 0 že X a Y mají stejný rozptyl NEZAMÍTÁME = 094 b Test rovnosti středních hodnot se stejným neznámým rozptylem: Předpokládáme že veličiny X a Y jsou nezávislé s normálními rozděleními po řadě Nµ 1 σ s Nµ σ Tento předpoklad je podložen předchozím testem rovnosti rozptylů který jsme nezamítli Jednotlivá měření pro X a Y považujeme opět všechna navzájem za nezávislá Budeme testovat nulovou hypotézu o rovnosti středních hodnot H 0 : µ 1 = µ proti alternativní hypotéze H 1 : µ 1 µ Testovací statistika je T = X Y S 1/m +1/n kde S = m 1 m+n S X + n 1 m+n S Y je vážený odhad rozptylu Za předpokladu nulové hypotézy H 0 tj µ 1 = µ má statistika T Studentovo tm + n -rozděleni s m+n stupni volnosti Kritérium pro ZAMÍTNUTÍ bude proto očekávatelně tvaru t > q tm+n 1 α zamítáme H 0 na dané hladině α a Po dosazení máme t = s = m 1s x +n 1s y m +n x y s 1/m+1/n = 10 1 3 = 10 +0 3 10+0 1 11 + 1 1 = 3 = 3 4 7 = 1984 Hodnota kvantilu je q tm+n 1 α = q t30 0975 = 04 t = 1984 04 = q tm+n 1 α hypotézu H 0 ze X a Y mají stejnou střední hodnotu také NEZAMÍTÁME 116 párový pokus U n = 8 praváků jsme změřili délku prostředníčku na pravé a levé ruce hodnoty v milimetrech uvádí tabulka Levá 81 74 90 84 77 67 59 70 Pravá 84 76 89 85 80 69 58 68 Page 5

Na hladině významnosti α = 5% posud te hypotézu že praváci mají delší prostředníček na levé ruce a uved te předpoklady Označme si jako veličinu X délku prostředníčku na levé ruce a jako veličinu Y délku prostředníčku na pravé ruce u téhož člověka zde navíc praváka Pokud na jednom subjektu provádíme měření více veličin zde X a Y pak už jejich vzájemné hodnoty nemůžeme považovat za nezávislé Za nezávislá ovšem samozřejmě považujeme měření dvojice veličin X Y tj náhodného vektoru u různých lidí U veličiny := X Y která představuje rozdíly mezi veličinami můžeme přirozeně předpokládat normální rozdělení Nµσ nebot jde o odchylky které obvykle tuto vlastnost mají Máme tedy nezávislá měření s hodnotami δ = x 1 y 1 x n y n a naše původní hypotéza EX EY lze ekvivalentně vyjádřit pomocí 0 EX EY = E = µ jako nulová hypotéza H 0 : µ 0 kterou otestujeme proti alternativní hypotéze H 1 : µ < 0 na hladině významnosti α = 5% Půjde tedy o obvyklý test střední hodnoty veličiny s normálním rozdělením při neznámém rozptylu Použijeme tudíž statistiku a kritérium pro ZAMÍTNUTÍ bude tvaru Určíme si hodnoty realizace δ veličiny = X Y T = S n t < q tn 1 α zamítáme H 0 na dané hladině α x 81 74 90 84 77 67 59 70 y 84 76 89 85 80 69 58 68 δ = x y -3-1 -1-3 - 1 Spočteme její výběrový průměr a rozptyl pro n = 8: určíme realizaci statistiky a příslušný kvantil δ = 7 8 = 0875 s δ = 1 n 1 n t = δ s δ n = 7 7 15 = 163 15 δ i δ = = 38393 56 q tn 1 α = q tn 1 1 α = q t7 095 = 1895 t = 163 1895 = q t7 005 nulovou hypotézu že praváci mají delší levý prostředníček než pravý NEZAMÍTÁME 117 test nekorelovanosti dvou výběrů z normálních rozdělení Pro realizace X 15 30 7 9 Y 10 6 8 4 8 náhodných výběrů z veličin X Y testujte na hladině významnosti α = 5% jejich korelovanost Pro test korelovanosti je potřeba předpoklad že náhodný vektor X Y ma dvourozměrné normální rozdělení Poznámka: Každé takové rozdělení je tvaru X α β X µ1 = Y γ δ Y + µ }{{} A Page 6

kde matice A je regulární µ 1 µ R a veličiny X Y jsou nezávislé s normovaným normálním rozdělením N01 Označme si ještě u = αβ R a v = γδ R Snadno je pak vidět že a pro korelaci máme což je právě kosinus úhlu mezi vektory u a v EX = µ 1 EY = µ DX = u DY = v XY = u v u v My budeme testovat hypotézu o koeficientu korelace XY mezi náhodnými veličinami X a Y H 0 : XY = 0 tj náhodné veličiny X a Y jsou nekorelované proti alternativní hypotéze H 1 : XY 0 tj náhodné veličiny X a Y jsou korelované K testování použijeme výběrový koeficient korelace RX Y a testovou statistiku T = RXY n 1 R XY která má Studentovo rozdělení tn kde n je rozsah výběrů Realizaci rx y výběrového koeficientu korelace RXY vypočteme ze vzorce n n n n 1 n x i y i x i y i x n j y j xy rxy = n n n x i x i n n n = n j=1 n 1 s xs y yi y i Za předpokladu nulové hypotézy H 0 tj XY = 0 je očekávaná hodnota statistiky T rovna 0 Kritérium pro ZAMÍTNUTÍ proto podobně jako pro některé předchozí testy bude tvaru t > q tn 1 α zamítáme H 0 na dané hladině α Je n = 5 n x i = 13 Po dosazení hodnot dostaneme Z tabulek nalezneme kvantil hypotézu H 0 NEZAMÍTÁME n y i = 36 rxy = n n x i = 3179 n yi = 80 x i y i = 890 4450 448 766 104 = 11 4979 = 007794 t = rxy n 363 1 r xy = = 01354 19795 q tn 1 α = q t3 0975 = 318 t = 01354 318 = q t3 0975 +++++++++++++++++++++++++++++++++++++++++++++++++++ 118 test střední hodnoty při známém rozptylu Posud te na hladině významnosti α = 001 hypotézu že mince je symetrická jestliže a při n = 00 hodech padl líc 80 b při n = 100 hodech padl líc 40 tj v obou případech to bylo 40% výsledků Návod: Použijte vhodnou statistiku s přibližně normálním rozdělením odvozenou na základě centrální limitní věty pro náhodnou veličinu Xlíc = 1 Xrub = 0 Page 7

Situace kdy přesně známe rozptyl daného normálního rozdělení není příliš obvyklá Většinou jej máme jen odhadnutý a pak musíme používat Studentovo rozdělení namísto normálního Výjimkou jsou ale případy kdy rozptyl nějakého rozdělení alternativního exponenciálního Poissonova atd je svázaný se střední hodnotou tohoto rozdělení prostřednictvím nějakého parametru Může se zdát že pak se ale nedá použít obvyklý postup pro test střední hodnoty se známým rozptylem protože nemáme normální rozdělení To si ale můžeme vyrobit přibližně pomocí CLV Výsledky hodu mincí představují náhodnou veličinu Xlíc = 1 Xrub = 0 s alternativním rozdělením s parametrem p tj PX = 1 = p Naše nulová hypotéza tedy bude H 0 : p = p 0 proti alternativní hypotéze: H 1 : p p 0 kde p 0 = 1 Vezmeme si nezávislé náhodné veličiny kopie veličiny X { 1 při i-tém pokusu padl líc X i = 0 při i-tém pokusu padl rub Za předpokladu nulové hypotézy budeme pro veličinu X = 1 n X i n mít EX = 1 a DX = 1 takže podle CLV má normovaná statistika 4n T = X 1 1 4n přibližně normované normální rozdělení N0 1 = X 05 n 05 Poznámka: Tato statistika je analogií statistiky T = X µ 0 n σ pro případ veličiny X s normálním rozdělením Nµσ a pro nulovou hypotézu H 0 : µ = µ 0 Pozor! Nenaznačujeme tím že by naše původní veličina X s alternativním rozdělením snad měla vlastnosti nějaké jiné veličiny X s normálním rozdělením! Jde tu o to ze při hledání kritického oboru pro X při dané hladině významnosti α je postup principiálně stejný jako pro případ kdy X má normální rozdělení - viz dále Kritérium pro ZAMÍTNUTÍ je tvaru t > Φ 1 1 α zamítáme H 0 na dané hladině α Zdůvodnění tvaru zamítacího kritéria: Nulová hypotéza je tvaru H 0 : p = p 0 a hodnotu p aproximujeme pomocí xchceme siproto zvolittakovou dolníhraniciu 1 Ratakovou horníhraniciu Raby pravděpodobnost že je hodnota veličiny X překročí byla nejvýše rovna hodnotě α = 1% zvolená hladina významnosti a navíc tak že překročení směrem výše bude stejně pravděpodobně jako směrem níže neboli na každou stranu α/ Jinými slovy má platit že PX < u 1 = α = Pu < X neboli u 1 = q X α a u = q X 1 α u veličiny X předpokládáme normální rozdělení Pokud nastane jedno z překročení tj pro realizaci x máme x R\ u 1 u budeme to považovat za přílišné porušení nulové hypotézy pro danou toleranci chyby a zamítneme ji Místo veličiny X a jejích kvantilů si ale Page 8

raději vezmeme už zmíněnou statistiku T = X 05 05 n která je jen transformací veličiny X a problém pomocí ní ekvivalentně přeformulujeme Veličina T má přibližně rozdělení N0 1 takže meze pro T snadno najdeme: P T < Φ 1 α = α = P Φ 1 1 α < T Tedy kritériem pro ZAMÍTNUTÍ nulové hypotézy je případ kdy pro realizaci t statistiky T nastane t < Φ 1 α nebo Φ 1 1 α < t neboli protože máme rovnost Φ 1 α = Φ 1 1 α t > Φ 1 1 α Nyní stačí už jen dosadit: a Zde máme n = 00 x = 80 00 = 04 a 1 α t = x 05 05 n = = 0995 takže 04 05 00 = 88 > 576 = Φ 1 0995 05 Hypotézu H 0 : p = 1 tedy ZAMÍTÁME na dané hladině α = 1% b Zde máme n = 100 a opět x = 40 100 = 04 a 1 α = 0995 takže t = x 05 n = 04 05 05 100 = 576 = Φ 1 0995 05 Hypotézu H 0 : p = 1 tedy NEZAMÍTÁME na dané hladině α = 1% Jak je vidět za předpokladu že mince je symetrická se jen 40% úspěšných pokusů dá ještě tolerovat při n = 100 hodech ale už ne při n = 00 hodech Page 9