Odhad parametrů ormálího rozděleí a testy hypotéz o těchto parametrech * Věty o výběru z ormálího rozděleí Nechť, X, X je áhodý výběr z rozděleí N ( µ, ) X, Ozačme výběrový průměr a = X = i = X i i = ( X i X ) výběrový rozptyl Veličia X je estraým a kozistetím odhadem parametru µ a veličia je estraým odhadem parametru (viz Pricipy, tvrzeí 8) Chceme-li vyjádřit chybu, jaké se při odhadech parametrů µ a veličiami X a dopouštíme, je třeba zát rozděleí těchto veliči O tom pojedává ásledující věta Věta Nechť, X, X je áhodý výběr z rozděleí N ( µ, ) X, (a) X ~ N ( µ, ) Pak (b) Jestliže > 0 a, pak áhodá veličia ( ) má rozděleí (c) Jestliže, pak veličiy X a jsou ezávislé χ Pozámky Tvrzeí (b) je důsledkem věty z Pricipů, ikoliv však důsledkem zcela bezprostředím (přemýšlejte o tom) Z tohoto tvrzeí vyplývá, že v případě výběru z ormálího rozděleí je výběrový rozptyl kozistetím odhadem parametru (obecě to eplatí)vskutku, rozptyl rozděleí χ je rove ( ), a proto odkud plye, že ( ) ( ) = D 4 ( ) = 4 D( D( ) = ( ) 0 ), Veličia je tedy kozistetím odhadem parametru dle věty 5 z Pricipů Nezávislost výběrového průměru a rozptylu ormálího rozděleí zformulovaá v tvrzeí (c) je zcela etriviálí vlastostí tohoto rozděleí, kterou avíc žádé jié rozděleí kromě ormálího emá Z tvrzeí (a) předchozí věty vyplývá, že X µ ( ) ~ N (0,) Nahradíme-li v ( ) ezámou hodotu směrodaté odchylky jejím výběrovým ekvivaletem, změí se rozděleí N (0,) v tudetovo t rozděleí Přesěji řečeo platí ásledující věta * Na úvodí pojedáí o pricipech matematické statistiky se budeme v tomto textu odkazovat jako a Pricipy
Věta Nechť X, X,, X je áhodý výběr z rozděleí N ( µ, ) Pak X µ ( ) ~ t Důkaz Je X µ X µ X µ = = ( ) Dle věty jsou veličiy ( X µ ) a ( ) vzájemě ezávislé, prví z ich má rozděleí N (0,) a druhá rozděleí χ Tvrzeí věty tedy vyplývá z věty 3 z Pricipů Odhad středí hodoty, test hypotézy o středí hodotě Ozačeí Nechť u (α ), resp t (α ) jsou čísla vyhovující ásledujícím podmíkám: má-li veličia X rozděleí N (0,), pak má-li veličia X rozděleí t, pak [ X > u( α )] = α P ; [ X > t ( α )] = α P Tato čísla azýváme kritickými hodotami rozděleí N (0,), resp t Povšiměte si, že ozačeí kritických hodot rozděleí N (0,) a t eí kozistetí, důvody této ekozistece jsou však zcela tradičí a emají žádý hlubší smysl Nechť X, X,, X je áhodý výběr z rozděleí N ( µ, ) Ze vztahu ( ) vyplývá, že s pravděpodobostí α je X µ Podobě z ( ) plye, že s pravděpodobostí α je < u( α ) X µ < t ( α ) Odtud jedoduchou aritmetickou úpravou dospějeme k ásledujícímu výsledku Věta 3 Nechť (a) Iterval X, X,, X je áhodý výběr z rozděleí N ( µ, ) Pak ( ) ( ) X u α X + u α, pokrývá hodotu parametru µ s pravděpodobostí α (b) Iterval X t α) X + t (, ( α) pokrývá hodotu parametru µ s pravděpodobostí α
Itervaly z předchozí věty představují itervalové odhady (itervaly spolehlivosti) pro středí hodotu ormálího rozděleí Prví iterval je přitom (oboustraým) ( α ) 00% itervalem spolehlivosti pro parametr µ při zámé hodotě parametru, druhý z ich je itervalovým odhadem parametru µ při ezámé hodotě parametru (V aplikacích se zpravidla použije druhý z obou itervalů) Číslo α se azývá koeficiet spolehlivosti odhadu Podobě je možé zkostruovat jedostraé itervaly spolehlivosti Tak apříklad platí: Iterval a rověž tak iterval, X + t (α ), ), ( X t α pokrývá hodotu parametru µ s pravděpodobostí α + Kostrukce itervalů spolehlivosti pro parametr µ úzce souvisí s testem hypotézy H 0 : µ = µ 0, kde µ 0 je daé reálé číslo Je přitom uté předem staovit proti jaké alterativě budeme hypotézu H 0 testovat Přirozeá alterativa je H : µ µ 0 ; budeme jí říkat oboustraá alterativa V ěkterých případech lze ale a základě ějaké předběžé iformace o parametru µ určité jeho alterativí hodoty předem vyloučit V aplikacích se setkáváme s alterativami H : µ > µ 0 a H : µ < µ 0, které se azývají jedostraé Hypotézu H 0 zamíteme, jestliže alezeý iterval spolehlivosti pro parametr µ hypotetickou hodotu µ 0 eobsahuje; v případě oboustraé alterativy použijeme iterval oboustraý, v případě jedostraé alterativy odpovídající iterval jedostraý ado ahlédeme, že hladia výzamosti takového testu (tj pravděpodobost, že při aplikaci testu bude zamítuta správá hypotéza) je rova α, kde α je koeficiet spolehlivosti odhadu parametru µ Testujeme-li tedy hypotézu H 0 proti oboustraé alterativě, zamíteme ji tehdy, když iterval X t ( α), X + t ( α) eobsahuje číslo µ 0 K zamítáí hypotézy H 0 dochází právě tehdy, když ( ) X µ 0 t ( α) V případě, že je splěa erovost ( ), říkáme že rozdíl že rozdíl X µ 0 mezi výběrovým průměrem X a hypotetickou hodotou µ 0 parametru µ je statisticky výzamý (sigifikatí) Číslo t ( α ) přitom představuje ejmeší statisticky výzamý rozdíl (agl Least igificat Differece, zkráceě LD) Kritérium ( ) lze přepsat ve tvaru X µ 0 t ( α ) To zameá, že hypotéza H 0 se zamítá, jestliže T t ( α), kde T X µ = 0 Náhodá veličia T představuje tzv testovací statistiku pro hypotézu H 0 3
Kritérium pro zamítáí hypotézy H 0 se vyjadřuje též ásledujícím způsobem Možia ( t ( α) ] [ t ( ), α), se azývá kritickou oblastí (oblastí zamítáí) pro hypotézu H 0 ; hypotéza se zamítá, jestliže hodota testovací statistiky T pade do kritické oblasti Aalogicky lze zkostruovat testy hypotézy H 0 : µ = µ 0 proti jedostraým alterativám H : µ > µ 0 a H : µ < µ 0 Popis testu při všech třech možých alterativách (za použití testovací statistiky T ) je shrut v ásledující větě: Věta 4 Testujme hypotézu H 0 : µ = µ 0 o parametru µ rozděleí N µ, ) prostředictvím kofrotace této hypotézy s empiricky zjištěou hodotou výběrového průměru X a výběrového rozptylu Položme X µ 0 T = ( a staovme ásledující kritéria pro zamítáí hypotézy H 0 : () Hypotéza H 0 : µ = µ 0 se proti alterativě H : µ µ 0 zamítá, jestliže T t ( α) () Hypotéza H 0 : µ = µ 0 se proti alterativě H : µ > µ 0 zamítá, jestliže T t ( α) (3) Hypotéza H 0 : µ = µ 0 se proti alterativě H : µ < µ 0 zamítá, jestliže T t ( α) Hladia výzamosti tohoto testu je rova α Jde přitom o test, který má ze všech možých testů hypotézy H 0 : µ = µ 0 ejvětší možou sílu Jiak řečeo, pravděpodobost zamítutí esprávé hypotézy je u tohoto testu při libovolé předem zadaé hladiě výzamosti α ejvětší možá Defiice Test popsaý v předchozí větě se azývá jedovýběrový t test Pozámka K testovací statistice jedovýběrového t testu lze dospět přímo, aiž bychom předtím odvozovali vzorec pro iterval spolehlivosti pro parametr µ Jestliže je totiž hypotéza H 0 : µ = µ 0 správá, pak v důsledku věty má veličia T X µ = 0 rozděleí t Použijeme-li tedy pro zamítáí hypotézy H 0 kritérií popsaých ve větě 4, bude hypotéza zamítuta právě tehdy, když absolutí hodota testovací statistiky T je tak veliká, že takto veliká hodota je u této statistiky za předpokladu platosti hypotézy H 0 je velmi málo pravděpodobá kutečost, že hodota statistiky T je veliká přitom zameá, že mezi výběrovým průměrem X a hypotetickou hodotou µ 0 parametru µ je veliký rozdíl; právě proto má popsaý test velkou sílu a s velikou pravděpodobostí odhalí skutečost, že hypotéza H 0 správá eí ÚLOHY Předpokládejme, že výčetí tloušťka stromu se řídí ormálím zákoem rozděleí pravděpodobostí Byla změřea tloušťka šestácti áhodě vybraých stromů (v cetimetrech); výsledky jsou zazameáy v ásledující tabulce: Tloušťka 8 0 4 8 3 38 Četost 4 5 3 4
a) Nalezěte iterval, který pokrývá hodotu středí výčetí tloušťky s pravděpodobostí 0,95 b) Předpokládejme (apř a základě předchozí zkušeosti či s přihlédutím k výše aměřeým hodotám), že směrodatá odchylka tloušťky eí větší ež osm cetimetrů Jaký ejmeší počet stromů musíme vybrat, jestliže požadujeme, aby chyba, které se dopustíme při odhadu středí tloušťky aritmetickým průměrem tlouštěk vybraých stromů, byla s 95% pravděpodobostí meší ež jede cetimetr? Řešeí Ozačme X, X,, X tloušťky vybraých stromů a předpokládejme, že jde o áhodý výběr z rozděleí N ( µ, ) a) Je třeba odhadout hodotu parametru µ Průměrá tloušťka změřeých stromů je X = 6, 75, výběrový rozptyl je = 7, 67 Veličia X je maximálě věrohodým odhadem parametru µ, přičemž 95% iterval spolehlivosti pro parametr µ je dá předpisem X ± t (0,05), kde = 6 je velikost výběru a t ( 0,05) = t5(0,05) =, 3 je kritická hodota rozděleí t Po dosazeí dospějeme k itervalu 6, 75 ±, 80 Teto iterval pokrývá hodotu středí tloušťky µ s pravděpodobostí 0,95 b) Je-li číslo zámé, pak ( α ) 00% iterval spolehlivosti pro parametr µ má meze X ± u( α ), kde u ( α ) je kritická hodota rozděleí N( 0, ) Pro určeí miimálího počtu vybraých stromů potřebého k dosažeí požadovaé přesosti odhadu středí tloušťky počítejme s ejvětší možou předpokládaou variabilitou tlouštěk, tj s hodotou = 8 Požadujeme, aby u( 0,05) < Odtud plye, že musí být [ u(0,05) ] = (,96 8) = 46 Je tedy uto vybrat a změřit řá- > dově alespoň dvě stě padesát stromů Nechť chyba, které se dopouštíme při měřeí výšky stromu určitým typem výškoměru, má rozděleí N (0, ), přičemž je ezámý parametr Dejme tomu, že určitý strom má výšku h met- rů Za účelem přesého určeí této výšky bylo provedeo devět ezávislých opakovaých měřeí s ásledujícím výsledkem (v metrech): 0,9 0, 9,84 9,8 9,83 0,6 9,79 9,96 9,7 a) Určete 99 % iterval spolehlivosti pro výšku h b) Jak se změí řešeí úlohy a), jestliže číslo, vyjadřující velikost áhodé chyby měřeí, záte? Kokrétě předpokládejte, že = 0, 5 Řešeí Nechť je počet měřeí a X i, kde i =,,,, je výsledek i - tého měřeí Ozačímeli e i chybu i - tého měřeí, pak X i = h + ei Předpokládáme přitom, že tyto chyby mají ormálí rozděleí, ulovou středí hodotu a stejý rozptyl Předpoklad ulové středí hodoty veliči e i zameá, že během měřeí edochází k systematickým chybám, stejý rozptyl těchto veliči pak vyjadřuje stálost podmíek, za ichž jsou měřeí prováděa Normalita rozděleí chyb přitom odpovídá implicitímu předpokladu o jejich zcela áhodé povaze Je tedy odkud plye, že e i ~ N (0, ), 5
X i ~ N ( h, ) pro každé i =,,, Přitom je ezámá kostata ezávislá a i a charakterizující zvoleý proces měřeí Předpokládáme-li dále, že chyby e, e,, e jsou vzájemě ezávislé, pak vektor X, X,, X je áhodým výběrem z rozděleí N ( h, ) Chceme přitom odhadout středí hodotu h tohoto rozděleí Výběrový průměr je X = 9, 95, výběrový rozptyl = 0, 04 a směrodatá odchylka = 0, a) Hledaý 99% iterval spolehlivost pro parametr h (skutečou výšku stromu) je dá předpisem X ± t (0,0), kde = 9 je počet provedeých měřeí Z tabulek zjistíme, že t ( 0,0) = t8(0,0) = 3, 355 Po dosazeí obdržíme výsledek 9,95 ± 0, b) Předpokládáme-li, že = 0, 5, pak 99% iterval spolehlivosti pro parametr h je X ± u( 0,005) Z tabulek zjistíme, že u ( 0,005) =, 576 Po dosazeí dostaeme výsledek 9,95 ± 0, 3 3 Při výrobě micí je staovea hmotost mice pět gramů Je podezřeí, že a materiálu se systematicky šetří Testujte hypotézu, že tomu tak eí Použijte výsledků amátkové kotroly, při íž bylo áhodě vybráo deset micí, a poté zjištěa jejich hmotost; zazameaé hmotosti vybraých micí (v gramech) jsou přitom ásledující: 4,9 5,0 4,88 4,79 4,89 4,7 5,0 4,97 4,86 4,93 Řešeí Ozačme X, X,, X hmotosti vybraých micí a předpokládejme, že tyto hmotosti představují áhodý výběr z rozděleí N ( µ, ) Testujme hypotézu H 0 : µ = 5, tj hypoté- zu, že středí hmotost vyráběých micí je rova staoveé ormě, a to ejprve proti oboustraé alterativě H : µ 5 Provedeme jedovýběrový t test, a to a základě testovací statistiky X 5 T =, o íž víme, že má za předpokladu správosti hypotézy H 0 rozděleí t V ašem případě je = 0, X = 4,898, = 0,0937, T = 3,44 > 3,5 = t 9 (0,0) Hypotéza H : µ 5 se proto zamítá proti alterativě H : µ 5 a hladiě výzamosti 0 = α = 0,0 Vzhledem k tomu, 3,44 = t 9 (0,0074), je hladia výzamosti testu ve skutečosti o ěco málo meší ež 0,0 V aší úloze však a priori vylučujeme možost, že se mice vyrábějí systematicky těžší ež je staoveá orma, správá alterativa k testovaé hypotéze je tudíž jedostraá alterativa H : µ < 5 Hladia výzamosti se přechodem k této jedostraé alterativě sižuje a poloviu, je tedy meší ež 0,004 Jedovýběrový t test lze a předem daé hladiě výzamosti α realizovat též tak, že určíme ( α ) 00% iterval spolehlivosti pro parametr µ a povšimeme si, zda teto iterval obsahuje či eobsahuje testovaou hodotu (zde číslo pět) Například oboustraý 99% iterval spolehlivosti pro parametr µ je ( 4,80; 4,994) Teto iterval eobsahuje číslo 5 (ýbrž leží celý alevo od tohoto čísla), což odpovídá skutečosti, že a hladiě výzamosti α = 0, 0 se hypotéza H 0 : µ = 5 proti alterativě H : µ 5 zamítá Jedostraé alterativě pak odpovídá jedostraý iterval spolehlivosti ( ; 4,98) 6
4 Párový t test U devíti vzorků půdy byla staovea kocetrace jisté škodlivé látky Použilo se přitom dvou metod Jeda z ich je klasická, zatímco druhá je ová Na základě zjištěých výsledků (viz ásledující tabulka) posuďte, zda prví metoda dává systematicky větší ebo meší výsledky ež druhá Klasická metoda,68,60,43,85,94,70,68,98,85 Nová metoda,36,4,39,90,8,73,58,89,78 Rozdíl 0,3 0,9 0,04-0,05 0, -0,03 0,0 0,09 0,07 Řešeí Předpokládejme, že rozdíl mezi hodotami výsledků jedotlivých metod se řídí ormálím zákoem rozděleí pravděpodobostí a testujme hypotézu, že středí hodota tohoto rozdílu je rova ule Tím je úloha převedea a jedovýběrový t test Hodota testovací statistiky je T =,53,306 = t (0,05) ystematický rozdíl ve výsledcích obou metod je tím prokázá 8 Odhad rozptylu, test hypotézy o rozptylu χ, tj takovou hod- Ozačeí ymbolem χ ( α ) budeme ozačovat kritickou hodotu rozděleí otu, která je veličiou s rozděleím χ překročea s pravděpodobostí α Nechť X, X,, X je áhodý výběr z rozděleí N ( µ, ) Z věty (b) vyplývá, že s pravděpodobostí α je ( ) χ ( α ) χ ( α < < ) Odtud pak lehce dospějeme k ásledujícímu výsledku Věta 5 Nechť, X, X je áhodý výběr z rozděleí N ( µ, ) X, Pak iterval ( ) ( ), χ ( α ) ( ) χ α pokrývá hodotu parametru s pravděpodobostí α Iterval z předchozí věty představuje itervalový odhad pro rozptyl ormálího rozděleí; přesěji jde o oboustraý ( α ) 00% iterval spolehlivosti Aalogicky lze zkostruovat jedostraé itervaly spolehlivosti Kokrétě: Iterval ( ),, χ ( α ) a rověž tak iterval ( ) χ ( α) pokrývá hodotu parametru s pravděpodobostí Kostrukce itervalu spolehlivosti pro parametr, + α souvisí s testem hypotézy 0 H 0 : =, kde 7
hypotetickou hodotu 0 je daé reálé číslo Tuto hypotézu zamíteme, jestliže alezeý iterval spolehlivosti pro parametr straé alterativě 0 0 eobsahuje Testujeme-li tedy apř hypotézu H 0 proti obou- H :, zamíteme ji tehdy, když iterval ( ) ( ), χ ( α ) ( ) χ α eobsahuje číslo 0 ado ahlédeme, že hladia výzamosti takového testu je rova α Je přitom zjevé, že k zamítáí hypotézy H 0 dochází právě tehdy, když Náhodá veličia ( ) < χ α 0 ( ) ( ) ebo > χ ( α ) ( ) T = představuje tedy testovací statistiku pro hypotézu H 0 Hypotéza se zamítá, jestliže T < χ ( α ) ebo χ ( α T > ) Aalogicky lze zkostruovat testy hypotézy H 0 : = 0 proti jedostraým alterativám H : > 0 a H : < 0 Popis testu při všech třech možých alterativách (za použití testovací statistiky T ) je shrut v ásledující větě: 0 0 Věta 6 Testujme hypotézu H 0 : = 0 o parametru ormálího rozděleí prostředictvím kofrotace této hypotézy s empiricky zjištěou hodotou výběrového rozptylu Položme ( ) T = a staovme ásledující kritéria pro zamítáí hypotézy H 0 : () Hypotéza () Hypotéza (3) Hypotéza H 0 : = 0 se proti alterativě : 0 0 H zamítá, jestliže T χ ( ) ebo T χ ( α ) < α H 0 : = 0 se proti alterativě : > 0 H 0 : = 0 se proti alterativě : < 0 > > H zamítá, jestliže T χ ( α) < α H zamítá, jestliže T χ ( ) Hladia výzamosti tohoto testu je rova α Jde přitom o ejsilější možý test Pozámka Kritéria pro zamítáí hypotézy H 0 : = 0 zformulovaá v předchozí větě se lehce zapamatují Hypotéza se totiž zamítá tehdy, jestliže poměr empiricky zjištěé hodoty výběrového rozptylu a hypotetické hodoty 0 rozptylu je příliš malý (resp příliš velký) ÚLOHY 5 a) Nechť chyba, které se dopouštíme při zjišťováí výšky stromu určitým typem výškoměru, má rozděleí N (0, ) Chceme odhadout hodotu parametru Za tím účelem provedeme = 00 opakovaých měřeí jedé kokrétí výšky; předpokládáme přitom, že výsledky jedotli- 8
vých měřeí jsou vzájemě ezávislé Z aměřeých hodot vypočítáme výběrovou směrodatou odchylku; její hodota echť je = 0, 37 Určete 95% oboustraý iterval spolehlivosti pro parametr Zcela speciálě testujte hypotézu, že = 0, 5 b) Řešte předchozí úlohu pro = 000 měřeí s výběrovou směrodatou odchylkou = 0, 44 (Provedeme-li více měřeí, obdržíme přesější odhad) Řešeí a) Podobě jako v úloze předpokládáme, že chyby e, e,, e jedotlivých měřeí jsou vzájemě ezávislé veličiy s rozděleím N (0, ) Jiak řečeo vektor e, e,, e je áhodým výběrem z rozděleí N (0, ) a aším úkolem je odhadout rozptyl tohoto rozděle- í Bodovým odhadem parametru je veličia = 0,37 ; jde přitom o estraý a maximálě věrohodý odhad (Je třeba si uvědomit, že výběrový rozptyl aměřeých hodot je stejý jako výběrový rozptyl chyb, kterých se při měřeí dopustíme) Itervalový odhad parametru zkostruujeme ásledujícím způsobem Platí, že a tudíž s pravděpodobostí 0,95 je 99 99 ~ χ, 99 χ 99 99 χ (0,975) < < Příslušé kritické hodoty rozděleí χ 99 jsou 99 = To zameá, že s pravděpodobostí 0,95 je (0,05) 99 = χ (0,05) 8,4 a χ (0,975) 73, 36 99 73,36 < < 8,4 Odtud vyplývá, že iterval 99, 8,4 99 = (0,0447; 0,0533) 73,36 pokrývá ezámou hodotu parametru s pravděpodobostí 0,95 Tudíž 95% oboustraý iterval spolehlivosti pro směrodatou odchylku je ( 0,; 0,6) To ale zameá, že hypotéza H 0 : = 0, 5 se proti alterativě H : 0, 5 a hladiě výzamosti α = 0, 05 ezamítá b) Podobě jako v úloze a) zjistíme, že 95% oboustraý iterval spolehlivosti pro rozptyl je 999, χ 999(0,05) 999 χ 999(0,975) Kritické hodoty χ 999(0,05) a χ 999(0,975) rozděleí χ lze s poměrě velikou přesostí určit pomocí aproximace tohoto rozděleí ormálím rozděleím N ( 999, 999) Obdržíme tak kritické hodoty 999 ±,96 999, tj 999 ± 87, 6 Po dosazeí za tyto kritické hodoty a za empiricky zjištěou hodotu rozptylu = 0,37 získáme pro 95% iterval spolehlivosti pro parametr vyjádřeí ( 0,09; 0,03) Odpovídající itervalový odhad parametru je ( 0,38; 0,5) 999 9
6 Pevost vláka bavlěé příze lze pokládat za áhodou veličiu s rozděleím N( µ, ) Je-li > 036, kg, vzikají potíže při tkaí Při zkoušce jedeácti áhodě vybraých vláke byly zjištěy tyto hodoty jejich pevosti: 5,3 3,0 4,8 3,6 4,,5 4,7,4 3, 3,8 4,4 Je třeba posoudit, zda je příze vyhovující Řešeí Testujme hypotézu H 0 : = 0, 36 proti alterativě H : > 0, 36 Test lze realizovat buď tak, že vypočteme jedostraý iterval spolehlivosti pro parametr, ebo pomocí testovací statistiky Bodovým odhadem parametru je výběrový rozptyl = 0, 9 Přitom 95 % levostraý iterval spolehlivosti pro parametr je rove 0, χ0(0,05) +, 0 = zatímco testovací statistika pro hypotézu H : 0, 36 je 0 T = 0,36 Po dosazeí za číslo obdržíme pro iterval spolehlivosti pro parametr vyjádřeí ( 05, ; + ); teto iterval pokrývá ezámou hodotu parametru s pravděpodobostí 0,95 Hypotéza H 0 : = 0,36 se tudíž proti alterativě H : > 0, 36 zamítá a hladiě výzamosti α = 0, 05, eboť iterval ( 05, ; + ) eobsahuje číslo 0,36 Dále 0 T = 5, 6 > 3, 09 = χ ( 0, 0), což zameá, že hypotéza H 0 se proti alterativě H zamítá i a hladiě výzamosti α = 0, 0 Ozačíme-li tedy přízi za evyhovující, pak pravděpodobost, že je teto závěr špatý, epřekračuje hodotu 0,0 7 V úloze b) předpokládáme, že směrodatá odchylka výčetí tloušťky stromu epřekračuje hodotu osm cetimetrů Ukažte, že teto předpoklad je v souladu se získaými experimetálími daty Řešeí Iterval ( ; 7,56) pokrývá hodotu směrodaté odchylky s pravděpodobostí 0,95 Test hypotézy o rovosti středích hodot dvou ormálích rozděleí Nechť X, X,, X je áhodý výběr z rozděleí N( µ, ) a Y, Y,, Y je áhodý výběr m z rozděleí N( µ, ) To zameá, že X, X,, X m jsou vzájemě ezávislé áhodé veličiy s rozděleím N( µ, ) a Y, Y,, Y jsou vzájemě ezávislé áhodé veličiy s rozděleím N( µ, ) Předpokládejme dále, že hodoty veliči Y, Y,, Y ezávisí a hodotách veliči X, X,, X m (a aopak), tj že jde o vzájemě ezávislé áhodé výběry Chceme testovat hypotézu H 0 : µ = µ Ozačme X = m m X i i =, Y = Y i i = m, = ( X i X m ) i =, = ( Y i Y ) i = 0
Věta 7 Náhodá veličia má rozděleí N (0,) Důkaz Víme, že Vzhledem k tomu, že výběry též veličiy X a Y, a proto Odtud pak plye, že což bylo dokázat T = ( µ µ ) + m X ~ N, µ a Y m ~ N, µ X, X,, X m a Y, Y,, Y jsou vzájemě ezávislé, jsou ezávislé ~ N µ µ, + m ( µ µ ) ~ + m N (0, ), Důsledek Nechť H 0 : µ = µ je správá hypotéza Pak áhodá veličia má rozděleí N (0,) T = + m Náhodou veličiu T z předchozího důsledku lze považovat za testovací statistiku pro hypotézu H 0 Pokud budeme zamítat hypotézu H 0 tehdy, když hodoty statistiky T padou do kritické oblasti rozděleí N (0,), tj tehdy, když T u( α ), obdržíme test s hladiou výzamosti α Při aplikaci tohoto testu se ovšem předpokládá, že hodoty rozptylů a jsou zámé; v běžých aplikacích tomu tak ale zpravidla ebývá Podobě jako v jedovýběrovém t testu se přitom abízí myšleka ahradit ve statistice T hodoty ezámých rozptylů a jejich odhady a a zjistit jak se přitom rozděleí statistiky T změí Bohužel však v případě, že o parametrech a emáme vůbec žádou iformaci, eumíme toto rozděleí exaktě vyčíslit Kdybychom však předpokládali, že hodoty rozptylů a jsou stejé, pak lze postupovat ásledujícím způsobem Ozačme = = Veličia T z věty 7 pak abývá tvaru Lze přitom ukázat, že veličia T = ( µ µ ) + m ( m ) + ( ) = m + je estraým (a maximálě věrohodým) odhadem parametru a že veličiy X Y a jsou vzájemě ezávislé Odtud lze pomocí věty z tohoto pojedáí a věty 3 z Pricipů vyvodit ásledu-
jící výsledek: Věta 8 Nechť = Pak áhodá veličia má rozděleí t m+ Důsledek Nechť 0 : µ = µ má rozděleí t m+ T = ( µ µ ) + m H je správá hypotéza (a echť avíc = ) Pak áhodá veličia T = + m Veličiu T z předchozího důsledku lze tedy za předpokladu, že =, považovat za testovací statistiku pro hypotézu H 0 : µ = µ Hypotéza H 0 : µ = µ se zamítá proti oboustraé alterativě H : µ µ, pokud T t + ( α ) m Proti alterativě H : µ > µ se hypotéza H 0 zamítá, jestliže T t m + (α ) a proti alterativě H : µ < µ se zamítá tehdy, když T t + ( m α) ouhrě řečeo, proti jedostraé alterativě se hypotéza H 0 zamítá, jestliže T t m + (α ) Hladia výzamosti tohoto testu je rova α Lze přitom ukázat, že za předpokladu = je popsaý test ejsilějším možým testem hypotézy H 0 : µ = µ Pozámka Jestliže m =, pak + = Defiice Výše popsaý test se azývá dvouvýběrový t test Prohlédeme-li si pozorě kritérium pro zamítáí hypotézy H 0 : µ = µ v právě popsaém dvouvýběrovém t testu, vidíme, že proti oboustraé alterativě H : µ µ se tato hypotéza zamítá právě tehdy, když V takovém případě říkáme, že rozdíl X tm+ ( α ) + m LD Y je statisticky výzamý Číslo ( ) m = tm+ α + přitom představuje ejmeší (statisticky) výzamý rozdíl Dvouvýběrový t test hypotézy H 0 : µ = µ proti alterativě H : µ µ lze při daé hladiě výzamosti α realizovat též tak, že zkostruujeme oboustraý ( α ) 00% iterval spolehlivosti pro rozdíl µ µ Z věty 8 vyplývá, že takový iterval je dá předpisem ± tm+ ( α ) + m Hypotéza H 0 se přitom zamítá, jestliže teto iterval eobsahuje ulu
Pokud máme pádý důvod předpokládat, že, je možo použít k testu hypotézy H 0 : µ = µ ějakou obdobu dvouvýběrového t testu, v íž se erovost rozptylů explicitě předpokládá Jako testovací statistika pak obvykle slouží veličia T = + m Rozděleí pravděpodobostí veličiy T (za platosti hypotézy H 0 ), a tedy ai kritické hodoty tohoto rozděleí však eumíme, jak již bylo pozameáo, přesě vyčíslit Jestliže však jsou čísla m a dost veliká, lze tyto kritické hodoty určit alespoň přibližě Často bývá používá tzv Cochraův-Coxův test, který pracuje s modifikovaou kritickou hodotou v tm ( α) + vt ( α) t ( α ) =, v + v kde s v = m a s v = Hypotéza H 0 se zamítá, jestliže T t (α ) atterthwaiteův test a Welchův test pak pracují s modifikovaým počtem stupňů volosti, a to u atterthwaiteova a ( v + v ) f = v v + m ( v + v ) h = v v + m + + u Welchova testu Hypotéza H 0 se zamítá, jestliže T t f (α ), resp T t h (α ) Hladiy výzamosti všech tří testů jsou při oboustraé alterativě asymptoticky (tj pro m, ) rovy α Test hypotézy o rovosti rozptylů dvou ormálích rozděleí Předpokládejme opět, že X, X,, X je áhodý výběr z rozděleí N( µ, ) m, Y, Y,, Y je áhodý výběr z rozděleí N( µ, ) a že tyto výběry jsou vzájemě ezávislé Chceme testovat hypotézu H 0 : = Tak jako u dvouvýběrového t testu ozačme m = ( X i X ) m i = a = ( Y i Y ) i = Řešeí úlohy spočívá ve vyčísleí rozděleí veličiy za předpokladu, že H 0 je správá hypotéza; kokrétě se ukáže, že jde o F rozděleí (stačí spojit větu (b) z tohoto pojedáí s větou 4 z Pricipů) Důvodem k zamítutí hypotézy H 0 jsou zřejmě příliš malé či příliš veliké hodoty poměru (meší či větší ež hodoty kritické) Popíšeme postup tohoto testováí podroběji Nejpr- ve přesě zformulujme základí věty, a ichž je toto testováí založeo 3
Ozačeí ymbolem F m, ( α) budeme ozačovat kritickou hodotu rozděleí F m,, tj takovou hodotu, která je veličiou s rozděleím m,, m α F ( α) = F ( ) F, překročea s pravděpodobostí α Lze ukázat, že m Věta 9 Náhodá veličia má rozděleí F m, T = Důsledek Nechť H 0 : = je správá hypotéza Pak áhodá veličia T = má rozděleí F m, Hodota veličiy T z předchozí věty se zřejmě s pravděpodobostí F ( α ) F ( α ) Odtud bezprostředě vyplývá ásledující věta ( ) m,, m, α achází v itervalu Věta 0 Iterval Fm =, ( α ) ( ) ( ) ( ) F, α α α m Fm, F, m,, pokrývá hodotu podílu s pravděpodobostí α Teto iterval tedy představuje ( α ) 00% iterval spolehlivosti pro parametr Nyí můžeme přistoupit k vlastímu popisu testu hypotézy se zamítá proti alterativě H : tehdy, jestliže iterval H 0 : = Hypotéza H 0 : = Fm, ( α ) ( ) F, α m, eobsahuje číslo (tj tu hodotu, které podíl abývá tehdy, když H 0 je správá hypotéza) To astae právě tehdy, když ( ) T ( ) ebo T ( α ), < F, α m > F m, kde T = Veličiu T = lze tedy považovat za testovací statistiku pro hypotézu H 0 Hladia výzamosti tohoto testu je rova α Ukazuje se přitom, že při běžě používaých hladiách výzamosti a při epříliš velikém rozdílu mezi čísly m a se emůže stát, aby jeda z erovostí ( ) byla splěa a druhá ikoliv Proto v praxi postupujeme zpravidla tak, že za zvolíme větší a za meší z obou výběrových rozptylů a hypotézu H 0 zamíteme, jestliže poměr je příliš veliký, tj jestliže T ( α ) Defiice 3 Výše popsaý test je zám jako F test > F m, 4
ÚLOHY 8 Bylo vybráo třiáct polí stejé kvality Na osmi z ich se zkoušel ový způsob hojeí, zbývajících pět bylo ošetřeo běžým způsobem Výosy pšeice v tuách a hektar jsou uvedey v ásledující tabulce Nový způsob hojeí 5,7 5,5 4,3 5,9 5, 5,6 5,8 5, Běžý způsob hojeí 5,0 4,5 4, 5,4 4,4 Je třeba zjistit, zda způsob hojeí má vliv a výos pšeice Řešeí Ozačme X, X,, X Y, Y,, Y m výosy pšeice v tuách a hektar při ovém a při běžém způsobu hojeí Je tedy m = 8 a = 5 Předpokládejme dále, že X, X,, X m je áhodý výběr z rozděleí N( µ, ), Y, Y,, Y je áhodý výběr z rozděleí N( µ, ) a testujme hypotézu H 0 : µ = µ Nejprve předpokládejme, že = a proveďme dvouvýběrový t test Je X = 5, 3875, = = Y = 47,, 0, 698, 0, 4 Dále pak ( m ) + ( ) 7 + 4 = = = 0,59 m + Testovací statistika pro dvouvýběrový t test je T = + m Jelikož T =,37 >,0 = t(0,05), hypotéza H 0 : µ = µ se proti alterativě H : µ µ zamítá a hladiě výzamosti α = 0, 05 V daém kotextu by ovšem možá bylo přirozeější zvolit alterativu H : µ > µ a porovávat hodotu statistiky T s kritickou hodotou t ( 00, ) Iterval spolehlivosti pro rozdíl µ µ je dá předpisem X Y ± tm+ ( α ) + m V ašem případě shledáváme, že 95% iterval spolehlivosti pro rozdíl středích výosů při ovém a běžém způsobem hojeí je 0, 6875 ± 0, 6386, tj (0,05;,33) Hypotéza H 0 : µ = µ byla proti alterativě H : µ µ zamítuta a hladiě výzamosti α = 0, 05 z toho důvodu, že teto iterval eobsahuje ulu Při posouzeí, zda iterval spolehlivosti pro rozdíl µ µ obsahuje či eobsahuje ulu, lze postupovat též ásledujícím způsobem Nejprve vypočítáme číslo LD = tm+ ( α ) +, m tj ejmeší (statisticky) výzamý rozdíl mezi průměrými výosy při ovém a běžém způsobu hojeí a ověříme, zda rozdíl X Y je statisticky výzamý, tj zda V ašem případě je X Y LD = 0,6875 0, 6386 = LD, tudíž rozdíl X Y je při zadaé hladiě výzamosti α = 0, 05 statisticky výzamý 5
Otestujme ještě hypotézu H 0 : =, což je předpoklad výše provedeého dvouvýběrového t testu Hodota testovací statistiky je = T =,4 (Připomeňme, že je třeba dělit větší rozptyl meším!) Vzhledem k tomu, že,4 (0,05) T < F 7 = 9,074, hypotéza H 0 : = se proti alterativě H : a hladiě výzamosti α = 0, 05 ezamítá Teto tzv F test lze realizovat též tak, že vyčíslíme 95 % iterval spolehlivosti pro podíl, tj iterval Dosadíme-li F7, 4, ( 0,05) 4 F (0,975) 7, 7, 4 = 4, 7 = F 7, 4 (0,05) = 9,074 ; F (0,975) F (0,05) 0, 8, obdržíme iterval ( 0,4; 6,09) Teto iterval pokrývá hodotu podílu rozptylů a s pravděpodobostí 0,95 Hypotéza H 0 : = se proti alterativě H : a hladiě výzamosti α = 0, 05 ezamítla proto, že teto iterval obsahuje jedičku (a připouští tedy možost, že poměr je rove jedé) Testujme yí hypotézu H 0 : µ = µ za předpokladu, že Jako testovací statistika se pak používá veličia T = + m V ašem případě je v = = 0,03375, v = = 0, 048, T * =, 405 m Cochraův-Coxův test: Je vtm (0,05) + vt (0,05) t (0,05) = =,606 v + v Jelikož T < t (0,05), hypotéza H 0 : µ = µ se proti alterativě H : µ µ a hladiě výzamosti α = 0, 05 ezamítá atterthwaiteův test: Je ( v + v ) f = = 9,044 v v + m a t f ( 0,05) =, 60 Jelikož T > t f (0,05), hypotéza H 0 : µ = µ se proti alterativě H : µ µ a hladiě výzamosti α = 0, 05 zamítá Welchův test: Je h = ( v + v ) =,086 v v + m + + a t h ( 0,05) =, 99 Jelikož T > t h (0,05), hypotéza H 0 : µ = µ se proti alterativě H : µ µ a hladiě výzamosti α = 0, 05 zamítá 6
9 Chceme prokázat, že studeti lesické fakulty jsou v průměru hmotější ež studetky Za tím účelem vybereme áhodě deset studetů a deset studetek a zjistíme jejich hmotost (v kilogramech) Výsledky tohoto průzkumu jsou uvedey v ásledující tabulce tudeti 73 5 68 69 85 97 75 77 73 7 tudetky 49 4 70 76 54 5 6 46 47 63 Je rozdíl v průměrých hmotostech vybraých studetů a studetek statisticky výzamý? Řešeí Ozačme X, X,, X 0 hmotosti vybraých studetů a Y, Y,, Y0 hmotosti vybraých studetek Předpokládejme, že X, X,, X 0 je áhodý výběr z rozděleí N( µ, ) a, Y,, Y0 Y je áhodý výběr z rozděleí N( µ, ) Je X = 74, Y = 56, =, 8, =, 33 Odtud plye, že 95% iterval spolehlivosti pro středí hmotost studetů je ( 65,55; 8,45) a 95% iterval spolehlivosti pro středí hmotost studetek je ( 47,89; 64,) Tyto itervaly mají prázdý průik, pokud by tedy skutečě pokrývaly hodoty středích hmotostí µ a µ, zamealo by to, že µ µ, tj že středí hmotosti studetů a studetek ejsou stejé Bohužel však elze přesě určit pravděpodobost, že takovýmto postupem dospějeme k chybému závěru (tj zamíteme hypotézu H 0 : µ = µ ) Víme pouze, že tato pravděpodobost je větší ež 0,05 a meší ež 0,0 Chceme-li takovou pravděpodobost určit přesě, je třeba provést dvouvýběrový t test Předpokládejme tedy avíc, že = a testujme hypotézu H 0 : µ = µ proti alterativě H : µ > µ (možost, že studetky jsou v průměru hmotější ež studeti a priori vylučujeme) Je = ( + ) =, 57 a T = 3,48 >,55 = t8(0,0) Hypotéza H 0 : µ = µ se tedy proti alterativě H : µ > µ zamítá a hladiě výzamosti α = 0, 0 Předpokládejme yí, že Je T = 3, 48 a t ( 0,0) = t9 (0,0) =, 8 Cochraův- Coxův test tedy rověž vede k zamítutí hypotézy H 0 : µ = µ proti alterativě H : µ > µ a hladiě výzamosti α = 0, 0 Dále je f = 8 a t (0,0), 55, a koečě h = 0 a 8 = t 0 (0,0) =,58 Tudíž jak atterthwaiteův, tak Welchův test vedou k zamítutí hypotézy H 0 : µ = µ proti alterativě H : µ > µ a hladiě výzamosti α = 0, 0 0 Na stroji vyrábějícím dřevěé polotovary byla provedea jistá úprava za účelem zvýšeí přesosti obráběí Chceme posoudit, zda tato úprava byla účiá Bylo proto áhodě vybráo osm polotovarů vyrobeých a stroji bez úpravy a osm a upraveém stroji Délky výrobků v milimetrech jsou obsažey v ásledující tabulce: troj bez úpravy 4 4 8 4 30 6 6 Upraveý stroj 6 8 8 8 0 0 0 4 a) Testujte hypotézu, že středí délka vyráběých polotovarů zůstala po úpravě stroje stejá b) Testujte hypotézu, že přesost obráběí se ezměila, a to proti alterativě, že tato přesost se po úpravě stroje zvýšila Řešeí Ozačme X, X,, X 8 délky polotovarů vyrobeých a stroji bez úpravy a Y, Y,, Y8 délky polotovarů vyrobeých a upraveém stroji Předpokládejme přitom, že a obou strojích se odchylka délky polotovaru od jeho středí délky se řídí ormálím zákoem rozděleí pravděpodobostí a) Jelikož X = Y = 9, 5, elze zamítout hypotézu, že středí délka polotovarů je pro oba stroje stejá b) Je 3, 93, 5, 64 a T = =,66 > 3,787 = (0,05) Hypotéza, že přesost ob- = = 5 F7, 7 7
ráběí se ezměila, se tedy zamítá a hladiě výzamosti α = 0, 05 Jelikož však T < 6,993 = F 7, 7 (0,0), hypotéza se ezamítá a hladiě výzamosti α = 0,0 8