7. Statistické hypotézy parametrické testy V této části se budeme zabývat statistickými hypotézami, pomocí vyšetřujeme jedotlivé parametry populace. K takovýmto šetřeím většiou využíváme ám již dobře zámé statistické itervalové odhady. 7. Testy o parametrech ormálího rozděleí V této části se budeme zabývat studiem případů, kdy testujeme základí parametry rozděleí N(m,s ). Kokrétě budeme kostruovat testy pro středí hodotu a rozptyl takovéto áhodé veličiy. 7.. Středí hodota m Na základě áhodého výběru = ( x,,x ), které pochází z populace popsaé rozděleím N(m,s ) budeme testovat hypotézu H : m = m, m je předem zadaé reálé číslo. Z kapitoly o itervalových odhadech víme, že základem všech kostrukcí odhadů středí hodoty bývá výběrový průměr X a jeho vlastosti. Právě z vlastostí výběrového průměru jsme kostruovali itervalové odhady a z těchto vlastostí yí odvodíme příslušé testové statistiky pro kokrétí alterativí statistické hypotézy H. Protože jsme při tvorbě itervalových odhadů rozlišovali případ zda je ám zám rozptyl rozděleí provedeme takovéto rozděleí i yí. 7... Parametr s je zám V tomto případě použijeme jako testovací statistiku rozděleí U X µ =., (7.) o kterém je zámo, že při platosti hypotézy H je typu N(,). Budeme li tedy vyšetřovat ejdříve případ pravostraé alterativí hypotézy tedy: H : m > m a hladiě výzamosti p získáme kritický obor = { u; u u -p }, kde u α je α % kvatil rozděleí N(,) a u je vypočteá hodota testové statistiky. V případě levostraé alterativí hypotézy H : m < m s použitím stejé testovací statistiky a hladiě výzamosti p získáme kritický obor = { u; u c u -p }. V posledím případě oboustraé alterativí hypotézy H : m π m, s použitím stejé testovací statistiky získáme a hladiě výzamosti p kritický obor = u; u u p, kde opět u α je α% kvatil rozděleí N(,) a u je opět vypočteá hodota - testové statistiky. Dále uvedeme ěkolik modelových příkladů k presetaci postupů a ke staoveí silofukce těchto hypotéz. Příklad 7. Byl provede áhodý výběr o rozsahu =5 prvků z populace N(m,). Testujme hypotézu H : m = 8 proti alterativí hypotéze H: m 8 a hladiě výzamosti 5%.
Pomocí áhodého výběru byl aleze výběrový průměr X = 8,8. Rozhoděte o platosti hypotézy H! Řešeí: Vzhledem k hladiě výzamosti, je staove kritický obor = { u; u,96 }. X µ 8,88 8 Staovíme hodotu testové statistiky pro áš případ u =. =. 5 =,984. Protože hodota testové statistiky eí v kritickém oboru emůžeme hypotézu H zamítout. Hodota silofukce je v tomto případě rova : µ µ µ µ -ß( µ ) = Φ. + up +Φ. + up. Pro jedotlivé hodoty m vypočteme hodotu β, v ásledující tabulce jsou tyto hodoty uvedey: µ β(µ ) 5,676958 6,8995 7,99 8,95 9,99,8995,676958,483994 3,9458 4,496 5,6776 Samozřejmě, že pro hodotu m = 8 je hodota β rova 95%, celkově je vidět, že hodoty chyby druhého druhu jsou pro stávající hodoty velmi epřízivé, s rostoucí vzdáleostí od testovaé hodoty β klesá. Jedozačým viíkem těchto výsledků je malý počet čleů výběru. Příklad 7. Výrobce tvrdí, že výrobek má rozměry 56, jedotky se směrodatou odchylkou, jedotky. Odběratel tvrdí, že rozměry jsou větší, proto echal přeměřit 7 áhodě vybraých výrobků a zjistil, že jejich průměrý rozměr byl 58,9 jedotek. Je tato hodota výběrového průměru, za předpokladu ormálího rozděleí a směrodaté odchylky rozměrů, jedotky, statisticky výzamě větší ež tvrdí výrobce? Řešeí prove dte a hladiě výzamosti %. Řešeí: Staovme ejdříve základí hypotézy: H : m c 56, a H : m > 56,. Testová statistika je i v tomto případě stejá, zjistíme tedy její hodoty 58,9 56,, 7 u =. 7 =.8,37=,7,, V tomto případě je kritický obor = { u; u,36 }, protože vypočítaá hodota se achází v kritickém oboru a hladiě výzamosti zamítáme hypotézu H, výrobky jsou tedy statisticky výzamě větší ež tvrdí výrobce.
7... Parametr s je ezámý Při praktických úlohách se ve většiě případů setkáváme spíše s případem, kdy hodoty parametru s ejsou zámy a můžeme z aměřeých údajů je odhadovat jeho skutečou hodotu. V tomto případě ( již a základě ašich zalostí z části bodového odhadu ) se jako testová statistika volí áhodá veličia t X µ s =. (7.) o které již z dřívějších kapitol víme, že je typu studetova rozděleí s - stupi volosti. Takováto veličia se v souladu s tradicí ozačuje písmekem t. Výraz s je klasická hodota statistického rozptylu. Vypišme yí kritické obory pro jedotlivé případy jedostraých resp. oboustraých hypotéz: Pravostraá alterativí hypotéza m > m = { tt ; t p}, hodota t -p je rova (-p)% kvatilu studetova rozděleí s (-) stupi volosti. Levostraá alterativí hypotéza m < m = tt t, při stejém ozačeí. { ; p} Oboustraá alterativí hypotéza m π m = t; t t p, začeí jako v předchozím. Pozameejme, že stejě jako v prví části je jedím z podstatých předpokladů to, že daá data jsou získáváa z populace ormálí a způsob výběru je áhodý! Příklad 7.3 Na základě áhodého měřeí jsme zjistili ásledující hodoty 6;9;; ;;;;3;4;4;4;4;5;6;6;7. Zjistěte, zda můžeme a hladiě výzamosti 5% rozhodout o tom, že středí hodota populace erová 5. Řešeí: Staovíme ejdříve hypotézy H : m =5 a H : m π 5. Protože z daých dat vyplývají ásledující údaje : = 6; X =,65; s=,849. Můžeme dále zjistit kritický obor pomocí áhodé veličiy studetova rozděleí s 5 stupi volosti = { t; t,95}, dosadíme tedy do testové statistiky (7.) a získáme ásledující, 65 5,375 hodoty t =. 6 =.4= 3,33, protože tato hodota -3,33 leží v kritickém,849,849 oboru přijímáme alterativí hypotézu H.. Pokud bychom hledali tzv. p hodotu ( p-value ) těchto dat ( jde o hodotu hladiy výzamosti při které bude poprvé přijata hypotéza H ), získali bychom v tomto případě p=,45, tato hodota je více ež polovičí ež byla uvedea úvodí testovaá hladia výzamosti.
Příklad 7.4 Po staoveí měřeí hodot vzdáleostí mezi dvěma sazeicemi a záhoě jsme získali ásledující hodoty : 4 5 7 8 5 9 8 5 4 9 Ověřte a hladiě výzamosti 5% zda vzdáleosti mezi jedotlivými sazeicemi jsou vzdáleé ejvýše jedotek. Řešeí: Nejdříve staovíme opět testovaou a alterativí hypotézu. Zřejmě tedy bude H : m c a H : m>. V ašem případě máme tedy staoveou pravostraou alterativí = tt ; t = tt ;,74. hypotézu, kritický obor je tedy staove jako { } { } Z uvedeých hodot získáme opět základí hodoty = 8; X =,; s= 3,63. Pro další postup je uté vypočítat hodotu testové statistiky pro tato čísla, její velikost je rova t=-,8. Pro staoveí odpovědi a aší otázku yí ověříme, zda hodota vypočteé testové statistiky patří či epatří do kritického oboru. Vypočteá hodota epatří do kritického oboru, emůžeme tedy a hraici výzamosti 5% zamítout možost, že mezi sazeicemi je vzdáleost ejvýše jedotek. Pokud bychom hledali p-hodotu zjistili bychom, že je a úrovi čísla,64. 7.. Směrodatá odchylka s Směrodatá odchylka má pro ormálí rozděleí stejý výzam jako středí hodota. Oba tyto parametry sice ovlivňují hodoty ormálího rozděleí každý jiak, ale celkově je toto rozděleí dvouparametrické, potřebujeme proto zát oba parametry stejě dobře. 7... Při zámém parametru m V kapitole o bodovém odhadu směrodaté odchylky populace popsaé pomocí ormálího rozděleí jsme rozlišovali zda záme středí hodotu ormálího rozděleí či zda je ezáma. Chceme tedy testovat a základě áhodého výběru o prvcích z populace hypotézu H : s = s Jestliže byla středí hodota m populace záma potom vybíráme jako testovací statistiku áhodou veličiu,95 χ ( X µ )., i = (7.3) která má při platosti hypotézy H rozděleí c ( chi kvadrát ) s stupi volosti. Podobě jako v předchozích případech můžeme staovovat kritické obory v závislosti a hodotách alterativí hypotézy. Pravostraá alterativí hypotéza s > s. = χ ; χ χ ( p; ) p% kvatilu rozděleí chi kvadrát s stupi volosti. Je zřejmé, že kritický obor je pak dá { } Levostraá alterativí hypotéza s < s. = χ ; χ χ ( p; ) Kritickým oborem v tomto případě je { }, kde c (p;) je rove
Oboustraá alterativí hypotéza s π s. Kritický obor je v tomto případě složitější, jde o dva disjuktí itervaly p p ; χ ; = χ ; ; Příklad 7.5 Při kotrolím měřeí byly zjištěy ásledující hodoty,6;,64;,57;,6;,59;,57;,6;,59 za platosti, že středí hodota je rova,5. Rozhoděte, zda je platá : a) H : s =,3 proti H : s π,3 b) H : s =,3 proti H : s <,3. Ověřeí proveďte a hladiě výzamosti 5%. Řešeí: Nejdříve staovíme základí hodoty = 8; X =, 65; s=, 539; s =, 64. Část a) je případem oboustraé hypotézy, staovíme tedy kritický obor pro teto případ. = ; χ p χ p; = ( ;,8) ( 7,535; ). Dále musíme ještě zjistit hodotu testovací statistiky (7.3), po dosazeí vychází c = 3,64. Protože se eachází v kritickém oboru emůžeme hypotézu H zamítout. V případě části b) staovíme opět kritický obor = { χ ; χ χ ( p; ) } = (;.733). Protože hodota testovací statistiky leží i v tomto případě mimo kritický obor emůžeme ai yí hypotézu H zamítout. 7... Při ezámém parametru m Při práci s ezámou populací většiou její středí hodotu m ezáme, proto je více reálý případ, který budeme vyšetřovat v této části. Podle kapitoly 8., v íž jsme probírali bodové odhady je áhodá veličia ( Xi X) χ = ( )., (7.4) typu c s (-) stupi volosti. Podobě jako v předchozí podkapitole tohoto tvrzeí využijeme ke kostrukci vhodé testovací statistiky. Chceme tedy testovat a základě áhodého výběru o prvcích z populace hypotézu H : s = s Jestliže byla středí hodota m populace záma potom vybíráme jako testovací statistiku áhodou veličiu ( Xi X) χ = ( )., (7.5) která má při platosti hypotézy H rozděleí c ( chi kvadrát ) s (-) stupi volosti. Proti předchozí části tedy získáváme statistiku stejého typu, ale protože musíme z dat získávat avíc iformaci o odhadu parametru m je počet stupňů volosti o jede meší.
Podobě jako v předchozích případech můžeme staovovat kritické obory v závislosti a hodotách alterativí hypotézy. Pravostraá alterativí hypotéza s > s. = χ ; χ χ ( p ; ) rove p% kvatilu rozděleí chi kvadrát s (-) stupi volosti. Je zřejmé, že kritický obor je pak dá { } Levostraá alterativí hypotéza s < s. = χ ; χ χ ( p ; ) Kritickým oborem v tomto případě je { } Oboustraá alterativí hypotéza s π s. Kritický obor je v tomto případě složitější, jde o dva disjuktí itervaly p p ; χ ; = χ ; ;, kde c (p;-) je Příklad 7.6 Měřeím jistého výrobku jsme získali ásledující hodoty: 5,5; 5,; 5,4; 5,4; 5,. Předpokládejme, že výsledky těchto měřeí jsou áhodé veličiy N(m,s ). Testujme ásledující případy : a) H : s =,3 a H : s <,3 b) H : s =,3 a H : s π,3 Řešeí: a) Alterativí hypotéza je levostraá, tedy jejím kritickým oborem je = { χ ; χ χ ( p ; ) } = (;,7). Musíme yí zjistit hodotu testovací statistiky z výrazu uvedeém v (7.5). Po dosazeí aměřeých hodot ( Xi X), 96 získáváme χ = ( ). = 7. = 4,5733. Protože tato hodota,3 eleží v kritickém oboru hypotézu H emůžeme zamítout. b) Alterativí hypotéza v tomto případě je oboustraá, kritický obor sestrojíme podle výše uvedeých pravidel. = ( ;,69) ( 6,3; ). Protože ai v tomto případě eleží hodota testovací statistiky v kritickém oboru hypotézu H ezamítáme. V další části se budeme zabývat srováváím dvou áhodých veliči typu N(m,s ). Osvojíme si metody, které se obecě azývají t-test a F-test. V rámci ich jsou velmi výzamým faktorem rozděleí studetovo a Fischer Sedecorovo. 7..3 Testy pro podíl rozptylů Nechť a jsou áhodé výběry z rozděleí N(m ;s ) a N(m ;s ) s počtem čleů výběru resp.. Chceme zjistit itervalový odhad pro podíl rozptylů áhodých veliči
tedy. Při staoveí tohoto itervalového odhadu budeme vycházet z kapitoly 3 ze vztahu (3.). Dále je uto rozlišovat dva růzé případy: Potom je áhodá veličia 7..3. Středí hodoty m a m jsou zámé F = ( X µ ) i. i ( X µ ). je Fischer Sedecorovo rozděleí s ( ; ) stupi volosti. V tomto případě je proto oboustraý (-p) % iterval spolehlivosti rove: ( X i µ ) ( X i µ ).. p Fp ( Xi µ ) ( X i µ ) F < <, (7.6) kde hodoty F p jsou příslušé kvatily rozděleí F( ; ). Z těchto tvrzeí vyjdeme ve staoveí základích hypotéz. Staovujeme hypotézu H : s = s., alterativí hypotézu H staovujeme jako s π s. Za předpokladu, že platí hypotéza H je zřejmě podíl ( X µ ) i i ( X µ ) itervalu Fp; F p. Tedy kritickým oborem je v tomto případě sjedoceí itervalů: W = ; Fp F p;. prvkem
7..3. Středí hodoty m a m jsou ezámé Při tvorbě takového itervalu spolehlivosti vycházíme opět z vlastostí F- rozděleí. Náhodá veličia F = ( X X ) i ( ). s i ( X X ) ( ). s je potom Fischer Sedecorovo rozděleí s ( -; -) stupi volosti. Kostrukce oboustraého ( p )% itervalu spolehlivosti v tomto případě je velmi podobá kostrukci uvedeé v předchozí části : ( X i X) ( X i X) s s.. =. p p p p ( X ) ( i X X i X) =. < < (7.7), F F s F F s kde hodoty F p jsou kvatily F rozděleí s ( -; - ) stupi volosti. Podobě jako v předchozí části staovujeme hypotézu H : s = s., alterativí hypotézu H staovujeme jako s π s. Za předpokladu, že platí hypotéza H je zřejmě podíl ( X X ) i = s i X ( X ) s prvkem itervalu Fp; F p. Tedy kritickým oborem je i v tomto případě sjedoceí itervalů: W = ; Fp F p;. Oba případy se liší použitím áhodých veliči F- rozděleí o růzých stupích volosti. Práce s oběma předchozími hypotézami se obecě azývá F test. Rozhodujeme v ěm o tom, zda můžeme přijmout či vyvrátit rovost s = s a daé hladiě výzamosti. Teto test se užívá velmi často v regresí aalýze, v t testu a v aalýze rozptylu ( ANOVA ). Velmi důležitými parametrickými testy jsou tzv. t testy, pomocí ichž zjišťujeme, zda dvě áhodé veličiy mají stejé středí hodoty. 7..4 Testy o shodě středích hodot dvou ormálích rozděleí Jak už jsme uvedli dříve budeme v této části testovat základí hypotézu H :m = m. Jako alterativí hypotézu můžeme volit buď jedostraé ebo oboustraé hypotézy.
Nechť tedy podobě jako v předchozí části jsou a áhodé výběry z rozděleí N(m ;s ) a N(m ;s ) s počtem čleů výběru resp.. V celé této části budeme vyšetřovat hypotézy a hladiě výzamosti p. V dalším musíme rozlišovat ěkolik růzých případů. 7..4. Rozptyly populací s a s jsou zámé Již z předchozích kapitol je zámo, testové kritérium U = X X + (7.8), je typu N(;). Odtud můžeme odvodit kritické obory pro případy jedotlivých alterativích hypotéz :. H : m > m. W = < u p ; ). H : m < m. W = ( ; u p > 3. H : m m. W = ( ; u > < u ; ) p p Ovšem případy, kdy jsou zámy rozptyly populací jsou velmi řídké, proto větší uplatěí mají testy, kdy příslušé hodoty rozptylů populací ejsou zámy. Příklad 7.7 Rozhoděme a hladiě výzamosti, zda výsledky testů v jedé škole jsou ižší ež výsledky testů ve škole druhé. Provedli jsme áhodý výběr 5 studetů v prví škole a 4 studetů ve škole druhé. Průměré výsledky testů studetů prví školy byly 75 bodů a druhé školy 8 bodů. Z dřívějších testů jsou zámy rozptyly obou škol s = 48 a. Řešeí: Testovaá statistika H : m = m a zřejmě H : m < m. Dosadíme tedy do (7.8) a 75 8 u = = 3,549. Podle předchozího je pro teto případ alterativí hypotézy kritický 48 4 + 5 4 obor W = ( ;,645 >. Hodota testové statistiky patří tedy do kritického oboru, takže zamítáme testovaou hypotézu H a přijímáme hypotézu alterativí tj. výsledky druhé školy mají větší bodové ohodoceí. Příklad 7.8 Rozhoděte a hladiě výzamosti %, zda jsou shodé vzdáleosti dojezdu dvou typů peumatik. Prví typ jsme testovali v 5 kusech a průměrá vzdáleost dojezdu čiila 5 km ; druhý typ jsme testovali 5 kusů s průměrým dojezdem 3 km. Rozptyl dojezdu prví peumatik s = 4 km a druhých peumatik s = 56 km.
Řešeí: Testovaá statistika H : m = m a zřejmě H : m πm. Opět dosadíme do vztahu 5 (7.8) u = = 95,85. Vzhledem k oboustraému testu je hodota 99,5% 4 56 + 5 5 kvatilu N(,) rova,58. Tedy hodota leží v kritickém oboru ( leží v kritickém oboru i pro případ jedostraého testu, kdy m < m ). Proto hypotézu H zamítáme a přijímáme hypotézu H. 7..4. Rozptyly populací jsou ezámé, ale jsou si rovy V tomto případě použijeme opět metodu vedoucí a testovou statistiku: t = X X S ( x). + (7.9) Následující hodota S(x) se azývá společý výběrový rozptyl a je vážeým průměrem výběrových rozptylů S (x) a S (x) s vahami a -, tedy jeho hodota je rova ( ). S ( x) + ( ). S ( x) S( x) = (7.). + Náhodá veličia (7.9) je při platosti H studetovo rozděleí s + stupi volosti. Nyí již tedy můžeme určit kritické obory pro růzé formulace alterativích hypotéz H.. H : m > m. W = <t ; ) + ; p. H : m < m. 3. H : m m. W = ( ; t + p > ; W = ( ; t > < t ; ) p p + ; + ; K tomu abychom mohli rozhodout, že ezámé rozptyly s a s si jsou rovy musíme použít v tomto případě F test viz 7..3. Uvedeme opět ěkolik příkladů pro tuto situaci. Příklad 7.9 Ve dvou prodejách jsme zjišťovali cey určitého typu produktu, získali jsme ásledující výsledky: = 8, x = 4, 74, s = 55,4 = 3, x = 7,97, s = 789,83 Předpokládáme ormalitu uvedeých dat, ověřte shodu středích hodot ce v obou prodejách. Řešeí:
Nejdříve použijeme F test a ověřeí shody rozptylů ce v obou prodejách. Hodota testovací statistiky pro F test je v ašem případě rova 55,4 F = =,63956 789,83 Tato hodota eleží v kritickém oboru F testu. Na hladiě,5 jsme tedy eprokázali to, že by se rozptyly ce v obou prodejách lišily. Nyí tedy využijeme statistiku (7.9) ke staoveí rozdílu mezi středími hodotami. 4,74 7,97 t = =,9796 65,55. + 8 3 Kritické hodota pro oboustraý test je rova,3697. Tedy test eprokázal a hladiě výzamosti,5 mezi ceami žádý rozdíl. Příklad 7. V podiku byly zkoumáy dva odlišé techologické postupy. Máme a hladiě výzamosti,5 zjistit, zda se od sebe liší! Dále ásledují celkem tuy výroby prvím a druhým postupem vždy za jedu směu:.. techologický techologický postup postup 6,3 6,5 5,8 6, 4,9 6,7 5,3 5,8 6 4,5 5,7 5,6 5,4 4,8 6,3 5 5,8 4,9 4,8 4,6 6,7 3,8 5,6 6,3 Řešeí: Prvím krokem bude porováí rozptylů obou techologických postupů. Z daých hodot zjistíme, že s =,5744, = 4; s =, 658, =. Hodota testové,5744 statistiky je proto rova F = =,867555. Tato hodota eleží opět v kritickém, 658 oboru F testu, emůžeme tedy zamítou hypotézu H o rovosti obou rozptylů. Postupujeme jako v předchozím případě, zjistíme hodotu testové statistiky t =,555. Ověříme si kritické hodoty studetova rozděleí s stupi volosti ( jde o oboustraý test ) :,7388. Z těchto hodot vyplývá, že a hladiě výzamosti,5 elze zamítout hypotézu o shodých výsledcích obou techologických postupů.
7..5 Rozptyly ejsou zámé a ejsou si rovy V tomto případě pro malé hodoty a použijeme ásledující postup. Místo předchozího dvouvýběrového t testu používáme jedé z alterativ :. Cochra Coxův test - vypočteme: s s S = +, dále * X Y T = a koečě t S H zamíteme, jestliže T * * s s. ( ). ( α) t α + t * = s s + t ( v tomto případě jde o oboustraý test ).. Hypotézu. Welchův test: Nejdříve určíme aproximaci stupňů volosti s s + NW =, toto číslo většiou zaokrouhlujeme dolu a ejbližší celé kladé s s + číslo. Vypočteme opět * T jako v předchozím způsobu a porováme s N W ( ) t α. 3. Satterthwaiteův test. Opět určíme aproximaci stupňů volosti s s + NS =. Výsledek opět zaokrouhlíme dolu a ejbližší celé kladé s s + + + číslo. Vypočteme opět * T jako v předchozím způsobu a porováme s N S ( ) Hladia každého z těchto tří testů je přibližě rova a. t α. Příklad 7. Pole stejých rozměrů byla upravea dvěma růzými způsoby. Výsledé parametry sklizí jsou ásledující = 3, x = 3, s =, 78; = 59, x = 8,3, s =,56. Zjistěte, zda obě úpravy pole vedou ke stejým výsledkům! Řešeí : Nejdříve určíme hodotu F testu, číselě je rova,48346. Pro daé stupě volosti leží toto číslo v kritickém oboru F testu. Tedy zamítáme hypotézu H o stejých rozptylech. ( p value =,35 ). Budeme tedy určovat hodotu statistiky T* = -78,545. Hodoty jedotlivých t* jsou postupě pro metodu.,95 ; pro metodu.,989 a koečě pro metodu 3.,988. Pokud bychom tedy zvolili libovolou z výše uvedeých metod, dospěli bychom k zamítutí možosti o stejých výsledcích.