Cvičeí 6: Bodové a itervalové odhady středí hodoty, rozptylu a koeficietu korelace, test hypotézy o středí hodotě při zámém rozptylu Příklad : Bylo zkoumáo 9 vzorků půdy s růzým obsahem fosforu (veličia X) Hodoty veličiy Y ozačují obsah fosforu v obilých klíčcích (po 38 dech), jež vyrostly a těchto vzorcích půdy číslo vzorku 2 3 4 5 6 7 8 9 X 4 5 9 3 23 23 28 Y 64 7 54 8 76 93 77 95 09 Těchto 9 dvojic hodot považujeme za realizace áhodého výběru (X,Y ),, (X 9,Y 9 ) z dvourozměrého rozložeí se středími hodotami µ, µ 2, rozptyly 2, 2 2 a koeficietem korelace ρ Najděte bodové odhady těchto číselých charakteristik, tj realizace výběrových průměrů, výběrových rozptylů a výběrového koeficietu korelace : Otevřeme datový soubor fosforsta o dvou proměých X a Y 9 případech V proměé X jsou zjištěé hodoty obsahu fosforu v půdě a v Y v obilých klíčcích Výpočet výběrových průměrů a výběrových rozptylů: Statistiky Základí statistiky/tabulky Popisé statistiky OK Proměé X, Y a záložce Detailí výsledky vybereme Průměr, Rozptyl Výpočet Dostaeme tabulku: Popisé statistiky (fosforsta) Proměá Průměr Rozptyl X 3 9,75 Y 80 284,25 Vidíme, že výběrové průměry veliči X, Y se realizují hodotami 3 a 80, výběrové rozptyly pak abývají hodot 9,75 a 284,25 Výpočet výběrového koeficietu korelace: Aktivujeme Popisé statistiky Storo Korelačí matice OK 2 sezamy sezam proměých X, 2 sezam proměých Y OK Výpočet Korelace (fosforsta) Ozač korelace jsou výzamé a hlad p <,05000 N=9 (Celé případy vyecháy u ChD) Proměá Y X 0,804989 Výběrový koeficiet korelace veliči X, Y abyl hodoty 0,805, tedy mezi veličiami x, Y existuje silá přímá lieárí závislost
Vzorce pro meze 00(-α)% empirického itervalu spolehlivosti pro středí hodotu µ ormálího rozložeí při zámém rozptylu 2 : Oboustraý: d = m u α / 2, h = m + u α / 2 Levostraý: d = m u α, pravostraý: h = m + u α Příklad 2: Při kotrolích zkouškách životosti žárovek byl staove odhad m = 3000 h středí hodoty jejich životosti Z dřívějších zkoušek je zámo, že životost žárovky se řídí ormálím rozložeím se směrodatou odchylkou = h Vypočtěte a) 99% empirický iterval spolehlivosti pro středí hodotu životosti b) 90% levostraý empirický iterval spolehlivosti pro středí hodotu životosti c) 95% pravostraý empirický iterval spolehlivosti pro středí hodotu životosti Upozorěí: Výsledek zaokrouhlete a jedo desetié místo a vyjádřete v hodiách a miutách Řešeí: ad a) d = m u 0, 995 = 3000 2,57583 = 2987,, h = m + u 0, 995 = 3000 + 2,57583 = 302,9 2987 h a 6 mi < µ < 302 h a 54 mi s pravděpodobostí 0,99 Otevřeme ový datový soubor o dvou proměých d, h a jedom případu Do Dlouhého jméa proměé d apíšeme vzorec =3000-/sqrt()*VNormal(0,995;0;) Do Dlouhého jméa proměé h apíšeme vzorec =3000+/sqrt()*VNormal(0,995;0;) ad b) d = m u 0, 9 = 3000,2855 = 2993,6 2993 h a 36 mi < µ s pravděpodobostí 0,9 Otevřeme ový datový soubor o jedé proměé d a jedom případu Do Dlouhého jméa proměé d apíšeme vzorec =3000-/sqrt()*VNormal(0,9;0;) ad c) h = m + u 0, 975 = 3000 +,95996 = 3009,8 3009 h a 48 mi > µ s pravděpodobostí 0,95 Otevřeme ový datový soubor o jedé proměé h a jedom případu Do Dlouhého jméa proměé h apíšeme vzorec =3000+/sqrt()*VNormal(0,975;0;) Užitečý odkaz: a adrese http://wwwprevody-jedotekcz je program, s jehož pomocí lze převádět růzé fyzikálí jedotky, v ašem případě hodiy a miuty
Základí pozatky o testováí hypotéz Předpokládáme, že testujeme ulovou hypotézu H 0 : h( ϑ ) = c, kde c R buď proti oboustraé alterativě H : h( ϑ ) c ebo proti levostraé alterativě H : h( ϑ ) < c ebo proti pravostraé alterativě H : h( ϑ ) > c Testováí pomocí kritického oboru Najdeme testovou statistiku T 0 = T 0 (X,, X ) Možia všech hodot, jichž může testová statistika abýt, se rozpadá a obor ezamítutí ulové hypotézy (začí se V) a obor zamítutí ulové hypotézy (začí se W a azývá se též kritický obor) W a V jsou odděley kritickými hodotami (pro daou hladiu výzamosti α je lze ajít ve statistických tabulkách) Jestliže číselá realizace t 0 testové statistiky T 0 pade do kritického oboru W, pak ulovou hypotézu zamítáme a hladiě výzamosti α a zameá to skutečé vyvráceí testovaé hypotézy Jestliže t 0 pade do oboru ezamítutí V, pak jde o pouhé mlčeí, které platost ulové hypotézy jeom připouští Staoveí kritického oboru pro daou hladiu výzamosti α: Ozačme t mi (resp t max ) ejmeší (resp ejvětší) hodotu testového kritéria Kritický obor v případě oboustraé alterativy má tvar W = ( t mi, K α / 2 (T) K α / 2 (T), t max ), kde K α/2 (T) a K -α/2 (T) jsou kvatily rozložeí, jímž se řídí testové kritérium T 0, je-li ulová hypotéza pravdivá Kritický obor v případě levostraé alterativy má tvar: W = ( t mi,k α (T) Kritický obor v případě pravostraé alterativy má tvar: W = K α (T), ) t max Testováí pomocí itervalu spolehlivosti Sestrojíme 00(-α)% empirický iterval spolehlivosti pro parametrickou fukci h( ϑ ) Pokryje-li teto iterval hodotu c, pak H 0 ezamítáme a hladiě výzamosti α, v opačém případě H 0 zamítáme a hladiě výzamosti α Pro test H 0 proti oboustraé alterativě sestrojíme oboustraý iterval spolehlivosti Pro test H 0 proti levostraé alterativě sestrojíme pravostraý iterval spolehlivosti Pro test H 0 proti pravostraé alterativě sestrojíme levostraý iterval spolehlivosti Testováí pomocí p-hodoty p-hodota udává ejižší možou hladiu výzamosti pro zamítutí ulové hypotézy: je-li p α, pak H 0 zamítáme a hladiě výzamosti α, je-li p > α, pak H 0 ezamítáme a hladiě výzamosti α Způsob výpočtu p-hodoty: Pro oboustraou alterativu p = 2 mi{p(t 0 t 0 ), P(T 0 t 0 )} Pro levostraou alterativu p = P(T 0 t 0 ) Pro pravostraou alterativu p = P(T 0 t 0 )
Příklad 3: Víme, že výška hochů ve věku 9,5 až 0 let má ormálí rozložeí s ezámou středí hodotou µ a zámým rozptylem 2 = 39,2 cm 2 Dětský lékař áhodě vybral 5 hochů uvedeého věku, změřil je a vypočítal realizaci výběrového průměru m = 39,3 cm Podle jeho ázoru by výška hochů v tomto věku eměla přesáhout 42 cm s pravděpodobostí 0,95 Lze tvrzeí lékaře akceptovat? Řešeí: Testujeme H 0 : µ = 42 proti H : µ < 42 (to je tvrzeí lékaře) a hladiě výzamosti 0,05 a) Test provedeme pomocí kritického oboru Pro úlohy o středí hodotě ormálího rozložeí při zámém rozptylu používáme pivotovou M µ M c statistiku U = ~ N(0, ) Testová statistika tedy bude T0 = a bude mít rozložeí N(0, ), pokud je ulová hypotéza pravdivá Vypočítáme realizaci testové statistiky: 39,3 42 t 0 = =, 7773 39,2 5 Staovíme kritický obor: W = ( u = (,u = (, u = (,, 6449 α, 0,05 0, 95 Protože -,7773 W, H 0 zamítáme a hladiě výzamosti 0,05 Tvrzeí lékaře lze tedy akceptovat s rizikem omylu 5 % Otevřeme ový datový soubor o dvou proměých t0 a kvatil a jedom případu Do Dlouhého jméa proměé t0 apíšeme =(39,3-42)/sqrt(39,2/5) Do Dlouhého jméa proměé kvatit apíšeme =VNormal (0,05;0;) Dostaeme tabulku: t0 2 kvatil -,7773482 -,6448536 Protože se testová statistika realizuje v kritickém oboru, ulovou hypotézu zamítáme a hladiě výzamosti 0,05 b) Test provedeme pomocí itervalu spolehlivosti Meze 00(-α)% empirického pravostraého itervalu spolehlivosti pro středí hodotu µ při zámém rozptylu 2 jsou: (-, h) = (-, m + u-α ) 39,2 39,2 V ašem případě dostáváme: h = 39,3 + u 0,95 = 39,3 +,645 = 4,79 5 5 Protože 42 (- ; 4,79), H 0 zamítáme a hladiě výzamosti 0,05 Otevřeme ový datový soubor o jedé proměé h a jedom případu Do Dlouhého jméa proměé h apíšeme =39,3+sqrt(39,2/5)*VNormal(0,95;0;) h 4,786052 Protože číslo 42 epatří do itervalu (- ; 4,79), H 0 zamítáme a hladiě výzamosti 0,05
c) Test provedeme pomocí p-hodoty p = P(T 0 t 0 ) = Φ(-,7773) = 0,0378 Jelikož 0,0378 0,05, ulovou hypotézu zamítáme a hladiě výzamosti 0,05 Otevřeme ový datový soubor o jedé proměé p a jedom případu Do Dlouhého jméa proměé p apíšeme =INormal(-,7773;0;) p 0,03775945 Protože p-hodota je meší ež 0,05, H 0 zamítáme a hladiě výzamosti 0,05