Testování hypotéz. 3.1 Základní pojmy a obecný postup při testování

Podobné dokumenty
Testování statistických hypotéz

a další charakteristikou je četnost výběrového souboru n.

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

Mendelova univerzita v Brně Statistika projekt

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 2

PRAVDĚPODOBNOST A STATISTIKA

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i

Přednáška č. 10 Analýza rozptylu při jednoduchém třídění

, jsou naměřené a vypočtené hodnoty závisle

Ilustrativní příklad ke zkoušce z B_PS_A léto 2013.

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

Nejistoty měření. Aritmetický průměr. Odhad směrodatné odchylky výběrového průměru = nejistota typu A

12. Neparametrické hypotézy

Odhady parametrů 1. Odhady parametrů

8. Zákony velkých čísel

Spolehlivost a diagnostika

Test dobré shody se používá nejčastěji pro ověřování těchto hypotéz:

3. Hodnocení přesnosti měření a vytyčování. Odchylky a tolerance ve výstavbě.

14. Testování statistických hypotéz Úvod statistické hypotézy Definice 14.1 Statistickou hypotézou parametrickou neparametrickou. nulovou testovanou

Úvod do korelační a regresní analýzy

Metody zkoumání závislosti numerických proměnných

Intervalové odhady parametrů některých rozdělení.

Intervalový odhad. nazveme levostranným intervalem pro odhad parametru Θ. Statistiku. , kde číslo α je blízké nule, nazveme horním

5.5. KOMPLEXNÍ ODMOCNINA A ŘEŠENÍ KVADRATICKÝCH A BINOMICKÝCH ROVNIC

PRAVDĚPODOBNOST A STATISTIKA

1.1 Rozdělení pravděpodobnosti dvousložkového náhodného vektoru

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

Náhodný výběr 1. Náhodný výběr

Úvod do teorie měření

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

Odhady a testy hypotéz o regresních přímkách

Generování dvojrozměrných rozdělení pomocí copulí

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

Pravděpodobnost a aplikovaná statistika

PRAVDĚPODOBNOST A STATISTIKA

Náhodné jevy, jevové pole, pravděpodobnost

8. Analýza rozptylu.

PRAVDĚPODOBNOST A STATISTIKA. Bodové a intervalové odhady

Chyby přímých měření. Úvod

9. Měření závislostí ve statistice Pevná a volná závislost

12. N á h o d n ý v ý b ě r

Testování statistických hypotéz

P1: Úvod do experimentálních metod

4.2 Elementární statistické zpracování Rozdělení četností

jsou varianty znaku) b) při intervalovém třídění (hodnoty x

PRAVDĚPODOBNOST A STATISTIKA

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

[ jednotky ] Chyby měření

Pravděpodobnost a aplikovaná statistika

VYSOCE PŘESNÉ METODY OBRÁBĚNÍ

NEPARAMETRICKÉ METODY

Přednáška V. Úvod do teorie odhadu. Pojmy a principy teorie odhadu Nestranné odhady Metoda maximální věrohodnosti Průměr vs.

Univerzita Karlova v Praze Pedagogická fakulta

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA

Přednáška č. 2 náhodné veličiny

Přednáška VIII. Testování hypotéz o kvantitativních proměnných

Intervalové odhady parametrů

UNIVERZITA JANA EVANGELISTY PURKYNĚ V ÚSTÍ NAD LABEM PEDAGOGICKÁ FAKULTA Katedra tělesné výchovy

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

7 LIMITNÍ VĚTY. Čas ke studiu kapitoly: 70 minut. Cíl:

VY_52_INOVACE_J 05 01

8. Odhady parametrů rozdělení pravděpodobnosti

14. B o d o v é o d h a d y p a r a m e t r ů

STATISTICKÁ ANALÝZA. Doc. RNDr. Zden k Karpíšek, CSc. P ehledový u ební text pro doktorské studium. Vysoké u ení technické v Brn

Mezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby.

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor

V. Normální rozdělení

- metody, kterými lze z napozorovaných hodnot NV získat co nejlepší odhady neznámých parametrů jejího rozdělení.

Výstup a n. Vstup. obrázek 1: Blokové schéma a graf paralelní soustavy

UČEBNÍ TEXTY OSTRAVSKÉ UNIVERZITY. Přírodovědecká fakulta ANALÝZA DAT. 2. upravené vydání. Josef Tvrdík

3. Lineární diferenciální rovnice úvod do teorie

8.2.1 Aritmetická posloupnost I

Deskriptivní statistika 1

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

Statistika - vícerozměrné metody

Doc. Ing. Dagmar Blatná, CSc.

8.2.1 Aritmetická posloupnost

veličiny má stejný řád jako je řád poslední číslice nejistoty. Nejistotu píšeme obvykle jenom jednou

8 NELINEÁRNÍ REGRESNÍ MODELY

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor

Testy statistických hypotéz

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

Spojitost a limita funkcí jedné reálné proměnné

11. Časové řady Pojem a klasifikace časových řad

Téma 4: Výběrová šetření

APLIKOVANÁ STATISTIKA

Metody statistické analýzy. doc. Ing. Dagmar Blatná, CSc.

Náhodný výběr, statistiky a bodový odhad

Pravděpodobnost a aplikovaná statistika

UPLATNĚNÍ ZKOUŠEK PŘI PROHLÍDKÁCH MOSTŮ

0,063 0,937 0,063 0, P 0,048 0,078 0,95. = funkce CONFIDENCE.NORM(2α; p(1 p)

14. Korelace Teoretické základy korelace Způsoby měření závislostí pro různé typy dat

1.1 Definice a základní pojmy

Statistika. Jednotlivé prvky této množiny se nazývají prvky statistického souboru (statistické jednotky).

2. Vícekriteriální a cílové programování

Výukový modul III.2 Inovace a zkvalitnění výuky prostřednictvím ICT

Transkript:

Lekce 3 Testováí hypotéz Vlajkovou lodí matematcké statstky jsou techky testováí hypotéz. Formulace hypotéz a jejch ověřováí jsou základím mechasmem postupu ldského pozáí. Pokud jsou formace, potřebé k ověřeí hypotézy, čerpáy z áhodého výběru z rozděleí pravděpodobost áhodé velčy, jde o statstcké hypotézy, které jsou vyslovováy o parametrech rozděleí áhodých velč, o jejch ezávslost, o tvaru rozděleí, o odlehlých hodotách atd. atd. Jž ěkolkrát jsme se zmňoval o tom, že slyší-l lak parametr rozděleí áhodé velčy, domívá se zpravdla, že jde o pojem, který emá žádou souvslost s praktckým žvotem. Ovšem řada hodot, které lak vímá jako kostaty typcky možství výrobku v obalu, rozměr součástky apod. jsou ve skutečost áhodé velčy ( když s poměrě epatrou varabltou). Sestrojt apř. plcí lku, která by plla do obalu kostatí možství výrobku, stejě jako obráběcí stroj, produkující absolutě detcké obrobky, je emožé. Musíme se tedy spokojt s tím, že kol jedotlvé realzace, ale příslušé středí hodoty, rozptyly apod. je třeba mít pod maxmálí kotrolou, eboť rozhodují o kvaltě č jakost výrobků, využtí systémů hromadé obsluhy a v moha dalších stuacích. alteratví hypotéza; dvouvýběrové testy; hlada výzamost; homogeta rozptylů; chyba druhého druhu; chyba prvího druhu; jedoduchá hypotéza; jedostraá hypotéza; jedovýběrové testy; krtcký obor; eparametrcký test; evýzamý rozdíl; ulová hypotéza; obor přjetí ; oboustraá hypotéza; odlehlá hodota; síla testu; složeá hypotéza; test dobré shody; testovaá hypotéza; testováí; testové krtérum; vysoce výzamý rozdíl; výzamý rozdíl; zamítutí; zaméková metoda 3. Základí pojmy a obecý postup př testováí Statstckou hypotézou rozumíme předpoklad o určtých vlastostech áhodé velčy (o úrov, varabltě, ezávslost dvou áhodých velč, o zákou rozděleí) vysloveý ezávsle a evetuálích formacích o í. Příklady statstckých hypotéz áhodý výběr pochází z rozděleí áhodé velčy, jejíž parametr je rove předpokládaé hodotě c, dva áhodé výběry pochází z rozděleí áhodých velč se stejou hodotou parametrů, dvě áhodé velčy jsou ezávslé, počet vadých výrobků v dodávce epřesahuje číslo c, áhodý výběr pochází z rovoměrého (Possoova apod.) rozděleí. Praktcký výzam ověřováí takovýchto tvrzeí (zdálvě od žvota odtržeých) v růzých oblastech vědy praxe je začý. Jako adekvátí příklad lze uvést apř. statstckou přejímku. Prot testovaé (také ulové) hypotéze stavíme její protklad alteratví hypotézu (apř. parametr eí rove předpokládaé hodotě c, áhodé velčy ejsou ezávslé, áhodá velča emá rovoměré rozděleí). Smyslem testováí hypotéz je zamítutí ulové hypotézy a přjetí hypotézy alteratví. Pouze v tomto případě, kdy se testovaá hypotéza ukáže jako eudržtelá, lze hovořt o jedozačém výsledku testu. Pokud se ulovou hypotézu epodaří zamítout, elze to považovat za důkaz její správost, eboť současě lze zpravdla sestrojt ekoečě moho dalších (růzých) ulových hypotéz,

které by společě s původí za daých okolostí zůstaly rověž ezamítuty. Testy vycházející z tohoto prcpu azýváme testy výzamost a pouze těmto testy se adále budeme zabývat. Vzhledem k tomu, že př testováí hypotéz jsme odkázá a formace z áhodého výběru, exstuje rzko, že výsledek testu ebude v souladu s realtou. Tuto problematku budeme řešt zaedlouho. Obecý postup testováí hypotéz Formulace testovaé (ulové) hypotézy H a alteratví hypotézy H. Např. testovaou (ulovou) hypotézu, že plcí lka je správě astavea, budeme formulovat jako H : µ c (kde c je požadovaé možství výrobku v obalu), kdežto alteratvu můžeme zformulovat růzě apř. jako H : µ c plcí lka je esprávě astavea, jako H : µ < c lka plí meší možství případě H : µ > c lka plí větší možství. Hypotézu, která obsahuje pouze jede možý případ (takovou hypotézou je právě testovaá hypotéza obsahující ), ozačíme jako jedoduchou. Alteratví hypotéza je aprot tomu hypotézou složeou, a to buď oboustraou ( ) ebo jedostraou (>, <). V souvslost s tím se hovoří též o jedostraých a oboustraých testech. Podobě jako u kofdečích tervalů je vhodý tvar alteratví hypotézy odvoze od kokrétího zadáí úlohy. Najděte možé sloví vyjádřeí a terpretac hypotéz H : θ c; H : θ c! Volba hlady výzamost. Hlada výzamost je pravděpodobost (rzko) esprávého zamítutí pravdvé ulové hypotézy. Tuto pravděpodobost lze (a rozdíl od pravděpodobost esprávého ezamítutí epravdvé hypotézy) předem zvolt. Praktcky se hlada výzamost často volí a hodotách,5;, (tj. stejě jako rzko odhadu), případě podle okolostí jak. Získáí formací z výběru a výpočet hodoty testového krtéra. Testové krtérum je áhodá velča statstka, jejíž rozděleí pravděpodobost za předpokladu platost ulové hypotézy je zámo. Jsou tedy zámy jeho kvatly, resp. pravděpodobost, že se testové krtérum odchýlí od své předpokládaé hodoty o více, ež je lbovolá zadaá hodota. Vraťte Obvyklým testovým krtér jsou velčy s ormovaým ormálím, Studetovým, Pearsoovým ebo Fsherovým Sedecorovým rozděleím. se k prví lekc a odpovězte a otázku, které z dále uvedeých ulových hypotéz lze/elze testovat pomocí právě uvedeých rozděleí: H : θ θ; H : ; H :. Nevyhovující µ hypotézy se pokuste přeformulovat do takového tvaru, aby byly ověřtelé. (3 ) Některé testy ovšem vyžadují kostrukc specálích testových krtérí. Obor hodot testového krtéra, do kterého př platost ulové hypotézy a zvoleé hladě výzamost krtérum padá praktcky jstě tj. s pravděpodobostí, azýváme oborem přjetí (správěj však oborem ezamítutí) testovaé hypotézy. Doplňkem oboru přjetí je tzv. krtcký obor, v ěmž je výskyt testového krtéra za předpokladu platost testovaé hypotézy jevem praktcky emožým. Pokud se v ěm tedy hodota testového krtéra přesto achází, svědčí to s velkou pravděpodobostí o její eudržtelost a ve prospěch alteratví hypotézy. Hrace krtckého oboru tvoří tzv. krtcké hodoty, které jsou zároveň kvatly rozděleí testového krtéra. U oboustraých testů, a které se až a ezbyté výjmky omezíme, je krtcký obor testového krtéra tvoře vždy dvěma samostatým tervaly, které ohračují % a ( )% kvatly testového krtéra. Pokud má testové krtérum apř. µ 3

Obr. 3. Krtcký obor testového krtéra U φ(u).4. Obor přjetí Krtcký obor rozděleí N [ ; ], je krtcký obor oboustraého testu př hladě výzamost, 5 tvoře všem hodotam testového krtéra, které (vz obr. 3.) buď edosahují krtcké hodoty u u u,975, 96 ebo přesahují krtckou hodotu u u +, 96.,975-3 u - u u Pomocí tabulek kvatlů Studetova rozděleí porovejte právě uvedeé hrace s hracem krtckého oboru př oboustraém testu pro rozsah výběru 5,,5,, 3! Hypotézy, ke kterým elze sestrojt testové krtérum se zámým zákoem rozděleí, elze testovat. Iterpretace výsledků testováí. Jedozačým výsledkem testu je zamítutí testovaé hypotézy a přjetí hypotézy alteratví. Pokud je předmětem testováí rozdíl skutečé a předpokládaé hodoty parametru, hovoří se v tomto případě o prokázáí výzamého (a hladě, 5 ), resp. vysoce výzamého (, ), rozdílu. Pokud exstující rozdíl epostačí k zamítutí ulové hypotézy, hovoří se o statstcky evýzamém rozdílu. Protože jsme př testováí odkázá a formace z áhodého výběru, je přrozeé, že výsledek testu emusí být vždy v souladu se skutečostí. Nastae-l případ, že testovaá hypotéza je sce pravdvá, ale hodota testového krtéra přesto pade do krtckého oboru, dojde k eoprávěému zamítutí testovaé hypotézy k chybě prvího druhu. Pravděpodobost tohoto výsledku je předem zámá a dokoce voltelá jde o pravděpodobost odpovídající zvoleé hladě výzamost. Nastae-l opačý případ, tj. že testovaá hypotéza eí pravdvá, ale testové krtérum přesto epade do krtckého oboru, dojde k eoprávěému ezamítutí epravdvé testovaé hypotézy chybě druhého druhu. Zatímco pravděpodobost chyby prvího druhu je předem zámá a voltelá, lze pravděpodobost chyby druhého druhu β staovt (ejde o trválí problém) až po zámém výsledku testu. Tato pravděpodobost je totž promělvá a avíc epřímo úměrá pravděpodobost chyby prvího druhu (čím žší, tím vyšší β ). Zvažte Sestavte čtyřpolí tabulku, jejíž řádky obsahují výrok o testovaé hypotéze (pravda/epravda) a sloupce možé výsledky testu (zamítutí/ezamítutí). Ozačte pole obsahující výsledek, který je v souladu se skutečostí a lokalzujte v tabulce chybu prvího a druhého druhu. terpretac rzka, pokud testovací procedurou je statstcká přejímka. Čí rzko představují pravděpodobost chyby prvího a druhého druhu? (3 ) Velm důležtou kategorí je síla testu β, což je pravděpodobost oprávěého zamítutí testovaé hypotézy. Problematkou síly testů se kvůl její áročost zabývat ebudeme, ale musíme alespoň upozort a to, že je-l rozdíl skutečé a předpokládaé hodoty parametru (apř. µ,, θ 4

apod.) malý, je př malém rozsahu výběru velm obtížé hypotézu zamítout (síla testu je malá a reálě hrozí, že epravdvá hypotéza zůstae ezamítuta). Opačým případem je stuace, kdy př extrémě vysokém rozsahu výběru (takové případy se stávají, typcky apř. př testováí hypotéz o tvaru rozděleí) je každý sebemeší rozdíl bezdůvodě dková jako výzamý a pravdvou hypotézu tedy elze ezamítout. V souvslost s chybam př testováí s můžeme položt otázku, co můžeme očekávat př mohoásobém opakovaém prováděí statstckého testu. Př jedotlvých pokusech je pravděpodobost, že se dopustíme chyby prvího a druhého druhu, dáa pravděpodobostm, β a užvatel (pokud jsou tyto pravděpodobost malé) vůbec emusí kalkulovat s tím, že se těchto chyb skutečě dopustí. Př mohoásobém opakováí určtého testu je aopak praktcky jsté, že % výsledků bude esprávých z ttulu eoprávěého zamítutí pravdvé hypotézy a β % výsledků bude esprávých z ttulu ezamítutí epravdvé hypotézy (které výsledky to kokrétě jsou, se pochoptelě kdy edozvíme). 3. Jedovýběrové testy o parametrech rozděleí Veškeré potřebé údaje o ěkterých ejfrekvetovaějších testech shromáždíme do tabulky. Tvar alteratvích hypotéz a krtckých oborů vypovídá o tom, že jde o oboustraé testy. Tab. 3. Přehled jedovýběrových testů Hypotéza H H Testové krtérum Krtcký obor Stupě volost Podmíky testu µ c µ c U X c u > < u x Zámé ebo > 3 µ c µ c X c t S t > < t Nezámé a 3 c c θ c θ c χ ( ) S c (; χ > < χ p c U u ; c( c) ) > < u x x c ( c) > 9 Příklad 3. Vrátíme se yí k příkladu. ( se žárovkam) a ověříme hypotézu, že tvrzeí výrobce o středí hodotě žvotost je pravdvé, tj. H : µ 4 prot alteratvě H : µ 4. Zvolíme obě obvyklé hlady výzamost (tj.,5,). Výběr v úloze. má 5, x, 46. 4 Realzace testového krtéra u 4, 44. 46 5 s 5

t ±, 975 ± t. ±, 995 ± Hrace krtckého oboru pro,5 [ 4], 64 pro, [ 4], 797 Testové krtérum spadá do krtckého oboru př obou hladách výzamost. Testovaou hypotézu tedy a obou hladách zamítáme, přjímáme hypotézu alteratví. Rozdíl mez udávaou a skutečou žvotostí můžeme ozačt za vysoce výzamý. K jakému výsledku bychom dospěl, pokud bychom rozhodoval a základě výběru pouhých pět (osm) žárovek? Všechy ostatí hodoty zůstaou zachováy. (3 3) Pokud jste počítal správě, vdíte, že stejý rozdíl můžeme podle okolostí prohlást za evýzamý, výzamý ebo vysoce výzamý. Důležtou rol př tom sehrává rozsah výběru. Čím je rozsah výběru meší, tím je obtížější testovaou hypotézu zamítout. Př tom roste pravděpodobost, že se dopustíme chyby druhého druhu. T c Je korektí zapsat všecha testová krtéra v tabulce 3. obecě jako? Přpomeňte s př D( T ) této příležtost výzam symbolů T, D( T ). (3 4) Př podrobějším srováí výsledků úlohy. a 3. bychom dovodl, že exstuje vzájemě jedozačý vztah mez kofdečím tervalem a testem hypotézy, který můžeme formulovat takto: Je-l a hladě výzamost testovaá hypotéza o ezámém parametru H : Θ c zamítuta, pak kofdečí terval př rzku eobsahuje číslo c, a aopak. Nelze však prohlást, že jde o zbytečé zdvojeí problematky. Ne ke všem testům hypotéz totž odpovídající kofdečí tervaly exstují. Než postoupíte dál, vypočtěte ve cvčeí k této lekc úlohy a! Počítačové řešeí Uvádíme ukázku řešeí testu hypotézy H : µ 7 prot alteratvě H : µ 7 př ezámém (pro teto test se obecě vžl ázev t test ) Průměr Směrodatá odchylka Směrodatá chyba Proměá 7,7,6364,575 Zadaá hodota 7, t-statstka,357 Stupě volost 9, dvoustraá pravděpodobost,9 Rozdíl mez průměry,7 95% kofdečí terval -,476 <>,876 Rozsah výběru, Výběrový rozptyl,6778 Síla testu,866 Výzamost,95 - ebo -straý test, Mmálí rozlštelý rozdíl,7 Vdíme, že a rozdíl od ám prezetovaého postupu (vedle toho, že program poskytuje podstatě více formací, včetě síly testu, která mmochodem eí vysoká) se zde esrovává vypočteá hodota t s hodotam tabulkovým, ale počítá se pravděpodobost, s jakou se může vyskytout odchylka,7 za předpokladu platost testovaé hypotézy. Vzhledem k tomu, že tato pravděpodobost je poměrě vysoká (,9), hypotézu v tomto případě elze zamítout. Pravděpodobost chyby druhého druhu je ovšem,866,934, tedy poměrě vysoká. Lze apř. vypočítat, že za jak stejých podmíek by pro dosažeí síly testu β, 9 byl třeba výběr o rozsahu 6 (zatímco v ašem příkladu to bylo je deset). 6

3.3 Dvouvýběrové testy o parametrech rozděleí Všechy údaje o těchto testech opět prezetujeme v podobě tabulky (3.). Podoba alteratví hypotézy a jí odpovídající vymezeí krtckého oboru odpovídají oboustraým testům. Nejpoužívaější je test hypotézy H µ µ, u kterého přchází v úvahu tyto varaty: : Dva ezávslé výběry buď se zámým rozptyly, (případě s extrémě vysokým rozahy výběrů, ) ebo s ezámým rozptyly, které jsou ahrazey bodovým odhady, S S. Pokud tyto výběrové rozptyly evedou k zamítutí hypotézy, jde o ezamítutí hypotézy o homogetě rozptylů. V tom případě má testové krtérum počet stupňů volost +. Pokud je hypotéza o homogetě rozptylů zamítuta, jde o případ ehomogeích rozptylů. V tomto případě má testové krtérum rozděleí s tzv. redukovaým počtem stupňů volost (způsob výpočtu euvádíme, je možo ho dohledat v příslušé lteratuře a my se tomuto případu vyheme). Dva závslé výběry s párově uspořádaým dvojcem měřeí x, y (kdy ). V tomto případě ahrazujeme zjštěé hodoty jejch rozdíly ve dvojcích d x y a d d, sd ( d d ). U testu hypotézy má krtcký obor je jedu část. Nejde o to, že by se jedalo o jedostraý test, ale druhou část krtckého oboru eí třeba vyšetřovat z toho důvodu, že testové krté- rum je kostruováo tak, aby výsledek ebyl meší ež jeda (větší rozptyl dělíme meším). Příklad 3. V ávazost a příklad.5 provedeme test homogety rozptylů a hladě výzamost,5 a,. Použjeme údaje z příkladu.5.. Hypotézu o homogetě rozptylů te-,3 F,35 F,975 F,5 dy ezamítáme. Příklad 3.3 [ 4;],48 [ 4;] 3,,995 V ávazost a příklad.4 (poté, co jsme se přesvědčl o homogetě rozptylů) ověříme shodu astaveí lek. Údaje opět budeme čerpat z příkladu.4. Rozptyly považujeme za ezámé a homogeí. 5 498 t 5,3 t,975[ 44] u,975,96 t,995[ 44] u, 995, 576. 5 + 4,3 +,5 5 5 + Hypotézu tedy zamítáme a rozdíl v astaveí obou lek považujeme za vysoce výzamý. Výsledek tedy opět korespoduje s příslušým kofdečím tervalem z příkladu.4. Než postoupíte dál, vypočtěte ve cvčeí k této lekc úlohy 3 a 4! 7

Tab. 3. Přehled dvouvýběrových testů Hypotéza H H Testové krtérum Krtcký obor Stupě volost Podmíky testu µ µ µ µ U X X + u > < u x Nezávslé výběry, zámé rozptyly ebo velké rozsahy výběrů µ µ µ µ t + ( X X ) S + ( ) S + t > < t + Nezávslé výběry, ezámé homogeí rozptyly µ µ µ X X t > < t redukovaé Nezávslé výběry, ezámé ehomogeí rozptyly µ t S + S D E ( D) E ( D) t S( D) t > < t Párově uspořádaé výběry, D X Y S F S < F ; Test homogety rozptylů θ θ θ θ U ( p p p + p )( p ( + ) p ) u > < u x Velké rozsahy výběrů 8

3.4 Testováí shody rozděleí (ukázka) Náhodý výběr z rozděleí pravděpodobost může být malého rozsahu (v tom případě bude zpravdla etříděý) ebo velkého rozsahu, přčemž může být tříděý ebo etříděý. Probereme pouze případ výběru velkého rozsahu, tříděého do k tříd. Testuje se hypotéza, že hodoty jsou áhodým výběrem z určtého rozděleí pravděpodobost. Pokud jsou zámy parametry tohoto rozděleí, hovoříme o úplě specfkovaém problému, pokud parametry rozděleí ezáme, jde o eúplě specfkovaý problém. Prcp testu spočívá v obou případech v tom, že pozorovaé (emprcké, skutečé) četost (,,..., k) v jedotlvých třídách se porovávají s četostm očekávaým (vypočteým, teoretckým), staoveým pro příslušé rozděleí pravděpodobost áhodé velčy. Testovým krtérem je velča χ k ( ), která má za předpokladu platost testovaé hypotézy Pearsoovo rozděleí s počtem stupňů volost, který je u úplě specfkovaého problému, kdy jsou zámy parametry, dá jako k, u eúplě specfkovaého problému, kdy je třeba z výběru ejprve odhadout parametry rozděleí a teprve pak určovat příslušé teoretcké četost, rove k p, kde p je počet odhadovaých parametrů. Podmíkou použtí Pearsoova rozděleí je > 5 ve všech třídách. V případě, že tato podmíka eí splěa, je třeba sousedí třídy spojt, čímž dojde k poklesu počtu stupňů volost testového krtéra. Příklad 3.4 Ověříme hypotézu, že výběr o rozsahu 8 tříděý do k 5tříd, pochází z rovoměrého rozděleí R ;. Oba parametry považujeme za zámé,, 5. Řešeí vz pracoví tabulka 3.3. [ ] Tab. 3.3 Pracoví tabulka k testu dobré shody Vymezeí Emprcká Teoretcká ( ) Itervalu četost četost ;) 6,565 ;4) 6, 4 ;6) 4 6,5 6 ;8) 6 6, 8 ;) 9 6,565 Součet 8 8 3,375 Vypočteá hodota χ 3, 375. χ. Tabulková hodota [ 4] 9 49, 95, Hypotézu tedy eí možo zamítout. Nejčastěj se pomocí testů shody rozděleí (kterých je velký počet vz růzé stuace azačeé a začátku tohoto odstavce) ověřuje ormalta rozděleí pravděpodobost áhodé velčy. Teoretcké četost se staovují pro dskrétí áhodou velču jako souč rozsahu výběru a hodoty pravděpodobostí fukce P(x), pro spojtou áhodou velču F( x ), další hodoty jsou pak staovey jako ( F( x ) F( x )) a posledí hodota k ( F( xk )), kde F (x) je dstrbučí fukce. 9

Krtcký obor tohoto testu je moža všech hodot testového krtéra, které přesahují hodotu ( )% kvatlu rozděleí χ teto test exstuje je jako jedostraý (žádé rozděleím emůže z prcpu být apř. rovoměrější ež rozděleí rovoměré). Test se azývá testem dobré shody. 3.5 Odlehlé hodoty Klascké řešeí problému detfkace odlehlých hodot Toto řešeí reprezetuje apř. Grubbsův test extrémích odchylek, založeý za předpokladu or- N µ; a tom, že P [ X µ > ],46 <, 5. Př této hladě vý- málího rozděleí [ ] zamost tedy považujeme za odlehlou hodotu každou hodotu h, pro kterou h X > S. Příklad 3. 5 Je dá áhodý výběr (uspořádaý podle velkost),3,4,5,6,7,8,9,, 5, pro který x, 4 a s 4,5. Pro hodotu h 5 je 5,4,8s a tato hodota je tedy celkem podle očekáváí detfkováa jako odlehlá. Podobě jako v předchozím případě mějme výběr,3,4,5,6,7,8,9,,, který má x 4,4 a s 39, 9. Vyjádřete se k hodotě h. (3 5) Použtí artmetckého průměru a směrodaté odchylky eí pro řešeí problému odlehlých hodot přílš efektví a vede často k výsledkům, které jsou v rozporu s logkou. Robustí řešeí problému detfkace odlehlých hodot K řešeí problému detfkace odlehlých hodot lze s úspěchem využít robustího přístupu založeého a charakterstce MAD (meda absolute devato), tj. prostředí (medáové) absolutí odchylce od medáu jako robustí charakterstce varablty. MAD je prostředí v řadě uspořádaých odchylek x ~ MAD ( ) x a mez í a směrodatou odchylkou je vztah est, kde je směro-,6745. Klascké krtérum je tedy ahrazeo krtérem ~ MAD h x >.,6745 datá odchylka N [ µ; ] Příklad 3. 6 MAD Pro oba výběry z příkladu 3.5 je medá rove 6, 5 a MAD, 5. Proto 7, 4. Jako,6745 odlehlá tedy bude ozačea každá hodota, jejíž odchylka od medáu je větší ež právě vypočteá hodota. To se u prvího výběru týká stejě jako u klasckého přístupu založeého a odchylce od průměru právě ejvyšší hodoty 5, u íž je tato odchylka rova 43, 5. Řešte odlehlé hodoty z příkladu (3 5). (3 6) Teto odstavec chápeme současě jako malou demostrac výzamu eklasckých robustích metod ve statstce. Je třeba s ovšem uvědomt, že žádá metoda edokáže detfkovat hrubé chyby za stuace, kdy je hrubou chybou zatížea výzamá část pozorováí. Rozhodutí o vyloučeí odlehlé hodoty je vždy problematcké. Nevyloučeí odlehlé hodoty, která je hrubou chybou, představuje problém, stejě jako vyloučeí odlehlé hodoty, která hrubou chybou eí. Výskyt odlehlých hodot lze apř. očekávat u slě asymetrckých rozděleí. 3

3.6 Neparametrcké metody a testy (ukázka) Neparametrcké metody předpokládají takové úpravy v datech, kterým se ezámé rozděleí (za ceu ztráty část formace obsažeé v datech), převede a rozděleí zámé. Jedou z těchto metod je tzv. zaméková metoda, kterou se hodoty áhodého výběru z ezámého spojtého rozděleí převedou a posloupost symbolů dvojího druhu (apř. zaméek + a ), čímž je ztracea formace o jejch velkost. Nechť X,...,, X X je áhodým výběrem z ezámého spojtého rozděleí s medáem x,5. Testovaá hypotéza H : x,5 c prot oboustraé alteratvě H : x,5 c. Počet kladých odchylek od medáu v souboru o rozsahu ozačíme jako áhodou velču Z. Tato velča má bomcké rozděleí se středí hodotou E ( Z) a rozptylem D ( Z ). Je-l rozsah 4 Z výběru dostatečě velký, lze potom velču U aproxmovat rozděleím N [ ;]. Krtcký obor testového krtéra je stejý jako u všech ostatích oboustraých testů s krtérem U. Ve výběru o rozsahu 5 předpokládáme hodotu medáu x,5 33. V datech bylo ovšem zjštěo celkem 35 kladých odchylek od této hodoty. Ověříme hypotézu o hodotě medáu a hladě výzamost,. (3 7) Další používaou eparametrckou metodou je metoda pořadová, př íž ahrazujeme hodoty uspořádaého áhodého výběru pořadovým čísly, čímž se (za ceu ztráty formace o rozdílech sousedích hodot) dostáváme k dskrétímu rovoměrému rozděleí. Σ. Nejceější techkou matematcké statstky je testováí hypotéz.. Obecý postup př testováí předpokládá formulac hypotéz (testovaé a alteratví), volbu hlady výzamost, výpočet testového krtéra a vyhodoceí testu. 3. Př testováí dospějeme buď k zamítutí testovaé hypotézy (a přjetí alteratví hypotézy) ebo k jejímu ezamítutí. 4. Protože př testováí vycházíme z formací z áhodého výběru, je testovací procedura zatížea chybam chybou prvího a druhého druhu. 5. Nejvýzamější skupou testů jsou testy o parametrech rozděleí pravděpodobost áhodých velč. V této souvslost jsme probral ěkteré ejfrekvetovaější jedo- a dvouvýběrové testy. 6. Dalším úkolem testováí je ověřovat hypotézy o tvaru rozděleí áhodých velč. V této souvslost jsme se omezl pouze a ukázku tzv. testu dobré shody. 7. Pomocí testováí lze rověž ve výběru ošetřt odlehlá pozorováí. V této souvslost jsme ukázal rověž jede robustí postup, který se praktcky využívá v laboratorí prax. 8. Rezgujeme-l a tvar rozděleí, lze využít eparametrckých metod a testů. V této souvslost jsme se omezl a ukázku zamékové metody a jedovýběrového zamékového testu o medáu áhodé velčy. 3

9. Problematku testováí jsme probral pouze a úrov lehkého úvodu. Čteář se po prostudováí lekce rozhodě estae expertem a daou problematku.. Z praktckého hledska výzamou aplkací testovací procedury je ěkolkrát ctovaá statstcká přejímka. (3 ) Testovat lze pouze hypotézu o rozptylech. Ostatí hypotézy je třeba přeformulovat: H θ θ, H : µ µ. : (3 ) Pravděpodobost chyby prvího druhu je rzko dodavatele (vyhovující dodávka je odmítuta). Pravděpodobost chyby druhého druhu je rzko odběratele (evyhovující dodávka je přjata). x c bychom pro 5 (3 3) Př stejém rozdílu 378 dospěl k ezamítutí ulové hypotézy ( t, 98 ). Pro 8 t, 5. Stejý rozdíl bychom tedy prohlásl v prvím případě za evýzamý a ve druhém za výzamý. (3 4) S výjmkou testu o rozptylu všecha testová krtéra skutečě vyhovují tomuto obecému zápsu a vyjadřují rozdíl mez vypočteou a předpokládaou hodotou v čtatel v ásobcích směrodaté chyby ve jmeovatel. h je a tato hodota tedy překvapvě jako odlehlá detfkováa eí. (3 5) Pro 4,4,89s (3 6) Pro druhý z výběrů je hodota MAD stejá jako ve 3.6 a tudíž zde budou jako odlehlé ozačey hodoty stejě vzdáleé od medáu, jako u prvího výběru. To se týká (tetokrát v souladu s očekáváím) obou ejvyšších hodot (jejch odchylka od medáu je 93, 5 ), které prví metoda jako odlehlé eodhalla. 35 5 u > u,995 5 ( 35 (3 7) Testové krtérum,83, 58. Hypotézu o hodotě medáu tedy zamítáme, eboť rozdíl skutečého z ) a předpokládaého počtu 5 kladých odchylek je atolk velký, že hypotéza o hodotě medáu eí udržtelá.. Na hladě výzamostí,5 ověřte hypotézu : 5 H prot oboustraé alteratvě. Použjte data z příkladu... Z 36 áhodě vybraých automoblů určté sére mělo určtou vadu %. O- věřte hypotézu, že tuto vadu má /3 všech vozů prot alteratvě, že /3 vozů tuto vadu emá. Pracujte s % hladou výzamost. 3. V ávazost a úlohu formulujeme úlohu, že v sesterském motážím závodě se z 4 áhodě vybraých vozů závada projevla u 8 % vozů. Ověřte hypotézu o stejé četost vady v obou motážích závodech prot alteratvě o estejé četost. Zvolte obě běžě používaé hlady výzamost. 4. V tabulce jsou uvedey časy (v m.) spotřebovaé a určtou výrobí operac u 6 dělíků a počátku ( x ) a koc ( y ) zácvku. Ověřte hypotézu, že zácvk eměl vlv a spotřebu času prot oboustraé alteratvě. Hladu výzamost zvolte apř.., 3

Dělík 3 4 5 6 x 4 6 4 y 9 5 5. Př povrchím pohledu lze říct, že oboustraé testy mají krtcký obor složeý ze dvou částí. Mez testy, které jsme probral, jsou dvě výjmky. Zatímco jeda se jako jedostraý test pouze tváří, exstuje skupa testů, které jsou z prcpu jedostraé. Popšte tyto výjmky. 6. Exstuje v prcpu stuace, kdy můžeme prohlást výskyt chyby prvího/druhého druhu za jev (absolutě) emožý? 33