14. Testování statistických hypotéz Úvod statistické hypotézy Definice 14.1 Statistickou hypotézou parametrickou neparametrickou. nulovou testovanou

Podobné dokumenty
6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

Odhady parametrů 1. Odhady parametrů

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

Testování statistických hypotéz

Intervalové odhady parametrů některých rozdělení.

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

Náhodný výběr 1. Náhodný výběr

2. Náhodná veličina. je konečná nebo spočetná množina;

NEPARAMETRICKÉ METODY

Přednáška VIII. Testování hypotéz o kvantitativních proměnných

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

VYSOCE PŘESNÉ METODY OBRÁBĚNÍ

12. N á h o d n ý v ý b ě r

Intervalové odhady parametrů

17. Statistické hypotézy parametrické testy

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

8. Analýza rozptylu.

Odhad parametrů normálního rozdělení a testy hypotéz o těchto parametrech * Věty o výběru z normálního rozdělení

Deskriptivní statistika 1

Kvantily. Problems on statistics.nb 1

Pravděpodobnost a aplikovaná statistika

V. Normální rozdělení

PRAVDĚPODOBNOST A STATISTIKA

DERIVACE FUNKCÍ JEDNÉ REÁLNÉ PROM

7. Odhady populačních průměrů a ostatních parametrů populace

jako konstanta nula. Obsahem centrálních limitních vět je tvrzení, že distribuční funkce i=1 X i konvergují za určitých

0,063 0,937 0,063 0, P 0,048 0,078 0,95. = funkce CONFIDENCE.NORM(2α; p(1 p)

Pravděpodobnost a aplikovaná statistika

Při sledování a studiu vlastností náhodných výsledků poznáme charakter. podmínek různé výsledky. Ty odpovídají hodnotám jednotlivých realizací

Mezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby.

MATICOVÉ HRY MATICOVÝCH HER

14. B o d o v é o d h a d y p a r a m e t r ů

Přednáška VI. Intervalové odhady. Motivace Směrodatná odchylka a směrodatná chyba Centrální limitní věta Intervaly spolehlivosti

Testování statistických hypotéz

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

4. B o d o v é o d h a d y p a r a m e t r ů

Úloha II.S... odhadnutelná

Kapitola 6. : Neparametrické testy o mediánech

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

Ilustrativní příklad ke zkoušce z B_PS_A léto 2013.

8.2.1 Aritmetická posloupnost I

Intervalový odhad. nazveme levostranným intervalem pro odhad parametru Θ. Statistiku. , kde číslo α je blízké nule, nazveme horním

Teorie chyb a vyrovnávací počet. Obsah:

8.2.1 Aritmetická posloupnost

Pravděpodobnostní modely

Náhodu bychom mohli definovat jako součet velkého počtu drobných nepoznaných vlivů.

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

UPLATNĚNÍ ZKOUŠEK PŘI PROHLÍDKÁCH MOSTŮ

Pravděpodobnost a aplikovaná statistika

1.1. Definice Reálným vektorovým prostorem nazýváme množinu V, pro jejíž prvky jsou definovány operace sčítání + :V V V a násobení skalárem : R V V

3. Charakteristiky a parametry náhodných veličin

P2: Statistické zpracování dat

VaR analýza citlivosti, korekce

Úloha III.S... limitní

7. cvičení 4ST201-řešení

8. Odhady parametrů rozdělení pravděpodobnosti

Testujeme hypotézu: proti alternativě. Jednoduché třídění:

MATEMATICKÁ INDUKCE. 1. Princip matematické indukce

veličiny má stejný řád jako je řád poslední číslice nejistoty. Nejistotu píšeme obvykle jenom jednou

Seriál XXX.II Zpracování dat fyzikálních měření

vají statistické metody v biomedicíně Literatura Statistika v biomedicínsk nském výzkumu a ve zdravotnictví

a další charakteristikou je četnost výběrového souboru n.

OKRUŽNÍ A ROZVOZNÍ ÚLOHY: OBCHODNÍ CESTUJÍCÍ. FORMULACE PŘI RESPEKTOVÁNÍ ČASOVÝCH OKEN

Pravděpodobnostní model doby setrvání ministra školství ve funkci

1. JEV JISTÝ a. je jev, který nikdy nenastane b. je jev, jehož pravděpodobnost = ½ c. je jev, jehož pravděpodobnost = 0 d.

vají statistické metody v biomedicíně

3. Lineární diferenciální rovnice úvod do teorie

6. Posloupnosti a jejich limity, řady

MOŽNOSTI STATISTICKÉHO POSOUZENÍ KVANTITATIVNÍCH VÝSLEDKŮ POŽÁRNÍCH ZKOUŠEK PRO POTŘEBY CERTIFIKACE A POSUZOVÁNÍ SHODY VÝROBKŮ

Vzorový příklad na rozhodování BPH_ZMAN

Metody zkoumání závislosti numerických proměnných

Užití binomické věty

Pro statistické šetření si zvolte si statistický soubor např. všichni žáci třídy (několika tříd, školy apod.).

Spojitost a limita funkcí jedné reálné proměnné

Kvantová a statistická fyzika 2 (Termodynamika a statistická fyzika)

Komplexní čísla. Definice komplexních čísel

Matematika I, část II

Matematika 1. Katedra matematiky, Fakulta stavební ČVUT v Praze. středa 10-11:40 posluchárna D / 13. Posloupnosti

Sekvenční logické obvody(lso)

DIFERENCIÁLNÍ POČET FUNKCE JEDNÉ PROMĚNNÉ. 1) Pojem funkce, graf funkce

Mocninné řady - sbírka příkladů

10.3 GEOMERTICKÝ PRŮMĚR

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Fakulta strojního inženýrství. Matematika IV. Semestrální práce

Petr Šedivý Šedivá matematika

Odhad parametru p binomického rozdělení a test hypotézy o tomto parametru. Test hypotézy o parametru p binomického rozdělení

Číselné charakteristiky náhodných veličin

REGRESNÍ DIAGNOSTIKA. Regresní diagnostika

Iterační výpočty projekt č. 2

PŘÍKLAD NA PRŮMĚRNÝ INDEX ŘETĚZOVÝ NEBOLI GEOMETRICKÝ PRŮMĚR

FITOVÁNÍ ROZDĚLENÍ PRAVDĚPODOBNOSTI PRO APLIKACE

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

2. Znát definici kombinačního čísla a základní vlastnosti kombinačních čísel. Ovládat jednoduché operace s kombinačními čísly.

Náhodné jevy a pravděpodobnost

Matematika 1. Ivana Pultarová Katedra matematiky, Fakulta stavební ČVUT v Praze. středa 10-11:40 posluchárna D Posloupnosti

Náhodný výběr, statistiky a bodový odhad

Transkript:

4. Testováí statistických hypotéz Úvod Při práci s daty se mohdy spokojujeme s itervalovým či bodovým odhadem parametrů populace. V mohých případech se však uchylujeme k jiému postupu, většiou jde o případy, kdy řešíme problémy související s typem rozděleí populace, s ezávislostí výběru atd., ěkdy jsme prostě ucei staovovat určité výroky, které mají statistické pozadí a studovat jejich pravdivost. Zavádíme proto pojem statistické hypotézy. Defiice 4. Statistickou hypotézou budeme rozumět výrok o áhodých veličiách. V případě, že teto výrok pojedává o parametrech populace azýváme takovouto hypotézu parametrickou, jestliže vyšetřujeme jié okolosti ( apř. typ rozděleí populace, ezávislost výběru, způsob výběru atd.) azýváme takovou hypotézu eparametrickou. Hypotézami parametrickými se budeme zabývat v ásledující. kapitole a eparametrickými v kapitole 2. a kapitole 3. Obecě je možou dělit statistické hypotézy ještě moho dalšími způsoby apř. podle počtu šetřeých populací, podle toho zda jsou jedoduché ebo složeé. Těmito okolostmi se budeme zabývat víceméě okrajově. Výrok, jehož platost ověřujeme, azýváme většiou ulovou ebo jiak testovaou hypotézou. Podle ustáleého ozačeí takový výrok popisujeme symbolem H 0. Hypotéza H 0 v tomto případě vyjadřuje dosavadí představy o těch skutečostech, které vyšetřujeme ( odráží stav pozáí, které máme v současé době o těchto skutečostech ). Názor pochybosti o platosti ulové hypotézy vyjadřuje v ašem modelu alterativí ebo jiak výzkumá hypotéza. Takovouto hypotézu většiou stavíme tak, aby její pravdivost zameala většiou pokrok či ějakou změu v dosavadích šetřeích. Alterativí hypotézu většiou začíme H resp. H A. Testem statistické hypotézy rozumíme proces rozhodováí, při kterém a základě áhodých výběrů provedeme rozhodutí ve prospěch právě jedé z předložeých hypotéz. Zameá to, že formulace hypotéz je prováděa tak, aby v daém okamžiku platila právě jeda. Z formálího hlediska představují tedy hypotézy H 0 a H úplou možiu eslučitelých jevů. Abychom tedy provedli korektí vyhodocovací proces o správosti předložeých hypotéz ( výroků ), je uté mít k dispozici ástroj, pomocí ěhož rozhodujeme o správosti předložeých výroků. Teto ástroj se azývá testovací statistika ebo testové kritérium. Možia hodot, kterých testová statistika abývá se rozpadá a dvě disjuktí možiy, které azýváme obor přijetí ( testovaé hypotézy H 0 ) a kritický obor ( obor zamítutí hypotézy H 0 ).. Kritický obor obsahuje takové hodoty, že pravděpodobost jejich výskytu je velmi malá. Jestliže přesto hodota testové statistiky je prvkem možiy, zamítáme testovaou hypotézu H 0 ve prospěch alterativí hypotézy H. Pade li však hodota testové statistiky do možiy říkáme, že uvedeý test eprokázal epravdivost testovaé hypotézy H 0. Při takovémto postupu samozřejmě mohou astat chyby v ašich rozhodutích. Zásadou je takové chyby studovat a pomocí jejich výskytu potom oceňovat vhodost či

evhodost použité hypotézy. Jestliže chybě zamíteme hypotézu H 0 vytvoříme chybu I. druhu, pravděpodobosti jejího výskytu je ozačováa jako a ( ěkdy jako - a ), tomuto číslu se pak říká hladia výzamosti. V praktických úlohách se vyskytují převážě hodoty a = 0,95 ( resp. 0,05 ) říkáme, že tato hladia je výzamá ; pro hladiu a = 0,99 prohlašujeme, že hladia je velmi výzamá a koečě pro hodotu a = 0,99 je hladia vysoce výzamá. Kromě chyby prvího druhu se můžeme dopustit při práci s hypotézami i chyby, kdy ezamíteme hypotézu H 0, i když tato hypotéza eplatí. Takovéto chybě se říká chyba II. druhu, pravděpodobost výskytu takové chyby ozačujeme b. Doplěk hodoty b do jedé je - b je tedy pravděpodobost, že hodota testovací statistiky správě spade do kritického oboru. Platí tedy ásledující ( symbolem T ozačujeme testovací statistiku ) ( 0 ) PT H = α (4.) ( ) PT H = β (4.2) ( ) PT H = β (4.3) Pro posouzeí kvality testovacího postupu je důležitá silofukce,. Vyjadřuje průběh pravděpodobosti hodoty - b při růzých hodotách a.nepodaří li se ám prokázat, že hodota testové statistiky je v kritickém oboru, musíme se spokojit s tvrzeím, že daá data ejsou v rozporu s tvrzeím hypotézy H 0. Popišme si tedy dále vlastí postup při práci s testováím statistických hypotéz: I. Na základě zalostí matematického problému staovujeme hypotézu H 0. Tuto hypotézu budeme považovat za pravdivou do okamžiku, kdy vybraá data eprokážou opak. II. Staoveí alterativí hypotézy H. Jde o tvrzeí, které je v rozporu s hypotézou H 0. Alterativí hypotéza je považováa za pravdivou po vyvráceí hypotézy H 0. III. Volba testovací statistiky T. Jde o áhodou veličiu a základě íž rozhodeme o pravdivosti jedotlivých hypotéz. IV. Staoveí hladiy výzamosti testu, staovíme pravděpodobost chyby I. druhu V. Staoveí kritického oboru testovací statistiky T.Kokrétí staoveí kritického oboru závisí a hladiě výzamosti a VI. Ověřeí předpokladů testu. Některé testy vyžadují splěí určitých podmíek, které musíme pro aše kokrétí data ověřit VII. Vlastí provedeí áhodého výběru z populace by mělo být provedeo korektě. Podmíky takového výběru by měli být podrobě ověřey. Data poté musíme přesě iterpretovat při výpočtu v testovací statistice. VIII. Po tomto procesu je zapotřebí rozhodout o dvou možých výrocích : a. Hypotéza H 0 se zamítá a alterativí hypotéza se přijímá. Takovýto výrok připouštíme tehdy, když hodota testovací statistiky leží v kritickém oboru. V tomto případě je zapotřebí kostatovat, že je prokázáa pravdivost alterativí hypotézy H ebo, že rozdíl mezi předpokládaou a vypočítaou hodotou se ukázal a daé hladiě výzamosti jako statisticky výzamý.

a. Hypotézu H 0 ezamítáme v případě, je li hodota testovací statistiky v oboru přijetí. Většiou kostatujeme, že a daé hladiě výzamosti ebyla testovaá hypotéza H 0 zamítuta.. V další části využijeme a upravíme příklad 2.3, který je uvedeý ve skriptech Praktikum k výuce matematické statistiky II: Testováí hypotéz, VŠE Praha, 2000. Příklad 4. Předpokládejme, že výsledky experimetů souhlasily s áhodou veličiou X s ormálím rozděleím se středí hodotou m a rozptylem 64. Dosud uzávaá hodota m je 25. Při vyhodocováí hodot experimetů došlo k určitým změám a yí se zdá, že hodota m vzrostla a je větší ež 25. Úkolem je a základě ezávislých experimetů rozhodout, zda platí hypotéza H 0 : m c 25 ebo alterativí hypotéza H : m > 25. K tomu, abychom mohli ěkterou z uvedeých hypotéz zamítout, je třeba alézt vhodou statistiku. Již z předchozích předášek víme, že ejlepším bodovým odhadem m je X i aritmetický průměr X =, jako testovou statistiku použijeme tedy realizaci tohoto průměru. Provedeme yí řešeí ašeho problému třemi růzými způsoby. Variata. Předpokládejme, že jsme provedli áhodý výběr apříklad o rozsahu 40 prvků. Staovíme hypotézu H 0 : m c 25 a alterativí hypotézu H : m > 25. Kritickým oborem bude staovea možia W = ( x,, x) ; xi > 40.25 = 000. Zjistíme hodotu silofukce K(b) = - b(m). Silofukce udává pro růzé hodoty m pravděpodobost, že výběrový průměr bude větší ež 25. Při áhodém výběru z populace popsaé N(m,64) víme, že výběrový průměr je typu ormálí rozděleí N(m, 64 = 8 ). 40 5 Můžeme tedy hodotu K(m) přímo spočítat : X µ 25- µ 25- µ K( µ ) = P( X >25 ) = P > = PZ >. 8 8 8 5 5 5 V dále uvedeé tabulce jsou zazameáy hodoty K(m) : K(m) m 0,008853 22 0,056923 23

0,24598 24 K(m) m 0,5 25 0,785402 26 0,943077 27 0,9947 28 Všiměme si, že pro m = 25 je hypotéza H 0 pravdivá, ale pravděpodobost jejího zamítutí je 50%. To je příliš vysoká pravděpodobost zamítutí pravdivé hypotézy! Variata 2. Alterativí hypotézu H : m > 25 přijmeme za podmíky, je li výběrový průměr větší ež 27. V tomto případě bude hodota silofukce K(m)rova K 27 µ = >27 = Φ (4.4) 8 5 ( µ ) P( X ) Po dosazeí stejých hodot jako v miulé variatě získáváme ásledující tabulku: K(m) m 3,86E-05 22 0,000783 23 0,008853 24 0,056923 25 0,24598 26 0,5 27 0,785402 28 Pro hodotu m = 25 je yí pravděpodobost zamítutí ( pravdivé ) hypotézy H 0 malá a úrovi 5,7%, ale pro hodotu 26 ( epravdivé ) je pravděpodobost zamítutí je 2,5% a to je trochu příliš. Variata 3. V této části budeme postupovat obráceě a určíme přímo hodoty silofukce K(m) v ěkterých důležitých bodech a z těchto skutečostí budeme chtít určit kritický obor W a rozsah výběru. Nechť tedy W = ( x,, x) ; xi > c., kde hodoty a c jsou v daé chvíli ezámé a budeme je dále počítat. Za těchto podmíek má silofukce hodotu K c µ = > c = Φ (4.5) 64 ( µ ) P( X ) Chtějme yí, aby pro hodotu m = 25 byla síla testu rova 0,05 a zároveň aby pro hodotu m = 26 byla síla testu 0,9. Získáme tedy po dosazeí ásledující soustavu:

c 25 Φ = 0,05 64, c 26 Φ = 0,90 64 Nyí využijeme kvatily N(0,) a soustava se převede a c 25 =, 64 64 c 26 =, 28 64 Řešeím této soustavy jsou hodoty = 545,7 a hodota c = 25,56. Shreme li yí získaé výsledky měl by mít áš výběr rozsah aspoň 546 prvků a kritický obor by měl být omeze číslem 25,56. Příklad 4.2 Předávací cea mezi výrobcem a prodávajícím byla odvozea mimo jié z toho, že podíl reklamovaých výrobků v záručí době byl 5%. Tato situace se jedou za čas ověřuje. Náhodým výběrem určitého počtu výrobků : a) Chtějí oba ověřit, že předpokládaý podíl je stále aktuálí b) Výrobce chce ukázat, že podíl je adhodoceý a ceu chce zvýšit c) Prodejce chce prokázat, že podíl je podhodoceý a ceu chce sížit. Formulujte v těchto případech hypotézy. Řešeí: Je zřejmé, že ve všech případech je hypotéza H 0 stejá a rova : H 0 : p = 0,5 Hodota p je parametr alterativího rozděleí. Hypotéza H 0 je jedoduchá( eí složeá eobsahuje tedy více výroků o áhodých veličiách). Provedeme yí kostrukci alterativích hypotéz pro jedotlivé případy. a) H : p 0,5. Jde o dvoustraou hypotézu ( složeou výroků je dokoce ekoečě moho!). b) H : p < 0,5. Jde o jedostraou hypotézu levostraou ( složeou ). c) H : p > 0,5. Jde o jedostraou hypotézu pravostraou ( složeou ). Příklad 4.3 Pokračujme v ašem příkladě. Výrobce předpokládá, že podíl zboží v reklamaci je 5%. Prodejce tvrdí, že v předcházejícím roce byl teto podíl 2% a chce proto ceu sížit. Nakoec se dohodou, že vyberou 0 výrobků, jestliže budou ve výběru ejvýše 2 reklamovaé výrobky ebudou ceu měit. V opačém případě se cea síží. Jakých chyb a s jakou pravděpodobostí se mohou oba dopustit? Řešeí: Provedeme kostrukci hypotéz. H 0 : p = 0,5 H : p = 0,2

Je zřejmé, že testová statistika je rova biomickému rozděleí Bi(0;p). Jestliže má pravdu výrobce je rova hodota p = 0,5, aopak má li pravdu prodejce je hodota p = 0,2. Podle zadáí je jasé, že kritický obor je možia W ={3, 4,,0} a obor přijetí testovaé hypotézy je rove v={0,,2}. I. Za předpokladu, že má pravdu výrobce ( platí H 0 ) a v áhodém výběru budou 0,,2 výrobky vede test k správému přijetí testovaé hypotézy H 0. II. Za předpokladu, že pravdu má výrobce, ale ve výběru budou více ež 2 reklamovaé výrobky, pak test vede k chybě I. druhu III. Za předpokladu, že pravdu má prodejce a v áhodém výběru budou více ež dva reklamovaé výrobky, vede test ke správému zamítutí testovaé hypotézy a k přijetí hypotézy alterativí. IV. Za předpokladu, že pravdu má prodejce a v áhodém výběru budou ejvýše dva výrobky reklamováy, pak test vede k chybě II. druhu. Vidíme, že body I. a III. vedou ke správým závěrům. Spočítáme yí dále s jakými pravděpodobostmi se dopouštíme chyb I. a II. druhu. Pravděpodobost chyby I. druhu ozačujeme a a azýváme ji hladia výzamosti. 0 0.0,5 i i. 0,5 0,798 0 α = ( ) = 3 i Pravděpodobost chyby druhého druhu ozačujeme b 2 0 β =.0,2. 0,2 = 0,6474 0 i i 0 i ( ). Příklad 4.4 Provedli jsme výběr s rozsahem = 400 prvků z populace ormálě rozděleé. Výběrový průměr X = 50 a výběrová směrodatá odchylka s = 4. Máme rozhodout, zda můžeme předpokládat, že středí hodota populace je rova 47,5. Řešeí: Zformulujeme ejprve testovaou hypotézu. Formulujeme alterativí hypotézu H 0 : m = 47,5 H : m π 47,5

X µ Testovací statistikou bude t =, která je za předpokladu ormality populace 2 s studetovo rozděleí o - stupích volosti. Protože je hodota > 00 aproximujeme studetovo rozděleí rozděleím ormálím. Staovíme hladiu výzamosti a 5%, musíme ještě ajít příslušý kvatil N(0,). Jde o 97,5% kvatil, který má hodotu,96. Tedy kritickým oborem jsou všechy hodoty větší ebo rovy hodotě,96. Stačí yí dosadit do testovací statistiky za zámé hodoty a za hodotu m = 47,5. 50 47,5 2,5 50 = = = 2,78. 8 8 8 400 20 Tato hodota leží v oboru zamítutí testovaé hypotézy a v oboru přijetí hypotézy alterativí. Kdybychom yí zjišťovali při jaké hodotě by za těchto předpokladů byla poprvé přijata testovaá hypotéza, museli bychom zjistit příslušý kvatil ormovaého ormálího rozděleí. Jde o 99,46%. Museli bychom tedy volit 00% - 99,46% = 0,54% jako hladiu výzamosti. Takováto hodota bývá azýváa v programech pro zpracováí statistických testů jako p value.