Ing. Michael Rost, Ph.D.

Podobné dokumenty
1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

STATISTICKÉ HYPOTÉZY

Testování statistických hypotéz

Testování statistických hypotéz

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

= = 2368

Pravděpodobnost a aplikovaná statistika

Statistické metody v marketingu. Ing. Michael Rost, Ph.D.

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení

Stručný úvod do testování statistických hypotéz

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Aproximace binomického rozdělení normálním

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Testování statistických hypotéz

5 Parametrické testy hypotéz

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Testy statistických hypotéz

Testování hypotéz. 4. přednáška

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

4ST201 STATISTIKA CVIČENÍ Č. 7

PRAVDĚPODOBNOST A STATISTIKA

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Charakteristika datového souboru

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Testy. Pavel Provinský. 19. listopadu 2013

Testování statistických hypotéz. Obecný postup

7.1. Podstata testu statistické hypotézy

Jednostranné intervaly spolehlivosti

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Cvičení ze statistiky - 8. Filip Děchtěrenko

Náhodné veličiny, náhodné chyby

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z

STATISTICKÉ TESTY VÝZNAMNOSTI

Zápočtová práce STATISTIKA I

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

4EK211 Základy ekonometrie

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

5. T e s t o v á n í h y p o t é z

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

ÚVOD DO TESTOVÁNÍ HYPOTÉZ. Martina Litschmannová

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

12. cvičení z PST. 20. prosince 2017

Matematika III. 3. prosince Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

Příklad datového souboru. Pravděpodobnost vs. statistika. Formální definice. Teorie odhadu

Neparametrické metody

Intervalové Odhady Parametrů II Testování Hypotéz

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

Jednofaktorová analýza rozptylu

You created this PDF from an application that is not licensed to print to novapdf printer (

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Ranní úvahy o statistice

PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA

Jednofaktorová analýza rozptylu

Úvod do testování hypotéz

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

STATISTICKÉ ODHADY Odhady populačních charakteristik

TECHNICKÁ UNIVERZITA V LIBERCI. Statistický rozbor dat z dotazníkového šetření

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

Testování hypotéz Biolog Statistik: Matematik: Informatik:

Příklady na testy hypotéz o parametrech normálního rozdělení

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

12. prosince n pro n = n = 30 = S X

KGG/STG Statistika pro geografy

STATISTICKÉ TESTY VÝZNAMNOSTI

Statistika. Testování hypotéz - statistická indukce Parametrické testy. Roman Biskup

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

TECHNICKÁ UNIVERZITA V LIBERCI

Statistické metody uţívané při ověřování platnosti hypotéz

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

prosince oboustranný symetrický 95% interval spolehlivosti pro střední hodnotu životnosti τ. X i. X = 1 n.. Podle CLV má veličina

Transkript:

Úvod do testování hypotéz, jednovýběrový t-test Ing. Michael Rost, Ph.D.

Testovaná hypotéza Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru, např. o parametru Θ, pak takovéto tvrzení lze nazvat hypotézou, resp. statistickou hypotézou. Statistickou hypotézu můžeme zapsat formálněji (a zpravidla to tak děláme) například ve tvaru H 0 : θ = θ 0 Takto formulovanou hypotézu nazveme testovanou hypotézou (nulovou hypotézou). Příklad: H 0 : Průměrná hmotnost mužů je 88,0 Kg. H 0 : µ = 88, 0

Alternativní hypotéza Proti testované hypotéze formulujeme hypotézu alternativní. Značí se symbolem H A nebo H 1. Existují různé alternativní hypotézy. V podstatě však při testování hypotéz rozeznáváme pouze tři typy alternativních hypotéz. Ty lze koncipovat následujícím způsobem: Pravostranná hypotéza H A : Θ > Θ 0 Levostranná hypotéza H A : Θ < Θ 0 Oboustranná hypotéza H A : Θ Θ 0.

Dvojice hypotéz Je velmi důležité, jak budeme své hypotézy specifikovat. Dle formulace problému se musíme správně rozhodnout mezi třemi variantami: H 0 : Θ = Θ 0 vs. H A : Θ Θ 0, nebo H 0 : Θ = Θ 0 vs. H A : Θ > Θ 0 nebo H 0 : Θ = Θ 0 vs. H A : Θ < Θ 0.

Testové kritérium Pro rozhodnutí o tom, která z výše formulovaných hypotéz je pravdivá, tj. zda bude platit H 0 nebo naopak H A, rozhodujeme za pomoci tzv. testové statistiky T. Testová statistika je funkcí našich pozorování, tj.: T = g(x 1, x 2, x 3,..., x n ) a je tedy náhodnou veličinou nabývající určitého oboru hodnot, resp. hodnot z určité podmnožiny množiny reálných čísel. Na definovaném oboru hodnot testové statistiky T lze vymezit jistým způsobem dvě podmnožiny.

Obor přijetí kritický obor První množinu nazveme oborem přijetí testované hypotézy. Druhou množinu nazveme kritickým symbolem K. oborem a označíme ji Otázka spočívá v tom jak stanovit hranici mezi těmito množinami? S touto otázkou souvisí problematika chyb kterých se můžeme při testování hypotéz dopustit.

Chyby spojené s testováním hypotéz V souvislosti s testováním hypotéz lze dojít ke čtyřem závěrům: Zamítneme nulovou hypotézu, přičemž ve skutečnosti platí alternativní hypotéza. Naše rozhodnutí je tedy správné. Nezamítneme nulovou hypotézu, přičemž ve skutečnosti nulová hypotéza platí. Naše rozhodnutí je tedy správné. Zamítneme nulovou hypotézu přestože je správná. Dopouštíme se tak chyby. Tento typ chyby nazýváme chybou I. druhu.

Chyby spojené s testováním hypotéz Nezamítneme nulovou hypotézu přestože platí alternativní hypotéza. Dopouštíme se tak chyby. Tento typ chyby nazýváme chybou II. druhu.

Chyba I. druhu Pokud bychom tedy chtěli určit pravděpodobnost vzniku chyby I. druhu, platilo by následující: P (chyby I.) = P (přijmu H A H 0 ) = P (T K platí H 0 ). Ve většině případů požadujeme, aby tato pravděpodobnost nepřekročila určitou, předem danou hodnotu α. Hodnotu α nazýváme hladinou významnosti. Nejčastější volbou hodnoty α pro testování hypotéz je α = 0, 05 či α = 0, 01. V takovém případě připouštíme existenci vzniku chyby I. druhu s pravděpodobností 0,05 resp. 0,01. Kritický obor je konstruován tak, že platí: P (chyby I.) = P (T K platí H 0 ) = α.

Rozhodnutí o platnosti testované hypotézy Pokud jde o samotné testování hypotézy, pak to spočívá v aplikaci jednoduchého rozhodovacího pravidla: Leží-li hodnota testového kritéria T v kritickém oboru tj. platí-li: T K, zamítáme nulovou hypotézu H 0 ve prospěch hypotézy alternativní H A. Naopak, neleží-li hodnota testového kritéria v kritickém oboru, pak testovanou hypotézu nezamítáme a tvrdíme, že se nepodařilo zamítnout nulovou hypotézu na předem zvolené hladině významnosti α na základě pozorovaných dat.

Chyba II. druhu Chyby druhého druhu se dopustíme tehdy, nezamítnemeli hypotézu H 0, přestože tato hypotéza ve skutečnosti neplatí. Pravděpodobnost toho, že se dopustíme chyby II. druhu lze vyjádřit následujícím způsobem: P (chyby II.) = P (nezamítnu H 0 H A ) = P (T K H A ) = β. Většinou se však zajímáme spíše o doplněk k této pravděpodobnosti. Tj. o pravděpodobnost toho, že se této chyby nedopustíme. Symbolicky lze hledanou pravděpodobnost definovat následovně: P (přijmu H A H A ) = P (T K H A ) = 1 β. (1) Tento doplněk k pravděpodobnosti chyby II. typu, tj. hodnotu 1 β, zpravidla nazýváme silou testu.

Druhy testů Z hlediska toho, jaké předpoklady činíme o rozdělení sledovaného statistického znaku, lze rozlišit dvě třídy testů: Parametrické testy: Jsou testy založené na znalosti charakteru rozdělení sledovaného statistického znaku. Parametrickými testy se pak testujeme předpoklady o neznámých hodnotách parametrů (může jít například o střední hodnotu či rozptyl). V převážné většině jde o početně náročnější, ale silné testy. Neparametrické testy: Jsou takové testy, které nevyžadují znalost předpokladů o charakteru rozdělení náhodných veličin. Neparametrické, se nazývají proto, že se netýkají parametrů rozdělení. Tyto testy mají obecně menší sílu ve srovnání s parametrickými testy.

Testy hypotéz o parametru µ při neznámém σ 2 Předpokládejme, že máme k dispozici výběr x = [x 1, x 2,, x n ], pocházející z normálního rozdělení, jehož parametry µ a σ 2 neznáme. Tato situace bývá v praxi nejčastější. Dále předpokládejme, že se budeme snažit učinit závěr o velikosti střední hodnoty µ v základním výběru. Testovaná hypotéza může mít některý z následujících tvarů: H 0 : µ = µ 0 H 0 : µ µ 0 H 0 : µ µ 0

Testy hypotéz o parametru µ při neznámém σ 2 Kritický obor je v případě testu hypotéz o parametru µ při neznámém σ 2 založen na testovém kritériu t = x µ 0 n. s Uvědomte si, že testové kritérium t je náhodnou veličinou!!! Náhodná veličina t sleduje za platnosti nulové hypotézy Studentovo rozdělení s n 1 stupni volnosti. Symbolicky lze tedy psát, že: t t(n 1).

Hypotézy, t, K a příklad H 0 H A t K µ = µ 0 µ µ 0 K = {t; t > t 1 α 2 (n 1)} µ µ 0 µ > µ 0 t = x µ 0 s n K = {t; t t1 α (n 1)} µ µ 0 µ < µ 0 K = {t; t t α (n 1)} Příklad: V populárním časopise bylo uvedeno, že česká populace žen vlivem změn životního stylu a špatných stravovacích návyků tloustne. Zatímco před pěti lety byla průměrná hmotnost českých žen 72,5 Kg dnes jsou ženy podstatně obéznější. Má autor tohoto článku pravdu nebo ženám křivdí?

Pozorovaná data Přistupme k tomuto problému statisticky. Předpokládejme, že jsme pořídili náhodný výběr z populace českých žen o rozsahu n = 24: 67,16; 86,97; 84,00; 85,29; 74,55; 68,93; 74,22; 72,34; 87,09; 77,51; 63,25 71,02; 99,82; 54,56; 73,12; 74,03; 71,00; 69,46; 79,86; 69,31; 68,25; 72,87 80,24; 83,20

Řešení v ruce Napišme tedy testovanou a alternativní hypotézu: H 0 : µ 72, 5 H A : µ > 72, 5 Průměrná hodnota hmotnosti žen ve výběrovém souboru je x = 1 n n i=1 x i = 75, 33542. Směrodatná odchylka pak s = 1 n 1 n i=1 (x i x) 2 = 88, 07907 = 9, 385045.

Řešení v ruce Vyjádřeme hodnotu testové statistiky t. t = x µ 0 s n = 75, 33542 72, 5 9, 385045 (24) = 1, 480083 Dále předpokládejme, že budeme chtít interpretovat naše výsledky s 95% spolehlivostí. Hladinu α specifikujeme tedy hodnotu 0, 05. Zbývá určit kritický obor K, ten je definován jako množina hodnot t pro které platí: t t 1 α (n 1) = t 0,95 (23) = 1, 713872. Je tedy zřejmé, že testová statistika t neleží v kritickém oboru K.

Řešení v ruce Z tohoto důvodu nelze zamítnout testovanou hypotézu H 0, která tvrdí, že µ 72, 5. Závěr: Závěrem lze říci, že se nám s 95% spolehlivostí na základě pozorovaných dat nepodařilo prokázat, že hmotnost žen vzrostla v porovnání s průměrnou hmotností žen před pěti lety. Autor článku ženám zřejmě křivdí.