Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Podobné dokumenty
Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

Ing. Michael Rost, Ph.D.

Stručný úvod do testování statistických hypotéz

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Statistika, Biostatistika pro kombinované studium. Jan Kracík

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

= = 2368

Testy statistických hypotéz

12. cvičení z PST. 20. prosince 2017

Testování statistických hypotéz. Obecný postup

diskriminaci žen letní semestr = výrok, o jehož pravdivosti chceme rozhodnout tvrzení o populaci, o jehož platnosti rozhodujeme

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Testování statistických hypotéz

Normální (Gaussovo) rozdělení

Příklad datového souboru. Pravděpodobnost vs. statistika. Formální definice. Teorie odhadu

Jednostranné intervaly spolehlivosti

4ST201 STATISTIKA CVIČENÍ Č. 7

Normální (Gaussovo) rozdělení

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Matematická statistika. Testy v. v binomickém. Test pravděpodobnosti. Test homogenity dvou. Neparametrické testy. statistika. Testy v.

15. T e s t o v á n í h y p o t é z

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Opakování. Neparametrické testy. Pořadí. Jednovýběrový Wilcoxonův test. t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality

Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testování statistických hypotéz

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Příklady na testy hypotéz o parametrech normálního rozdělení

Plánovací diář a Google Calendar

STATISTICKÉ TESTY VÝZNAMNOSTI

Statistika. Testování hypotéz - statistická indukce Parametrické testy. Roman Biskup

Pravděpodobnost a aplikovaná statistika

Vymezení důležitých pojmů. nulová hypotéza, alternativní hypotéza testování hypotézy hladina významnosti (alfa) chyba I. druhu, chyba II.

Testy nezávislosti kardinálních veličin

Testování uživatelského rozhraní

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

12. prosince n pro n = n = 30 = S X

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Aproximace binomického rozdělení normálním

15. T e s t o v á n í h y p o t é z

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

Zápočtová práce STATISTIKA I

Design Experimentu a Statistika - AGA46E

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

Fisherův exaktní test

Náhodné veličiny, náhodné chyby

Intervalové Odhady Parametrů

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

PRAVDĚPODOBNOST A STATISTIKA

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Cvičení ze statistiky - 8. Filip Děchtěrenko

Intervalové Odhady Parametrů II Testování Hypotéz

5. T e s t o v á n í h y p o t é z

4EK211 Základy ekonometrie

Testy. Pavel Provinský. 19. listopadu 2013

STATISTICKÉ HYPOTÉZY

Charakteristika datového souboru

Statistika pro každého. Párový test Test shody dvou rozptylů Dvouvýběrový t-test Porovnání středních hodnot při nestejných rozptylech

Uni- and multi-dimensional parametric tests for comparison of sample results

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Testování statistických hypotéz

STATISTICKÉ TESTY VÝZNAMNOSTI

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Seminář 6 statistické testy

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

Kvantitativní testování porovnání Alza.cz a Mall.cz

5 Parametrické testy hypotéz

Testování hypotéz. 4. přednáška

Přednáška X. Testování hypotéz o kvantitativních proměnných

Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj.

Seminář 6 statistické testy

Tomáš Karel LS 2012/2013

prosince oboustranný symetrický 95% interval spolehlivosti pro střední hodnotu životnosti τ. X i. X = 1 n.. Podle CLV má veličina

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA ELEKTROTECHNICKÁ

Úvod do testování hypotéz

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

Transkript:

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin EuroMISE Centrum Kontakt: Literatura: Obecné informace Zvárová, J.: Základy statistiky pro biomedicínskéobory I. Vydavatelství Karolinum, UK Praha 00 Zvára, K.: Rosner, B.: EuroMISE centrum Doc. Zdeněk Valenta, Ph.D. Tel.: 66 053 640 (sekretariát) Fax: 86 58 453 http://www.euromise.cz valenta@euromise.cz Biostatistika. Vydavatelství Karolinum, UK Praha 00 Fundamentals of Biostatistics, 4 th Edition Duxbury Press, International Thomson Publishing Company, 995 I. ÚVOD vv této přednášce budeme hovořit o jednovýběrových a dvouvýběrových testech týkajících se střední hodnoty (teoretického průměru) spojité náhodné veličiny, jakou je například porodní váha novorozenců. vve všech případech budeme vycházet z předpokladu, že sledovaná náhodná veličina má normální rozdělení N(μ,σ ).

II. Formalismus Testů Hypotéz v v Formalismus testů hypotéz začíná vyslovením medicínské hypotézy, která poskytuje věcný základ formulaci statistické nulovéhypotézy (H 0 ), zde hypotézy o střední (průměrné) hodnotě sledované náhodné veličiny (tj. parametru μ). Vedlenulové hypotézyje dále třeba zformulovat tzv. alternativní hypotézu (H ), která popisuje, jaká situace nastává v případě neplatnosti H 0. Dalším krokem je zvolení hladiny pravděpodobnosti chyby I. druhu, kterou jsme ochotni v našem testu tolerovat. Značíme ji obvykle α a nazýváme ji také hladinou významnosti testu ( significance level of a test). Jedná se o pravděpodobnost, s jakou zamítneme nulovou hypotézu v H 0 případě, že platí. Obvyklou volbou hladiny významnosti je α = 0.05, případně 0.0 nebo 0.00. II. Formalismus Testů Hypotéz (pokr.) v Dalším krokem je volba testové statistiky. Jedná se o náhodnou veličinu, která je navržena tak, abychom uměli určit její statistické rozdělení, např. N(0,). v Hodnocení statistické hypotézy vychází z dosažené hodnoty testové statistiky, kterou porovnáváme s tzv. kritickou hodnotou odpovídajícího rozdělení na hladiněα. Překročíli hodnota testové statistiky kritickou hodnotu, zamítáme H 0 na hladině významnosti α. II. Formalismus Testů Hypotéz (pokr.) v Ekvivalentně můžeme posoudit výsledek testu na základě tzv. dosažené hladiny významnosti (p-value, p), která udávápravděpodobnost, s jakou bychom za předpokladu platnosti nulové hypotézy mohli obdržet výsledek přinejmenším tak extrémní, jako je výsledek pozorovaný. v Má-li dosažená hladina významnosti p hodnotu nižší než je zvolená hladina významnosti testu α, pak obdržený výsledek je významný na této hladině významnosti a zamítáme nulovou hypotézu H 0.

III. Jednovýběrový z-test při známé hodnotěσ v Řekněme, že máme k dispozici dlouhodobé údaje o porodní váze novorozenců v České republice, na jejichž základě jsme zjistili, že průměrnáporodní váha novorozenců v ČR má hodnotu μ 0 = 3. kg a směrodatná odchylka máhodnotu σ 0 = 0.6 kg. V tomto případě můžeme předpokládat, že porodní váha novorozenců v ČR se řídí normálním rozdělením, tedy N(μ 0,σ 0 ) = N(3., 0.36). v Data získaná z místní spádovénemocnice ukazují, že průměrnáporodní váha 00 novorozenců zde narozených v průběhu posledních tří let má hodnotu.8 kg. III. Jednovýběrový z-test při známé hodnotěσ Motivace: naším cílem bude testovat hypotézu, zda je průměrná porodní váha novorozenců narozených v místní spádové nemocnici v průběhu posledních tří let nižšínež hodnota dlouhodobého republikového průměru. v H 0 : μ = μ 0, přičemž σ = σ 0. v H : μ < μ 0, přičemž σ = σ 0. v Zvolme hladinu významnosti α x µ v Testová statistika: z = 0 ~ N(0,) 0 σ / n H hladiněαv případě, že platí z < z α, nebo ekvivalentně v případě, že dosažená hladina významnosti p jednostranného testu bude menší než α. III. Jednovýběrový z-test při známé hodnotěσ Provedení testu: v H 0 : μ = 3., přičemž σ = 0.6. v H : μ <3., přičemž σ = 0.6. v Hladinavýznamnosti α = 5%. x µ 0.8 3. v Testová statistika: z = = = 6.66 ~ N(0,) σ / n 0.6/ 00 v Testové kritérium: 6.66 < z0. 05 =.645 Alternativně, dosažená hladina významnosti má hodnotu p =3.8*0-8 < 0.05. v Závěr: Zamítáme nulovou hypotézu, že průměrná porodní váha novorozenců v místní spádové nemocnici se neliší od celostátního průměru České republiky, ve prospěch H. 3

IV. Jednovýběrový t-test při neznámé hodnotěσ v Pokračujme v našem příkladě o porodní váze novorozenců v České republice, ve kterém jsme uvedli, že průměrná porodní váha novorozenců v ČR má hodnotu μ 0 = 3. kg. Předpokládejme ovšem, že směrodatná odchylka není známa, což je v praxi nejčastější případ. Hodnota σ musí tedy být odhadována z dat pomocí výběrové směrodatné odchylky s a modifikovaná testová statistika vede v tomto případě na studentovo t-rozdělení. v Předpokládejme tedy, že datazískaná z místní spádové nemocnice ukazují, že průměrnáporodní váha 00 novorozenců zde narozených v průběhu posledních tří let má hodnotu.8 kg a odhad směrodatné odchylky σ máhodnou s = 0.85 kg. IV. Jednovýběrový t-test při neznámé hodnotěσ Motivace: testujmehypotézu, že průměrná porodní váha novorozenců narozených v místní spádové nemocnici v průběhu posledních tří let nižší než hodnota dlouhodobého republikového průměru. v H 0 : μ = μ 0, přičemž σ odhadujeme pomocí s. v H : μ < μ 0, přičemž σ odhadujeme pomocí s. v Zvolme hladinu významnosti α x µ v Testová statistika: t = 0 ~ tn 0 s / n H hladiněαv případě, že platí t < t ( α n ), nebo ekvivalentně v případě, že dosažená hladina významnosti jednostranného testu bude menší než α. III. Jednovýběrový t-test při neznámé hodnotěσ Provedení testu: v H 0 : μ = 3., přičemž odhad σ má hodnotu s = 0.85. v H : μ <3., přičemž odhad σ má hodnotu s = 0.85. v Hladinavýznamnosti α = 5%. x µ.8 3. v Testová statistika: t = = = 4.06 s / n 0.85/ 00 0 ~ t99 v Testové kritérium: 4.06 < t99 (0.05) =.66 Alternativně, dosažená hladina významnosti má na základě t-rozdělení hodnotu p =4.*0-6 < 0.05. v Závěr: Zamítáme nulovou hypotézu, že průměrná porodní váha novorozenců v místní spádové nemocnici se neliší od celostátního průměru České republiky, ve prospěch H. 4

' V. Dvouvýběrové testy v Předpokládejme nyní, že jsme získali data o porodní váze novorozenců ze dvou různých spádových nemocnic, přičemž odhady směrodatných odchylek naznačují odlišnou variabilitu v obou souborech. v V případě, že hodnoty σ a σ nejsou známy, vede problém porovnání průměrných hodnot porodních vah novorozenců narozených v těchto dvou nemocnicích k tzv. dvouvýběrovému t-testu. Kdyby hodnoty σ a σ známy byly, mohli bychom opět použít z-test založený na normálním rozdělení rozdílů průměrných hodnot x a x. V. Dvouvýběrové testy a) Dvouvýběrový z-test při známých hodnotách σ a σ : Při známých hodnotách σ a σ mátestová statistika normální rozdělení: σ σ z = x + x ~ N µ µ, n n b) Dvouvýběrový t-test při neznámých hodnotách σ a σ : x x t = t ', přičemž testová statistika t má na d s s + základě Satterthwaitovy n n aproximace počet stupňů volnosti d roven přibližně: ( s / n + s / n) d' ( s / n ) /( n ) + ( s / n ) /( n ) V. Dvouvýběrový t-test při neznámých hodnotách σ a σ Motivace: testujmehypotézu rovnosti průměrných porodních vah novorozenců narozených ve dvou různých spádových nemocnicích v průběhu let 00-003. v H 0 : μ = μ, přičemž σ σ. vh : μ μ, přičemž σ σ. v Zvolme hladinu významnosti α x x ( s / n + s / n) t = t, d d ' = v Testová statistika: s s ( s / n) /( n ) + ( s / n) /( n + n n hladiněαv případě, že platí: t > t d ' ( α / ), nebo ekvivalentně v případě, že dosažená hladina významnosti oboustranného testu bude menší než α. ) 5

V. Dvouvýběrový t-test při neznámých hodnotách σ a σ Provedení: předpokládejme, že údaje o porodních vahách z obou nemocnic jsou následující: x =.8, s = 0.85, n = 5, x = 3., s = 0.6, n = 60 v H 0 : μ = μ, přičemž σ σ. vh : μ μ, přičemž σ σ. v Zvolme hladinu významnosti α = 0.05 v Testová statistika:.8 3. (.85 / 5 +.6 / 60) t = = 3.0, d' = = 3. 0.85 0.6 (.85 / 5) / 4 + (.6 / 60) / 59 + 5 60 v Závěr: Vzhledem k tomu, že t = 3.0 > t3 (0.95) =.98, zamítáme nulovou hypotézu na hladině významnosti 5%. Podobně dosažená hladina významnosti oboustranného testu má p-hodnotu 0.00 < 0.05, takže i na základě tohoto kritéria zamítáme H 0 o shodnosti středních hodnot. VI. Párový t-test v Motivace: Je všeobecně známo, že používání orální antikoncepce (OA) je u žen obecně doprovázeno snížením jejich tělesné hmotnosti. V důsledku známé souvislosti mezi tělesnou hmotností a krevním tlakem bychom dále mohli například usuzovat, že ženy, které používají OA mají v průměru také nižší hodnoty systolického krevního tlaku. v Hodnocení velikosti změn (diferencí d i ) hodnot spojité náhodné veličiny, jakou je např. systolický krevní tlak, u týchž subjektů v různých experimentálních podmínkách provádíme obecně pomocí párového t-testu. Tato situace vede opět k jednovýběrovému t-testu aplikovanému na hodnoty rozdílů sledovanénáhodné veličiny. I zde je třeba mít na paměti, že požadujeme normalitu, v tomto případě normalitu rozdílů. Ta je ovšem často splněna i v případech, kdy původní veličina předpoklad normálního rozdělení striktně nesplňuje. VI. Párový t-test v H 0 : d = 0, přičemž σ d odhadujeme pomocí s d. v H : d 0, přičemž σ d odhadujeme pomocí s d. v Zvolme hladinu významnosti α (např. 0.05) n v Označme d = di / n průměrnou hodnotu rozdílů d i i= d 0 v Testová statistika: t = ~ tn s / n d H0 hladiněαv případě, že platí: t > t n ( α / ), resp. ekvivalentně v případě, že dosažená hladina významnosti jednostranného testu bude menší než α. 6

VI. Párový t-test ID STK (OA-) STK (OA+) d 5 8 3 v Příklad: Souvislost používání orální antikoncepce (OA) a průměrné hodnoty systolického krevního tlaku 3 4 5 6 0 9 5 38 5 06 8 45 3-9 6 3 6 8 05 09 4 9 04 0-0 5 v Příklad řešení v R: VI. Párový t-test x <- c(5,,0,9,5,38,6,05,04,5) y <- c(8,5,06,8,,45,3,09,0,) > t.test(y,x,paired=true) Paired t-test data: y and x t = 3.34, df = 9, p-value = 0.00884 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval:.53398 8.06603 sample estimates: mean of the differences 4.8