Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Podobné dokumenty
Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Ing. Michael Rost, Ph.D.

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

Stručný úvod do testování statistických hypotéz

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Testy statistických hypotéz

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Statistika, Biostatistika pro kombinované studium. Jan Kracík

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

= = 2368

Normální (Gaussovo) rozdělení

Testování statistických hypotéz

Normální (Gaussovo) rozdělení

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

diskriminaci žen letní semestr = výrok, o jehož pravdivosti chceme rozhodnout tvrzení o populaci, o jehož platnosti rozhodujeme

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

12. cvičení z PST. 20. prosince 2017

4ST201 STATISTIKA CVIČENÍ Č. 7

Testování statistických hypotéz. Obecný postup

Jednostranné intervaly spolehlivosti

Opakování. Neparametrické testy. Pořadí. Jednovýběrový Wilcoxonův test. t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality

Příklad datového souboru. Pravděpodobnost vs. statistika. Formální definice. Teorie odhadu

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

15. T e s t o v á n í h y p o t é z

Testování statistických hypotéz

Matematická statistika. Testy v. v binomickém. Test pravděpodobnosti. Test homogenity dvou. Neparametrické testy. statistika. Testy v.

STATISTICKÉ TESTY VÝZNAMNOSTI

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze

Plánovací diář a Google Calendar

Pravděpodobnost a aplikovaná statistika

Statistika. Testování hypotéz - statistická indukce Parametrické testy. Roman Biskup

Vymezení důležitých pojmů. nulová hypotéza, alternativní hypotéza testování hypotézy hladina významnosti (alfa) chyba I. druhu, chyba II.

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Testování uživatelského rozhraní

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Testy. Pavel Provinský. 19. listopadu 2013

Testy nezávislosti kardinálních veličin

Příklady na testy hypotéz o parametrech normálního rozdělení

Zápočtová práce STATISTIKA I

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

5 Parametrické testy hypotéz

Náhodné veličiny, náhodné chyby

Fisherův exaktní test

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Neparametrické metody

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

15. T e s t o v á n í h y p o t é z

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

PRAVDĚPODOBNOST A STATISTIKA

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

Testování hypotéz. 4. přednáška

Aproximace binomického rozdělení normálním

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Testování statistických hypotéz

12. prosince n pro n = n = 30 = S X

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

Charakteristika datového souboru

Přednáška X. Testování hypotéz o kvantitativních proměnných

Uni- and multi-dimensional parametric tests for comparison of sample results

STATISTICKÉ TESTY VÝZNAMNOSTI

Design Experimentu a Statistika - AGA46E

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

5. T e s t o v á n í h y p o t é z

Úvod do testování hypotéz

Intervalové Odhady Parametrů

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

Kvantitativní testování porovnání Alza.cz a Mall.cz

You created this PDF from an application that is not licensed to print to novapdf printer (

Tomáš Karel LS 2012/2013

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

STATISTICKÉ HYPOTÉZY

Bootstrap - konfidenční intervaly a testy

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA ELEKTROTECHNICKÁ

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Neparametrické testy

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

Seminář 6 statistické testy

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

prosince oboustranný symetrický 95% interval spolehlivosti pro střední hodnotu životnosti τ. X i. X = 1 n.. Podle CLV má veličina

Transkript:

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin EuroMISE Centrum I. ÚVOD vv této přednášce budeme hovořit o jednovýběrových a dvouvýběrových testech týkajících se střední hodnoty (teoretického průměru) spojité náhodné veličiny, jakou je například porodní váha novorozenců. vve všech případech budeme vycházet z předpokladu, že sledovaná náhodná veličina má normální rozdělení N(μ,σ ). Kontakt: Literatura: Obecné informace Zvárová, J.: Základy statistiky pro biomedicínské obory I. Vydavatelství Karolinum, UK Praha Zvára, K.: Rosner, B.: EuroMISE centrum Doc. Zdeněk Valenta, Ph.D. Tel.: 66 53 64 (sekretariát) Fax: 86 58 453 http://www.euromise.cz valenta@euromise.cz Biostatistika. Vydavatelství Karolinum, UK Praha Fundamentals of Biostatistics, 4 th Edition Duxbury Press, International Thomson Publishing Company, 995 v v II. Formalismus Testů Hypotéz Formalismus testů hypotéz začíná vyslovením medicínské hypotézy, která poskytuje věcný základ formulaci statistické nulové hypotézy (H ), zde hypotézy o střední (průměrné) hodnotě sledované náhodné veličiny (tj. parametru μ). Vedle nulové hypotézy je dále třeba zformulovat tzv. alternativní hypotézu (H ), která popisuje, jaká situace nastává v případě neplatnosti H. Dalším krokem je zvolení hladiny pravděpodobnosti chyby I. druhu, kterou jsme ochotni v našem testu tolerovat. Značíme ji obvykle α a nazýváme ji také hladinou významnosti testu ( significance level of a test). Jedná se o pravděpodobnost, s jakou zamítneme nulovou hypotézu v H případě, že platí. Obvyklou volbou hladiny významnosti je α =.5, případně. nebo..

II. Formalismus Testů Hypotéz (pokr.) v Dalším krokem je volba testové statistiky. Jedná se o náhodnou veličinu, která je navržena tak, abychom uměli určit její statistické rozdělení, např. N(,). v Hodnocení statistické hypotézy vychází z dosažené hodnoty testové statistiky, kterou porovnáváme s tzv. kritickou hodnotou odpovídajícího rozdělení na hladině α. Překročíli hodnota testové statistiky kritickou hodnotu, zamítáme H na hladině významnosti α. v Řekněme, že máme k dispozici dlouhodobé údaje o porodní váze novorozenců v České republice, na jejichž základě jsme zjistili, že průměrná porodní váha novorozenců v ČR má hodnotu μ = 3. kg a směrodatná odchylka má hodnotu σ =.6 kg. V tomto případě můžeme předpokládat, že porodní váha novorozenců v ČR se řídí normálním rozdělením, tedy N(μ,σ ) = N(3.,.36). v Data získaná z místní spádové nemocnice ukazují, že průměrná porodní váha novorozenců zde narozených v průběhu posledních tří let má hodnotu.8 kg. II. Formalismus Testů Hypotéz (pokr.) v Ekvivalentně můžeme posoudit výsledek testu na základě tzv. dosažené hladiny významnosti (p-value, p), která udává pravděpodobnost, s jakou bychom za předpokladu platnosti nulové hypotézy mohli obdržet výsledek přinejmenším tak extrémní, jako je výsledek pozorovaný. v Má-li dosažená hladina významnosti p hodnotu nižší než je zvolená hladina významnosti testu α, pak obdržený výsledek je významný na této hladině významnosti a zamítáme nulovou hypotézu H. Motivace: naším cílem bude testovat hypotézu, zda je průměrná porodní váha novorozenců narozených v místní spádové nemocnici v průběhu posledních tří let nižší než hodnota dlouhodobého republikového průměru. v H : μ = μ, přičemž σ = σ. v H : μ < μ, přičemž σ = σ. x µ v Testová statistika: z = ~ N(,) H σ / n hladině αv případě, že platí z < z α, nebo ekvivalentně v případě, že dosažená hladina významnosti p

Provedení testu: v H : μ = 3., přičemž σ =.6. v H : μ <3., přičemž σ =.6. v Hladina významnosti α = 5%. x µ.8 3. v Testová statistika: z = = = 6.66 ~ σ / n.6 / N (,) v Testové kritérium: 6.66 < z. 5 =.645 Alternativně, dosažená hladina významnosti má hodnotu p =3.8* -8 <.5. v Závěr: Zamítáme nulovou hypotézu, že průměrná porodní váha novorozenců v místní spádové nemocnici se neliší od celostátního průměru České republiky, ve prospěch H. IV. Jednovýběrový t-test při neznámé hodnotě σ Motivace: testujme hypotézu, že průměrná porodní váha novorozenců narozených v místní spádové nemocnici v průběhu posledních tří let nižší než hodnota dlouhodobého republikového průměru. v H : μ = μ, přičemž σ odhadujeme pomocí s. v H : μ < μ, přičemž σ odhadujeme pomocí s. x µ v Testová statistika: t = ~ tn s / n H hladině αv případě, že platí t < t n ( α), nebo ekvivalentně v případě, že dosažená hladina významnosti IV. Jednovýběrový t-test při neznámé hodnotě σ v Pokračujme v našem příkladě o porodní váze novorozenců v České republice, ve kterém jsme uvedli, že průměrná porodní váha novorozenců v ČR má hodnotu μ = 3. kg. Předpokládejme ovšem, že směrodatná odchylka není známa, což je v praxi nejčastější případ. Hodnota σ musí tedy být odhadována z dat pomocí výběrové směrodatné odchylky s a modifikovaná testová statistika vede v tomto případě na studentovo t-rozdělení. v Předpokládejme tedy, že data získaná z místní spádové nemocnice ukazují, že průměrná porodní váha novorozenců zde narozených v průběhu posledních tří let má hodnotu.8 kg a odhad směrodatné odchylky σ má hodnou s =.85 kg. III. Jednovýběrový t-test při neznámé hodnotě σ Provedení testu: v H : μ = 3., přičemž odhad σ má hodnotu s =.85. v H : μ <3., přičemž odhad σ má hodnotu s =.85. v Hladina významnosti α = 5%. x µ.8 3. v Testová statistika: t = = = 4.6 s / n.85/ ~ v Testové kritérium: 4.6 < t99(.5) =.66 Alternativně, dosažená hladina významnosti má na základě t-rozdělení hodnotu p =4.* -6 <.5. v Závěr: Zamítáme nulovou hypotézu, že průměrná porodní váha novorozenců v místní spádové nemocnici se neliší od celostátního průměru České republiky, ve prospěch H. t 99

V. Dvouvýběrové testy v Předpokládejme nyní, že jsme získali data o porodní váze novorozenců ze dvou různých spádových nemocnic, přičemž odhady směrodatných odchylek naznačují odlišnou variabilitu v obou souborech. v V případě, že hodnoty σ a σ nejsou známy, vede problém porovnání průměrných hodnot porodních vah novorozenců narozených v těchto dvou nemocnicích k tzv. dvouvýběrovému t-testu. Kdyby hodnoty σ a σ známy byly, mohli bychom opět použít z-test založený na normálním rozdělení rozdílů průměrných hodnot x a x. V. Dvouvýběrový t-test při neznámých hodnotách σ a σ Motivace: testujme hypotézu rovnosti průměrných porodních vah novorozenců narozených ve dvou různých spádových nemocnicích v průběhu let -3. v H : μ = μ, přičemž σ σ. vh : μ μ, přičemž σ σ. x x t = v Testová statistika: s s n n hladině αv případě, že platí: t t '( α / ), nebo ekvivalentně v případě, že dosažená hladina významnosti oboustranného testu bude menší než α. t d ', d' = ( s > d ( s / n s / n ) / n ) /( n ) ( s / n ) /( n ) V. Dvouvýběrové testy a) Dvouvýběrový z-test při známých hodnotách σ a σ : Při známých hodnotách σ a σ mátestová statistika normální rozdělení: σ σ z = x x ~ N µ µ, n n b) Dvouvýběrový t-test při neznámých hodnotách σ a σ : x x t = t ', d přičemž testová statistika t má na s s základě Satterthwaitovy n n aproximace počet stupňů volnosti d roven přibližně: d' ( s / n ) ( s / n s / n) /( n ) ( s / n ) /( n ) V. Dvouvýběrový t-test při neznámých hodnotách σ a σ Provedení: předpokládejme, že údaje o porodních vahách z obou nemocnic jsou následující: x =.8, s =.85, n = 5, x = 3., s =.6, n 6 = v H : μ = μ, přičemž σ σ. vh : μ μ, přičemž σ σ. =.5 v Testová statistika: t =.8 3..85.6 5 6 = 3., (.85 / 5.6 / 6) d' = = 3. (.85 /5) / 4 (.6 /6) / 59 v Závěr: Vzhledem k tomu, že t = 3. > t3 (.95) =.98, zamítáme nulovou hypotézu na hladině významnosti 5%. Podobně dosažená hladina významnosti oboustranného testu má p-hodnotu. <.5, takže i na základě tohoto kritéria zamítáme H o shodnosti středních hodnot.

v Motivace: Je všeobecně známo, že používání orální antikoncepce (OA) je u žen obecně doprovázeno snížením jejich tělesné hmotnosti. V důsledku známé souvislosti mezi tělesnou hmotností a krevním tlakem bychom dále mohli například usuzovat, že ženy, které používají OA mají v průměru také nižší hodnoty systolického krevního tlaku. v Hodnocení velikosti změn (diferencí d i ) hodnot spojité náhodné veličiny, jakou je např. systolický krevní tlak, u týchž subjektů v různých experimentálních podmínkách provádíme obecně pomocí párového t-testu. Tato situace vede opět k jednovýběrovému t-testu aplikovanému na hodnoty rozdílů sledované náhodné veličiny. I zde je třeba mít na paměti, že požadujeme normalitu, v tomto případě normalitu rozdílů. Ta je ovšem často splněna i v případech, kdy původní veličina předpoklad normálního rozdělení striktně nesplňuje. v Příklad: Souvislost používání orální antikoncepce (OA) a průměrné hodnoty systolického krevního tlaku ID 3 4 5 6 8 9 STK (OA-) 5 9 5 38 6 5 4 5 STK (OA) 8 5 6 8 45 3 9 d 3 3-9 6 4 - v H : d =, přičemž σ d odhadujeme pomocí s d. v H : d, přičemž σ d odhadujeme pomocí s d. (např..5) n v Označme d = d i / n průměrnou hodnotu rozdílů d i i= v Testová statistika: d t = ~ tn s / n d H hladině αv případě, že platí: t > t n ( α / ), resp. ekvivalentně v případě, že dosažená hladina významnosti v Příklad řešení v R: x <- c(5,,,9,5,38,6,5,4,5) y <- c(8,5,6,8,,45,3,9,,) > t.test(y,x,paired=true) Paired t-test data: y and x t = 3.34, df = 9, p-value =.884 alternative hypothesis: true difference in means is not equal to 95 percent confidence interval:.53398 8.663 sample estimates: mean of the differences 4.8