Testování hypotéz a jeho metodika 2 Jasnovidec?... 4 Pojmy... 6 Postup... 7 Chyby... 8



Podobné dokumenty
Testy pro porovnání vlastností dvou skupin

Testování statistických hypotéz

Ing. Michael Rost, Ph.D.

Testování statistických hypotéz

4ST201 STATISTIKA CVIČENÍ Č. 7

Testování statistických hypotéz

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Normální (Gaussovo) rozdělení

= = 2368

Stručný úvod do testování statistických hypotéz

Neparametrické metody

Jednostranné intervaly spolehlivosti

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Testy statistických hypotéz

15. T e s t o v á n í h y p o t é z

Testování statistických hypotéz. Obecný postup

12. cvičení z PST. 20. prosince 2017

Testování hypotéz. 4. přednáška

Normální (Gaussovo) rozdělení

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

PRAVDĚPODOBNOST A STATISTIKA

χ 2 testy. Test nekorelovanosti.

12. prosince n pro n = n = 30 = S X

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Pravděpodobnost a aplikovaná statistika

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

15. T e s t o v á n í h y p o t é z

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Testy. Pavel Provinský. 19. listopadu 2013

5. T e s t o v á n í h y p o t é z

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

2 ) 4, Φ 1 (1 0,005)

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

STATISTICKÉ TESTY VÝZNAMNOSTI

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

You created this PDF from an application that is not licensed to print to novapdf printer (

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

STATISTICKÉ HYPOTÉZY

diskriminaci žen letní semestr = výrok, o jehož pravdivosti chceme rozhodnout tvrzení o populaci, o jehož platnosti rozhodujeme

STATISTICKÉ TESTY VÝZNAMNOSTI

Statistické testování hypotéz II

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Náhodné veličiny, náhodné chyby

Neparametrické testy

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Tomáš Karel LS 2012/2013

Matematika III. 3. prosince Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Aproximace binomického rozdělení normálním

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Charakteristika datového souboru

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

5 Parametrické testy hypotéz

Cvičení ze statistiky - 8. Filip Děchtěrenko

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

Jana Vránová, 3. lékařská fakulta UK

KGG/STG Statistika pro geografy

prosince oboustranný symetrický 95% interval spolehlivosti pro střední hodnotu životnosti τ. X i. X = 1 n.. Podle CLV má veličina

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Příklad datového souboru. Pravděpodobnost vs. statistika. Formální definice. Teorie odhadu

Jednofaktorová analýza rozptylu

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Příklady na testy hypotéz o parametrech normálního rozdělení

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

Ranní úvahy o statistice

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

Zápočtová práce STATISTIKA I

Statistické metody uţívané při ověřování platnosti hypotéz

Cvičení ze statistiky - 9. Filip Děchtěrenko

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

Vymezení důležitých pojmů. nulová hypotéza, alternativní hypotéza testování hypotézy hladina významnosti (alfa) chyba I. druhu, chyba II.

Testování hypotéz Biolog Statistik: Matematik: Informatik:

Transkript:

Testování hypotéz Petr Pošík Části dokumentu jsou převzaty (i doslovně) z Mirko Navara: Pravděpodobnost a matematická statistika, https://cw.felk.cvut.cz/lib/exe/fetch.php/courses/a6m33ssl/pms_print.pdf s laskavým svolením autora. Testování hypotéz a jeho metodika 2 Jasnovidec?........................................................................................................ 4 Pojmy............................................................................................................. 6 Postup............................................................................................................. 7 Chyby............................................................................................................. 8 ROC křivka........................................................................................................ 9 Volba κ........................................................................................................... Formulace hypotéz................................................................................................. p-hodnota......................................................................................................... 2 Významnost?...................................................................................................... 3 Kuchařka pro testování hypotéz 4 Typický tvar testu.................................................................................................. 5 Test µ, σ známe.................................................................................................... 6 Test µ, σ neznáme.................................................................................................. 7 Př: Oboustr. test µ.................................................................................................. 8 Test σ 2............................................................................................................ 9 Neparametrické testy 2 Neparametrické?................................................................................................... 2 Znaménkový test.................................................................................................. 22 Jednovýběrový Wilcoxonův test..................................................................................... 23

Testování hypotéz a jeho metodika 2 / 23 Testování hypotéz Mnoho statistiků trpí nejrůznějšími psychickými poruchami, protože v mládí bylo mnoho jejich hypotéz zamítnuto. P. Pošík c 25 A6M33SSL: Statistika a spolehlivost v lékařství 3 / 23 :-) Motivační příklad: Jasnovidec? Experiment, kterým chceme ověřit, zda osoba má (větší či menší) jasnovidecké schopnosti: Máme balíček karet o 4 barvách (káry, piky,...) se stejným počtem karet kaˇzdé barvy. Vytáhneme z balíčku kartu, poloˇzíme rubem nahoru, testovaná osoba řekne svůj tip, my jej zkontrolujeme, kartu vrátíme do balíčku, balíček zamícháme. Opakujeme n-krát, např. 25krát. Výsledek experimentu: testovaná osoba se trefila v X případech z n. Jaké rozhodovací pravidlo byste pouˇzili? Řekli byste, ˇze osoba je jasnovidec, kdyˇz se trefila v 25 případech z 25? Řekli byste, ˇze osoba je jasnovidec, kdyˇz se trefila v 6 nebo 7 případech z 25? Co kdyˇz se trefila v, 5, 2 případech? Jak postupovat systematicky? Osoba můˇze být v jednom ze dvou skutečných stavů :. obyčejný člověk, pak pravděpodobnost, ˇze kartu určí správně, je p = p = 4, nebo 2. jasnovidec, pak p > 4. Výsledkem vašeho testu mohou být 2 rozhodnutí:. prohlásíte osobu za obyčejného člověka, nebo 2. prohlásíte osobu za jasnovidce (zamítnete obyčejnost ). P. Pošík c 25 A6M33SSL: Statistika a spolehlivost v lékařství 4 / 23 2

Motivační příklad: Jasnovidec? (Pokr.) Pouˇzijme test: Osobu označíme za jasnovidce (zamítneme obyčejnost ), trefí-li se v 25 případech z 25. Můˇzeme s tímto pravidlem označit obyčejného člověka za jasnovidce? Ano. Jaká je pravděpodobnost, ˇze se to stane? P[zamítáme obyčejnost ve skutečnosti obyčejný ] = P[X = 25 p = p ] = ( ) 25. = 5 4 Pro obecný test: Osobu označíme za jasnovidce (zamítneme obyčejnost ), trefí-li se alespoň v c případech z n. Jaké rozdělení má X pro obyčejného člověka? X Bi(n, p ) Pravděpodobnost, ˇze obyčejného člověka označíme za jasnovidce P[zam. obyč skut. obyč ] = P[X c p = p ] = = n i=c p Bi(n,p )(i) = F Bi(n,p )(c ) PDF of X.2.5..5 5 5 2 25 X CDF of X.5 5 5 2 25 X c 8 9 2 3 4 5 2 25 P[X c p = p ].27.5.7.3..3.9.2 8 5 Pravděpodobnost, ˇze by obyčejný člověk (náhodou) uhodl 4 nebo více karet z 25 je cca /. Stačí vám to jako důkaz toho, ˇze onen člověk není obyčejný (ˇze je jasnovidec)? P. Pošík c 25 A6M33SSL: Statistika a spolehlivost v lékařství 5 / 23 Pojmy Hypotéza H je tvrzení o vlastnostech rozdělení pravděpodobnosti pozorované náhodné veličiny X s distribuční funkcí F X (x, θ) nebo náhodného vektoru (X, Y) se sdruˇzenou distribuční funkcí F XY (x, y θ), např: Střední hodnota poloměru vyráběných hřídelí se shoduje s nominální hodnotou. Úmrtnost při stejném druhu operace na 3 různých pracovištích je stejná. Pacienti s AIDS mají červené krvinky menší neˇz zdraví lidé. Rozdělení výšky dospělých muˇzů v ČR je normální. Pouˇzívání léku XY zvyšuje riziko neˇzádoucích účinků alespoň o 5 %. Test statistické hypotézy je matematický postup, jímˇz ověřujeme hypotézu. Nulová hypotéza H je ta, jejíˇz platnost ověřujeme. Alternativní hypotézu H A stavíme proti H. POZOR: Nelze prokázat platnost statistické hypotézy! Na základě realizace náhodného výběru bud lze rozhodnout, že hypotéza H není věrohodná (pak zamítáme H a vědomě podstupujeme malé riziko chybného rozhodnutí), nebo nelze zamítnout H, ale v tom případě nevíme, zda je to proto, ˇze H skutečně platí, nebo jen nemáme dostatek dat (dostatečný rozsah výběru) na její zamítnutí. P. Pošík c 25 A6M33SSL: Statistika a spolehlivost v lékařství 6 / 23 3

Průběh testu Typický postup při testu hypotézy:. Formulujeme H a H A. 2. Zvolíme vhodnou testovou statistiku T (kritérium) takovou, ˇze její hodnoty co nejtěsněji souvisejí s platností hypotézy H, její realizaci jsme schopni spočítat z realizace náhodného výběru a její rozdělení za předpokladu platnosti H známe nebo jsme schopni odvodit. 3. Zvolíme práh κ R (kritickou hodnotu), pomocí něhoˇz dokáˇzeme rozhodnout o H : pro T > κ zamítáme H, pro T κ nezamítáme H. 4. Získáme realizaci náhodného výběru x a provedeme test. Test hypotézy lze povaˇzovat za binární klasifikátor: jeho úkolem je bud zařadit realizaci x do normální populace (nezamítne H ), nebo zařadit realizaci x do anomální populace (zamítne H ve prospěch H A ). Testová statistika T je náhodnou veličinou (je to funkce náhodného výběru). Rozhodování se proto neobejde bez chyb. P. Pošík c 25 A6M33SSL: Statistika a spolehlivost v lékařství 7 / 23 Chyby I. a II. druhu Rozhodnutí (výsledek testu) Stav světa H nezamítnuta H zamítnuta H platí OK Chyba I. druhu True negative (TN) False positive (FP) H neplatí Chyba II. druhu OK False negative (FN) True positive (TP) Říkáme, ˇze výsledek testu je pozitivní, kdyˇz můˇzeme zamítnout H, a negativní, kdyˇz nemůˇzeme. Chyba I. druhu: zamítneme H, která ve skutečnosti platí. Její pravděpodobnost α(κ) je nerostoucí funkce prahu κ a nazýváme ji hladinou významnosti testu. Chyba II. druhu: nezamítneme H, která neplatí. Její pravděpodobnost β(κ) je neklesající funkcí prahu κ. Číslo β pak nazýváme sílou testu. Hodnotu β lze stanovit jen tehdy, známe-li rozdělení T za předpokladu platnosti H A! V lékařské literatuře se často mluví o následujících veličinách: Specificita (jinak také true negative rate, TNR): p spec = TNR = TN = P[H p TN + není zamítnuta H platí] = α. p FP Senzitivita (jinak také true positive rate, TPR, nebo recall): p senz = TPR = TP = P[H p TP + je zamítnuta H neplatí] = β. p FN P. Pošík c 25 A6M33SSL: Statistika a spolehlivost v lékařství 8 / 23 4

ROC křivka Reciever operating characteristic (ROC): závislost významnosti testu α (vodorovná osa) a síly testu β (svislá osa). Parametrem křivky je kritická hodnota κ..5.5.5 β =.226 α =. β =.5 α =.3 β =.26 α =.7.5.5.5 3 32 33 34 35 36 37.5 3 32 33 34 35 36 37 3 32 33 34 35 36 37 β =.34 α =.5.9.8.5.7 3 32 33 34 35 36 37.5.5 β =.476 α =. 3 32 33 34 35 36 37 Síla testu β.6.5.4.3.2..2.4.6.8 Hladina významnosti α P. Pošík c 25 A6M33SSL: Statistika a spolehlivost v lékařství 9 / 23 Volba kritické hodnoty Volbou kritické hodnoty κ sniˇzujeme riziko jedné chyby, ale zároveň zvyšujeme riziko druhé. Hodnotu κ obecně volíme tak, abychom se přiblíˇzili bezchybné klasifikaci (α =, β = ), tj. bodu (,) v grafu ROC. Jedinou moˇzností, jak sníˇzit riziko obou chyb zároveň, je získat více dat! Moˇzná kritéria pro volbu prahu κ: α(κ) = β(κ) min κ (α(κ)+ β(κ)) min κ e(α(κ), β(κ)), např. min κ (aα(κ)+bβ(κ)), tj. minimalizace výplatní funkce, α(κ) = předem zvolená malá hodnota. Většinou se pouˇzívá poslední moˇznost: nalezení κ je nejsnazší, nepotřebujeme znát rozdělení anomální skupiny (tj. rozdělení, pokud H neplatí). Kritická hodnota testu κ se volí tak, aby chyba I. druhu nastávala s pravděpodobností α nebo menší (nelze-li dosáhnout rovnosti). Tradičně se volí α =.5 nebo α =.. Hodnoty T > κ (odpovídají výsledkům málo pravděpodobným za předpokladu platnosti H ) povaˇzujeme za statisticky významné (a zamítáme H ). Hodnoty T κ (odpovídají výsledkům, jejichˇz pravděpodobnost není dostatečně malá při platnosti H ) nejsou statisticky významné (a H proto nezamítáme, ani nepotvrzujeme). P. Pošík c 25 A6M33SSL: Statistika a spolehlivost v lékařství / 23 5

Formulace hypotéz Obvyklým cílem testování hypotéz je stanovit, zda nějaká spekulativní hypotéza o pozorovaném jevu má podporu v datech. O H se předpokládá, ˇze platí, dokud data neposkytnou dostatek důkazů pro její zamítnutí ve prospěch H A. Proto obvykle: H vyjadřuje shodu s předpoklady, neexistenci rozdílu mezi skupinami, neexistenci vlivu, nezávislost, apod. (protoˇze v těchto případech jsme obvykle schopni odvodit rozdělení testové statistiky), zatímco H A vyjadřuje naši spekulativní hypotézu, pro níˇz hledáme podporu v datech; vyjadřuje odchylku od předpokladů, významný rozdíl, existenci vlivu, závislosti, apod. H i H A mohou být jednoduchá hypotéza, jíˇz odpovídá jediná hodnota parametru, nebo sloˇzená hypotéza, jíˇz odpovídá více hodnot parametru. U sloˇzené hypotézy H poˇzadujeme, aby pravděpodobnost chyby I. druhu byla nejvýše α přes všechny hodnoty parametru vyhovující H. H a H A se často formulují tak, ˇze nejsou navzájem svými negacemi a nepokrývají celý prostor moˇzných hodnot parametru = chaos. Snadno se mu vyhneme, kdyˇz budeme formulovat nulovou hypotézu jako negaci alternativní. Je-li H A : θ > c, nevolíme H : θ = c, ale raději H : θ c. Největší riziko chyby I. druhu obvykle odpovídá případu θ = c, takˇze postup testu je stejný. P. Pošík c 25 A6M33SSL: Statistika a spolehlivost v lékařství / 23 Klasický a alternativní postup testu Předpoklad: Máme testovou statistiku T, která roste s parametrem θ (jehoˇz hodnota je předmětem testu) a má známé rozdělení při platné H. Klasický test hypotézy: Typický postup:. Zvolíme poˇzadovanou hladinu významnosti α. 2. Ze znalosti rozdělení T pro případ, ˇze platí H, určíme kritickou hodnotu κ tak, aby P[T > κ] α, tj. κ je příslušný kvantil rozdělení T: κ = q T ( α). 3. Porovnáme realizaci t a kritickou hodnotu κ a zamítneme H, pokud t > κ. Ekvivalentní postup: H zamítáme, pokud hodnota parametru θ platná pro H nepadne do ( α) intervalu spolehlivosti. Alternativní postup: zjištění mezní hladiny významnosti, při níˇz by pozorovaná hodnota t byla kritická, tj.. Ze znalosti rozdělení T zjistíme pravděpodobnost, s jakou statistika T nabývá hodnot ještě extrémnějších neˇz t za předpokladu, ˇze platí H. Této pravděpodobnosti říkáme dosaˇzená hladina významnosti a obvykle se značí P (nebo p-value, p-hodnota). 2. Dosaˇzenou hladinu významnosti P prostě zveřejníme (aby si kaˇzdý udělal závěr sám), nebo porovnáme se stanovenou poˇzadovanou hladinou významnosti a zamítneme H, pokud P < α. Dosaženou hladinu významnosti P lze interpretovat jako míru naší důvěry v platnost H. (Čím niˇzší, tím je výsledek významnější a tím větší máme právo H zamítnout.) P. Pošík c 25 A6M33SSL: Statistika a spolehlivost v lékařství 2 / 23 6

Statistická významnost vs. faktická významnost I sebemenší odchylka od předpokladů se s dostatečným rozsahem výběru ukáˇze jako statisticky významná. Označme jistou minimální odchylku, která pro nás bude uˇz fakticky významná. Interval Významnost spolehlivosti statistická skutečná Ne Moˇzná Ne Moˇzná Ano Moˇzná Ano Ano Ne Ne Ano Ne Zdaleka ne kaˇzdý efekt, který je statisticky významný, je významný i reálně. Pojem statistická významnost je tak lépe chápat jako statistickou rozeznatelnost. P. Pošík c 25 A6M33SSL: Statistika a spolehlivost v lékařství 3 / 23 Kuchařka pro testování hypotéz 4 / 23 Typický tvar testu Realizaci t testovací statistiky T, která roste s parametrem θ a pro H má známé rozdělení, porovnáme s kvantily příslušného rozdělení a H zamítneme při extrémních hodnotách (nepravděpodobných při platnosti H ). H H A H zamítáme, kdyˇz dosaˇzená významnost P θ c θ > c t > q T ( α) F T (t) θ c θ < c t < q T (α) F T (t) θ = c θ = c t > q T ( α 2 ) nebo t < q T( α 2 ) 2 min(f T(t), F T (t)) V literatuře se často setkáme i s následujícími formulacemi hypotéz, které se ale řeší stejně jako první dva výše uvedené případy: H θ = c θ = c H A θ > c θ < c P. Pošík c 25 A6M33SSL: Statistika a spolehlivost v lékařství 5 / 23 7

Recept: Test střední hodnoty N(µ, σ 2 ) při známém σ 2 Realizaci testové statistiky t = x c n σ porovnáme s kvantily normovaného normálního rozdělení: H H A H zamítáme, kdyˇz dosaˇzená významnost P µ c µ > c t > Φ ( α) Φ(t) µ c µ < c t < Φ (α) Φ(t) µ = c µ = c t > Φ ( α 2 ) nebo t < Φ ( α 2 ) 2( Φ( t )) P. Pošík c 25 A6M33SSL: Statistika a spolehlivost v lékařství 6 / 23 Recept: Test střední hodnoty N(µ, σ 2 ) při neznámém σ 2 Realizaci testové statistiky t = x c n s x porovnáme s kvantily Studentova rozdělení s n stupni volnosti: H H A H zamítáme, kdyˇz dosaˇzená významnost P µ c µ > c t > q t(n ) ( α) F t(n ) (t) µ c µ < c t < q t(n ) (α) F t(n ) (t) µ = c µ = c t > q t(n ) ( α 2 ) nebo t < q t(n )( α 2 ) 2( F t(n )( t )) P. Pošík c 25 A6M33SSL: Statistika a spolehlivost v lékařství 7 / 23 8

Příklad: Oboustranný test střední hodnoty Zadání: 26 pacientům jsme změřili koncentraci bílkovin v krevním séru: x = 34.46 g/l, s x = 5.835 g/l. Ověřte hypotézu, ˇze střední hodnota koncentrace bílkovin u pacientů tohoto typu je µ = 33.5 g/l, proti moˇznosti, ˇze se od této hodnoty liší. Poznámka: Protoˇze neznáme skutečný rozptyl σ 2, měli bychom pouˇzít Studentovo rozdělení. Protoˇze ale máme dostatečně velký vzorek, můˇzeme jej aproximovat normálním rozdělením. Řešení : Interval spolehlivosti. Nepokryje-li 95% interval spolehlivosti I hodnotu µ, zamítneme H : I = x± s x n Φ ( α 2 ) = = 34.46± 5.835 26.96 g/l.8 Rozdělení výb. průměrů X: N(34.46,.58) = 34.46±.78 g/l I = (33.68, 35.24) g/l Předpokládaná hodnota µ = 33.5 g/l nepatří do tohoto intervalu, coˇz je výsledek, který bychom pozorovali v méně neˇz 5 % případů, kdyby skutečně platilo µ = 33.5 g/l. Proto zamítáme H na hladině významnosti 5 %..6.4 α 2 =.25 α =.95.2p 2 =.78 α 2 =.25 p 2 =.78 Řešení 2: Oboustranný test hypotézy. Formulujeme hypotézy: H : µ = 33.5 g/l a H A : µ = 33.5 g/l Realizace testové statistiky t = x µ s x n = = 34.46 33.5 5.835 26 = 2.48 T má přibliˇzně rozdělení Φ = N(, ). Dosaˇzená hladina významnosti: p = 2( Φ( t )) =.56 33 33.5 34 34.5 35 35.5 36 Rozdělení testové statistiky T: N(, ).4.35.3.25.2.5. p α 2 =.25 α =.95.52 =.78 α 2 =.25 p 2 =.78 4 2 2 4 Pravděpodobnost, ˇze bychom pozorovali hodnotu t = 2.48 nebo větší, kdyby platila H, je pouze.56%. Na hladině významnosti 5 % bychom H zamítli. Na hladině významnosti % bychom H zamítnout nemohli. P. Pošík c 25 A6M33SSL: Statistika a spolehlivost v lékařství 8 / 23 Recept: Test rozptylu N(µ, σ 2 ) Realizaci testové statistiky t = (n )s2 x c porovnáme s kvantily χ 2 rozdělení s n stupni volnosti: H H A H zamítáme, kdyˇz dosaˇzená významnost P σ 2 c σ 2 > c t > q χ 2 (n ) ( α) F χ 2 (n ) (t) σ 2 c σ 2 < c t < q χ 2 (n ) (α) F χ 2 (n ) (t) σ 2 = c σ 2 = c t > q χ 2 (n ) ( α 2 ) nebo 2 min(f χ 2 (n ) (t), F χ 2 (n ) (t)) t < q χ 2 (n ) ( α 2 ) P. Pošík c 25 A6M33SSL: Statistika a spolehlivost v lékařství 9 / 23 9

Neparametrické testy 2 / 23 Neparametrické? Neparametrické testy nejsou zaloˇzeny na nějaké parametrizované rodině rozdělení, tj. jsou pouˇzitelné bez ohledu na typ rozdělení, ale jsou slabší (ke stejnému závěru potřebujeme více dat neˇz u parametrických testů, jsou-li aplikovatelné oba druhy). Narozdíl od parametrických testů jsou často pouˇzitelné i na kvalitativní data, tj. pro ordinální či nominální škálu. P. Pošík c 25 A6M33SSL: Statistika a spolehlivost v lékařství 2 / 23 Znaménkový test Jak otestovat hypotézu o poloze rozdělení, kdyˇz nemůˇzeme pouˇzít test střední hodnoty (který vyˇzaduje rozdělení, u něhoˇz střední hodnota existuje)? Otestujme medián: H : q X (.5) = c Platí-li H, pak jsou kladné i záporné odchylky od c stejně pravděpodobné. Testovací statistikou T je počet kladných odchylek, které testujeme na rozdělení Bi(n,.5). (Z výběru jsme předem vyloučili nulové odchylky.) H H A H zamítáme, kdyˇz dosaˇzená významnost P q X (.5) c q X (.5) > c t > q Bi(n, 2 ) ( α) F Bi(n, 2 )(t) q X (.5) c q X (.5) < c t < q Bi(n, 2 ) (α) F Bi(n, 2 )(t) q X (.5) = c q X (.5) = c t > q Bi(n, 2 ) ( α 2 ) 2 min(f Bi(n, 2 )(t), F Bi(n, 2 )(t)) nebo t < q Bi(n, 2 ) ( α 2 ) Pro velká n pouˇzíváme CLV a testujeme T = 2T n n na rozdělení N(, ). P. Pošík c 25 A6M33SSL: Statistika a spolehlivost v lékařství 22 / 23

Jednovýběrový Wilcoxonův test Testuje H : X má rozdělení symetrické kolem hodnoty c. Má-li X rozdělení symetrické kolem c, pak je c mediánem i střední hodnotou. Často se pouˇzívá se jako neparametrická alternativa testu střední hodnoty, je silnější neˇz znaménkový test. Z realizace x = (x,..., x n ) vypočteme posloupnost (z,..., z n ), kde z j = x j c. Seřadíme ji vzestupně podle z j, čímˇz j-tému prvku přiřadíme pořadí r j. Je-li více stejných rozdílů, přiřadíme jim stejné pořadí rovné aritmetickému průměru. Testovou statistikou je T = r j j:z j > nebo T 2 = min r j, j:z j > j:z j < r j. Porovnáváme s tabulkou kritických hodnot pro tento test. V dalších přednáškách uvidíte příklady dalších neparametrických testů. P. Pošík c 25 A6M33SSL: Statistika a spolehlivost v lékařství 23 / 23