Matematika III. 3. prosince Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Podobné dokumenty
ÚVOD DO TESTOVÁNÍ HYPOTÉZ. Martina Litschmannová

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testování statistických hypotéz

Tomáš Karel LS 2012/2013

Ing. Michael Rost, Ph.D.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Testování statistických hypotéz

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Charakteristika datového souboru

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Statistika, Biostatistika pro kombinované studium. Jan Kracík

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

PRAVDĚPODOBNOST A STATISTIKA

Normální (Gaussovo) rozdělení

Testování hypotéz Biolog Statistik: Matematik: Informatik:

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Pravděpodobnost a aplikovaná statistika

Testování statistických hypotéz. Obecný postup

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Jednostranné intervaly spolehlivosti

= = 2368

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

15. T e s t o v á n í h y p o t é z

Testování statistických hypotéz

You created this PDF from an application that is not licensed to print to novapdf printer (

4ST201 STATISTIKA CVIČENÍ Č. 7

Stručný úvod do testování statistických hypotéz

Testy. Pavel Provinský. 19. listopadu 2013

Normální (Gaussovo) rozdělení

7.1. Podstata testu statistické hypotézy

2 ) 4, Φ 1 (1 0,005)

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Příklad datového souboru. Pravděpodobnost vs. statistika. Formální definice. Teorie odhadu

Cvičení ze statistiky - 8. Filip Děchtěrenko

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

5 Parametrické testy hypotéz

Testy statistických hypotéz

15. T e s t o v á n í h y p o t é z

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Aproximace binomického rozdělení normálním

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Statistika. Testování hypotéz - statistická indukce Parametrické testy. Roman Biskup

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

5. T e s t o v á n í h y p o t é z

Náhodné veličiny, náhodné chyby

Příklady na testy hypotéz o parametrech normálního rozdělení

12. cvičení z PST. 20. prosince 2017

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

TECHNICKÁ UNIVERZITA V LIBERCI. Statistický rozbor dat z dotazníkového šetření

Pravděpodobnost a matematická statistika

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Zápočtová práce STATISTIKA I

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

ADDS cviceni. Pavlina Kuranova

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Úvod do analýzy rozptylu

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu

y = 0, ,19716x.

STATISTICKÉ TESTY VÝZNAMNOSTI

Test z teorie VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY

Testování hypotéz. 4. přednáška

4EK211 Základy ekonometrie

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

diskriminaci žen letní semestr = výrok, o jehož pravdivosti chceme rozhodnout tvrzení o populaci, o jehož platnosti rozhodujeme

Test z teorie VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

STATISTICKÉ HYPOTÉZY

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

Transkript:

Vysoká škola báňská - Technická univerzita Ostrava 3. prosince 2018

Úvod do testování hypotéz

Základní metody statistické indukce Intervalové odhady (angl. confidence intervals) umožňují odhadnout nejistotu v odhadu parametru náhodné veličiny Testování hypotéz (angl. hypothesis testing) - umožňuje posoudit, zda experimentálně získaná data nepopírají předpoklad, který jsme před provedením testování učinili, tj. používáme, chceme-li ověřit platnost předem definované hypotézy (s předem danou hladinou významností).

Co je to statistická hypotéza? Statistická hypotéza předpoklad (tvrzení) o rozdělení náhodné veličiny Příklady statistických hypotéz: Střední životnost žárovek je nižší než výrobcem udávaných 5 let. Mortalita je u laparoskopických operací nižší než u operací konvenčních. Průměrné výsledky srovnávacích testů závisí na typu absolvované střední školy. Pořízený datový soubor je výběrem z populace mající normální rozdělení. Poznámka: Rozdíl (resp. poměr) parametru náhodné veličiny a jeho očekávané hodnoty, popřípadě rozdíl (resp. poměr) parametrů náhodných veličin nazýváme efekt.

Typy statistických hypotéz Parametrická statistická hypotéza tvrzení ohledně efektu Hypotézy o parametru jedné populace (o střední hodnotě, rozptylu, mediánu, parametru binomického rozdělení,... ) Hypotézy o parametrech dvou populací (srovnávací testy) Hypotézy o parametrech více než dvou populací (ANOVA, Kruskalův-Wallisův test,... ) Neparametrická statistická hypotéza - tvrzení o jiné vlastnosti rozdělení náhodné veličiny než o jejím parametru (např. hypotézy o typu rozdělení NV, hypotézy o závislosti NV,... )

Jak ověřit, zda je statistická hypotéza pravdivá? Pravdivost nulové hypotézy nelze na základě dat dokázat!!! Pravdivost nulové hypotézy lze na základě dat pouze vyvrátit. Nulová hypotéza (obžalovaný je nevinen) Alternativní hypotéza (obžalovaný je vinen) Data (výběrový soubor) (svědci) Testové kritérium (soudce) Princip presumpce neviny Neodsoudí-li soudce obžalovaného, nemusí to znamenat, že je obžalovaný nevinný. Může to znamenat, že neexistuje dostatek důkazů pro jeho odsouzení!

Co je to testování hypotéz? Rozhodovací proces, v němž proti sobě stojí nulová a alternativní hypotéza. Nulová hypotéza H 0 tvrzení, že efekt je nulový, resp. že neexistuje závislost, že data mají určitý typ rozdělení,... Alternativní hypotéza H A (H 1 ) tvrzení popírající hypotézu nulovou (obvykle to, co chceme dokázat)

Příklad I Ověřte, zda použití bezpečnostních pásů ovlivňuje úmrtnost při dopravních nehodách. Populace 1 (základní soubor 1): Účastníci dopravních nehod, kteří seděli na místech, na nichž je možno používat bezpečnostní pásy a byli připoutáni. Populace 2 (základní soubor 2): Účastníci dopravních nehod, kteří seděli na místech, na nichž je možno používat bezpečnostní pásy a nebyli připoutáni. Sledovaný statistický znak (náhodná veličina): úmrtnost (relativní četnost zemřelých) Nulová hypotéza H 0 : π A = π N, kde π A, resp. π N označuje úmrtnost účastníků dopravních nehod, kteří byli, resp. nebyli připoutáni. Alternativní hypotéza H A : π A π N.

Příklad II Ověřte, zda průměrný plat v ČR je větší než 30 000,- Kč. Populace (základní soubor): Ekonomicky aktivní obyvatelstvo pobírající mzdu. Sledovaný statistický znak (náhodná veličina): mzda. Nulová hypotéza H 0 : µ = 30000. Alternativní hypotéza H A : µ > 30000. Poznámka: Průměrný plat zjištěný z výběrového souboru by měl být větší než 30 000,- Kč. Pokud by tomu tak nebylo, měli bychom použít oboustrannou alternativní hypotézu.

Jak postupovat při testování hypotéz? (klasický přístup) 1 Formulujeme nulovou a alternativní hypotézu. 2 Zvolíme tzv. testovou statistiku, tj. výběrovou charakteristiku, jejíž rozdělení závisí na testovaném parametru θ. (Rozdělení testové statistiky za předpokladu platnosti nulové hypotézy nazýváme nulové rozdělení.) 3 Ověříme předpoklady testu! 4 Určíme kritický obor W tj. množinu, v níž se, za předpokladu platnosti H 0, hodnoty testové statistiky vyskytují s velmi malou pravděpodobností. Doplňkem k W je tzv. obor přijetí V. Hranici mezi kritickým oborem a oborem přijetí označujeme jako kritická hodnota testu t krit. 5 Na základě konkrétní realizace výběru určíme pozorovanou hodnotu x OBS testové statistiky. 6 Na základě vztahu mezi x OBS a t krit rozhodneme o výsledku testu ( Zamítáme H 0. nebo Nezamítáme H 0. )

Příklad Standardním výrobním způsobem lze vyrobit monitory se střední životnosti 1200 hodin a směrodatnou odchylkou 300 hodin. Novou technologií, kterou navrhuje vývojové centrum bylo zkušebně vyrobeno 100 obrazovek, jejichž průměrná životnost byla 1265 hodin. Jde o kvalitnější technologii, nejde pouze o náhodný rozdíl? Řešení: 1) H 0 : µ = 1200, H A : µ > 1200 2) T (X) = X µ σ n N(0; 1) 3) Ověření předpokladů testu: Zajištění náhodného výběru je důležité již ve fázi plánování experimentu! Normalitu výběru je nutno ověřit!!! (např. pomocí exploračních grafů nebo pomocí statistického testu.)

Příklad 4) Pro určení kritického oboru je nutné předem si stanovit, jak nepravděpodobné hodnoty testové statistiky již budeme považovat za velmi nepravděpodobné. Nezamítáme H 0 Zamítáme H 0 0 z 0,95 = 1, 64 W α - hladina významnosti testu W = {x OBS x OBS > 1, 64}

Příklad 5) x OBS = T (x) H 0 = 1265 1200 300 100 = 2, 17 6) x OBS W = Na hladině významnosti 0,05 zamítáme H 0 ve prospěch H A. Pozorované zlepšení průměrné životnosti obrazovek je statisticky významné.

Chyba I. a II. druhu Při testování hypotéz mohou nastat čtyři situace: Výsledek testu Nezamítáme H 0 Zamítáme H 0 Skutečnost Platí H 0 Platí H A Správné rozhodnutí Pravděpodobnost rozhodnutí: 1-α (spolehlivost) Chyba II. druhu Pravděpodobnost rozhodnutí: β Chyba I. druhu Pravděpodobnost rozhodnutí: α (hladina významnosti) Správné rozhodnutí Pravděpodobnost rozhodnutí: 1 β (síla testu) Jelikož výběr na jehož základě rozhodujeme je náhodný, nelze se chybám I. a II. druhu vyhnout. Chtěli bychom mít k dispozici testy s nízkou hladinou významnosti (tj. vysokou spolehlivosti) a vysokou sílou testu. = dva protichůdné požadavky

Závěr S klesající hladinou významnosti roste pravděpodobnost chyby II. druhu! Existuje způsob jak snížit α i β - zvýšení rozsahu výběru. Hladinu významnosti α volíme obvykle 0.05 (resp. 0.01). Sílu testu lze poté ovlivnit volbou testové statistiky a dostatečného počtu pozorování.

Operativní charakteristika a silofunkce Chceme-li srovnat dva testy, porovnáme jejich operativní charakteristiky, resp. silofunkce. Operativní charakteristika fce vyjadřující závislost pravděpodobnosti chyby II. druhu na přesné specifikaci alternativní hypotézy Silofunkce - fce vyjadřující závislost síly testu na přesné specifikaci alternativní hypotézy

Příklad: Výšku asijských hybridů lilií lze modelovat náhodnou veličinou s normálním rozdělením N(100; 144). Skupina 100 kusů těchto lilií byla pěstována za příznivějších podmínek, aby se zjistilo, zda se výška zvýší. a) Určete kritickou hodnotu průměrné výšky tohoto vzorku, při jejímž překročení bude možno se spolehlivostí 0.95 tvrdit, že nové pěstební podmínky vedly ke zvýšení střední výšky asijských hybridů lilií. Řešení: 1. H 0 : µ = 100, H A : µ > 100 2. T (X) = X µ σ n N(0; 1) 3. Předpoklady testu nelze popřít. 4. W = {x OBS : x OBS > z 0.95 } = {x OBS : x OBS > 1.64} x OBS = x µ 12 n > 1.64 x > 1.64 + 100 102 σ 100 Překročí-li průměrná výška 100 vzorků 102 cm, bude možno se spolehlivostí 0.95 tvrdit, že nové pěstební podmínky vedly ke zvýšení střední výšky asijských hybridů lilií.

Příklad: Výšku asijských hybridů lilií lze modelovat náhodnou veličinou s normálním rozdělením N(100; 144). Skupina 100 kusů těchto lilií byla pěstována za příznivějších podmínek, aby se zjistilo, zda se výška zvýší. b) Průměrná výška testovaného vzorku lilií je 102.5 cm. Ověřte klasickým testem, zda lze se spolehlivostí 0.95, resp. 0.99, tvrdit, že nové pěstební podmínky vedly ke zvýšení střední výšky asijských hybridů lilií. Řešení: 1. H 0 : µ = 100, H A : µ > 100 2. T (X) = X µ σ n N(0; 1) 3. Předpoklady testu nelze popřít. 4. W = {x OBS : x OBS > z 0.95 } = {x OBS : x OBS > 1.64} 5. x OBS = T (X) H 0 = 102.5 100 12 100 = 2.08 6. x OBS W Na hladině významnosti 0.05 zamítáme H 0 ve prospěch H A. Pozorované zvýšení průměrné výšky asijských hybridů lilií je na hladině významnosti 0.05 statisticky významné.

Příklad: Výšku asijských hybridů lilií lze modelovat náhodnou veličinou s normálním rozdělením N(100; 144). Skupina 100 kusů těchto lilií byla pěstována za příznivějších podmínek, aby se zjistilo, zda se výška zvýší. b) Průměrná výška testovaného vzorku lilií je 102.5 cm. Ověřte klasickým testem, zda lze se spolehlivostí 0.95, resp. 0.99, tvrdit, že nové pěstební podmínky vedly ke zvýšení střední výšky asijských hybridů lilií. Řešení: 1. H 0 : µ = 100, H A : µ > 100 2. T (X) = X µ σ n N(0; 1) 3. Předpoklady testu nelze popřít. 4. W = {x OBS : x OBS > z 0.99 } = {x OBS : x OBS > 2.33} 5. x OBS = T (X) H 0 = 102.5 100 12 100 = 2.08 6. x OBS W Na hladině významnosti 0.01 nezamítáme H 0. Pozorované zvýšení průměrné výšky asijských hybridů lilií není na hladině významnosti 0.01 statisticky významné.

p-hodnota Nevýhodou klasického testu je skutečnost, že při pohledu na výsledek testu (vztah pozorované a kritické hodnoty) nevidíme přímo, jak rozhodnutí závisí na změně hladiny významnosti. = často preferujeme rozhodování o výsledku testu na základě p-hodnoty (nejvyšší hladina významnosti, na níž se již nulová hypotéza nezamítá). p-hodnota je pravděpodobnost, s jakou můžeme za předpokladu platnosti nulové hypotézy pozorovat takový výsledek, jaký jsme pozorovali, nebo takový, jaký nulové hypotéze odporuje ješte více než ten námi pozorovaný.

Čistý test významnosti aneb testování pomoci p-hodnoty Postup při čistém testu významnosti 1 Formulace nulové a alternativní hypotézy. 2 Volba testové statistiky (testového kritéria) T(X). 3 Ověření předpokladů testu. 4 Výpočet pozorované hodnoty x OBS testové statistiky T(X). 5 Výpočet p-hodnoty (angl. p-value nebo significance level ). Tvar alternativní hypotézy H A p-hodnota θ < θ 0 p-hodnota = F 0 (x OBS ) θ > θ 0 p-hodnota = 1 F 0 (x OBS ) θ θ 0 p-hodnota = 2 min{f 0 (x OBS ); 1 F 0 (x OBS )} 6 Rozhodnutí o výsledku testu. p-hodnota Rozhodnutí p-hodnota < α Zamítáme H 0 ve prospěch H A. p-hodnota α Nezamítáme H 0.

Příklad Výšku asijských hybridů lilií lze modelovat náhodnou veličinou s normálním rozdělením N(100; 144). Skupina 100 kusů těchto lilií byla pěstována za příznivějších podmínek, aby se zjistilo, zda se výška zvýší. Ověřte čistým testem významnosti, zda lze se spolehlivosti 0, 95, resp. 0, 99, tvrdit, že nové pěstební podmínky vedly ke zvýšení střední výšky asijských hybridů lilií. Řešení: H 0 : µ = 100 H A : µ > 100 T (X) = X µ σ n N(0; 1) Předpoklady testu nelze popřít. x OBS = T (x) H 0 = 102.5 100 12 100 = 2.08 p-hodnota = 1 F 0(2.08) = 1 Φ(2.08) = 0.019 p-hodnota < 0.05 Na hladině významnosti 0.05 zamítáme H 0 ve prospěch H A. Pozorované zvýšení průměrné výšky asijských hybridů lilii je na hladině významnosti 0.05 statisticky významné.

Příklad Výšku asijských hybridů lilií lze modelovat náhodnou veličinou s normálním rozdělením N(100; 144). Skupina 100 kusů těchto lilií byla pěstována za příznivějších podmínek, aby se zjistilo, zda se výška zvýší. Ověřte čistým testem významnosti, zda lze se spolehlivosti 0, 95, resp. 0, 99, tvrdit, že nové pěstební podmínky vedly ke zvýšení střední výšky asijských hybridů lilií. Řešení: H 0 : µ = 100 H A : µ > 100 T (X) = X µ σ n N(0; 1) Předpoklady testu nelze popřít. x OBS = T (x) H 0 = 102.5 100 12 100 = 2.08 p-hodnota = 1 F 0(2.08) = 1 Φ(2.08) = 0.019 p-hodnota > 0.01 Na hladině významnosti 0.01 nezamítáme H 0. Pozorované zvýšení průměrné výšky asijských hybridů lilii není na hladině významnosti 0.01 statisticky významné.

Několik poznámek pro praxi Pozor na pečlivé plánování experimentu! (Nutno zajistit nezávislost pokusů, eliminaci vlivů nežádoucích faktorů, dostatečný rozsah výběru (výsledky testu nelze upravovat tím, že dodatečně rozšíříme výběrový soubor),... ) Příklad: Včely jsou postupně vypouštěny do pokusného prostoru se žlutými, červenými a modrými terči. Sledujeme barvu terče, na který každá včela poprvé usedne. Nulová hypotéza je, že pravděpodobnost usednutí nezávisí na barvě terče (tímto způsobem zjišujeme, zda se včely vizuálněorientují a zda při této orientaci hrají nějakou úlohu barvy). (Lepš, Kapitola 2 testování hypotéz, test dobré shody, online: http://botanika.bf.jcu.cz/suspa/vyuka/materialy/kap2.pdf [2012-03-19]) Co všechno je třeba při pokusu zajistit? vypouštění včel po jednotlivcích, včely nesmí zanechávat stopy o své návštěvě terče (není-li splněno, nutná výměna terčů po každém pokusu), předem daný počet pokusů.

Několik poznámek pro praxi V odborných pracích většinou výsledky testování hypotéz prezentujeme ve tvaru: (název testu, pozorovaná hodnota, testové statistiky, p-hodnota)+někdy doplňujeme další parametry testu (např. stupně volnosti u χ 2 testu dobré shody). Např.: Předpoklad normality byl na hladině významnosti 0, 05 zamítnut (χ 2 test dobré shody; χ 2 = 14, 9; df = 6; p hodnota = 0, 021). Pokud je výstupem software: p hodnota = 0, znamená to, že p hodnota je menší než přesnost softwaru. Do odborných textů nikdy NEPIŠTE p hodnota = 0, ale např. p hodnota 0, 01. Uvědomte si, co to znamená, když p hodnota 1 Příliš dobrá shoda dat s nulovou hypotézou je podezřelá, angl. Too good to be true

Statistická vs. praktická významnost Rozhodnutí o výsledku statistického testu je rozhodnutím o tzv. statistické významnosti (statistical significance) pozorovaného efektu (rozdílu parametrů dvou nebo více výběrových souborů, případně rozdílu parametru jednoho souboru od předem dané konstantní hodnoty). Statisticke testy jsou konstruované tak, aby s rostoucím rozsahem výběru reagovaly na jakékoliv odchylky citlivěji. Tj. čím větší rozsah výběru, tím menší pozorovaný efekt je posouzen jako statisticky významný. Statistická významnost nemusí znamenat existenci příčinného vztahu, statistická významnost pouze indikuje, že pozorovaný efekt není ve smyslu stanovené hypotézy náhodný. Jako míry praktické(věcné, klinické, biologické) významnosti pozorovaných efektů se používají tzv. ukazatelé míry účinků (effect size). Těmito ukazateli jsou libovolné statistiky, které odrážejí míru porušení nulové hypotézy, nezávisí na rozsahu výběru, nejsou ovlivněny volbou jednotky proměnných.

Vybrané jednovýběrové testy hypotéz test o rozptylu, testy o střední hodnotě (z-test, t-test), testy o parametru binomického rozdělení, testy o mediánu (Wilcoxonův a mediánový test)

Test o rozptylu normálního rozdělení H 0 : σ 2 = σ 2 0 H A : σ 2 σ 2 0 (resp. σ 2 < σ 2 0, σ2 > σ 2 0 ) Předpoklady testu: X je náhodný výběr z populace mající normální rozdělení. Testová statistika: χ 2 = s2 σ0 2 (n 1) Nulové rozdělení: χ 2 rozdělení s n 1 stupni volnosti Pravidla pro zamítnutí H 0 pro podle zvolené alternativní hypotézy: H A : σ 2 σ 2 0... zamítáme H 0, když χ 2 < χ 2 α 2 (n 1) nebo χ 2 > χ 2 1 α (n 1) 2 H A : σ 2 > σ0 2... zamítáme H 0, když... χ 2 > χ 2 1 α (n 1) H A : σ 2 < σ0 2... zamítáme H 0, když... χ 2 < χ 2 α (n 1)

Test o střední hodnotě (z-test pro jeden výběr) H 0 : µ = µ 0 H A : µ µ 0 (resp. µ < µ 0, µ > µ 0 ) tzn. testujeme hypotézu, zda data náhodného výběru pochází z rozdělení se stejnou střední hodnotou, jako je předpokládaná konstanta µ 0. Předpoklady testu: X je náhodný výběr z populace mající normální rozdělení o známém rozptylu σ 2. Testová statistika: Nulové rozdělení: normované normální rozdělení T (X) = X µ 0 n N(0, 1) σ Pravidla pro zamítnutí H 0 pro z-test pro jeden výběr podle zvolené alternativní hypotézy: H A : µ µ 0... zamítáme H 0, když... Z > z 1 α 2 H A : µ > µ 0... zamítáme H 0, když... Z > z 1 α H A : µ < µ 0... zamítáme H 0, když... Z < z α

Test o střední hodnotě (t-test pro jeden výběr) H 0 : µ = µ 0 H A : µ µ 0 (resp. µ < µ 0, µ > µ 0 ) tzn. testujeme hypotézu, zda data náhodného výběru pochází z rozdělení se stejnou střední hodnotou, jako je předpokládaná konstanta µ 0. Předpoklady testu: X je náhodný výběr z populace mající normální rozdělení s neznámým rozptylem σ 2 (tj. nepředpokládáme znalost parametru σ). Testová statistika: T (X) = X µ 0 n t(n 1) s Nulové rozdělení: Studentovo rozdělení s n 1 stupni volnosti. Pravidla pro zamítnutí H 0 pro t-test pro jeden výběr podle zvolené alternativní hypotézy: H A : µ µ 0... zamítáme H 0, když... T > t 1 α 2 (n 1) H A : µ > µ 0... zamítáme H 0, když... T > t 1 α (n 1) H A : µ < µ 0... zamítáme H 0, když... T < t α(n 1)

Jak postupovat pokud není splněn předpoklad normality? 1) Původní veličinu transformujeme (např. pomocí logaritmu, druhé odmocniny či převrácené hodnoty) na novou veličinu, pro kterou je model normálního rozdělení přijatelný. 2) Požadovanou analýzu potom provedeme na transformované veličině. 3) Výsledky analýzy (např. průměry či intervaly spolehlivosti) lze pro účely prezentace výsledků zpětně transformovat. Pokud nenajdeme vhodnou transformaci na normální rozdělení, nabízí statistika jiné přístupy založené např. na tzv. neparametrických(robustních) metodách. Neparametrické testy testy, které nemají předpoklady ohledně typu rozdělení populace (Mají nižší sílu testu než jejich parametrické alternativy)

Neparametrický test střední hodnoty mediánový test H 0 : x 0.5 = x 0.50 H A : x 0.5 x 0.50 (resp. x 0.5 < x 0.50, x 0.5 > x 0.50 ) Předpoklady testu: X je náhodný výběr z populace mající spojité rozdělení. Testová statistika: T (X) = Y, kde Y modeluje počet pozorování v náhodném výběru o rozsahu n, která jsou menší než x 0,50. Nulové rozdělení: Bi(n; 0.5)

Neparametrický test střední hodnoty - Wilcoxonův test H 0 : x 0.5 = x 0.50 H A : x 0.5 x 0.50 (resp. x 0.5 < x 0.50, x 0.5 > x 0.50 ) Předpoklady testu: Mějme náhodný výběr X 1,..., X n ze spojitého rozdělení s hustotou f, která je symetrická kolem bodu a (tzn. a je median x 0.5 ). Postup: Je-li některá z veličin X 1, X 2,..., X n rovna testované hodnotě x 0.50, obvykle toto pozorování z výběrového souboru vypustíme. Položme Y i = X i x 0.50, i = 1, 2,..., n. Veličiny Y i seřaďme vzestupně podle jejich absolutní hodnot Y (1) Y (2)... Y (n) Označme R + pořadí veličiný Y (1). Dále Testová statistika: S + = R + i, S = R + i. Y i 0 Y i <0 T (X) = min(s + ; S ). Pravidlo pro zamítnutí H 0 pro Wilcoxonův test: H A : x 0.5 x 0.50 zamítáme H 0, když T < ω nα.

Kritické hodnoty jednovýběrového Wilcoxonova testu (ω n α)

Máme-li k dispozici výběr o dostatečně velkém rozsahu (n > 30), využijeme toho, že S + má asymptoticky normální rozdělení s parametry E(S + ) = 1 4 n(n + 1), D(S+ ) = 1 n(n + 1)(2n + 1). 24 Testové kritérium: T (X) = S+ E(S + ) D(S + ) Nulové rozdělení: normované normální rozdělení Poznámka: K zamítnutí H 0 tak může dojít i tehdy je-li median roven x 0.50, ale hustota f je výrazně asymetrická.

Test o parametru binomického rozdělení H 0 : π = π 0 H A : π π 0 (resp. π < π 0, π > π 0 ) Předpoklady testu: X je náhodný výběr z alternativního rozdělení. Rozsah rozdělení n musí splňovat podmínky n > 30, n > 9 p(1 p), kde p je relativní četnost výskytu sledovaného jevu. Testová statistika: T (X) = p π n π(1 π) Nulové rozdělení: normované normální rozdělení

Vtip Biolog, Statistik, Matematik a Informatik na safari. Zastaví džíp a pozorují dalekohledem zebry. Biolog: Podívejte se! Stádo zeber! A mezi nimi bílá zebra! To je fantastické! Existují bílé zebry! Budeme slavní! Statistik: To není významné. Platí pouze, že hypotézu, že bílé zebry neexistují nemůžeme zamítnout! Matematik: Ve skutečnosti víme, že existuje zebra, která je na jedné straně bílá. Informatik: Ale kdepak! To je výjimka!

Děkuji za pozornost!!!