DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

Podobné dokumenty
Dvouvýběrové a párové testy. Komentované řešení pomocí MS Excel

KORELACE. Komentované řešení pomocí programu Statistica

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze

Korelace. Komentované řešení pomocí MS Excel

Vzorová prezentace do předmětu Statistika

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

KONTINGENČNÍ TABULKY Komentované řešení pomocí programu Statistica

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

Lineární regrese. Komentované řešení pomocí MS Excel

5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

= = 2368

Jednovýběrové testy. Komentované řešení pomocí MS Excel

Jednostranné intervaly spolehlivosti

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Testy nezávislosti kardinálních veličin

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

NEPARAMETRICKÉ TESTY

Jednofaktorová analýza rozptylu

Cvičení 9: Neparametrické úlohy o mediánech

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

4. Zpracování číselných dat

ADDS cviceni. Pavlina Kuranova

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Testy. Pavel Provinský. 19. listopadu 2013

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

Testování statistických hypotéz. Obecný postup

Charakteristika datového souboru

Pravděpodobnost a aplikovaná statistika

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Testování statistických hypotéz

Popisná statistika. Komentované řešení pomocí MS Excel

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

STATISTICA Téma 7. Testy na základě více než 2 výběrů

Statistika, Biostatistika pro kombinované studium. Jan Kracík

4ST201 STATISTIKA CVIČENÍ Č. 7

2 ) 4, Φ 1 (1 0,005)

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Vysoká škola ekonomická v Praze

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Porovnání dvou výběrů

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

STATISTICKÉ TESTY VÝZNAMNOSTI

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

12. cvičení z PST. 20. prosince 2017

You created this PDF from an application that is not licensed to print to novapdf printer (

STATISTICKÉ TESTY VÝZNAMNOSTI

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

Pearsonův korelační koeficient

Opakování. Neparametrické testy. Pořadí. Jednovýběrový Wilcoxonův test. t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality

Úvod do analýzy rozptylu

Pohlédněte si základní charakteristiky polohy jednotlivých veličin pomocí funkce summary.

TECHNICKÁ UNIVERZITA V LIBERCI

Základní statistické metody v rizikovém inženýrství

15. T e s t o v á n í h y p o t é z

Popisná statistika kvantitativní veličiny

Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj.

Zápočtová práce STATISTIKA I

Testy statistických hypotéz

Jednofaktorová analýza rozptylu

KGG/STG Statistika pro geografy

Odhady parametrů základního souboru. Cvičení 6 Statistické metody a zpracování dat 1 (podzim 2016) Brno, říjen listopad 2016 Ambrožová Klára

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Stručný úvod do testování statistických hypotéz

, Brno Hanuš Vavrčík Základy statistiky ve vědě

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

diskriminaci žen letní semestr = výrok, o jehož pravdivosti chceme rozhodnout tvrzení o populaci, o jehož platnosti rozhodujeme

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Průzkumová analýza dat

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Příklad datového souboru. Pravděpodobnost vs. statistika. Formální definice. Teorie odhadu

Testování statistických hypotéz

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Testování hypotéz. 4. přednáška

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

VŠB Technická univerzita Ostrava BIOSTATISTIKA

Transkript:

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

Úloha A) koncentrace glukózy v krvi V této části posoudíme pomocí párového testu, zda nový lék prokazatelně snižuje koncentraci glukózy v krvi

Vstupní data I Vstupní data o koncentraci glukózy před léčbou a po léčbě doplníme o pokles koncentrace glukózy (rozdíl koncentrace před léčbou mínus po léčbě) myší dvakrát poklepeme na hlavičku třetího sloupce, do jména uvedeme např. Před - Po a do pole dole =v1-v2, což značí rozdíl prvního a druhého sloupce Spočteme základní charakteristiky dat Před - Po Statistiky Základní statistiky Popisná statistika Detailní výsledky Zvolíme si, jaké charakteristiky chceme spočítat A dále Proměnné Před - Po OK Výpočet A také krabicové grafy Před a Po Grafy Krabice Proměnné Před - Po OK, nastavení viz prezentace k popisné statistice

Vstupní data II 8,6 8,4 8,2 8,0 7,8 7,6 7,4 7,2 7,0 6,8 Krabicový graf z více proměnných Medián; Krabice: 25%-75%; Svorka: Rozsah neodleh. Pomocí bodového grafu znázorníme přehled poklesu koncentrace glukózy u všech pacientů: Grafy Spojnice Proměnné Před - Po OK OK Odstraníme spojnici: pravým tlačítkem myši klikneme na graf Možnosti grafu Obecné zrušíme označení Spojnice OK 6,6 6,4 6,2 Před Po Medián 25%-75% Rozsah neodleh. Odlehlé Extrémy

Vstupní data III Před - Po 1,8 1,6 1,4 1,2 1,0 0,8 0,6 0,4 0,2 0,0-0,2-0,4-0,6-0,8-1,0-1,2 Bodový graf z Před - Po 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 U sledovaných 60 pacientů způsobila aplikace léku pokles koncentrace glukózy v průměru o 0,48 mmol/l Z tohoto grafu (i krabicového grafu) je patrné, že u většiny pacientů způsobil nový lék pokles glukózy (kladné hodnoty), jen u některých způsobil mírný nárůst (záporné hodnoty). Zdá se tedy, že jeho aplikace má pozitivní dopad. Tuto hypotézu zkusíme prokázat pomocí t testu o střední hodnotě.

Ověření normality histogram Základním předpokladem pro použití párového t testu je normalita zjištěných rozdílů. Počet pozorování 24 22 20 18 16 14 12 10 8 6 4 2 0 Histogram z Před - Po Před - Po = 60*0,5*normal(x; 0,4767; 0,5447) -1,5-1,0-0,5 0,0 0,5 1,0 1,5 2,0 Grafy Histogram Proměnné Před Po OK, v Detailech přidáme ještě Shapiro Wilkův test normality OK p hodnota testu je, jak vidíme, poměrně vysoká (0,6). Hypotézu o nenormalitě dat bychom zamítli až na hladinách přes 60 %, což svědčí ve prospěch normality rozdílů. To ovšem podporuje i vzhled histogramu a dále i Q Q grafu, který je vytvořen na dalším listě. Před - Po: SW-W = 0,9837; p = 0,6039 Před - Po

Ověření normality Q-Q graf 3 Normální p-graf z Před - Po 2 Oček. normál. hodnoty 1 0-1 Grafy Grafy vstupních dat Pravděpodobnostní graf Před Po Normál. pravděpodobnost -2-3 -1,2-1,0-0,8-0,6-0,4-0,2 0,0 0,2 0,4 0,6 0,8 1,0 1,2 1,4 1,6 1,8 Pozorovaný kvantil

Párový test Protože bychom rádi prokázali, že lék má průkazný pozitivní vliv na hladinu glukózy v krvi, budeme testovat oproti jednostranné alternativě, že střední hodnota rozdílu Před - Po" je vetší než nula. Statistiky Základní statistiky t test, samost. vzorek OK Proměnné zvolíme Před - Po OK Test všech průměrů vůči necháváme volbu 0 OK Jak již bylo zmíněno u jednovýběrových testů, v případě jednostranné alternativy je třeba vypočtenou p hodnotu 0,0000000064 = 6,4 10 9 vydělit dvěma, tím získáme p hodnotu našeho testu 3,2 10 9. Ke stejnému výsledku se lze dostat i jinak: Statistiky Základní statistiky t test, závislé vzorky OK

Párový test výsledky Na hladině významnosti 5 % jsme prokázali, že nový lék vede (ve střední hodnotě) ke snížení koncentrace glukózy v krvi. Vzhledem k dosažené p hodnotě (řádově 10 9 ) jsou získané výsledky velmi průkazné (i na výrazně nižší, než požadované, hladině významnosti).

Úloha B) úroveň glykovaného hemoglobinu V této části posoudíme pomocí dvouvýběrového t testu, zda nový lék prokazatelně snižuje úroveň glykovaného hemoglobinu.

Vstupní data I Při 1. pokusu byl skupině I aplikován nový přípravek, zatímco skupině II běžná léčba. Po nějakém čase se provedl 2. pokus, kdy se léčba prohodila skupina I dostávala běžný přípravek, zatímco skupina II ten nový. Data vložíme do tabulky a pojmenujeme si je, např. NP znamená nový přípravek BP znamená běžná přípravek Budeme postupovat jako v úloze A), spočteme krabicové grafy, bodové grafy a základní charakteristiky dat.

Vstupní data II 11 Krabicový graf z více proměnných Medián; Krabice: 25%-75%; Svorka: Rozsah neodleh. 10 9 8 7 6 5 4 3 Skupina I - NP Skupina II - BP Skupina I - BP Skupina II - NP Medián 25%-75% Rozsah neodleh. Odlehlé Extrémy

Vstupní data III 11 Bodový graf Skupina I 9 Bodový graf Skupina II 10 8 9 8 7 7 6 6 5 5 4 4 3 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 Skupina I - NP Skupina I - BP 3 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 Skupina II - BP Skupina II - NP

Vstupní data IV Z krabicových a bodových grafů a ze základních charakteristiky dat usuzujeme: Obě skupiny v čase léčby novým přípravkem měly nižší průměrnou hladinu glykovaného hemoglobinu než v čase léčby běžným přípravkem. Zda lze považovat tyto rozdíly za statisticky významné, ověříme pomocí dvouvýběrových t testů (pro každý pokus zvlášť). Při použití nového přípravku také můžeme pozorovat nižší variabilitu hladiny glykovaného hemoglobinu ve srovnání s běžným přípravkem a to u obou skupin. Ověření normality I pro dvouvýběrový t test je zásadní předpoklad normality náhodného výběru. Opět se podíváme pouze na jednorozměrnou normalitu všech čtyř výběrů.

Ověření normality Q-Q graf 2,5 Normální p-graf z Skupina I - NP 2,5 Normální p-graf z Skupina I - BP 2,0 2,0 1,5 1,5 Oček. normál. hodnoty 1,0 0,5 0,0-0,5-1,0-1,5 Oček. normál. hodnoty 1,0 0,5 0,0-0,5-1,0-1,5-2,0-2,0-2,5 3,8 4,0 4,2 4,4 4,6 4,8 5,0 5,2 5,4 5,6 5,8 Pozorovaný kvantil Normální p-graf z Skupina II - BP 3-2,5 3 4 5 6 7 8 9 10 11 Pozorovaný kvantil Normální p-graf z Skupina II - NP 2,5 2 2,0 1,5 Oček. normál. hodnoty 1 0-1 Oček. normál. hodnoty 1,0 0,5 0,0-0,5-1,0-2 -1,5-2,0-3 4,0 4,5 5,0 5,5 6,0 6,5 7,0 7,5 8,0 8,5 9,0-2,5 4,0 4,2 4,4 4,6 4,8 5,0 5,2 5,4 5,6 5,8 Pozorovaný kvantil Pozorovaný kvantil

Ověření normality histogram 12 Histogram z Skupina I - NP Skupina I - NP = 46*0,2*normal(x; 4,7522; 0,4288) 12 Histogram z Skupina I - BP Skupina I - BP = 46*0,5*normal(x; 6,7717; 1,2178) 10 10 8 8 Počet pozorování 6 4 Počet pozorování 6 4 2 2 0 3,8 4,0 4,2 4,4 4,6 4,8 5,0 5,2 5,4 5,6 5,8 Skupina I - NP: SW-W = 0,9597; p = 0,1118 16 14 12 Skupina I - NP Histogram z Skupina II - BP Skupina II - BP = 49*0,5*normal(x; 6,149; 0,8576) 0 3,5 4,0 4,5 5,0 5,5 6,0 6,5 7,0 7,5 8,0 8,5 9,0 9,5 10,0 10,5 Skupina I - BP: SW-W = 0,983; p = 0,7309 10 9 8 7 Skupina I - BP Histogram z Skupina II - NP Skupina II - NP = 49*0,2*normal(x; 4,7653; 0,4294) Počet pozorování 10 8 6 Počet pozorování 6 5 4 4 3 2 2 1 0 3,5 4,0 4,5 5,0 5,5 6,0 6,5 7,0 7,5 8,0 8,5 9,0 9,5 Skupina II - BP: SW-W = 0,978; p = 0,4854 Skupina II - BP 0 3,8 4,0 4,2 4,4 4,6 4,8 5,0 5,2 5,4 5,6 5,8 6,0 Skupina II - NP: SW-W = 0,9529; p = 0,0482 Skupina II - NP

Ověření normality závěr Shapiro Wilkův test normalitu zamítá u skupiny II v případě léčby novým přípravkem na hladinách vyšších než 0,048. V ostatních případech ji na hladině nejvýše 5 % nezamítá (vyšší p hodnota je u skupiny I léčené běžným přípravkem). S testy tedy budeme pracovat pouze asymptoticky.

Testy hypotéz I Provedeme dva dvouvýběrové t testy hypotézy o shodě středních hodnot; jeden pro 1. pokus a jeden pro 2. pokus. Alternativní hypotéza v případě 1. pokusu je, že střední hodnota úrovně glykovaného hemoglobinu ve skupině I (nový lék) je nižší než ve skupině II (běžný lék) V případě 2. pokusu je alternativní hypotéza opačná střední hodnota ve skupině I (běžný lék) je vyšší než ve skupině II (nový lék) Statistiky Základní statistiky t test, nezávislé, dle prom. OK Proměnné 1. seznam Skupina I - NP, 2. seznam Skupina II - BP Možnosti zvolit t test se samostat. odhady rozptylů Výpočet (tuto možnost volíme proto, že nemáme důvod předpokládat, že naše data pocházejí z náhodného výběru se shodnými rozptyly!)

Testy hypotéz II 1. pokus Nejprve si všimněme, že z přidruženého F testu rozptylů zamítáme shodnost rozptylů ve prospěch oboustranné alternativy. Proto bychom ani nemohli použít softwarem přednastavený dvouvýběrový t test předpokládající stejné rozptyly! p hodnota vlastního testu je 9,1 10 16 (p hodnota spočtená softwarem dělená dvěma, neb se jedná o jednostrannou alternativu), takže na hladině 5 % (i na podstatně nižších hladinách) zamítáme nulovou hypotézu rovnosti středních hodnot ve prospěch alternativy, tj. na základě 1. pokusu jsme prokázali, že nový přípravek je účinnější než ten běžný.

Testy hypotéz III 2. pokus Výsledky se získají stejně jako pro 1. pokus, jen v proměnných se zvolí 1. seznam jako Skupina I - BP a 2. seznam jako Skupina II - NP Stejně jako u 1. pokusu vidíme, že rozptyly nemůžeme považovat za shodné. p hodnota t testu 3,3 10 15 je opět velmi nízká, a tak jsme opět prokázali, že na základě 2. pokusu dává nový přípravek lepší výsledky než ten běžný, a to na hladinách podstatně nižších než požadovaných 5 %. Závěrem: slepý dvojitý pokus proběhl úspěšně a zavedení nového léku můžeme spolehlivě doporučit.