Neparametrické metody

Podobné dokumenty
Neparametrické metody

Pravděpodobnost a aplikovaná statistika

NEPARAMETRICKÉ METODY

Kapitola 6. : Neparametrické testy o mediánech

Pravděpodobnost a aplikovaná statistika

Deskriptivní statistika 1

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

Přednáška VIII. Testování hypotéz o kvantitativních proměnných

Náhodný výběr 1. Náhodný výběr

Závislost slovních znaků

Testujeme hypotézu: proti alternativě. Jednoduché třídění:

P2: Statistické zpracování dat

Základy statistiky. Zpracování pokusných dat Praktické příklady. Kristina Somerlíková

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 2

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

Katedra pravděpodobnosti a matematické statistiky. χ 2 test nezávislosti

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

12. N á h o d n ý v ý b ě r

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

8. cvičení 4ST201-řešení

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

8. Analýza rozptylu.

Pro statistické šetření si zvolte si statistický soubor např. všichni žáci třídy (několika tříd, školy apod.).

Odhady parametrů 1. Odhady parametrů

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

Intervalové odhady parametrů některých rozdělení.

14. Testování statistických hypotéz Úvod statistické hypotézy Definice 14.1 Statistickou hypotézou parametrickou neparametrickou. nulovou testovanou

Testování statistických hypotéz

vají statistické metody v biomedicíně

vají statistické metody v biomedicíně Literatura Statistika v biomedicínsk nském výzkumu a ve zdravotnictví

Statistika. Testování hypotéz statistická indukce Neparametrické testy. Roman Biskup

VYSOCE PŘESNÉ METODY OBRÁBĚNÍ

1.3. POLYNOMY. V této kapitole se dozvíte:

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

Popisná statistika - zavedení pojmů. 1 Jednorozměrný statistický soubor s kvantitativním znakem

Pravděpodobnost a aplikovaná statistika

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Intervalové odhady parametrů

13 Popisná statistika

0,063 0,937 0,063 0, P 0,048 0,078 0,95. = funkce CONFIDENCE.NORM(2α; p(1 p)

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Pravděpodobnostní model doby setrvání ministra školství ve funkci

1. JEV JISTÝ a. je jev, který nikdy nenastane b. je jev, jehož pravděpodobnost = ½ c. je jev, jehož pravděpodobnost = 0 d.

Cvičení 9: Neparametrické úlohy o mediánech

PRAVDĚPODOBNOST A STATISTIKA

Přednáška VI. Intervalové odhady. Motivace Směrodatná odchylka a směrodatná chyba Centrální limitní věta Intervaly spolehlivosti

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

veličiny má stejný řád jako je řád poslední číslice nejistoty. Nejistotu píšeme obvykle jenom jednou

UPLATNĚNÍ ZKOUŠEK PŘI PROHLÍDKÁCH MOSTŮ

Elementární zpracování statistického souboru

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Mezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby.

7. Odhady populačních průměrů a ostatních parametrů populace

Parametr populace (populační charakteristika) je číselná charakteristika sledované vlastnosti

2 IDENTIFIKACE H-MATICE POPISUJÍCÍ VEDENÍ Z NAMĚŘENÝCH HODNOT

8. cvičení 4ST201. Obsah: Neparametrické testy. Chí-kvadrát test dobréshody Kontingenční tabulky Analýza rozptylu (ANOVA) Neparametrické testy

Statistika, Biostatistika pro kombinované studium. Jan Kracík

UNIVERZITA PALACKÉHO V OLOMOUCI PŘÍRODOVĚDECKÁ FAKULTA KATEDRA MATEMATICKÉ ANALÝZY A APLIKACÍ MATEMATIKY. Statistické chyby v medicínském výzkumu

jako konstanta nula. Obsahem centrálních limitních vět je tvrzení, že distribuční funkce i=1 X i konvergují za určitých

17. Statistické hypotézy parametrické testy

2. Náhodná veličina. je konečná nebo spočetná množina;

Pravděpodobnostní modely

6. P o p i s n á s t a t i s t i k a

Co je to statistika? Statistické hodnocení výsledků zkoušek. Úvod statistické myšlení. Úvod statistické myšlení. Popisná statistika

REGRESNÍ DIAGNOSTIKA. Regresní diagnostika

Statistika. Statistické funkce v tabulkových kalkulátorech MSO Excel a OO.o Calc

Odhad parametrů normálního rozdělení a testy hypotéz o těchto parametrech * Věty o výběru z normálního rozdělení

8. Odhady parametrů rozdělení pravděpodobnosti

3. Lineární diferenciální rovnice úvod do teorie

EKONOMETRIE 9. přednáška Zobecněný lineární regresní model

Úvod do analýzy rozptylu

MOŽNOSTI STATISTICKÉHO POSOUZENÍ KVANTITATIVNÍCH VÝSLEDKŮ POŽÁRNÍCH ZKOUŠEK PRO POTŘEBY CERTIFIKACE A POSUZOVÁNÍ SHODY VÝROBKŮ

Kvantily. Problems on statistics.nb 1

2 STEJNORODOST BETONU KONSTRUKCE

Pravděpodobnost vs. statistika. Data. Teorie pravděpodobnosti pracuje s jednou nebo více teoretickými náhodnými

OKRUŽNÍ A ROZVOZNÍ ÚLOHY: OBCHODNÍ CESTUJÍCÍ. FORMULACE PŘI RESPEKTOVÁNÍ ČASOVÝCH OKEN

Úloha II.S... odhadnutelná

Při sledování a studiu vlastností náhodných výsledků poznáme charakter. podmínek různé výsledky. Ty odpovídají hodnotám jednotlivých realizací

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE

VaR analýza citlivosti, korekce

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

MATICOVÉ HRY MATICOVÝCH HER

Úloha III.S... limitní

Náhodu bychom mohli definovat jako součet velkého počtu drobných nepoznaných vlivů.

Národní informační středisko pro podporu kvality

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Statistika. Poznámky z přednášek

DERIVACE FUNKCÍ JEDNÉ REÁLNÉ PROM

Číselné charakteristiky náhodných veličin

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

Popisná statistika. Zdeněk Janák 9. prosince 2007

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

4EK212 Kvantitativní management 4. Speciální úlohy lineárního programování

V. Normální rozdělení

Tento projekt je spolufinancován Evropským sociálním fondem a Státním rozpočtem ČR InoBio CZ.1.07/2.2.00/

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Transkript:

Neparametrické metody EuroMISE Cetrum Kotakt: Literatura: Obecé iformace Zvárová, J.: Základy statistiky pro biomedicískéobory I. Vydavatelství Karolium, UK Praha 00 Zvára, K.: Roser, B.: EuroMISE cetrum Doc. Zdeěk Valeta, Ph.D. Tel.: 05 0 (sekretariát) Fax: 5 5 http://www.euromise.cz valeta@euromise.cz Biostatistika. Vydavatelství Karolium, UK Praha 00 Fudametals of Biostatistics, th Editio I. ÚVOD v Neparametrické testy jsou založey a pořadových skórech, které reprezetují původí data v Dataemusí utě splňovat určité předpoklady vyžadovaé u parametrických testů (apř. ormalita rozdílů v párovém t-testu) v Neparametrické metody mohou zahrovat požadavky a určité vlastosti rozděleí (apř. symetrie ebo spojitost) v Jsou mohdy jediou alterativou aalýzy ordiálích dat ebo dat ve formě četostí či pořadí

ÚVOD (pokr.) v TŘÍD NEPARAMETRICKÝCH TESTŮ: JEDNOVÝBĚROVÉ: Kvatilový test DVOUVÝBĚROVÉ PÁROVÉ: Zamékový test, Wilcoxoův párový test (siged-rak test). Oba testy jsou eparametrickou alterativou párového t-testu. DVOUVÝBĚROVÉ PRO NEZÁVISLÉ VÝBĚR: Mediáový test, Wilcoxoův dvouvýběrový test (Maův-WhiteyůvU test, Wilcoxo Rak-Sum test), Robustí dvouvýběrový test, Kolmogorovův-Smirovův dvouvýběrový test, případě Waldův-Wolfowitzův rus test. Tyto testy jsou eparametrickou alterativou dvouvýběrového t-testu. VÍCEVÝBĚROVÉ: Kruskalova-Wallisovaaalýza pořadových skórů jedoduchého tříděí, Friedmaova aalýza pořadových skórů opakovaých měřeí v jedoduchém tříděí. Tyto aalýzy odpovídají aalýze rozptylu (ANOVA - aalysis of variace, MANOVA - multivariateanova) jedoduchého tříděí. ÚVOD (pokr.) v Výše uvedeé testy jsou aalogií zámých parametrických testů, tj. jedovýběrového t-testu, dvouvýběrového t-testu pro ezávislé výběry a aalýzy rozptylu v Neparametrické testy emusí vyžadovat splěí všech požadavků zámých z parametrických metod, jakými jsou apříklad ormalita rozděleí, případě ai shodost rozptylů u dvouvýběrových testů (apř. robustí dvouvýběrový test) v V případě, že jsou ovšem požadavky a použití parametrických metod splěy, je vhodé je upředostit před metodami eparametrickými, eboť testy založeé a parametrických metodách mají zpravidla větší sílu (využívají více iformace) II. USPOŘÁDÁNÍ A POŘADÍ v Pozorovaá data: -,,,, 0, 0,, v Vzestupě uspořádaá data: -, 0,,,,,, 0 v Pořadí R i pozorovaých dat (Raks R i ):, 5,,,,, 7,

POŘADÍ SHODNÝCH POZOROVÁNÍ (ties) v V případě shodých pozorováí (ties) přiřazujeme tzv. průměrá pořadí (averageraks). v Vzestupě uspořádaá dataa jejich průměrápořadí: Uspořádaá Data - Průměrá pořadí 0,5,5 5 7 7 7 0 0 0,5,5 III. VÝBĚROVÉ KVANTIL SPOJITÝCH ROZDĚLENÍ v Vzestupě uspořádaá data: -, 0,,,,,, 0 v Výběrové kvatily: -. 0% kvatil (mi) 0. /7 =,% kvatil. /7 =,% kvatil... 5/7 = 7,5% kvatil 0. 00% kvatil (max) ODHAD KVANTILŮ SPOJITÝCH ROZDĚLENÍ v Vzestupě uspořádaá data: -, 0,,,,,, 0 v Odhady kvatilů (lieáríiterpolace): 0% kvatil (mi) =-,00 0% kvatil =- + (0- -)*(0/.) = -0,0 5% (.kvartil, Q) = 0 + (-0)*(0.7/.)= 0,75 50% (mediá): =,50 75% (. kvartil, Q) = 5,00 0% kvatil =,0 00% kvatil (max) =0,00

IV. KVANTILOVÝ TEST (-výběrový) v Nulováhypotéza: H 0 : x q = c (H 0 :00*q% kvatil x q cílové populaceje rove c) v Alterativí hypotéza: H : x q c v Hladia výzamosti: α (apř. 0,05) v Postup: Záhodého výběru vyřadíme čley, u kterých je hodota zaku x rova kostatě c. Ve výsledém souboru o rozsahu pak zjistíme počet čleů m, u kterých je x < c. v Testová statistika: Z = m q ~ N(0,) q( q) má za platosti H 0 stadardíormálí rozděleí N(0,). v Testové kritérium: Zamítáme H 0, jestliže Z z α / v Předpoklady: > 5, 0,0 < q < 0,0 a spojitost rozděleí (aprox. biomického rozděleí ormálím rozděleím N(0,)) KVANTILOVÝ TEST příklad: v ZADÁNÍ: Na základě dat o itervečí léčbě 00 pacietů sezávažou formou hyperlipoproteiemie(sérum CHOL 0 mmol/l a více) testujte a hladiě výzamosti α = 0,05 hypotézu, že u alespoň 0% pacietů s touto závažou formou hyperlipoproteiémiedocílí itervečí léčba poklesu hladiy CHOL v séru většího ež mmol/l. v H 0 :(y -x) 0.0 = d 0.0 = v H : d 0.0 > (léčba edosahuje staoveého poklesu u alespoň 0% pacietů) (pokles u alespoň 0%pacietů) v HLADINA VÝZNAMNOSTI: α =0,05 KVANTILOVÝ TEST pokr. př.: v ŘEŠENÍ: Předpokládejme, že data ukazují, že ve 00 případech ze 00 byla hodota d >a ai v jedom případě ebylo d =. Tedy: = 00 (počet případů kde d ) m = 00 (počet případů kde d > ) q = 0,0. m q 00 00 *0, v TESTOVÁ STATISTIKA: Z = = =,5 q( q) 00 *0,*0, v VÝSLEDEK: Kritická hodota ormálího rozděleí pro jedostraý test a hladiě výzamosti α = 5% má hodotu,5. Protože hodota testové statistiky Z =,5 přesahuje kritickou hodotu, zamítáme ulovou hypotézu H 0 a hladiě výzamosti 5%. v ZÁVĚR: Na hladiěα= 0,05 zamítáme ulovou hypotézu H 0, že itervečí léčba edosahuje staoveého poklesu hladiy CHOL o více ež mmol/l u alespoň 0% pacietů.

V. ZNAMÉNKOVÝ TEST (párový) v NULOVÁ HPOTÉZA: H 0 : (x y) 0,5 = d 0,5 = 0 (H 0 :Mediá párových rozdílů d 0,5 je rove 0) v ALTERNATIVNÍ HPOTÉZA: H : d 0,5 0 v HLADINA VÝZNAMNOSTI: α (apř. 0,05) v POZNÁMKA: Zamékový test je speciálím případem kvatilového testu pro mediá (tj. q = 0,5) aplikovaého a párové rozdíly hodot mezi dvěma výběry. v POSTUP: Zezákladího souboru párových rozdílů vyřadíme čley, u kterých je hodota zaku d = x - yrova 0. Ve výsledém souboru o rozsahu (počet párů) pak zjistíme počet čleů C, u kterých je d > 0. V. ZNAMÉNKOVÝ TEST (párový, pokr.) v TEST H 0 (aproximace biomického rozděleí ormálím): Zamíteme H 0, jestliže: C > + + z α / ebo C < z α / v PŘEDPOKLAD: Počet dvojic 0 a spojitost rozděleí v TEST H 0 (exaktí staoveí hladiy výzamosti p a základě biomickéhorozděleí): (a) Je - li C > p = * j= C j C (b) Je - li C < p = * j = 0 j ZNAMÉNKOVÝ TEST příklad v DERMATOLOGIE: Byla realizováa studie zaměřeá a porováí účiosti pleťových krémů typu A, B a C s ochraým faktorem proti egativím účikům sluečího zářeí při dlouhodobé expozici. Krémy byly aplikováy účastíkům studie a odpovídající místa s podobou kvalitou pokožky a levé a pravé části těla a každý z účastíků byl ásledě vystave itezivímu sluečímu zářeí po dobu hod. Poté bylo dermatologem porováo zrudutí pokožky a ošetřeých místech. 5

ZNAMÉNKOVÝ TEST příklad v Orgaizace dat: 5 7 0 Krém A Krém B Krém C 5 5 5 7 5 5 5 5 Původí data hodotila zrudutí pokožky koeficietem 0 až 5. v DATA: Box & Whisker Plot ZNAMÉNKOVÝ TEST příklad Box & Whisker Plot 0 0 0 Krém A Krém B Krém C Media 5%-75% Mi-Max ZNAMÉNKOVÝ TEST (pokr. př.) v Soustřeďme se yí pouze a porováí účiosti jedotlivých dvojic krémů typu A, B a C. Navíc předpokládejme, že dermatolog byl schope rozlišit pouze ásledující případy (zde porováváme apř. krémy typu A a B):. Místo A je lépe ochráěé ež místo B (meší zrudutí při aplikaci krému A). Místo B je lépe ochráěé ež místo A (meší zrudutí při aplikaci krému B). Obě místa vykazují podobý stupeň zrudutí pokožky v Tato situace je vhodá pro využití zamékového testu, eboť původí hodoty koeficietů zrudutí pokožky v tomto případě ejsou dostupé, pouze počty případů, kdy pro d = x y platí: d < 0, d=0 a d >0.

STATISTICA.0: ZNAMÉNKOVÝ TEST (pokr. př.) Sig Test (sig-test-small.sta) Marked tests are sigificat at p <,05000 No. of Percet Z p-level Pair of Variables No-ties v < V Krém A & Krém C 00,0000,7 0,007 Sig Test (sig-test-small.sta) Marked tests are sigificat at p <,05000 No. of Percet Z p-level Pair of Variables No-ties v < V Krém A & Krém B,,000000 0,05500 Sig Test (sig-test-small.sta) Marked tests are sigificat at p <,05000 No. of Percet Z p-level Pair of Variables No-ties v < V Krém B & Krém C,,000000 0,05500 ZNAMÉNKOVÝ TEST (pokr. př.) v Rozsah áhodého výběru byl však v každé skupiě (tj, pro každý typ ochraého krému) pouze 0, což esplňuje požadavek a aproximaci biomického rozděleí stadardím ormálím rozděleím. V takovém případě je uté použít exaktí test biomický test. v Buď C AB počet subjektů, u ichžje d = x y > 0 při porováváí účiku krémů A a B. Je-li C AB velké číslo blízké, pak krém B chráí pokožku většiy studovaých subjektů lépe ež krém A, zatímco je-li C AB malé, pak krém typu A vykazuje a souboru studovaých subjektů lepší výsledky ež krém typu B. ZNAMÉNKOVÝ TEST (pokr. př.) v Za platosti ulové hypotézy H 0 (tj. předpokladu stejé efektivity krémů A a B) lze předpokládat, že Pr(d > 0) = Pr(d < 0) je u subjektů s eulovou hodotou d stejá, tedy ½. Jiými slovy, jsou-li oba krémy stejě efektiví, potom frekvece případů, kdy A je lepší ež B a případů, kdy A je horší ež B by měly být zhruba stejé. v Ke staoveí DOSAŽENÉ HLADIN VÝZNAMNOSTI p zamékového testu tedy můžeme využít přímo formule biomického rozděleí: p = * j = C AB j 7

ZNAMÉNKOVÝ TEST (dokočeí) v EAKTNÍ ZNAMÉNKOVÝ TEST: Připoměňme si, že při porováváíúčiosti krému A a B jsme měli 0 pozorováí, shodu ( tie ), C AB =, =. Pro exaktí výpočet dosažeé hladiy výzamosti oboustraého testu tedy platí: p = * j= 0 j v ZÁVĚR: = *( + )* = 0* = 0,00 Na hladiě výzamosti α = 5% zamítáme ulovou hypotézu H 0 o shodosti účiku ochraých krémů typu A a B. VI. WILCOONŮV PÁROVÝ TEST (siged-rak test) v NULOVÁ HPOTÉZA: H 0 : (x y) 0,5 = d 0,5 = 0 (H 0 :Mediá párových rozdílů d 0,5 = 0) v ALTERNATIVNÍ HPOTÉZA: H : d 0,5 0 v HLADINA VÝZNAMNOSTI: α (apř. 0,05) v POSTUP: Z áhodého výběru s počtem párových pozorováí vyřadíme čley, u ichž je hodota zaku d = x - yrova0. Staovíme pořadí hodot d a zjistíme součet pořadí T +,která odpovídají kladým hodotám d. VI. WILCOONŮV PÁROVÝ TEST (siged-rak test, pokr.) + T ( + ) / v TESTOVÁ STATISTIKA: Z = ~ N (0,) ( + )( + ) / má za platosti H 0 stadardíormálí rozděleí v POZNÁMKA: Wilcoxoův párový test má větší statistickou sílu ež zamékový test, eboť využívá jak iformaci o směru rozdílů, tak o jejich velikosti ve formě pořadí. To se projevuje také v ižším požadovaém miimálím rozsahu áhodého výběru. v TESTOVÉ KRITÉRIUM: ZamítámeH 0,jestliže Z z α / v PŘEDPOKLAD:počet párů > 5 a spojitost rozděleí

WILCOONŮV PÁROVÝ TEST-příklad v Pokračujme aším příkladem z dermatologie: připoměňme, že Wilcoxoův siged-rak test pracuje s aktuálí velikostí rozdílů d = x y, ikoliv pouze s iformací, zda x je větší či meší ež y. Můžeme tedy očekávat, že reálě existující rozdíly mezi efektivostí krémů bude sazší detekovat a základě Wilcoxoova párového testu ež jedoduššího testu zamékového. WILCOONŮV PÁROVÝ TEST-příklad v Orgaizace dat: v Box ad Whisker plot: Krém A Krém B Krém C 5 5 5 7 5 5 7 5 5 5 0 0 5 5 5 5 7 5 7 0 5 0 0 0 0 Box & Whisker Plo Krém A Krém B Krém C Media 5%-75% Mi-Max WILCOONŮV PÁROVÝ TEST (pokr. př.): Krém A vs B: Wilcoxo Matched Pairs Test (sig-test.sta) Marked tests are sigificat at p <,05000 Valid T Z p-level Pair of Variables N Kr ém A & Krém B 0 0,00000,05 0,0000 Srovej: Sig Test (sig-test.sta) Marked tests are sigificat at p <,05000 No. of Percet Z p-level Pair of Variables No-ties v < V Krém A & Krém B,,0 0,00

WILCOONŮV PÁROVÝ TEST (pokr. př.): Krém A vs C: Wilcoxo Matched Pairs Test (sig-test.sta) Marked tests are sigificat at p <,05000 Valid T Z p-level Pair of Variables N Kr ém A & Krém C 0,500000,50 0,0005 Srovej: Sig Test (sig-test.sta) Marked tests are sigificat at p <,05000 No. of Percet Z p-level Pair of Variables No-ties v < V Krém A & Krém C,,555 0,00007 WILCOONŮV PÁROVÝ TEST (pokr. př.): Krém B vs C: Wilcoxo Matched Pairs Test (sig-test.sta Marked tests are sigificat at p <,05000 Valid T Z p-level Pair of Variables N Krém B & Krém C 0,500000,0 0,0005 Srovej: Sig Test (sig-test.sta) Marked tests are sigificat at p <,05000 No. of Percet Z p-level Pair of Variables No-ties v < V Krém B & Krém C 7,75,5 0,0005 VII. MEDIÁNOVÝ TEST (dvouvýběrový) v NULOVÁ HPOTÉZA: v ALTERNATIVNÍ HPOTÉZA: H 0 : Θ = Θ (H 0 :Mediáy Θ a Θ jsou shodé) v HLADINA VÝZNAMNOSTI: α (apř. 0,05) H : Θ > Θ (mediá Θ je apravo od Θ ) v POSTUP: Klasifikacehodot vobou souborech podle společého mediáu Θ : Klasifikace Soubor Počet hodot > Θ a Počet hodot < Θ c Celkem a+c Soubor b d b+d Celkem a+b c+d 0

v MEDIÁNOVÝ TEST (dvouvýběrový, pokr.) VARIANT TESTU: - exaktí a základě hypergeometrickéhorozděleí: (Fisherův test, 0) a + c b + d a b P [ a, b] = a + b - Chí-kvadrát aproximace(>0): ( ad bc / ) () = ( a + b)( a + c)( b + d)( c + d) v PŘEDPOKLAD: spojitost a shodý tvar rozděleí a. VIII. WILCOONŮV DVOUVÝBĚROVÝ TEST (Ma-Whitey U test, Rak-Sum test) v NULOVÁ HPOTÉZA: H 0 : Dva ezávislé výběry pocházejí z populací se shodými mediáy (Θ = Θ ) v ALTERNATIVNÍ HPOTÉZA: od (mediá Θ > Θ ) H : Populace je apravo v HLADINA VÝZNAMNOSTI: α (apř. 0,05) v POSTUP: Staovímepořadí hodot vsouboru vziklém spojeím výběrů a azjistímesoučty pořadí W aw ( raked sums ) odpovídající výběrům,. Za platosti H 0 by statistikyw aw y měly mít přibližě stejou hodotu. WILCOONŮV DVOUVÝBĚROVÝ TEST (pokr.) v TESTOVÁ STATISTIKA: W + 0.5 m( m + + ) / Z = ~ N(0,) m( m + + ) / má za platosti H 0 stadardíormálí rozděleí N(0,), přičemž m a jsou rozsahy jedotlivých výběrů. v POZNÁMKA: V případě, že H mátvar Θ < Θ má hodota 0,5 v čitateli záporé zaméko.wilcoxoův dvouvýběrový test má větší statistickou sílu ež mediáový test, eboť využívá jak iformaci o poloze skórů vůči společému mediáu, tak také součty pořadí.

WILCOONŮV DVOUVÝBĚROVÝ TEST (dok.) v TESTOVÉ KRITÉIUM: ZamítámeH 0, jestliže Z z α v PŘEDPOKLAD: m> 0, > 0 a spojitost a shodý tvar rozděleí v obou populacích WILCOONŮV DVOUVÝBĚROVÝ TEST - příklad v v Pokračujme opět aším příkladem z dermatologie; pouze yí předpokládejme, že data evzikla párovým porováváím a týchž subjektech, ýbrž že každému z účastíků studie byl apliková právě jediý z ochraých krémů typu A, B, C. Z tohoto důvodu budou mít data amísto 0 zázamů (records) se třemi proměými A, B, C mít zázamů 0 a pouze dvě proměé, přičemž prví proměá udává hodotu zjištěého koeficietu a druháje idikátorem, udávajícím typ použitého krému u daého subjektu. WILCOONŮV DVOUVÝBĚROVÝ TEST - příklad v Orgaizace dat v programu Statistica v tomto případě vypadá ásledově: 5 7 0 5 7 0 5 7 0 Krém Group 5 5 5 5 7 5 5

WILCOONŮV DVOUVÝBĚROVÝ TEST - pokr. př. Ma-Whitey U Test (Wilcoxo Rak Sum Test.sta) By variable Group Marked tests are sigificat at p <,05000 Rak Sum Rak Sum U Z p-level Z p-level Valid N Valid N *sided variable Group Group adjusted Group Group exact p Krém 5,5000,5000 5,5000 -,05 0,0 -,00 0,05 0 0 0,05 DALŠÍ DVOUVÝBĚROVÉ TEST: v KOLMOGOROVŮV-SMIRNOVŮV test: Kolmogorov-Smirov Test (Wilcoxo Rak Sum Test.sta) By variable Group Marked tests are sigificat at p <,05000 Max Neg Max Pos p-level Mea Mea Std.Dev. Std.Dev. Valid N Valid N variable Differc Differc Group Group Group Group Group Group Kr ém -0,00000 0,00 p >.0,00000,050000,750,70 0 0 v WALDŮV-WOLFOWITZŮV rus test Wald-Wolfowitz Rus Test (Wilcoxo Rak Sum Test.sta) By variable Group Marked tests are sigificat at p <,05000 Valid N Valid N Mea Mea Z p-level Z adjstd p-level No. of No. of Variable Group Group Group Group Rus ties Kr ém 0 0,00000,050000 0,05 0,50 0,000 0, 7 Pozámky k dvouvýběrovým testům: v Ukázka výpočtu rus ve WALDOVĚ-WOLFOWITZOVĚ testu a příkladě: pořadí... data MMMZZZMMMMZZMMMZZZZZZZMMZMMZZZZ ru 555 77 0000

Pozámky k dvouvýběrovým testům: v WILCOONŮV DVOUVÝBĚROVÝ TEST (Maův- Whiteyův U-test, Wilcoxoův Rak-Sum test) má ejvětší statistickou sílu z uvedeých testů a je vhodý zejméa v případě, že počet ties (shodých pozorováí) je malý. Je vhodý zejméa v situacích, kdy se průměré hodoty pořadí v jedotlivých skupiách (apř. muži a žey) podstatě liší. v WALDŮV-WOLFOWITZŮV RUNS TEST má meší statistickou sílu, ale je vhodý v případě, že průměré hodoty pořadí se ve skupiách (muži a žey) zásadě eliší, ale apříklad u mužů abývají buď vysokých ebo aopak ízkých hodot, zatímco u že abývají středích hodot. v KOLMOGOROVŮV-SMIRNOVŮV test je vhodý v případě, že počet shodých pozorováí ( ties ) je vyšší. I. KRUSKALOVA-WALLISOVA ANOVA v Nulováhypotéza: H 0 : k ezávislých výběrů pochází z populací se shodými mediáy (Θ = Θ =...= Θ k ) v Alterativí hypotéza: H : Mediáy se alespoň ve dvou populacích vzájemě liší v Hladia výzamosti: α (apř. 0,05) v Postup:. Do tabulky o k sloupcích, ve které j-tý sloupec odpovídá výběru z j-té populace (j=,...,k), zapíšeme amísto pozorovaých hodot pořadí, která odpovídají pozorovaým hodotám v souboru vziklém spojeím k podsouborů.. V každé z k skupi spočteme průměrépořadí R j, (j=,...,k) KRUSKALOVA-WALLISOVA ANOVA (pokr.) v Testová statistika: má za platosti H 0 rozděleí v Testové kritérium: Zamítáme H 0, jestliže KW v Předpoklady: k KW = j R j ( N + ) N( N + ) j = χ k > χ k ( α) - Rozsahy výběru j (j=,...,k) musí být v jedotlivých skupiách alespoň 5 - Spojitost - Shodý tvar rozděleí v jedotlivých populacích.

KRUSKALOVA-WALLISOVA aalýza příklad: Opthalmologie: v Kyselia arachodiová je zámá tím, že ovlivňuje metabolismus oka. Kotakt oka s malým možstvím této kyseliy má za ásledek zavřeí víčka, svěděí a v ěkterých případech poruchy viděí. Studie, z íž pocházejí data pro áš příklad, porovávala protizáětlivé účiky zkoumaých látek, které byly aplikováy laboratorím zvířatům (bílí králíci) do jedoho oka a roztok salia do druhého oka. v Po 0 miutách bylo králíkům aplikováo malé možství kyseliy arachodiové a obě bulvy. Po dalších 5 miutách byli králíci kotrolovái, zda došlo k uzavřeí víčka a bylo zazameáo skóre, které představovalo hodotu rozdílu mezi stupěm otevřeí víčka (0-otevřeé, - polouzavřeé a uzavřeé) a začátku pokusu a po aplikaci kyseliy arachodiové. KRUSKALOVA-WALLISOVA aalýza pokr. př.: Opthalmologie: v Data pro statistickou aalýzu udávají míru efektivosti protizáětlivého přípravku a jsou dáa rozdíly mezi hodotou skóre a oku ošetřeém aktiví látkou a oku ošetřeém saliou (eutrálí izotoický 0,% roztok soli). v Vyšší hodoty skórů (rozdíly rozdílů) azačují efektivější účiek protizáětlivé látky. KRUSKALOVA-WALLISOVA aalýza pokr. př. v Opthalmologie-data: 5 7 0 5 7 0 Sk ore Lecba Idometaci Idometaci Idometaci Idometaci Idometaci 0 Idometaci Aspiri Aspiri Aspiri Aspiri Aspiri Aspiri Piroxicam Piroxicam Piroxicam Piroxicam Piroxicam Piroxicam BW755C 0 BW755C 0 BW755C 0 BW755C 0 BW755C - BW755C 5

KRUSKALOVA-WALLISOVA aalýza pokr. př. v Box & Whisker Plot:,5 Boxplot by Group Variable: Skore,0,5,0,5 Skore,0 0,5 0,0-0,5 -,0 -,5 Idometaci Aspiri Piroxicam BW755C Lecba Media 5%-75% Mi-Max KRUSKALOVA-WALLISOVA aalýza pokr. př. v K-W aalýza pořadových skórů: Deped.: Sk ore Idometaci Aspiri Piroxicam BW755C v Mediáový test: Depedet: Sk ore <= Media: observed expected obs.-exp. > Media: observed expected obs.-exp. Total: observed Kruskal-Wallis ANOVA by Raks; Idepedet (groupig) variable: Lecba Kruskal-Wallis test: H (, N= ) =,05 p =,00 Code Valid Sum of N Raks 0 7,50000 0 5,00000 0,50000 0,00000 Media Test, Overall Media =,00000; Sk ore (Kruskal-Wallis Ophtalmologie.sta) Idepedet (groupig) variable: Lecba Chi-Square =,, df =, p =,0 Idometaci Aspiri Piroxicam BW755C Total,00000,000000,000000,00000 5,00000,75000,750000,750000,75000 -,75000 0,50000-0,750000,5000,00000,000000,000000 0,00000,00000,5000,50000,50000,5000,75000-0,50000 0,750000 -,5000,00000,000000,000000,00000,00000. ROBUSTNÍ DVOUVÝBĚROVÝ TEST v NULOVÁ HPOTÉZA: H 0 : Dva ezávislé výběry pocházejí z populací se shodými mediáy (Θ = Θ ) v ALTERNATIVNÍ HPOTÉZA: H : Mediá Θ > Θ v HLADINA VÝZNAMNOSTI: α (apř. 0,05) v POSTUP (a příkladě):. Vzestupě uspořádejme pozorovaá data a ozačme příslušost ke skupiám a : Data Skupia 0 5

ROBUSTNÍ DVOUVÝBĚROVÝ TEST (pokr.) Data Skupia 0 5. Defiujeme: U( i ) počet meších ež i U( j ) počet meších ež j i U( i ) 5 j U( j ) 0 0 0. Vypočteme středí hodoty U() a U(): ( ) (+ + ( ) = m U i U = i= m ( ) (0+ 0+ + ( ) = U i U = i= ) ) = = 0,75 ROBUSTNÍ DVOUVÝBĚROVÝ TEST - pokr. Středí hodoty: U() = U() = 0,75.. Vypočteme ukazatelevariability V a V : V i U( i ) m = [ U ( i) U ( )] i= = ( ) + ( ) + ( ) = + 0+ = 5 V j U( j ) = = j= 0 [ U( ) U( ) ] j 0 0 = (0 0,75) + (0 0,75) + ( 0,75) + ( 0,75) =,75 = ROBUSTNÍ DVOUVÝBĚROVÝ TEST - pokr. v Středí hodoty: U() = U() = 0,75. v Ukazatele variability: V = V =,75. 5. TESTOVÁ STATISTIKA U má za platosti H 0 rozděleí N(0,): mu( ) U( ) () (0,75) U = = =, V + V + U ( ) U ( ) +,75+ (0,75)(). TESTOVÉ KRITÉRIUM: Zamítáme H 0, jestližeplatí U z. 7. ZÁVĚR: V ašem příkladě H 0 ezamítáme. α. PŘEDPOKLAD: m >, > a spojitost rozděleí (rozptyly se mohou lišit, jde o tzv. Behresův-Fisherův problém). Pro m, je rozděleí U tabelováo. 7