Neparametrické metody



Podobné dokumenty
Neparametrické metody

NEPARAMETRICKÉ METODY

Pravděpodobnost a aplikovaná statistika

Deskriptivní statistika 1

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

Pravděpodobnost a aplikovaná statistika

Základy statistiky. Zpracování pokusných dat Praktické příklady. Kristina Somerlíková

P2: Statistické zpracování dat

Kapitola 6. : Neparametrické testy o mediánech

8. cvičení 4ST201-řešení

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

12. N á h o d n ý v ý b ě r

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

Přednáška VIII. Testování hypotéz o kvantitativních proměnných

8. Analýza rozptylu.

Závislost slovních znaků

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

Náhodný výběr 1. Náhodný výběr

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

Pro statistické šetření si zvolte si statistický soubor např. všichni žáci třídy (několika tříd, školy apod.).

Popisná statistika - zavedení pojmů. 1 Jednorozměrný statistický soubor s kvantitativním znakem

1.3. POLYNOMY. V této kapitole se dozvíte:

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

VYSOCE PŘESNÉ METODY OBRÁBĚNÍ

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

Testujeme hypotézu: proti alternativě. Jednoduché třídění:

vají statistické metody v biomedicíně

14. Testování statistických hypotéz Úvod statistické hypotézy Definice 14.1 Statistickou hypotézou parametrickou neparametrickou. nulovou testovanou

Odhady parametrů 1. Odhady parametrů

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 2

Pravděpodobnost a aplikovaná statistika

vají statistické metody v biomedicíně Literatura Statistika v biomedicínsk nském výzkumu a ve zdravotnictví

13 Popisná statistika

Katedra pravděpodobnosti a matematické statistiky. χ 2 test nezávislosti

veličiny má stejný řád jako je řád poslední číslice nejistoty. Nejistotu píšeme obvykle jenom jednou

2 IDENTIFIKACE H-MATICE POPISUJÍCÍ VEDENÍ Z NAMĚŘENÝCH HODNOT

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Parametr populace (populační charakteristika) je číselná charakteristika sledované vlastnosti

UPLATNĚNÍ ZKOUŠEK PŘI PROHLÍDKÁCH MOSTŮ

Co je to statistika? Statistické hodnocení výsledků zkoušek. Úvod statistické myšlení. Úvod statistické myšlení. Popisná statistika

Elementární zpracování statistického souboru

1. JEV JISTÝ a. je jev, který nikdy nenastane b. je jev, jehož pravděpodobnost = ½ c. je jev, jehož pravděpodobnost = 0 d.

0,063 0,937 0,063 0, P 0,048 0,078 0,95. = funkce CONFIDENCE.NORM(2α; p(1 p)

jako konstanta nula. Obsahem centrálních limitních vět je tvrzení, že distribuční funkce i=1 X i konvergují za určitých

17. Statistické hypotézy parametrické testy

Testování statistických hypotéz

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

2. Náhodná veličina. je konečná nebo spočetná množina;

7. Odhady populačních průměrů a ostatních parametrů populace

2 STEJNORODOST BETONU KONSTRUKCE

Přednáška VI. Intervalové odhady. Motivace Směrodatná odchylka a směrodatná chyba Centrální limitní věta Intervaly spolehlivosti

Pravděpodobnostní modely

PRAVDĚPODOBNOST A STATISTIKA

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

Intervalové odhady parametrů některých rozdělení.

REGRESNÍ DIAGNOSTIKA. Regresní diagnostika

Pravděpodobnostní model doby setrvání ministra školství ve funkci

Statistika. Statistické funkce v tabulkových kalkulátorech MSO Excel a OO.o Calc

3. Lineární diferenciální rovnice úvod do teorie

MATICOVÉ HRY MATICOVÝCH HER

6. P o p i s n á s t a t i s t i k a

Popisná statistika. Zdeněk Janák 9. prosince 2007

Intervalové odhady parametrů

Mezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby.

OKRUŽNÍ A ROZVOZNÍ ÚLOHY: OBCHODNÍ CESTUJÍCÍ. FORMULACE PŘI RESPEKTOVÁNÍ ČASOVÝCH OKEN

EKONOMETRIE 9. přednáška Zobecněný lineární regresní model

8. cvičení 4ST201. Obsah: Neparametrické testy. Chí-kvadrát test dobréshody Kontingenční tabulky Analýza rozptylu (ANOVA) Neparametrické testy

Cvičení 9: Neparametrické úlohy o mediánech

Statistika. Poznámky z přednášek

Tento projekt je spolufinancován Evropským sociálním fondem a Státním rozpočtem ČR InoBio CZ.1.07/2.2.00/

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Při sledování a studiu vlastností náhodných výsledků poznáme charakter. podmínek různé výsledky. Ty odpovídají hodnotám jednotlivých realizací

Úloha II.S... odhadnutelná

Úloha III.S... limitní

Náhodu bychom mohli definovat jako součet velkého počtu drobných nepoznaných vlivů.

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Fakulta strojního inženýrství. Matematika IV. Semestrální práce

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Metody zkoumání závislosti numerických proměnných

1. Základy počtu pravděpodobnosti:

4EK212 Kvantitativní management 4. Speciální úlohy lineárního programování

VaR analýza citlivosti, korekce

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Základní požadavky a pravidla měření

STUDIUM MAXWELLOVA ZÁKONA ROZDĚLENÍ RYCHLSOTÍ MOLEKUL POMOCÍ DERIVE 6

Pravděpodobnost vs. statistika. Data. Teorie pravděpodobnosti pracuje s jednou nebo více teoretickými náhodnými

DERIVACE FUNKCÍ JEDNÉ REÁLNÉ PROM

STATISTIKA PRO EKONOMY

Odhad parametru p binomického rozdělení a test hypotézy o tomto parametru. Test hypotézy o parametru p binomického rozdělení

8. Základy statistiky. 8.1 Statistický soubor

UNIVERZITA PALACKÉHO V OLOMOUCI PŘÍRODOVĚDECKÁ FAKULTA KATEDRA MATEMATICKÉ ANALÝZY A APLIKACÍ MATEMATIKY. Statistické chyby v medicínském výzkumu

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Stav Svobodný Rozvedený Vdovec. Svobodná Rozvedená Vdova 5 8 6

MOŽNOSTI STATISTICKÉHO POSOUZENÍ KVANTITATIVNÍCH VÝSLEDKŮ POŽÁRNÍCH ZKOUŠEK PRO POTŘEBY CERTIFIKACE A POSUZOVÁNÍ SHODY VÝROBKŮ

10.3 GEOMERTICKÝ PRŮMĚR

Statistika pro metrologii

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Testování statistických hypotéz

Transkript:

I. ÚVOD Neparametrické metody EuroMISE Cetrum v Neparametrické testy jsou založey a pořadových skórech, které reprezetují původí data v Data emusí utě splňovat určité předpoklady vyžadovaé u parametrických testů (apř. ormalita rozdílů v párovém t-testu) v Neparametrické metody mohou zahrovat požadavky a určité vlastosti rozděleí (apř. symetrie ebo spojitost) v Jsou mohdy jediou alterativou aalýzy ordiálích dat ebo dat ve formě četostí či pořadí Kotakt: Literatura: Obecé iformace Zvárová, J.: Základy statistiky pro biomedicíské obory I. Vydavatelství Karolium, UK Praha Zvára, K.: Roser, B.: EuroMISE cetrum Doc. Zdeěk Valeta, Ph.D. Tel.: 5 (sekretariát) Fax: 5 5 http://www.euromise.cz valeta@euromise.cz Biostatistika. Vydavatelství Karolium, UK Praha Fudametals of Biostatistics, th Editio ÚVOD (pokr.) v TŘÍD NEPARAMETRICKÝCH TESTŮ: JEDNOVÝBĚROVÉ: Kvatilový test DVOUVÝBĚROVÉ PÁROVÉ: Zamékový test, Wilcoxoův párový test (siged-rak test). Oba testy jsou eparametrickou alterativou párového t-testu. DVOUVÝBĚROVÉ PRO NEZÁVISLÉ VÝBĚR: Mediáový test, Wilcoxoův dvouvýběrový test (Maův-Whiteyův U test, Wilcoxo Rak-Sum test), Robustí dvouvýběrový test, Kolmogorovův-Smirovův dvouvýběrový test, případě Waldův-Wolfowitzův rus test. Tyto testy jsou eparametrickou alterativou dvouvýběrového t-testu. VÍCEVÝBĚROVÉ: Kruskalova-Wallisova aalýza pořadových skórů jedoduchého tříděí, Friedmaova aalýza pořadových skórů opakovaých měřeí v jedoduchém tříděí. Tyto aalýzy odpovídají aalýze rozptylu (ANOVA - aalysis of variace, MANOVA - multivariate ANOVA) jedoduchého tříděí.

ÚVOD (pokr.) v Výše uvedeé testy jsou aalogií zámých parametrických testů, tj. jedovýběrového t-testu, dvouvýběrového t-testu pro ezávislé výběry a aalýzy rozptylu v Neparametrické testy emusí vyžadovat splěí všech požadavků zámých z parametrických metod, jakými jsou apříklad ormalita rozděleí, případě ai shodost rozptylů u dvouvýběrových testů (apř. robustí dvouvýběrový test) v V případě, že jsou ovšem požadavky a použití parametrických metod splěy, je vhodé je upředostit před metodami eparametrickými, eboť testy založeé a parametrických metodách mají zpravidla větší sílu (využívají více iformace) POŘADÍ SHODNÝCH POZOROVÁNÍ (ties) v V případě shodých pozorováí (ties) přiřazujeme tzv. průměrá pořadí (average raks). v Vzestupě uspořádaá data a jejich průměrá pořadí: Uspořádaá Data Průměrá pořadí -,5,5 5,5,5 II. USPOŘÁDÁNÍ A POŘADÍ v Pozorovaá data: -,,,,,,, v Vzestupě uspořádaá data: -,,,,,,, v Pořadí R i pozorovaých dat (Raks R i ):, 5,,,,,, III. VÝBĚROVÉ KVANTIL SPOJITÝCH ROZDĚLENÍ v Vzestupě uspořádaá data: -,,,,,,, v Výběrové kvatily: -. % kvatil (mi). / =,% kvatil. / =,% kvatil... 5/ =,5% kvatil. % kvatil (max)

ODHAD KVANTILŮ SPOJITÝCH ROZDĚLENÍ v Vzestupě uspořádaá data: -,,,,,,, v Odhady kvatilů (lieárí iterpolace): % kvatil (mi) =-, % kvatil =- + (- -)*(/.) = -, 5% (.kvartil, Q) = + (-)*(./.) =,5 5% (mediá): =,5 5% (. kvartil, Q) = 5, % kvatil =, % kvatil (max) =, KVANTILOVÝ TEST příklad: v ZADÁNÍ: Na základě dat o itervečí léčbě pacietů se závažou formou hyperlipoproteiemie (sérum CHOL mmol/l a více) testujte a hladiě výzamosti α =,5 hypotézu, že u alespoň % pacietů s touto závažou formou hyperlipoproteiémie docílí itervečí léčba poklesu hladiy CHOL v séru většího ež mmol/l. v H :(y -x). = d. = v H : d. > v HLADINA VÝZNAMNOSTI: α =,5 (léčba edosahuje staoveého poklesu u alespoň % pacietů) (pokles u alespoň % pacietů) IV. KVANTILOVÝ TEST (-výběrový) v Nulová hypotéza: H : x q = c (H :*q% kvatil x q cílové populace je rove c) v Alterativí hypotéza: H : x q c v Hladia výzamosti: α (apř.,5) v Postup: Záhodého výběru vyřadíme čley, u kterých je hodota zaku x rova kostatě c. Ve výsledém souboru o rozsahu pak zjistíme počet čleů m, u kterých je x < c. v Testová statistika: Z = m q ~ N(,) q( q) má za platosti H stadardí ormálí rozděleí N(,). v Testové kritérium: Zamítáme H, jestliže z α / v Předpoklady: > 5,, < q <, a spojitost rozděleí (aprox. biomického rozděleí ormálím rozděleím N(,)) Z KVANTILOVÝ TEST pokr. př.: v ŘEŠENÍ: Předpokládejme, že data ukazují, že ve případech ze byla hodota d >a ai v jedom případě ebylo d =. Tedy: = (počet případů kde d ) m = (počet případů kde d > ) q =,. m q *, v TESTOVÁ STATISTIKA: Z = = =,5 q( q) *,*, v VÝSLEDEK: Kritická hodota ormálího rozděleí pro jedostraý test a hladiě výzamosti α = 5% má hodotu,5. Protože hodota testové statistiky Z =,5 přesahuje kritickou hodotu, zamítáme ulovou hypotézu H a hladiě výzamosti 5%. v ZÁVĚR: Na hladiě α=,5 zamítáme ulovou hypotézu H, že itervečí léčba edosahuje staoveého poklesu hladiy CHOL o více ež mmol/l u alespoň % pacietů.

V. ZNAMÉNKOVÝ TEST (párový) v NULOVÁ HPOTÉZA: H : (x y),5 = d,5 = (H :Mediá párových rozdílů d,5 je rove ) v ALTERNATIVNÍ HPOTÉZA: H : d,5 v HLADINA VÝZNAMNOSTI: α (apř.,5) v POZNÁMKA: Zamékový test je speciálím případem kvatilového testu pro mediá (tj. q =,5) aplikovaého a párové rozdíly hodot mezi dvěma výběry. v POSTUP: Ze základího souboru párových rozdílů vyřadíme čley, u kterých je hodota zaku d = x - yrova. Ve výsledém souboru o rozsahu (počet párů) pak zjistíme počet čleů C, u kterých je d >. ZNAMÉNKOVÝ TEST příklad v DERMATOLOGIE: Byla realizováa studie zaměřeá a porováí účiosti pleťových krémů typu A, B a C s ochraým faktorem proti egativím účikům sluečího zářeí při dlouhodobé expozici. Krémy byly aplikováy účastíkům studie a odpovídající místa s podobou kvalitou pokožky a levé a pravé části těla a každý z účastíků byl ásledě vystave itezivímu sluečímu zářeí po dobu hod. Poté bylo dermatologem porováo zrudutí pokožky a ošetřeých místech. V. ZNAMÉNKOVÝ TEST (párový, pokr.) v TEST H (aproximace biomického rozděleí ormálím): Zamíteme H, jestliže: ZNAMÉNKOVÝ TEST příklad v Orgaizace dat: C > + + z α / ebo C < z α / v PŘEDPOKLAD: Počet dvojic a spojitost rozděleí v TEST H (exaktí staoveí hladiy výzamosti p a základě biomického rozděleí): (a) Je - li C > p = * j = C j C (b) Je - li C < p = * j = j 5 Krém A Krém B Krém C 5 5 5 5 5 5 5 Původí data hodotila zrudutí pokožky koeficietem až 5.

ZNAMÉNKOVÝ TEST příklad v DATA: Box & Whisker Plot Box & Whisker Plot Krém A Krém B Krém C Media 5%-5% Mi-Max STATISTICA.: ZNAMÉNKOVÝ TEST (pokr. př.) Sig Test (sig-test-small.sta) Marked tests are sigificat at p <,5 No. of Percet Z p-level Pair of Variables No-ties v < V Krém A & Krém C,,, Sig Test (sig-test-small.sta) Marked tests are sigificat at p <,5 No. of Percet Z p-level Pair of Variables No-ties v < V Krém A & Krém B,,,55 Sig Test (sig-test-small.sta) Marked tests are sigificat at p <,5 No. of Percet Z p-level Pair of Variables No-ties v < V Krém B & Krém C,,,55 ZNAMÉNKOVÝ TEST (pokr. př.) v Soustřeďme se yí pouze a porováí účiosti jedotlivých dvojic krémů typu A, B a C. Navíc předpokládejme, že dermatolog byl schope rozlišit pouze ásledující případy (zde porováváme apř. krémy typu A a B):. Místo A je lépe ochráěé ež místo B (meší zrudutí při aplikaci krému A). Místo B je lépe ochráěé ež místo A (meší zrudutí při aplikaci krému B). Obě místa vykazují podobý stupeň zrudutí pokožky v Tato situace je vhodá pro využití zamékového testu, eboť původí hodoty koeficietů zrudutí pokožky v tomto případě ejsou dostupé, pouze počty případů, kdy pro d = x y platí: d <, d = a d >. ZNAMÉNKOVÝ TEST (pokr. př.) v Rozsah áhodého výběru byl však v každé skupiě (tj, pro každý typ ochraého krému) pouze, což esplňuje požadavek a aproximaci biomického rozděleí stadardím ormálím rozděleím. V takovém případě je uté použít exaktí test biomický test. v Buď C AB počet subjektů, u ichž je d = x y > při porováváí účiku krémů A a B. Je-li C AB velké číslo blízké, pak krém B chráí pokožku většiy studovaých subjektů lépe ež krém A, zatímco je-li C AB malé, pak krém typu A vykazuje a souboru studovaých subjektů lepší výsledky ež krém typu B.

ZNAMÉNKOVÝ TEST (pokr. př.) v Za platosti ulové hypotézy H (tj. předpokladu stejé efektivity krémů A a B) lze předpokládat, že Pr(d > ) = Pr(d < ) je u subjektů s eulovou hodotou d stejá, tedy ½. Jiými slovy, jsou-li oba krémy stejě efektiví, potom frekvece případů, kdy A je lepší ež B a případů, kdy A je horší ež B by měly být zhruba stejé. v Ke staoveí DOSAŽENÉ HLADIN VÝZNAMNOSTI p zamékového testu tedy můžeme využít přímo formule biomického rozděleí: p = * j= C AB j VI. WILCOONŮV PÁROVÝ TEST (siged-rak test) v NULOVÁ HPOTÉZA: H : (x y),5 = d,5 = (H :Mediá párových rozdílů d,5 = ) v ALTERNATIVNÍ HPOTÉZA: H : d,5 v HLADINA VÝZNAMNOSTI: α (apř.,5) v POSTUP: Z áhodého výběru s počtem párových pozorováí vyřadíme čley, u ichž je hodota zaku d = x - yrova. Staovíme pořadí hodot d a zjistíme součet pořadí T +,která odpovídají kladým hodotám d. ZNAMÉNKOVÝ TEST (dokočeí) v EAKTNÍ ZNAMÉNKOVÝ TEST: Připoměňme si, že při porováváí účiosti krému A a B jsme měli pozorováí, shodu ( tie ), C AB =, =. Pro exaktí výpočet dosažeé hladiy výzamosti oboustraého testu tedy platí: p = * j= j v ZÁVĚR: = *( + )* = * =, Na hladiě výzamosti α = 5% zamítáme ulovou hypotézu H o shodosti účiku ochraých krémů typu A a B. VI. WILCOONŮV PÁROVÝ TEST (siged-rak test, pokr.) + T ( + ) / v TESTOVÁ STATISTIKA: Z = ~ N(,) ( + )( + ) / má za platosti H stadardí ormálí rozděleí v POZNÁMKA: Wilcoxoův párový test má větší statistickou sílu ež zamékový test, eboť využívá jak iformaci o směru rozdílů, tak o jejich velikosti ve formě pořadí. To se projevuje také v ižším požadovaém miimálím rozsahu áhodého výběru. v TESTOVÉ KRITÉRIUM: Zamítáme H,jestliže z α / v PŘEDPOKLAD:počet párů > 5 a spojitost rozděleí Z

v WILCOONŮV PÁROVÝ TEST -příklad Pokračujme aším příkladem z dermatologie: připoměňme, že Wilcoxoův siged-rak test pracuje s aktuálí velikostí rozdílů d = x y, ikoliv pouze s iformací, zda x je větší či meší ež y. Můžeme tedy očekávat, že reálě existující rozdíly mezi efektivostí krémů bude sazší detekovat a základě Wilcoxoova párového testu ež jedoduššího testu zamékového. WILCOONŮV PÁROVÝ TEST (pokr. př.): Krém A vs B: Wilcoxo Matched Pairs Test (sig-test.sta) Marked tests are sigificat at p <,5 Valid T Z p-level Pair of Variables N Krém A & Krém B,,5, Srovej: Sig Test (sig-test.sta) Marked tests are sigificat at p <,5 No. of Percet Z p-level Pair of Variables No-ties v < V Krém A & Krém B,,, WILCOONŮV PÁROVÝ TEST -příklad WILCOONŮV PÁROVÝ TEST (pokr. př.): v Orgaizace dat: v Box ad Whisker plot: Krém A vs C: 5 5 Krém A Krém B Krém C 5 5 5 5 5 5 5 5 5 5 5 5 Box & Whisker Plot Krém A Krém B Krém C Media 5%-5% Mi-Max Wilcoxo Matched Pairs Test (sig-test.sta) Marked tests are sigificat at p <,5 Valid T Z p-level Pair of Variables N Krém A & Krém C,5,5,5 Srovej: Sig Test (sig-test.sta) Marked tests are sigificat at p <,5 No. of Percet Z p-level Pair of Variables No-ties v < V Krém A & Krém C,,555,

WILCOONŮV PÁROVÝ TEST (pokr. př.): Krém B vs C: Wilcoxo Matched Pairs Test (sig-test.sta) Marked tests are sigificat at p <,5 Valid T Z p-level Pair of Variables N Krém B & Krém C,5,,5 Srovej: Sig Test (sig-test.sta) Marked tests are sigificat at p <,5 No. of Percet Z p-level Pair of Variables No-ties v < V Krém B & Krém C,5,5,5 v VARIANT TESTU: - exaktí a základě hypergeometrického rozděleí: (Fisherův test, ) a + c b + d a b P [ a, b] = a + b - Chí-kvadrát aproximace (>): MEDIÁNOVÝ TEST (dvouvýběrový, pokr.) ( ad bc / ) () = ( a + b)( a + c)( b + d)( c + d) v PŘEDPOKLAD: spojitost a shodý tvar rozděleí a. VII. MEDIÁNOVÝ TEST (dvouvýběrový) v NULOVÁ HPOTÉZA: v ALTERNATIVNÍ HPOTÉZA: H : Θ = Θ (H :Mediáy Θ a Θ jsou shodé) v HLADINA VÝZNAMNOSTI: α (apř.,5) H : Θ > Θ (mediá Θ je apravo od Θ ) v POSTUP: Klasifikace hodot vobou souborech podle společého mediáu Θ : VIII. WILCOONŮV DVOUVÝBĚROVÝ TEST (Ma-Whitey U test, Rak-Sum test) v NULOVÁ HPOTÉZA: H : Dva ezávislé výběry pocházejí z populací se shodými mediáy (Θ = Θ ) v ALTERNATIVNÍ HPOTÉZA: od (mediá Θ > Θ ) H : Populace je apravo v HLADINA VÝZNAMNOSTI: α (apř.,5) Klasifikace Počet hodot > Θ Počet hodot < Θ Celkem Soubor a c a+c Soubor b d b+d Celkem a+b c+d v POSTUP: Staovíme pořadí hodot vsouboru vziklém spojeím výběrů a azjistíme součty pořadí W aw ( raked sums ) odpovídající výběrům,. Za platosti H by statistiky W aw y měly mít přibližě stejou hodotu.

WILCOONŮV DVOUVÝBĚROVÝ TEST (pokr.) v TESTOVÁ STATISTIKA: W Z = +.5 m( m + + ) / ~ N (,) m( m + + ) / má za platosti H stadardí ormálí rozděleí N(,), přičemž m a jsou rozsahy jedotlivých výběrů. v POZNÁMKA: V případě, že H mátvar Θ < Θ má hodota,5 v čitateli záporé zaméko. Wilcoxoův dvouvýběrový test má větší statistickou sílu ež mediáový test, eboť využívá jak iformaci o poloze skórů vůči společému mediáu, tak také součty pořadí. WILCOONŮV DVOUVÝBĚROVÝ TEST - příklad v v Pokračujme opět aším příkladem z dermatologie; pouze yí předpokládejme, že data evzikla párovým porováváím a týchž subjektech, ýbrž že každému z účastíků studie byl apliková právě jediý z ochraých krémů typu A, B, C. Z tohoto důvodu budou mít data amísto zázamů (records) se třemi proměými A, B, C mít zázamů a pouze dvě proměé, přičemž prví proměá udává hodotu zjištěého koeficietu a druhá je idikátorem, udávajícím typ použitého krému u daého subjektu. WILCOONŮV DVOUVÝBĚROVÝ TEST (dok.) v TESTOVÉ KRITÉIUM: Zamítáme H, jestliže z α v PŘEDPOKLAD: m>, > a spojitost a shodý tvar rozděleí v obou populacích Z WILCOONŮV DVOUVÝBĚROVÝ TEST - příklad v Orgaizace dat v programu Statistica v tomto případě vypadá ásledově: 5 5 5 Krém Group 5 5 5 5 5 5

WILCOONŮV DVOUVÝBĚROVÝ TEST - pokr. př. Pozámky k dvouvýběrovým testům: v Ukázka výpočtu rus ve WALDOVĚ-WOLFOWITZOVĚ testu a příkladě: Ma-Whitey U Test (Wilcoxo Rak Sum Test.sta) By variable Group Marked tests are sigificat at p <,5 Rak Sum Rak Sum U Z p-level Z p-level Valid N Valid N *sided variable Group Group adjusted Group Group exact p Krém 5,5,5 5,5 -,5, -,,5,5 pořadí... data MMMZZZMMMMZZMMMZZZZZZZMMZMMZZZZ ru 555 DALŠÍ DVOUVÝBĚROVÉ TEST: v KOLMOGOROVŮV-SMIRNOVŮV test: Kolmogorov-Smirov Test (Wilcoxo Rak Sum Test.sta) By variable Group Marked tests are sigificat at p <,5 Max Neg Max Pos p-level Mea Mea Std.Dev. Std.Dev. Valid N Valid N variable Differc Differc Group Group Group Group Group Group Kr ém -,, p >.,,5,5, v WALDŮV-WOLFOWITZŮV rus test Wald-Wolfowitz Rus Test (Wilcoxo Rak Sum Test.sta) By variable Group Marked tests are sigificat at p <,5 Valid N Valid N Mea Mea Z p-level Z adjstd p-level No. of No. of Variable Group Group Group Group Rus ties Krém,,5,5,5,, Pozámky k dvouvýběrovým testům: v WILCOONŮV DVOUVÝBĚROVÝ TEST (Maův- Whiteyův U-test, Wilcoxoův Rak-Sum test) má ejvětší statistickou sílu z uvedeých testů a je vhodý zejméa v případě, že počet ties (shodých pozorováí) je malý. Je vhodý zejméa v situacích, kdy se průměré hodoty pořadí v jedotlivých skupiách (apř. muži a žey) podstatě liší. v WALDŮV-WOLFOWITZŮV RUNS TEST má meší statistickou sílu, ale je vhodý v případě, že průměré hodoty pořadí se ve skupiách (muži a žey) zásadě eliší, ale apříklad u mužů abývají buď vysokých ebo aopak ízkých hodot, zatímco u že abývají středích hodot. v KOLMOGOROVŮV-SMIRNOVŮV test je vhodý v případě, že počet shodých pozorováí ( ties ) je vyšší.

I. KRUSKALOVA-WALLISOVA ANOVA v Nulová hypotéza: H : kezávislých výběrů pochází z populací se shodými mediáy (Θ = Θ =...= Θ k ) v Alterativí hypotéza: H : Mediáy se alespoň ve dvou populacích vzájemě liší v Hladia výzamosti: α (apř.,5) v Postup:. Do tabulky o k sloupcích, ve které j-tý sloupec odpovídá výběru z j-té populace (j=,...,k), zapíšeme amísto pozorovaých hodot pořadí, která odpovídají pozorovaým hodotám v souboru vziklém spojeím k podsouborů.. V každé z k skupi spočteme průměré pořadí R j, (j=,...,k) KRUSKALOVA-WALLISOVA aalýza příklad: Opthalmologie: v Kyselia arachodiová je zámá tím, že ovlivňuje metabolismus oka. Kotakt oka s malým možstvím této kyseliy má za ásledek zavřeí víčka, svěděí a v ěkterých případech poruchy viděí. Studie, z íž pocházejí data pro áš příklad, porovávala protizáětlivé účiky zkoumaých látek, které byly aplikováy laboratorím zvířatům (bílí králíci) do jedoho oka a roztok salia do druhého oka. v Po miutách bylo králíkům aplikováo malé možství kyseliy arachodiové a obě bulvy. Po dalších 5 miutách byli králíci kotrolovái, zda došlo k uzavřeí víčka a bylo zazameáo skóre, které představovalo hodotu rozdílu mezi stupěm otevřeí víčka (-otevřeé, - polouzavřeé a uzavřeé) a začátku pokusu a po aplikaci kyseliy arachodiové. KRUSKALOVA-WALLISOVA ANOVA (pokr.) v Testová statistika: má za platosti H rozděleí v Testové kritérium: Zamítáme H, jestliže KW v Předpoklady: k KW = jr N( N + ) j= χ k ( N + ) - Rozsahy výběru j (j=,...,k) musí být v jedotlivých skupiách alespoň 5 - Spojitost - Shodý tvar rozděleí v jedotlivých populacích. j > χ k ( α ) KRUSKALOVA-WALLISOVA aalýza pokr. př.: Opthalmologie: v Data pro statistickou aalýzu udávají míru efektivosti protizáětlivého přípravku a jsou dáa rozdíly mezi hodotou skóre a oku ošetřeém aktiví látkou a oku ošetřeém saliou (eutrálí izotoický,% roztok soli). v Vyšší hodoty skórů (rozdíly rozdílů) azačují efektivější účiek protizáětlivé látky.

KRUSKALOVA-WALLISOVA aalýza pokr. př. v Opthalmologie -data: 5 5 Skore Lecba Idometaci Idometaci Idometaci Idometaci Idometaci Idometaci Aspiri Aspiri Aspiri Aspiri Aspiri Aspiri Piroxicam Piroxicam Piroxicam Piroxicam Piroxicam Piroxicam BW55C BW55C BW55C BW55C BW55C - BW55C KRUSKALOVA-WALLISOVA aalýza pokr. př. v K-W aalýza pořadových skórů: Deped.: Sk ore Idometaci Aspiri Piroxicam BW55C v Mediáový test: Depedet: Sk ore <= Media: observed expected obs.-exp. > Media: observed expected obs.-exp. Total: observed Kruskal-Wallis ANOVA by Raks; Idepedet (groupig) variable: Lecba Kruskal-Wallis test: H (, N= ) =,5 p =, Code Valid Sum of N Raks,5 5,,5, Media Test, Overall Media =,; Sk ore (Kruskal-Wallis Ophtalmologie.sta) Idepedet (groupig) variable: Lecba Chi-Square =,, df =, p =, Idometaci Aspiri Piroxicam BW55C Total,,,, 5,,5,5,5,5 -,5,5 -,5,5,,,,,,5,5,5,5,5 -,5,5 -,5,,,,, KRUSKALOVA-WALLISOVA aalýza pokr. př. v Box & Whisker Plot: Boxplot by Group Variable: Skore,5,,5,. ROBUSTNÍ DVOUVÝBĚROVÝ TEST v NULOVÁ HPOTÉZA: H : Dva ezávislé výběry pocházejí z populací se shodými mediáy (Θ = Θ ) v ALTERNATIVNÍ HPOTÉZA: H : Mediá Θ > Θ v HLADINA VÝZNAMNOSTI: α (apř.,5) Skore,5,,5, v POSTUP (a příkladě):. Vzestupě uspořádejme pozorovaá data a ozačme příslušost ke skupiám a : -,5 -, -,5 Idometaci Aspiri Piroxicam BW55C Lecba Media 5%-5% Mi-Max Data Skupia 5

ROBUSTNÍ DVOUVÝBĚROVÝ TEST (pokr.) Data Skupia i U( i ). Defiujeme: U( i ) počet meších ež i U( j ) počet meších ež j 5 j U( j ). Vypočteme středí hodoty U() a U(): ( ) (+ ( ) = m U i U = m i= ( ) (+ + ( ) = U i U = i= + ) + ) = =,5 5 U = ROBUSTNÍ DVOUVÝBĚROVÝ TEST - pokr. v Středí hodoty: U() = U() =,5. v Ukazatele variability: V = V =,5. 5. TESTOVÁ STATISTIKA U má za platosti H rozděleí N(,): mu ( ) U ( ) = V + V + U ( ) U ( ) () (,5) =, +,5 + (,5)(). TESTOVÉ KRITÉRIUM: Zamítáme H, jestliže platí U z.. ZÁVĚR: V ašem příkladě H ezamítáme. α. PŘEDPOKLAD: m >, > a spojitost rozděleí (rozptyly se mohou lišit, jde o tzv. Behresův-Fisherův problém). Pro m, je rozděleí U tabelováo. ROBUSTNÍ DVOUVÝBĚROVÝ TEST - pokr. Středí hodoty: U() = U() =,5.. Vypočteme ukazatele variability V a V : V i U( i ) m = [ U ( i) U ( )] i= = ( ) = + + = + ( ) 5 V = + ( ) j U( j ) = j= [ U ( ) U ( )] = (,5) + (,5) j + (,5) + (,5) = =,5