12. Neparametrické hypotézy

Podobné dokumenty
PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 2

Testování statistických hypotéz

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

Ilustrativní příklad ke zkoušce z B_PS_A léto 2014.

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

a další charakteristikou je četnost výběrového souboru n.

Ilustrativní příklad ke zkoušce z B_PS_A léto 2013.

Metody zkoumání závislosti numerických proměnných

8. Zákony velkých čísel

PRAVDĚPODOBNOST A STATISTIKA

Úvod do korelační a regresní analýzy

Tento odhad má rozptyl ( ) σ 2 /, kde σ 2 je rozptyl souboru, ze kterého výběr pochází. Má-li každý prvek i. σ 2 ( i. ( i

NEPARAMETRICKÉ METODY

4.2 Elementární statistické zpracování Rozdělení četností

12. N á h o d n ý v ý b ě r

Mendelova univerzita v Brně Statistika projekt

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA

Spolehlivost a diagnostika

Úvod do teorie měření

Kapitola 6. : Neparametrické testy o mediánech

Přednáška č. 10 Analýza rozptylu při jednoduchém třídění

6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

Nejistoty měření. Aritmetický průměr. Odhad směrodatné odchylky výběrového průměru = nejistota typu A

PRAVDĚPODOBNOST A STATISTIKA

Odhady parametrů 1. Odhady parametrů

PRAVDĚPODOBNOST A STATISTIKA

6. Posloupnosti a jejich limity, řady

1.1 Rozdělení pravděpodobnosti dvousložkového náhodného vektoru

14. Korelace Teoretické základy korelace Způsoby měření závislostí pro různé typy dat

Test dobré shody se používá nejčastěji pro ověřování těchto hypotéz:

Generování dvojrozměrných rozdělení pomocí copulí

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

[ jednotky ] Chyby měření

Náhodné jevy, jevové pole, pravděpodobnost

MASARYKOVA UNIVERZITA PŘÍRODOVĚDECKÁ FAKULTA BAKALÁŘSKÁ PRÁCE. Dvouvýběrové parametrické a neparametrické testy

Náhodný výběr 1. Náhodný výběr

, jsou naměřené a vypočtené hodnoty závisle

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

Testování statistických hypotéz

3. Lineární diferenciální rovnice úvod do teorie

Intervalové odhady parametrů některých rozdělení.

Pravděpodobnost a aplikovaná statistika

Odhad parametrů normálního rozdělení a testy hypotéz o těchto parametrech * Věty o výběru z normálního rozdělení

14. Testování statistických hypotéz Úvod statistické hypotézy Definice 14.1 Statistickou hypotézou parametrickou neparametrickou. nulovou testovanou

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

Testování hypotéz. 3.1 Základní pojmy a obecný postup při testování

UNIVERZITA JANA EVANGELISTY PURKYNĚ V ÚSTÍ NAD LABEM PEDAGOGICKÁ FAKULTA Katedra tělesné výchovy

Pravděpodobnost a aplikovaná statistika

MATICOVÉ HRY MATICOVÝCH HER

SP2 Korelační analýza. Korelační analýza. Libor Žák

17. Statistické hypotézy parametrické testy

8. Analýza rozptylu.

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

Deskriptivní statistika 1

Statistika. Jednotlivé prvky této množiny se nazývají prvky statistického souboru (statistické jednotky).

Přednáška č. 2 náhodné veličiny

9. Měření závislostí ve statistice Pevná a volná závislost

Kapitola 5.: Analýza rozptylu jednoduchého třídění

3. Hodnocení přesnosti měření a vytyčování. Odchylky a tolerance ve výstavbě.

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

UČEBNÍ TEXTY OSTRAVSKÉ UNIVERZITY. Přírodovědecká fakulta ANALÝZA DAT. 2. upravené vydání. Josef Tvrdík

APLIKOVANÁ STATISTIKA

Lineární regrese ( ) 2

11. Časové řady Pojem a klasifikace časových řad

1. Základy měření neelektrických veličin

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

Chyby přímých měření. Úvod

Závislost slovních znaků

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

LABORATORNÍ CVIČENÍ Z FYZIKY. Měření objemu tuhých těles přímou metodou

jsou varianty znaku) b) při intervalovém třídění (hodnoty x

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor

jako konstanta nula. Obsahem centrálních limitních vět je tvrzení, že distribuční funkce i=1 X i konvergují za určitých

2. Vícekriteriální a cílové programování

P1: Úvod do experimentálních metod

VY_52_INOVACE_J 05 01

VYSOCE PŘESNÉ METODY OBRÁBĚNÍ

8.2.1 Aritmetická posloupnost

Pravděpodobnost a aplikovaná statistika

Univerzita Karlova v Praze Pedagogická fakulta

- metody, kterými lze z napozorovaných hodnot NV získat co nejlepší odhady neznámých parametrů jejího rozdělení.

PRAVDĚPODOBNOST A STATISTIKA. Náhodný vektor

STUDIUM MAXWELLOVA ZÁKONA ROZDĚLENÍ RYCHLSOTÍ MOLEKUL POMOCÍ DERIVE 6

V. Normální rozdělení

Doc. Ing. Dagmar Blatná, CSc.

8.2.1 Aritmetická posloupnost I

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

Funkce. RNDr. Yvetta Bartáková. Gymnázium, SOŠ a VOŠ Ledeč nad Sázavou

PRAVDĚPODOBNOST A STATISTIKA. Bodové a intervalové odhady

5.5. KOMPLEXNÍ ODMOCNINA A ŘEŠENÍ KVADRATICKÝCH A BINOMICKÝCH ROVNIC

Optimalizace portfolia

Testujeme hypotézu: proti alternativě. Jednoduché třídění:

Metody statistické analýzy. doc. Ing. Dagmar Blatná, CSc.

Odhad parametru p binomického rozdělení a test hypotézy o tomto parametru. Test hypotézy o parametru p binomického rozdělení

Matematická analýza I

Petr Šedivý Šedivá matematika

Testy statistických hypotéz

Jednoduchá lineární regrese

11. Popisná statistika

Transkript:

. Neparametrcké hypotézy V této část se budeme zabývat specálí částí teore statstckých hypotéz tzv. eparametrckým hypotézam ebo jak řečeo eparametrckým statstckým testy. Neparametrcké se azývají proto, že př kostrukc těchto testů ejsou využty zalost parametrů rozděleí áhodých velč, ale jé způsoby práce s daty.. Zamékový test Jde o jede z ejjedodušších testů. Nechť X,, je výběr ze spojtého rozděleí s medáem x Testujeme hypotézu H 0 : x = x0, kde x 0 je daé číslo. Test má jak oboustraou alteratvu, tak jedostraou. H : x x0. Jde tedy o oboustraou alteratvu. Nejdříve vytvoříme rozdíly X x0,, X x0. Pokud je ěkterý z těchto rozdílů ulový vyecháme ho. Tím získáme možu čísel. Z této možy ás bude zajímat je počet rozdílů s kladým zamékem, teto počet ozačme B. Pokud by platla hypotéza H 0, pak by áhodá velča B byla typu B( ; 0,5 ) ( předpokládáme, hodoty jsou vesměs růzé od x 0 ). Hypotézu H 0 zamíteme, jestlže bude hodota B velm malá ebo aopak bude téměř rova. Krtcké hodoty tohoto testu jsou tabelováy v tabulkách, ale můžete s je zjstt sam pomocí dstrbučí fukce bomckého rozděleí B(;0,5). Platí tedy α α P( B k), P( B k). (.) Pro hodoty malé ( < 0 ) se v tabulkách alezou čísla k a k. Hypotézu zamíteme, jestlže B kebo B k. V případě velkých hodot ( >9 )se provádí ormalzace áhodé velčy B. Náhodá velča U.B = (.) se podle cetrálí lmtí věty asymptotcky blíží k N(0,). Hypotézu H 0 tedy zamíteme v tomto případě, když U u α. Příklad. Nechť jsou aměřey hodoty 5.6 ; 4,8; 8,; 4,7; 6,3; 0,7; 9,4; 8,; 7,4; 6,4; 4,9; 5,; 6,5. Pomocí zamékového testu rozhoděte, zda 8 může být medáem dat. Od hodot x odečteme očekávaou hodotu medáu a dostaeme: 5,6 4,8 8, 4,7 6,3 0,7 9,4 8, 7,4 6,4 4,9 5, 6,5 -,4-3, 0, -3,3 -,7,7,4 0, -0,6 -,6-3, -,9 -,5 Počet čísel kladých je rove 4. Pro hodotu = 3 jsou krtcké hodoty a hladě výzamost 0,05 rovy a 9. Protože číslo 4 leží mez těmto hodotam, emůžeme vyloučt možost, že je medáem ašch dat.

Příklad. Př měřeí hmotost výlovku ryb ( v tuách ) byly zjštěy ásledující hodoty: 3 4 5 6 7 8 9 0 3,64,537,0 0,6,63 3,5 0,3,04,774,83 0,899,743 6,397 4 5 6 7 8 9 0 3 4 5 6,0 0,63 0,07 0,6,704,78,004,344 6,954,479 0,3 7,9 3,6 Máme ověřt hypotézu, že medá výlovku ryb je rove t. Opět zjstíme hodotu počtu kladých rozdílů mez x a hodotou. Těchto čísel je 0. Hodota B = 0. Ověřeí provedeme pomocí vztahu (.), teto vztah je aproxmatvě.0 6 rozděleí N(0,). Vypočtěme hodotu U, U = =,767 =,767, porováme 6 l tuto hodotu s krtckou hodotou u 0,975 =,96, zjšťujeme, že hodota U eleží v krtckém oboru. Nemůžeme tedy vyvrátt možost, že číslo je medáem výlovku ryb. Pokud bychom prováděl výpočet klasckou metodou, měl bychom pro = 6 k dspozc krtcké hodoty 7 a 8, a a pomocí této metody emůžeme vyvrátt možost, že je medáem hmotost výlovku.. Jedovýběrový Wlcoxoův test Teto test je opět založe a pořadových statstkách. Předpokládáme, že daá jedorozměrá data byla vybráa z populace popsaé spojtou áhodou velčou. Nulová hypotéza je postaveá tak, že zjšťujeme, zda dstrbučí fukce F(x) je symetrcká kolem počátku ( resp. kolem obecého bodu a ) tedy zda platí : ( ) ( ) (, ) F x = x F x, oprot í stojí alteratví hypotéza, která je egací tohoto výroku. Z požadavků a rozděleí vyplývá, že medáem rozděleí je 0 ( resp. bod a ), pokud exstuje středí hodota rozděleí je také rova 0 ( resp. a ). Nechť X,,X je áhodý výběr z výše uvedeého rozděleí. Položíme Y = X - 0 ( resp. X - a ). Náhodé velčy uspořádáme vzestupě podle jejch absolutí hodoty, tedy Y Y Y. () ( ) ( ) Symbolem R + ozačíme pořadí velčy Y. Zaveďme dále ozačeí. (.3) R = R, R = R + + + Y 0 Y< 0

( ) +. + Podle zavedeí těchto hodot jstě platí R + R =. Hypotézu H 0 a hladě a + zamítáme, jestlže číslo m ( R, R ) w ( α ), kde w ( α ) je tabelovaá krtcká hodota. Tuto hodotu získáte v tabulce krtckých hodot jedovýběrového Wlcoxoova testu. Věta.3 Platí l hypotéza H 0, potom ( ).( ).( ).(. ), ( ) + + + + + E R = VAR R = (.4). 4 4 Důkaz: Vz []. Dá se dokázat, že áhodá velča R + má asymptotcky rozděleí ormálí. Můžeme tedy test hypotézy H 0 založt a áhodé velčě +.( + ) R U = 4 (.5).( + ).(. + ) 4 Hypotézu H 0 potom zamíteme, jestlže U u α, a hladě, která se s rostoucím přblžuje hodotě a. Příklad.4 V průběhu deset za sebou jdoucích dů s pacet měřl 0x tep. Můžeme a základě těchto měřeí prohlást, že medá aměřeých hodot je rove 75 tepům? měř. č. měř. č. měř. č.3 měř. č.4 měř. č.5 měř. č.6 měř. č.7 měř. č.8 měř. č.9 měř. č.0 76 tepů 76 tepů 74 tepů 77 tepů 79 tepů 8 tepů 83 tepů 67 tepů 65 tepů 90 tepů Pokud by medá hodoty tepů byl 75, pak dostaeme hodoty Y takovéto Y Y Y 3 Y 4 Y 5 Y 6 Y 7 Y 8 Y 9 Y 0-4 6 8-8 -0 5 V této tabulce máme dokoce hodoty Y seřazeé podle velkost. Vypočteme dále + hodoty R = 35, R = 0. Hodota R = 0, tuto hodotu porováme s krtckou hodotou v tabulkách, w 0 ( 0,05) = 8, protože hodota R je větší ež 8, emůžeme a daé hladě hypotézu H 0 zamítout. Pokud bychom řešl tuto úlohu pomocí ormálí aproxmace, získal bychom 35 7,5 hodotu U = = 0,76447, tato hodota je meší ež,96, tedy touto metodou 96,5 emůžeme hypotézu H 0 zamítout. V případě jedovýběrového Wlcoxoova testu je důležtým předpokladem symetre hustoty f kolem medáu. K zamítutí hypotézy H 0 může tedy dojít také tehdy, když je sce medá rove ule ( resp. a ), ale hustota je výrazě esymetrcká. Můžeme tedy teto test použít a jedoduché testováí, zda vybraá data mohou pocházet z rozděleí ormálího!

.3 Dvouvýběrový Wlcoxoův test Nechť je X,, m je áhodý výběr ze spojtého rozděleí s dstrbučí fukcí F, echť dále je Y, Y áhodý výběr ze spojtého rozděleí s dstrbučí fukcí F, který je, a výběru X,, m ezávslý. Hypotézu H 0 sestavujeme tak,že F = F, alteratví hypotéza je oboustraá tedy F F. Př kostrukc testu ejdříve vytvoříme z výše uvedeých výběrů sdružeý výběr X,, m, Y,, Y. Hodoty v tomto výběru uspořádáme vzestupě podle velkost. Ozačíme S součet všech pořadí hodot X,, X m a S pořadí hodot Y,, Y ve sdružeém výběru. Zřejmě podobě jako v jedovýběrovém Wlcoxoově testu platí ( + m).( + m+ ) S+ S =. V případě áhodých velč S a S jde o tzv. leárí pořadové statstky. Jejch parametry jsou uvedey v ásledující větě. Věta.5 Platí l hypotéza H 0, potom m. ( m+ + ) m..( m+ + ) E ( S) =, VAR( S) =,. ( m+ + ) m..( m+ + ) E ( S) =, VAR ( S) = Důkaz: Uvede v []. (.6) Vzhledem k vazbě mez áhodým velčam S a S, stačí vyšetřovat je jedu z ch, zpravdla je to S. Stále častěj se místo této velčy vyšetřuje m.( m+ ) U = m. + S, Test založeý a áhodé velčě U se azývá Ma Whteyův test. Zavedeme l ještě ozačeí m.( m+ ) U = m. + S, platí U + U = m.. Náhodá velča U udává počet případů, kdy X < Y j, áhodá velča U udává počet případů, kdy X > Y j. Opět podobě jako v případě jedovýběrového testu staovíme S=m( U, U ). Pokud hodota S je meší ebo rova krtcké hodotě uvedeé v tabulce krtckých hodot dvouvýběrového Wlcoxoova testu, zamítá se a daé hladě a hypotéza H 0. Ozačeí výběrů přtom volíme tak, aby m. Na základě výsledků věty.5 zřejmě platí ( ) m...( ), ( ) m m + + E U = VAR U = (.7),protože U = m. - U. Je E ( U) = E ( U ), VAR( U) = VAR ( U ). Dá se dokázat, že velčy S, U asymptotcky ormálí rozděleí, tedy U E( U) U = (.8) VAR U ( )

Pokud U u α, zamíteme hypotézu H 0 a hladě blížící se hodotě a. Tetotest se dá použít v případě, že m > 0 a > 0. Dvouvýběrový Wlcoxoův test je velm ctlvý zejméa a případ posuutí, tedy a případ, kdy F (x) = F (x - ), kde 0. Příklad.6 Dvěma způsoby jsme prováděl aalýzu procetího obsahu zlata ve vzorcích rudy. Výsledky aalýz jsou uvedey v ásledující tabulce: hodoty X 3,3 3,4 3,4 3, 3,5 3,3 3, hodoty Y 3, 3,5 3,4 3,4 3,4 3,3 3,5 3,5 3,4 3,5 Seřadíme uvedeé hodoty do jedé tabulky, zjstíme pořadí hodot X: 3, 3, 3, 3,3 3,3 3,3 3,4 3,4 3,4 3,4 3,4 3,4 3,5 3,5 3,5 3,5 3,5 Odlšým podkladem jsou ozačey hodoty X. Zjstíme a spočteme hodoty U = 58 a U =. Hodoty S = 40 a S = 30. V tabulkách dvouvýběrového Wlcoxoova testu zjstíme pro hodoty m = 0 a = 7 ( prví hodota je podle úmluvy vždy větší ebo rova druhé hodotě ) krtckou hodotu 4. Tedy zamítáme a hladě výzamost 0,05 hypotézu H 0 o stejém způsobu měřeí. Použjeme l přechod a rozděleí N(0,) získáme 58 35 U = =, 4457, protože je tato hodota větší ež,96 zamítáme tímto 05 způsobem hypotézu H 0. Příklad.7 Ověřme, zda exstuje výzamý rozdíl v hektarových výosech brambor př použtí dvou metod hojeí. V ásledující tabulce jsou uvedey hektarové výosy : hodoty X 58 55 57 59 54 5 50 53 56 hodoty Y 67 60 7 68 56 53 6 Nejdříve seřadíme hodoty X a Y dohromady a setřídíme je podle velkost: 50 5 53 53 54 55 56 56 57 58 59 60 6 67 68 7 Opět jsme odlšým způsobem ozačl hodoty X. Podobě jako v předchozím příkladu zjstíme hodoty S = 54 a S = 9, stejě tak zjstíme, že hodoty U = 54 a U = 9, protože krtcká hodota pro případ m = 9 a = 7 je rova, zamíteme hypotézu H 0 a hladě výzamost 0,05. Pokud bychom počítal aproxmac pomocí rozděleí N(0,) získáme hodotu: 54 3,5 U = =,3455. Tato hodota je větší ež,96. Zamítáme tedy touto metodou 4 hypotézu H 0 o stejých výosech pomocí obou metod hojeí.

.4 Jedovýběrový Kolmogor Smrovův test Nechť X,, je áhodý výběr. Mějme dále určté spojté rozděleí s dstrbučí fukcí F. Staovme hypotézu H 0 : Dstrbučí fukce rozděleí, z ěhož pochází áhodý výběr je F. Nejdříve vytvoříme emprckou dstrbučí fukc F. vytvořeou z hodot výběru X,,. Položíme D = sup F ( x) F( x) (.9) x zřejmě velké hodoty D budou podporovat hypotézu H. Pro malé hodoty acházíme krtcké hodoty v tabulkách, pro velké hodoty se provádí aproxmace D.l (.0). α Hypotézu H 0 zamítáme, když D D (a). Teto test můžeme používat bez jakýchkol úprav a testováí, zda daá data pochází z rozděleí, které záme včetě všech možých parametrů, které toto rozděleí defují. Tedy bez úprav se ehodí přímo a testováí, zda daá data pochází z ormálího rozděleí. V případě, že by daé parametry byly odhaduty z výběru, změí se velm výrazě hodoty krtckých hodot D. Pro takovéto případy jsou krtcké hodoty odhaduty pomocí smulačích metod vz Llleforst, Ima. Příklad.8 V ásledující tabulce je uvedeo 0áhodých čísel vygeerovaých geerátorem áhodých čísle v programu Excel. Protože tato čísla mají pocházet z rozděleí rovoměrého a tervalu (0,), budeme testovat hypotézu H 0 : Daé údaje jsou popsáy pomocí rozděleí Ro(0,). 3 4 5 6 7 8 9 0 0,04039 0,06493 0,077673 0,086749 0,358 0,36589 0,68583 0,373 0,376007 0,37699 3 4 5 6 7 8 9 0 0,4463 0,5805 0,6556 0,78657 0,7896 0,84974 0,86987 0,890659 0,9785 0,974874 Nejdříve sestrojíme emprckou dstrbučí fukc. Protože vygeerovaé hodoty jsou jedečé ( jsou od sebe růzé ) bude kostrukce emprcké dstrbučí fukce takováto : Pro hodoty x 0,04039 bude F 0 (x)=0, v každé hodotě x bude mít emprcká dstrbučí fukce skok stejý a rový 0,05 0 = ( jestlže by se ěkterá z hodot x vyskytovala apř. p krát, pak by měla fukce F skok p v bodě x ). Dále je zobrazea emprcká dstrbučí fukce F 0 a dstrbučí fukce rovoměrého rozděleí a tervalu (0,):

0,9 0,8 0,7 0,6 0,5 emp. D.f. Ro(0,) 0,4 0,3 0, 0, 0 0 0, 0, 0,3 0,4 0,5 0,6 0,7 0,8 0,9 Výpočtem zjstíme, že v ašem případě je hodota D 0 = 0,847. V tabulkách zjstíme, že pro hladu výzamost je krtcká hodota pro = 0 rova 0,9408. Protože D 0 je meší ež krtcká hodota, elze zamítout hypotézu o výběru z rozděleí Ro(0,)..5 Dvouvýběrový Kolmogor Smrovův test Nechť je X,, m je áhodý výběr ze spojtého rozděleí s dstrbučí fukcí F, echť dále je Y,, Y áhodý výběr ze spojtého rozděleí s dstrbučí fukcí F, který je a výběru X,, m ezávslý. Hypotézu H 0 sestavujeme tak,že F = F, alteratví hypotéza je oboustraá tedy F F. Ozačíme l F m a F emprcké dstrbučí fukce jedotlvých výběrů, vyplývá z obecých vět, že s rostoucím hodotam m, se tyto fukce blíží ke skutečým dstrbučím fukcím F a F. Ozačme dále D = sup F x F x. ( ) ( ) m, m x Celý test je založe a ásledující větě: Věta.9 m. Ozačme M =. Nechť dále je m + k + K( λ ) =. ( ).exp(. k. λ ) (.) k = Potom pro každé l platí

lm m, (. m, λ ) ( λ ) P M D < = K. Důkaz : Provede apř. v Hájek a Šdák (967).. Fukc K(l) často aproxmujeme pomocí jejích počátečích čleů.e λ. Tato hodota je rova - a, jestlže λ =.l α, aproxmatví krtcká hodota pro D m, je = D m,. Jsou l čísla m, malá porovává se hodota D m,. M α s tabelovaým hodotam krtckých hodot a daé hladě výzamost. Jestlže jsou hodoty m, větší ( m + > 35 ), vypočítáme ejdříve hodotu λ 0 = M. Dm,, pomocí í vypočítáme K ( λ 0 ).Jestlže je tato hodota větší ebo rova - a, zamíteme hypotézu H 0 a hladě, která se s rostoucím rozsahem blíží k číslu a. Př * D α. Hypotézu H 0 pak * tedy rova.l ( α ) velkých hodotách aproxmujeme krtckou hodotu číslem m, ( ) * zamítáme, jestlže je D D ( α ). m, m, Příklad.9 Budeme vyšetřovat hodoty uvedeé v příkladě.6. Máme tedy k dspozc data: hodoty X 3,3 3,4 3,4 3, 3,5 3,3 3, hodoty Y 3, 3,5 3,4 3,4 3,4 3,3 3,5 3,5 3,4 3,5 Podobě jako v předchozí část s zobrazíme emprcké dstrbučí fukce: Emprcké dstrbučí fukce 0,9 0,8 0,7 0,6 0,5 X Y 0,4 0,3 0, 0, 0 3, 3,5 3, 3,5 3,3 3,35 3,4 3,45 3,5 3,55 3,6

Zřejmě je hodota D 0,7 = 0,3749, krtcká hodota alezeá v tabulkách dvouvýběrového Kolmogorova Smrova testu pro hladu výzamost 0,05 je rova 46 = 0,6574857. Tedy a základě zjštěých údajů emůžeme zamítout hypotézu H 0, že 70 oba výběry pocházejí ze základích souborů se stejým dstrbučím fukcem. Pokud * bychom použl aproxmovaých hodot je v ašem případě D 7,0 ( 0,05) = 0,66979734, tedy a v tomto případě hypotézu H 0 emůžeme zamítout..6 Kruskalův Wallsův test Jde o test, který je zobecěím dvouvýběrového Wlcoxoova testu. Je používá a data, která se velm lší od dat typu ormálího. Nechť X,, je áhodý výběr ze spojtého rozděleí s dstrbučí fukcí F, =,,N.Nechť jsou všechy a sobě avzájem ezávslé. Hypotézu H 0 postavíme takto. H 0 : F (x) = = F N (x) pro všecha x Alteratví hypotéza H je staovea v případě eplatost hypotézy H 0. Podobě jako v předchozích případech vytvoříme sdružeý áhodý výběr z hodot Y j o rozsahu = + + N ( předpokládáme, že >5,=,,N ). Hodoty Y j se uspořádají do eklesající posloupost a určí se pořadí R j v rámc každé velčy Y j ze sdružeého áhodého výběru. V rámc každé skupy zjstím hodotu R = R, zřejmě je součet všech hodot R.( + ) rove. Testovou statstkou je N R Q=. 3.( + ) (.).( + ) = Ukazuje se, že př platost hypotézy H 0 je rozděleí Q asymptotcky c rozděleí, jestlže hodoty všech rostou ade všechy meze. Výpočtem se zjstí, že E( Q) = N, tedy půjde o rozděleí c s N- stup volost. Hypotézu H 0 zamítáme, jestlže Q χ N ( α ). Kruskal Wallsův test je velm ctlvý a případá posuutí v argumetech jedotlvých dstrbučích fukcí. Jestlže dojde k zamítutí H 0, sažíme se dále rozhodout, které dvojce se ve sdružeém výběru od sebe výzamě lší. R Pro teto případ ozačíme symbolem r =, kde =,,N. Jestlže ozačíme symbolem kw N- (a) krtckou hodotu Kruskal Wallsova testu ( v případě malých hodot N j ajdeme přímo v tabulkách tohoto testu, pro větší rozsahy j aproxmujeme výše uvedeým rozděleím c N-(a) ), potom prohlásíme, že se dstrbučí fukce tého a j tého výběru od sebe výzamě lší, jestlže platí r rj >...( + ). kwn ( α) (.3) j Teto postup opakujeme pro všechy možé dvojce. j= j

Příklad.0 U přjímacích zkoušek se sledují počty bodů z testů z matematky, chceme posoudt, zda se výsledky výzamě odlšují. Náhodě vybereme z jedotlvých sledovaých typů škol 8 studetů. Hlada výzamost je staovea a 0,05. Dále ásledují data : stud. státí soukromé SEŠ prům. škola 78 84 3 93 95 4 7 74 3 47 54 65 58 4 78 76 4 85 5 85 68 67 60 6 96 6 5 7 7 75 7 53 67 8 83 66 70 59 Jedotlvé hodoty přepíšeme do jedé tabulky a přdáme sloupec, v ěmž uvedeme pořadí jedotlvého prvku ve sdružeém výběru, v posledí řádce čteme hodoty R. stud. státí pořadí soukromé pořadí SEŠ pořadí prům. škola pořadí 78 4,5 84 7 3 93 30 95 3 4 3 7 9,5 74 3 47 4 54 7 65 58 8 4 78 4,5 76 3 4 85 8,5 5 85 8,5 68 6 67 4,5 60 0 6 96 3 6 5 5 7 9,5 7 75 7 8 53 6 67 4,5 8 83 6 66 3 70 7 59 9 9,5 8 77 40,5 Dosazeím zámých hodot zjstíme velkost testovací statstky 9,5 8 77 40,5 Q =. + + + 3.33= 9,8773068 3.33 8 8 8 8 Krtcká hodota c s 3 stup volost je 7,8. Protože je hodota testové statstky větší ež krtcká hodota c, zamítáme hypotézu H 0 o shodě výsledků testů studetů z růzých typů škol. Protože budeme chtít posoudt a základě dat, které dvojce se vzájemě lší, použjeme vztahu (.3). Vzhledem k tomu, že všechy skupy mají stejý počet čleů, bude také pravá straa ve výrazu (.3) kostatí a rova 3,080. Zjstíme tedy absolutí hodoty rozdílů stojících ve výrazu (.3) a levé straě. Uvedeme tyto rozdíly v přehledé tabulce: soukromé SEŠ prům. škola státí 9,35 4,4375 6,5 soukromé 5,5,85 SEŠ 7,9375

Z vypočteých hodot je jasé, že výzamý rozdíl mez výsledky studetů jedotlvých typů škol je v případě státích gymází a SEŠ..7 Fredmaův test Nechť jako v mulém případě jsou Y j ezávslé áhodé velčy spojtého typu s dstrbučím fukcem F j. Fredmaovým testem testujeme hypotézu H 0, že F j ezávsí a j, a závset může. V podstatě jde o rozšířeí Wlcoxoova testu pro dva závslé výběry, a více a N závslých výběrů. Test se používá k ověřeí shody úrově sledovaého zaku v souborech vytvořeých a základě N závslých výběrů se stejým rozsahem jedotek. Typckou úlohou je případ, kdy jedu skupu jedotek sledujeme v určtých časových obdobích. Úlohou je potom posoudt, zda sledovaý zak závsí a daých podmíkách. Pro každou hodotu Y j ( =,,I a j=,,j) zjstíme pořadí R j v daé skupě. Tvar testovací statstky je potom rove J I Q=. Rj 3. I.( J ) IJ..( J ) + (.4) + j= = Dá se opět dokázat, že př platost hypotézy H 0 má áhodá velča Q tvar c s J stup volost. Hypotézu H 0 zamítáme, jestlže hodota Q překročí krtckou hodotu a hladě výzamost a. Stejě jako v předchozích testech pro větší hodoty za tuto hodotu budeme brát c J-(a). Zamíteme l H 0 zajímá ás většou, které dvojce se od sebe výzamě lší.ozačme R j I = R (.5) = j Podobě jako u Kruskal Wallsova testu budeme zjšťovat zda Ru Rt je větší ebo rovo tabelovaé krtcké hodotě. Asymptotcky lze krtcké hodoty určt pomocí vztahu qj, ( α).. I. J. ( J + ) (.6) Krtcké hodoty qj, ( α) se opět hledají ve specálích tabulkách. Příklad. Máme k dspozc údaje z průzkumu ce u tří prodeje, u chž byly sledováy cey 7 druhů zboží. Chceme posoudt, zda ve sledovaé době byla výzamě odlšá úroveň ce v těchto prodejách. a 4,5 5 8, b,5,7 4, c 5,7 5,5 5,6 d,4,5,8 e 7,8 3,6 8, f 7,4 89,4 7,5 g 8,4 6,7 7,8 Z dat je zřejmé, že je I = 7 a J = 3. Nejdříve upravíme předchozí tabulku tak, aby se v jedotlvých řádcích vyskytoval je pořadí jedotlvých hodot. Pro jedotlvé prodejy tyto hodoty sečteme, umocíme a dosadíme do vzorce (.4).

. zboží Prodeja. Prodeja 3. Prodeja a 3 b 3 c 3 d 3 e 3 f 3 g 3 Rj 3 7 Rj 44 69 89 Tedy Q = ( 44 + 69 + 89) 3.7.4 = 86 84 =. Z tabulek Fredmaova testu 7.3.4 vyplývá, že krtcká hodota pro a = 0,05 ; I = 7 a J = 3 je rova 7,43. Hodota Q eí větší ež krtcká hodota, proto emůže a hladě výzamost 0,05 zamítout předpoklad o shodě ce jedotlvých prodejách. Příklad. Celkem 0 studetů řešlo stejě obtížé úlohy s přemísťováím předmětů ( každý celkem 00 v jedé úloze) za růzých teplotích podmíek. Pomocí Fredmaova testu rozhoděte, zda se výkoy v těchto podmíkách lšly. Dále jsou uvedey data jedotlvých studetů: studet t=0 C t=30 C t=50 C 70 65 48 96 9 7 3 8 9 80 4 78 86 8 5 9 90 79 6 98 95 87 7 9 90 88 8 96 94 78 9 78 90 85 0 86 9 90 Podobě jako v předchozím případě zjstíme, že I = 0 a J = 3. Dále zjstíme pořadí : studet t=0 C t=30 C t=50 C 3 3 3 3 4 3 5 3 6 3 7 3 8 3 9 3 0 3 Rj 3 4 3 Rj 59 576 69

Z těchto hodot jž můžeme spočítat testovou statstku. Q =. ( 59 + 576 + 69 ) 3.0.4 = 7,4. Krtcká hodota pro daé hodoty I a J je 0.3.4 rova 6,. Tedy zamítáme ulovou hypotézu, výsledky studetů se a hladě výzamost 0,05 výzamě lší. Zjstíme dále hodoty rozdílů částečých součtů pořadí: R-R= - R-R3= R-R3= 0 Z tabulky Fredmaova testu pro mohoásobá porováváí je krtcká hodota rova 0,5. Tuto hrac překračuje R a R3 tedy a hladě výzamost 0,05 prokázá výzamý rozdíl mez výsledky př teplotě 30±C a 50±C.