Statistické zpracování vodohospodářských dat 4 Testování správnosti a shodnosti v kontrolní laboratoři vh 3/007 Milan Meloun Klíčová slova test správnosti - test shodnosti - párový test - Hornův postup - malé výběr heteroskedasticita - nulová hpotéza - alternativní hpotéza - Studentův t-test - Fischer-Snedecorův F-test Souhrn Pro testování hpotéz o parametrech základního souboru na základě jednoho výběru jsou odvozen testovací statistik ze vztahů pro interval spolehlivosti Jednodušší způsob spočívá v přímém užití 00( - α)%ního intervalu spolehlivosti: padne-li zadaná hodnota Θ 0 parametru Θ do tohoto intervalu spolehlivosti nezamítá se nulová hpotéza : Θ Θ 0 a odhad Θ 0 je správný Padne-li Θ 0 mimo tento interval spolehlivosti zamítá se nulová hpotéza a odhad Θ 0 není správný Při testování hpotéz o dvou základních souborech které jsou vzájemně nezávislé a jejichž rozdělení je přitom normální x i N(μ x σ x ) a j N(μ σ ) charakterizovaných dvěma výběr {x i } i n a { j } j n se nejdříve ověří shoda rozptlů testováním nulové hpotéz : σ x σ proti alternativě H A : σ x σ Fisherovým-Snedecorovým F-testem Protože F-test je značně citlivý na odchlk od normalit bývá výhodnější použít Jackknifův test F J nebo robustní test poloh T 4 resp T 5 pro nulovou hpotézu : μ x μ proti alternativě H A : μ x μ Kritériem klasického Studentova t-testu je T test resp T test který je robustní vůči odchlkám od heteroskedasticit zejména pokud jsou velikosti výběrů přibližně shodné Pro případ že se výběr liší v šikmostech od normálního rozdělení je vhodné užití testační statistik modifikovaného t-testu T 3 Vedle testu shodnosti je výhodné použití párového testu u párových dat U malých výběrů 4 < n < 0 je vhodné dát přednost Hornovu postupu Úvod Statistická hpotéza je předpoklad o rozdělení pravděpodobnosti jedné nebo více náhodných veličin Předpoklad se týká parametrů rozdělení náhodné veličin v základním souboru nebo se může vztahovat pouze k zákonu rozdělení náhodné veličin Test statistické hpotéz je pravidlo které na základě výsledků zjištěných z náhodného výběru objektivně předepisuje rozhodnutí má-li být ověřovaná hpotéza zamítnuta či nikoliv Při testování statistické hpotéz se rozlišuje testovaná nulová hpotéza a alternativní hpotéza H A O nulové hpotéze má test rozhodnout zda se zamítne či nikoliv Alternativní hpotéza je ta kterou přijímáme zamítneme-li hpotézu nulovou Celý postup testování je vlastně zamítání alternativních hpotéz Testování je předmětem řad monografií [-9] K testování nulové hpotéz se sestrojuje určitá testovací statistika Padne-li tato statistika do oboru přijetí nulová hpotéza se nezamítá Padne-li však do kritického oboru je nulová hpotéza zamítnuta Pravděpodobnost padnutí testovací charakteristik do kritického oboru se nazývá hladina významnosti α Vjadřuje se v % jako 00α%ní hladina významnosti např 5%ní nebo %ní Kritický obor je možno vmezit oboustranný nebo jednostranný Oboustranný se vmezuje tehd neexistuje-li důvod proč b testovací statistika měla mít buď jen kladné nebo jen záporné znaménko Hladina významnosti α je pak rozložena na dvě stejné části o velikosti α/ Obecný postup testování statistických hpotéz Postup testování statistických hpotéz lze vjádřit těmito krok [0-5]: () Formulace nulové a alternativní hpotéz H A () Volba hladin významnosti α (3) Volba testové statistik např t (4) Určení kritického oboru testové charakteristik např t -α/ (n-) (5) Včíslení testové statistik a jejích kvantilů (6) Rozhodnutí zda (a) zamítnout hpotézu a přijmout H A jestliže testové statistika padne do kritického oboru (b) nezamítnout hpotézu jestliže testová statistika nepadne do kritického oboru 3 Hornův postup malých výběrů 4 n 0 Postup obsahuje tto krok: krok: Postup je založen na pořád kových statistikách x (i) krok: Hloubka pivotu se včíslí dle vztahu H (int((n + )/))/ nebo H (int((n + )/) + )/ podle toho které číslo vjde celé a dolní pivot je potom x D x (H) a horní pivot x H x (n+-h) 3 krok: Odhadem parametru poloh je pivotová polosuma P L ( xd+ xh) / a odhadem parametru rozptýlení je pivotové rozpětí RL xh - xd 4 krok: Náhodná P L xd+ xh veličina k testování T L má přibližně smetrické RL ( xh - xd) rozdělení jehož vbrané kvantil t L0975 (n) jsou uveden v tabulce v cit [5] 5 krok: 95% interval spolehlivosti střední hodnot se vpočte dle vztahu PL- RL t L 0975( n ) μ PL+ RL t L 0975( n) n - α 09 095 0975 099 0995 4 0477 0555 0738 040 33 5 0869 370 094 375 5805 6 053 0759 035 505 968 7 045 0550 070 0978 8 0393 0469 0564 074 0890 9 0484 0688 095 65 575 0 0400 053 0668 0878 05 0363 045 0545 074 0859 0344 043 0483 0593 0697 3 0389 0497 0608 079 0945 4 0348 0437 055 066 0776 5 038 0399 0466 0586 0685 6 099 0374 0435 0507 059 7 033 04 050 0637 0774 8 0300 0380 045 0555 0650 9 088 036 043 050 0575 0 066 0337 0397 0464 059 4 Test správnosti přímých měření Test správnosti vcházejí ze známého tvaru rozdělení pravděpodobností základního souboru z něhož pochází náhodný výběr Standardním předpokladem je že ze základního souboru s rozdělením N(μ σ ) bl proveden náhodný výběr rozsahu n Z dat bl vpočten výběrový průměr x a směrodatná odchlka s Základní hpotéza testu správnosti se týká rovnosti neznámé střední hodnot μ dané známé konstantě μ 0 x - μ 0 Vhodná testová statistika je náhodná veličina t n Analogick s se postupuje i u testu rovnosti rozptlu σ známé hodnotě σ je 0 ( n - ) s nulová hpotéza : σ σ 0 a testová statistika je χ σ 0 Hraniční bod kritického oboru představují 00α%ní kvantil známých rozdě lení Místo formálního testování zda jsou tto kvantil větší než testové statistik je možné přímo včíslit velikost pravděpodobnosti ( - α) a u oboustranného testu ( - α/) V řadě statistických programů jsou včíslené hodnot pravděpodobnosti ( - α) rovněž výsledkem testu Je třeba věnovat pozornost také volbě hladin významnosti α a objasnění výsledku testování podle následujících pravidel: Pokud není nulová hpotéza zamítnuta na hladině významnosti α 005 považuje se rozdíl mezi zadanou hodnotou θ 0 a odhadem Θ parametru θ za nevýznamný Pokud je nulová hpotéza zamítnuta i na hladině významnosti α 00 považuje se rozdíl mezi zadanou hodnotou θ 0 a odhadem Θ za statistick významný 3 Pokud je nulová hpotéza zamítnuta na hladině α 005 ale není zamítnuta na hladině α 00 uvádí se že test neposktl pro daný rozsah výběru měření dostatečné infor mace k rozhodnutí Test významnosti úzce souvisejí s interval spo lehlivosti Test správnosti lze také vjádřit formulací že pokud 00( - α) %ní interval spolehlivosti parametru Θ obsahuje zadanou hodnotu Θ 0 nelze na hladině významnosti α zamítnout hpotézu : Θ Θ 0 U malých výběrů je vhodnější použít Hornův postup 5 Postup testů shodnosti parametrů dvou souborů Porovnání dvou souborů na základě náhodných výběrů {x i } i n a { j } j n patří k častým úlohám v přírodních i technických vědách a to při (a) porovnání výsledků z různých měřících metod nebo laboratoří (b) ověřování nutnosti dělení heterogenních výběrů do homogenních pod skupin (c) hodnocení rozdílu mezi rozličnými materiál a přístroji Někd lze tuto úlohu převést na testování jednoho výběru To je případ párového testu kd mezi prvk obou výběrů existuje jistá logická vazba Představují-li prvk x i vlastnosti před úpravou materiálu 07
a prvk i po úpravě materiálu těchže vzorků (n n ) lze utvořit kombinovaný jednorozměrný výběr D i x i - i pro který lze užít klasickou statistickou analýzu Pokud se odhad střední hodnot D významně neliší od nul znamená to že μ x μ a efekt zpracování materiálu není pro sledovanou vlastnost statistick významný V obecnějším případě dvou výběrů lze zjistit zda pocházejí ze stejného rozdělení pravděpodobnosti a zda se neliší v parametrech poloh a rozptýlení Před vlastní statistickou analýzou je výhodné prozkoumat nejprve metodami průzkumové analýz rozdíl ve statistickém chování obou výběrů Pro každý výběr se konstruuje krabicový graf a vizuálně jsou porovnáván rozdíl mezi relativním rozptýlením (délk krabicového grafu) i parametr poloh (mediánové čár) K ověření předpokladu shod rozdělení obou výběrů se užívá empirický graf Q-Q U výběrů stejného rozsahu n n se na osu vnášejí pořádkové statistik (i) a na osu x se vnášejí pořádkové statistik x (i) Při shodě obou rozdělení b měl bod { (i) x (i) } ideálně ležet na přímce x Pokud však směrnice přímk není rovna jedné liší se obě rozdělení o jistý násobek úměrný velikosti směrnice Je-li navíc úsek na ose nenulový udává jeho velikost posun středních hodnot obou výběrů Vjdeli ted v empirickém grafu Q-Q regresní přímka (i) k x (i) + q znamená to že střední hodnota výběru n je k x + q a pro rozptl platí s k s Nelineární průběh empirického grafu Q-Q pak indikuje rozdíl x v tpu rozdělení obou výběrů Pro praktické účel postačuje obvkle empirický graf Q-Q nebo krabicové graf [0 5] Pokud se konstruují vrubové krabicové graf je možné orientačně zhodnotit význam rozdílů mezi parametr poloh medián Jestliže se vrub nepřekrývají jsou oba výběr co do parametru poloh významně odlišné [0-5] Formálnější postup analýz rozdílů mezi parametr poloh a rozptýlení dvou výběrů je založen na testech významnosti Klasické test vcházejí z předpokladů: (a) výběr {x i } i n a { j } j n jsou vzájemně nezávislé; (b) rozdělení obou výběrů je normální x i N(μ x σ x ) a j N(μ σ ) K testování hpotéz o shodě středních hodnot nebo rozptlů existuje řada různých metod Některé jsou použitelné i v případech kd jsou tto předpoklad narušen Obecný postup testu shodnosti středních hodnot dvou souborů obsahuje tto krok: Ověření normálního rozdělení obou souborů: test a statistické diagnostik k ověření předpokladů o výběru Test shod rozptlů: a) Klasický Fisherův-Snedecorovův F-test b) Modifikovaný Fisherův-Snedecorův F-test c) Robustní Jackknife test F J 3 Test shod středních hodnot dvou souborů: a) Klasický Studentův t-test T pro homoskedasticitu b) Klasický Studentův t-test T pro heteroskedasticitu c) Modifikovaný Studentův t-test T 3 pro výběr odchýlené od normálního rozdělení d) Robustní Jackknife test poloh T 4 pro homoskedasticitu e) Robustní Jackknife test poloh T 5 pro heteroskedasticitu 6 Test shod rozptlů Klasický F-test umožňuje ověření nulové hpotéz : σ x σ proti alternativě H A : σ x σ Vchází se z předpokladu že oba výběr jsou nezávislé a pocházejí z normálního rozdělení obr s x s Testovací kritérium má tvar F max Platí-li hpotéza s sx a s x > s má F kritérium F-rozdělení s v (n - ) a v (n - ) stupni volnosti V opačném případě se pořadí stupňů volnosti zamění Tento klasický test je značně citlivý na předpoklad normalit Mají-li obě výběrová rozdělení jinou špičatost než odpovídá normálnímu je třeba užít kvantil F -α/ (v v ) se stupni volnosti v a v včíslenými podle vztahů a Z dalších testů shodnosti rozptlů i pro více výběrů se jeví spole hli vým robustní Jackknife test Testovací kritérium má tvar n ( z- z ) + n (z - z) F J n n ( z - z ) + (z -z ) i i i i n+ n n + n z z z n+ n n j a z ji i z j j n j Veličin z i se počítají podle vztahu: z i n ln sx- ( n - ) ln s( i) n s( i) ( x j- x() i ) n j i Ve vztahu se vsktuje průměr s vnechanou i-tou hodnotou pro který platí n x () i x j n j i Při výpočtu z i se ve výše uvedených vztazích dosazují hodnot { j } j n rozptl s a rozsah výběru n Platí-li nulová hpotéza má testovací kritérium F J přibližně F-rozdělení s v v n + n - stupni volnosti Vjde-li že F J > F α/ (v v ) je nutné zamítnout hpotézu o shodnosti obou výběrových rozptlů na hladině významnosti Test shod rozptlů se používají k rozhodování zda lze při testování shod výběrových parametrů vcházet z předpokladu σ x σ či nikoliv 7 Test shod středních hodnot ( test shodnosti ) Studentův t-test umožňuje testování hpotéz : μ x μ proti alternativní H A : μ x μ při splnění obou uvedených předpokladů o výběrech obr Obr Znázornění testu shodnosti výsledků při nestejných rozptlech Obr Znázornění testu shodnosti středních hodnot x a při stejných rozptlech 08 vh 3/007
Je-li σ x σ má testovací kritérium tvar x - n n ( n+ n- ) T ( n- ) sx+ ( n- ) s n+ n V případě platnosti hpotéz má tato testová statistika Studentovo rozdělení s v n + n - stupni volnosti Platí-li že T > t -α/ (v) je hpotéza o shodě středních hodnot na hladině významnosti α zamítnuta Je-li σ x σ x - má testovací kritérium tvar T s x s + n n Platí-li hpotéza má tato testová statistika Studentovo rozdělení s ekvi valentními stupni volnosti ν s n x 4 4 s x s + s + n n ( n - ) n ( n - ) Platí-li že T > t -α/ (v) je hpotéza o shodě středních hodnot na hladině významnosti α zamítnuta Určitým problémem při testování je neznalost hodnot obou rozptlů σ x a σ Blo však zjištěno že v pří padě stejných rozsahů obou výběrů n n větších než 8 lze použít testovací kritérium T i kdž σ x σ cit [9] Jestliže se rozsah výběrů výrazně liší n n lze užít kritéria T jenom tehd kdž je poměr výběrových rozptlů blízký jedné Je-li n > n a navíc n i n jsou dostatečně veliké je možné užít kritérium T Pro α 005 pak platí nerovnost dle [0] jak n s x + n s 08 7 sx n s Testovací kritérium T není uvádí s n s x > robustní vůči heteroskedasticitě tj případu kd data jsou ve výběrech měřena s různou přesností V této situaci je správnější užít testovacího kritéria T které je vůči heteroskedasticitě robustnější Pokud se oba výběr odchlují od normalit je vhodné použít modifikované testovací kritérium T 3 x - + C + D ( x - ) s x s + n n μ μ k Test vchází z předpokladu k-tice výběrů pocházejících z normálního rozdělení Velikosti výběrů jsou n i i k Jsou určen také průměr xi a rozptl s i i k Testovací kritérium je formulováno vztahem: k ni( xi - X) i F k i - n si i n k k X n ni x ni i n i a i Veličina F má za předpokladu platnosti hpotéz rozdělení F s (k - ) a v stupni volnosti Platí-li že F > F -α/ (k - v) hpotéza se zamítá Počet stupňů volnosti v se určí ze vztahu ν k oi i ni - ni - si n i o k i - n si i n K testování shod dvou středních hodnot stačí dosadit k x x x s s x s s 8 Ilustrativní úloh Úloha Analýza malého výběru při testu správnosti obsahu síranu v pitné vodě (E30 v [5]) Ve vzorku povrchové vod který bl 7krát vedle sebe naředěn v poměru :0 bl stanovován síran metodou RQ-flex (Merck) Proveďte analýzu vužitím Hornova postupu Deklarovaný obsah má být 50 mg l - Obsah síranů v povrchové vodě [mg l - ]: 500 504 550 550 555 560 565 Řešení: (a) Hornův postup pivotů pro malé výběr (4 < n < 0) vede k tomuto výpočetnímu schématu: Pořádkové statistik: nejprve se seřadí prvk od nejmenší do největší hodnot a zapíšou se do následující tabulk: i 3 4 5 6 7 x (i) 500 504 550 550 555 560 565 vh 3/007 a V těchto vztazích jsou a výběrové šikmosti Ab blo možné užít x kvantilů Studentova rozdělení pro předepsanou hladinu význam nosti α je třeba přeformulovat testovací kritérium T 3 do tvaru T 3 T + Bx- B a B se včíslí analogick pouze šikmost x se nahradí hodnotou σ a rozsah n hodnotou n Za předpokladu rozptl σ x hodnotou platnosti hpotéz má testovací kritérium T 3 Studentovo rozdělení s počtem stupňů volnosti v Test založený na kritériu T 3 je robustní vůči zešikmení výběrových rozdělení i vůči heteroskedasticitě a není u něho požadována ani shoda rozptlů σ x σ Vůči odchlkám rozdělení od normalit ve špičatosti jsou uvedené t-test T T a T 3 dostatečně robustní Je možné použít i korekcí na špičatost [0] které však nepřinášejí výrazné zlepšení Z ostatních tpů testů shod středních hodnot uvedeme test Brownův a For sthův který je vhodný pro obecnější testování shod k-tice středních hodnot je-li definována nulová hpotéza : μ Hloubka pivotu: včíslí se hloubka pivotu pro lichou či sudou hodnotu počtu prvků n Vlevo je zde uveden vzorec a vpravo je pak dosazení do tohoto vzorce: n 7 liché H int n + int() 3 Pivot: včíslí se pivot a to dolní pivot x D x (H) x () 504 a horní pivot x H x (n+-h) x (6) 560 xd + xh 4 Pivotová polosuma bude PL P L 530 5 Pivotové rozpětí bude RL xh - xd R L 560 6 95% interval spolehlivosti střední hodnot μ: t L-α/ 070 PL- RL t α (n ) μ PL+ RL t (n ) L- / L- α / 53-56 070 μ 53 + 56 070 497 μ 573 7 Závěr: Bodový odhad mír poloh je 530 mír rozptýlení 560 a intervalový odhad mír poloh je 497 μ 573 Úloha Test správnosti dodržení přípustné koncentrace fluoridů v pitné vodě (E39 v [5]) Předpis norm ČSN 757-Pitná voda připouští v pitné vodě maximální koncentraci fluoridů 5 mg l - U výběru 33 dat je na hladině významnosti α 005 třeba rozhodnout bl-li dodržen maximálně přípustný odhad střední hodnot koncentrace fluoridů ve vodě Je třeba rozhodnout který odhad střední hodnot lze použít jako statistick nejlepší K tomu se nejprve všetří zda je rozdělení smetrické a bez odlehlých hodnot Koncentrace fluoridů [mg l - ] v pitné vodě: 50 54 43 44 46 44 48 46 5 4 9 55 49 55 45 53 49 50 5 54 55 46 47 44 53 5 5 48 46 58 5 46 47 09
Řešení: Z řad grafických diagnostik exploratorní analýz dat bla zjištěna asmetrie rozdělení a blo detekováno spíše lognormální rozdělení než normální za přítomnosti jednoho vbočujícího bodu Z všetření základních předpokladů o výběru vplývá že data nejsou homogenní protože výběr obsahuje silně odlehlou hodnotu 9 mgl - která leží mimo vnitřní meze povoleného intervalu homogenit 33 a 65 mgl - Nor malita je Jarque- Beraovým testem zamítnuta protože vpočtená hladina významnosti P 0000 je menší než zvolená α 005 Von Neumanův test prokázal že data jsou nezávislá protože včíslená hladina významnosti P 0403 je větší než zvolená α 005 a dále jsou také bez autokorelačního trendu protože u testu včíslené P 055 je větší než α 005 Protože exploratorní analýza odhalila asmetrické rozdělení (lognormální) nelze použít odhad klasických parametrů ( x 505 s 0083 353 a 80 které vedou k chbnému 950%nímu intervalovému odhadu L D 475 a L H 534) Je proto třeba použít robustní odhad nebo nejlépe data transformovat Robustní odhad parametrů vedou k hodnotám mediánu ~ x 05 49 jeho směrodatné odchlk s( ~ x 05 ) 005 a 950% intervalovému odhadu L D 459 a L H 5 Prostá mocninná transformace vede k bodovému odhadu retransformovaného průměru xr 489 a 950% intervalovému odhadu L D 45 a L H 55 který obsahuje předepsanou hodnotu 50 mgl - Závěr: Z intervalových odhadů (robustních a retransformovaných) vplývá že normou požadovaná koncentrace fluoridů v pitné vodě 50 mgl - leží v nalezeném rozmezí L D a L D a naměřená data jsou proto v souladu s normou Úloha 3 Test shodnosti středních hodnot BSK 5 dvěma metodami (E336 v [5]) Koncentrace BSK 5 v odpadní vodě je stanovována dvěma metodami standardní zřeďovací metodou a metodou pomocí biosenzoru Oběma metodami bla provedeno 4 stanovení Je třeba testovat shodnost výsledků z obou metod Hodnot koncentrace kslíku [mg l - ] jsou následující: E336a standardní zřeďovací metodou 70 40 70 70 70 40 40 40 70 70 70 40 40 70 E336b biosenzorem 46 53 78 45 38 6 76 4 47 5 75 43 39 7 Řešení: Z ověření základních předpokladů pro oba jednotlivé výběr vplývá že data jsou nezávislá homogenní bez odlehlých bodů test normalit u obou výběrů prokázal Gaussovo rozdělení Test shodnosti u porovnání koncentrace BSK 5 dvou výběrů odpadní vod (ADSTAT) vede k výsledkům: po exploratorní analýze dat a ověření normalit u obou výběrů jsou včíslen klasické odhad parametrů poloh rozptýlení a tvaru: průměr x (A) 57 x (B) 547 rozptl s (A) 37 s (B) 7 šikmost (A) -09 (B) 05 špičatost (A) 08 (B) 68 Následuje test homogenit rozptlu Fisherovým- Snedecorovým testem nulové hpotéz : s s pro počet stupňů volnosti n - 3 a n - 3 Tabulkový kvantil F -α (n - n - ) 637 a experimentální hodnota činí F exp 095 vede k včíslené hladině významnosti P 0473 přijetí nulové hpotéz shodných rozptlů Pak následuje vlastní test shod průměrů nulové hpotéz : μ μ ke kterému se užije Studentův t-test pro shodné rozptl Tabulkový kvantil t -α/ (v) 055 a experimentální hodnota Studentov testační statistik T 046 což je menší a proto je nulová hpotéza shodných středních hodnot přijata Závěr: Na hladině významnosti α 005 potvrzuje oboustranný kla sic ký test shodu středních hodnot obou výběrů při shodnosti obou rozptlů Obě metod vedou proto ke stejným výsledkům a se stejnou variabilitou Úloha 4 Párový test obsahu železa ve vodě určeného ve dvou laboratořích (E330 v [5]) Koncentrace železa v pitné vodě je sledována ve dvou laboratořích A a B Vzorkování proběhlo v jeden den voda bla nabírána z různých vodovodů Je třeba všetřit zda je možné považovat stanovení v obou laboratořích za shodná Obsah železa [mg l - ] ve vodě dvěma laboratořemi činil: E330a: 005 006 006 06 03 004 04 006 095 0 0 08 03 a E330b: 006 008 007 06 05 006 06 007 079 5 06 007 030 Řešení: Párový test obsahu železa ve vodě určeného ve dvou laboratořích (ADSTAT) vede k výsledkům: Průměrný rozdíl D 000653 D rozptl s 008903 počet stupňů volnosti n - tabulkový kvantil t -α/ (n-) 79 t exp 049 vedou k výsledku že průměr se považují za shodné je přijata na hladině významnosti 0807 Závěr: Párový test přijal hpotézu o shodě koncentraci železa v pitné vodě stanovené ve dvou laboratořích 9 Závěr Studentův t-test správnosti analtického výsledku je základním testem s analogií vůči intervalu spolehlivosti Nachází-li se totiž hodnota μ 0 (tj Apravda@ správná hodnota norma standard) v intervalu spolehlivosti [L D ; L H ] je stanovení správné Exploratorní analýza předurčí volbu zda k testu správnosti vužijeme intervalový odhad aritmetického průměru retransformovaného průměru mediánu nebo pivotové polosum [0-5] Interaktivní statistická analýza vhodným software umožnuje snadno a jednoznačně všetřit správnost výsledku měření Při testování hpotéz o dvou základních souborech charakterizovaných dvěma výběr se nejdříve ověří shoda rozptlů Fisherovým-Snedecorovým F-testem Protože F-test je značně citlivý na odchlk od normalit je výhodnější použít robustní Jackknifův test shodných rozptlů F J Klasický Studentův t-test T pro výběr shodných rozptlů resp T pro výběr neshodných rozptlů je poměrně robustní vůči odchlkám od normalit zejména pokud jsou velikosti výběrů přibližně shodné Pro případ že se výběr liší v šikmostech od normálního rozdělení je vhodné užití testační statistik modifikovaného Studentova t-testu T 3 určeného především pro případ kd jeden z výběrů není Gaussova rozdělení Poděkování Článek vznikl za finační podpor vědeckého záměru Ministerstva školství mláděže a tělovýchov č MSM530000 Literatura [] Hensgaard D: Commun Statist B8 359 (979) [] Tuke J W McLaughlin: Sanka 5 33 (963) [3] Johnson N L Kotz S: Continuous Univariate Distributions Mifflin 970 [4] Hogg R V: J Amer Statist Assoc 69 909 (964) [5] Du Mond Ch Lenth R V: Technometrics 9 (987) [6] Blackman N M Machol R E: IEEE Trans on Inform Theor IT-33 373 (987) [7] Horn J: J Amer Statist Assoc 78 930 (983) [8] Efron B: Canad J Statist 9 39 (98) [9] Posten H O Yeh H C Owen D B: Commun Statist A 09 (98) [0] Cressie N A C Whitford H J: Biom J 8 3 (986) [] Yuen K Dixon W J: Biometrika 60 369 (973) [] Owen D B: Handbook of Statistical Tables Addison Wesle Publ Reading 963 [3] Green J R Margerison D: Statistical Treatment of Experimental Data Elsevier Amsterdam 978 [4] Miller J C a Miller J N: Statistics for Analtical Chemistr Ellis Horwood Chichester 984 [5] Himmelblau D M: Process Analsis b Statistical Methods Wile New York 969 [6] Liteanu C Rica I: Statistical Theor and Methodolog of Trace Analsis Ellis Horwood Chichester 980 [7] Anderson R L: Practical Statistics for Analtical Chemists van Nostrand Reinhold Comp New York 987 [8] Eason G a kol: Mathematics and Statistics for the Bio-Sciences Ellis Horwood Chichester 980 [9] Stoodl K: Applied and Computation Statistics Ellis Horwood Chiches ter 984 [0] Meloun M Militký J: Statistické zpracování experimentálních dat Plus Praha 994 East Publishing Praha 998 Academia Praha 004 [] Meloun M Militký J: Statistické zpracování experimentálních dat - Sbírka úloh s disketouuniverzita Pardubice 996 [] Meloun M Militký J Forina M: Chemometrics for Analtical Chemistr Volume PC-Aided Statistical Data Analsis Ellis Horwood Chichester 99 [3] Meloun M Militký J Forina M: Chemometrics for Analtical Chemistr Volume PC-Aided Regression and Related Methods Ellis Horwood Chichester 994 [4] ADSTAT TriloBte Statistical Software s r o Pardubice 990 [5] Meloun M Militký J: Kompendium statistického zpracování dat Academia Praha 00 ( vdání) 006 ( rozšířené a doplněné vdání) NÁZEV V ANGLIČTINĚ DO KOREKTUR Prof RNDr Milan Meloun DrSc Katedra analtické chemie Chemickotechnologická fakulta Ke Words accurac test - equalit test - pair test - Horn procedure of small smplex heteroscedasticit - null hpothesis - alternative hpothesis - Student t-test - Fischer-Snedecor F-test In man applications of statistics we are interested in making inferences about population characteristics on the basis of observations made on a random sample of items from population The characteristics of interest ma often be expressed in terms of popula- 0 vh 3/007
tion parameters such as the population mean or variance In other situations we ma wish to make inferences about the diference between two or more populations such as the difference between two population means A statistical hpothesis is a statement about the population distribution of some random variable Hpothesis testing consists of comparing some statistical measures called test criteria deduced from a data sample with the values of these criteria taken on the assumption that a given hpothesis is correct This article brings several frequentl used tests such as the accurac test the equalit test the pair test and Horn procedure of small samples with demonstration on tpical problems vh 3/007