STATISTICKÉ METODY PRO VYHODNOCOVÁNÍ SENZORICKÝCH DAT STATISTICAL METHODS FOR EVALUATION OF SENSORIAL DATA

Podobné dokumenty
Limitní věty teorie pravděpodobnosti. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která

Testování statistických hypotéz

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

8. Normální rozdělení

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

PRAVDĚPODOBNOST A STATISTIKA

Téma 22. Ondřej Nývlt

a způsoby jejího popisu Ing. Michael Rost, Ph.D.

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

I. D i s k r é t n í r o z d ě l e n í

Testování statistických hypotéz

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

p(x) = P (X = x), x R,

Aproximace binomického rozdělení normálním

MATEMATICKÁ STATISTIKA

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

NMAI059 Pravděpodobnost a statistika

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně

12. cvičení z PST. 20. prosince 2017

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

15. T e s t o v á n í h y p o t é z

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

Výběrové charakteristiky a jejich rozdělení

PRAVDĚPODOBNOST A STATISTIKA

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

1. Statistická analýza dat Jak vznikají informace Rozložení dat

Základy teorie pravděpodobnosti

Základy počtu pravděpodobnosti a metod matematické statistiky

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

KGG/STG Statistika pro geografy

Vybraná rozdělení náhodné veličiny

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Ing. Michael Rost, Ph.D.

2 ) 4, Φ 1 (1 0,005)

Charakterizace rozdělení

Pravděpodobnost a aplikovaná statistika

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

ROZDĚLENÍ NÁHODNÝCH VELIČIN

Testy. Pavel Provinský. 19. listopadu 2013

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

5 Parametrické testy hypotéz

15. T e s t o v á n í h y p o t é z

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

4ST201 STATISTIKA CVIČENÍ Č. 7

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013

Cvičení ze statistiky - 8. Filip Děchtěrenko

Funkce komplexní proměnné a integrální transformace

Rozdělení náhodné veličiny. Distribuční funkce. Vlastnosti distribuční funkce

Normální (Gaussovo) rozdělení

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Odhad parametrů N(µ, σ 2 )

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

= = 2368

NÁHODNÁ VELIČINA. 3. cvičení

Definice spojité náhodné veličiny zjednodušená verze

Náhodná veličina. Michal Fusek. 10. přednáška z ESMAT. Ústav matematiky FEKT VUT, Michal Fusek

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Pravděpodobnost a statistika

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Normální (Gaussovo) rozdělení

7. Rozdělení pravděpodobnosti ve statistice

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

Odhad parametrů N(µ, σ 2 )

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Regresní analýza 1. Regresní analýza

STATISTICKÉ ZJIŠŤOVÁNÍ

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

Pravděpodobnost a statistika

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

Derivace funkce. Přednáška MATEMATIKA č Jiří Neubauer

Pravděpodobnost a matematická statistika

Testování statistických hypotéz

Přijímací zkouška na navazující magisterské studium 2014

Pravděpodobnost a aplikovaná statistika

STATISTICKÉ HYPOTÉZY

Texty k přednáškám z MMAN3: 4. Funkce a zobrazení v euklidovských prostorech

Normální rozložení a odvozená rozložení

3 Bodové odhady a jejich vlastnosti

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Náhodné (statistické) chyby přímých měření

Interpolace, ortogonální polynomy, Gaussova kvadratura

Transkript:

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA STROJNíHO INŽENÝRSTVí ÚSTAV MATEMATIKY FACULTY OF MECHANICAL ENGINEERING INSTITUTE OF MATHEMATICS STATISTICKÉ METODY PRO VYHODNOCOVÁNÍ SENZORICKÝCH DAT STATISTICAL METHODS FOR EVALUATION OF SENSORIAL DATA DIPLOMOVÁ PRÁCE MASTER S THESIS AUTOR PRÁCE AUTHOR VEDOUCÍ PRÁCE SUPERVISOR Bc. MAGDA KOZIELOVÁ doc. RNDr. JAROSLAV MICHÁLEK, CSc. BRNO 009

Abstrakt Tématem této diplomové práce je statistické vyhodnocování dat získaných při senzorické analýze potravin. Přináší výběr vhodných statistických testů, jejich podrobnou analýzu a srovnání dle průběhu jednotlivých silofunkcí pro dané parametry. Důležitou součástí práce je naprogramování uživatelské aplikace přímo určené ke zpracování senzorických dat. Summary The thesis deals with the statistical evaluation of data gained by the sensory analysis of the foodstuff. It brings a selection of the suitable statistical tests, a detailed analysis of these tests and their comparision based on the particular power functions for given parameters. As an important part of the thesis, there is a creating of custom software for the evaluating of sensorial data. Klíčová slova statistické metody, senzorická analýza, silofunkce, síla testu Keywords statistical methods, sensory analysis, power function, power of test KOZIELOVÁ, M.Statistické metody pro vyhodnocování senzorických dat. Brno: Vysoké učení technické v Brně, Fakulta strojního inženýrství, 009. 77 s. Vedoucí doc. RNDr. Jaroslav Michálek, CSc.

Čestně prohlašuji, že jsem diplomovou práci Statistické metody pro vyhodnocování senzorických dat vypracovala samostatně pod vedením doc. RNDr. Jaroslava Michálka, CSc. s použitím materiálů uvedených v seznamu literatury. Bc. Magda Kozielová

Tímto bych chtěla poděkovat vedoucímu mé diplomové práce panu doc. RNDr. Jaroslavu Michálkovi, CSc. za odborné rady a cenné připomínky, které přispěly ke zdárnému zpracování zadaného tématu. Bc. Magda Kozielová

Obsah Úvod 3 1 Základní pojmy 5 1.1 Základní statistické pojmy........................... 5 1. Vybraná rozdělení................................ 6 1..1 Binomické rozdělení........................... 6 1.. Beta rozdělení.............................. 6 1..3 Rozdělení Fisherovo-Snedecorovo F.................. 7 1.3 Souvislost mezi rozdělením F a binomickým rozdělením........... 7 1.4 Aproximace binomického rozdělení normálním rozdělením.......... 9 1.5 Transformace stabilizující rozptyl....................... 9 1.5.1 Arcussinová transformace v binomickém rozdělení.......... 10 1.6 Testování hypotéz................................ 11 1.7 Intervalové odhady............................... 1 Senzorická analýza 13.1 Rozlišovací metody............................... 13.1.1 Párová porovnávací zkouška...................... 13.1. Zkouška duo-trio............................ 13.1.3 Trojúhelníková zkouška......................... 13. Pořadové metody................................ 14.3 Hodnocení s použitím ordinálních stupnic................... 14 3 Testy hypotéz o parametru π binomického rozdělení 15 3.1 Kritický obor testu o parametru binomického rozdělení........... 15 3. Síla testu o parametru π binomického rozdělení............... 16 3.3 Explicitní vyjádření intervalu spolehlivosti pro parametr π binomického rozdělení..................................... 18 3.4 Síla testu využívajícího Fisherovy kvantily.................. 0 3.5 Test založený na normální aproximaci..................... 3.6 Síla testu založeného na normální aproximaci................. 3 3.7 Testy založené na arcussinové transformaci.................. 31 3.8 Síla testů založených na arcsin-transformaci................. 31 3.9 Volba rozsahu výběru n............................ 37 4 Srovnání testů o parametru π binomického rozdělení 41 5 Statistické metody v senzorické analýze 49 5.1 Vyhodnocení rozlišovacích metod....................... 49 5.1.1 Párová porovnávací zkouška...................... 49 5.1. Zkouška duo-trio............................ 50 5.1.3 Trojúhelníková zkouška......................... 51 5. Vyhodnocení pořadových metod........................ 5 1

5.3 Vyhodnocení stupnicových metod....................... 53 5.3.1 Hodnocení jednoho senzorického znaku v rámci jednoho výrobku.. 53 5.3. Srovnání senzorického znaku dvou a více výrobků.......... 54 6 Software pro zpracování senzorických dat 57 6.1 Senzorická analýza............................... 57 6.1.1 Rozlišovací zkoušky........................... 58 6.1. Pořadové zkoušky............................ 59 6.1.3 Stupnicové zkoušky........................... 61 6. Analýza jednorozměrných dat......................... 61 6..1 Základní zpracování dat........................ 6 6.. Srovnání souboru s předpokladem................... 6 6..3 Srovnání dvou nezávislých souborů.................. 6 6..4 Srovnání dvou závislých souborů................... 64 7 Příklad senzorického experimentu 67 7.1 Párová porovnávací zkouška.......................... 67 7. Pořadová zkouška................................ 68 7.3 Hodnocení s použitím ordinálních stupnic................... 68 7.4 Shrnutí výsledků senzorického experimentu.................. 70 Závěr 71 Literatura 73 Seznam základních použitých zkratek a symbolů 75 Seznam příloh 77

Úvod Cílem této diplomové práce je vybrat a důkladně popsat statistické testy vhodné pro vyhodnocování dat získaných při senzorické analýze potravin. Dále vyšetřit silofunkce těchto testů a na základě jejich průběhu stanovit doporučení týkající se jejich využití. Dalším z cílů je také vybrat vhodné programovací prostředí a v něm provést programovou implementaci. Její funkčnost je pak nezbytné ověřit na reálných či simulovaných datech. V první kapitole jsou uvedeny základní dále používané pojmy z matematické statistiky, testování hypotéz a také některé závislosti nezbytné pro lepší orientaci v dalším textu. Druhá kapitola seznamuje s problematikou metod senzorické analýzy, obsahuje stručnou charakteristiku jednotlivých typů senzorických zkoušek a popis jejich provádění. Třetí kapitola popisuje pět testů vybraných pro vyhodnocování senzorických dat. Jsou zavedeny jednotlivé testovací statistiky a také jsou zde odvozeny analytické vztahy pro přesné i aproximované silofunkce testů. Součástí je rozbor testů založený na zkoumání tvarů silofunkcí, které byly vykresleny pomocí nově naprogramovaných funkcí v MAT- LABu. Jedná se o programy, které graficky znázorňují průběh jednotlivých silofunkcí, jak pro teoreticky odvozené vztahy, tak pro simulovaná data. Důležitou částí této kapitoly je také odstavec týkající se volby rozsahu výběru pro optimalizaci experimentu. Je zde popsáno stanovení minimálního rozsahu výběru grafickým způsobem a také výpočtem pomocí analyticky odvozených vztahů. Následující čtvrtá kapitola přináší srovnání jednotlivých vybraných testů na základě průběhu jejich silofunkcí. Poukazuje na vhodnost volby testů pro různé parametry a také varuje před jejich neuváženým používáním. Pátá kapitola popisuje využití jednotlivých vybraných testů pro zpracování senzorických dat a dále nastiňuje vyhodnocování dat získaných dalšími senzorickými zkouškami. V rámci této diplomové práce byla autorem v prostředí Delphi naprogramována uživatelská aplikace SMSA (verze 1.09) sloužící k přímému vyhodnocování senzorických experimentů založeném na předem teoreticky popsaných způsobech. Tento software a možnosti jeho praktického použití včetně ilustrujících obrázků je popsán v kapitole šest. Závěrečná sedmá kapitola přináší ukázku senzorického experimentu. Tento aplikační příklad je vyřešen pomocí programu SMSA. 3

4

1 Základní pojmy 1.1 Základní statistické pojmy Definice 1. Necht Ω je prostor elementárních jevů, A systém jevů definovaných na Ω. Předpokládejme, že platí 1. A =,. A A Ā A, 3. A i A, i = 1,,... i=1 A i A. Pak systém A nazýváme jevovou σ-algebrou. Dvojici (Ω, A) nazýváme jevové pole. Definice. Necht (Ω, A) je jevové pole, n je počet opakování pokusů, A je náhodný jev a m n (A) je četnost nastoupení jevu A v n pokusech. Pak f n (A) = mn(a) je relativní n četnost A. Definice 3. Necht (Ω, A) je jevové pole. Necht P je množinová funkce definovaná na A s oborem hodnot R = (, ) a s vlastnostmi: 1. P(A) 0, A A.. Necht A i A, A i A j =, i j, i,j = 1,, P( i=1 A i) = i=1 P(A i). 3. P(Ω) = 1. Pak množinovou funkci P : A R nazýváme pravděpodobností na (Ω, A). Pro náhodný jev A A pak číslo P(A) nazýváme pravděpodobností jevu A. Trojici (Ω, A, P) nazýváme pravděpodobnostní prostor. Definice 4. Necht (Ω, A, P) je pravděpodobnostní prostor. Pak zobrazení X : Ω R nazveme náhodnou veličinou (vzhledem k jevovému poli (Ω, A)), když pro každé x R platí: {ω : X(ω) x} A. Definice 5. Necht (Ω, A, P) je pravděpodobnostní prostor a X : Ω R náhodná veličina vzhledem k A. Pak funkci F(x) = P ({ω : X(ω) x}), x R, nazýváme distribuční funkcí náhodné veličiny X. Označení: F(x) = P ({ω : X(ω) x}) = P ([X x]) = P (X x). Definice 6. Necht X je náhodná veličina na (Ω, A, P), B je Borelovská σ-algebra. Pak množinovou funkci P X : B R definovanou vztahem P X (B) = P(X B), B B, nazýváme rozdělením pravděpodobností náhodné veličiny X. Definice 7. Necht F(x) je distribuční funkce náhodné veličiny X. Pak funkci F 1 (u) = inf x {x : F(x) u}, u (0, 1), nazýváme kvantilovou funkcí náhodné veličiny X nebo též kvantilovou funkcí příslušnou k distribuční funkci F(x). Pro dané číslo γ (0, 1) nazýváme čísla x γ = F 1 (γ) γ-kvantilem distribuční funkce F (γ-kvantilem rozdělení pravděpodobnosti náhodné veličiny X). 5

Definice 8. Necht X je náhodná veličina definovaná na pravděpodobnostním prostoru (Ω, A, P) a M nejvýše spočetná množina reálných čísel taková, že platí x M P(X = x) = 1. Pak řekneme, že náhodná veličina X je diskrétního typu (má diskrétní rozdělení pravděpodobnosti), M se nazývá obor hodnot X a funkce p (x) definovaná vztahy p (x) =P(X = x), x M p (x) = 0, x / M se nazývá pravděpodobnostní funkcí náhodné veličiny X. Označení X (M, p) znamená, že náhodná veličina X má diskrétní rozdělení pravděpodobnosti s oborem hodnot M a pravděpodobnostní funkcí p. Poznámka. Pro diskrétní rozdělení s pravděpodobnostní funkcí p (x) na M stačí distribuční funkci zadat v bodech z M. Této skutečnosti budeme dále využívat. Definice 9. Řekneme, že náhodná veličina X má rozdělení pravděpodobnosti spojitého typu, když existuje nezáporná funkce f(x), x R, f(x)dx = 1, a distribuční funkci F(x) náhodné veličiny X lze pomocí f(x) zapsat ve tvaru F(x) = x f(t)dt Funkci f pak nazýváme hustotou náhodné veličiny X. 1. Vybraná rozdělení 1..1 Binomické rozdělení Uvažujme náhodnou veličinu X, která má binomické rozdělení Bi(n,π) s parametry n N, π (0, 1). Ozn. X Bi(n, π). Pak její pravděpodobnostní funkce je ( ) n p(x) = P(X = x) = π t (1 π) n t, x = 0, 1,...,n. (1.1) t Střední hodnota je tvaru EX = nπ a rozptyl DX = nπ(1 π). Je-li n = 1, jedná se o tzv. alternativní rozdělení A(π). 1.. Beta rozdělení Náhodná veličina X má beta rozdělení Be(p,q) s parametry p, q > 0, je-li hustota pravděpodobnosti tvaru { 1 B(p,q) f(x) = xp 1 (1 x) q 1 pro x (0, 1), (1.) 0 pro x / (0, 1), kde B(p,q) = 1 0 xp 1 (1 x) q 1 dx je tzv. beta funkce. Ozn. X Be(p,q). Distribuční funkce { 1 x B(p,q) 0 F(x) = tp 1 (1 t) q 1 dt pro x > 0, (1.3) 0 pro x 0, rozdělení beta je tzv. neúplná beta funkce. 6

1..3 Rozdělení Fisherovo-Snedecorovo F Náhodná veličina X má rozdělení F o stupních volnosti ν 1, ν 0, je-li hustota pravděpodobnosti ( ) ν1 1 ν ( ) ν 1 f ν1, ν (x) = B( ν 1, ν ) ν x ν 1 1 +ν 1 1 + ν 1 ν x pro x > 0, (1.4) 0 pro x 0. Ozn. X F(ν 1, ν ). Distribuční funkce F rozdělení se značí jako F ν1, ν (x) a α-kvantil jako F α (ν 1, ν ). 1.3 Souvislost mezi rozdělením F a binomickým rozdělením Věta 1.3.1. Distribuční funkci F(x) binomického rozdělení lze vyjádřit pomocí neúplné beta funkce, tedy F(x) = x t=0 ( ) n π t (1 π) n t = t 1 1 π z n x 1 (1 z) x dz. (1.5) B(n x,x + 1) 0 Důkaz. Věta se dokáže postupnou integrací per partes (viz [9]). Věta 1.3.. Distribuční funkci F(x) binomického rozdělení Bi(n, π) lze vyjádřit pomocí distribuční funkce F ν1, ν (x) rozdělení F o ν 1, ν stupních volnosti ve tvaru F(x) = x t=0 kde ν 1 = (n x), ν = (x + 1). ( ) ( n x + 1 π t (1 π) n t = F ν1, ν t n x 1 π ), (1.6) π Důkaz. Vyjdeme ze vztahu (1.5) a v uvedeném integrálu provedeme substituci z = y a + y, kde a = x + 1 n x. (1.7) Pak Dále určíme meze integrálu. Pro dz = a (a + y) dy. z = 1 π 7

dostaneme a pro dostaneme y = a z 1 z = a 1 π π z = 0 y = a 0 = 0. Po této substituci z (1.5) po úpravě dostaneme x t=0 = = = = = = ( ) n π t (1 π) n t = t 1 B(n x,x + 1) 1 B(n x,x + 1) 1 B(n x,x + 1) 1 B(n x,x + 1) 1 B(n x,x + 1) 1 B(n x,x + 1) a 1 π π 0 a 1 π π 0 a 1 π π 0 a 1 π π 0 a 1 π π 0 ( 1 a ( ) n x 1 ( y 1 y ) x a a + y a + y y n x 1 (a + y) x+1 n ( a a + y y n x 1 a x a (a + y) n (a + y) dy y n x 1 a x a (a + y) n (a + y) an a dy n ( ) n+1 a y n x 1 a x n dy a + y ( y n x 1 1 + a) y n 1 dy ) n x a 1 π π 0 (a + y) dy ) x a (a + y) dy Položíme ν 1 = (n x), ν = (x+1). Odtud po dosazení ze vztahu (1.7) za a = x+1 dostáváme F(x) = 1 B( ν 1, ν ) ( ν1 ν ) ν 1 ν 1 π ν 1 π 0 ( y ν 1 1 1 + ν ) ν 1 +ν 1 y ν Což je distribuční funkce F ν1,ν rozdělení F v bodě x+1 1 π n x π ( x + 1 F(x) = F ν1,ν n x 1 π ). π. Tedy = ν n x ν 1 dy. (1.8) 8

1.4 Aproximace binomického rozdělení normálním rozdělením Věta 1.4.1 (Moivreova-Laplaceova). Necht X n Bi(n,π). Pak U = X EX DX = X nπ nπ(1 π) má asymptoticky normální rozdělení N(0, 1), a tedy lim P(U < u) = Φ(u), < u <, n kde Φ(u) je distribuční funkce normovaného normálního rozdělení N(0,1). Důkaz. Bud X n = n i=1 I i, kde I i A(θ). Pak z centrální limitní věty plyne, že X n konverguje v distribuci k N(0, 1). Z věty 1.4.1 plyne, že při dostatečně velkém rozsahu výběru n lze distribuční funkci binomického rozdělení aproximovat distribuční funkcí normálního rozdělení. 1.5 Transformace stabilizující rozptyl Necht X je náhodná veličina s rozdělením závisejícím na parametru θ. Předpokládejme, že platí EX = θ. Na parametru θ závisí také rozptyl veličiny X, tedy DX = σ (θ). Stabilizací rozptylu rozumíme nalezení vhodné netriviální transformační funkce g takové, aby náhodná veličina Y = g(x) měla rozptyl nezávisející na θ. Funkce g se získá pomocí aproximace z Taylorova vzorce g(x) g(θ) + (X θ)g (θ), tedy Eg(X) g(θ) Dg(X) [g (θ)] σ (θ), Požadavek na nezávislost rozptylu g(x) na parametru θ lze vyjádřit jako (1.9) g (θ)σ(θ) = c, kde c je vhodně zvolená konstanta. Odtud dostáváme řešení dθ g(θ) = c σ(θ). (1.10) Získaná transformační funkce g(θ) výrazně stabilizuje rozptyl, tedy D g (X) závisí na θ jen velmi málo. Navíc rozdělení náhodné veličiny Y bývá již velmi blízké normálnímu, ačkoli samotné rozdělení veličiny X může být výrazně nenormální. 9

1.5.1 Arcussinová transformace v binomickém rozdělení Necht X je náhodná veličina s binomickým rozdělením Bi(n, π). Relativní četnost úspěchů v n nezávislých pokusech je o střední hodnotě a rozptylu Z = X n EZ = π DZ = D X n = 1 π(1 π) ndx = n (plyne z odstavce 1..1). Dle (1.10) je g(π) = c dπ σ(π) = c n dπ π(1 π). Zvolíme-li konstantu c = ( n ) 1, dostaneme arcussinovou transformaci X Y = g(z) = arcsin(z) = arcsin n, (1.11) přičemž dle (1.9) má transformovaná veličina Y střední hodnotu a rozptyl DY = Dg(X) (g (π)) σ (π) = EY = Eg(Z) g(π) = arcsin π ( 1 1 ) 1 π 1 π(1 π) π n = 1 4n. Jak bylo uvedeno výše, veličina Y má rozdělení blízké normálnímu. Standardizací se odvodí asymptoticky normální náhodná veličina U 1 = Y EY = ( ) X n arcsin DY n arcsin π 0. (1.1) V [6] je uvedeno, že arcussinová transformace Z + 3 8n Y = g(z) = arcsin 1 + 3 = arcsin 4n o střední hodnotě a rozptylu EY arcsin π + 3 8n 1 + 3 4n DY 1 4n + X + 3 8 n + 3 4 (1.13) 10

je stabilnější. Výhodou této transformace oproti (1.11) je menší rozptyl. Z (1.13) lze opět získat asymptoticky normální statistiku U = ( ) 8X + 3 4n + arcsin 8n + 6 arcsin 8nπ0 + 3. (1.14) 8n + 6 1.6 Testování hypotéz Necht náhodný výběr X = (X 1,..., X n ) má rozdělení o distribuční funkci F(x, θ), kde parametr θ je z parametrického prostoru Θ, a necht X je obor hodnot náhodného výběru X. Definujme nulovou hypotézu H 0 : θ Θ 1 Θ a alternativní hypotézu H 1 : θ Θ 1 = Θ Θ 1. Je-li množina Θ 1 jednobodová, pak H 0 se nazývá jednoduchá nulová hypotéza. Je-li Θ Θ 1 jednobodová množina, pak se H 1 nazývá jednoduchou alternativní hypotézou. Na základě náhodného výběru X z rozdělení o distribuční funkci F(x, θ) je potřeba rozhodnout o platnosti H 0 nebo H 1. Statistický test je pravidlo, které každé hodnotě náhodného výběru přiřadí jedno ze dvou možných rozhodnutí: hypotéza H 0 se zamítá, nebo se H 0 nezamítá. Pokud se zamítne hypotéza H 0, přestože je správná, dojde k chybě I. druhu. Jestliže se naopak hypotéza H 0 nezamítne, ačkoli neplatí, dojde k chybě II. druhu. Test se konstruuje tak, aby pravděpodobnost chyby I. druhu byla nejvýše rovna α. Za této podmínky se pak minimalizuje pravděpodobnost chyby II. druhu β. Test se provádí pomocí tzv. kritického oboru. Kritický obor W α X se zavádí pomocí testovací statistiky T a pomocí kritické hodnoty k α R. Pravostranným kritickým oborem vedoucím na jednostranný test se rozumí levostranný kritický obor má tvar W α = {x X : T = T(x) > k α }, W α = {x X : T = T(x) < k α }, na oboustranný test pak vede oboustranný kritický obor W α = {x X : T < k α, nebo T > k α}, W α = {x X : T > k α }, kde k α, k α, k α jsou kritické hodnoty. Platí-li x W α, pak se hypotéza H 0 zamítá, pokud ale x / W α, hypotéza H 0 se nezamítá. Horní hranice pro pravděpodobnost chyby I. druhu α = sup P(x W α ) θ 11

se nazývá hladina významnosti testu. Číslo β α = 1 β se nazývá síla testu. Sílou testu v bodě θ se rozumí silofunkce testu β α (θ), což je pravděpodobnost, že hypotéza H 0 se zamítá, když hodnota parametru je θ. Aby byla splněna podmínka, že pravděpodobnost chyby I. druhu nemá být větší než hladina významnosti α, musí platit β α (θ) α pro θ Θ 1. Problematika testování hypotéz je podrobněji popsána v [1]. 1.7 Intervalové odhady Definice 10. Necht X = (X 1,, X n ) je náhodný výběr z rozdělení o distribuční funkci F(x,θ), τ(θ) je daná parametrická funkce. Necht T D = T D (X) a T H = T H (X) jsou statistiky. Pak T D,T H nazýváme 100(1 α)% oboustranným intervalem spolehlivosti pro τ(θ), když P(T D < τ(θ) < T H ) 1 α. Dále interval,t H nazýváme 100(1 α)% pravostranný interval spolehlivosti pro τ(θ), když P(τ(θ) < T H ) 1 α. Konečně interval T D, nazýváme 100(1 α)% levostranný interval spolehlivosti pro τ(θ), když P(T D < τ(θ)) 1 α. Je-li,T H, resp. T D, pravostranný, resp. levostranný interval spolehlivosti pro τ(θ), pak T H, resp. T D nazýváme horní, resp. dolní odhad τ(θ) s rizikem α. 1

Senzorická analýza Senzorická analýza je jedním z prostředků hodnocení jakosti potravin. Patří mezi tzv. psychometrické metody, její pomocí se tedy nezjišt uje složení potravin, ale posuzuje se existence či intenzita určitého vjemu. Určují se organoleptické vlastnosti, tedy vlastnosti vnímatelné lidskými smysly (chut, vůně apod.). Mezi metody senzorické analýzy patří: rozlišovací metody, pořadové metody a hodnocení s použitím stupnic. Při provádění analýzy se obvykle využívá jejich kombinace. Senzorická analýza je podrobněji popsána včetně testů v [11]..1 Rozlišovací metody Pomocí rozlišovacích metod se stanovuje, zda mezi dvěma hodnocenými výrobky existuje rozdíl ve sledovaném senzorickém znaku. Po posuzovatelích se vyžaduje tzv. vynucená odpověd, hodnotitel tedy musí vybrat jednu z nabídnutých formulací. Podle způsobu provádění posuzování se rozlišují tyto metody: párová porovnávací zkouška, zkouška duotrio, trojúhelníková zkouška..1.1 Párová porovnávací zkouška Posuzovatelé obdrží dva za stejných podmínek připravené vzorky A a B zkoumaných výrobků. Jejich úkolem je odpovědět, který vzorek je intenzivnější při zkoušce rozdílu v intenzitě či kterému ze vzorků dávají přednost u preferenčních zkoušek. Pro vyhodnocení párové porovnávací zkoušky se používají testy o parametru binomického rozdělení. Zkoumá-li se rozdílnost výrobků jako takových, použije se pro vyhodnocení obostranných testů. Je-li žádoucí zjistit směr této rozdílnosti, využijí se testy jednostranné..1. Zkouška duo-trio Při zkoušce duo-trio jsou posuzovatelům předloženy celkem tři vzorky. První se nazývá tzv. referenční, podává se jako standard. Další dva jsou tzv. experimentální a jsou předloženy anonymně. Jeden z těchto dvou vzorků pochází ze stejného výrobku jako standard. Hodnotitel má pak za úkol rozhodnout, který vzorek ze dvou experimentálních je ve sledovaném znaku shodný se standardem a který je odlišný..1.3 Trojúhelníková zkouška Hodnotitel při trojúhelníkové zkoušce obdrží řadu tří náhodně uspořádaných, avšak za stejných podmínek připravených vzorků, z nichž dva pocházejí ze stejného výrobku a třetí je odlišný. Úkolem posuzovatele je označit vzorek, který se od ostatních dvou liší. 13

. Pořadové metody Cílem pořadové zkoušky je roztřídění skupiny výrobků, jejich seřazení podle intenzity senzorického znaku, podle preferencí spotřebitelů, nebo sledování vlivu určitého faktoru na organoleptické vlastnosti a senzorickou jakost výrobku. Posuzovateli je předložena skupina vzorků v náhodném pořadí a jeho úkolem je seřadit vzorky podle daného ukazatele (preference či intenzity znaku). I zde je doporučována nucená volba, tzn. na jedno místo v pořadí by nemělo být přiřazeno více vzorků..3 Hodnocení s použitím ordinálních stupnic Existují různé typy stupnic, v senzorické analýze se však nejčastěji využívají tzv. ordinální stupnice. Měřit na ordinální stupnici znamená přiřadit jednotlivým variantám odpovědí čísla vyjadřující větší nebo menší úroveň sledovaného senzorického znaku. V množině uspořádané podle stupnice tohoto typu nelze stanovit, jaká je tzv. vzdálenost mezi dvěma sousedními objekty. Ordinální stupnice lze dále dělit na stupnice intenzitní, tj. zkoumající intenzitu daného znaku, a hédonické, zkoumající příjemnost, přijatelnost apod. Stupnici lze konstruovat jako tzv. stupnici prvního stupně, tj. první kategorie je vyhrazena pro nepatrnou intenzitu vlastnosti a poslední kategorie pro největší intenzitu resp. nejlepší jakost, nebo lze směr hodnot definovat obráceně a vytvořit tak tzv. stupnici druhého druhu. Příkladem intenzitní ordinální stupnice prvního druhu může být posloupnost vyjadřující slanost vzorku: naprosto neslaný, velmi málo slaný, málo slaný,..., nesmírně slaný. Samotná zkouška probíhá tak, že zaškolený hodnotitel obdrží protokol s uvedenými senzorickými znaky, které bude u vzorků hodnotit, a stupnice, podle kterých bude vzorek zařazovat. Poté předložený vzorek objektivně posoudí a v souladu se stupnicí zapíše své hodnocení. Toto provede u každého vzorku a znaku. 14

3 Testy hypotéz o parametru π binomického rozdělení Dále bude pozornost zaměřena na podrobný rozbor testů hypotéz o parametru π binomického rozdělení, které jsou vhodné pro vyhodnocování senzorických dat získaných rozlišovacími zkouškami. 3.1 Kritický obor testu o parametru binomického rozdělení Necht X 1,...,X n je náhodný výběr z alternativního rozdělení A(π), pak náhodná veličina X = n i=1 X i má binomické rozdělení Bi(n,π). Testujme hypotézu H 0 : π = π 0 proti oboustranné alternativě H 1 : π π 0, kde π 0 je pevná hodnota z intervalu (0, 1). Test založíme na kritickém oboru je W α = {x {0, 1,, n} : x c 1, x c }, tj. hledáme největší celé číslo c 1, pro které při daném α platí c 1 ( ) n P π0 (X c 1 ) = π t 0(1 t π 0 ) n t α, t=0 c 1 +1 ( n P π0 (X c 1 + 1) = )π t0(1 π 0 ) n t > α (3.1) t, t=0 a nejmenší celé číslo c splňující pro dané α P π0 (X c ) = P π0 (X c 1) = n ( n t n t=c t=c 1 ) π t 0(1 π 0 ) n t α, ( n t )π t0(1 π 0 ) n t > α. (3.) V případě testování hypotézy H 0 : π = π 0 proti pravostranné alternativě H 1 : π > π 0, kde π 0 je pevná hodnota z intervalu (0, 1), je kritickým oborem množina W α = {X = x; x c}, přičemž c splňuje nerovnosti P π0 (X c) = P π0 (X c 1) = n ( n t n t=c t=c 1 ( n t ) π t 0(1 π 0 ) n t α, ) π t 0(1 π 0 ) n t > α. (3.3) 15

Testuje-li se hypotéza H 0 : π = π 0 proti levostranné alternativě H 1 : π < π 0, kde π 0 je pevná hodnota z intervalu (0, 1), určíme kritický obor jako množinu W α = {X = x; x c}, kde c splňuje P π0 (X c) = t=0 c+1 P π0 (X c + 1) = c ( n t ( n t t=0 ) π t 0(1 π 0 ) n t α, ) π t 0(1 π 0 ) n t > α. (3.4) Čísla c 1 a c se spočítají jako c 1 = x α 1, (3.5) c = x 1 α + 1, (3.6) kde x α, x 1 α jsou příslušné kvantily binomického rozdělení. Tyto závislosti vycházejí ze vztahů (3.1) a (3.) a definice kvantilů. U jednostranných testů číslo c spočteme analogicky. V případě pravostranného testu máme v případě levostranného testu pak c = x 1 α + 1, (3.7) c = x α 1. (3.8) Výpočet čísel c 1 a c (resp. c) lze tedy provést pomocí kvantilů binomického rozdělení, lze však také využít souvislosti binomického rozdělení s Fisherovým (viz (1.6)) a situaci tím zjednodušit. Tento případ je rozebrán v odstavci 3.3. 3. Síla testu o parametru π binomického rozdělení Silofunkce testu založeného na kritickém oboru popsaném v odstavci 3.1 má dle odstavce 1.6 tvar pro oboustranný test tvar β α (π) = c 1 t=0 ( ) n π t (1 π) n t + t n t=c ( ) n π t (1 π) n t, π π 0, (3.9) t pro pravostranný test pro levostranný test β α (π) = β α (π) = n t=c c t=0 ( ) n π t (1 π) n t, π > π 0, (3.10) t ( ) n π t (1 π) n t, π < π 0. (3.11) t 16

Jsou-li známa čísla c 1, c (resp. číslo c), která zaručují dodržení hladiny významnosti, lze spočítat hodnotu síly pro libovolné π. Příklad: Mějme náhodný výběr rozsahu n = 100 z rozdělení A(π). Testujme hypotézu H 0 : π = π 0 proti oboustranné alternativě H 1 : π π 0 pro π 0 = 0, 5 na hladině významnosti α = 0, 05. Ze vztahů (3.5) a (3.6) se spočítá, že c 1 = 39, c = 61, čímž se zaručí splnění nerovnic (3.1) a (3.): P 0,5 (x 39) = P 0,5 (x 61) = 0, 0176 < 0, 05 = α, P 0,5 (x 40) = P 0,5 (x 60) = 0, 084 > 0, 05 = α. Kritický obor založený na statistice X = n i=1 X i (viz odstavec 3.1) je pak tvaru W α = {x = n x i ; x 39, x 61}, i=1 Hodnoty silofunkce tohoto testu spočtené dle vzorce (3.9) jsou pro názornost uvedeny v tabulce 3.1. Silofunkce je znázorněna na obrázku 3.1. Analogický postup se provede u jednostranných testů. V případě pravostranné alternativy je dle (3.7) kritický obor W α = {x = n x i ; x 59} i=1 (obrázek 3.(a)), u testování levostranné alternativy pak dle (3.8) W α = {x = n x i ; x 41} i=1 (obrázek 3.(b)). 1 H 0 : π = π 0 = 0.5, H 1 : π π 0, α = 0.05, n = 100 0.9 0.8 0.7 0.6 β( π ) 0.5 0.4 0.3 0. 0.1 0.035 0 0.1 0. 0.3 0.4 0.5 0.6 0.7 0.8 0.9 π Obr. 3.1: Silofunkce oboustranného testu 17

Tabulka 3.1: Hodnoty silofunkce oboustranného testu H 0 : π = π 0 = 0, 5, H 1 : π π 0 na hladině významnosti α = 0, 05 π 0.1 0. 0.3 0.4 0.5 0.6 0.7 0.8 0.9 β(π) 1.000 1.000 0.979 0.461 0.035 0.461 0.979 1.000 1.000 1 H 0 : π = π 0 = 0.5, H 1 : π π 0, α = 0.05, n = 100 1 H 0 : π = π 0 = 0.5, H 1 : π π 0, α = 0.05, n = 100 0.9 0.9 0.8 0.8 0.7 0.7 0.6 0.6 β( π ) 0.5 β( π ) 0.5 0.4 0.4 0.3 0.3 0. 0. 0.1 0.0443 0 0.1 0. 0.3 0.4 0.5 0.6 0.7 0.8 0.9 π (a) Pravostranný test 0.1 0.0443 0 0.1 0. 0.3 0.4 0.5 0.6 0.7 0.8 0.9 π (b) Levostranný test Obr. 3.: Silofunkce jednostranných testů 3.3 Explicitní vyjádření intervalu spolehlivosti pro parametr π binomického rozdělení Test hypotézy o parametru π binomického rozdělení se dá provést pomocí intervalu spolehlivosti pro π. Označme tento test dále jako F-test. Věta 3.3.1. Necht náhodná veličina X Bi(n, π). Pak 100(1 α)-procentním intervalem spolehlivosti pro parametr π je interval π D < π < π H, kde π H = π D = (X + 1)F 1 α1 ( (X + 1), (n X)) n X + (X + 1)F 1 α1 ((X + 1),(n X)), (3.1) X (n X + 1)F 1 α ( (n X + 1), X) + X, (3.13) přičemž F 1 α1 (ν 1, ν ) je (1 α 1 )-kvantil F-rozdělení o ν 1 = (X + 1), ν = (n X) stupních vonosti a F 1 α (ν 3, ν 4 ) je (1 α )-kvantil F-rozdělení o ν 3 = (n X + 1), ν 4 = X stupních volnosti. 18

Důkaz. Krajní meze π D a π H intervalu se naleznou řešením rovnic x ( ) n π t t H(1 π H ) n t = α 1 (3.14) a n t=x t=0 ( ) n π t t D(1 π D ) n t = α, kde α 1 + α = α. (3.15) Z důkazu věty 1.3. je známo, že x ( ) ( n α 1 = π t t H(1 π H ) n t = P Y < x + 1 n x 1 π ) H π H t=0, kde Y F( (n x), (x+1)). Za využití kvantilů F-rozdělení lze tedy po následujících úpravách vyjádřit horní krajní bod intervalu spolehlivosti ve tvaru (3.1). x + 1 n x 1 π H 1 = F α1 ((n x), (x + 1)) = π H F 1 α1 ((x + 1),(n x)) x + 1 xπ H π H 1 = (n x)π H F 1 α1 ((x + 1), (n x)) x + 1 (x + 1)π H π H = n x F 1 α1 ((x + 1),(n x)) F 1 α1 ((x + 1), (n x)) (x + 1) F 1 α1 ((x + 1), (n x)) (x + 1)π H = π H (n x) F 1 α1 ((x + 1), (n x)) (x + 1) = π H (n x + F 1 α1 ((x + 1),(n x)) (x + 1)) π H = (x + 1)F 1 α1 ((x + 1), (n x)) n x + (x + 1)F 1 α1 ((x + 1),(n x)) Dolní krajní bod nalezneme obdobně. Nejdříve se rovnice (3.15) převede na tvar x 1 ( ) n π t t D(1 π D ) n t = 1 α. t=0 Dále se využije vztah (1.4) pro distribuční funkci rozdělení F v t=0 = t=0 ( ) n π t t D(1 π D ) n t = 1 B(n v, v + 1) ( ) n v v+1 n v 1 π D ( n v π D y n v 1 1 + n v ) n 1 v + 1 0 v + 1 y dy Dosazením substituce v = x 1 se dostane x 1 ( ) n π t t D(1 π D ) n t = = 1 B(n x + 1, x) ( n x + 1 x ) n x+1 x n x+1 1 π D π D 0 19 ( y n x 1 + n x + 1 n 1 y) dy. x

Porovnáním se vztahem (1.4) pro hustotu F rozdělení se získá vyjádření x 1 1 α = t=0 kde Y F (n x+1),x. Tedy ( ) ( n π t t D(1 π D ) n t = P Y < x n x + 1 1 π ) D, π D x n x + 1 1 π D = F 1 α ((n x + 1), x) π D (n x + 1) π D F 1 α ((n x + 1), x) = x xπ D, odkud po úpravě se dostane tvar (3.15) dolního krajního bodu intervalu spolehlivosti binomického rozdělení π D = x (n x + 1)F 1 α ((n x + 1), x) + x. Platnost hypotézy H 0 : π = π 0 se proti oboustranné alternativě či jednostranným alternativám testuje na základě příslušnosti parametru π 0 k uvedenému intervalu spolehlivosti π D, π H dle odstavce 1.7. Je možné také použít upravenou verzi tohoto testu, kdy se v případě oboustranné alternativy H 1 : π π 0 testuje, zda nebo X n X + 1 1 π 0 π 0 X + 1 n X 1 π 0 π 0 U pravostranné alternativy H 1 : π > π 0 se pak zjišt uje, zda F 1 α ((n X + 1), X) (3.16) F α ((n X), (X + 1)). (3.17) X n X + 1 1 π 0 π 0 F 1 α ((n X + 1), X), (3.18) a u levostranné alternativy H 1 : π < π 0 se hodnotí nerovnost X + 1 n X 1 π 0 π 0 F α ((n X), (X + 1)). (3.19) 3.4 Síla testu využívajícího Fisherovy kvantily Následující výsledky byly získány pomocí opakovaných testů na simulovaných výběrech přímo generovaných z binomického rozdělení, přičemž hodnoty silofunkcí byly určeny jako podíl zamítnutých hypotéz H 0 ku celkovému počtu opakování při dané hodnotě π a π 0. Příslušné funkce pro simulace i pro vykreslování silofunkcí dle teoreticky odvozených 0

1 H 0 : π = π 0 = 0.5, H 1 : π π 0, α = 0.05 0.9 0.8 0.7 0.6 β( δ ) 0.5 0.4 0.3 0. 0.1 n = 10 n = 15 n = 0 n = 5 n = 30 n = 50 n = 100 0 0.4 0.3 0. 0.1 0 0.1 0. 0.3 0.4 0.5 δ = π π 0 Obr. 3.3: Silofunkce oboustranného F-testu pro různá n Tabulka 3.: Hodnoty silofunkcí oboustranného F-testu pro různá n, H 0 : π = π 0 = 0, 5, H 1 : π π 0 na hladině významnosti α = 0, 05 π 0.1 0. 0.3 0.4 0.5 0.6 0.7 0.8 0.9 n = 10 0.73 0.376 0.153 0.049 0.09 0.036 0.141 0.383 0.748 n = 15 0.960 0.669 0.96 0.091 0.036 0.097 0.81 0.651 0.9 n = 0 0.987 0.801 0.415 0.098 0.044 0.117 0.41 0.798 0.988 β(π) n = 5 0.996 0.881 0.515 0.147 0.044 0.166 0.511 0.889 0.999 n = 30 1.000 0.96 0.595 0.176 0.034 0.177 0.595 0.96 1.000 n = 50 1.000 0.991 0.785 0.48 0.035 0.5 0.766 0.996 1.000 n = 100 1.000 1.000 0.985 0.49 0.035 0.476 0.976 1.000 1.000 vzorců naprogramované v prostředí MATLAB jsou uvedeny v příloze P (toto bude platit i dále). Nejprve se zabývejme srovnáním silofunkcí testu pro různé rozsahy výběrů n. Testujme hypotézu H 0 : π = π 0 = 0, 5 proti alternativě H 1 : π π 0 na hladině významnosti α = 0, 05. Volme rozsah výběru n = 10, 15, 0, 5, 30, 50 a 100. Z obrázku 3.3, kde jsou silofunkce získané simulacemi vyznačeny tečkovaně a teoretické silofunkce spočítané dle kapitoly 3. zakreslené plnou čarou, je patrná dobrá shoda obou těchto typů silofunkcí. Dále je zřejmé i z tabulky 3., že největších hodnot silofunkce β(π) dosahuje test při volbě rozsahu n = 100, kdy β(π) nabývá hodnot blízkých 1 již při π = 0, 3 a π = 0, 7, u rozsahu n = 50 toto nastává až u π = 0, a π = 0, 8. Je zde patrná obecná vlastnost silofunkcí, a to, že s rostoucím n roste i síla testu. Také se ukázalo, 1

1 H 0 : π = π 0, H 1 : π π 0, α = 0.05, n = 100 0.9 0.8 0.7 0.6 β( δ ) 0.5 0.4 0.3 0. 0.1 π = 0.1 0 π = 0. 0 π = 0.3 0 π = 0.4 0 π = 0.5 0 0 0 0.05 0.1 0.15 0. 0.5 0.3 δ = π π 0 Obr. 3.4: Silofunkce oboustranného F-testu pro různá π 0 že test je pro všechna n podhodnocený, tj. hodnota β(π 0 ) nedosahuje stanovené hladiny významnosti α = 0, 05. Tento fakt je způsoben tím, že jsou výběry z diskrétního rozdělení, distribuční funkce není spojitá. Nejvíce se hodnota silofunkce blíží k hladině významnosti α = 0, 05 pro rozsah n = 0 a n = 5, kdy β(0, 5) = 0, 044, nejméně pak pro n = 10, kdy β(0, 5) = 0, 09. Nyní pro stejný test zadáme pevný rozsah n = 100 a pro hypotézu H 0 : π = π 0 proti alternativě H 1 : π π 0 volíme parametr π 0 = 0, 1; 0, ; 0, 3; 0, 4 a 0, 5. Z obrázku 3.4 je patrné, že síla testu závisí rovněž na volbě parametru π 0. Ukázalo se, že nejsilnější je test pro π 0 = 0, 1 a že s rostoucím parametrem π 0 jeho síla klesá. Rozdíl je zřejmý také z tabulky 3.3, odkud lze vyčíst, že pro parametr π = π 0 + 0, 1 je hodnota β(π) rovna 0, 83 u volby π 0 = 0, 1, přičemž u volby π 0 = 0, 5 je již síla rovna jen 0, 504. Test je opět podhodnocený, tzn. hodnota β(π 0 ) ani v jednom případě nedosahuje hladiny významnosti α = 0, 05. 3.5 Test založený na normální aproximaci Jako další testovací kriterium lze dle odstavce 1.4 použít statistiku U = X nπ 0 nπ0 (1 π 0 ). (3.0) Testujeme-li hypotézu H 0 : π = π 0 proti oboustranné alternativě H 1 : π π 0, kritickým oborem jsou všechna U, pro něž platí U u 1 α, kde u 1 α je kvantil normovaného

Tabulka 3.3: Hodnoty silofunkcí oboustranného F-testu pro různá π 0, n = 100, H 0 : π = π 0, H 1 : π π 0 na hladině významnosti α = 0, 05 π 0.1 0. 0.3 0.4 0.5 0.6 0.7 0.8 0.9 π 0 = 0.1 0.033 0.83 0.998 1.000 1.000 1.000 1.000 1.000 1.000 π 0 = 0. 0.716 0.036 0.633 0.994 1.000 1.000 1.000 1.000 1.000 β(π) π 0 = 0.3 1.000 0.543 0.041 0.533 0.986 1.000 1.000 1.000 1.000 π 0 = 0.4 1.000 0.989 0.549 0.041 0.459 0.97 1.000 1.000 1.000 π 0 = 0.5 1.000 1.000 0.979 0.467 0.09 0.504 0.981 1.000 1.000 normálního rozdělení. V případě pravostranné alternativy H 1 : π > π 0 zamítáme hypotézu H 0 při platnosti U u 1 α, u levostranné alternativy H 1 : π < π 0 zamítáme hypotézu H 0, je-li U u 1 α. Označme dále tento test založený na aproximaci normálním rozdělením jako U-test. kde Jako testovací kriterium pro oboustranný test lze také využít upravenou statistiku s π = U = U s π, 1 DX = 1 nπ(1 π) je korekce na spojitost (viz [7]). Pak je tedy testovací kriterium tvaru U = X nπ 0 1 nπ0 (1 π 0 ). (3.1) V případě jednostranných testů se využívá statistika U = U s π = X nπ 0 1 nπ0 (1 π 0 ). (3.) Kritické obory se stanoví analogicky jako u testovací statistiky U. Označme tento test s korekcí na spojitost jako U -test. 3.6 Síla testu založeného na normální aproximaci Věta 3.6.1. Silofunkce kritického oboru testu využívajícího statistiku U (viz (3.0)) má přesný tvar pro oboustranný test β α (π) = j k u 1 α nπ0 (1 π 0 )+nπ 0 1 l m x= u α nπ0 (1 π 0 )+nπ 0 +1 3 ( ) n π x (1 π) n x, π π 0, (3.3) x

pro pravostranný test β α (π) = pro levostranný test β α (π) = n l m x= u α nπ0 (1 π 0 )+nπ 0 +1 j k u 1 α nπ0 (1 π 0 )+nπ 0 1 x=0 ( ) n π x (1 π) n x, π < π 0, (3.4) x ( ) n π x (1 π) n x, π > π 0. (3.5) x Důkaz. Důkaz věty je založen na využití vyjádření silofunkce pro test o parametru binomického rozdělení: β α (π) = 1 P π (a < X < b) = b 1 x=a+1 β α (π) = P π (U u 1 α ) ( X nπ 0 =P π nπ0 (1 π 0 ) u 1 α = 1 P π (u α < X nπ 0 nπ0 (1 π 0 ) < u 1 α = 1 P π (u α = ( ) n π x (1 π) n x, π π 0 x ) ) ) nπ0 (1 π 0 ) + nπ 0 < X < u 1 α nπ0 (1 π 0 ) + nπ 0 j k u 1 α nπ0 (1 π 0 )+nπ 0 1 l m x= u α nπ0 (1 π 0 )+nπ 0 +1 ( ) n π x (1 π) n x x 4

Poznámka. Silofunkci kritického oboru testu využívajícího statistiku U lze kvůli zjednodušení i aproximovat. Po jednoduchém výpočtu (viz [15]) dostaneme β α (π) = P π (U u 1 α ) ( X nπ 0 =P π nπ0 (1 π 0 ) u 1 α = 1 P π (u α < X nπ 0 nπ0 (1 π 0 ) < u 1 α = 1 P π (u α < u 1 α ( (. = 1 Φ u 1 α (. = Φ u α ( Φ u α + Φ ) ) π0 (1 π 0 ) π(1 π) n(π π 0) nπ(1 π) < π0 (1 π 0 ) n(π π ) 0) π(1 π) nπ(1 π) π0 (1 π 0 ) n(π π ) 0) π(1 π) nπ(1 π) π0 (1 π 0 ) n(π π )) 0) π(1 π) nπ(1 π) ) π0 (1 π 0 ) + π π 0 n π(1 π) π(1 π) ( u α π0 (1 π 0 ) π(1 π) + ) π 0 π n π(1 π) X nπ nπ(1 π) Tedy pro oboustranný test obdržíme aproximaci ve tvaru ( ) β α (π) =. π π 0 π Φ 0 (1 π 0 ) n + u α π(1 π) π(1 π) ( π 0 π π + Φ 0 (1 π 0 ) n + u α π(1 π) π(1 π) ), π π 0, (3.6) pro pravostranný test pro levostranný test β α (π). = Φ β α (π). = Φ ( π π 0 π 0 (1 π 0 ) n + uα π(1 π) π(1 π) ( π 0 π π 0 (1 π 0 ) n + uα π(1 π) π(1 π) ) ), π < π 0, (3.7), π > π 0, (3.8) kde Φ(x) je distribuční funkce standardizovaného normálního rozdělení N(0, 1). 5

V dalším textu bude používáno označení teoretické silofunkce pro tvary silofunkcí získané aproximací. Testujme hypotézu H 0 : π = π 0 = 0, 5 proti alternativě H 1 : π π 0 na hladině významnosti α = 0, 05. Rozsah náhodného výběru volme n = 0, 30, 40, 50, 60, 80 a 100. V obrázku 3.5 jsou zakresleny plnou čarou teoretické silofunkce spočítané pomocí výše uvedených vzorců a ptečkovaně silofunkce získané simulacemi. Ze zmíněného obrázku a tabulky 3.4 je patrné, že s rostoucím n roste i síla testu pro daný parametr π, zároveň se ale rozdíly mezi silami změnšují. Hodnot blízkých 1 dosahují silofunkce pro rozsahy n > 30 v bodech π = 0, a π = 0, 8, pro rozsahy n > 60 již v bodech π = 0, 3 a π = 0, 7. Pro všechny volby n je hodnota silofunkce β(π 0 ) velmi blízká hladině významnosti α = 0, 05. 1 H 0 : π = π 0 = 0.5, H 1 : π π 0, α = 0.05 0.9 0.8 0.7 0.6 β( π ) 0.5 0.4 0.3 0. 0.1 n = 0 n = 30 n = 40 n = 50 n = 60 n = 80 n = 100 0.3 0. 0.1 0 0.1 0. 0.3 0.4 0.5 δ = π π 0 Obr. 3.5: Silofunkce oboustranného U-testu pro různá n Tabulka 3.4: Hodnoty silofunkcí oboustranného U-testu pro různá n, H 0 : π = π 0 = 0, 5, H 1 : π π 0 na hladině významnosti α = 0, 05 π 0.1 0. 0.3 0.4 0.5 0.6 0.7 0.8 0.9 n = 0 0.987 0.813 0.410 0.18 0.045 0.15 0.419 0.810 0.99 n = 30 1.000 0.937 0.579 0.178 0.050 0.177 0.64 0.949 1.000 n = 40 1.000 0.98 0.703 0.0 0.037 0.0 0.710 0.984 1.000 β(π) n = 50 1.000 0.998 0.853 0.35 0.048 0.316 0.847 0.998 1.000 n = 60 1.000 0.996 0.898 0.337 0.048 0.345 0.899 1.000 1.000 n = 80 1.000 1.000 0.968 0.46 0.058 0.45 0.961 1.000 1.000 n = 100 1.000 1.000 0.981 0.58 0.053 0.538 0.98 1.000 1.000 6

Nyní porovnáme silofunkce stejného testu pro různou volbu parametru π 0 hypotézy H 0. Mějme náhodný výběr z binomického rozdělení o rozsahu n = 100 a necht π 0 = 0, 1; 0, ; 0, 3; 0, 4 a 0, 5. Výsledky simulací jsou znázorněny v obrázku 3.6 a tabulce 3.5. Test je pro všechny volby π 0 (až na π 0 = 0, 4) nadhodnocený, tj. hodnota silofunkce v daném bodě π 0 převyšuje hladinu významnosti α = 0, 05, největší rozdíl je u parametru π 0 = 0, 1, kdy β(π 0 ) je rovna 0, 07. Tabulka 3.5: Hodnoty silofunkcí oboustranného U-testu pro různá π 0, n = 100, H 0 : π = π 0 = 0, 5, H 1 : π π 0 na hladině významnosti α = 0, 05 π 0.1 0. 0.3 0.4 0.5 0.6 0.7 0.8 0.9 π 0 = 0.1 0.070 0.876 0.999 1.000 1.000 1.000 1.000 1.000 1.000 π 0 = 0. 0.81 0.065 0.707 0.993 1.000 1.000 1.000 1.000 1.000 β(π) π 0 = 0.3 1.000 0.654 0.061 0.607 0.989 1.000 1.000 1.000 1.000 π 0 = 0.4 1.000 0.997 0.537 0.05 0.544 0.981 1.000 1.000 1.000 π 0 = 0.5 1.000 1.000 0.988 0.555 0.06 0.541 0.989 1.000 1.000 1 H 0 : π = π 0, H 1 : π π 0, α = 0.05, n = 100 0.9 0.8 0.7 0.6 β( π ) 0.5 0.4 0.3 0. 0.1 π = 0.1 0 π = 0. 0 π = 0.3 0 π = 0.4 0 π = 0.5 0 0 0 0.05 0.1 0.15 0. 0.5 0.3 δ = π π 0 Obr. 3.6: Silofunkce oboustranného U-testu pro různá π 0 Věta 3.6.. Silofunkce kritického oboru testu využívajícího statistiku U (viz (3.)) má přesný tvar pro oboustranný test β α (π) = ju 1 α nπ0 (1 π 0 )+nπ 0 + 1 1 k m x= lu α nπ0 (1 π 0 )+nπ 0 + 1 +1 7 ( ) n π x (1 π) n x, π π 0, (3.9) x

pro pravostranný test β α (π) = pro levostranný test β α (π) = n m x= lu α nπ0 (1 π 0 )+nπ 0 + 1 +1 ju 1 α nπ0 (1 π 0 )+nπ 0 + 1 1 k x=0 ( ) n π x (1 π) n x, π < π 0, (3.30) x ( ) n π x (1 π) n x, π > π 0. (3.31) x Důkaz. Věta se dokáže analogicky jako věta 3.6.1. Poznámka. Aproximace silofunkce kritického oboru testu využívajícího statistiku U má pro oboustranný test tvar ) nπ nπ0 β α (π) =Φ( 1 π 0 (1 π 0 ) + u α nπ(1 π) π(1 π) ( nπ0 nπ 1 + Φ + u α nπ(1 π) π 0 (1 π 0 ) π(1 π) ),π π 0, (3.3) pro pravostranný test pro levostranný test ( nπ nπ0 1 π β α (π) = Φ 0 (1 π 0 ) + u α nπ(1 π) π(1 π) ( nπ0 nπ 1 π β α (π) = Φ 0 (1 π 0 ) + u α nπ(1 π) π(1 π) ) ), π < π 0, (3.33), π > π 0, (3.34) kde Φ(x) je distribuční funkce standardizovaného normálního rozdělení N(0, 1). Pro srovnání silofunkcí zopakujeme u testu využívajícího upravenou testovací statistiku U stejný postup simulací jako dříve. Mějme tedy hypotézu H 0 : π = π 0 = 0, 5 proti alternativě H 1 : π π 0 na hladině významnosti α = 0, 05. Volme opět rozsah souboru n = 0, 30, 40, 50, 60, 80 a 100. Jak dokazuje tabulka 3.6 i obrázek 3.7, kde jsou teoretické silofunkce zakresleny opět plnou čarou, test je pro všechna n > 30 velmi podhodnocený, například pro n = 60 je hodnota silofunkce β(π 0 ) rovna pouze 0, 01. Test je tedy vhodný pro malé rozsahy n. Velká podhodnocennost testu se nemění, ani když volíme různé hodnoty parametru π 0, tedy π 0 = 0, 1; 0, ; 0, 3; 0, 4 a 0, 5 při fixním rozsahu výběru n = 100 (viz tabulka 3.7, obrázek 3.8). 8

1 H 0 : π = π 0 = 0.5, H 1 : π π 0, α = 0.05 0.9 0.8 0.7 0.6 β( π ) 0.5 0.4 0.3 0. 0.1 0 n = 0 n = 30 n = 40 n = 50 n = 60 n = 80 n = 100 0.3 0. 0.1 0 0.1 0. 0.3 0.4 0.5 δ = π π 0 Obr. 3.7: Silofunkce oboustranného U -testu pro různá n Tabulka 3.6: Hodnoty silofunkcí oboustranného U -testu pro různá n, H 0 : π = π 0 = 0, 5, H 1 : π π 0 na hladině významnosti α = 0, 05 π 0.1 0. 0.3 0.4 0.5 0.6 0.7 0.8 0.9 n = 0 0.993 0.80 0.418 0.116 0.041 0.133 0.433 0.790 0.996 n = 30 1.000 0.946 0.564 0.165 0.046 0.178 0.570 0.945 0.999 n = 40 1.000 0.985 0.696 0.4 0.034 0.188 0.691 0.984 1.000 β(π) n = 50 1.000 0.995 0.78 0.34 0.04 0.51 0.784 0.99 1.000 n = 60 1.000 0.998 0.831 0.43 0.01 0.67 0.849 0.998 1.000 n = 80 1.000 1.000 0.959 0.371 0.03 0.36 0.933 1.000 1.000 n = 100 1.000 1.000 0.978 0.454 0.03 0.441 0.979 1.000 1.000 Tabulka 3.7: Hodnoty silofunkcí oboustranného U -testu pro různá π 0, n = 100, H 0 : π = π 0 = 0, 5, H 1 : π π 0 na hladině významnosti α = 0, 05 π 0.1 0. 0.3 0.4 0.5 0.6 0.7 0.8 0.9 π 0 = 0.1 0.07 0.809 0.999 1.000 1.000 1.000 1.000 1.000 1.000 π 0 = 0. 0.708 0.033 0.606 0.989 1.000 1.000 1.000 1.000 1.000 β(π) π 0 = 0.3 0.999 0.555 0.05 0.53 0.978 1.000 1.000 1.000 1.000 π 0 = 0.4 1.000 0.989 0.461 0.06 0.471 0.978 1.000 1.000 1.000 π 0 = 0.5 1.000 1.000 0.989 0.468 0.038 0.453 0.974 1.000 1.000 9

1 H 0 : π = π 0, H 1 : π π 0, α = 0.05, n = 100 0.9 0.8 0.7 0.6 β( π ) 0.5 0.4 0.3 0. 0.1 π = 0.1 0 π 0 = 0. π = 0.3 0 π = 0.4 0 π = 0.5 0 0 0 0.05 0.1 0.15 0. 0.5 δ = π π 0 Obr. 3.8: Silofunkce oboustranného U -testu pro různá π 0 Srovnání testu využívajícího statistiku U a testu s upravenou statistikou U je pro různá n demonstrováno na obrázku 3.9, kde jsou pomocí simulací vykresleny silofunkce pro testování hypotézy H 0 : π = π 0 = 0, 5 proti oboustranné alternativě na hladině významnosti α = 0, 05. Silofunkce U-testu je znázorněna plnou čarou a silofunkce U pomocí teček. Ukázalo se, že tyto dvě varianty testu založeného na aproximaci normálním rozdělením se neliší pro n 49, ovšem u volby rozsahu n = 50 jsou již patrné rozdíly. Jak lze vyčíst z tabulky 3.8 (kde označuje druhou variantu testu), nejvíce se tyto dva testy liší pro parametr π = 0, 5, kdy je hodnota silofunkce β(0, 5) U-testu rovna 0, 067 a U -testu jen 0, 09. Je zřejmé, že je lépe využívat upravené statistiky U, protože tento test je stále na předepsané hladině významnosti α = 0, 05, na rozdíl od testu založeného na statistice U. Tabulka 3.8: Hodnoty silofunkcí U-testu a U -testu pro různá n, H 0 : π = π 0 = 0, 5, H 1 : π π 0 na hladině významnosti α = 0, 05 π 0.1 0. 0.3 0.4 0.5 0.6 0.7 0.8 0.9 n = 50 1.000 1.000 0.855 0.345 0.067 0.331 0.853 0.995 1.000 β(π) n = 100 1.000 1.000 0.988 0.566 0.06 0.5 0.989 1.000 1.000 n = 50 1.000 0.996 0.777 0.53 0.09 0.40 0.765 0.99 1.000 n = 100 1.000 1.000 0.981 0.484 0.037 0.44 0.980 1.000 1.000 30

1 H 0 : π = π 0 = 0.5, H 1 : π π 0 0.9 0.8 0.7 0.6 β( π ) 0.5 0.4 0.3 0. 0.1 U: U*: n = 30 n = 40 n = 49 n = 50 n = 100 n = 30 n = 40 n = 49 n = 50 n = 100 0 0.4 0.3 0. 0.1 0 0.1 0. 0.3 0.4 0.5 δ = π π 0 Obr. 3.9: Srovnání silofunkcí oboustranné varianty U-testu a U -testu pro různá n, H 0 : π = π 0 = 0, 5, H 1 : π π 0 na hladině významnosti α = 0, 05 3.7 Testy založené na arcussinové transformaci Pro testy hypotéz o parametru π binomického rozdělení lze využít také statistiky získané arcussinovou transformací (viz odstavec 1.5.1) U 1 = ( x n arcsin n arcsin ) π 0, (3.35) U = ( ) 8x + 3 4n + arcsin 8n + 6 arcsin 8nπ0 + 3. (3.36) 8n + 6 Vyhodnocení oboustranných (popř. jednostranných) testů (ozn. U 1 -test, U -test) se provede analogicky jako v odstavci 3.5. 3.8 Síla testů založených na arcsin-transformaci Věta 3.8.1. Silofunkce kritického oboru testu využívajícího statistiku U 1 (viz (3.35)) má přesný tvar pro oboustranný test β α (π) = pro pravostranný test β α (π) = u1 nsin α n +arcsin «π 0 1 u α x= nsin n +arcsin «ı π 0 +1 n u α x= nsin n +arcsin «ı π 0 +1 31 ( ) n π x (1 π) n x, π π 0, (3.37) x ( ) n π x (1 π) n x, π < π 0, (3.38) x

pro levostranný test β α (π) = u1 nsin α n +arcsin «π 0 x=0 1 ( ) n π x (1 π) n x, π > π 0. (3.39) x Důkaz. Důkaz věty se provede analogicky jako u věty 3.6.1, tedy β α (π) = P π ( ( ) ) X n arcsin n arcsin π 0 u 1 α ( ( u = 1 P π n sin α n + arcsin ) ( u1 π 0 < X < n sin α n + arcsin )) π 0 = u1 nsin α n +arcsin «π 0 1 u α x= nsin n +arcsin «ı π 0 +1 ( ) n π x (1 π) n x x Poznámka. Silofunkci kritického oboru testu využívajícího statistiku U 1 lze vyjádřit také v aproximovaném tvaru. Jednoduchým odvozením dostaneme β α (π) =P π (U 1 u 1 α π = π 0) =P π ( ( ) X n arcsin n arcsin π 0 ( = 1 P π (u α < n arcsin u 1 α X n arcsin π 0 = 1 P π (u α n ( arcsin π arcsin ) π 0 < ( X n arcsin n arcsin ) π < u 1 α n(arcsin π arcsin π 0 )) = 1 (Φ(u 1 α n(arcsin π arcsin π 0 )) Φ(u α n(arcsin π arcsin π 0 ))) = Φ(u α + n(arcsin π arcsin π 0 )) + Φ(u α + n(arcsin π 0 arcsin π)) Tedy aproximací obdržíme pro oboustranný test tvar ) ) < u 1 α ) β(π) = Φ ( u α + n ( arcsin π arcsin π 0 )) + + Φ ( u α + n ( arcsin π 0 arcsin π )), π π 0, (3.40) 3

pro pravostranný test pro levostranný test β(π) = Φ ( u α + n ( arcsin π arcsin π 0 )), π < π0, (3.41) β(π) = Φ ( u α + n ( arcsin π 0 arcsin π )), π > π 0, (3.4) kde Φ(x) je distribuční funkce standardizovaného normálního rozdělení N(0, 1). Testujme hypotézu H 0 : π = π 0 = 0, 5 proti alternativě H 1 : π π 0 na hladině významnosti α = 0, 05 pomocí testovací statistiky U 1. Rozsah náhodného výběru volme n = 0, 30, 40, 50, 60, 80 a 100. Výsledné silofunkce získané pomocí simulací jsou zakresleny tečkovaně v obrázku 3.10, teoretické silofunkce jsou znázorněny plnou čarou. Hodnoty silofunkcí v bodě π 0 se pohybují nad i pod hladinou významnosti α. Nejvíce podhodnocený a zároveň nejslabší je test výběru o rozsahu n = 0, kdy hodnota silofunkce β(π) v bodě π = 0, je rovna 0, 799, zatím co pro rozsah n = 30 je již β(0, ) = 0, 954. 1 H 0 : π = π 0 = 0.5, H 1 : π π 0, α = 0.05 0.9 0.8 0.7 0.6 β( π ) 0.5 0.4 0.3 0. 0.1 n = 0 n = 30 n = 40 n = 50 n = 60 n = 80 n = 100 0 0.4 0.3 0. 0.1 0 0.1 0. 0.3 0.4 0.5 δ = π π 0 Obr. 3.10: Silofunkce oboustranného U 1 -testu pro různá n Pro porovnání závislosti silofunkcí na volbě parametru π 0 zafixujme rozsah náhodného výběru na hodnotě n = 100 a testujme hypotézu H 0 : π = π 0 proti alternativě H 1 : π π 0 na hladině významnosti α = 0, 05 pro parametr π 0 = 0, 1; 0, ; 0, 3; 0, 4 a 0, 5. Jak lze vyčíst z obrázku 3.11 i tabulky 3.10, silofunkce testu si jsou velmi podobné pro volbu parametru π 0 = 0, 3; 0, 4; 0, 5, nejvíce se pak odlišuje silofunkce získaná volbou π 0 = 0, 1. Tento rozdíl je patrný zejména v bodě π = π 0 + 0, 1, kdy se hodnota silofunkce β(π) pro volby parametru π 0 = 0, 3; 0, 4; 0, 5 pohybuje v rozmezí od 0, 518 do 0, 633, 33

Tabulka 3.9: Hodnoty silofunkcí oboustranného U 1 -testu pro různá n, H 0 : π = π 0 = 0, 5, H 1 : π π 0 na hladině významnosti α = 0, 05 π 0.1 0. 0.3 0.4 0.5 0.6 0.7 0.8 0.9 n = 0 0.987 0.799 0.433 0.139 0.039 0.17 0.413 0.8 0.991 n = 30 1.000 0.954 0.580 0.184 0.046 0.169 0.543 0.943 0.999 n = 40 1.000 0.980 0.70 0.13 0.046 0.08 0.700 0.985 1.000 β(π) n = 50 1.000 0.998 0.865 0.341 0.068 0.35 0.866 0.997 1.000 n = 60 1.000 1.000 0.896 0.367 0.048 0.368 0.894 1.000 1.000 n = 80 1.000 1.000 0.978 0.458 0.058 0.464 0.959 1.000 1.000 n = 100 1.000 1.000 0.988 0.546 0.065 0.555 0.987 1.000 1.000 zatím co pro volbu π 0 = 0, 1 je β(π) = 0, 813. Ovšem již v bodě π = π 0 + 0, se hodnoty β(π) pro všechny volby parametru π 0 blíží k hodnotě 1 tak, že pravděpodobnosti 1 β chyby II. druhu pro jednotlivé volby parametru se liší maximálně jen o, %. Také je patrné, že síla testu v bodě π 0 se s roustoucím π 0 zvětšuje. 1 H 0 : π = π 0, H 1 : π π 0, α = 0.05,n = 100 0.9 0.8 0.7 0.6 β( π ) 0.5 0.4 0.3 0. 0.1 π = 0.1 0 π = 0. 0 π = 0.3 0 π = 0.4 0 π = 0.5 0 0 0 0.05 0.1 0.15 0. 0.5 δ = π π 0 Obr. 3.11: Silofunkce oboustranného U 1 -testu pro různá π 0 Věta 3.8.. Silofunkce kritického oboru testu využívajícího statistiku U (viz (3.36)) má přesný tvar pro oboustranný test β α (π) = u1 8n+6 sin α q 8nπ0 +3 8 4n+ +arcsin «38 8n+6 1 u α 8n+6 x= sin 8 4n+ +arcsin q ı 8nπ0 +3 «38 8n+6 +1 34 ( ) n π x (1 π) n x, π π 0, (3.43) x

Tabulka 3.10: Hodnoty silofunkcí oboustranného U 1 -testu pro různá π 0, n = 100, H 0 : π = π 0 = 0, 5, H 1 : π π 0 na hladině významnosti α = 0, 05 π 0.1 0. 0.3 0.4 0.5 0.6 0.7 0.8 0.9 π 0 = 0.1 0.041 0.813 0.998 1.000 1.000 1.000 1.000 1.000 1.000 π 0 = 0. 0.809 0.043 0.633 0.989 1.000 1.000 1.000 1.000 1.000 β(π) π 0 = 0.3 1.000 0.647 0.058 0.55 0.987 1.000 1.000 1.000 1.000 π 0 = 0.4 1.000 0.991 0.536 0.056 0.540 0.968 1.000 1.000 1.000 π 0 = 0.5 1.000 1.000 0.986 0.53 0.060 0.518 0.990 1.000 1.000 pro pravostranný test β α (π) = pro levostranný test β α (π) = n u α 8n+6 x= sin 8 4n+ +arcsin 8n+6 8 sin u1 α 4n+ +arcsin x=0 q ı 8nπ0 +3 «38 8n+6 +1 q 8nπ0 +3 «38 8n+6 1 ( ) n π x (1 π) n x, π < π 0, (3.44) x ( ) n π x (1 π) n x, π > π 0. (3.45) x Důkaz. Důkaz věty se provede analogicky jako u věty 3.8.1. Poznámka. Aproximace silofunkce kritického oboru testu využívajícího statistiku U má tvar pro oboustranný test ( β(π) = Φ u α + ( )) π + 3 π 8n 0 + 3 8n 4n + arcsin 1 + 3 arcsin 1 + 3 + + Φ ( pro pravostranný test ( β(π) = Φ pro levostranný test ( β(π) = Φ u α + 4n + u α + 4n + u α + 4n + ( ( ( arcsin arcsin arcsin 4n π 0 + 3 8n 1 + 3 4n π + 3 8n 1 + 3 4n π 0 + 3 8n 1 + 3 4n arcsin arcsin arcsin 4n π + 3 8n 1 + 3 4n π 0 + 3 8n 1 + 3 4n π + 3 8n 1 + 3 4n )) )), π π 0, kde Φ(x) je distribuční funkce standardizovaného normálního rozdělení N(0, 1). 35 )) (3.46), π < π 0, (3.47), π > π 0, (3.48)

Provedeme-li opět testování hypotézy H 0 : π = π 0 = 0, 5 proti alternativě H 1 : π π 0 na hladině významnosti α = 0, 05 pro různé volby rozsahu výběru n tentokrát ovšem pomocí statistiky U (situaci ilustruje obrázek 3.1 a tabulka 3.11), získáme obdobné výsledky jako v případě použití statistiky U 1. Hodnoty silofunkcí β(π = π 0 ) se pohybují nad i pod hladinou významnosti α = 0, 05. 1 H 0 : π = π 0 = 0.5, H 1 : π π 0, α = 0.05 0.9 0.8 0.7 0.6 β( π ) 0.5 0.4 0.3 0. 0.1 0 n = 0 n = 30 n = 40 n = 50 n = 60 n = 80 n = 100 0.3 0. 0.1 0 0.1 0. 0.3 0.4 0.5 δ = π π 0 Obr. 3.1: Silofunkce oboustranného U -testu pro různá n Tabulka 3.11: Hodnoty silofunkcí oboustranného U -testu pro různá n, H 0 : π = π 0 = 0, 5, H 1 : π π 0 na hladině významnosti α = 0, 05 π 0.1 0. 0.3 0.4 0.5 0.6 0.7 0.8 0.9 n = 0 0.989 0.818 0.411 0.18 0.037 0.11 0.407 0.779 0.987 n = 30 1.000 0.930 0.618 0.183 0.046 0.186 0.566 0.940 1.000 n = 40 1.000 0.981 0.688 0.195 0.030 0.18 0.76 0.979 1.000 β(π) n = 50 1.000 0.999 0.86 0.337 0.066 0.34 0.858 0.996 1.000 n = 60 1.000 0.999 0.896 0.333 0.050 0.36 0.899 1.000 1.000 n = 80 1.000 1.000 0.964 0.451 0.065 0.453 0.973 1.000 1.000 n = 100 1.000 1.000 0.988 0.56 0.065 0.564 0.988 1.000 1.000 Obrázek 3.13 a tabulka 3.1 demonstrují simulace testu využívajícího statistiku U pro různou volbu parametru π 0. Silofunkce pro volby π 0 = 0, 3; 0, 4; 0, 5 si jsou opět velmi blízké. Nejsilnější je test při volbě π 0 = 0, 1, výrazný rozdíl je v bodě π = π 0 +0, 1, ovšem silofunkce v bodě π = π 0 + 0, pro všechny volby parametru π 0 se již blíží hodnotě 1. 36

1 H 0 : π = π 0, H 1 : π π 0, α = 0.05, n = 100 0.9 0.8 0.7 0.6 β( π ) 0.5 0.4 0.3 0. 0.1 π 0 = 0.1 π = 0. 0 π 0 = 0.3 π 0 = 0.4 π 0 = 0.5 0 0 0.05 0.1 0.15 0. 0.5 0.3 δ = π π 0 Obr. 3.13: Silofunkce oboustranného U -testu pro různá π 0 Tabulka 3.1: Hodnoty silofunkcí oboustranného U -testu pro různá π 0, n = 100, H 0 : π = π 0 = 0, 5, H 1 : π π 0 na hladině významnosti α = 0, 05 π 0.1 0. 0.3 0.4 0.5 0.6 0.7 0.8 0.9 π 0 = 0.1 0.045 0.805 1.000 1.000 1.000 1.000 1.000 1.000 1.000 π 0 = 0. 0.87 0.047 0.631 0.990 1.000 1.000 1.000 1.000 1.000 β(π) π 0 = 0.3 0.999 0.683 0.060 0.543 0.986 1.000 1.000 1.000 1.000 π 0 = 0.4 1.000 0.997 0.55 0.057 0.530 0.987 1.000 1.000 1.000 π 0 = 0.5 1.000 1.000 0.987 0.540 0.041 0.544 0.988 1.000 1.000 3.9 Volba rozsahu výběru n V rámci plánování senzorického experimentu je nutné stanovit minimální vhodný rozsah souboru n odpovídající předem stanoveným požadavkům, které zahrnují dodržení předepsané chyby II. druhu. Věta 3.9.1. Uvažujme test jednoduché hypotézy H 0 : π = π 0 proti jednoduché alternativě H 1 : π = π 1 na dané hladině významnosti α pomocí testovací statistiky U viz (3.0). Pak rozsah výběru n, při nemž je pravděpodobnost chyby II. druhu nejvýše rovna předem dané hodnotě β, musí splňovat nerovnost n ( u 1 α π0 (1 π 0 ) π(1 π) + u 1 β ) (π π 0 ) π(1 π). (3.49) 37

Při využití upravené testovací statistiky U viz (3.1) je rozsah n určen vztahem n u = π(1 π) ( u 1 α n n u + n u (π π 0 ), kde (3.50) (π π 0 ) ) π 0 (1 π 0 ) π(1 π) + u 1 β + π π 0. Důkaz. Podmínka pro volbu rozsahu n má tvar 1 β α (π) β, tedy ( ) X nπ 0 1 P π nπ0 (1 π 0 ) u 1 α β ( X nπ π P π 0 (1 π 0 ) u 1 α nπ(1 π) u 1 α ) π(1 π) π π 0 n 1 β π(1 π) π 0 (1 π 0 ) π(1 π) π π 0 n = uβ π(1 π) Úpravou dostaneme výraz pro minimální hodnotu rozsahu výběru n = ( u 1 α π0 (1 π 0 ) π(1 π) + u 1 β ) (π π 0 ) π(1 π). Vzorec (3.50) udávající minimální rozsah souboru pro test využívající upravenou statistiku U se odvodí analogicky. Daný problém lze řešit také graficky (popř. numericky). Vykreslí se teoretické silofunkce pro daný test pro různá n na zadané hladině významnosti α a zjistí se, ke které z těchto silofunkcí má zadaný bod o souřadnicích [π π 0 ; β α (π π 0 )] nejblíže. Příklad: Požadujme, aby pro U-test hypotézy H 0 : π = π 0 = 0, 5 na hladině významnosti α = 0, 05 byla pravděpodobnost chyby II. druhu při alternativě H 1 : π = π 1 = 0, 8 menší než β = 0,, tj. aby síla testu v bodě δ = π π 0 = 0, 8 byla větší než 0, 8. Pak dle vzorce 3.49 lze spočítat, že je nutno volit rozsah souboru n 19.61, tedy vhodný minimální rozsah je n = 0. Danou hodnotu lze také odvodit graficky. Na obrázku 3.14(b) jsou v detailu zakresleny teoreticky spočítané silofunkce pro zadanou hladinu α a danou alternativu H 1. Bod o souřadnicích [π π 0 ; β 0,05 (π π 0 )] = [0, 3; 0, 8] leží mezi silofunkcemi pro rozsah n = 19 a n = 0, což odpovídá spočítané hodnotě n. Chceme-li tento případ pro danou alternativu a hladinu významnosti za stejné podmínky týkající se síly testovat pomocí testovací statistiky U, použijeme ke stanovení minimálního doporučeného rozsahu vztah 3.50. Výpočtem získáme hodnotu n, 471, pro U -test tedy potřebujeme pro dosažení stejné síly při stejné hladině významnosti a alternativě soubor o větším rozsahu než u U-testu (viz srovnání silofunkcí těchto dvou 38

1 H 0 : π = π 0 = 0.5, H 1 : π π 0, α = 0.05 0.9 0.8 0.7 0.6 β( δ) 0.5 0.4 0.3 0. 0.1 0 0.4 0.3 0. 0.1 0 0.1 0. 0.3 0.4 δ = π π 0 n = 17 n = 18 n = 19 n = 0 n = 1 H 0 : π = π 0 = 0.5, H 1 : π π 0, α = 0.05 (a) Silofunkce oboustranného U-testu 0.84 H 0 : π = π 0 = 0.5, H 1 : π π 0, α = 0.05 0.8 0.81 β( π ) 0.8 0.78 0.76 0.74 n = 17 n = 18 n = 19 n = 0 n = 1 0.6 0.8 0.3 0.3 0.34 0.36 δ = π π 0 (b) Detail silofunkcí U-testu β( π ) 0.8 0.79 0.78 0.77 0.76 0.7 0.8 0.9 0.3 0.31 0.3 δ = π π 0 n = 19 n = 0 n* = n* = 3 (c) Detail silofunkcí U-testu a U -testu Obr. 3.14: Hledání minimálního rozsahu pomocí silofunkcí oboustranného U-testu a U - testu Tabulka 3.13: Hodnoty silofunkcí oboustranného U-testu a U -testu pro různá n, H 0 : π = π 0 = 0, 5, H 1 : π = π 1 na hladině významnosti α = 0, 05 n 18 19 0 1 3 β(0, 8) 0.768 0.794 0.817 0.838 0.857 0.874 β (0, 8) 0.669 0.703 0.734 0.76 0.789 0.81 testů pro různá n v detailu na obrázku 3.14(c)). Pro názornost jsou uvedeny hodnoty 39

silofunkce β(π 1 ) v bodě π 1 = 0, 8 také v tabulce 3.13, přičemž silofunkce U -testu je značena β. Věta 3.9.. Mějme test hypotézy H 0 : π = π 0 proti zadané alternativě H 1 : π = π 1 na určené hladině významnosti α založený na testovací statistice U 1 viz (3.35). Pak pro n ( u1 α + u ) 1 β 4(arcsin π arcsin (3.51) π 0 ) platí, že pravděpodobnost chyby II. druhu je menší rovna dané hodnotě β. Důkaz. Věta se dokáže analogicky jako věta 3.9.1, tedy P π ( n ( arcsin 1 β α (π) β ( 1 P π ( n arcsin )) X n arcsin π 0 β ) X n arcsin ) π u 1 α n(arcsin π arcsin π 0 ) 1 β n = u 1 α n(arcsin π arcsin π 0 ) = u β ( u1 α + u ) 1 β 4(arcsin π arcsin π 0 ). Poznámka. Nerovnice (3.49), (3.50) a (3.51) určující potřebný minimální rozsah výběru n jsou odvozeny aproximací, jedná se tedy pouze o přibližné výpočty rozsahu. Vrátíme-li se k příkladu a spočítáme-li pro zadané hodnoty minimální rozsah výběru podle vzorce 3.51, dostaneme výsledek n 18, 954, tedy pro dodržení síly β 0, 8 v bodě π 1 = 0, 8 je zapotřebí souboru o rozsahu n 19. Vztah pro výpočet minimálního rozsahu výběru n splňujícího dané podmínky není pro U -test (viz (3.36)) ani pro testování pomocí intervalu π D,π H, tedy F-testu, snadné analyticky vyjádřit, problém návrhu experimentu se tedy řeší graficky nebo numericky. Pro výše uvedený příklad byla získána grafickou metodou pro oba tyto testy hodnota minimálního rozsahu n = 0. 40

4 Srovnání testů o parametru π binomického rozdělení Uvažujme pět výše popsaných testů: F-test založený na použití kvantilů Fisherova rozdělení v intervalu spolehlivosti (viz odstavec 3.3), U-test využívající statistiku (3.0) získanou aproximací normálním rozdělením, U -test s upravenou statistikou (3.), dále pak arcussinovou transformací odvozený U 1 -test se statistikou (3.35) a U -test využívající statistiku (3.36). Testujme hypotézu H 0 : π = π 0 proti alternativě π π 0 na hladině významnosti α = 0, 05. Tuto formulaci testu budeme uvažovat pro všechny následující rozbory v této kapitole, nebot α = 0, 05 je v praxi nejužívanější volbou. Nejprve volme parametr binomického rozdělení π 0 = 0, 5. Pomocí simulací se snadno dokáže, že F-test pro rozsah výběru n 5 nikdy hypotézu H 0 nezamítá. Nelze totiž najít taková c 1 a c (viz (3.9)), aby β(π 0 ) α, jak je patrné z tabulky 4.1. V programu pro Tabulka 4.1: Srovnání hodnot c 1, c, β(π 0 ) při π 0 = 0, 5 n 4 5 6 7 c 1-1 -1 0 0 c 5 6 6 7 β(π 0 ) 0,15 0,063 0,031 0,016 vykreslování teoretických silofunkcí F-testu (viz příloha P) je tato skutečnost ošetřena podmínkami. Necht je tedy n = 6. Na obrázku 4.1 lze vidět, že ani F-test, ani U -test nedosahují 1 0.9 0.8 0.7 H 0 : π = π 0 = 0.5, H 1 : π π 0, α = 0.05, n = 6 F test U test U* test U 1 test U test 0.6 β( δ ) 0.5 0.4 0.3 0. 0.1 0 0.5 0.4 0.3 0. 0.1 0 0.1 0. 0.3 0.4 0.5 δ = π π 0 Obr. 4.1: Srovnání testů pro π 0 = 0, 5 a n = 6 41

stanovené hladiny významnosti, přičemž více podhodnocený je U -test. Největší síly dosahuje U 1 -test pro δ 0, 47; 0, 47, tedy pro π 0, 03; 0, 97. Použití testovací statistiky U není pro dané parametry vhodné, např. silofunkce β(π) v bodě π = 0, 1 je u U -testu rovna pouze 0.48, zatímco pro U 1 -test je β(0, 1) = 0, 63. Z grafu je dále patrné, že silofunkce F-testu nabývá větších hodnot než silofunkce U-testu v rozmezí π 0, 03; 0, 18 0, 8; 0, 97. Ve srovnání s U -testem je F-test silnější do bodu π = 0, 11, resp. od bodu π = 0, 89. Zatímco sílu U 1 -testu převyšuje do bodu π = 0, 0, resp. od bodu π = 0, 98. Silofunkce U -testu nabývá vyšších hodnot než silofunkce U-testu do bodu π = 0, 08, resp. od bodu π = 0, 9. Do (resp. od) tohoto bodu je vhodnější použít jeden z testů využívajících statistiky U 1, U nebo přesný F-test. Na obrázku 4. je znázorněna situace pro volbu rozsahu výběru n = 10. F-test a U -test 1 0.9 0.8 0.7 H 0 : π = π 0 = 0.5, H 1 : π π 0, α = 0.05, n = 10 F test U test U* test U 1 test U test 0.6 β( δ ) 0.5 0.4 0.3 0. 0.1 0 0.5 0.4 0.3 0. 0.1 0 0.1 0. 0.3 0.4 0.5 δ = π π 0 Obr. 4.: Srovnání testů pro π 0 = 0, 5 a n = 10 jsou opět podhodnocené, u obou je totiž síla v bodě π = π 0 rovna 0, 08, což je méně než je stanovená hladina významnosti α = 0, 05. Silofunkce F-testu dosahuje vyšších hodnot než silofunkce U -testu pro π 0, 04; 0, 35 0, 65; 0, 96. Celkově nejméně vhodným testem pro parametr π 0, 05; 0, 95 je U -test. Použití této statistiky je výhodné pouze pro velká δ ( δ 0, 45). Do bodu π = 0, 05, resp. od bodu π = 0, 95 je nejslabší U -test. Nejsilnějším testem na intervalu π 0, 09; 0, 91 je test využívající statistiku U 1. Pro π do 0, 09, resp. od 0, 91 je výhodnější použití U-testu. Testy používající statistiky U a U se výrazně liší do bodu π = 0, 16, resp. od bodu π = 0, 84. Je-li n = 15, jak je vidět z obrázku 4.3, výsledky jsou podobné předcházející situaci. Síla v bodě π = π 0 je pro F-test rovna 0, 035 a pro U -test je to 0, 065, oba testy jsou tedy opět podhodnocené. U -test je celkově nejméně vhodným testem pro volbu parametru π 0, 1; 0, 9. Do bodu π = 0, 1, resp. od bodu π = 0, 9 nabývá nejnižších hodnot silofunkce U -testu. Pro vyšší δ, tj. δ 0, 4 je naopak jednou z nejlepších variant použití právě U -testu. Nejsilnějším testem na intervalu π 0, 15; 0, 85 je test využívající statistiku U 1. Pro π do 0, 15, resp. od 0, 85 nabývá nejvyšších hodnot U-test. S rostoucím rozsahem výběru n (viz obrázek 4.4), roste síla U -testu v bodě π = π 0 směrem k hodnotě předepsané hladiny α, ovšem nikdy jí nedosáhne. Dále také dochází 4

1 0.9 0.8 0.7 H 0 : π = π 0 = 0.5, H 1 : π π 0, α = 0.05, n = 15 F test U test U* test U 1 test U test 0.6 β( δ ) 0.5 0.4 0.3 0. 0.1 0 0.5 0.4 0.3 0. 0.1 0 0.1 0. 0.3 0.4 0.5 δ = π π 0 Obr. 4.3: Srovnání testů pro π 0 = 0, 5 a n = 15 1 H 0 : π = π 0 = 0.5, H 1 : π π 0, α = 0.05, n = 50 1 H 0 : π = π 0 = 0.5, H 1 : π π 0, α = 0.05, n = 90 0.9 0.9 0.8 0.8 0.7 0.7 0.6 0.6 β( δ ) 0.5 β( δ ) 0.5 0.4 0.4 0.3 0. 0.1 F test U test U* test U 1 test U test 0.3 0. 0.1 F test U test U* test U 1 test U test 0 0.4 0.3 0. 0.1 0 0.1 0. 0.3 0.4 δ = π π 0 0 0.3 0. 0.1 0 0.1 0. δ = π π 0 Obr. 4.4: Srovnání testů pro π 0 = 0, 5 a n = 50, 90 k zúžení intervalu pro volbu parametru π, pro nějž je nejsilnějším testem U 1 -test, zároveň k zúžení intervalu, na němž je nevhodné použít testovací statistiku U. Rozdíly mezi testy U, U 1 a U se víceméně vytrácejí. Necht π 0 = 0, 3. Pak pro n 10 nelze vůbec najít vhodné číslo c 1 (viz tabulka 4.) pro F-test. Na obrázku 4.5 je znázorněno srovnání testů pro minimální rozsah, tedy n = 11. Jak je patrné, silofunkce všech pěti testů mají asymetrický tvar, přičemž nejvíce anomální situace nastává při použití statistiky U pro δ < 0, tj. π < π 0. U -test je obecně nejslabší pro volbu parametru π z intervalu 0; 0, 93. V bodě π = π 0 = 0, 3 je síla tohoto testu rovna 0, 01, pro F-test je β(π 0 ) = 0, 0414, testy jsou tedy podhodnocené. Od bodu π = 0, 93 dosahuje nejnižších hodnot silofunkce U -testu. Jako nejsilnější test pro π < π 0 se chová U 1 -test, pro π > π 0 je pak nejvhodnější použít testovací statistiku U, kterou ovšem pro π < π 0 nelze doporučit. 43

Tabulka 4.: Srovnání hodnot c 1, c, β(π 0 ) při π 0 = 0, 3 n 8 9 10 11 c 1-1 -1-1 0 c 6 7 7 7 β(π 0 ) 0,069 0,045 0,039 0,041 1 H 0 : π = π 0 = 0.3, H 1 : π π 0, α = 0.05, n = 11 0.9 0.8 0.7 0.6 β( δ ) 0.5 0.4 0.3 0. 0.1 F test U test U* test U 1 test U test 0 0.3 0. 0.1 0 0.1 0. 0.3 0.4 0.5 0.6 δ = π π 0 Obr. 4.5: Srovnání testů pro π 0 = 0, 3 a n = 11 Na obrázku 4.6 jsou vykresleny silofunkce testů pro volbu n = 15. Síla F-testu v bodě 1 H 0 : π = π 0 = 0.3, H 1 : π π 0, α = 0.05, n = 15 0.9 0.8 0.7 0.6 β( δ ) 0.5 0.4 0.3 0. 0.1 F test U test U* test U 1 test U test 0 0.3 0. 0.1 0 0.1 0. 0.3 0.4 0.5 0.6 δ = π π 0 Obr. 4.6: Srovnání testů pro π 0 = 0, 3 a n = 15 π = π 0 dosahuje pouze hodnoty 0, 0199, u U -testu se jedná o hodnotu 0, 049, oba jsou tedy opět podhodnocené. Změna nastává v tom, že úlohu nejslabšího testu přebírá na 44

intervalu π 0, 31; 0, 75 F-test. Stejně jako v předešlé situaci je nejsilnějším testem pro π < π 0 U 1 -test, pro π > π 0 je to výrazně U-test. S rostoucím n (viz obr. 4.7) se vytrácí asymetrické chování silofunkcí. Zmenšují se rozdíly 1 H 0 : π = π 0 = 0.3, H 1 : π π 0, α = 0.05, n = 30 1 H 0 : π = π 0 = 0.3, H 1 : π π 0, α = 0.05, n = 60 0.9 0.9 0.8 0.8 0.7 0.7 0.6 0.6 β( δ ) 0.5 β( δ ) 0.5 0.4 0.4 0.3 0. 0.1 F test U test U* test U 1 test U test 0.3 0. 0.1 F test U test U* test U 1 test U test 0 0.3 0. 0.1 0 0.1 0. 0.3 0.4 δ = π π 0 0 0.3 0. 0.1 0 0.1 0. 0.3 δ = π π 0 Obr. 4.7: Srovnání testů pro π 0 = 0, 3 a n = 30, 60 mezi U -testem, F-testem a rovněž mezi U 1 -testem a U -testem. U-test zůstává nadále dominantní pro π > π 0. Je-li π 0 = 0.1, F-test zamítá hypotézu H 0 oboustranně až od n = 36, pro nižší n vůbec nelze najít vhodná čísla c 1 (viz tabulka 4.3). Na obrázku 4.8 je znázorněno srovnání silofunkcí testů pro n = 36. Tabulka 4.3: Srovnání hodnot c 1, c, β(π 0 ) při π 0 = 0, 1 n 34 35 36 37 c 1-1 -1 0 0 c 8 8 8 9 β(π 0 ) 0,045 0,045 0,46 0,030 Pokud chceme provádět F-test pro π 0 = 0.05 je zapotřebí volit n 7, nebot pro menší rozsahy tento test zamítá pouze jednostranně, přičemž nelze vůbec najít vhodné c 1 (viz tabulka 4.4). Srovnání silofunkcí testů je ilustrováno obrázkem 4.9. Je zapotřebí poznamenat, že není vhodné provádět testování dané hypotézy pomocí statistik U, U, U 1, U pro menší než výše doporučené rozsahy výběru pro F-test. Testy totiž pro malé rozsahy zamítají pouze jednostranně či asymetricky. Některé z nich dokonce vykazují určité další nedostatky. Konkrétně silofunkce U-testu pro π 0 = 0, 3, n = 5 a silofunkce U -testu pro π 0 = 0, 5, n = 5 a π 0 = 0, 3, n = 10 mají anomální průběhy. Tyto 45

1 H 0 : π = π 0 = 0.1, H 1 : π π 0, α = 0.05, n = 36 0.9 0.8 0.7 0.6 β( δ ) 0.5 0.4 0.3 0. 0.1 F test U test U* test U 1 test U test 0 0.1 0 0.1 0. 0.3 0.4 δ = π π 0 Obr. 4.8: Srovnání testů pro π 0 = 0, 1 a n = 36 Tabulka 4.4: Srovnání hodnot c 1, c, β(π 0 ) při π 0 = 0, 05 n 70 71 7 73 c 1-1 -1 0 0 c 8 9 9 9 β(π 0 ) 0,051 0,035 0,035 0,034 1 H 0 : π = π 0 = 0.05, H 1 : π π 0, α = 0.05, n = 7 0.9 0.8 0.7 0.6 β( δ ) 0.5 0.4 0.3 0. 0.1 F test U test U* test U 1 test U test 0 0.05 0.05 0.15 δ = π π 0 Obr. 4.9: Srovnání testů pro π 0 = 0, 05 a n = 7 příklady ilustrují obrázky 4.10, 4.11 a 4.1. Příslušné hodnoty jsou uvedeny v tabulkách 4.5, 4.6 a 4.7. 46

1 H 0 : π = π 0 = 0.3, H 1 : π π 0, α = 0.05, n = 5 0.9 0.8 0.7 0.6 β( δ ) 0.5 0.4 0.3 0. 0.1 0 0. 0.1 0 0.1 0. 0.3 0.4 0.5 0.6 δ = π π 0 Obr. 4.10: Anomálie u U-testu pro π 0 = 0, 3, n = 5 Tabulka 4.5: Anomálie u U-testu pro π 0 = 0, 3, n = 5 π 0,01 0,03 0,05 0,1 0,15 0,18 0, β(π) 0,0060 0,04 0,0598 0,0664 0,0578 0,0518 0,0484 0. H 0 : π = π 0 = 0.5, H 1 : π π 0, α = 0.05, n = 5 0.18 0.16 0.14 0.1 β( δ ) 0.1 0.08 0.06 0.04 0.0 0 0.5 0.4 0.3 0. 0.1 0 0.1 0. 0.3 0.4 0.5 δ = π π 0 Obr. 4.11: Anomálie u U -testu pro π 0 = 0, 5, n = 5 47

Tabulka 4.6: Anomálie u U -testu pro π 0 = 0, 5, n = 5 π 0,01 0,015 0,0 0,03 0,04 0,05 0,08 0,1 β(π) 0,1391 0,1636 0,1760 0,1855 0,1859 0,186 0,1648 0,1514 1 H 0 : π = π 0 = 0.3, H 1 : π π 0, α = 0.05, n = 10 0.9 0.8 0.7 0.6 β( δ ) 0.5 0.4 0.3 0. 0.1 0 0. 0.1 0 0.1 0. 0.3 0.4 0.5 0.6 δ = π π 0 Obr. 4.1: Anomálie u U -testu pro π 0 = 0, 3, n = 10 Tabulka 4.7: Anomálie u U -testu pro π 0 = 0, 3, n = 10 π 0,01 0,0 0,03 0,05 0,1 0,15 0, 0,3 β(π) 0,0809 0,111 0,1176 0,1114 0,0789 0,0516 0,034 0,01 48

5 Statistické metody v senzorické analýze 5.1 Vyhodnocení rozlišovacích metod Senzorická data získaná při rozlišovacích zkouškách se vyhodnocují pomocí testů hypotéz o parametru π binomického rozdělení popsaných v kapitole 3. 5.1.1 Párová porovnávací zkouška Necht π je pravděpodobnost, že posuzovatel zvolí výrobek A jako intenzivnější. Pak mějme hypotézu H 0 : výrobky nelze rozlišit, tedy π = 1, proti oboustranné alternativě H 1: výrobky jsou rozdílné, tj. π 1. Hodnocení provedlo n posuzovatelů, z toho n A posuzovatelů označilo vzorek A a n B hodnotitelů se vyslovilo pro vzorek B, tedy n = n A + n B. Test lze provést za využití statistik : 1. a F 1 = n A n n A + 1 (5.1) F = n A + 1 n n A (5.) vycházejících z (3.16) a (3.17), přičemž hypotéza H 0 se zamítá, platí-li na dané hladině významnosti α ( F 1 F ν1,ν 1 α ) ( α ) nebo F F ν3,ν 4, kde F ν1,ν ( 1 α ) a Fν3,ν 4 ( α ) jsou kvantily Fisherova rozdělení s ν1 = (n n A +1), ν = n A a ν 3 = (n n A ), ν 4 = (n A + 1) stupni volnosti,. U = n A n n (5.3) založené na statistice (3.0), přičemž hypotéza H 0 se zamítá, platí-li 3. kde u 1 α je kvantil rozdělení N(0, 1), U u 1 α, U = n A n 1 n (5.4) dle (3.1), přičemž hypotéza H 0 se zamítá, platí-li kde u 1 α je kvantil rozdělení N(0, 1), 49 U u 1 α,

4. U 1 = n ( arcsin odvozené z (3.35), H 0 se zamítá, platí-li ) na 1 n arcsin U 1 u 1 α, (5.5) 5. kde u 1 α je kvantil rozdělení N(0, 1), U = 4n + ( arcsin ) 8nA + 3 4n + 3 8n + 6 arcsin, (5.6) 8n + 6 viz (3.36), H 0 se zamítá, platí-li kde u 1 α je kvantil rozdělení N(0, 1). U u 1 α, Diskuze, kdy je kterou z těchto uvedených testovacích statistik vhodnější použít, je popsána v předešlé kapitole 4. V případě jednostranného testu formulujeme k hypotéze H 0 : výrobky nelze rozlišit, tj. π = 1, alternativu H 1: vlastnost výrobku A je intenzivnější než u výrobku B, tj. π > 1. Jako testovací kriterium se použije (5.1), H 0 se zamítá, pokud F F 1 α (ν 1,ν ), kde F 1 α (ν 1,ν ) je kvantil Fisherova rozdělení s ν 1 = (n n A + 1) a ν = n A stupni volnosti. Je možno použít také statistiku hypotéza H 0 se zamítá, platí-li U = n A n 1 n, (5.7) U u 1 α, kde u 1 α je kvantil rozdělení N(0, 1). Dále se využívají statistiky (5.3), (5.5) a (5.6), pomocí nichž se test vyhodnotí stejně jako v případě (5.7). 5.1. Zkouška duo-trio Test pro zkoušku duo-trio se formuluje obdobně jako v odstavci 5.1.1. Pro vyhodnocení se použijí testovací statistiky stejné jako u jednostranného testu při párové porovnávací zkoušce. Zde se ovšem jedná o jednostranný test pouze z technického hlediska, výsledkem není určení směru rozdílnosti, ale pouze její existence. 50

5.1.3 Trojúhelníková zkouška Necht π je pravděpodobnost, že posuzovatel zvolí vzorek A jako odlišný od ostatních. Protože se jedná o volbu jednoho vzorku ze tří, pravděpodobnost správné kombinace je π = 1. Mějme tedy hypotézu H 3 0: výrobky nelze rozlišit, tj. π = 1, proti oboustranné 3 alternativě H 1 : výrobky jsou rozdílné, tj. π > 1. Hodnocení provedlo n posuzovatelů, 3 z toho n A posuzovatelů rozpoznalo správnou kombinaci. Rozdíl ve sledované vlastnosti bude zřejmý, pokud správnou kombinaci uvede více než třetina posuzovatelů, tj. n A > n B, za platnosti n = n A + n B. Jako testové kriterium využijeme statistiky 1. F = n A n n A + 1 (5.8) odvozenou z (3.16), pak se hypotéza H 0 zamítá, platí-li na dané hladině významnosti α F 1 F 1 α (ν 1,ν ), kde F 1 α (ν 1,ν ) je kvantil Fisherova rozdělení s ν 1 = (n n A +1), ν = n A stupni volnosti.. U = 3n A n n, (5.9) viz (3.0), přičemž hypotéza H 0 se zamítá, platí-li kde u 1 α je kvantil rozdělení N(0, 1), U u 1 α, 3. U = 6n A n 3 8n (5.10) 4. dle (3.1), hypotéza H 0 se zamítá, platí-li kde u 1 α je kvantil rozdělení N(0, 1), U 1 = n ( U u 1 α, arcsin ) na 1 n arcsin 3 odvozené z (3.35), hypotéza H 0 se opět zamítá, platí-li kde u 1 α je kvantil rozdělení N(0, 1), U 1 u 1 α, (5.11) 51

5. U = 8 8nA + 3 4n + arcsin 8n + 6 arcsin n + 3 3 (5.1) 8n + 6 získané z (3.36), přičemž hypotéza H 0 se zamítá, platí-li kde u 1 α je kvantil rozdělení N(0, 1), U u 1 α, Pomocí těchto jednostranných testů stejně jako u zkoušky duo-trio pouze odhadujeme, zda se výrobky liší či nikoli, ale nelze takto zjistit směr rozdílu. Pro tento účel je vhodné využití párové porovnávací zkoušky. Vhodnost použití testů je diskutována v kapitole 4. 5. Vyhodnocení pořadových metod Pořadová zkouška se nejčastěji vyhodnocuje Friedmanovým testem. Pořadí vzorků od jednotlivých hodnotitelů se zapíšou do tabulky a následně se spočítají součty pořadí jednotlivých vzorků. Mějme hypotézu H 0 : mezi vzorky nejsou významné rozdíly ve sledovaném znaku, proti alternativě H 1 : mezi zkoumanými vzorky je alespoň jeden, který se od jiného či jiných odlišuje. Pokud platí H 1, měly by být součty pořadí teoreticky stejné. Jako testové kriterium se použije veličina FR = 1 nr(r + 1) R i=1 T i 3n(R + 1), (5.13) kde n je počet hodnotitelů, R počet vzorků a T i jsou součty pořadí jednotlivých vzorků pro i = 1,,..., R. Testovaná hypotéza se zamítá, pokud pro dané α platí FR Q 1 α (R,n), přičemž Q 1 α (R,n) jsou kritické hodnoty tabelované pro α = 0, 05 a 0, 01, 3 n 16, 3 R 10 (viz [11]). Pro vyšší počet posuzovatelů či vzorků (pro R 5, n 5) je přijatelná aproximace testovací statistiky Pearsonovým χ rozdělením s (R 1) stupni volnosti. Hypotéza H 0 se pak zamítá, pokud pro dané α platí FR χ 1 α(r 1), kde χ 1 α(r 1) jsou kvantily Pearsonova χ rozdělení s (R 1) stupni volnosti. Zamítne-li se daná hypotéza, je vhodné zjistit, které jednotlivé vzorky se od sebe liší. K tomuto účelu slouží Némenyiho metoda vícenásobného párového porovnávání závislých výběrů. Jedná se o oboustranný test, lze tedy stanovit rozdílnost mezi vzorky jako takovou, ale nikoli její směr. Metoda výchází znovu ze součtů pořadí. Rozdíl mezi i-tým a j-tým vzorkem pak je se 100(1 α)% spolehlivostí významný, platí-li T i T j q 1 α (R, n), (5.14) 5

kde q 1 α (R, n) je speciální tabelovaná kritická hodnota pro párová porovnávání opět pro α = 0, 05 a 0, 01, 3 n 16, 3 R 10 (viz [11]). V případě malého rozsahu tabelovaných hodnot lze již pro R > 5 použít aproximaci. Hypotéza se pak pro dané α zamítá, platí-li nr(r + 1) T i T j g 1 α (R) (5.15) 1 kde g 1 α (R) je kritická hodnota speciální studentizované funkce pro počet vzorků v původní R-tici (viz [11], [4]) 5.3 Vyhodnocení stupnicových metod 5.3.1 Hodnocení jednoho senzorického znaku v rámci jednoho výrobku Úkolem metod sloužících pro hodnocení jednoho senzorického znaku v rámci jednoho výrobku je srovnání pravděpodobností kategorií v rámci dané otázky. Mějme n posuzovatelů hodnotících dle stupnice o K kategoriích. Relativní četnost k- té kategorie je p k = n k n, kde n = K k=1 n k a n k je absolutní četnost k-té kategorie pro k = 1,,..., K. Při hodnocení jednoho znaku chceme ověřit, zda se podíl posuzovatelů hovořících ve prospěch jedné a druhé kategorie významně liší. V rámci jedné otázky se tedy zjišt uje, zda je rozdíl mezi absolutními četnostmi n i a n j těchto dvou kategorií statisticky významný. Tato úloha se opět řeší testem o parametru binomického rozdělení. Mějme hypotézu H 0 : kategorie se navzájem neliší, tj. π = 1, proti alternativě H 1: existuje rozdíl mezi i-tou a j-tou kategorií, tj. π 1. Hypotéza H 0 se zamítá, platí-li n i n j + 1 F 1 α (ν 1,ν ), (5.16) kde F 1 α (ν 1,ν ) je kvantil Fisherova rozdělení s ν 1 = (n j +1) a ν = n i stupni volnosti. Je-li k dispozici dostatečně velký počet hodnotitelů (dle [11] pro n i + n j > 30), lze požít také testovací statistiku u = n i n j. (5.17) ni + n j Hypotéza se pak zamítá, platí-li u u 1 α/, kde u 1 α/ je kvantil rozdělení N(0, 1). Je-li předmětem zájmu prokázání, zda podíl posuzovatelů hovořících ve prospěch i-té kategorie významně převyšuje podíl hodnotitelů stavějících se ve prospěch j-té kategorie, aplikuje se jednostranný test. V případě, že potřebujeme rozšířit srovnávání na L kategorií, využijeme test o shodě pravděpodobností L kategorií, L K. Tento test je možné provést, platí-li n 1 +n +...+ n L > 30(viz [11]). Mějme hypotézu H 0 : kategorie jsou shodné, tj. π 1 = π = = π L, 53

proti alternativě H 1 : alespoň jedna kategorie se od další liší, tj. π i π j pro libovolné i j. Pak pro test využijeme statistiku χ = L k=1 (n k nπ k ) nπ k. Protože pro H 0 platí π k = 1, k = 1,..., L, lze testovací kriterium zapsat jako L χ = L L k=1 n k L k=1 n k L n k. (5.18) k=1 Hypotéza se zamítá na dané hladině významnosti α, platí-li χ χ 1 α(l 1), kde χ 1 α(l 1) je kvantil Pearsonova rozdělení s (L 1) stupni volnosti. K dalším metodám sloužícím k vyhodnocení jednoho senzorického znaku u jednoho výrobku patří také metoda odhadu intervalu spolehlivosti tzv. míry asymetrie pro ordinální znak. Předpokládá se větší počet posuzovatelů (n 30) a stupnice o lichém počtu kategorií. Uprostřed stupnice se nachází tzv. neutrální kategorie. Všechna hodnocení se roztřídí do tří kategorií. Do první kategorie označené symbolem se zařadí výrobky označované jako horší, či méně intenzivní než střední úroveň, do druhé kategorie označené symbolem 0 se zařadí výsledky odpovídající střední úrovni a poslední kategorie + zahrne výsledky vyjadřující lepší nebo více intenzivní úroveň než střední úroveň. Pro tyto kategorie stanovíme absolutní a relativní četnosti, označíme je postupně n, n 0, n +, p, p 0 a p +. Za předpokladů n > 30, n + > 5 a n > 5, lze stanovit 100(1 α)% oboustranný interval spolehlivosti (α D, α H) = (a u 1 α s, a + u 1 α s ), (5.19) kde a = n + n n je odhad charakteristiky α vyjadřující míru asymetrie (podrobněji viz [11]), s = p0 (1 p 0 ) + 4p + p je odhad směrodatné chyby odhadu a u 1 α/ je kvantil rozdělení N(0, 1). 5.3. Srovnání senzorického znaku dvou a více výrobků Je-li potřeba srovnat mezi sebou ve sledované senzorické vlastnosti dva výrobky A a B, použije se Wilcoxonův test. Podmínkou je, aby pro počet posuzovatelů platilo n A + n B 0. Ke každému výrobku se přiřadí náhodný výběr reprezentovaný výsledky posuzovatelů a ze všech jednotek se vytvoří sdružený výběr o rozsahu n = n A +n B uspořádaný vzestupně 54 n

podle velikosti. Jednotlivým hodnotám se přiřadí pořadová čísla, stejným hodnotám se přiřadí průměrná pořadová čísla. Pro každý výrobek se pak spočítá součet pořadí jednotek příslušejících do j-tého výběru a označí se T j, j = A, B. Dále se použije modifikovaná testovací statistika s opravou na spojitost u W = T j n j(n+1) ± 1, (5.0) var(sw ) kde n j je počet posuzovatelů j-tého výrobku a var(s W ) = n A n B 1 n3 K k=1 (n k) 3, n(n 1) kde K je počet kategorií, n k jsou četnosti odpovídající tzv. celkovému zastoupení k-té kategorie ve sdruženém výběru, k = 1,,..., K. Ve vztahu (5.0) použijeme + 1, je-li výraz v čitateli (bez 1) záporný, a 1, když je výraz v čitateli kladný. Provádíme-li oboustranný test, tj. zajímá-li nás, zda mají výrobky odlišnou úroveň ve sledovaném znaku, zamítneme hypotézu o shodnosti úrovní, pokud u W u 1 α, kde u 1 α je kvantil rozdělení N(0, 1). Použití jednostranného testu závisí na typu předložené stupnice. Hypotézou H 0 je tvrzení, že oba výrobky nejsou ve sledovaném znaku rozdílné. Předpokládejme použitou ordinální stupnici prvního druhu. Pak alternativa H 1 tvrdí, že výrobek A je intenzivnější nebo lepší než výrobek B. Hypotéza se zamítá, platí-li u W u 1 α. (5.1) Pokud bude alternativa H 1 tvrdit, že A je méně intenzivní nebo horší než výrobek B, hypotéza H 0 se zamítne, pokud u W u 1 α. (5.) Předpokládáme-li použití stupnice druhého druhu, pak se při alternativě H 1 hypotéza H 0 zamítá pro (5.) a při alternativě H 1 zamítáme H 0, platí-li (5.1). Pro srovnání senzorického znaku u více než dvou výrobků je vhodnou metodou Kruskalův-Wallisův test. Předpokládejme, že se hodnotí R výrobků ve sledované vlastnosti a počet posuzovatelů n je alespoň 5. Každému výrobku se přiřadí náhodný výběr reprezentovaný výsledky posuzovatelů a ze všech jednotek se vytvoří sdružený výběr o rozsahu n = n 1 + n +... + n R uspořádáný vzestupně podle velikosti. Jednotlivým hodnotám se přiřadí pořadová čísla. Pro každý výběr se pak počítá součet pořadí jednotek příslušejících do r-tého výběru. Mějme hypotézu H 0 : mezi R výrobky není rozdíl v úrovni sledovaného znaku, proti alternativě H 1 : existuje alespoň jeden výrobek, který se ve sledované R-tici v úrovni senzorického znaku liší od jiného či jiných. Použije se testovací kriterium Q KW = 1 n(n + 1) R r=1 55 T r n r 3(n + 1). (5.3)

Pokud je shodných pozorování ve všech výběrech více než 5%, pak se doporučuje užít korigované testové kritérium Q KW = Q KW, (5.4) 1 D n 3 n kde D = K k=1 (n3 k n k), K je počet kategorií, R je počet výrobků, n k je počet pozorování v k-té kategorii ve sdruženém souboru, n r počet posuzovatelů v r-tém výběru, n = R r=1 n r je celkový počet posuzovatelů a T r je součet pořadí jednotek r-tého výběru. Hypotéza se při dané hladině α zamítá, pokud platí Q KW χ 1 α(r 1), kde χ 1 α(r 1) je kvantil Pearsonova rozdělení s (R 1) stupni volnosti. Pokud byla na základě Kruskalova-Wallisova testu zamítnuta hypotéza o shodě úrovní, je vhodné pokračovat Némenyiho metodou vícenásobného porovnávání nezávislých výběrů pro zjištění, které jednotlivé vzorky v R-tici posuzovaných výrobků se od sebe liší. Jestiže je počet posuzovatelů n r u všech výrobků stejný a platí n r 5, rozdíl mezi i-tým a j-tým výrobkem je významný se spolehlivostí 100(1 α)%, platí-li T i T j > Q 1 α (R, n r ), (5.5) kde T i, T j jsou součty pořadí jednotek příslušejících i-tému, j-tému výrobku a R je počet výrobků zahrnutých v původním Kruskalově-Wallisově testu. Pro n r 5 a R 10 jsou kritické hodnoty Q 1 α (R,n r ) tabelované pro α = 0, 05 a α = 0, 01 (viz [11]). Jestiže je počet posuzovatelů n r u všech výrobků stejný, platí n r > 5 a pro počet výrobků platí R 0, rozdíl mezi i-tým a j-tým výrobkem je významný se spolehlivostí 100(1 α)%, platí-li R(Rnr + 1) T i T j > g 1 α (R)n r. (5.6) 1 Kritické hodnoty g 1 α (R) speciální studentizované funkce jsou tabelované pro počet posuzovatelů R 0 a hladiny významnosti α = 0, 05 a α = 0, 01 (viz [11]). Pro nestejný ale dostatečný počet posuzovatelů u všech výrobků je rozdíl mezi i-tým a j-tým výrobkem významný se spolehlivostí 100(1 α)%, platí-li vztah T i T ( j n i n j > 1 1 + 1 1 n i n j ) n(n + 1)χ 1 α(r 1), (5.7) kde χ 1 α(r 1) je kvantil Pearsonova rozdělení s (R 1) stupni volnosti. Všechny uvedené typy testů Neményiho metody jsou oboustranné, tj. lze stanovit pouze rozdílnost v úrovni jako takovou, a nikoli její směr. Podrobný popis testů pro vyhodnocování stupnicových metod obsahuje např. [], [8]. 56

6 Software pro zpracování senzorických dat V rámci diplomové práce byl na základě výše uvedených teoretických závislostí v programovacím jazyce Delphi vytvořen uživatelský software SMSA verze 1.09 (zkratka názvu Statistické metody v senzorické analýze) pro vyhodnocování senzorických dat vybranými statistickými metodami. Skládá se ze dvou modulů: Senzorická analýza a Analýza jednorozměrných dat. Výběr mezi sekcemi i následně mezi jednotlivými testy se provádí pomocí roletového menu umístěného v horní části aplikace. Všechny aktuální výsledky včetně vstupních dat lze ukládat ve formátu.txt v průběhu testování, vykreslené grafy lze uložit ve formátu.bmp. Obr. 6.1: Software SMSA 6.1 Senzorická analýza Tento modul obsahuje prostředky k vyhodnocení rozlišovacích, pořadových a stupnicových senzorických metod dle kapitoly 5, přičemž je přesně zachováno výše uvedené názvosloví a označení proměnných. 57

6.1.1 Rozlišovací zkoušky Po zvolení jedné z rozlišovacích zkoušek z menu (viz obrázek 6.) lze vybrat konkrétní test, podle kterého se získaná senzorická data vyhodnotí. Na obrázku 6.3 je možno vidět ukázku Obr. 6.: Roletové menu oboustranné párové porovnávací zkoušky. Byla zadána vstupní data: hladina významnosti α, počet hodnotitelů n A, kteří označili vorek A, a počet hodnotitelů n B, kteří vybrali Obr. 6.3: Ukázka rozlišovací zkoušky vzorek B. Byl zvolen test pomocí statistiky F. Po výpočtu se zobrazily zarámečkované 58

výsledky obsahující vypočtené příslušné statistiky F 1, F a kvantily F 1 α, F1, dále pak červeně zvýrazněný závěr celého testu. Uživatel má možnost stisknout tlačítko Analýza silofunkcí, čímž otevře nové okno, kde se vykreslují silofunkce pro předem zadané hodnoty a vybrané druhy testů (viz obrázek 6.4). Zároveň se vypisují hodnoty β(δ) v bodě δ = 0, tedy π = π 0. Konkrétně pro pořadovou Obr. 6.4: Analýza silofunkcí zkoušku je v nabídce také tlačítko Volba rozsahu výběru, po jehož stisknutí se otevře okno, v němž lze zadat potřebné hodnoty pro výpočet minimálního rozsahu výběru (ten se provádí na základě vzorců uvedených v odstavci 3.9). Pro zadanou hladinu významnosti α, hypotézu H 0 : π = π 0 proti alternativě H 1 = π = π 1 se požaduje splnění podmínky, že pravděpodobnopst chyby II. druhu nebude větší než β. Daná situace je ilustrována na obrázku 6.5. Ve spodním rámečku jsou vypsány spočtené hodnoty minimálního rozsahu výběru n pro jednotlivé vybrané testovací statistiky. 6.1. Pořadové zkoušky Po zvolení položky Pořadová zkouška, přičemž na výběr jsou obě varianty uvedené v odstavci 5., uživatel zadá počet vzorků a počet hodnotitelů. Poté vyplní do tabulky jednotlivá pořadí získaná při senzorické zkoušce a stiskne tlačítko Vypočti. Zobrazí se tabulka s diferencemi mezi vzorky, vypočtené testovací kritérium F R, kritické hodnoty Q, nebo χ 1 α, pro Némenyiho metodu krit., závěr a tabulka se vzorky, mezi nimiž jsou statisticky významné rozdíly (viz obrázek 6.6). 59

Obr. 6.5: Volba rozsahu testu Obr. 6.6: Ukázka pořadové zkoušky 60

6.1.3 Stupnicové zkoušky Vyhodnocení jedné otázky v jednom výběru Uživatel nejdříve zadá počet kategorií použité stupnice, přičemž maximální počet je 7, poté vyplní tabulku získanými absolutními četnostmi a vybere si jeden z testů uvedených v odstavci 5.3.1, tedy Srovnání relativní četnosti a teoretické pravděpodobnosti u jedné kategorie, Srovnání struktury výběru s předpokládanou strukturou, Srovnání dvou kategorií - přesný test, Srovnání více než dvou kategorií nebo Vyhodnocení míry asymetrie. Na obrázku 6.7 je znázorněna první situace. Obr. 6.7: Ukázka vyhodnocení jedné otázky v jednom výběru Srovnání výsledků jedné otázky ve dvou a více výběrech Zde jsou na výběr tyto funkce: Srovnání dvou nezávislých výběrů - oboustranný a jednostranný Wilcoxonův test, Srovnání tří a více nezávislých výběrů - Kruskalův-Wallisův test. Vyhodnocení se provádí dle odstavce 5.3.. Na obrázku 6.8 lze vidět příklad Kruskalova- Wallisova testu. 6. Analýza jednorozměrných dat Sekce Analýza jednorozměrných dat je zpracována nad rámec teoretické části této diplomové práce, jednotlivé výpočty jsou založeny na vzorcích uvedených v literatuře [10], [5]. Tato část aplikace se dále dělí na: Základní zpracování dat, Srovnání souboru s předpokladem, Srovnání dvou nezávislých souborů a Srovnání dvou závislých souborů. 61

Obr. 6.8: Ukázka srovnání tří a více nezávislých výběrů 6..1 Základní zpracování dat Na základě vstupních dat vyplněných do tabulky je možno jednak ověřit normalitu výběru pomocí C-testu (test založený na výběrové šikmosti a výběrové špičatosti viz [5]) a dále pak spočítat tyto základní charakteristiky souboru: rozsah souboru, aritmetický průměr, momentový rozptyl, momentová odchylka, výběrový rozptyl, výběrová odchylka, koeficient šikmosti a koeficient špičatosti (viz [5]). Ilustrující ukázka je uvedena na obrázku 6.9. 6.. Srovnání souboru s předpokladem V této sekci se provádí srovnání hodnot s předpokladem pomocí parametrických testů a testů pro vyhodnocení nominálního znaku. Testy pro nominální znak se provádějí analogicky jako při vyhodnocování jedné otázky v jednom výběru u stupnicových metod (5.3.1). Využitím parametrických testů může uživatel srovnat jak rozptyl (test χ pro rozptyl souboru viz [10]), tak střední hodnotu souboru s předpokládanou konstantou (ttest při známém rozptylu viz [10]). Na obrázku 6.10 je uveden příklad srovnání střední hodnoty s předpokladem. 6..3 Srovnání dvou nezávislých souborů Dva nezávislé soubory se srovnávají pomocí parametrických metod, a to porovnáním bud jejich rozptylů (F-test [10]), nebo jejich středních hodnot (příklad uveden na obrázku 6.1). Před hodnocením středních hodnot souborů je zapotřebí zvolit předpoklad heteroskedasticity, nebo homoskedasticity, dle tohoto požadavku se pak zvolí příslušný test (dvouvýběrové t-testy viz [10]). Je možno také využít funkce Ověřit shodnost rozptylů. Dle jejího výsledku se předpoklad automaticky nastaví (ilustrováno na obrázku 6.11). 6

Obr. 6.9: Ukázka základního zpracování dat Obr. 6.10: Ukázka srovnání souboru s předpokladem 63

Obr. 6.11: Ukázka srovnání dvou nezávislých souborů - ověření homoskedasticity Obr. 6.1: Ukázka srovnání dvou nezávislých souborů - srovnání středních hodnot 6..4 Srovnání dvou závislých souborů Tato sekce využívá opět parametrické metody. Spočívá v porovnání souboru zadaných diferencí s předpokládanou nulovou střední hodnotou (t-test při známém rozptylu [10]). Ukázku lze vidět na obrázku 6.13. 64

Obr. 6.13: Ukázka srovnání dvou závislých souborů 65