Vlastnosti odhadů ukazatelů způsobilosti

Podobné dokumenty
Definice spojité náhodné veličiny zjednodušená verze

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Charakterizace rozdělení

Akademie věd České republiky Ústav teorie informace a automatizace RESEARCH REPORT. Hustoty rozdělení pravděpodobnosti pro odhady ukazatele C pk

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 )

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

Přijímací zkouška na navazující magisterské studium 2014

PRAVDĚPODOBNOST A STATISTIKA

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Normální (Gaussovo) rozdělení

15. T e s t o v á n í h y p o t é z

3 Bodové odhady a jejich vlastnosti

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

Regresní analýza 1. Regresní analýza

PRAVDĚPODOBNOST A STATISTIKA

Q-diagramy. Jiří Michálek ÚTIA AVČR

8. Normální rozdělení

2 ) 4, Φ 1 (1 0,005)

15. T e s t o v á n í h y p o t é z

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Normální rozložení a odvozená rozložení

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

HODNOCENÍ VÝKONNOSTI ATRIBUTIVNÍCH ZNAKŮ JAKOSTI. Josef Křepela, Jiří Michálek. OSSM při ČSJ

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Testování statistických hypotéz

Testování hypotéz o parametrech regresního modelu

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

Testování hypotéz o parametrech regresního modelu

Základy teorie odhadu parametrů bodový odhad

Příklady na testy hypotéz o parametrech normálního rozdělení

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

7. Analýza rozptylu.

Výběrové charakteristiky a jejich rozdělení

Interpolace, ortogonální polynomy, Gaussova kvadratura

MATEMATICKÁ STATISTIKA

Testy. Pavel Provinský. 19. listopadu 2013

KGG/STG Statistika pro geografy

Pravděpodobnost a aplikovaná statistika

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

Vícerozměrná rozdělení

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013

1 Klasická pravděpodobnost. Bayesův vzorec. Poslední změna (oprava): 11. května 2018 ( 6 4)( 43 2 ) ( 49 6 ) 3. = (a) 1 1 2! + 1 3!

5. T e s t o v á n í h y p o t é z

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

Normální (Gaussovo) rozdělení

12. cvičení z PST. 20. prosince 2017

Téma 22. Ondřej Nývlt

AVDAT Klasický lineární model, metoda nejmenších

1. Přednáška. Ing. Miroslav Šulai, MBA

α β ) právě tehdy, když pro jednotlivé hodnoty platí β1 αn βn. Danou relaci nazýváme relace

6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový.

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

8 Coxův model proporcionálních rizik I

Statistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I

Statistická analýza jednorozměrných dat

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

5. B o d o v é o d h a d y p a r a m e t r ů

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

MATEMATICKÁ STATISTIKA - XP01MST

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

Intervalová data a výpočet některých statistik

Náhodné vektory a matice

Přijímací zkouška na navazující magisterské studium 2017

Pravděpodobnost a matematická statistika

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

pravděpodobnosti, popisné statistiky

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Praktická statistika. Petr Ponížil Eva Kutálková

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Vyhodnocování způsobilosti a výkonnosti výrobního procesu

Aproximace binomického rozdělení normálním

správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B.

Příklady ke čtvrtému testu - Pravděpodobnost

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

1 Odvození poptávkové křivky

Pravděpodobnost a statistika

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

KGG/STG Statistika pro geografy

Nestranný odhad Statistické vyhodnocování exp. dat M. Čada

Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj.

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

KGG/STG Statistika pro geografy

Charakteristika datového souboru

Příklad 1. Řešení 1a. Řešení 1b ŘEŠENÉ PŘÍKLADY Z M1B ČÁST 5

- funkce, které integrujete aproximujte jejich Taylorovými řadami a ty následně zintegrujte. V obou případech vyzkoušejte Taylorovy řady

Základy teorie pravděpodobnosti

Základní statistické metody v rizikovém inženýrství

Testování statistických hypotéz

PRIMITIVNÍ FUNKCE. Primitivní funkce primitivní funkce. geometrický popis integrály 1 integrály 2 spojité funkce konstrukce prim.

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

Semestrální písemka BMA3 - termín varianta A13 vzorové řešení


Jednofaktorová analýza rozptylu

AVDAT Náhodný vektor, mnohorozměrné rozdělení

Náhodné (statistické) chyby přímých měření

Transkript:

Vlastnosti odhadů ukazatelů způsobilosti Jiří Michálek CQR při Ústavu teorie informace a automatizace AV ČR v Praze Úvod Ve výzkumné zprávě č 06 Odhady koeficientů způsobilosti a jejich vlastnosti viz [], byly odvozeny aproximace hustot rozdělení pravděpodobnosti odhadu Ĉp koeficientů C p podle typu tzv způsobilostní směrodatné odchylky Volba odhadu směrodatné odchylky sledovaného jakostního znaku obvykle v praxi úzce souvisí s použitým tvarem regulačního diagramu Jedná-li se o diagram x, R), pak je vhodné použít pro odhad směrodatné odchylky σ veličinu R/d n), kde n je rozsah logické podskupiny odebírané z procesu a R je průměrné rozpětí Analogicky při regulačním diagramu x, s), kdy směrodatná odchylka σ se odhaduje pomocí veličiny s/c 4 n), kde s je průměrná výběrová směrodatná odchylka Koeficienty d n) a C 4 n) jsou běžně tabelovány v literatuře zabývající se konstrukcí regulačních diagramů Lze uvažovat i třetí typ odhadu odvozený od výběrové směrodatné odchylky, a to / k n σ = x ij x i ), kn ) i= j= který je založen na odhadech rozptylu v podskupinách za předpokladu nezávislosti podskupin Číslo k představuje počet vzatých podskupin do výpočtu Jednotlivá měření v i-té podskupině jsou známa jako x ij, j =,,, n Tento odhad se ale bohužel v praxi ani v softwarech pro SPC) nepoužívá, i když dává velice dobré výsledky a má celou řadu výhod, např při konstrukci odhadů ukazatele C p Při odvozování aproximativních hustot se vychází z předpokladu, že v rámci každé podskupiny lze chování jakostního znaku popsat normálním rozdělením Tato rozdělení se mohou od jedné podskupiny k druhé lišit v parametru polohy, nikoliv však v parametru variability σ a skupiny musí být navzájem nezávislé Ukazatel C p totiž vyjadřuje potencionální úroveň způsobilosti dosažitelnou pouze při centrování sledovaného jakostního znaku na prostředek tolerančního rozpětí Maximálně věrohodné odhady ukazatele C p V dalším provedeme odvození maximálně věrohodných odhadů ukazatele C p pro výše uvedené tři případy:

a) Odhad založený na výběrovém rozpětí R: Zde je hustota odhadu Ĉp dána vyjádřením: f R x) = exp k π αu ) Cp βu x αn β n pro x 0 Jinak je f R x) = 0 Koeficienty α n, β n jsou tabelovány viz []) a závisejí na velikosti podskupiny a souvisejí s asymptotickým rozdělením výběrového rozpětí R z normálního rozdělení Uvažujme situaci, kdy máme k dispozici N výběrů složených z k odebraných podskupin, za předpokladu nezávislosti je pak sdružená hustota dána součinem kde ρ n,k = α n β n k f R x, x,, x N ) = C N p ρ N n,k exp ρ n,k i= k x C p ) Cp N x i i= Odhad ukazatelů C p založený na poměru věrohodnosti se získá hledáním maxima hustoty Snadno zjistíme, že ln f R x, x,, x n ) = N ln C p + N ln ρ n,k ρ n,k Odtud již ln fx, x,, x N ) C p = N C p ρ n,k Maximálně věrohodný odhad pak získáme řešením rovnice: N C p = ρ n,k i= i= i= ) Cp x i Tím se dostáváme ke kvadratické rovnici pro C p, a to kde ρ n,k T x, x,, x N ) = N Řešení rovnice má pak tvar ) Cp x i ) Cp x i x i = T x,, x N ) C p T x, x,, x N ) C p, i= p = T x, x,, x N ) ± x i, T x, x,, x N ) = N, i= ln i= T x, x,, x n ) + 4 T x,x,,x n) ρ n,k T x, x,, x N ) Samozřejmě uvažujeme pouze případ se znamením +, nebot záporný odhad nemá smysl, nebot vždy C p > 0

V případě N =, což je nejčastěji se vyskytující situace v praxi např C p odhaduje na základě jediné regulační karty), pak se kde p = ρ n,k + ρ n,k + 4 Ĉp, Ĉ p = Pro zjednodušení lze odhad ĈMLE) p p = ρ n,k USL LSL 6R/d n) vyjádřit jako + 4 + ρ n,k Ĉp, což znamená při k +, že pro praktické účely se odhady Ĉp a C p MLE) Při k 0 lze uvažovat, že p = Ĉp Pro N > je pak situace již komplikovanější, nebot pak moc neliší T = N i= Ĉ p,i, T = N, i= Ĉp,i kde Ĉp,i je odhad odvozený od R i /d n), tedy od i-té části logických podskupin Pokud v tomto případě budeme uvažovat N a současně k, pak lze snadno dokázat, že p Jedná se tedy o konzistentní odhad k,n C p b) Odhad založený na průměrné směrodatné odchylce s: Zde je hustota odhadu ukazatele C p dána obdobně jako v případě a) vyjádřením: f s x) = exp a ) n Cp k π b n x an C p k b n x pro x > 0 Pro x 0 je f s x) = 0 Z tvaru aproximativní hustoty ihned plyne, že její tvar se neliší od tvaru hustoty v případě a), pouze jsou zde jiné koeficienty a n, b n Tyto jsou rovněž tabelovány, dokonce je možno je vyjádřit pomocí funkce Γ ) a n = n Γ n ) Γ n ), b n = n Γ ) n Γ n Z tohoto faktu vyplývá, že maximálně věrohodný odhad počítaný pomocí s lze získat zcela stejným postupem jako v případě a) a se zcela stejnými vlastnostmi 3 )

c) Odhad založený na průměrném rozptylu σ k n = x ij x i ) kn ) i= j= Zde lze napsat vzorec pro odpovídající hustotu rozdělení pravděpodobnosti přesně, nebot lze její tvar odvodit od χ -rozdělení, když rozdělení v podskupinách bude normální a podskupiny navzájem nezávislé Hustota má tvar f I x) = Ckn ) p kn ) [kn )] kn ) Γ ) exp kn ) kn ) C p x x kn )+ Opět uvažujeme situaci složenou z N nezávislých dílčích úseků logických podskupin o k podskupinách Pak sdružená hustota má tvaru součinu, tedy f I x, x,, x n ) = CNkn ) p Nkn ) [kn )] Nkn ) ) Γ N kn ) exp kn ) C p x i= Ni= x kn )+ i Odtud snadno odvodíme ln f I x, x,, x N ) ) Nkn ) kn ) = Nkn ) ln C p + ln kn ) ln ) kn ) N ln Γ C pkn ) kn ) + ) ln Pak derivace logaritmu od hustoty je rovna: ln f I x, x,, x N ) C p = i= a tedy maximálně věrohodný odhad splňuje rovnici: neboli i= Nkn ) C p kk ), C p i= = C p N p = N, i= i= ) / V nejjednodušším případě, N =, pak ihned máme, že p = Ĉp při aplikaci odhadu směrodatné odchylky založeném na průměrném rozptylu 4

Věrohodnostní poměry a testy hypotéz o ukazateli C p Odhad založený na R: σ R = V tomto případě poměr věrohodnosti má tvar lx, x,, x n ) = Odtud snadno C ) N exp ρ n,k ln lx, x,, x n ) = N ln C c 0 R d n) i= ρ n,k = N ln c ρ n,k ) C x i ρ n,k i= i= ) C0 x i C ) ) C0 i= x i x i C C0 C ) x i Předpokládáme, že, C jsou hodnoty ukazatele C p s tím, že pro jednoduchost 0 < < C Speciálně, pro N = máme ln lx) = ln C ρ n,k C C 0 C ) x x Bohužel nelze tento věrohodnostní poměr rozepsat do tvaru lnx, x,, x N ) = Q N, C ) + K N, C ) T N x,, x N ), který by znamenal věrohodnostní funkci s monotónním poměrem věrohodností, kterého by se dalo využít např pro konstrukci nejsilnějších testů pro složené alternativy Znamená to, že tento věrohodnostní poměr se dá obecně využít pouze pro konstrukci testu jednoduché hypotézy H 0 : C p = proti jednoduché alternativě H : C P = C Nejdříve se budeme zabývat opět nejjednodušším případem N = Testujme hypotézu H 0 : C p = proti alternativě H : C p = C Klasické Neyman Pearsonovo lemma dává nejsilnější test: hypotéza H 0 se zamítá, když ln C ρ C n,kc ) C Ĉp > λ α, 0 Ĉp přičemž λ α je stanoveno tak, aby P ln C ρ C n,kc ) C Ĉp > λ α H 0 0 Ĉp = α 5

není problém vyjádřit věrohodnostní poměr ve výše uvedeném tvaru, kde C = +C ) Lze totiž předpokládat, že hodnota testové statistiky bude větší, když hodnoty odhadů Ĉ p budou větší, a tím blíže k platnosti alternativy H Jde tedy o to najít hodnotu λ α tak, aby C P Ĉp < ln C C λ α H 0 = α Ĉ p Pro nalezení vhodné hodnoty λ α je nutno odvodit hustotu rozdělení veličiny C Ĉ p, při Ĉp odhadu směrodatné odchylky založené na R Pro tento cíl je nutno analyzovat průběh funkce T x) = C x Tato funkce není monotónní, je definovaná na 0, + ) a T x x) = 0 pro x = C Pro x 0, C je ostře klesající, pro x C, + ) má parabolický průběh s lim x T x) = 0 a zde T x) < 0 Je-li u 0, + ), pak rovnice T x) = u má jediný kořen + 4uc x 0 = +, pro u 0, 4C existují dva kořeny ρ n,k x = + 4uC, x = + + 4uC u u Na základě těchto faktů je pak hustota rozdělení pravděpodobnosti pro veličinu T Ĉp) rovna pro u 0 pro 0 > u 4C h T x) = f R h T x) = f R + + 4uC u + + 4uC u +f R u T + T + + 4uC u T +4uC u +4uC u ) ) +4uC u Je vidět, že vzorec pro hustotu rozdělení T Ĉp) je poměrně složitý a pro nalezení požadované hodnoty λ α podle předepsaného rizika α je nutno sáhnout k numerickému řešení Zcela analogicky lze postupovat v případě b), kdy je odhad směrodatné odchylky založen na s ) 6

Poněkud jiná situace nastává v případě c), kdy je odhad směrodatné odchylky odvozen od průměrného rozptylu Tento případ byl již částečně uvažován v [] Nyní provedeme úplný rozbor této situace Opět rozsah podskupiny je n, v každém úseku je uvažováno k podskupin a úseků je N Odvodíme věrohodnostní poměr: ln f Ix, x,, x n C ) f I x, x,, x n ) = Nkn ) ln C C Nkn ) C C 0) N i= Při tomto přístupu k testování hypotéz o ukazateli C p je nutno předpokládat nezávislost mezi podskupinami a popsání hodnot jakostního znaku v rámci každé podskupiny pomocí normálního rozdělení s různými středními hodnotami, ale stejným rozptylem Znamená to, že proces nemusí být zvládnut vůči parametru polohy, ale musí být zvládnut v úrovni variability kde Jak snadno vidět, logaritmus věrohodnostního poměru lze napsat do tvaru ln f Ix, x,, x n C ) f I x, x,, x n ) = K N, C ) T N x, x,, x N ) + Q N, C ), Nkn ) K N, C ) = C C 0) T N x, x,, x N ) = N Q N, C ) = i= Nkn ) ln C C0 Opět budeme předpokládat, že < C Je vidět, že logaritmus věrohodnostního poměru je lineární funkce pro každou dvojici, C Na základě obecné teorie o testech založených na monotónním poměru věrohodnosti, viz např [3], lze tvrdit, že v tomto případě existuje stejnoměrně nejsilnější test ϕx, x,, x N ) hypotézy H 0 : C p = proti složené alternativě H : C p > : ϕx, x,, x N ) = pro T N x, x,, x N ) < konst ϕx, x,, x N ) = γ pro T N x, x,, x N ) = konst ϕx, x,, x N ) = 0 pro T N x, x,, x N ) > konst Tedy hypotéza C p = se zamítá, pokud platí nerovnost T N x, x,, x N ) = N i= < konst Otevřeným problémem zůstává odvození rozdělení pravděpodobnosti pro statistiku T N za předpokladu platnosti H 0, aby bylo možno stanovit hodnotu konstanty při volbě 7

rizika druhu V nejjednodušším případě N = je situace daleko schůdnější, nebot pak se jedná o statistiku T x ) = a hypotéza H x 0 se zamítá, když Ĉ p > C kn ) 0 q α kn )), kde q α kn )) je α-kvantil rozdělení χ o kn ) stupních volnosti Odhad Ĉp je pak jediný odhad založený na k podskupinách o rozsahu n kusů V praxi je daleko vhodnější otočit role hypotézy H 0 a alternativy H Proces bude tím kvalitnější, čím ukazatel C p bude větší Ptáme se tedy, zdali platí hypotéza, že C p = C proti tomu, že C p < C Pro N = se hypotéza = C zamítá, když Ĉ p < C kn ) 0 q α kn )) Testy založené na konfidenčních intervalech V případech a) a b) nelze na základě věrohodnostního poměru zkonstruovat stejnoměrně nejsilnější test jednoduché hypotézy proti složené alternativě, protože uvažovaný věrohodnostní poměr nemá vlastnost monotonie Hustoty rozdělení pravděpodobnosti však umožňují konstrukci konfidenčních intervalů pro požadované hodnoty ukazatele C p Lze postupovat následovně: hypotéza H 0 : C p = proti alternativě H : C p se nezamítá, když odhad Ĉp parametru C p bude obsažen v intervalu q α/ < Ĉp < q α/, kde P q α/ < Ĉp < q α/ = α, kde α je riziko chyby druhu V případě odhadu C p pomocí průměrného rozpětí R to znamená, že C p + βnu α/ α n k < Ĉp < C p + βnu α/ α n k Hypotéza H 0 : C p = se nezamítá tímto testem na hladině α, když Ĉ p + β ) nu α/ < < α n k Ĉp + β ) nu α/ α n k Zde je tedy uvažován případ s pouze jedním úsekem, tedy N = Případ pro N > bude řešen později, nebot pak odvození rozdělení pravděpodobnosti testové statistiky je daleko komplikovanější 8

Kvalita testu se posuzuje jeho silou, tzn pravděpodobností zamítnutí hypotézy, když ona neplatí Čili jde o to určit pravděpodobnosti náhodných jevů Ĉ p + β n u α/ α n k ), Ĉp ) β n u α/ α n k za platnosti alternativy H : C p = C, a zjistit, jak tato síla testu závisí jednak na rozdílu C a jednak na vztahu pravděpodobnosti pro C p = C jako h A ) Pak pravděpodobnost přijetí alternativy je +ξn/ k 0 h A x) dx + ξn/ k h a x) dx = ξn/ k +ξn/ k h a x) dx, kde ξ n = βn α n u α/, u α je příslušný kvantil rozdělení N0, ) Snadno je vidět, že při k síla testu roste k pro každý rozsah podskupiny Alternativní hustota má tvar: h A x) = π α n β n k exp α uk β u C x ) C x Po dosazení do výše uvedených integrálů a transformaci proměnných lze psát: necht β n,k α) je pravděpodobnost chyby druhu, pak β n,k α) = βnu α/ αn k βnu α/ + αn k Φ h A x) dx = Φ αn ) C k + C ) u α/ β n αn ) C k C ) u α/ β n kde Φ ) je distribuční funkce of N0, ) a u α/ je její příslušný kvantil Odtud již ihned vidíme, že síla testu je rovna αn ) C β n,k α) = Φ k β n αn ) C +Φ k β n + C ) u α/ C u α/ Pro ilustraci uvažujme případ, když n = 5, k = 0 a α = 0, 05 Pak α 5 =, 36, β 5 = 0, 864, u 0,975 =, 96, a tudíž síla takovéhoto testu je rovna při = 4 3 a C = 5 3 přibližně 0,73 To znamená, že silou přibližně 7 % budeme detekovat proces, který je na skutečné úrovni C p =, 67 Uvažujme ještě případ téhož zadání pouze se změnou C = Pak síla testu bude rovna přibližně Φ, 54)+Φ 4, 47) = 0, 068 = 0, 938 Tedy pokud bude proces 9 )

skutečně nezpůsobilý s C p =, pak při tomto zadání tento test tuto nezpůsobilost detekuje s pravděpodobností 93,8 % Všimněme si dosti značného rozdílu mezi uvažovanými příklady Lze se ptát, kolik podskupin je nutno uvažovat, aby síla u prvního příkladu se zvýšila ze 7 % na 95 % Aby tomu tak bylo, musí být chyba druhu β n,k α) maximálně 5 %, tedy hledáme k takové, aby β 5,k 0, 05) 0, 05 Protože k bude muset být rozhodně nad 0, je možno hodnotu Φ αn ) C k + C ) u α/ β n nahradit, a tudíž je nutno volit k tak, aby bylo αn ) C Φ k C ) u α/ β n tedy 0, 95, Φ, 69 0, 5 k, 45 ) 0, 95, Φ 0, 673 k, 45 ) 0, 95 Když zvolíme k = 38, pak riziko řádu bude 0,955 Z toho plyne, že pro detekci procesu na úrovni C p =, 67 je nutno uvažovat cca 37 38 podskupin o 5ti výrobcích v každé podskupině Zcela analogicky lze spočítat sílu testu založeného na konfidenčních intervalech pro C p v případě statistiky průměrné směrodatné odchylky s Pouze místo koeficientů α n, β n se objeví koeficienty a n, b n, které jsou rovněž tabelovány Porovnejme tyto testy s nejsilnějším testem založeným na průměrném rozptylu Máme tedy opět k dispozici k podskupin o rozsahu n kusů Pak odpovídající hustota rozdělení pravděpodobnosti má tvar pro x > 0 f I x) = Cs s s/ s/ Γ ) exp s C s x x s+, s = kn ) a f I x) = 0 jinak Testujeme hypotézu C p = proti obecné alternativě C p Není problém ukázat, že hustota f I ), viz [], je odvozena od vztahu Ĉ p kn ) P λ < < µ = P χ kn ) kn )) <, µ λ kde χ kn )) je náhodná veličina s χ -rozdělením s kn ) stupni volnosti Odtud již snadno zjistíme, že s pravděpodobností α je C kn ) 0 q α/ kn )) < Ĉp < C kn ) 0 q α/ kn )), 0

kde q α/ kn )) a q α/ kn )) jsou příslušné kvantily od χ -rozdělení s kn ) stupni volnosti Odtud již snadno zjistíme, že chyba druhu testu C p = proti alternativě C p je dána výrazem β n,k α) = kn ) q α/ kn )) kn ) q α/ kn )) f I x) dx, kde parametr C v hustotě f I ) představuje alternativní možnost, že C p = C Výše uvedená chyba druhu se dá snadno spočítat, a to pomocí distribuční funkce χ -rozdělení s kn ) stupni volnosti Platí totiž, že β n,k α) = C q α/ s) C qα/ s) u s s/ Γ ) exp s u du, kde pro jednoduchost s = kn ) Pak síla studovaného testu při alternativě C p = C je dána výrazem β n,k α) = H s C ) q α/ s) + Hs C ) q α/ s), kde H s ) je distribuce rozdělení χ o s stupních volnosti, q α/ s) a q α/ s) jsou kvantily χ -rozdělení o s stupních volnosti Když se nyní vrátíme k příkladům s n = 5, k = 0, α = 0, 05, pak zjistíme, že síla výše uvažovaného testu je pro C = 5 3, = 4 3 β 5,0 0, 05) = H 80, 5 0, 36) + H 80, 5 7, 560) Distribuční funkci H kn ) ) rozdělení χ k ) lze snadno vyjádřit pomocí distribuční funkce H kn ) rozdělení χ kn )), totiž Pak síla testu je dána hodnotou H kn )x) = H kn )x ) β 5,0 0, 05) = H 8066, 65) + H 8089, 30) = + 0, 7766 = 0, 7766 Z toho vyplývá, že test založený na průměrném roztylu je o něco silnější nežli testy založené na průměrném rozpětí či průměrné směrodatné odchylce

Literatura [] J Michálek: Odhady koeficientů způsobilosti a jejich vlastnosti, Výzkumná zpráva č 05, ÚTIA AV ČR, červen 00 [] J Michálek: Statistické testy koeficientů způsobilosti, Výzkumná zpráva č 54, ÚTIA AV ČR, prosinec 005 [3] E L Lehman: Testing statistical hypothesis, ruský překlad, Izdatelstvo Nauka, Moskva 964