Akademie věd České republiky Ústav teorie informace a automatizace Academy of Sciences of the Czech Republic Institute of Information Theory and Automation RESEARCH REPORT Jiří Michálek: Hustoty rozdělení pravděpodobnosti pro odhady ukazatele C pk číslo 55 květen 9 ÚTIA AV ČR, P. O. Box 18, 18 8 Prague, Czech Republic Telex: 118 atom c, Fax: (+4) () 688 493 E-mail: utia@utia.cas.cz
This report constitutes an unrefereed manuscript which is intended to be submitted for publication. Any opinions and conclusions expressed in this report are those of the author(s) and do not necessarily represent the views of the Institute.
Hustoty rozdělení pravděpodobnosti pro odhady ukazatele C pk Ukazatel C pk, někdy též značený jako index C pk, je spolu s ukazatelem C p nejčastějším nástrojem pro hodnocení způsobilosti výrobního procesu vyjádřené zde chováním sledovaného znaku jakosti na výrobku, který je procesem produkován. Požadavek na ukazatele C pk dává zákazník či konstruktér a tento požadavek se jednak vztahuje na parametr polohy µ a jednak na úroveň variability σ. V definici ukazatele C pk je míněna tzv. inherentní variabilita, která představuje různorodost jednoho výrobku od druhého, které jsou odebírány ve formě tzv. logických podskupin. Tedy tato variabilita z pohledu času by se dala též charakterizovat jako okamžitá variabilita vyjadřující proměnlivost uvnitř podskupiny. Druhý parametr µ je parametr polohy a vyjadřuje umístění hodnot sledovaného znaku vůči specifikačnímu rozmezí. Parametr µ lze tedy chápat jako těžiště těchto hodnot, které jsou rozmístěny kolem něho právě s mírou variability či rozptýlenosti σ. Za předpokladu, že data lze považovat za normálně rozdělená, vzorec pro ukazatele C pk je následující: C pk = min (C pku, C pkl ), kde C pku = USL µ 3σ, C pkl = µ LSL. 3σ USL a LSL jsou horní a dolní mezní hodnoty. Jestliže je dán požadavek na hodnotu ukazatele C pk, např. C pk = 1, 33, je nutno si uvědomit, že tím nejsou jednoznačně určeny hodnoty parametrů µ a σ. To ale znamená, že zadané pouze hodnoty pro ukazatele C pk nestačí, je nutno bud stanovit hodnotu parametru µ či naopak parametru σ. Hodnota parametru σ vyplývá např. z udání hodnoty ukazatele C p, proto se v praxi nejčastěji udává dvojice C p, C pk pro úplnou charakterizaci požadavků na stav procesu. Dále je nutné si uvědomit, že pokud C p = C pk, je to požadavek na přesné centrování polohy znaku jakosti doprostřed specifikačního rozmezí. Dále při nerovnosti C pk < C p to znamená, že parametr polohy µ nemusí ležet přesně uprostřed specifikačního rozmezí, ale z hodnoy ukazatele C pk nevyplývá, zdali má proces sedět napravo či nalevo od středu specifikačního rozmezí. Pokud bychom požadovali, aby proces byl umístěn napravo od středu, pak jedině explicitně vyjádřením, že v tomto případě je C pk = C pku. Pokud je tedy předepsána hodnota parametru σ, pak z hodnoty pro C pk vyplývá existence dvou hodnot µ a µ + pro parametr polohy, totiž C pku = USL µ + 3σ, C pkl = µ LSL ; 3σ když parametr polohy µ bude bud roven µ či µ +, pak C pk bude roven předepsané hodnotě. Pokud parametr polohy µ bude mezi, tj. µ µ µ +, 1
pak hodnota ukazatele C pk nebude horší. Z definice ukazatele C pk vyplývá, že toto má smysl požadovat, když parametry µ a σ budou v čase neměnné, nebo v praxi téměř neměnné. Tomuto stavu odpovídá stabilita procesu v čase a je nutno toto zajistit, např. pomocí metod SPC, aby bylo možno odpovědně způsobilost procesu analyzovat. Pokud by tento stav tzv. statisticky zvládnutého procesu nebyl dosažen, hodnocení způsobilosti stojí na vodě a obvykle neodpovídá realitě. Tedy na jednu stranu máme hodnotu pro C pk, na druhé straně je reálný proces a je otázka, zdali tento proces je schopen požadavek splnit. Jak se to dozvíme? Jedině tak, že z procesu odebereme nějaké výrobky, na nich sledovaný znak přeměříme, ze získaných dat vypočteme vhodné odhady pro C pk, a ty s danou požadovanou hodnotou zkonfrontujeme pomocí statistické analýzy. Abychom dovedli odhadovat úroveň inherentní variability, potřebujeme, aby data byla zorganizována v podskupinách. Pak přicházejí obvykle následující tři možnosti, jak parametr σ odhadovat: 1. ˆσ R = R d (n). ˆσ S = s C 4 (n) 1/ 1 k n 3. ˆσ I = (x ij x i ), k(n 1) i=1 j=1 kde x ij je j-té pozorování v i-té podskupině, i = 1,,..., k; j = 1,,..., n. R je průměrné rozpětí, tedy R = 1 k R i, R i = max x ij min x ij, k j j s je průměrná směrodatná odchylka z podskupin, tedy i=1 s = 1 k s i, k j=1 s i = x i = 1 n x ij. n j=1 1/ 1 n (x ij x i ), k(n 1) j=1 Parametr µ se odhaduje nejčastěji pomocí tzv. celkového aritmetického průměru x = 1 k n x ij. kn i=1 j=1 Odhad ukazatele C pk, označme ho Ĉpk, pak má tvar: ( USL x Ĉ pk = min, x LSL ), 3ˆσ 3ˆσ
kde ˆσ je jeden z výše uvažovaných odhadů směrodatné odchylky σ. Jestliže data mají individuální charakter, tedy každá podskupina obsahuje pouze jedno pozorování, pak se problém podskupin obvykle řeší pomocí tzv. klouzavého rozpětí, což vlastně znamená vytváření umělých podskupin, např. ze dvou po sobě jdoucích pozorování. Pak lze taktéž uvažovat ony tři typy odhadů inherentní směrodatné odchylky, ale je nutno mít na paměti, že tentokrát se v součtu vyskytují stochasticky závislá data. Dalším problémem je, že tím do hry vstupuje výrazně čas ve formě časového odstupu mezi dvěma sousedními pozorováními. Budeme předpokládat, že data jsou organizována ve formě podskupin o počtu n kusů v podskupině, tento počet je neměnný a máme k dispozici k podskupin. Předpokládejme, že data jsou vzájemně stochasticky nezávislá a normálně rozdělená. Abychom mohli studovat vlastnosti odhadů ukazatele C pk, je nutno nejdříve odvodit distribuční funkce a hustoty rozdělení těchto odhadů. Je zřejmé, že tvar těchto funkcí bude záviset na použitém odhadu směrodatné odchylky, což v literatuře téměř není rozlišováno a v softwarech pro vyhodnocování způsobilosti rovněž. Je několik přístupů, jak odvodit tvar rozdělení pro odhad Ĉpk: 1. Postup založený na součinu dvou nezávislých náhodných veličin Ukazatel C pk se dá vyjádřit jako součin dvou veličin, z nichž jedna je funkcí pouze parametru polohy µ a druhá pouze parametru směrodatné odchylky σ. Platí totiž, že kde K = µ T C pk = (1 K) C p, USL+LSL, přičemž T =, = USL LSL Odtud pro odhad Ĉpk jasně platí, že. Ĉ pk = (1 ˆK) Ĉpk, kde ˆK = x T USL LSL a Ĉ p = = 6ˆσ 3ˆσ. Protože vycházíme z předpokladu, že znak jakosti je normálně rozdělen, pak náhodné veličiny 1 ˆK a Ĉp musí být stochasticky nezávislé. Tento fakt je pak využit pro odvození hustoty rozdělení pravděpodobnosti pro odhad Ĉpk. Hustota pro odhad Ĉp závisí na volbě dohadu směrodatné odchylky a její odvození lze najít v [1]. Potřebujeme tedy odvodit hustotu pro veličinu 1 ˆK. Vyjděme z vyjádření pravděpodobnosti náhodného jevu {1 ˆK < λ, tedy pro λ reálné spočítejme P { 1 ˆK < λ = P { 1 λ < ˆK = 1 P { ˆK 1 λ = 1 3
v případě, že 1 λ <, tedy pro λ > 1, nebot ˆK. Pro λ < 1 máme pak P { ˆK 1 λ = P { x T (1 λ) = = P {T (1 λ) x T + (1 λ) = { kn = P (T µ (1 λ)) σ x µ kn kn (T µ + (1 λ)) = σ σ ( ) ( ) kn kn = Φ (T µ + (1 λ)) Φ (T µ (1 λ)), σ σ protože x má rozdělení N(µ, σ ). Po snadných úpravách máme, že kn P {1 ˆK < λ = 1 Φ ( 3 kn(c pku λc p ) ) + Φ ( 3 kn(λc p C pkl ) ), kde C pkl = µ LSL, C 3σ pku = USL µ. 3σ Derivováním podle λ pak již snadno odvodíme hustotu pro veličinu 1 ˆK: f 1 ˆK(λ) = 3C p kn ( ϕ(3 kn(λcp C pkl )) + ϕ(3 kn(c pku λc p )) ) pro λ 1, a pro λ > 1 je f 1 ˆK(λ) =. (Φ( ) je distribuční funkce od N(, 1), ϕ( ) je její hustota.) Necht fĉp ( ) je hustota rozdělení pravděpodobnosti odhadu Ĉp, pak vzorec pro hustotu odhadu Ĉpk založený na součinu dvou nezávislých náhodných veličin je: fĉpk (x) = fĉpk (x) = x ( ) 1 x u f Ĉ p (u) f 1 ˆK du pro x > u ( ) 1 x u f Ĉ p (u) f 1 ˆK du pro x. u Volbou hustoty fĉp ( ) podle různého odhadu parametru σ dostaneme tři případy pro hustotu fĉpk ( ). Problém je ovšem v tom, že nelze z výše uvedeného vzorce hustotu fĉpk ( ) explicitně vyjádřit, ale lze udělat numerickou studii a numericky vyjádřit odhady kvantilů, což se např. hodí pro konstrukci statisticky pokryvných intervalů pro odhad Ĉpk.. Druhý přístup je založen na následující rovnosti: P { Ĉ pk > λ = P { min (ĈpkL, ĈpkU) > λ = = P { Ĉ pkl > λ, Ĉ pku > λ { x LSL = P > λ, USL x 3ˆσ 3ˆσ > λ. Hledáme tedy podmínky, za nichž jsou obě nerovnosti popisující dva náhodné jevy splněny. Podmínky splnění je nutno rozdělit na 4 možné případy: 4
a) λ >, ˆσ > V tomto případě lze snadno ukázat, že podmínka splnění obou nerovností je LSL + 3λσ < x < USL 3λˆσ, pokud bude USL LSL > 6λˆσ, tedy ˆσ < USL LSL 6λ. b) λ >, ˆσ < Tato situace vede k nerovnosti USL LSL < 6λˆσ, což nemůže být splněno, nebot USL LSL >, ale 6λˆσ <. c) λ <, ˆσ > Tato situace vede k nerovnosti LSL + 3λˆσ < x < USL 3λˆσ, která platí pro každé ˆσ >, protože λ <. d) λ <, ˆσ < Zde dospějeme k nerovnosti USL 3λˆσ < x < LSL + 3λˆσ, která může být splněna jedině pro USL LSL 6λ > ˆσ. Pro λ > shrnutím obou případů a), b) máme, že P { Ĉ pk λ = 1 P { Ĉ pk > λ = = 1 P {LSL + 3λˆσ < x < USL 3λˆσ = { ( ) kn LSL + 3λˆσ µ = 1 P < x µ ( ) USL 3λˆσ µ kn < kn = σ σ σ ( ( )) (( ) ) kn kn = 1 + Φ 3C pkl + 3λ ˆσ σ Φ 3C pku 3λ ˆσ σ Nyní je nutné si uvědomit, že ˆσ σ podle volby odhadu pro ˆσ. Lze snadno ukázat, že při volbě ˆσ = R d (n) je náhodná veličina, která má rozdělení pravděpodobnosti lze hustotu podílu ˆσ σ aproximovat velice dobře, viz [1], hustotou N ( ) 1, β n α, kde αn, β n jsou parametry charakterizující asymptotické chování výběrového rozpětí R z normálního n k rozdělení. Označme g( ) hustotu rozdělení pravděpodobnosti veličiny ˆσ, pak distribuční funkce σ odhadu Ĉpk pro λ > má tvar FĈpk (λ) = P { Ĉ pk λ = = 1 Cp/λ ( Φ ( 3 kn(cpku λu) ) + Φ ( 3 kn(λu C pkl ) )) g(u) du. 5.
Protože C p = C pkl + C pku, pak lze distribuční funkci FĈpk ( ) vyjádřit následovně FĈpk (λ) = 1 Cp /λ (( Φ ( 3 kn(cpk λu) )) Φ ( 3 kn(λu C p + C pk ) )) g(u) du. Vzorec pro odpovídající hustotu fĉpk ( ) pro λ > získáme derivováním integrálu podle parametru. Vyjděme z obecného vzorce F (λ) = B(λ) h(u, λ) du, pak za předpokladů, které jsou splněny (viz []), derivace F (λ) podle parametru λ je F (λ) = B(λ) dh(u, λ) dλ V našem případě B(λ) = C p λ, tedy B (λ) = C p λ, du + h(b(λ), λ) B (λ). h(u, λ) = { Φ ( 3 kn(c pk λu) ) + Φ ( 3 kn(λu C p + C pk ) ) g(u). Odtud je snadno vidět, že pro λ > je hustota pro Ĉpk rovna fĉpk (λ) = Cp /λ 3 kn u { ϕ ( (λu C p + C pk ) 3 kn ) + ϕ ( 3 kn(c pk λu) ) g(u) du. Pro λ vychází hustota rozdělení pravděpodobnosti pro Ĉpk jako součet dvou složek, protože musíme oddělit ˆσ > a ˆσ <. Pak fĉpk (λ) = 3 kn u { ϕ ( 3 kn(λu 3C p + C pk ) ) + ϕ ( 3 kn(c pk λu) ) g(u) du Cp /λ + 3 kn u { ϕ ( 3 kn(λu C pk ) ) + ϕ ( 3 kn(c pk C p λu) ) g(u) du. Pro praktické účely je možno na základě numerických studií položit fĉpk (λ) = pro λ. 3. Postup založený na podmíněné pravděpodobnosti Vyjděme opět ze součinu C pk = (1 K) C p, což v řeči odhadů těchto ukazatelů znamená Ĉ pk = (1 ˆK) Ĉp. Tedy P { Ĉ pk < λ = P { (1 ˆK) Ĉp < λ = + P { (1 ˆK) u < λ Ĉp = u g(u) du, kde g( ) je hustota rozdělení pravděpodobnosti pro veličinu Ĉp. Již víme, že lze uvažovat tři možnosti tvaru této hustoty podle volby odhadu parametru σ. Je nutno ve výše uvedeném vzorci rozlišit dva případy, a to u >, u <. Pro u > se pak jedná o výraz P { (1 ˆK) < λ u 6 Ĉp = u g(u) du,
a pro u < se jedná o výraz Celkem tedy pro λ > P { (1 ˆK) > λ u Ĉp = u g(u) du. FĈpk (λ) = P { Ĉ pk < λ = P (1 ˆK) < λ g(u) du + λ u ( { + 1 P (1 ˆK) < λ ) λ g(u) du + g(u) du, u protože P {(1 ˆK) < x = 1 pro x > 1. Potřebujeme tedy znát distribuční funkci veličiny (1 ˆK), což již bylo odvozeno dříve: zde x = λ u. P { (1 ˆK) < x = 1 Φ ( 3 kn(c pku xc p ) ) + Φ ( 3 kn(λc p C pkl ) ), Derivováním podle proměnné λ dosáhneme implicitního vyjádření pro hustotu odhadu Ĉ pk, totiž pro λ > (pro λ < lze odvodit hustotu fĉpk ( ) obdobně, pro praktické účely lze ji položit jako ) FĈpk (λ) = (( ( 3C p kn ϕ 3 kn(c pku λ )) λ u u C p) + ( +ϕ 3 ( ))) λ n u C p C pkl g(u) du+ (( ( ))) ( 3C p kn λ + ϕ u u C p C pkl ϕ kn { ( C pku λ u C p ))) g(u) du. V případě odhadu Ĉp založeném na pooled směrodatné odchylce část s integrálem pro u < odpadá, protože hustota g( ) je odvozena od χ -rozdělení. Pro λ > 1 je hustota veličiny (1 ˆK) rovna, tím g( ) ze vzorce vypadá. Samozřejmě by bylo možné roli veličin (1 ˆK) a Ĉp v podmínce otočit a dojít tak k vyjádření P { Ĉ pk < λ { + = P Ĉ p < λ (1 z ˆK = z) h(z) dz = { { = 1 P Ĉ p < λ z h(z) dz + 1 P Ĉ p < λ z h(z) dz, opět z toho důvodu, že h(z) = pro z > 1, když h( ) bude hustota veličiny 1 ˆK. V dalším bude provedena srovnávací numerická studie všech tří přístupů k vyjádření hustoty odhadu Ĉpk a porovnání numerických odhadů příslušných kvantilů pro α =, 1,,,, 5,, 95,, 98 a, 99. Studie bude provedena pomocí softwaru MathCad. 7
Numerická studie v Dodatku se věnuje srovnání všech tří přístupů k aproximaci hustoty rozdělení pravděpodobnosti odhadu Ĉpk. Pro určení hranic konfidenčních intervalů a statistiky pokryvných intervalů je nutno odvodit rozdělení veličiny Ĉpk/C pk, tedy Ĉ pk C pk = (1 ˆK) 1 K Ĉp C p. Hodnoty ukazatelů C p a C pk musí být předem stanoveny. Tedy distribuční funkce pro podíl Ĉ pk /C pk má tvar: F (λ) = P { Ĉ pk /C pk < λ = + P u < λ 1 ˆK C p 1 K = u q(u) du, kde q( ) je hustota veličiny (1 ˆK)/(1 K). Tuto hustotu potřebujeme odvodit, proto {Ĉp 1.. 1 ˆK 1 K > 1 ˆK >, protože lze uvažovat, že µ T <, tedy ˆK < 1 {LSL < x < USL. 1 ˆK 1 K < {x > USL či x < LSL. Z toho plyne, že P {Ĉpk < λ C pk = P {Ĉp < λ 1 K C p 1 ˆK +P {Ĉp C p > λ 1 K 1 ˆK x (LSL, USL) + x > USL či x < LSL. Je-li splněna podmínka x (LSL, USL), pak to znamená, že 1 ˆK 1 K < 1, pro podmínku, že x > USL či x < LSL to pak značí, že 1 ˆK 1 K > 1. Tím se distribuční funkce pro podíl Ĉ pk /C pk rozpadá na dvě části. Nejdříve ale musíme odvodit hustotu rozdělení pravděpodobnosti pro veličinu (1 ˆK)/(1 K). Máme Q(u) = P { (1 ˆK)/(1 K) < u { = P 1 ˆK < C pk u, C p 8
protože 1 K = C pk /C p. Odtud již snadno protože ˆK = x T Q(u) = 1 P { x T < u C pk C p σ. Jelikož aritmetický průměr x má rozdělení N (µ, ), pak {( LSL µ Q(u) = 1 P + u ) kn σ σ Cpk x µ < kn < C p σ ( USL µ < u ) kn σ σ Cpk = C p kde Φ( ) je distribuce N(, 1). u C pk Cp = 1 Φ ( 3 kn(c pku C pk u) ) + Φ ( 3 kn(c pk u C pkl ) ), Protože při odvozování je ve výrazu absolutní hodnota x T, pak musí být >, což vede k požadavku, aby Pro u C p C pk je pak automaticky Q(u) = 1. u < C p C pk. Souhrnně tedy, bude-li C pk = C pku, pak distribuce Q(u) pro u < Cp C pk, kn má tvar Q(u) = 1 Φ ( 3 kn(c pk u C pk ) ) + Φ ( 3 kn(u C pk C p + C pk ) ). V případě, že C pk = C pkl, pak distribuce Q(u) pro u < C p C pk má tvar Q(u) = 1 Φ ( 3 kn ( C pk + C p C pk u) ) + Φ ( 3 kn (C pk u C pk ) ). Díky vlastnosti distribuce Φ( ), totiž, že Φ( z) = 1 Φ(z), je snadno vidět, že obě vyjádření pro hodnotu distribuce Q( ) jsou totožné, čili nezávisí na tom, zdali C pk = C pku či C pk = C pkl. Odtud již snadno odvodíme výraz pro hustotu q( ): q(u) = pro u C p C pk, q(u) = 3C pk kn ( φ ( 3 kn(cpk u C pk ) ) + φ ( 3 kn(c pk + u C pk C p ) )) jinak. Tím se dostáváme ke konečnému vyjádření distribuce F ( ) pro podíl Ĉ pk C pk. 9
λ > : F (λ) = P = = {Ĉpk {Ĉp < λ = P C pk P Cp /C pk {Ĉp C p < λ 1 K 1 ˆK < λ q(u) du = C p u {Ĉp P < λ q(u) du. C p u ˆK < 1 = Pak tedy pro λ > protože Ĉp Cp F (λ) = Cp/C pk > s pravděpodobností 1. O P {Ĉp < λ q(u) du, C p u Pro ilustraci uvažujme případ s odhadem parametru σ založeném na R, tedy ˆσ = R d (u). Pak distribuční funkce pro podíl Ĉ p /C p může být velmi dobře aproximována funkcí pak tedy a P ( ( )) {Ĉp.= αn k ˆ1 < µ 1 Φ C β n µ 1, viz [1], P {Ĉp < λ ( ( ) ).= αn k u 1 Φ C p u β n λ 1 P {Ĉp λ ( ( ) ).= αn k u Φ C p u β n λ 1. Souhrnně pak tedy máme vyjádření pro distribuci F ( ): a F (λ) = ( Cp /C pk F (λ) = ( ( ) )) αn k u 1 Φ λ 1 q(u) du pro λ > β n ( (û )) αn k Φ λ 1 q(u) du pro λ <. β n Odtud již snadno derivováním získáme hustotu rozdělení pravděpodobnosti pro veličinu Ĉ pk /C pk : pro λ > : f(λ) = Cp /C pk ( ( ) α ) n k αn k u ϕ β n β n λ 1 u q(u) du λ 1
a pro λ < f(λ) = ( ( ) α ) n k αn k u ϕ β n β n λ 1 u q(u) du λ (pro praktické účely lze položit definitoricky f(λ) = pro λ <, protože f(λ) pro λ < je zanedbatelná). V dodatku jsou uvedeny tabulky kvantilů pro rozdělení pravděpodobnosti podílu Ĉ pk /C pk pro velikost podskupiny n =, 5 a 1 a počet podskupin k = 1,, 5 a 5. Kvantily lze využít následovně: vybereme konfidenční úroveň 1 α, kde např. α =, 1 či, 5. Najdeme odpovídající kvantily q α a q 1 α, pak P { q α Ĉpk q 1 α C pk = 1 α. Odtud snadno odvodíme statistický pokryvný interval pro Ĉpk, totiž či konfidenční interval pro C pk : C pk q α Ĉpk C pk q 1 α, Ĉ pk q 1 α C pk Ĉpk q α. Hustoty rozdělení pravděpodobnosti pro ukazatele C pkl a C pku. Tyto ukazatelé představují základ pro definování ukazatele C pk a používají se především při zadání pouze jediné specifikační meze. Je-li to USL, pak se použije C pku, při zadání LSL se pracuje s C pkl. C pkl = µ LSL 3σ, C pku = USL µ, 3σ kde µ je parametr polohy a σ je směrodatná odchylka inherentní variability sledovaného znaku jakosti. Definice obou ukazatelů v tomto pojetí předpokládá normální rozdělení N(µ, σ ) znaku jakosti. Reálný stav procesu pak vyjadřují jejich odhady ĈpkL a ĈpkU, kde parametr µ je odhadován aritmetickým průměrem x ze všech dat a parametr σ je odhadován pomocí některého odhadu směrodatné odchylky σ, tedy ˆσ R = R d (u), ˆσ S = s 1/ C 4 (u), ˆσ 1 k n I = (x ij x i ). k(n 1) i=1 j=1 Jde tedy o to odvodit tvar rozdělení těchto odhadů ukazatelů C pkl a C pku podle použitého odhadu úrovně inherentní variability. Je předpokládáno, že data jsou organizována do 11
podskupin o rozsahu n a jsou mezi sebou navzájem nezávislá. Z předpokladu o normalitě dat vyplývá, že veličiny x a ˆσ jsou vzájemně nezávislé. Hustoty odhadů ĈpkL a Ĉ pku odvodíme na základě vzorce pro hustotu podílu dvou nezávislých náhodných veličin f(v) = + z f X (vz) f Y (z) dz, kde f X ( ) je hustota čitatele, f Y ( ) je hustota jmenovatele v podílu X/Y. Zde máme X = x LSL a Y = ˆσ 3 R či ˆσ S či ˆσ I. Nejdříve probereme případ s Y = ˆσ R. Je zřejmé, že na základě rozdělení pro x: ( x LSL µ LSL N, 3 3 odhad ˆσ R má přibližné rozdělení N ( ) σ, β nσ. kα n σ ), 9kn Pak dosazením do obecného vzorce pro hustotu podílu dojdeme k integrálu + f(v) = z 3kα { n n πβ n σ exp 9kn ( ) vz µ + LSL ( ) α nk z σ dz. σ σ Integrál rozdělíme na dvě části (, ) (, + ) a po substituci t = z získáváme σ + f(v) = t 3kα { n n exp 9kn πβ n (vt 3C) α nk (t 1) dt, kde hodnota C pkl = C. Pro další výpočet integrálu rozdělíme opět na dvě části: f + (v) = 3kα n n { 3kn(vt 3C) t exp α nk (t 1) dt πβ n βn f (v) = 3kα n n { 3kn(vt 3C) t exp α nk (t 1) dt. πβ n βn Pak f(v) = f + (v) f (v). V dalším použijeme následující vzorec: t e at bt dt = 1 a b { [ ( )] π b b a a exp 1 erf, a a kde a >. V našem případě máme ( označme ještě d = k a = k ( 9C n + α n β n f(v) = 3α nk n πβ n nv + α n β n ), b = k ( β n Cnv + α n β n β n ). Pak hustota f( ) má explicitní vyjádření: [ 1 e d a + b π n 3/ eb /4a ( Φ ) ( ) )] b 1. a, Pro ilustraci uved me grafické vyjádření hustoty pro C pkl při k = 3, n = 3 a C pkl = 1, α n = 1, 693, β n =, 888. 1
.5 1 1.5 x Ihned je vidět, že rozdělení odhadu ukazatele C pku, tedy veličina ĈpkU, má tentýž tvar hustoty s tím, že C = C pku, protože rozdělení čitatele USL x je v tom případě 3 ( USL µ N, 3 σ ). 9kn Pokud by nás zajímala hustota podílu ĈpkL/C pkl, pak použijeme obecný vzorec pro hustotu podílu náhodné veličiny a nenulového čísla, a získáme (g( ) je hustota pro ĈpkL/C pkl ) g(v) = C pkl f(c pkl v). Tento tvar hustoty se hodí pro numerické řešení nalezení konfidenčních mezí pro ukazatele C pkl či odvození statistického pokryvného intervalu pro hodnoty odhadu ĈpkL při zadané hodnotě ukazatele C pkl. Jestliže bychom použili odhad ˆσ S, pak se tvar výsledné hustoty pro odhad ĈpkL nezmění, jenom místo α n, β n budou konstanty a n 1 a b n 1 spojené s rozdělením výběrové směrodatné odchylky. Jiná situace bude v případě použití tzv. pooled standard deviation ˆσ I. Její rozdělení je odvoditelné od rozdělení χ o k(n 1) stupních volnosti a má tvar r(x) = k(n 1) x σ f χ ( k(n 1) x σ, k(n 1) kde f χ (, k(n 1)) je hustota χ -rozdělení o k(n 1) stupních volnosti. Podrobněji r(x) = k(n 1) ( ) k(n 1) k(n 1) x 1 { σ k(n 1) Γ ( k(n 1) x ) exp x pro x. k(n 1) σ σ ), 13
Na základě obecného vzorce pro hustotu podílu dvou nezávislých náhodných veličin, zde x LSL 3 a ˆσ I, získáme vzorec pro hustotu odhadu ĈpkL při použití odhadu směrodatné odchylky založeném na pooled deviation. f(v) = 3 kn π Pro zjednodušení zaved me β(v) = 1 exp [k(n 1) k(n 1) ] 1 Γ ( ) t k(n 1) k(n 1) { 9kn { (vt C pkl) k(n 1) exp k(n 1) pak lze hustotu f( ) přepsat do tvaru f(v) = 3 kn π = 3 kn π k(n 1) ( 9knv + k(n 1) ), γ(v) = 9kn C pkl v, [k(n 1)] k(n 1) { 1 Γ ( ) exp 9kn C pkl k(n 1) t k(n 1) exp { β(v) t γ(v) t dt = [k(n 1)] k(n 1) { 1 Γ ( ) exp k(n 1) k(n 1) 9kn C pkl [β(v)] k(n 1)+1 Γ (k(n 1) + 1) exp { γ (v) 8β(v) t dt. D k(n 1) 1 γ(v), β(v) kde funkce D r ( ) patří do rodiny tzv. funkcí parabolického válce a pro r > je tato funkce definována jako: D r (z) = e z 4 x zx e x r 1 dx. Γ(r) Hustotu f( ) lze napsat taky v poněkud jednodušším tvaru, a to f(v) = 3 kn[k(n 1)] k(n 1) k(n 1)+1 β(v) k(n 1)+1 k(n 1) π 1 Γ ( ) k(n 1) exp { 9kn C pkl e x γ(v) x β(v) dx. Aproximace hustoty rozdělení pravděpodobnosti odhadu Ĉpk. Z předchozího odvozování tvaru hustoty pro odhad Ĉpk je vidět, že se velice těžko dopracujeme explicitního vyjádření tvaru hustoty. Kdybychom takové explicitní vyjádření 14
ve tvaru vhodného vzorce měli, tak získání požadovaných kvantilů pro konstrukci statistického pokryvného intervalu by bylo možno snadno získat. V literatuře (např. []) lze najít odhady kvantilů či odkazy na další literaturu, kde jsou vhodné odhady kvantilů navrženy a studovány, ale aproximovat celou hustotu jinou vhodnou hustotou zatím studováno nebylo. Na základě numerické studie lze předpokládat, že relativně dobrou aproximací hustoty odhadu Ĉpk se jeví hustota odhadu ĈpkL, resp. Ĉ pku, která byla odvozena v přechozím. Jestliže se bude lišit hodnota C p od C pk, tedy C p > C pk více, tím spíše se chování odhadu Ĉ pk bude blížit chování odhadu Ĉpk či ĈpkU podle toho, na které straně od centra tolerančního rozmezí bude umístěn parametr polohy. Horší aproximaci lze tedy očekávat v těch případech, kdy C p = C pk (požadavek na přesné centrování) či C p bude málo odlišné od C pk. Necht jsou dány požadované hodnoty ukazatelů C p a C pk. Dále máme k dispozici data organizovaná do podskupin rozsahu n a počet podskupin je k. Odhad inherentní variability (parametr σ) bude odhadován pomocí R, resp. pomocí s. Výše byla odvozena hustota pro odhad ĈpkL, resp. Ĉ pku na základě vzorce pro podíl dvou nezávislých náhodných veličin. Pro odhady směrodatné odchylky σ, a to R/d (u) a s/c 4 (u), lze odvodit explicitní tvar hustoty pro odhady ĈpkL, resp. Ĉ pku, a to ve formě + fc pkl ˆ (x) = y f Y (xy) f Y (y) dy, kde f X ( ) je hustota rozdělení N ( ) 1 C pkl, 9kn, fy ( ) je hustota rozdělení N ( ) βn 1, α ; po nk dosazení těchto hustot do vzorce a potřebných výpočtech dojdeme k vyjádření ve tvaru: fĉpkl (x) = 3kα [ n n 1 exp { d πβ n A(x) + B(x) { π B ] A(x) A(x) exp (x) A(x) Φ B(x) A(x) Φ B(x) A(x), kde d = 1 ( ) 9kn CpkL + α nk βn A(x) = 1 ( ) 9kn x + α nk βn B(x) = 1 ( ) 9kn C pkl x + α nk βn a Φ( ) je distribuční funkce pro N(, 1). Toto je aproximace pro případ odhadu parametru σ pomocí R/d (u). V případě odhadu σ pomocí s/c 4 (n) se ve vzorci místo α n, β n použijí parametry a n 1, b n 1 již dříve zmíněné. 15
Vhodnost aproximace ověříme na numerické studii provedené pomocí software Math- Cad. Studie je uvedena v Dodatku. Literatura [1] J. Michálek: Odhady koeficientů způsobilosti a jejich vlastnosti. Výzkumná zpráva 16, červen 1, ÚTIA AV ČR. [] S. Kotz, C. R. Lovelace: Process Capability Indices in Theory and Practice. Arnold, London 1998. 16
DODATEK obsahující numerické studie: 1. porovnání tří přístupů k výpočtu hustoty odhadu indexu Cpk. vliv volby odhadu pro směrodatnou odchylku na tvar hustoty odhadu indexu Cpk 3. porovnání hodnot kvantilů rozdělení odhadu indexu Cpk s kvantily rozdělení odhadu indexu CpkL 4. tabulka hodnot důležitých kvantilů rozdělení podílu odhadu indexu Cpk a hodnoty indexu Cpk
Numerická studie porovnávající 3 uvažované přístupy k výpočtu hustoty rozdělení pravděpodobnosti odhadu ukazatele Cpk Studie provádí srovnání tří přístupů k vyjádření hustoty odhadu ukazatele Cpk, které jsou rozebírány v práci. Srovnání je provedeno na základě výpočtu vybraných kvantilů pro rozsah podskupiny n=3,5 a 1 a pro počet podskupin k=1,15,,5,5 a 1. Jednotlivé přístupy jsou označeny Součin, Min a Podm.pst. podle základního principu odvození tvaru hustoty. Srovnání bylo provedeno pro hustotu založenou na odhadu inherentní směrodatné odchylky pomocí výběrového rozpětí R. Součin Cp=1,67 Cpk=1,33 n=3 k=1 15 5 5 1,1,94,996 1,31 1,57 1,16 1,179,,975 1,7 1,6 1,84 1,147 1,195,5 1,31 1,77 1,15 1,16 1,179 1,,5 1,33 1,33 1,33 1,33 1,33 1,33,95 1,843 1,7 1,658 1,616 1,51 1,46,98,35 1,856 1,764 1,76 1,577 1,496,99,185 1,958 1,843 1,77 1,616 1,51 Min Cp=1,67 Cpk=1,33 n=3 k=1 15 5 5 1,1,94,996 1,31 1,57 1,16 1,179,,975 1,7 1,6 1,84 1,147 1,195,5 1,81 1,77 1,15 1,16 1,179 1,,5 1,33 1,33 1,33 1,33 1,33 1,33,95 1,84 1,7 1,657 1,616 1,51 1,46,98,34 1,856 1,764 1,76 1,577 1,496,99,185 1,958 1,843 1,771 1,616 1,51 Podm. Pst. Cp=1,67 Cpk=1,33 n=3 k=1 15 5 5 1,1,94,996 1,31 1,57 1,16 1,179,,975 1,7 1,6 1,84 1,147 1,195,5 1,81 1,77 1,15 1,16 1,179 1,,5 1,33 1,33 1,33 1,33 1,33 1,33,95 1,84 1,7 1,657 1,616 1,51 1,46,98,34 1,856 1,764 1,76 1,577 1,496,99,185 1,957 1,843 1,771 1,616 1,51
Součin Cp=1,67 Cpk=1,33 n=5 k=1 15 5 5 1,1 1,8 1,74 1,13 1,14 1,178 1,19, 1,57 1,99 1,16 1,145 1,194 1,31,5 1,13 1,139 1,16 1,178 1,19 1,5,5 1,33 1,33 1,33 1,33 1,33 1,33,95 1,66 1,588 1,549 1,5 1,461 1,4,98 1,767 1,668 1,614 1,579 1,497 1,444,99 1,846 1,75 1,66 1,618 1,5 1,461 Min Cp=1,67 Cpk=1,33 n=5 k=1 15 5 5 1,1 1,8 1,74 1,13 1,14 1,178 1,19, 1,57 1,99 1,16 1,145 1,194 1,31,5 1,13 1,139 1,16 1,178 1,19 1,5,5 1,33 1,33 1,33 1,33 1,33 1,33,95 1,66 1,588 1,549 1,5 1,461 1,4,98 1,767 1,668 1,614 1,579 1,497 1,444,99 1,846 1,75 1,66 1,618 1,5 1,461 Podm. Pst. Cp=1,67 Cpk=1,33 n=5 k=1 15 5 5 1,1 1,8 1,74 1,13 1,14 1,178 1,19, 1,57 1,99 1,16 1,145 1,194 1,31,5 1,13 1,139 1,16 1,178 1,19 1,5,5 1,33 1,33 1,33 1,33 1,33 1,33,95 1,66 1,588 1,549 1,5 1,461 1,4,98 1,767 1,668 1,614 1,579 1,497 1,444,99 1,846 1,75 1,66 1,618 1,5 1,461 Součin Cp=1,67 Cpk=1,33 n=1 k=1 15 5 5 1,1 1,16 1,14 1,164 1,18 1, 1,51, 1,18 1,161 1,181 1,196 1,3 1,6,5 1,164 1,19 1,9 1, 1,51 1,73,5 1,33 1,33 1,33 1,33 1,33 1,33,95 1,545 1,51 1,176 1,459 1,419 1,39,98 1,69 1,55 1,517 1,495 1,443 1,48,99 1,655 1,584 1,545 1,5 1,459 1,419
Min Cp=1,67 Cpk=1,33 n=1 k=1 15 5 5 1,1 1,16 1,14 1,164 1,18 1, 1,51, 1,18 1,161 1,181 1,196 1,3 1,6,5 1,164 1,19 1,9 1, 1,51 1,73,5 1,33 1,33 1,33 1,33 1,33 1,33,95 1,545 1,51 1,476 1,459 1,419 1,39,98 1,69 1,55 1,517 1,495 1,443 1,48,99 1,655 1,584 1,545 1,5 1,459 1,419 Podm. Pst. Cp=1,67 Cpk=1,33 n=1 k=1 15 5 5 1,1 1,16 1,14 1,164 1,18 1, 1,51, 1,18 1,161 1,181 1,196 1,3 1,6,5 1,164 1,19 1,9 1, 1,51 1,73,5 1,33 1,33 1,33 1,33 1,33 1,33,95 1,545 1,51 1,476 1,459 1,419 1,39,98 1,69 1,55 1,517 1,495 1,443 1,48,99 1,655 1,584 1,545 1,5 1,459 1,419 Na základě tohoto srovnání lze tvrdit, že pro numerické vyjádření průběhu hustoty rozdělení pravděpodobnosti pro odhad ukazatele Cpk jsou všechny tři přístupy uvedené v práci naprosto ekvivalentní a rozdíly v hodnotách příslušných kvantilů, pokud nějaké jsou, pak jsou v tisicinách.
Numerická studie o vlivu volby odhadu směrodatné odchylky Srovnání kvantilů rozdělení pravděpodobnosti odhadu ukazatele Cpk vůči použitému odhadu inherentní směrodatné odchylky σ R, σ s, σ I : n=velikost podskupiny, k=počet podskupin, α= pravděpodobnost odpovídající příslušnému kvantilu Výpočet kvantilů je založen na tvaru příslušné hustoty odhadu ukazatele Cpk odvozeném od součinu veličin 1-K a Cp Cp=1,33 Cpk=1 n=3 k 1 15 5 5 1 α R s I R s I R s I R s I R s I R s I,1,696,697,75,74,74,748,768,768,775,788,788,794,84,84,847,883,884,887,,74,74,734,763,764,774,79,791,798,89,89,816,858,858,863,896,896,9,5,768,768,78,83,84,813,86,86,834,84,84,849,883,884,889,915,915,919,5 1 1 1,16 1 1 1,11 1 1 1,8 1 1 1,6 1 1 1,3 1 1 1,,95 1,393 1,391 1,377 1,31 1,3 1,9 1,5 1,51 1,4 1, 1,19 1,11 1,147 1,146 1,141 1,1 1,1 1,96,98 1,539 1,536 1,497 1,43 1,4 1,377 1,333 1,331 1,313 1,89 1,88 1,7 1,19 1,189 1,18 1,18 1,17 1,1,99 1,654 1,65 1,586 1,481 1,478 1,44 1,393 1,391 1,363 1,338 1,337 1,315 1, 1,19 1,7 1,147 1,146 1,139 Cp=1,33 Cpk=1 n=5 k 1 15 5 5 1 α R s I R s I R s I R s I R s I R s I,1,,5,5,95,98,99,764,768,771,8,83,87,83,86,89,839,84,845,88,844,886,914,915,917,787,79,795,8,83,87,841,844,847,856,858,861,894,896,896,93,95,96,83,86,83,851,854,859,869,871,875,88,884,887,914,915,918,938,939,94 1 1 1,8 1 1 1,5 1 1 1,4 1 1 1,3 1 1 1, 1 1 1,1 1,54 1,48 1,45 1, 1,195 1,19 1,169 1,165 1,16 1,149 1,145 1,143 1,11 1,99 1,97 1,7 1,68 1,67 1,337 1,38 1,316 1,61 1,54 1,46 1,19 1,14 1,7 1,19 1,187 1,18 1,19 1,16 1,13 1,89 1,87 1,85 1,397 1,386 1,367 1,34 1,97 1,84 1,54 1,48 1,39 1, 1,17 1,9 1,149 1,145 1,141 1,11 1,99 1,96 Cp=1,33 Cpk=1 n=1 k 1 15 5 5 1 α R s I R s I R s I R s I R s I R s I,1,,5,5 1 1 1,4 1 1 1, 1 1 1, 1 1 1,1 1 1 1,1 1 1 1,95,98,99,85,834,836,853,861,86,871,878,879,883,89,891,915,9,91,938,94,943,843,851,853,868,876,877,884,891,89,895,9,93,94,99,99,945,949,949,871,878,88,89,898,9,95,911,913,915,9,91,938,94,943,956,959,959 1,166 1,153 1,153 1,13 1,1 1,1 1,113 1,14 1,14 1,1 1,93 1,9 1,69 1,64 1,64 1,48 1,45 1,44 1,16 1,198 1,195 1,17 1,157 1,155 1,145 1,133 1,13 1,17 1,118 1,116 1,87 1,81 1,8 1,6 1,56 1,56 1,5 1,9 1,5 1,197 1,18 1,178 1,166 1,153 1,151 1,147 1,135 1,133 1,1 1,93 1,91 1,69 1,64 1,63
Cp=1,67 Cpk=1,33 n=3 k 1 15 5 5 1 α R s I R s I R s I R s I R s I R s I,1,,5,5,95,98,99,94,941,95,996,996 1,6 1,31 1,3 1,41 1,57 1,58 1,66 1,16 1,16 1,133 1,179 1,18 1,185,975,976,988 1,7 1,7 1,38 1,6 1,61 1,7 1,84 1,84 1,93 1,147 1,147 1,154 1,195 1,196 1,1 1,31 1,3 1,48 1,77 1,77 1,9 1,15 1,16 1,117 1,16 1,16 1,136 1,179 1,18 1,187 1, 1, 1,5 1,33 1,33 1,35 1,33 1,33 1,345 1,33 1,33 1,341 1,33 1,33 1,339 1,33 1,33 1,334 1,33 1,33 1,33 1,843 1,84 1,81 1,7 1,71 1,76 1,658 1,656 1,644 1,616 1,615 1,64 1,51 1,5 1,513 1,46 1,459 1,455,35,31 1,977 1,856 1,854 1,8 1,764 1,76 1,736 1,76 1,74 1,683 1,577 1,576 1,563 1,496 1,495 1,488,185,18,9 1,958 1,955 1,9 1,843 1,84 1,8 1,77 1,77 1,739 1,616 1,615 1,598 1,51 1,5 1,51 Cp=1,67 Cpk=1,33 n=5 k 1 15 5 5 1 α R s I R s I R s I R s I R s I R s I,1,,5,5,95,98,99 1,8 1,33 1,38 1,74 1,78 1,83 1,13 1,17 1,111 1,14 1,17 1,131 1,178 1,181 1,184 1,19 1,1 1,3 1,57 1,6 1,68 1,99 1,13 1,18 1,16 1,13 1,134 1,145 1,148 1,15 1,194 1,197 1, 1,31 1,33 1,85 1,13 1,17 1,115 1,139 1,143 1,149 1,16 1,165 1,17 1,178 1,181 1,185 1,19 1,1 1,4 1,5 1,51 1,53 1,33 1,33 1,341 1,33 1,33 1,337 1,33 1,33 1,335 1,33 1,33 1,334 1,33 1,33 1,33 1,33 1,33 1,331 1,66 1,651 1,646 1,588 1,58 1,578 1,549 1,543 1,539 1,5 1,518 1,514 1,461 1,458 1,455 1,4 1,418 1,416 1,767 1,755 1,739 1,668 1,659 1,648 1,614 1,66 1,598 1,579 1,57 1,565 1,497 1,493 1,489 1,444 1,44 1,439 1,846 1,831 1,85 1,75 1,714 1,697 1,66 1,651 1,638 1,618 1,611 1,6 1,5 1,518 1,51 1,161 1,458 1,454 Cp=1,67 Cpk=1,33 n=1 k 1 15 5 5 1 α R s I R s I R s I R s I R s I R s I,1,,5,5,95,98,99 1,16 1,119 1,1 1,14 1,153 1,154 1,164 1,174 1,175 1,18 1,189 1,19 1, 1,8 1,8 1,51 1,56 1,57 1,18 1,14 1,143 1,161 1,171 1,173 1,181 1,191 1,19 1,196 1,4 1,6 1,3 1,39 1,4 1,6 1,64 1,65 1,164 1,174 1,177 1,19 1, 1,3 1,9 1,16 1,18 1, 1,8 1,9 1,51 1,56 1,57 1,73 1,77 1,78 1,33 1,33 1,335 1,33 1,33 1,333 1,33 1,33 1,33 1,33 1,33 1,33 1,33 1,33 1,331 1,33 1,33 1,33 1,545 1,57 1,57 1,51 1,487 1,487 1,476 1,464 1,464 1,459 1,449 1,448 1,419 1,41 1,41 1,39 1,387 1,387 1,69 1,585 1,581 1,55 1,53 1,59 1,517 1,5 1,499 1,495 1,48 1,48 1,443 1,434 1,433 1,48 1,4 1,41 1,655 1,66 1,619 1,584 1,563 1,558 1,545 1,57 1,54 1,5 1,54 1,51 1,459 1,449 1,447 1,419 1,41 1,411 Shrnutí numerické studie: Na základě velikosti kvantilového rozpětí lze tvrdit, že nejkratší rozpětí vykazuje použití pooled standard deviation, zatím co obě dvě zbývající možnosti jsou prakticky rovnocenné pro malý rozsah podskupiny, ale začínají se lišit při větším rozsahu podskupiny ve prospěch klasické směrodatné odchylky. Zde ještě hraje roli počet uvažovaných podskupin a lze říci, že s rostoucím počtem podskupin se rozdíly mezi uvažovanými odhady inherentní směrodatné odchylky stírají.
Numerická studie porovnání kvantilů rozdělení pravděpodobnosti odhadu ukazatele Cpk a odhadu ukazatele CpkL (aproximace hustoty odhadu Cpk pomocí hustoty odhadu CpkL) k=počet podskupin n=velikost podskupiny α Cpk CpkL Cpk CpkL Cpk CpkL Cpk CpkL,1 Cp=1,746,765 Cp=1,33,764,765 Cp=1,89,84 Cp=1,33,83,84, Cpk=1,767,787 Cpk=1,787,787 Cpk=1,86,841 Cpk=1,841,841,5 CpkL=1,8,83 CpkL=1,83,83 CpkL=1,85,869 CpkL=1,869,869,5 k=1,963 1 k=1 1 1 k=,974 1 k= 1 1,95 n=5 1,198 1,55 n=5 1,54 1,55 n=5 1,131 1,169 n=5 1,169 1,169,98 1,75 1,337 1,337 1,337 1,178 1, 1,19 1,,99 1,33 1,398 1,397 1,389 1,1 1,56 1,54 1,56 α Cpk CpkL Cpk CpkL Cpk CpkL Cpk CpkL,1 Cp=1,87,881 Cp=1,33,88,881 Cp=1,97,9 Cp=1,33,914,9, Cpk=1,884,894 Cpk=1,894,894 Cpk=1,916,97 Cpk=1,93,97,5 CpkL=1,9,814 CpkL=1,914,914 CpkL=1,99,94 CpkL=1,938,94,5 k=5,983 1 k=5 1 1 k=1,988 1,1 k=1 1 1,1,95 n=5 1,79 1,11 n=5 1,11 1,11 n=5 1,54 1,73 n=5 1,7 1,73,98 1,15 1,19 1,19 1,19 1,7 1,99 1,89 1,99,99 1,13 1,148 1,149 1,148 1,84 1,11 1,11 1,11 α Cpk CpkL Cpk CpkL Cpk CpkL Cpk CpkL,1 Cp=1,33,764,765 Cp=1,67,764,765 Cp=1,33,83,84 Cp=1,67,83,84, Cpk=1,33,787,787 Cpk=1,33,787,787 Cpk=1,33,841,841 Cpk=1,33,841,841,5 CpkL=1,33,83,83 CpkL=1,33,83,83 CpkL=1,33,869,869 CpkL=1,33,869,869,5 k=1 1 1 k=1 1 1 k= 1 1 k= 1 1,95 n=5 1,54 1,55 n=5 1,54 1,55 n=5 1,169 1,169 n=5 1,169 1,169,98 1,337 1,337 1,337 1,337 1,19 1, 1,19 1,,99 1,397 1,398 1,397 1,398 1,54 1,56 1,54 1,56 α Cpk CpkL Cpk CpkL Cpk CpkL Cpk CpkL,1 Cp=1,33,88,881 Cp=1,67,88,881 Cp=1,33,914,9 Cp=1,67,914,9, Cpk=1,33,894,894 Cpk=1,33,894,894 Cpk=1,33,93,97 Cpk=1,33,93,97,5 CpkL=1,33,914,914 CpkL=1,33,914,914 CpkL=1,33,938,94 CpkL=1,33,938,94,5 k=5 1 1 k=5 1 1 k=1 1 1,1 k=1 1 1,1,95 n=5 1,11 1,11 n=5 1,11 1,11 n=5 1,7 1,73 n=5 1,7 1,73,98 1,19 1,19 1,19 1,19 1,89 1,99 1,89 1,99,99 1,149 1,148 1,149 1,148 1,11 * 1,11 * Shrnutí numerické studie: Studie odhalila zajímavé zjištění, že studovaná aproximace hustoty odhadu ukazatele Cpk je lepší, čím je větší odstup mezi ukazateli Cp a Cpk. Když Cpk=Cp, pak jsou rozdíly řádově v 5-6ti setinách. Rovněž rozdíly se zmenšují, pokud rostou hodnoty ukazatelů a počet podskupin. Největší rozdíly se vyskytují, když Cp=Cpk=1 a při malém počtu podskupin. Lze ale říci, že pro praktické účely je navrhovaná aproximace uspokojivá.
Numerická studie kvantilů rozdělení pravděpodobnosti pro podíl odhadcpk/cpk k=počet podskupin n=velikost podskupiny Cp=1 n=3 Cpk = ρ Cp k=1 k= k=5 k=5 α ρ=1,75,67 ρ=1,75,67 ρ=1,75,67 ρ=1,75,67,1,683,687,676,757,76,754,778,783,776,834,838,834,5,719,78,7,786,795,789,85,813,88,855,86,858,5,75,767,759,813,85,819,89,841,836,874,883,879,5,968 1,16 1,16,974 1,8 1,8,976 1,6 1,6,98 1,3 1,3,95 1,99 1,39 1,4 1,191 1,5 1,58 1,167 1, 1,5 1,111 1,148 1,151,975 1,383 1,486 1,496 1,4 1,38 1,315 1,1 1,69 1,75 1,139 1,178 1,183,99 1,491 1,68 1,6 1,34 1,378 1,386 1,63 1,38 1,335 1,173 1,16 1,1 Cp=1,33 n=3 Cpk = ρ Cp k=1 k= k=5 k=5 α ρ=1,75,67 ρ=1,75,67 ρ=1,75,67 ρ=1,75,67,1,697,75,699,768,775,77,788,794,79,841,847,844,5,73,744,739,796,86,8,814,83,8,86,869,866,5,765,78,775,88,834,831,838,849,846,88,889,887,5,98 1,16 1,16,98 1,8 1,8,984 1,6 1,6,987 1,3 1,3,95 1,31 1,377 1,38 1,119 1,4 1,45 1,174 1,1 1,14 1,116 1,141 1,143,975 1,396 1,468 1,474 1,5 1,96 1,3 1,17 1,58 1,6 1,144 1,171 1,174,99 1,56 1,586 1,593 1,31 1,363 1,368 1,71 1,315 1,3 1,178 1,7 1,1 Cp=1,67 n=3 Cpk = ρ Cp k=1 k= k=5 k=5 α ρ=1,75,67 ρ=1,75,67 ρ=1,75,67 ρ=1,75,67,1,75,714,71,774,781,778,793,8,798,845,851,849,5,74,75,748,8,811,89,819,88,86,866,87,871,5,77,786,784,88,839,837,843,853,851,884,89,89,5,987 1,17 1,17,988 1,8 1,8,988 1,7 1,7,99 1,3 1,3,95 1,31 1,37 1,374 1,5 1,37 1,39 1,179 1,7 1,9 1,119 1,138 1,14,975 1,45 1,46 1,464 1,56 1,9 1,93 1, 1,53 1,55 1,147 1,167 1,169,99 1,515 1,576 1,58 1,318 1,356 1,359 1,76 1,39 1,31 1,181 1,3 1,5
Cp=1 n=5 Cpk = ρ Cp k=1 k= k=5 k=5 α ρ=1,75,67 ρ=1,75,67 ρ=1,75,67 ρ=1,75,67,1,753,756,747,815,818,81,83,835,89,876,879,875,5,78,79,78,838,844,839,858,859,854,89,897,893,5,89,81,814,858,871,863,871,88,876,96,913,91,5,971 1,8 1,5,978 1,4 1,4,98 1,3 1,3,985 1, 1,,95 1,188 1,57 1,63 1,14 1,171 1,175 1,19 1,15 1,154 1,74 1,1 1,15,975 1,138 1,314 1,3 1,156 1,7 1,1 1,137 1,18 1,187 1,93 1,13 1,17,99 1,31 1,385 1,394 1,195 1,51 1,57 1,171 1, 1,6 1,115 1,148 1,15 Cp=1,33 n=5 Cpk = ρ Cp k=1 k= k=5 k=5 α ρ=1,75,67 ρ=1,75,67 ρ=1,75,67 ρ=1,75,67,1,765,771,766,83,89,85,839,844,841,885,889,888,5,793,83,799,846,53,85,86,867,864,9,96,94,5,819,83,88,866,875,873,879,887,885,914,9,919,5,98 1,8 1,8,984 1,4 1,4,985 1,3 1,3,99 1, 1,,95 1,197 1,45 1,49 1,13 1,16 1,165 1,115 1,143 1,145 1,8 1,95 1,96,975 1,48 1,99 1,34 1,16 1,197 1, 1,14 1,173 1,176 1,9 1,114 1,116,99 1,31 1,367 1,373 1,1 1,39 1,43 1,176 1,9 1,13 1,11 1,137 1,139 Cp=1,67 n=5 Cpk = ρ Cp k=1 k= k=5 k=5 α ρ=1,75,67 ρ=1,75,67 ρ=1,75,67 ρ=1,75,67,1,771,779,776,88,834,83,844,849,847,885,889,888,5,8,89,87,85,858,856,864,871,869,9,96,94,5,86,837,835,87,879,877,883,891,889,914,9,919,5,986 1,8 1,8,988 1,4 1,4,989 1,3 1,3,99 1, 1,,95 1,3 1,39 1,4 1,134 1,158 1,16 1,118 1,139 1,141 1,8 1,95 1,96,975 1,53 1,9 1,95 1,166 1,19 1,194 1,146 1,169 1,171 1,99 1,114 1,116,99 1,316 1,359 1,363 1,5 1,33 1,36 1,18 1,4 1,6 1,11 1,137 1,139 Cp=1 n=1 Cpk = ρ Cp k=1 k= k=5 k=5 α ρ=1,75,67 ρ=1,75,67 ρ=1,75,67 ρ=1,75,67,1,8,84,817,868,871,866,881,883,879,914,915,91,5,844,849,844,885,89,886,896,91,897,95,98,96,5,863,87,867,9,97,93,91,916,913,935,939,937,5,977 1,3 1,3,983 1, 1,,985 1,1 1,1,989 1,1 1,1,95 1,115 1,16 1,166 1,78 1,11 1,113 1,69 1,97 1,1 1,48 1,67 1,69,975 1,145 1,196 1,1 1,98 1,133 1,137 1,86 1,117 1,11 1,59 1,81 1,83,99 1,181 1,37 1,44 1,11 1,159 1,164 1,17 1,141 1,145 1,73 1,97 1,1
Cp=1,33 n=1 Cpk = ρ Cp k=1 k= k=5 k=5 α ρ=1,75,67 ρ=1,75,67 ρ=1,75,67 ρ=1,75,67,1,831,835,83,875,879,876,887,891,888,918,91,919,5,85,859,853,891,897,894,9,97,95,99,933,931,5,871,88,878,96,913,911,915,91,919,939,943,94,5,984 1,4 1,4,989 1, 1,,989 1,1 1,1,99 1,1 1,1,95 1,11 1,153 1,156 1,8 1,14 1,16 1,7 1,9 1,94 1,5 1,64 1,65,975 1,15 1,185 1,189 1,11 1,15 1,18 1,9 1,111 1,113 1,6 1,76 1,78,99 1,186 1,5 1,9 1,15 1,151 1,154 1,11 1,133 1,136 1,75 1,91 1,93 Cp=1,67 n=1 Cpk = ρ Cp k=1 k= k=5 k=5 α ρ=1,75,67 ρ=1,75,67 ρ=1,75,67 ρ=1,75,67,1,836,841,839,879,883,881,89,894,893,9,93,9,5,857,864,86,895,9,899,95,91,99,931,935,934,5,876,884,883,99,916,914,918,94,93,941,945,944,5,988 1,4 1,4,991 1, 1,,991 1,1 1,1,994 1,1 1,1,95 1,14 1,149 1,151 1,84 1,11 1,1 1,75 1,89 1,91 1,59 1,6 1,63,975 1,154 1,18 1,183 1,14 1,1 1,13 1,9 1,18 1,19 1,63 1,74 1,75,99 1,19 1,18 1,1 1,17 1,147 1,148 1,11 1,19 1,131 1,77 1,89 1,9