statistické kontroly jakosti

Transkript

1 Univerzita Karlova v Praze Matematicko-fyzikální fakulta DIPLOMOVÁ PRÁCE Petr Klášterecký Některé problémy statistické kontroly jakosti Katedra pravděpodobnosti a matematické statistiky Vedoucí diplomové práce: Prof. RNDr. Marie Hušková, DrSc. Studijní program: Matematika, Matematická statistika

2 Poděkování Rád bych na tomto místě poděkoval především vedoucí své diplomové práce Prof. Marii Huškové za cenné rady, návrhy a připomínky, jež významně přispěly k vylepšení konečné podoby textu. Poděkování patří také všem ostatním členům katedry pravděpodobnosti a matematické statistiky MFF UK v Praze, a mým rodičům, kteří mi studium umožnili. Prohlašuji, že jsem svou diplomovou práci napsal samostatně a výhradně s použitím citovaných pramenů. Souhlasím se zapůjčováním práce. V Praze dne 7. dubna 2003 Petr Klášterecký

3 Obsah Abstrakt/Abstract v Úvod 1 Výzkum v oblasti statistické kontroly jakosti Terminologie a značení Zaměření této práce Standartní procedury SKJ Shewhartova procedura Shewhartova procedura pro normální rozdělení CUSUM procedura CUSUM procedura pro normální rozdělení EWMA procedura Monotónně vzrůstající střední hodnota 10 3 Střední hodnota omezená stanovenou hranicí Odvození testové statistiky pro normální rozdělení při známém rozptylu σ Kritické hodnoty pro statistiky {Q n } N n= Simulované kritické hodnoty Vlastnosti statistiky Q n Modifikace Q n Kritické hodnoty pro statistiky {Q n,g } N n= Kritické hodnoty pro statistiky {Q simp n,g } N n= Úprava pro jinou formulaci hypotéz Modifikace předpokladů Normálně rozdělená data s neznámým rozptylem Data s jiným než normálním rozdělením iii

4 OBSAH iv 4 Simulace zpoždění detekce změn Vhodná volba okénka G Porovnání zpoždění detekce změn u různých testových statistik Porovnání se statistikou M n A Vybrané limitní věty 42 B Zdrojové kódy programů 44 Literatura 51

5 Abstrakt/Abstract v Abstrakt Název práce: Některé problémy statistické kontroly jakosti Autor: Petr Klášterecký Katedra: Katedra pravděpodobnosti a matematické statistiky Vedoucí diplomové práce: Prof. RNDr. Marie Hušková, DrSc. vedoucího: huskova@karlin.mff.cuni.cz Abstrakt: Pro posloupnosti nezávislých, stejně rozdělených náhodných veličin jsou v odborné literatuře poměrně podrobně popsány metody pro detekci změn ve střední hodnotě těchto náhodných veličin z jedné konstantní hodnoty na jinou. Méně pozornosti se doposud věnovalo situacím, kdy je třeba kontrolovat, zda střední hodnota nepřesáhla stanovenou úroveň, tzv. prahovou hodnotu. Po úvodním stručném shrnutí standartních procedur se práce věnuje právě této problematice. Jsou definovány různé testové statistiky pro odhalení změny, která nastala v neznámém čase m, a zkoumány jejich vlastnosti. Na chování sledované střední hodnoty do času m přitom nejsou kladeny žádné požadavky jako např. konstantnost, monotónnost a podobně. Závěrečná simulační studie porovnává vhodnost použití jednotlivých testových statistik v různých situacích. Klíčová slova: Statistická kontrola jakosti, testování hypotéz, test poměrem věrohodností. Abstract Title: Some Problems in Statistical Quality Control Author: Petr Klášterecký Department: Dept. of Probability and Mathematical Statistics Supervisor: Prof. RNDr. Marie Hušková, DrSc. Supervisor s address: huskova@karlin.mff.cuni.cz Abstract: Currently there are many scientific papers and monographs published on detection of changes in the mean of a sequence of iid random variables, if the change is from one constant value to another. Only few are, however, concerned with a more general situation, where the mean is allowed to change in any way until it crosses some predetermined threshold value. After a brief summary of the standard SPC procedures this thesis explores various test statistics for detecting a change, which occured in an unknown time point m in the past, and their properties. No restrictions like constancy, monotonicity etc. are required for the mean sequence until the time point m occurs. Using a simulation study, suggested procedures are compared by means of their delay in the change detection. Keywords: Statistical process control, testing of statistical hypotheses, generalized likelihood ratio test.

6 Úvod Z praktického hlediska je statistická kontrola jakosti (SKJ) v moderní době významným nástrojem pro zlepšování kvality výrobků a služeb, který přináší užitek spotřebitelům v podobě větší jistoty při nákupu i výrobcům v podobě větší důvěryhodnosti jejich produktů na trhu. Z hlediska teoretického jde o rychle a dynamicky se rozvíjející oblast matematické statistiky s mnoha otevřenými problémy a se stále probíhajícím výzkumem na mnoha univerzitních i vědeckých institucích po celém světě. Praktický problém detekce změn v nějaké kvalitativní charakteristice produktu se pro statistické účely převádí na problém detekce změn v parametrech pravděpodobnostního rozdělení, které pro sledovanou charakteristiku předpokládáme jako výchozí. Obvykle se proto nejvíce pozornosti věnuje různým posunům ve střední hodnotě, což odpovídá změně v úrovni sledované charakteristiky, a změnám v rozptylu daného rozdělení. Zatímco někteří autoři řadí pod obor statistická kontrola jakosti například i teorii navrhování experimentů jako nástroj pro určování faktorů, jež významně ovlivňují kvalitu zkoumaných produktů či postupů, ryzí statistickou kontrolu jakosti lze v podstatě rozdělit do dvou směrů buď se již v průběhu výroby odebírají a vyhodnocují kontrolní vzorky a v případě zjištění závad se výrobní proces okamžitě zastaví, nebo se taková kontrola provádí až při přejímce zboží, tedy po vyrobení a distribuci celé dávky (šarže) daného produktu. Současným celosvětovým trendem je z důvodu efektivity zapracovávat statistiku a statistické metody do výrobního procesu co nejdříve, nejlépe již ve fázi navrhování kontrolovaných experimentů, neboť jejich pozdní využití bývá často nesrovnatelně nákladnější. Proto je v poslední době výzkum zaměřen spíše na problémy spojené s první skupinou tzv. on-line kontrolních mechanismů a některým z nich se budeme věnovat i v této práci. Výzkum v oblasti statistické kontroly jakosti Základní stavební kameny statistické kontroly jakosti byly položeny Walterem Shewhartem (Shewhartova X procedura pro detekci skokové změny ve 1

7 Úvod 2 střední hodnotě) ve 20. a 30. letech dvacátého století, tedy již před více než 80 lety. Přestože se od té doby objevilo několik dalších detekčních postupů (mimo jiné umožňujících urychlení detekce využitím více než jednoho posledního pozorování, např. CUSUM, EWMA) a došlo k mnoha vylepšením a modifikacím Shewhartovy procedury (zavedení pomocných varovných mezí atd.), výzkum v této oblasti poměrně dlouho nebyl v porovnání s jinými oblastmi statistiky nijak intenzívní a oživení přišlo až v období kolem roku Woodall a Montgomery [Woodall, Montgomery 1999] jej připisují především zvýšenému tlaku na kvalitu výrobků ze strany spotřebitelů a konkurenčnímu boji na jedné straně a potřebou vědeckých institucí nalézat nová odvětví výzkumu (a prostoru k publikaci) na straně druhé. S tím bohužel souvisí fakt, že je dnes v podstatě nemožné sledovat vývoj výzkumu v nějaké ucelené podobě, jelikož se nové články objevují s rostoucí frekvencí v mnoha různých odborných technických časopisech. Jiným zlomovým bodem bylo nepochybně masívní rozšíření moderní výpočetní techniky v poslední době; zatímco zpočátku se kontrolní vzorky odebíraly v relativně dlouhých časových intervalech a bylo poměrně obtížné vůbec získat kvalitní data, natož je potom efektivně analyzovat, v dnešní době nejsou výjimkou měření opakovaná každých několik minut či dokonce sekund. To samozřejmě klade zcela jiné nároky na metody pro analýzu těchto měření, neboť obzvláště u rozsáhlých datových souborů je nutno brát v úvahu také časovou náročnost prováděných výpočtů. Terminologie a značení Předpokládejme, že sledujeme proces produkující posloupnost (konečnou nebo nekonečnou) x 1, x 2,... a tato posloupnost je (zpočátku) pod kontrolou, tj. spokojíme se s pouhým zaznamenáním pozorovaných hodnot. Taková situace je v praxi naprosto běžná, zmíněný proces může být například sériová výroba součástek a podobně. Pod kontrolou potom znamená, že stroj je správně seřízen a sledované hodnoty (např. průměr šroubku, síla izolace atd.) jsou v předem stanovené toleranci (ta je zpravidla určena podnikovou, státní nebo přímo mezinárodní normou). Předpokládejme dále, že v čase m dojde ke změně, která sledovaný proces vychýlí natolik, že pozorované hodnoty x m1, x m2,... již nesplňují kritéria nutná k tomu, aby byl proces pod kontrolou. Říkáme, že proces je mimo kontrolu. Ve zmíněném příkladu s výrobou šroubků může taková situace nastat například z důvodu opotřebení soustruhu, chybou obsluhujícího dělníka atd. Okamžik m zpravidla (s výjimkou cvičných, testovacích procesů) neznáme, k dispozici jsou pouze pozorovaná data. Cílem tedy je na jedné straně odhalit nežádoucí změnu ve sledovaném

8 Úvod 3 procesu co nejdříve po jejím výskytu, ale na druhé straně zároveň nezastavovat zbytečně proces, který je pod kontrolou (tedy minimalizovat výskyt tzv. falešných poplachů. Pro účely statistického modelování budeme předpokládat, že pozorované hodnoty x 1, x 2,... jsou realizacemi nezávislých náhodných veličin X 1, X 2,..., kde X i má pravděpodobnostní rozdělení s distribuční funkcí F (x i, θ i ), znač. X i F (x i, θ i ). θ i je obecně vektor parametrů, na nichž toto rozdělení závisí. Některé z těchto parametrů mohou být tzv. rušivé, tedy takové, které nás nezajímají kvůli samotnému řešení problému, ale nelze je ignorovat. Naopak některé (nebo všechny) parametry svými hodnotami přímo nebo nepřímo udávají, zda je sledovaný proces pod kontrolou či nikoli. Naší snahou proto bude učinit o těchto parametrech nějaký závěr na základě pozorovaných hodnot x 1, x 2,..., zpravidla pomocí statistického testování hypotéz. Pro úplnost ještě dodejme, že symbolem R budeme v textu označovat množinu všech reálných čísel, symbolem R množinu kladných reálných čísel. Pro označení konce (např. důkazu) budeme používat symbol. ARL versus chyby I. a II. druhu Jelikož jednotlivá pozorování přicházejí postupně v čase a nejsou tedy k dispozici všechna najednou, nabízí se použít pro statistickou analýzu sekvenční metody, zejména pak sekvenční testování hypotéz. Nejprve je však nutno nějakým způsobem definovat a případně vyvážit včasnost detekce nastalé změny a závažnost chybného zastavení procesu pod kontrolou (falešného poplachu), neboť shora uvedené cíle jsou evidentně naprosto protichůdné. Jednou z možností je využití střední doby trvání 1 (ARL). ARL se obvykle definuje jako střední hodnota času (počtu pozorování) potřebného k odhalení změny od jejího výskytu nebo jako střední doba mezi falešnými poplachy (MTBFR) 2. ARL je funkce, která závisí na velikosti, eventuálně na orientaci změny, a má obdobný význam jako silofunkce v klasické teorii testování hypotéz. Při tomto postupu zpravidla stanovíme požadovanou střední dobu mezi falešnými poplachy (tedy jak dlouho by měl vydržet bez zastavení běh procesu, v němž nedošlo ke změně), a základě této hodnoty potom určíme pravidla pro zastavení procesu. Druhé kritérium pro určení zastavovacího pravidla (pravidel) je bližší klasické problematice statistického testování hypotéz požadavek na MTBFR 1 Střední doba trvání je pravděpodobně korektní překlad anglického termínu Average Run Length, zkráceně ARL. Tato zkratka je však již natolik zakotvená v odborné literatuře, že považuji za vhodné používat ji namísto českého SDT i v tomto textu. 2 Opět se zde přikláním k používání zavedené anglické zkratky pro Mean Time Between False Reactions namísto českého SDMFP.

9 Úvod 4 je zde nahrazen požadavkem, aby k chybnému zastavení procesu, který je v pořádku, došlo s pravděpodobností (nejvýše) rovnou zvolené hladině α. Při volbě mezi dostupnými testy (procedurami) se stejnou MTBFR nebo hladinou významnosti α se poté zpravidla volí na základě střední doby zpoždění nebo obdobných charakteristik. V této práci budeme kritéria pro zastavení procesu určovat podle hladiny významnosti α a v následné simulační studii potom budeme zkoumat vhodnost použití jednotlivých procedur pomocí kritéria rychlosti (zpoždění) detekce změn. Zaměření této práce Stručný přehled postupů, které se v dnešní době běžně používají pro detekci změn ve střední hodnotě z jedné konstantní hladiny na jinou, je uveden v kapitole 1. Kromě toho je v praxi často potřeba detekovat za mnoha různých výchozích podmínek změny v situaci, kdy není určena žádná konkrétní hodnota, ale pouze rozmezí, v němž by se hodnoty sledovaných parametrů měly pohybovat. Chang a Fricker [Chang, Fricker 1999] se například zabývali situací, kdy sledovaná střední hodnota monotónně vzrůstá až do překročení stanovené hranice (bod změny), a s použitím isotonické regrese odvodili test poměrem věrohodností speciálně pro tento případ. Stručné shrnutí jejich výsledků obsahuje 2. kapitola této práce. Od kapitoly 3 dále se potom zaměříme na poněkud obecnější problém z hlediska formulace nulové a alternativní hypotézy: budeme předpokládat, že X 1,..., X n jsou nezávislé náhodné veličiny, E(X i ) = µ i a za platnosti H 0 je sledovaná střední hodnota pod určitou předem stanovenou hranicí pro všechna X i, zatímco za platnosti H 1 existuje takový čas (bod) m, že střední hodnoty všech veličin od tohoto bodu dále (X m1, X m2,...) danou mez překračují. Matematicky zapsáno předpokládáme situaci, kdy H 1 : µ i δ, i = 1... m, H 0 : µ i δ, i = 1... n µ i > δ, i = m 1... n a hodnotu δ známe. Odvodíme test poměrem věrohodností pro normálně rozdělená data a v následné simulační studii budeme zkoumat chování (především včasnost detekce změn) takto odvozené testové statistiky a jejích modifikací. Stručně pojednáme i o zobecnění celé situace vyjmutím předpokladu normálního rozdělení dat. Problém lze také jednoduchou úpravou převést na oboustranný, případně změnit směr sledovaného posunu dolů.

10 Kapitola 1 Standartní procedury SKJ Tato kapitola podává přehled nejpoužívanějších postupů pro detekci posunu ve střední hodnotě při tzv. on-line statistické kontrole jakosti. Všechny vztahy jsou uvedeny pro zachycení posunu směrem nahoru, tedy nová střední hodnota je větší než původní. Oboustranné a opačně orientované testy lze získat jednoduchou úpravou. Podrobnější odvození jednotlivých testových statistik a některé příklady lze nalézt například v textu [Antoch, Jarušková 2002]. V celé kapitole budeme předpokládat následující: X 1, X 2,... jsou nezávislé náhodné veličiny X 1, X 2,... F 0 (x) za platnosti H 0 X 1,..., X m F 0 (x) a X m1, X m2,... F 1 (x), F 0 ( ) F 1 ( ) za platnosti H 1. Teoreticky mohou být F 0 i F 1 libovolné distribuční funkce, tedy i distribuční funkce diskrétních rozdělení. Zde se však omezíme pouze na rozdělení absolutně spojitá. Označme tedy dále f 0 hustotu odpovídající distribuční funkci F 0 a podobně označme f 1 hustotu odpovídající distribuční funkci F 1. Zatímco skutečné rozdělení po změně (F 1 a f 1 ) zpravidla neznáme, distribuční funkci F 0 (hustotu f 0 ) předpokládáme známou. Poslední předpoklad je logický vzhledem k tomu, že toto rozdělení je rozdělením výchozím, které by v ideálním případě mělo zůstat zachováno stále. Ještě je nutno specifikovat pojmy čas, časový okamžik a podobně. V problematice SKJ se klasický čas velmi často zaměňuje s počtem pozorování, která uskutečníme před zastavením procesu. Tím je v podstatě umožněno používat stejné postupy pro celou škálu situací a procesů s různou rychlostí produkce. Hlavním cílem všech uvedených postupů je najít vhodný časový okamžik (počet pozorování), řekněme τ, kdy se proces zastaví. Ačkoli 5

11 1. Standartní procedury SKJ 6 by bylo ideální nechat proces, který je pod kontrolou, pokračovat bez zastavení, není to možné. Bylo dokázáno, že nutná podmínka k tomu, aby střední doba do odhalení změny byla konečná, je právě konečnost střední doby do zastavení procesu, který je v pořádku. Poznámka 1.1: Z důvodu redukce variability se níže popsané postupy někdy uplatňují místo původních veličin X 1, X 2,... na skupinové průměry typu k(l1) X i, případně i na průměry vypočtené z posloupností nestejných délek. 1 k i=kl1 1.1 Shewhartova procedura Pravidlo pro zastavení procesu: Proces se zastaví, pokud po n-tém kroku poprvé platí log f 1(X n ) f 0 (X n ) h 1 (1.1) pro nějaké h 1. Konstantu h 1 nelze samozřejmě volit zcela libovolně, naopak její hodnota závisí na požadované hladině testu nebo MTBFR. Obecně neznámou hustotu f 1 je nutno v alternativní hypotéze vhodně zvolit, například na základě předchozích zkušeností. Ze vzorce (1.1) plyne, že Shewhartova procedura nijak nevyužívá historii procesu, rozhodování je založeno pouze na poslední pozorované hodnotě. Důsledkem je značná nerobustnost tohoto postupu vůči odlehlým pozorováním, což lze částečně napravit použitím průměrovaných hodnot namísto původních měření (viz poznámka 1.1) Shewhartova procedura pro normální rozdělení Důležitým speciálním případem je situace, kdy jsou obě rozdělení (původní i po změně) normální se shodným rozptylem σ 2 a liší se pouze střední hodnoty µ 0 µ 1. V souladu s úvodem této kapitoly budeme předpokládat µ 0 < µ 1 a bez újmy na obecnosti můžeme položit µ 0 = 0. Dosazením do vztahu (1.1) a úpravou získáme následující podmínku pro zastavení procesu po n krocích: X n h 1σ 2 µ 1 µ 1 2 := b (1.2) Konstanta b je evidentně přímo úměrná původní konstantě h 1 a v praktických aplikacích se nejčastěji užívá b = 3σ. Tato hodnota je však odvozena pro pevně stanovenou hodnotu MTBFR (konkrétně MTBFR = 740 pozorování) a neměla by proto být zneužívána jako univerzální konstanta. Tabulky

12 1. Standartní procedury SKJ 7 a grafy ARL funkcí pro tento i pro oboustranný problém lze opět nalézt v [Antoch, Jarušková 2002]. Poznámka 1.2: Existuje několik modifikací původního Shewhartova postupu, nejpoužívanější z nich spočívá v zavedení tzv. varovné meze b 1 < b. Rozhodování o zastavení procesu po n-tém kroku je poté založeno na tom, zda X n < b 1 (proces se nezastaví), X n > b (proces se zastaví okamžitě), nebo b 1 X n b (proces se zastaví, je-li tato nerovnost splněna opakovaně). Přidáním dalších podmínek lze samozřejmě rozhodovací pravidla dále pozměňovat (a zpravidla komplikovat). 1.2 CUSUM procedura Pravidlo pro zastavení procesu: Proces se zastaví, pokud po n-tém kroku poprvé platí S n min S j h 2 (1.3) 0 j n pro nějaké vhodné h 2, kde S n = i=1 log f 1(X i ) f 0 (X i ), S 0 = 0. Název CUSUM vznikl zkrácením anglického termínu CUmulative SUMs (postupné součty) a celá procedura je založena na následující myšlence předpokládejme, že máme v daný okamžik k dispozici právě n pozorování x 1,..., x n, že známe čas m, m < n, kdy mělo dojít ke změně a navíc že známe i hustotu nového rozdělení f 1 ( ). V takovém případě má statistika testu poměrem věrohodností tvar S n S m 1 = i=m log f 1(X i ) f 0 (X i ). (1.4) Nulovou hypotézu tvrdící, že ke změně nedošlo, zamítneme při velké hodnotě statistiky (1.4). Jelikož okamžik m předem neznáme, je nutno (1.4) poopravit a počítat s nejnepříznivější možnou variantou, tedy s největší možnou hodnotou statistiky (1.4): max (S n S j ), což je ekvivalentní se vzorcem v (1.3). 0 j n Rovněž je nutno v alternativní hypotéze specifikovat neznámou hustotu f 1. Poznámka 1.3: Zatímco Shewhartova procedura je v každém okamžiku založena pouze na poslední pozorované hodnotě, procedura CUSUM využívá všech dostupných měření. Přímým důsledkem této skutečnosti je jednak její větší robustnost k odlehlým pozorováním a jednak i schopnost daleko dříve

13 1. Standartní procedury SKJ 8 detekovat kumulované, pozvolné změny (posuny). Naopak, jednorázová skoková změna může být vyvážena předchozími pozorováními a odhalena později než při použití Shewhartova testu CUSUM procedura pro normální rozdělení Pro stejnou speciální situaci jako v případě Shewhartovy procedury, kdy jsou obě rozdělení (původní i po změně) normální se shodným rozptylem σ 2 a liší se pouze střední hodnoty 0 = µ 0 < µ 1, získáme a tedy S n = ( i=1 X i µ 1 2 max (S µ 1 n S j ) = max 0 j n 0 j n σ 2 ) µ1 σ 2 (1.5) ( X i µ ) 1 i=j1 2 (1.6) Proces se zastaví, pokud je hodnota výrazu (1.6), nebo ekvivalentně hodnota výrazu ( max X i µ ) 1 (1.7) 0 j n 2 i=j1 větší než vhodná konstanta, řekněme h. V [Antoch, Jarušková 2002] je mimo jiné uvedena zajímavá geometrická interpretace problému, tabulky hodnot ARL funkce a metodika (integrální rovnice) pro jejich výpočet. Tentýž text obsahuje zobecnění výpočtů provedených pro normální rozdělení na rozdělení exponenciálního typu (Koopmanovy Darmoisovy rodiny) a Lordenovu modifikaci procedury CUSUM. 1.3 EWMA procedura Pravidlo pro zastavení procesu: Proces se zastaví, pokud po n-tém kroku poprvé platí X EW MA (n) h 3 (1.8) pro nějaké vhodné h 3, kde X EW MA (n) = (1 λ) X EW MA (n 1) λx n, 0 < λ < 1. Ze vztahu (1.8) je patrné, že procedura EWMA (zkratka z anglického Exponentially Weighted Moving Average klouzavé průměry s exponenciálními

14 1. Standartní procedury SKJ 9 vahami) závisí na parametru λ. Pro λ = 1 bychom zřejmě získali Shewhartovu proceduru, naopak pro malé hodnoty λ se EWMA statistika (1.8) podobá statistice CUSUM (1.3). EWMA procedura tedy v závislosti na volbě λ může být citlivější ke skokovým i postupným změnám. Z tohoto důvodu se její použití doporučuje zejména v situacích, kdy nemáme žádnou informaci o velikosti a typu možné změny a neumíme tedy rozhodnout mezi Shewhartovým a CUSUM testem.

15 Kapitola 2 Monotónně vzrůstající střední hodnota Cílem této práce je, jak již je zmíněno v Úvodu, sestavit statistický test pro detekci změny v úrovni střední hodnoty sledovaných náhodných veličin za poměrně obecných podmínek. Standartní procedury shrnuté v kapitole 1 byly původně navrženy pro odhalení jednorázových skokových změn z µ 0 na µ 1 nebo změn, které mají charakter lineárního trendu. Tato kapitola je věnována situaci, kdy střední hodnoty sledovaných náhodných veličin monotónně vzrůstají a v určitém okamžiku překročí stanovenou hranici, řekněme δ. To je poměrně zásadní odlišnost od klasických podob formulace problému, neboť tam jde zpravidla o rozpoznání stavu, kdy se sledovaná střední hodnota µ odchýlí od dané cílové hodnoty µ 0. Hranici δ je tedy nutno chápat jako maximální tolerovatelnou mez, jejíž překročení nechceme dovolit. Naopak pojem cílová hodnota zde ztrácí smysl, jelikož všechny hodnoty µ δ jsou v pořádku (přijatelné). Pro jednoduchost se omezíme pouze na pozorování pocházející z normálního rozdělení se známým rozptylem: budeme předpokládat, že X 1, X 2,..., X n je posloupnost nezávislých náhodných veličin s normálním rozdělením s rozptylem σ 2 = 1 (bez újmy na obecnosti), E(X i ) = µ i a pro střední hodnoty platí µ 1 µ 2... µ n, jinými slovy střední hodnoty tvoří monotónní neklesající posloupnost. Nulovou a alternativní hypotézu potom zformulujeme H 0 : µ 1 µ 2... µ n δ (2.1) H 1 : m {1,..., n 1} takové, že µ 1 µ 2... µ m δ µ m1... µ n. Proces chceme samozřejmě zastavit co nejdříve po překročení hranice δ, a naopak jej chceme nechat běžet co nejdéle, v ideálním případě stále, pokud k překročení hraniční hodnoty δ nedojde. 10

16 2. Monotónně vzrůstající střední hodnota 11 Test poměrem věrohodností (viz například [Dupač, Hušková 2001], kapitola 6) má tvar max {log f(x µ)} max{log f(x µ)} = µ H 0 H A µ H 0 { } 1 = min (X i µ i ) 2 min µ 1... µ n δ 2 i=1 µ 1... µ n { 1 2 } (X i µ i ) 2. (2.2) i=1 Minimalizační problém v (2.2), tedy nalezení maximálně věrohodných odhadů středních hodnot µ i, je v literatuře znám pod názvem isotonická regrese (viz například [Robertson a kol. 1988], kapitola 1). Jelikož je zapotřebí minimalizovat jeden výraz dvakrát za různých podmínek, zahrnuje výpočet hodnoty testové statistiky (2.2) vlastně počítání dvou isotonických regresí: Z 1,..., Z n pro růst omezený hodnotou δ a Y 1,..., Y n pro hodnoty rostoucí bez omezení. Při znalosti Z n 1 a Y n 1 určených z pozorování x 1,..., x n 1 lze výpočet Z n a Y n provést podle následujícího algoritmu s použitím nového pozorování x n (PAVA algoritmus): 1. Položme A n = x n a k = Dokud platí Y n k > A n k1 : Položme A n k = 1 k1 (ka n k1 Y n k ) a Položme k = k Položme Y n = Y n 1 =... = Y n k1 = A n k1. 4. Položme Z i = min(y i, δ) pro všechna i = 1,..., n. Testová statistika (2.2) je potom pro n = 1... N (viz dále) ekvivalentní výrazu M n = = (X i Z i ) 2 (X i Y i ) 2 i=1 i=1 0 pro Y n δ (X i δ) 2 n (X i Y i ) 2 pro Y n > δ, i=j i=j (2.3) kde J = min{i : Y i > δ}. Nulovou hypotézu zamítneme, jakmile M n > h pro nějaké vhodné h a pro první takové n proceduru zastavíme. Proceduru lze také použít na části původních dat za pomoci okénka dané šířky, které se po datech posouvá. V textu [Chang, Fricker 1999] jsou hodnoty h určeny

17 2. Monotónně vzrůstající střední hodnota 12 pomocí simulací, nejsou však nikde tabelovány. Navíc byly pro stejnou posloupnost statistik {M n } N n=1 simulovány různé kritické hodnoty pro různé chování posloupnosti středních hodnot µ 1, µ 2,..., µ n, což je poměrně neobvyklý postup. Pro účely porovnání detekčních schopností statistiky M n se statistikami sestavenými v kapitole 3 byly kritické hodnoty určeny pomocí simulací jako empirické kvantily rozdělení veličiny max M n, kde N představuje nejvyšší možný počet pozorování během nějakého časového intervalu 1, a 1 n N hodnoty x i potřebné k výpočtu M n byly simulovány z normálního rozdělení N(δ, 1). Kvůli časové náročnosti výpočtu bylo nutno omezit počet opakování simulace na a hodnotu N na N = 100. Výsledné simulované kritické hodnoty jsou pro vybraná α uvedeny v tabulce 2.1. Tabulka 2.1: Simulované kritické hodnoty pro posloupnost statistik {M n } N n=1, zaokrouhlené na tři desetinná místa. α N 0,10 0,05 0, ,862 8,209 12, ,387 16,147 20,260 V další části práce zobecníme právě popsanou situaci vyjmutím předpokladu monotónnosti. Pomocí simulací pak porovnáme rychlost detekce překročení hraniční hodnoty pro různá výchozí nastavení jak při testování statistikou M n (2.3), tak i při použití statistik odvozených pro obecný případ v kapitole 3. 1 Komplexnější a podrobnější pojednání o určování a simulacích kritických hodnot je obsaženo v části 3.2.

18 Kapitola 3 Střední hodnota omezená stanovenou hranicí V této kapitole se z hlediska formulace a testování statistických hypotéz podrobněji zaměříme na obecnější problém nastíněný v úvodu práce. Nulové hypotéze H 0 bude odpovídat situace, kdy je střední hodnota každé z náhodných veličin X i, i = 1,..., n pod stanovenou hranicí δ. Za platnosti alternativní hypotézy H 1 potom existuje bod (okamžik) m, v němž sledovaná střední hodnota hranici δ překročí a setrvá nad ní až do zastavení procesu. Formálně zapsáno H 0 : E(X i ) = µ i δ i = 1,..., n (3.1) H 1 : m {1,..., n 1} takové, že E(X i ) = µ i δ pro i = 1,..., m E(X i ) = µ i > δ pro i = m 1,..., n. Rozhodování založíme na testu poměrem věrohodností. Testovou statistiku, označme ji například Q n, odvodíme pro normálně rozdělená data a budeme zkoumat její vlastnosti. 3.1 Odvození testové statistiky pro normální rozdělení při známém rozptylu σ 2 Předpokládáme, že X 1,..., X n jsou nezávislé náhodné veličiny s normálním rozdělením s obecně různými středními hodnotami, ale se stejným a známým rozptylem σ 2 : X i N(µ i, σ 2 ). Předpoklad známého rozptylu lze odůvodnit například zkušenostmi z podobných výrobních procesů nebo z minulosti. 13

19 3. Střední hodnota omezená stanovenou hranicí 14 V závěru této kapitoly rozebereme také složitější situaci, kdy rozptyl σ 2 neznáme a musíme jej odhadnout z naměřených hodnot. Rozdělení každé z veličin X i tedy lze popsat hustotou f(x i, µ i ) = 1 2πσ exp { (x i µ i ) 2 2σ 2 }, < x i <. (3.2) Podle hodnoty parametru µ i budeme v dalším textu podle potřeby přidávat index j, j = 0, 1. Hustota f 0 (x i, µ i ) potom bude znamenat hustotu X i za platnosti nulové hypotézy pro i-té pozorování, tj. µ i δ, a podobně f 1 (x i, µ i ) bude značit hustotu X i pokud µ i > δ. Pro větší přehlednost zápisu definujme dále k prvkům vektoru µ A m,n = = (µ 1,..., µ n ) množinu A m,n takto: { } µ µ 1,..., µ m δ µ m1,..., µ n > δ. (3.3) A m,n je tedy množina všech vektorů µ, které ve formulaci (3.1) splňují alternativní hypotézu H 1, pokud m < n. Pro m = n ovšem A n,n označuje naopak všechny vektory µ splňující v (3.1) nulovou hypotézu H 0. Předpokládejme na okamžik, že známe bod změny m a buď m = k. V tom případě by testová statistika testu poměrem věrohodností měla (logaritmický) tvar [ n ] [ ] k n sup f 1 (x i, µ i ) sup f 0 (x i, µ i ) f 1 (x i, µ i ) µ A k,n i=1 µ A k,n i=1 i=k1 Λ k = log [ n ] = log [ n ] sup f 0 (x i, µ i ) sup f 0 (x i, µ i ) µ A n,n i=1 µ A n,n i=1 [ ] n sup exp( (x i µ i ) 2 ) 2σ µ = log i > δ i=k1 2 ] = sup sup µ i δ [ n µ i > δ i=k1 exp( (x i µ i ) 2 ) 2σ i=k1 2 ( (x i µ i ) 2 ) sup 2σ 2 µ i δ i=k1 ( (x i µ i ) 2 2σ 2 ). (3.4) Suprema nabývají oba výrazy ve vztahu (3.4) tehdy a jen tehdy, pokud skutečné hodnoty parametrů µ i nahradíme jejich odhady získanými metodou maximální věrohodnosti. Vzhledem k tomu, že máme jediné pozorování pro každou z náhodných veličin X i, má věrohodnostní funkce pro odhad i-té střední hodnoty µ i tvar L(µ i, x i ) = 1 2πσ exp { (x i µ i ) 2 2σ 2 }, (3.5)

20 3. Střední hodnota omezená stanovenou hranicí 15 případně po zlogaritmování l(µ i, x i ) = log L(µ i, x i ) = log ( ) 1 (x i µ i ) 2. (3.6) 2πσ 2σ 2 Výraz (3.6) je nutno maximalizovat vzhledem k neznámé střední hodnotě µ i, ovšem s omezeními vyplývajícími z obou hypotéz. Za platnosti H 0 tak hledáme [ a za platnosti H 1 arg max µ i δ arg max µ i >δ [ log log ( ) 1 (x i µ i ) 2 ] 2πσ 2σ 2 (3.7) ( ) 1 (x i µ i ) 2 ]. (3.8) 2πσ 2σ 2 Standartním výpočtem s použitím grafu funkce g(µ i ) = (x i µ i ) 2 potom získáme následující podmíněné maximálně věrohodné odhady: { δ pro xi δ > 0 µ i µi δ = x i pro x i δ 0, { xi pro x µ i µi >δ = i δ > 0 δ pro x i δ 0, neboli µ i µi δ = min(x i, δ), (3.9) µ i µi >δ = max(x i, δ). (3.10) Právě vypočtené maximálně věrohodné odhady můžeme nyní použít místo neznámých parametrů µ i v testové statistice (3.4). Dosazením výsledků (3.9) a (3.10) do (3.4) získáme Λ k = = = sup µ i > δ i=k1 i=k1 i=k1 ( (x i µ i ) 2 2σ 2 ) sup µ i δ i=k1 ( (x i µ i ) 2 2σ 2 (x i max(x i, δ)) 2 (x i min(x i, δ)) 2 2σ 2 2σ 2 (x i δ) 2 ) 2σ 2 sign(x i δ). (3.11) Statistiku (3.11) jsme odvodili za předpokladu m = k, tj. pro známý čas změny m, tedy vlastně pro obyčejný dvouvýběrový problém. Pokud m neznáme, musíme jej zahrnout do výpočtu jako další neznámý parametr a počítat v (3.4) navíc ještě supremum přes m. V podstatě se jedná o to, že statistiku (3.11) je nutno modifikovat tak, abychom nulovou hypotézu zamítli,

21 3. Střední hodnota omezená stanovenou hranicí 16 pokud by ji zamítla jakákoli ze statistik Λ m, m < n. Výpočtem dostáváme [ ] m max sup n f 0 (x i, µ i ) f 1 (x i, µ i ) Λ 0 m<n µ A m,n i=1 i=m1 m,n = log [ n ] sup f 0 (x i, µ i ) µ A n,n i=1 (x i δ) 2 = max sign(x 0 m<n 2σ 2 i δ). (3.12) i=m1 Definujeme tedy pro n = 1... N Q n := max Λ 1 m = max 0 m<n 0 m<n 2σ 2 i=m1 (X i δ) 2 sign(x i δ). (3.13) Hodnota N udává maximální možný počet pozorovaní v daném časovém intervalu, typicky volíme jako časový interval jeden výrobní cyklus (den, pracovní týden a podobně). N potom zpravidla představuje předpokládaný počet kusů vyrobených během jednoho cyklu. Ještě jednou zopakujme, že statistika (3.13) byla odvozena pro normální rozdělení náhodných veličin X i a za předpokladu známé hodnoty rozptylu σ 2. Zobecnění problému pro neznámý rozptyl a/nebo pro náhodné veličiny s jiným než normálním rozdělením je obsahem závěru této kapitoly, konkrétně části 3.6. Test poměrem věrohodností v podobě, v jaké byl definován v (3.4), bude zamítat nulovou hypotézu ve prospěch alternativy, bude li testová statistika Q n dostatečně velká, tj. Q n > c pro nějakou vhodnou konstantu (kritickou hodnotu) c. Volba kritických hodnot je v tomto případě poměrně netriviální problém, kterému se budeme věnovat v části 3.2. Již nyní ale zavedeme dvě standardizované verze statistiky (3.13), které mohou být určitým způsobem přínosné. Definujme pro n = 1... N Q nn := 1 Q n = 1 1 max N N 0 m<n 2σ 2 Q nn := 1 Q n = 1 1 max n n 0 m<n 2σ 2 i=m1 i=m1 (X i δ) 2 sign(x i δ),(3.14) (X i δ) 2 sign(x i δ). (3.15) Kritické hodnoty pro posloupnost testových statistik (3.13) závisí na hodnotě N, viz část 3.2. Jedním ze smyslů standardizace (3.14) je tuto závislost odstranit, standardizace (3.15) by mohla urychlit detekci brzkých změn. Kritický obor statistik (3.15) totiž odpovídá kritickému oboru statistik (3.14) zakřivenému podle funkce n. Obě standardizace potom podle věty A.3 umožňují aproximaci součtu Wienerovým procesem, což lze využít například při simulaci kritických hodnot.

22 3. Střední hodnota omezená stanovenou hranicí Kritické hodnoty pro statistiky {Q n } N n=1 Testová statistika Q n (3.13), založená na n pozorováních, zamítne nulovou hypotézu v případě, že její hodnota bude větší než jisté číslo c. Pokud ovšem Q n c pro dané n, procedura pokračuje a testujeme znovu s použitím statistiky Q n1 až do dosažení předem stanoveného maximálního počtu pozorování N v daném časovém intervalu. Pokud i Q N c, ukončíme proceduru s konstatováním, že pozorované hodnoty nejsou v rozporu s tvrzením H 0. Pro pravděpodobnost chyby I. druhu požadujeme, aby pravděpodobnost P (zamítneme H 0 H 0 platí) byla nejvýše rovna zvolené hodnotě α, přičemž H 0 můžeme zamítnout pro jakoukoli ze statistik Q n, n = 1... N. První možnost určení kritických hodnot vychází ze vztahu ( N ) P H0 {Q n > c N, α } α, (3.16) n=1 který je však pro praktické použití kvůli své složitosti nevhodný. Jistou aproximaci ( poskytují ) kritické hodnoty získané použitím Bonferroniho nerovnosti N P A n N P (A n ), zde pro {A n } = {Q n > c N, α }, tato aproximace je n=1 n=1 ovšem zpravidla velmi hrubá a kritické hodnoty značně konzervativní. Výpočet kritických hodnot proto založíme na vztahu ( ) P H0 max Q n c N, α = 1 α. (3.17) 1 n N Pro jednoznačnost zápisu budeme do indexu přidávat faktory, na nichž číslo c závisí. Kritickou hodnotu pro test na hladině významnosti α založený na nejvýše N pozorováních tedy označíme c N, α. Poznámka 3.1: Z výše uvedených úvah je zřejmé, že číslo N musí být konečné, aby bylo vůbec možno kritické hodnoty stanovit. K výpočtu přesných kritických hodnot bychom potřebovali znát pravděpodobnostní rozdělení statistiky max Q n za platnosti nulové hypotézy; 1 n N zde však narazíme hned na několik problémů. Především je nutno si uvědomit, že nulová hypotéza je v tomto případě složená, a rozhodnout, pro jakou konfiguraci budeme kritické hodnoty požadovat. Standartní postup spočívá ve výpočtu kritických hodnot pro nejnepříznivější možnou situaci, která ještě neodporuje tvrzení nulové hypotézy. Zde to odpovídá situaci, kdy jsou všechny střední hodnoty µ i rovny prahové hranici δ. Teoreticky lze sice určit rozdělení členů Z i = 1 2σ 2 (X i δ) 2 sign(x i δ) (podle tvrzení (3.2), viz část 3.3) a dalším výpočtem by bylo možné určit i rozdělení jejich součtu,

23 3. Střední hodnota omezená stanovenou hranicí 18 rozdělení maxima maxima takových součtů však již je neúměrně komplikované, nebo dokonce nespočítatelné. V současné době není známo ani žádné asymptotické rozdělení statistik tohoto typu. Kritické hodnoty proto určíme pomocí simulací Simulované kritické hodnoty K získání kritických hodnot generujme N-tici x 1,..., x N jako realizaci náhodného výběru o rozsahu N z rozdělení N(δ, σ 2 ) a spočítejme hodnotu max Q n pro n = 1,..., N. První simulovaná hodnota x 1 přitom bude použita celkem N krát k výpočtu Q 1,..., Q N, zatímco poslední x N pouze jednou k výpočtu Q N. Tímto způsobem se zároveň simuluje sekvenční povaha testu v každém kroku se k dosavadním pozorováním pouze přidá jedno nové. Bez újmy na obecnosti lze zvolit hodnoty δ = 0 a σ 2 = 1. Celý postup se několikrát opakuje. Kritické hodnoty c sim N, α po vícenásobném opakování simulace určíme jako kvantily empirického rozdělení statistiky max Q n. Zde bylo použito n N opakování a kritické hodnoty pro test na hladinách α = 0,10, 0,05 a 0,01 tedy opovídají pořadovým statistikám (max Q n) (z) pro z = 9 000, a n N Nulovou hypotézu potom zamítneme, jakmile Q n > c sim N, α pro nějaké n N. Uvedený postup použijeme i pro posloupnosti standardizovaných statistik {Q nn } N n=1 a {Q nn } N n=1. Pro ty lze navíc (po znormování) použít i aproximaci založenou na větě A.3. V tom případě se sčítance Z i nahradí hodnotami X i generovanými z rozdělení N(0, 1). Simulované kritické hodnoty c sim N, α pro statistiky {Q n } N n=1 (3.13), zaokrouhlené na 3 desetinná místa, jsou pro vybraná α a N 1 uvedeny v tabulce 3.1. V tabulce 3.2 vlevo jsou uvedeny simulované kritické hodnoty c sim N,N, α pro standardizované statistiky {Q nn } N n=1 (3.14) a tyto simulované kritické hodnoty potvrzují jisté vyloučení vlivu hodnoty N. Vpravo jsou pak simulované kritické hodnoty c sim N,n, α pro standardizované statistiky {Q nn } N n=1 (3.15). K výpočtu byl použit program R, verze pro Windows. Zdrojové kódy všech použitých programů jsou připojeny v příloze B. 1 Omezení do N = 1000 je vynuceno časovou náročností výpočtů. Protože ale N představuje teoretický maximální počet pozorování v určitém časovém intervalu, lze v případě potřeby použít hodnoty vypočtené pro N = 1000 a upravit (zkrátit) tento časový interval.

24 3. Střední hodnota omezená stanovenou hranicí 19 Tabulka 3.1: Simulované kritické hodnoty c sim N, α pro posloupnost testových statistik {Q n } N n=1. α N ,01 7,387 23,241 75,612 0,05 5,254 17,995 59,724 0,10 4,225 15,666 51,722 Tabulka 3.2: Simulované kritické hodnoty c sim N,N, α pro standardizovanou verzi {Q nn } N n=1 (vlevo) a c sim N,n, α pro standardizovanou verzi {Q nn } N n=1 (vpravo). α N ,01 2,336 2,324 2,391 0,05 1,661 1,800 1,889 0,10 1,340 1,567 1,636 α N ,01 3,260 3,416 3,544 0,05 2,221 2,560 2,715 0,10 1,776 2,202 2, Vlastnosti statistiky Q n V této části shrneme některé další vlastnosti statistiky Q n (3.13). Tvrzení 3.1: Po přidání dalšího pozorování X n1 pro statistiku (3.13) platí rekurentní vztah Q n1 = max{q n, 0} 1 2σ 2 (X n1 δ) 2 sign(x n1 δ). (3.18) Důkaz: Důkaz provedeme přímým výpočtem. Platí Q n1 = max 0 m<n1 1 2σ 2 = max 1 m<n1 2σ 2 = max 1 m<n1 2σ 2 n1 i=m1 i=m1 (X i δ) 2 sign(x i δ) (X i δ) 2 sign(x i δ) (X n1 δ) 2 sign(x n1 δ) 2σ 2 (X i δ) 2 sign(x i δ) (X n1 δ) 2 sign(x n1 δ), 2σ 2 i=m1 (3.19)

25 3. Střední hodnota omezená stanovenou hranicí 20 neboť poslední člen nezávisí na parametru m. Dále je max 1 (X m<n1 2σ 2 i δ) 2 sign(x i δ) = i=m1 = max max 1 (X m<n 2σ 2 i δ) 2 1 sign(x i δ), (X i=m1 2σ 2 i δ) 2 sign(x i δ) i=n1 = max (Q n, 0). Dosazením do (3.19) získáme požadovaný vztah (3.18). Ze vzorce (3.13) vyplývá, že statistika Q n je funkcí součtů nezávislých náhodných veličin. Vskutku, náhodné veličiny X i jsou navzájem nezávislé a tudíž i jejich měřitelné funkce (X i δ) 2 sign(x i δ) jsou navzájem nezávislé náhodné veličiny (viz [Anděl 1985], strana 29) a známe dokonce i jejich rozdělení. Tvrzení 3.2: Nechť náhodná veličina X má spojité rozdělení s hustotou f(x) pro všechna x R. Pak náhodná veličina T = (X δ) 2 sign(x δ), kde δ je známá konstanta, má rozdělení s hustotou g(t) = f(δ sign(t) t ), t R. (3.20) 2 t Důkaz: Důkaz tvrzení je přímou aplikací věty o transformaci náhodných veličin ([Anděl 1985], věta 5, str. 47). Tvrzení 3.2 nám teoreticky dává nástroj ke zkoumání vlastností náhodných veličin, které tvoří sčítance v (3.13), pro libovolné výchozí rozdělení X i. Pro praktické počítání se však v kombinaci s hustotami f( ) většiny známých rozdělení příliš nehodí. Například jen počítání momentů by zde byla velmi obtížná integrace a právě střední hodnota jednotlivých sčítanců nám může poskytnout intuitivní představu o vhodnosti statistiky Q n pro testování (3.1). Tvrzení 3.3: Nechť X N(µ, σ 2 ). Pak platí E[(X δ) 2 sign(x δ)] = ( ( ( )) (δ µ) 2 σ 2) δ µ 1 2Φ σ { } (δ µ)σ (δ µ)2 2 exp, (3.21) 2π 2σ 2 kde Φ(z) značí distribuční funkci standartního normálního rozdělení a δ je stanovená hraniční hodnota.

26 3. Střední hodnota omezená stanovenou hranicí 21 Důkaz: Důkaz provedeme přímým výpočtem. Platí E[(X δ) 2 sign(x δ)] = = = = δ µ δ µ { } (x δ) 2 1 (x µ)2 sign(x δ) exp dx 2πσ 2σ 2 { } (x (δ µ)) 2 1 sign(x (δ µ)) exp x2 dx 2πσ 2σ 2 (x (δ µ)) 2 1 2πσ exp { } x2 2σ 2 dx { } (x (δ µ)) 2 1 exp x2 dx. (3.22) 2πσ 2σ 2 Rozepsáním členu (x (δ µ)) 2 a integrací metodou per partes získáme v první části vzorce (3.22) δ µ δ µ δ µ x 2 1 2πσ exp = 2(δ µ) 2πσ { (δ µ)σ 2π { x exp } x2 2σ 2 2(δ µ)σ = exp 2π { } (δ µ)2 2πσ exp dx = { } ( ) (δ µ)2 δ µ exp σ 2 Φ, (3.23) 2σ 2 σ } x2 dx = 2σ 2 x2 2σ 2 { } (δ µ)2, 2σ 2 (3.24) ( ) δ µ dx = (δ µ) 2 Φ. σ (3.25) Podobně rozepsáním druhého integrálu v (3.22) dostaneme δ µ { } x 2 1 exp x2 dx = 2πσ 2σ 2 = (δ µ)σ 2π exp { } ( (δ µ)2 σ 2 1 Φ 2σ 2 ( )) δ µ, (3.26) σ

27 3. Střední hodnota omezená stanovenou hranicí 22 { } 2(δ µ) x exp x2 dx = 2πσ 2σ 2 δ µ { } 2(δ µ)σ (δ µ)2 = exp, (3.27) 2π 2σ 2 a konečně δ µ (δ µ) 2 2πσ exp { } x2 2σ 2 ( )) δ µ dx = (δ µ) (1 2 Φ. (3.28) σ Sečtením výsledků dílčích integrálů (3.23) až (3.28) získáme požadovaný vztah (3.21). Podívejme se nyní poněkud intuitivně na chování právě vypočtené střední hodnoty jednotlivých sčítanců při různých vztazích mezi hranicí δ a střední hodnotou µ (pro přehlednost značení je vynechán index i). Pro přibližnou rovnost µ δ je 2 (δ µ)σ 2π exp { } (δ µ)2 2σ 0 a zároveň 2 Φ ( ) δ µ σ 1/2. Celkem tedy E[(X δ) 2 sign(x δ)] 0. Při výrazné nerovnosti µ << δ vychází 2 (δ µ)σ 2π exp { } (δ µ)2 2σ 0 a 2 Φ ( ) δ µ σ 1. Celkem tedy E[(X δ) 2 sign(x δ)] k, k R dostatečně velké. Při výrazné nerovnosti µ >> δ je opět 2 (δ µ)σ 2π exp { } (δ µ)2 2σ 0 a 2 Φ ( ) δ µ σ 0. Celkem E[(X δ) 2 sign(x δ)] k, k R dostatečně velké. Výsledky jsou ve shodě s logickým očekáváním test zamítne nulovou hypotézu pokud Q n > c, čehož lze nejsnáze (podle střední hodnoty) dosáhnout pro µ >> δ. Naopak takovou situaci nelze příliš očekávat, pokud µ << δ. Poznámka 3.2: Obecněji lze právě popsanou vlastnost nahlédnout takto: Označíme li Z i (δ) = (X i δ) 2 sign(x 2σ 2 i δ), pak E(Z i (δ)) je neklesající funkce střední hodnoty E(X i ), jelikož funkce g(t) = t 2 sign(t) je lichá a rostoucí v t (viz [Hušková a kol. 2003]). Poznámka 3.3: Statistika definovaná v (3.13) je v podstatě zobecněná statistika typu CUSUM (viz část 1.2). Pokud bychom použili vždy jen poslední pozorování X n, získali bychom věrohodnostním poměrem testovou statistiku Z n jako analogii klasického Shewhartova testu (část 1.1).

28 3. Střední hodnota omezená stanovenou hranicí 23 Poznámka 3.4: Statistika (3.13) byla odvozena za předpokladu normálního rozdělení. Pro data s jiným rozdělením lze příslušný test odvodit stejnou metodou nebo použít vhodné zobecnění statistiky (3.13). Definujme Z i (δ, ρ) = ρ(x i δ) sign(x i δ), (3.29) kde ρ( ) je nezáporná, symetrická, ryze konvexní funkce a ρ(0) = 0. Zobecněná statistika Q n,ρ potom bude mít tvar Q n,ρ = max 0 m<n i=m1 Z i (δ, ρ). (3.30) Speciální volbou ρ(t) = t 2 získáme potom přímo statistiku (3.13), volba ρ(t) = t by například odpovídala testu poměrem věrohodností pro data s Laplaceovým rozdělením. 3.4 Modifikace Q n V některých případech, zejména pokud byly hodnoty µ i výrazně (nebo velmi dlouho) menší než hraniční úroveň δ, se může stát, že statistika Q n nebude na případné překročení mezní hranice reagovat dostatečně pružně. Proto byly navrženy její modifikace, které využívají pouze několik posledních pozorování. Definujeme pro n = 1... N Q n,g := 1 G Q simp n,g := 1 G 1 2σ 2 max n G m<n 1 2σ 2 i=n G1 i=m1 (X i δ) 2 sign(x i δ), (3.31) (X i δ) 2 sign(x i δ). (3.32) Statistika (3.32) je vlastně jakousi zjednodušenou verzí (3.31). Okénko G je potřeba v obou případech volit velmi opatrně, typicky se používá malý zlomek maximálního počtu pozorování N v rozmezí G = 0,01N až G = 0,2N. Konkrétní hodnota zpravidla závisí na očekávaném chování procesu do času změny. Poznámka 3.5: Faktor 1 G slouží ke standardizaci, která je nutná k existenci limitního rozdělení (za dosti obecných předpokladů). Možnost použít asymptotické výsledky, především pak asymptotické kritické hodnoty, je ostatně dalším důvodem pro zavedení modifikace (3.32).

29 3. Střední hodnota omezená stanovenou hranicí Kritické hodnoty pro statistiky {Q n,g } N n=1 Pro posloupnost statistik {Q n,g } N n=1 definovanou v (3.31) platí naprosto stejné úvahy jako v předchozí části pro statistiky {Q n } N n=1. Pokud je Q n,g menší než příslušná kritická hodnota c, pokračujeme v testování se statistikou Q n1,g až dokud nedosáhneme maximálního počtu N pozorování v daném časovém intervalu. I zde se tedy jedná o sekvenční postup s nejvýše N pozorováními a ze stejných důvodů jako výše i zde založíme určení kritických hodnot c N,G, α na vztahu ( ) P H0 max Q n,g c N,G, α = 1 α. (3.33) 1 n N Oproti předchozí části je tu však podstatný rozdíl; díky větě A.1 a důsledku A.2 známe limitní rozdělení statistiky max Q n,g a kromě simulací 1 n N tak můžeme použít asymptotické kritické hodnoty. Tabulka 3.3 obsahuje kritické hodnoty c sim N,G, α určené pomocí simulací, hodnota G byla pro simulace volena postupně G = 0,2N, G = 0,15N, G = 0,1N a G = 0,05N, maximální počet N potom 10, 100 a 1000 pozorování. 2 Tabulka 3.4 potom obsahuje vybrané asymptotické kritické hodnoty. 3 Způsob provedení simulací byl stejný jako u statistiky Q n v části 3.2.1, opět s použitím opakování. Tabulka 3.3: Simulované kritické hodnoty c sim N,G, α pro statistiky {Q n,g } N n=1. α G = 0,2N, N: ,01 3,853 3,274 3,090 0,05 2,731 2,642 2,663 0,10 2,181 2,351 2,433 α G = 0,1N, N: ,01 4,839 3,672 3,360 0,05 3,281 2,988 2,900 0,10 2,688 2,680 2,667 α G = 0,15N, N: ,01-3,422 3,270 0,05-2,769 2,786 0,10-2,473 2,552 α G = 0,05N, N: ,01-4,320 3,623 0,05-3,456 3,115 0,10-3,055 2,882 2 Opět z důvodu velké časové náročnosti výpočtu, také zde lze v případě potřeby upravit (zkrátit) daný časový interval a použít hodnoty vypočtené pro N = Členy Z i ve statistice Q n,g nemají jednotkový rozptyl, a proto nelze přímo aplikovat větu A.1. Statistiku Q n,g by bylo třeba přenásobit normující konstantou 2 3. Pro možnost porovnání se simulovanými hodnotami však byl ponechán původní tvar (3.31) a naopak kritické hodnoty jsou upraveny přenásobeny konstantou 3 2. Pro N = 10 by zde okénko vyšlo 1,5, resp. 0,5 pozorování. Tuto kombinaci tedy nelze použít.

30 3. Střední hodnota omezená stanovenou hranicí 25 Tabulka 3.4: Asymptotické kritické hodnoty c as N,G, α pro statistiky {Q n,g } N n=1. α G 0,01N 0,05N 0,1N 0,15N 0,2N 0,01 3,996 3,739 3,652 3,620 3,613 0,05 3,530 3,162 2,994 2,895 2,826 0,10 3,325 2,908 2,704 2,575 2, Kritické hodnoty pro statistiky {Q simp n,g } N n=1 Testová statistika Q simp n,g (3.32) je z výpočetního hlediska jednodušší než původní modifikace Q n,g (3.31) a zároveň je založena na stejné myšlence jako (3.31). V kapitole 4 proto mimo jiné pomocí simulací zjistíme, zda má také podobné detekční vlastnosti. Simulované kritické hodnoty c sim N,G, α pro posloupnost statistik {Q simp n,g } N n=1, získané stejnou metodou jako v případě posloupností {Q n } N n=1 a {Q n,g } N n=1, jsou uvedeny v tabulce 3.5. Tabulka 3.5: Simulované kritické hodnoty c sim N,G, α pro statistiky {Q simp n,g } N n=1. α G = 0,2N, N: ,01 3,853 3,226 3,038 0,05 2,712 2,593 2,585 0,10 2,160 2,290 2,346 α G = 0,1N, N: ,01 4,839 3,642 3,299 0,05 3,281 2,952 2,838 0,10 2,688 2,633 2,602 α G = 0,15N, N: ,01-3,384 3,210 0,05-2,709 2,727 0,10-2,417 2,470 α G = 0,05N, N: ,01-4,295 3,574 0,05-3,426 3,071 0,10-3,032 2, Úprava pro jinou formulaci hypotéz Pro opačně formulované hypotézy v (3.1), tj. H 0 : E(X i ) = µ i δ i = 1,..., n (3.34) H 1 : m {1,..., n 1} takové, že E(X i ) = µ i δ pro i = 1,..., m E(X i ) = µ i < δ pro i = m 1,..., n

31 3. Střední hodnota omezená stanovenou hranicí 26 je odvození statistiky testu poměrem věrohodností zcela analogické. Pouze výraz (3.4) se změní na ( Λ op k = sup (x i µ i ) 2 ) ( sup (x i µ i ) 2 ) (3.35) µ i <δ 2σ 2 µ i δ 2σ 2 i=k1 i=k1 a po dosazení maximálně věrohodných odhadů µ i, které jsou i nadále určeny vztahy (3.9) a (3.10), získáme namísto (3.11) Λ op k = n i=k1 (x i δ) 2 2σ 2 sign(x i δ). (3.36) Podobně se změna ve znění hypotéz projeví i v (3.12). Při požadavku, aby nulovou hypotézu zamítala kterákoli ze statistik (3.36) pro k < n, získáme pro n = 1... N obdobu Q n jako Q op n = min 0 m<n 1 2σ 2 i=m1 (X i δ) 2 sign(x i δ) (3.37) a nulovou hypotézu test zamítne pro malé hodnoty testové statistiky Q op n. Při oboustranné alternativě máme obecně situaci H 0 : E(X i ) = δ 1 µ i δ 2 i = 1,..., n (3.38) H 1 : m {1,..., n 1} takové, že δ 1 E(X i ) = µ i δ 2 pro i = 1,..., m E(X i ) = µ i > δ 2 nebo µ i < δ 1 pro i = m 1,..., n a pro normálně rozdělená data se známým rozptylem σ 2 má testová statistika testu poměrem věrohodností tvar ( Q ob 1 n =max m<n 2σ 2 X i δ ( )) 1 δ 2 ( 2 i=m1 2 δ2 δ 1 sign 2 X i δ ) 1 δ 2 2 δ 2, (3.39) opět pro n = 1... N. Postup odvození je obdobný jako u jednostranných alternativ, pouze je nutno určit příslušné maximálně věrohodné odhady středních hodnot µ i podle nových omezení vyplývajících z H 0 a H 1. Tyto odhady mají nyní tvar δ 2 pro δ 1 δ 2 x i µ i δ1 µ i δ 2 = x i pro δ 1 x i δ 2 (3.40) δ 1 pro x i δ 1 δ 2,

32 3. Střední hodnota omezená stanovenou hranicí 27 x i pro δ 1 δ 2 x i nebo x i δ 1 δ 2 µ i µi <δ 1 nebo µ i >δ 2 = δ 1 pro δ 1 x i δ 1δ 2 2 (3.41) δ 2 pro δ 1δ 2 2 x i δ 2. Po dosazení do obecného vzorce (3.4) (s indexem suprema upraveným podle nového znění hypotéz) a několika standartního úpravách získáme statistiku Q ob n definovanou vztahem (3.39). Nulovou hypotézu test zamítne pro velké hodnoty testové statistiky Q ob n. Poznámka 3.6: Pro speciální případ δ 1 = δ 2 = δ > 0 se (3.39) redukuje na Q ob 1 n = max ( X m<n 2σ 2 i δ) 2 sign( X i δ), (3.42) i=m1 tedy tvar velmi blízký původní jednostranné statistice (3.13). 3.6 Modifikace předpokladů V celém předcházejícím textu jsme se zabývali situací, kdy sledované náhodné veličiny X 1,..., X n měly normální rozdělení a rozptyl tohoto rozdělení byl známý (například z dřívější zkušenosti) natolik dobře, že jeho hodnotu bylo možno určit bez znalosti konkrétních měření. Teoreticky je taková situace nejsnazší, v praxi jsou však normalita pozorovaných veličin nebo znalost rozptylu často příliš silné předpoklady. V této části jsou uvedena detailní odvození a vzorce, které platí za změněných předpokladů, pro původní znění hypotéz (3.1). Postup v případě jiné formulace problému by však byl zcela analogický Normálně rozdělená data s neznámým rozptylem Obecný tvar testu poměrem věrohodností je i nadále vyjádřen vzorcem (3.4) s tím rozdílem, že v indexu suprema se objeví ještě nový parametr σ 2 a skutečná hodnota tohoto parametru bude nahrazena hodnotou jeho odhadu. Podmíněné maximálně věrohodné odhady parametrů µ i jsou stále určeny

Zobrazit více