ŠKODA AUTO VYSOKÁ ŠKOLA, O.P.S. D I P L O M O V Á P R Á C E Bc. Petr Zápotocký

Podobné dokumenty
SEMINÁRNÍ PRÁCE Z 4ST432 Tereza Michlíková (xmict05) ZS 06/07

Úvod do analýzy časových řad

Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných)

Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů

Regulační diagramy (RD)

Modely stacionárních časových řad

PRINCIPY ZABEZPEČENÍ KVALITY

Tématické okruhy pro státní závěrečné zkoušky. Navazující magisterské studium. studijní obor "Management jakosti"

Cvičení 9 dekompozice časových řad a ARMA procesy

Regresní analýza 1. Regresní analýza

SPC v případě autokorelovaných dat. Jiří Michálek, Jan Král OSSM,

4EK211 Základy ekonometrie

Modely pro nestacionární časové řady

Tématické okruhy pro státní závěrečné zkoušky. Navazující magisterské studium. studijní obor "Management kvality"

Ekonomické aspekty statistické regulace pro vysoce způsobilé procesy. Kateřina Brodecká

Regresní analýza. Eva Jarošová

Inovace bakalářského studijního oboru Aplikovaná chemie

4EK211 Základy ekonometrie

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

Průzkumová analýza dat

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Zápočtová práce STATISTIKA I

Modely pro nestacionární časové řady

PRAVDĚPODOBNOST A STATISTIKA

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Národní informační středisko pro podporu kvality

Ilustrační příklad odhadu LRM v SW Gretl

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Charakteristika datového souboru

6. Lineární regresní modely

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

PRAVDĚPODOBNOST A STATISTIKA

Tvorba nelineárních regresních modelů v analýze dat

Rozšířené regulační diagramy

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

Statistické řízení jakosti - regulace procesu měřením a srovnáváním

Úloha 1: Lineární kalibrace

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Kalibrace a limity její přesnosti

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

Korelační a regresní analýza

Inovace bakalářského studijního oboru Aplikovaná chemie

Kalibrace a limity její přesnosti

Lineární regrese. Komentované řešení pomocí MS Excel

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

Jednofaktorová analýza rozptylu

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

Národníinformačnístředisko pro podporu jakosti

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

AVDAT Geometrie metody nejmenších čtverců

Semestrální práce. 3.3 Tvorba nelineárních regresních modelů v analýze dat

Národní informační středisko pro podporu jakosti

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Regulační diagramy EWMA. Eva Jarošová Škoda Auto Vysoká škola

Tomáš Karel LS 2012/2013

4EK211 Základy ekonometrie

JIHOČESKÁ UNIVERZITA V ČESKÝCH BUDĚJOVICÍCH. Ekonomická fakulta. Katedra aplikované matematiky a informatiky. Diplomová práce

AVDAT Klasický lineární model, metoda nejmenších

2.2 Kalibrace a limity její p esnosti

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

18AEK Aplikovaná ekonometrie a teorie časových řad. Řešení domácích úkolů č. 1 a 2 příklad 1

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Rozdíl rizik zbytečného signálu v regulačním diagramu (I,MR) a (xbar,r)

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )

S E M E S T R Á L N Í

Statistika II. Jiří Neubauer

Ekonometrie. Jiří Neubauer

4EK211 Základy ekonometrie

Neuronové časové řady (ANN-TS)

Přehled metod regulace procesů při různých typech chování procesu

Univerzita Pardubice SEMESTRÁLNÍ PRÁCE. Tvorba lineárních regresních modelů. 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D.

12. cvičení z PST. 20. prosince 2017

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

Testování statistických hypotéz

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Úvodem Dříve les než stromy 3 Operace s maticemi

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:

Statistická analýza jednorozměrných dat

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Kalibrace a limity její přesnosti

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Jednofaktorová analýza rozptylu

ŠKODA AUTO VYSOKÁ ŠKOLA, O.P.S. DIPLOMOVÁ PRÁCE Ing. Markéta Černá

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie

LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica

Transkript:

ŠKODA AUTO VYSOKÁ ŠKOLA, O.P.S. D I P L O M O V Á P R Á C E 216 Bc. Petr Zápotocký

ŠKODA AUTO VYSOKÁ ŠKOLA, O.P.S. Studijní program: N628 Ekonomika a management Studijní obor: 628T88 Podniková ekonomika a management provozu STATISTICKÁ REGULACE PROCESU S AUTOKORELACÍ Bc. Petr ZÁPOTOCKÝ Vedoucí práce: doc. Ing. Eva Jarošová, CSc.

Tento list vyjměte a nahraďte zadáním diplomové práce

Prohlašuji, že jsem diplomovou práci vypracoval samostatně s použitím uvedené literatury pod odborným vedením vedoucího práce. Prohlašuji, že citace použitých pramenů je úplná a v práci jsem neporušil autorská práva (ve smyslu zákona č. 121/2 Sb., o právu autorském a o právech souvisejících s právem autorským). V Mladé Boleslavi dne 1. ledna 216 3

Děkuji vedoucí diplomové práce doc. Ing. Evě Jarošové, CSc. za odborné vedení, poskytnutí cenných rad a hlavně trpělivost při vypracovávání diplomové práce. Dále pak rodině a kolegům, kteří byli velkou oporou v náročných dnech. 4

Obsah Seznam použitých zkratek a symbolů... 6 Úvod... 7 1 Statistická regulace procesu s autokorelací... 9 1.1 Přístup založený na modelech časové řady... 14 1.1.1 Metoda založená na ARIMA modelech... 14 1.1.2 Aproximační postup založený na využití statistiky EWMA... 25 1.1.3 Dynamický diagram EWMA... 27 1.1.4 Přístup založený na modifikaci regulačních mezí... 27 1.2 Přístup bez použití modelu... 29 2 Aplikace popsaných metod statistické regulace procesu... 31 2.1 Poloha závitového čepu pro uchycení zadního nárazníku... 33 2.1.1 Metoda založená na ARIMA modelech... 37 2.1.2 Aproximační postup založený na využití statistiky EWMA... 42 2.1.3 Dynamický diagram EWMA... 43 2.1.4 Přístup založený na modifikaci regulačních mezí... 44 2.1.5 Přístup bez použití modelu... 45 2.2 Symetrie v ose Y mezi otvory pro dolní panty předních dveří... 47 2.2.1 Metoda založená na ARIMA modelech... 51 2.2.2 Aproximační postup založený na využití statistiky EWMA... 56 2.2.3 Dynamický diagram EWMA... 57 2.2.4 Přístup založený na modifikaci regulačních mezí... 58 3 Výhody a nevýhody jednotlivých metod... 59 Závěr... 61 Seznam literatury... 64 Seznam obrázků a tabulek... 67 Seznam obrázků... 67 Seznam tabulek... 69 Seznam příloh... 7 5

Seznam použitých zkratek a symbolů ACF ADF test AIC AR ARCH ARIMA ARL ARMA EWMA HQC LCL LM MA ML NLS NBM OBM OLS PACF RMSE SAR SARIMA SMA SPC UCL autokorelační funkce rozšířený Dickeyův-Fullerův test Akaikeho informační kritérium autoregresní proces autoregresní model s podmíněnou heteroskedasticitou integrovaný smíšený proces průměrná délka přeběhu smíšený proces exponenciálně vážený klouzavý průměr Hannanovo-Quinnovo informační kritérium dolní regulační mez Lagrangeův multiplikátor proces klouzavých součtů metoda maximální věrohodnosti metoda nelineárních nejmenších čtverců Non-Overlapping Means Overlapping Means metoda nejmenších čtverců parciální autokorelační funkce Root Mean Square Error sezónní autoregresní proces multiplikativní sezónní proces sezónní proces klouzavých průměrů statistická regulace procesu horní regulační mez 6

Úvod V dnešním globalizovaném světě je pro firmy čím dál těžší nalézt konkurenční výhodu, která by je odlišila od ostatních firem. To platí nesporně i pro tak silně konkurenční prostředí, jakým je automobilový trh v Evropě. Zároveň se každým rokem zpřísňují požadavky Evropské unie na bezpečnost, ekologii a elektronické systémy, což vede k unifikaci napříč konkurencí. Automobilovým výrobcům při hledání konkurenční výhody nezbývá než se zaměřit na snižování nákladů a zvyšování kvality. Pro sledování a zlepšování kvality je důležitý vhodně nastavený systém statistické regulace procesu (SPC). Základním nástrojem SPC je regulační diagram, který představuje jednoduchý a účinný prostředek, jak porozumět sledovanému výrobnímu procesu. Volba vhodného regulačního diagramu je jedním z faktorů, který významně ovlivní efektivnost aplikace statistické regulace procesu. Se zvyšujícím se objemem výroby roste automatizace a zkracují se výrobní takty, což může vést ke vzniku vzájemné závislosti pozorování sledovaného znaku kvality. Cílem závěrečné práce je představit vybrané metody statistické regulace procesu pro autokorelovaná data, jejich aplikaci na dva výrobní procesy a stručně zhodnotit jejich výhody a nevýhody. Diplomová práce se skládá ze dvou celků, teoretické a praktické části. V teoretické části bude vysvětleno, co je to autokorelace, a jak působí porušení předpokladu nezávislosti pozorování na klasické regulační diagramy. Následně budou představeny metody pro řešení závislosti pozorování založené na modelech časových řad a metody bez použití modelu. Do první skupiny patří metoda založená na ARIMA modelech, které bude věnováno nejvíce pozornosti; úvod do základů ARIMA modelování, identifikace vhodného modelu, ověření požadovaných předpokladů reziduí a následná konstrukce regulačních diagramů na rezidua modelu. Dále bude představen aproximační postup založený na využití statistiky EWMA, dynamický diagram EWMA a přístup založený na modifikaci regulačních mezí. Do druhé skupiny, bez použití modelu, patří metody OBM a NBM. V praktické části budou analyzovány dva výrobní procesy se statisticky významnou autokorelací. V prvním případě se jedná o výrobní proces, ve kterém je regulovanou veličinou poloha závitového čepu pro uchycení zadního nárazníku. V druhém procesu je regulovanou veličinou symetrie v ose Y mezi otvory pro dolní 7

panty předních dveří svařené karoserie. V obou případech ověříme předpoklady pozorování a implementujeme výše popsané metody. V závěru budou výsledky těchto metod porovnány s klasickými Shewhartovými diagramy a také budou diskutovány toleranční meze stanovené pro dané procesy ve firmě ŠKODA AUTO a.s. 8

1 Statistická regulace procesu s autokorelací Statistická regulace procesu (SPC - Statistical process control) je metoda kontroly kvality využívající statistické metody. Cílem regulace je dosažení stabilního procesu, který co nejméně kolísá kolem stanovené hodnoty. Metoda je založena na průběžné kontrole procesu prostřednictvím pravidelných výběrů a zjištění odchylek od požadovaného stavu. Základním nástrojem statistické regulace je regulační diagram, do kterého se vynášejí hodnoty zvolené výběrové charakteristiky. Mezi další nástroje SPC patří histogram a číslicový diagram (Stem-and-Leaf plot), kontrolní tabulka (Check sheet), Paretův diagram, Ishikawův diagram (diagram příčin a následků), diagram afinity (Defect concentration diagram) a korelogram (Montgomery, 29, str. 18). V každém procesu lze pozorovat určitou variabilitu sledovaného znaku. Inherentní kolísání je součástí procesu a bývá označováno jako náhodné nebo přirozené. Je-li v procesu přítomna pouze inherentní variabilita, označuje se proces jako proces pod (statistickou) kontrolou. Kolísání, které je možné přímo přiřadit určitému problému (např. lidská chyba, porucha stroje, použití nevhodné vstupní suroviny apod.), se nazývá vymezitelné. Cílem statistické regulace procesu je odhalit přítomnost vymezitelné příčiny co nejdříve a minimalizovat tak škodu vzniklou výrobou neshodných jednotek. V roce 1924 představil Walter A. Shewhart regulační diagramy a zdůraznil důležitost sledování a kontroly variability k dosažení vyšší kvality. V průběhu druhé světové války byly Shewhartovy regulační diagramy zavedeny do výrobních standardů USA. V průběhu 5. let 2. století byly představeny regulační diagramy CUSUM (Cumulative Sum kumulativní součet) a EWMA (Exponentially Weighted Moving Average exponenciálně vážený klouzavý průměr), které využívají informace i z předchozích pozorování (Page, 1954 a Roberts, 1959). Vlastnosti regulačních diagramů byly odvozeny za předpokladu nezávislých a normálně rozdělených pozorování se střední hodnotou a směrodatnou odchylkou. Proces je mimo kontrolu v případě změny a (nebo obou). V případě procesu pod kontrolou lze hodnotu y t v čase t zapsat jako y t 1,2, (1) t t 9

kde t je bílý šum (tj. posloupnost nekorelovaných náhodných veličin s nulovou 2 střední hodnotou a konstantním konečným rozptylem ) 1. Rovnice (1) se nazývá Shewhartův procesní model (Montgomery, 29, str. 446). Porušení předpokladu nezávislosti pozorování má negativně vliv na meze regulačního diagramu. I nízká úroveň korelace ovlivní výpočet regulačních mezí, což vede v případě pozitivní korelace k vysokému počtu falešných signálů (regulační meze jsou příliš úzké) a v případě negativní autokorelace k malému počtu signálů (regulační meze jsou příliš široké). V praxi ve výrobním procesu se častěji vyskytuje pozitivní autokorelace. Autokorelace Autokorelací označujeme jev, kdy pozorování y t je závislé na minulých pozorováních y, kde k 1,2,, n. Tato závislost se často vyskytuje u spojitých procesů t k (např. chemické procesy, metalurgie), kde je autokorelace vyvolána velkou setrvačností procesu v čase (Noskievičová a Fridrich, 212, s. 38). Montgomery a Friedman (1989) uvádějí, že autokorelace se vyskytuje také u diskrétních procesů s krátkými výrobními cykly a vysokou výrobní rychlostí. K popisu autokorelace se používá autokovariační a autokorelační funkce. Autokovariační funkce pro zpoždění k je definována jako cov y, y E y y, k, 1,,1 (2) k t tk t tk Autokorelační funkce (ACF) pro zpoždění k je k k, k, 1,,1 (3) k 2 y y je konstantní rozptyl dané časové řady. Autokorelační funkce kde 2 var t y se graficky znázorňuje pomocí korelogramu. Pro odhad autokovariační funkce pro zpoždění k platí n 1 c y y y y k n,,1,, 1 (4) k t t k n tk1 1 V kontextu časových řad a ARIMA metodologie označen znak kvality jako y 1

kde 1 n yt n t 1 Odhad autokorelační funkce pro zpoždění k je kde n je počet pozorování časové řady. Kromě autokorelační funkce (PACF) značená jako kk. Hodnota kk je definována jako parciální korelační koeficient mezi y t a y (5) ck rk, k,1,, n 1 (6) c k se používá také parciální autokorelační funkce yt k při pevných hodnotách yt k1,, yt 1. Odhad r kk parciální autokorelační funkce kk pro zpoždění k je roven odhadu parametru kk v modelu y y y y (7) t k1 t1 k 2 t2 kk tk t kde je konstanta (může být i nulová). V praxi, prostřednictvím počítačových programů, se používá rekurentní výpočet r kk (Durbin, 196) r r, 11 1 kde r kk k 1 r r r k k1, j k j j1 k 1 1 r r k 1, j j j1 pro k 1 (8) rkj rk 1, j rkk rk 1, k j pro j 1,, k 1 (9) Detekce autokorelace Prvním krokem je vytvoření grafu pozorování y t a bodového grafu znázorňujícího závislost y na yt 1. Pozitivní autokorelace se projevuje nápadně dlouhou řadou t hodnot na jedné straně od průměru hodnot časové řady. Příklad takové časové řady je zobrazen na obrázku 1a. Při negativní autokorelaci hodnoty naopak oscilují kolem průměru (obrázek 1b). V bodovém grafu se projevuje závislost pozitivní resp. negativní, viz následující obrázek. 11

y t y t t y t-1 a) pozitivní autokorelace y t y t t y t-1 b) negativní autokorelace Zdroj: Vlastní zpracování Obr. 1 Příklady časových řad s pozitivní a negativní autokorelací Dalším způsobem detekce autokorelace je využití korelogramu, tj. grafu autokorelační funkce (6). Pomocí statistického programu GiveWin můžeme vytvořit korelogram s 95% intervaly spolehlivosti s mezemi ve vzdálenosti 2/ n. V případě kdy hodnoty leží mimo tyto meze, považujeme autokorelaci pro zpoždění k za statisticky významnou. Statistické testy autokorelace jsou např. portmanteau testy (Box a Pierce, 197 a Ljung a Box, 1978). Testuje se nulová hypotéza H : 1 2 K proti alternativě H1:non H, kde k, k 1,, K, jsou hodnoty ACF pro zpoždění k. K se volí blízké n. Testové statistiky májí tvar BP K 2 k k1 Q n r (1) 12

a Q LB K 2 rk n( n 2). (11) n k k1 Testová statistika obou testů má při platnosti nulové hypotézy rozdělení chí-kvadrát s K stupni volnosti. Tyto testy se však používají především pro ověření předpokladu nekorelovanosti reziduí vybraného modelu ARIMA (Jarošová a Noskievičová, 215, s. 42). Předpoklad normality Normalita pozorování spolu s jejich nezávislostí jsou základními předpoklady, z nichž Shewhartův diagram vychází. Při významnější odlišnosti rozdělení výběrové charakteristiky od normálního rozdělení může být riziko falešného signálu vyšší než očekávané. Montgomery (29, str. 446) však uvádí, že i v situacích ve kterých je mírně porušen předpoklad normality, budou klasické regulační diagramy i nadále fungovat poměrně dobře. K ověření předpokladu normality slouží statistické testy a grafické nástroje. Existuje celá řada testů normality, v praktické části bude využit program Statgraphics jehož součástí jsou testy šikmosti a špičatosti, chí-kvadrát test dobré shody, Shapirův Wilkův test a Kolmogorovův Smirnovův test. Nulová hypotéza vyjadřuje předpoklad, že hodnoty sledovaného znaku tvoří náhodný výběr z normálního rozdělení. Není-li nulová hypotéza zamítnuta, pokládáme předpoklad normality za splněný. O zamítnutí nulové hypotézy rozhodneme na základě p-hodnoty uvedené na výstupu Statgraphicsu. Z grafických nástrojů bude použit Q-Q graf. Podstatou kvantil-kvantilového grafu je seřazení hodnot podle velikosti y1 y2 yn, výpočet distribuční funkce F y pro každou hodnotu y i, kde i 1, 2,, n a výpočet kvantilů normálního rozdělení. Kvantily normovaného normálního rozdělení u i se vynášejí proti pozorování V případě normálního rozdělení budou vynesené body ležet přibližně v přímce. Variantou Q-Q grafu je pravděpodobnostní graf kde na osu y vynášíme hodnoty distribuční funkce v procentech. n i y i. 13

V následující části budou představeny vybrané metody, které je možné aplikovat při konstrukci regulačních diagramů a tím odstranit negativní vliv autokorelace na účinnost statistické regulace procesu. Metody je možné rozdělit do dvou hlavních skupin. Do první skupiny patří metody založené na modelech časových řad, do druhé skupiny patří metody bez použití modelu. 1.1 Přístup založený na modelech časové řady Postup spočívá v nalezení vhodného modelu s požadovanými vlastnostmi a aplikaci regulačních diagramů na jeho rezidua, která jsou již nekorelována. Mezi metody patří stochastické modelování časových řad ARIMA, aproximační postup založený na statistice EWMA a dynamický diagram EWMA. Specifickým postupem je metoda modifikace regulačních mezí, která využívá autokorelační struktury časových řad a upravuje regulační meze Shewhartových diagramů. 1.1.1 Metoda založená na ARIMA modelech ARIMA modely byly představeny v monografii Time Series Analysis: Forecasting and Control (Box a Jenkins, 197). Jedná se o stochastické modelování trendu a sezónní složky, kde základním prvkem konstrukce modelu časové řady je reziduální složka, která může být tvořena korelovanými náhodnými veličinami (Cipra, 1986). Těžiště této metodologie spočívá ve vyšetřování vzájemných závislostí pozorování v dané časové řadě. Metodologie vyžaduje delší časové řady, uvádí se minimální počet 5 pozorování (Cipra, 28, s. 327). V Boxově-Jenkinsově metodologii lze modelovat pouze stacionární časové řady, nicméně nestacionární časové řady lze převést vhodnou transformací na řady stacionární. Je nutné rozlišovat mezi deterministickou nestacionaritou, která je způsobena např. deterministickým trendem, a stochastickou nestacionaritou. V prvním případě se dosáhne stacionarity pomocí eliminace trendu, v druhém případě prostřednictvím diferencování. Stacionarita (slabá stacionarita) znamená, že příslušný stochastický proces má konstantní střední hodnotu, konstantní rozptyl a kovarianční strukturu druhého řádu invariantní vůči posunům v čase, tj. E y t konst (12) 2 y var t y konst (13) 14

y y y y y y cov s, t E s t cov sh, th pro libovolné h (14) Pro vyjádření časového posunu se používá operátor B a platí By t (15) yt 1 Obecně tedy j-tá mocnina vyjadřuje zpoždění veličiny o j časových jednotek B y B By B y y (16) j j 1 j 1 t t t1 tj Používá se také diferenční operátor a platí t t t1 1 t Obecně d-tá mocnina diferenčního operátoru y y y B y (17) d má tvar d d d d y y y y y y B y 1 2 d1 d t t t t1 t2 1 td 1 t (18) Základní modely Boxovy-Jenkinsovy metodologie Metodologie vychází z lineárního procesu, který lze zapsat jako 2 1 y B B B (19) t t 1 t1 2 t2 1 2 t t kde j jsou neznámé parametry. Lze dokázat (viz Box a Jenkins, 197, s. 49), že postačující podmínka pro existenci lineárního procesu má tvar B konverguje pro B 1 (2) přičemž s B zacházíme jako s komplexní proměnnou. Tato podmínka zároveň zaručí, že lineární proces je stacionární. Lze-li lineární proces vyjádřit ve tvaru y y y, tj. y y y B y (21) t 1 t1 2 t2 t t t 1 t1 2 t2 t jde o invertibilní proces. Postačující podmínka pro invertibilitu lineárního procesu má tvar (Box a Jenkins, 197) B konverguje pro B 1 (22) Základní modely Boxovy-Jenkinsovy metodologie jsou proces klouzavých součtů MA, autoregresní proces AR a smíšený proces ARMA. 15

Proces klouzavých součtů řádu q značený jako MA (q) má tvar kde 1,, q y t t 1 t1 q tq q t B (23) jsou neznámé parametry a q 1 q B 1 B B je operátor klouzavých součtů. Proces vznikne useknutím lineárního procesu (19) v bodě, který odpovídá zpoždění q. Autoregresní proces řádu p značený jako AR (p) má tvar kde 1, y y y, tj. y y y B y (24) t 1 t1 p t p t t 1 t1 p t p p t t jsou neznámé parametry a p 1, p p B 1 B B je autoregresní operátor. Proces vznikne useknutím invertovaného tvaru lineárního procesu (21) v bodě, který odpovídá zpoždění p. Smíšený proces řádu p a q značený jako ARMA (p, q) má tvar p q yt 1 yt 1 p yt p t 1 t1 qtq, tj. p B yt q B t (25) kde operátory B a B p jsou definovány výše. q Kromě trendu je možné stochasticky modelovat i sezónnost. Sezónní variantou autoregresního procesu řádu P označovaného jako SAR (P) je proces lze zapsat ve tvaru 2 kde P y y y y (23) t 1 ts 2 t2s P tps t s s 2 s Ps 1 2 B y B B B y (27) P t P t t B B B B je sezónní autoregresní operátor a s s s Ps 1 2 P,, 1 P jsou neznámé parametry. Sezónní variantou procesu klouzavých průměrů řádu Q označovaného jako SMA (Q) je 2 kde s 2 1 s Qs s 1 2 y B B B B (28) t Q t Q t B 1 B B B je sezónní operátor klouzavých průměrů Q s s s Qs 1 2 Q a,, 1 Q jsou neznámé parametry. 16

Model ARIMA a SARIMA Nestacionární časová řada svědčí o přítomnosti trendu. Jak bylo zmíněno v úvodu, v případě deterministického trendu je nutné tento trend eliminovat. Časové řady se stochastickým trendem lze stacionarizovat pomocí diferencování. V Boxově-Jenkinsově metodologii jsou k tomu určeny procesy typu ARIMA (Cipra, 28). Integrovaný smíšený proces řádu p,d,q značený jako ARIMA(p,d,q) má tvar d kde 1 t d t d B1 B y B (29) p t q t y B y je d-tá diference modelované časové řady. Časová řada se stacionarizuje prostřednictvím vhodně zvoleného řádu diferencování a následně se stacionární řada modeluje pomocí smíšeného procesu ARMA. V případě, že časová řada vykazuje sezónnost s periodou o délce s, použije se pro časové období t model kde s D s B y B (3) P s t Q t je tzv. sezónní diferenční operátor, pro který platí atd., a t s 1 B (31) s s s yt 1 B yt yt yt s (32) s 2 s s y 1 B y 1 2B B y y 2y y (33) 2 2 s t t t t ts t2s je náhodná složka. Řadu lze vyjádřit ARIMA modelem tvaru t d B1 B B (34) p t q t kde t již představuje bílý šum. Modely (3) a (34) lze spojit do jediného modelu s d s D s B B1 B 1 B y B B (35) P p t q Q t Model (35) se nazývá multiplikativní sezónní proces řádu p d q P D Q,,,, nebo s také SARIMA model. Zde p značí řád procesu AR, q je řád procesu MA, d je řád nesezónní diference, P je řád sezónní části procesu AR, Q je řád sezónního 17

procesu MA, D je řád sezónní diference a s je délka sezónní periody. Varianta SARIMA modelu s konstantou má tvar s s d s D s B B1 B 1 B y D, B B (36) P p t j j t q Q t j1 Proces (36) obsahuje konstantu, která je rozdílná pro každou sezónu j, j 1,, s D jt, je nula-jedničková sezónní pomocná proměnná. Konstrukce modelů ARIMA a SARIMA Prvním krokem je grafický rozbor dané časové řady, ze kterého můžeme zjistit její vlastnosti důležité pro další postup. Jde hlavně o nestacionaritu, přítomnost sezónní složky či použití vhodné transformace. Často se uvádí, že vhodnou transformací, která pokryje většinu praktických případů, je logaritmická transformace. Popis jednotlivých transformací je nad rámec této diplomové práce a autor uvádí pouze odkazy na publikace Box a Cox (1964) a Cipra (28, str. 316). Následnou konstrukci modelu v rámci Boxovy-Jenkinsovy metodologie je možné rozdělit na tři základní fáze, které se mohou opakovat, to jest identifikace, odhad a ověření modelu. Identifikace modelu Identifikace je postup vedoucí ke zjištění vhodného řádu diferencování a řádu pq, a PQ, jednotlivých složek SARIMA modelu. Pro identifikaci řádu diferencování se používají testy na jednotkový kořen. K identifikaci řádu pq, a PQ, lze využít známých (teoretických) průběhů korelogramů ACF a PACF. V případě nerozhodnosti mezi několika modely je možné použít informační kritéria. Fáze identifikace modelu je nejdůležitější v celé Boxově-Jenkinsově metodologii. Testy na jednotkový kořen Pro ověření stacionarity se používají testy na jednotkový kořen (Unit Root Test), kdy přítomnost jednotkového kořenu ukazuje na možnost stacionarizace diferencováním. Existuje několik statistických testů jako např. Dickeyův-Fullerův test, Phillipsův-Perronův test nebo KPSS test. V této práci bude použit rozšířený Dickeyův-Fullerův test (ADF test), který používá i statistický program EViews. ADF test má tři varianty (viz Fuller, 1976; Dickey a Fuller, 1979; Dickey a Fuller, 1981), 18

které se souhrnně označují jako -testy. V prvním testu se uvažuje model bez konstanty, v druhém testu model s konstantou a ve třetím testu model s konstantou i trendem. Nulovou hypotézu pro všechny tři testy lze zapsat jako alternativní jako H : y y y pro, (37) t t1 i ti t i1 p H : y. t y y pro, (38) 1 t t1 i ti t i1 kde 1 1 a dále pro první test platí, pro druhý test platí. Testová statistika je pro všechny tři ADF testy stejná p ˆ ADF (39) ˆ ˆ s odhady pořízenými momentovou metodou. Vzorce pro momentové odhady a směrodatné odchylky odhadů jsou uvedeny např. v Cipra (28, s. 344). Kritický obor testu je tvořen hodnotami ADF, pro něž platí t ADF t n (4) Kritické hodnoty t t se určí simulací. Tabulka 1 obsahuje ukázku kritických hodnot pro n 5 a zpoždění lag 4. Tab. 1 Kritické hodnoty ADF testů pro n 5 a zpoždění lag 4 Hladina významnosti 1% 5% 1% první test () -1,612-1,948-2,617 druhý test ( µ ) -2,62-2,928-3,585 třetí test ( ) -3,187-3,513-4,176 Zdroj: Vlastní zpracování Nezamítneme-li u žádného ze tří testů nulovou hypotézu, je nutné provést první diferenci časové řady a test opakovat. Způsob diferencování se doporučuje volit co nejjednodušší, protože složité postupy vedou k přediferencování (Cipra, 28, s. 32). 19

Tvary autokorelační a parciální autokorelační funkce Metoda volby řádu pq, je založena na hledání podobností ve tvaru autokorelační funkce a parciální autokorelační funkce a jejich teoretických protějšků známých modelů. V příloze č. 1 jsou zobrazeny teoretické průběhy ACF a PACF základních ARIMA modelů. Z grafů je patrné, že průběhy ACF a PACF jsou závislé na znaménku parametrů jednotlivého modelu. Teoretické autokorelační a parciální autokorelační funkce lze shrnout následovně (Arlt a Arltová, 29): Tab. 2 Popis průběhu základních teoretických ACF a PACF Model ACF PACF AR (1) Exponenciální nebo oscilační pokles kk = pro k > 1 (jeden vrchol) AR (2) AR (p) MA (1) MA (2) MA (q) ARMA (1,1) ARMA (p,q) Exponenciální nebo exponenciálně sinusoidní pokles Exponenciální a/nebo exponenciálně sinusoidní pokles k = pro k > 1 (jeden vrchol) k = pro k > 2 (dva vrcholy) k = pro k > q (q vrcholů) Od zpoždění 1 exponenciální nebo oscilační pokles Od zpoždění q - p exponenciální nebo exponenciálně sinusoidní pokles kk = pro k > 2 (dva vrcholy) kk = pro k > p (p vrcholů) Omezená exponenciálním nebo oscilačním poklesem Omezená exponenciálním nebo exponenciálně oscilačním poklesem Omezená exponenciálním a/nebo exponenciálně oscilačním poklesem Od zpoždění 1 omezená exponenciálním nebo oscilačním poklesem Od zpoždění q - p omezená exponen. nebo exponenciálně sinusoidním poklesem Zdroj: Vlastní zpracování Identifikace řádu modelu SARIMA je založena na stejném principu (např. Arlt, 1999). Informační kritéria pro volbu modelu V případě, že je nalezeno několik vyhovujících modelů, můžeme použít následující postup. Bylo navrženo několik kritérií, která jsou založena na porovnávání reziduí jednotlivých modelů (předpokladem je již vhodně zvolený řád diferencování). 2

Model je vybrán na základě nejnižší hodnoty daných kritérií. V práci budou používána dvě informační kritéria: Akaikeho kritérium AIC (Akaike, 1974) ve formě kde M p q P Q 1 AIC M M (41) n 2 2 ln ˆ je počet parametrů v modelu SARIMA p d q P D Q 2 s konstantou, ˆ je reziduální rozptyl modelu a n je počet pozorování. Hannanovo-Quinnovo kritérium HQC (Hannan a Quinn, 1979) ve formě Diagnostika modelu HQC M,,,, s 2M ln ln n 2 ln ˆ (42) n Diagnostika slouží k ověření předpokladů modelu. V této fázi musí dojít k rozhodnutí o přijatelnosti zvoleného modelu. V případě, že nejsou splněny předpoklady normality, rozptylu nebo nekorelovanosti náhodné složky, je potřeba se vrátit k identifikaci modelu a zvolit model jiný. Náhodná složka v ARIMA modelu nebo SARIMA modelu q B (1 B B ) p d t yt (43) q s B B 1 d 1 s B B P p s D t B B yt (44) Q by měla mít vlastnosti bílého šumu. Základní diagnostická kontrola tedy spočívá v posouzení reziduí resp. kde ˆ ˆ s ˆ s ˆ p B, q B, P B, Q B ˆ p B d ˆ t (1 B) yt (45) ˆ B q s B ˆ B d ˆ s B B ˆ P p s D ˆ t 1 B 1 B yt (46) ˆ q vzniknou z B B s s p, q, P B, QB po dosazení odhadů parametrů. Q 21

Normalita náhodné složky Normalita je důležitým předpokladem pro testování parametrů modelu a konstrukci intervalových předpovědí, ale také např. testu homoskedasticity či nekorelovanosti náhodné složky. K ověření normality reziduí je použit Jarqueův-Berův test (Jarque a Bera, 198), který testuje současně šikmost i špičatost a je součástí počítačového programu GiveWin. Sdružená testová statistika má tvar 2 2 JB SK KU (47) kde SK je testová statistika pro testování šikmosti rozdělení n SK 6 1/2 mˆ mˆ 3 3/2 2 (48) a KU je testová statistika pro testování špičatosti rozdělení kde KU 1/2 n mˆ 4 3 2 24 mˆ 2 (49) ˆ m j n t1 ˆ t n j a n t1 ˆ n t j 2,3,4 (5) Za předpokladu platnosti nulové hypotézy, která znamená normalitu náhodné složky modelu, mají statistiky SK a KU asymptoticky normované normální rozdělení N,1. Sdružená statistika JB má rozdělení chí-kvadrát se dvěma stupni volnosti. Rozptyl náhodné složky Testů pro ověření konstantního rozptylu náhodné složky existuje několik. V práci je použit tzv. ARCH (q) (AutoRegressive Conditional Heteroscedasticity) model, který je součástí počítačového programu GiveWin. Test heteroskedasticity je založen na modelu vyjadřujícím závislost na rozptylu náhodné složky t v čase t, na rozptylech,, t 1 v časech 1 t q t atd. K odhadu náhodné složky využijeme rezidua, model má tvar ˆ ˆ ˆ ˆ u (51) 2 2 2 2 t 1 t1 2 t2 q tq t 22

kde,, q jsou neznámé parametry a u t je náhodná složka s vlastnostmi bílého šumu. Parametry se odhadují metodou nejmenších čtverců. Nulová hypotéza H 1 2 q : vyjadřuje homoskedasticitu náhodné složky v modelu. Testová statistika má tvar kde n je délka časové řady a ARCH q 2 nr (52) 2 R je koeficient determinace modelu (51). Za platnosti nulové hypotézy má testová statistika rozdělení chí-kvadrát s q stupni volnosti. Nekorelovanost náhodné složky Existenci autokorelace lze posoudit pomocí autokorelační funkce reziduí r k t t ˆˆ t ˆ tk 2 t (53) kde nulová hypotéza je H : k proti alternativě H : 1 k. Kritický obor je tvořen takovými hodnotami r k, pro něž platí r k 2. V případě kdy hodnoty leží mi- n mo tyto meze, považujeme autokorelaci za statisticky významnou. Testy autokorelace byly představeny na začátku diplomové práce - testové statistiky (1) a (11). V případě testování nekorelovanosti náhodné složky jsou testy použity na rezidua modelu. Testová statistika má při platnosti nulové hypotézy rozdělení chí-kvadrát s K p q stupni volnosti. V praktické části bude použit Boxův-Piercův test, který je součástí programu GiveWin. 23

Regulační diagramy pro rezidua ARIMA modelů Za předpokladu, kdy odhady parametrů zvoleného modelu jsou statisticky významné, rezidua mají normální rozdělení, nejsou autokorelována a neprojevila se heteroskedasticita, lze přistoupit ke konstrukci regulačních diagramů. Autokorelace se projevuje především při sledování jednotlivých hodnot a spíše výjimečně při sledování průměrů, omezíme se proto na regulační diagramy pro individuální hodnoty (a klouzavá rozpětí) aplikované na rezidua modelu. Horní regulační mez, centrální přímka a dolní regulační mez se pro diagram individuálních hodnot vypočítá následovně 3 UCL eˆ t MR d CL e ˆ t 2 (54) 3 LCL eˆ t MR d 2 (55) kde e ˆt je průměr z reziduí a MR je průměrné klouzavé rozpětí reziduí. Vzorce pro výpočet regulačních mezí a centrální přímky regulačního diagramu pro klouzavé rozpětí mají tvar UCL D MR (56) 4 CL MR LCL (57) kde d 2 a D 4 jsou součinitele dle ISO ČSN 8258. Pro zvýšení citlivosti diagramů ARIMA na menší odchylky lze použít oboustranný regulační diagram CUSUM s rozhodovacím intervalem ±H nebo klasický EWMA diagram, oba aplikované na rezidua modelu (Noskievičová a Fridrich, 212). V následujícím odstavci bude představena další metoda pro autokorelovaná data. Nejdříve bude popsán klasický regulační diagram EWMA (Exponentially Weighted Moving Average exponenciálně vážený klouzavý průměr) a následně i postup umožňující využít EWMA pro autokorelovaná data (aproximační metoda). 24

1.1.2 Aproximační postup založený na využití statistiky EWMA Regulační diagram EWMA představil Roberts (1959). Statistika EWMA využívá informace ze všech předchozích pozorování a je definována (Montgomery, 29) jako 1 1 zi yi zi (58) kde 1 je váha současného pozorování a z (pro n 1) je počáteční (referenční) hodnota (nebo y ). Při dosazení za zi 1 podle (58) dostaneme 1 1 z y y z i i i1 i2 1 1 y y z i i1 i2 2 (59) a z i lze vyjádřit ve tvaru Váha 1 j i1 j i 1 1. (6) z y z i i j j geometricky klesá a tedy nejvyšší hodnotu má poslední pozorování, váha předchozích pozorování klesá. Čím menší je hodnota, tím větší význam je přikládán předchozím pozorováním. Nízká hodnota parametru zvyšuje citlivost diagramu k malým posunům procesu a naopak. EWMA diagramy s blízkým 1 jsou podobné Shewhartovým diagramům. Jestliže jsou pozorování y i nezávislé náhodné veličiny s rozptylem z i je 2, pak rozptyl 2 2 1 1 2 i z i 2 (61) V regulačním diagramu EWMA je na ose x vynesen pořadí pozorování (popřípadě čas) a na ose y hodnoty z i. Centrální přímka, horní regulační mez a dolní regulační mez jsou dány vztahy 2 i UCL L 1 1 (62) 2 CL 25

2 i LCL L 1 1 (63) 2 kde parametr L určuje vzdálenost regulační meze od centrální přímky. Vhodnou kombinací parametrů L a se zabývali např. Crowder (1987, 1989) nebo Lucas a Saccucci (199). Montgomery (29, s. 423) uvádí, že pro praktické použití je vhodné volit hodnotu v intervalu,5,25. Často se volí hodnota,2 (Noskievičová a Brodecká, 211), což znamená, že minulým pozorováním se přiřazují váhy,2,,16,,128,,124 a tak dále. Pro takto zvolenou váhu je možné použít L 3 (obvyklé 3-sigma meze). Aproximační metoda pro rezidua Protože v praxi může být obtížné zvolit vhodný model ARIMA, Montgomery a Mastrangelo (1991) navrhli aproximační metodu založenou na statistice EWMA. Využili přitom skutečnost, že EWMA lze za určitých podmínek použít na korelovaná data. Předpokládejme, že pro daný proces je vhodný model ARIMA (,1,1) y y. (64) t t1 t t1 EWMA s parametrem 1 (65) je pak optimální jednokroková předpověď daného procesu. Jestliže předpověď pozorování v čase t 1 vytvořena v čase t, pak kde y t z a chyba jednokrokové předpovědi v čase t t yˆt 1 je ˆt 1 t (66) 1 1 zt yt zt (67) e y yˆ t 1. (68) t t t Rezidua modelu mají normální rozdělení se střední hodnotou a jsou nezávislá. Odhad parametru (resp. ) se provede metodou nejmenších čtverců. Montgomery (29, s. 454) uvádí, že zmíněný postup lze použít i v případě jiného modelu než ARIMA (,1,1) za předpokladu, kdy pozorování daného procesu jsou vzájemně pozitivně korelována a střední hodnota procesu se nemění příliš rychle. 26

V takovém případě metoda EWMA s vhodně zvoleným parametrem poskytuje vynikající jednokrokovou předpověď. Regulační diagramy pro individuální hodnoty jsou konstruovány pro chyby jednokrokové předpovědi z rovnice (68). Pro praktické využití popsané metody se doporučuje sestavit i diagram původních pozorování, který obsluze pomůže sledovat dynamiku celého procesu (Montgomery, 29). 1.1.3 Dynamický diagram EWMA V souvislosti s doporučením vést dva regulační diagramy navrhli Montgomery a Mastrangelo (1991) způsob jak tyto dva diagramy zkombinovat. Výsledný regulační diagram již obsahuje informaci o stavu statistické kontroly i dynamice procesu. Dynamický diagram EWMA lze použít opět za předpokladu, kdy pozorování daného procesu jsou vzájemně pozitivně korelovány a střední hodnota procesu se nemění příliš rychle. Jestliže je statistika EWMA vhodnou jednokrokovou předpovědí, pak lze místo centrální přímky použít hodnoty z t z rovnice (67) v časovém okamžiku t 1 a regulační meze sestrojit podle (Montgomery, 29, s. 455) UCL t1 z t 3 D (69) a LCL t1 z t 3 D (7) kde D je směrodatná odchylka rozdělení chyb jednokrokové predikce. Pokud je odhad parametru proveden metodou nejmenších čtverců, pak platí, že ˆ D n t1 2 eˆ t n opt. (71) S regulačními mezemi (69) a (7) jsou potom pro posouzení, zda je proces pod statistickou kontrolou, porovnávány hodnoty sledovaného znaku kvality yt 1. 1.1.4 Přístup založený na modifikaci regulačních mezí V této metodě jsou regulační diagramy podobné Shewhartovým a konstruují se pro původní naměřené hodnoty. Odhad směrodatné odchylky je závislý na určení modelu časové řady. Regulační meze pro individuální hodnoty se stanoví následovně 27

UCL L (72) x a LCL L (73) x kde x je směrodatná odchylka použitého modelu časové řady a parametr L určuje šířku regulačních mezí. Odhad směrodatné odchylky ˆ x reflektuje autokorelační strukturu daného ARMA modelu. Vzorce pro výpočet odhadu směrodatné odchylky ˆ x vybraných modelů jsou zobrazeny v následující tabulce (Jarošová a Noskievičová, 215), kde ˆ je odhad reziduální směrodatné odchylky. Tab. 3 Vzorce pro výpočet odhadu směrodatné odchylky vybraných ARMA modelů AR (1) ˆ x 2 ˆ 1 ˆ 2 1 AR (2) ˆ x 1 ˆ ˆ 1 ˆ ˆ ˆ 2 2 2 2 2 1 2 1 MA (1) ˆ ˆ x 1 1 2 2 ˆ MA (2) ˆ ˆ ˆ x 1 1 2 2 2 2 ˆ ARMA (1,1) ˆ x 12ˆ ˆ ˆ 2 ˆ 1 2 1 1 1 2 ˆ 1 Protože již neplatí předpoklad nezávislosti pozorování, nelze hodnotu ARL určit jednoduše jako v případě Shewhartova diagramu. Jelikož jsou hodnoty ARL menší při pozitivní autokorelaci, je třeba volit parametr L tak, aby ARL() = 37,4. Např. pro model AR (1) uvádějí Michelson (1994), Reynolds (1996) a Zhang (1997) následující hodnoty zjištěné na základě simulací: Tab. 4 Volba parametru L v závislosti na parametru AR (1) pro ARL() = 37,4 1,2,25,4,5,6,75,8,95 L 3 2,998 2,99 2,989 2,98 2,96 2,9 2,864 2,54 28

1.2 Přístup bez použití modelu Metody založené na použití modelu jsou přesnější při popisu chování modelu a jeho dynamiky, avšak jsou náročné na čas. Z toho důvodu vznikl přístup, který nevyužívá statistický model (Model-Free Approach). Runger a Willemain (1996) navrhli regulační diagram založený na průměrech z podskupin (Batch Means). Předpoklady použití této metody jsou velký rozsah výběrů a stacionarita regulovaného procesu. Podskupiny jsou postaveny na čtyřech parametrech n, b, w a k. Kde n je počet pozorování, který je rozdělen na k podskupin o velikosti b s w vynechaných hodnot. Zdroj: Jarošová a Noskievičová (215) Obr. 2 Tvorba podskupin Z vytvořených podskupin jsou vypočteny průměry, které se vynášejí do regulačního diagramu pro individuální hodnoty. Vhodnou volbou parametrů modelu se docílí vzájemné nezávislosti a asymptoticky normálního rozdělení. Metodu, ve které nevynecháváme hodnoty mezi podskupinami ( w ), se označuje NBM (Non- Overlapping Means). Případ, kdy hodnoty vynecháváme ( w ), se označuje OBM (Overlapping Means). Metody jsou graficky znázorněny na obrázku 2. Určení parametru b je klíčové pro celou metodologii. Vhodnou volbou se zabývala řada autorů, např. Runger a Willemain (1996) navrhli jednoduchý způsob založený na postupné volbě velikosti podskupin pro AR (1) modely. Začíná se na hodnotě b 1 a pokračuje se s dvojnásobky, dokud hodnota korelace ve zpoždění t 1 modelu 29

AR (1) neklesne k,1. Tento postup zajistí minimalizaci hodnoty parametru b. Následující tabulka ukazuje hodnoty parametru b v závislosti na hodnotě parametru 1 modelu AR (1). Tab. 5 Hodnoty parametru b pro model AR (1) 1,1,2,3,4,5,6,7,8,9,95,99 b 1 2 3 4 6 8 12 17 27 58 118 596 Zdroj: Kang a Chmeiser (1987) Z tabulky je patrný důvod, proč metoda vyžaduje velký rozsah výběru. Při silné závislosti je nutné volit vysoký parametr b, který určuje velikost podskupiny. 3

1 11 21 31 41 51 61 71 81 91 11 111 121 131 141 151 161 171 181 191 21 211 221 231 241 251 261 271 281 291 31 311 Odchylka y 2 Aplikace popsaných metod statistické regulace procesu V této kapitole budou aplikovány výše popsané metody na dva výrobní procesy firmy ŠKODA AUTO a.s. V prvním případě je regulovanou veličinou poloha závitového čepu pro uchycení zadního nárazníku vozu Octavia. Poloha závitového čepu (obr. 3) je dána třemi rozměry, v rámci aplikační části bude pozornost věnována pouze odchylce Y od předepsaného rozměru (dále označeno jako proces 1). Obr. 3 Poloha závitového čepu pro uchycení zadního nárazníku 2,5 2, 1,5 1,,5 UCL,5, -,5 LCL -,5-1, Pozorování Obr. 4 Poloha závitového čepu a stanovené limity ve ŠKODA AUTO a.s. (MS Excel) 31

1 9 17 25 33 41 49 57 65 73 81 89 97 15 113 121 129 137 145 153 161 169 177 185 193 21 29 217 225 233 241 249 257 Y Z obrázku 4 je patrné, že naměřené hodnoty vůbec neodpovídají předepsaným tolerančním mezím,5 mm. V druhém případě je regulovanou veličinou symetrie v ose Y mezi otvory pro dolní panty předních dveří (obr. 5) svařené karoserie vozu Octavia (dále označeno jako proces 2). Obr. 5 Symetrie v ose Y mezi otvory pro dolní panty 2, 1,5 UCL 1,5 1,,5, -,5-1, -1,5 LCL -1,5-2, Pozorovani Obr. 6 Symetrie v ose Y mezi otvory a stanovené limity ve ŠKODA AUTO a.s. (MS Excel) V případě procesu 2 se zdají býti regulační meze (obr. 6) příliš široké. U obou procesů budeme vycházet při konstrukci regulačních diagramů z pozorovaných dat, nikoli z předepsané jmenovité hodnoty. 32

2.1 Poloha závitového čepu pro uchycení zadního nárazníku K dispozici je 317 pozorování odchylek Y u závitového čepu v období od 9. 6. 214 do 3. 1. 214 (příloha č. 2). Z grafu naměřených hodnot (nápadně dlouhá řada hodnot na jedné straně od průměru) a seskupení bodů bodového grafu na obrázku 7 je patrná vzájemná závislost pozorování. Odchylka y t 2,5 2 1,5 1,5 -,5 y t 2,5 2 1,5 1,5 -,5-1 5 1 15 2 25 3 Pozorování -1-1 -,5,5 1 1,5 2 2,5 y t-1 Obr. 7 Průběh pozorování a bodový graf, proces 1 (MS Excel) Vzhledem k tomu, že většina hodnot autokorelační funkce (obrázek 8) leží mimo meze 95% intervalu spolehlivosti, můžeme autokorelaci považovat za statisticky významnou. Z grafu ACF je dále patrné, že míra závislosti pro zpoždění 1 je přibližně,43. 1..9 ACF-Odchylka y 1..75 PACF-Odchylka y.8.7.5.6.25.5..4 -.25.3.2 -.5.1 -.75 5 1 15 5 1 15 Obr. 8 Autokorelační a parciální autokorelační funkce, proces 1 (GiveWin) 33

Procenta Cetnost 1 8 6 4 2 -,9 -,4,1,6 1,1 1,6 2,1 Odchylka y Obr. 9 Histogram a normální rozdělení, proces 1 (Statgraphics) 99.9 99 95 8 5 2 5 1.1 -,9 -,4,1,6 1,1 1,6 2,1 Odchylka y n:317 Mean:,572962 Sigma:,475253 W:,985193 P:,6219 Obr. 1 Pravděpodobnostní graf, proces 1 (Statgraphics) Dle histogramu a pravděpodobnostního grafu na obrázku 9 a 1 to vypadá, že pozorování má normální rozdělení. Ke stejnému závěru vede i vysoká p-hodnota všech testů normality v následující tabulce. Tab. 6 Testy normality (Statgraphics) Test Testová statistika p-hodnota Chí-kvadrát 37,4669,3566 Shapirův-Wilkův,9852,6219 Šikmost Z-score,2496,829 Špičatost Z-score,8841,3766 Kolmogorovův-Smirnovův,9358 34

1 11 21 31 41 51 61 71 81 91 11 111 121 131 141 151 161 171 181 191 21 211 221 231 241 251 261 271 281 291 31 311 MR 1 11 21 31 41 51 61 71 81 91 11 111 121 131 141 151 161 171 181 191 21 211 221 231 241 251 261 271 281 291 31 311 Y Regulační diagramy se zanedbáním autokorelace Na obrázku 11, 12, 13 a 14 jsou zobrazeny regulační diagramy pro individuální hodnoty, klouzavá rozpětí, EWMA a CUSUM v případě, kdy zanedbáme vzájemnou závislost pozorování. 2,5 2, 1,5 Individuální hodnoty UCL 1,6266 1,,5, -,5 LCL -,487-1, Pozorování Obr. 11 Regulační diagram pro individuální hodnoty při zanedbání autokorelace (MS Excel) Klouzavá rozpětí 1,4 1,2 UCL 1,294 1,,8,6,4,2, Pozorování Obr. 12 Regulační diagram pro klouzavá rozpětí při zanedbání autokorelace (MS Excel) 35

1 11 21 31 41 51 61 71 81 91 11 111 121 131 141 151 161 171 181 191 21 211 221 231 241 251 261 271 281 291 31 311 CUSUM 1 11 21 31 41 51 61 71 81 91 11 111 121 131 141 151 161 171 181 191 21 211 221 231 241 251 261 271 281 291 31 311 EWMA Čtrnáct naměřených hodnot je mimo regulační meze v diagramu pro individuální hodnoty. V případě klouzavých rozpětí se jedná o čtyři hodnoty: 81, 124, 242 a 279. Pro regulační diagram EMWA je mimo meze 81 pozorování a pro CUSUM 244 hodnot. Podle diagramů by měl být proveden zásah do procesu, to by však bylo neekonomické, proto se v další části zaměříme na výše popsané metody. 1,6 1,4 1,2 1,,8,6,4,2, -,2 -,4 -,6 EWMA UCL,915 LCL,2354 Pozorování Obr. 13 EWMA při zanedbání autokorelace (MS Excel) 1 CUSUM 5-5 -1-15 1,693-1,693-2 Pozorování Obr. 14 CUSUM při zanedbání autokorelace (MS Excel) 36

2.1.1 Metoda založená na ARIMA modelech Pokud máme pozorované kolísání střední hodnoty považovat za přijatelné, bude třeba rozšířit regulační meze. Prvně zvolíme vhodný ARIMA model, ověříme předpoklady modelu a následně aplikujeme regulační diagramy na jeho rezidua. Z grafu pozorování (obr. 7) se jeví daná časová řada jako stacionární. Tuto skutečnost potvrzují i rozšířené Dickeyovy-Fullerovy testy v tabulce 7. Pro všechny tři testy je p-hodnota testové statistiky menší než,5, zamítáme tedy nulovou hypotézu (přítomnost jednotkového kořene) a můžeme analyzovanou časovou řadu považovat za stacionární. Tab. 7 Testy na jednotkový kořen (EViews) Augmented Dickey-Fuller Unit Root Tests Null Hypothesis: Odchylka y has a unit root Lag Length: based on AIC t-statistic Prob.* -test ADF test statistic -2,897,38 Test critical value (5% level) -1,942 µ -test ADF test statistic -5,738, Test critical value (5% level) -2,871 -test ADF test statistic -5,826, Test critical value (5% level) -3,424 *MacKinnon (1996) one-sided p-values Při rozboru korelogramu výběrové autokorelační a parciální autokorelační funkce z obrázku 8 vidíme, že ACF i PACF od zpoždění 1 klesají. Pro časovou řadu bychom tedy mohli volit model ARIMA (1,,1). Statgraphics, jehož součástí je i automatická funkce pro volbu modelu (využívající informační kritéria), doporučuje shodný model s konstantou, viz následující tabulka. Tab. 8 Automatická funkce volby modelu ve Statgraphics Model RMSE AIC HQC ARIMA (1,,1) s konstantou,4194-1,76381-1,7496 ARIMA (,1,1),41523-1,75167-1,74693 ARIMA (1,1,1),414455-1,74897-1,73949 ARIMA (,1,1) s konstantou,415849-1,74225-1,73278 Odhad parametrů zvoleného ARIMA modelu metodou maximální věrohodnosti je zobrazen v tabulce 9. Z tabulky je patrné, že hodnota odhadnutého autoregresní- 37

ho parametru 1 ˆ je,915 a hodnota odhadnutého parametru 2 klouzavých součtů ˆ 1 je,675. Z tabulky je dále patrné, že všechny parametry včetně konstanty jsou statisticky významné a do modelu tedy patří (p-hodnoty menší než,5). Rovnice modelu má tvar y,586,915 y,675. t t1 t t1 Tab. 9 Odhad parametrů modelu ARIMA (1,,1) s konstantou (GiveWin) Maximum likelihood estimation of ARIMA (1,,1) model The dependent variable is: Odchylka y Coefficient Std.Error t-value t-prob AR-1,915,3726 24,6, MA-1 -,675,735-9,6, Constant,586,8529 6,87, log-likelihood -165,987578 no. of observations 317 no. of parameters 4 AIC.T 339,975155 AIC 1,7247683 Mean,572962 var,225153 Sigma,48155 sigma^2,166591 Na obrázku 15 jsou znázorněny odhady autokorelační a parciální autokorelační funkce reziduí včetně mezí intervalu spolehlivosti ve vzdálenosti 2 / 317. 1. ACF-Res_Odchylka_y 1. PACF-Res_Odchylka_y.75.75.5.5.25.25.. -.25 -.25 -.5 -.5 -.75 -.75 5 1 15 5 1 15 Obr. 15 Reziduální ACF a PACF modelu ARIMA (1,,1) s konstantou (GiveWin) Protože všechny hodnoty ACF a PACF leží uvnitř mezí, rezidua ARIMA modelu nevykazují autokorelaci. Tuto skutečnost potvrzuje i portmanteau test (tab. 1); protože p-hodnota příslušná testové statistice 6,684 je,9658, nezamítáme nulo- 2 GiveWin má v rovnici jiné znaménko u parametru klouzavých součtů než uvádí většina autorů 38

vou hypotézu nekorelovanosti reziduí. Z výsledků obou testů normality, kde asymptotic test odpovídá testu (47) a normality test je jeho modifikací pro malé výběry, je patrné, že předpoklad normálního rozdělení můžeme považovat za splněný, jak plyne z vysokých p-hodnot obou testů. Výsledkem ARCH testu je opět vysoká p-hodnota čímž jsme prokázali, že rezidua nevykazují heteroskedasticitu. Z výše uvedeného plyne, že model lze považovat za přijatelný. Tab. 1 Diagnostika modelu (GiveWin) Portmanteau statistic for residuals Portmanteau(17): Chi^2(15) = 6,684 [,9658] Normality test for residuals Asymptotic test: Chi^2(2) = 1,631 [,4424] Normality test: Chi^2(2) = 1,7152 [,4242] ARCH coefficients: Lag Coefficient Std.Error 1,44817,5657 RSS = 18,5842 sigma =,24459 Testing for error ARCH from lags 1 to 1 ARCH 1-1 test: F(1,312) =,62774 [,4288] Předpoklady pro použití reziduí jsou splněny a je tedy možné přistoupit ke konstrukci regulačních diagramů pro individuální hodnoty, klouzavá rozpětí, EWMA a CUSUM. Parametry diagramů EWMA a CUSUM jsou upraveny tak, aby se výsledná hodnota ARL() blížila klasickým Shewhartovým 37,4. Pomocí Statgraphicsu bylo zjištěno, že těchto hodnot dosahuje diagram EWMA při volbě =,2 a L = 2,86, CUSUM při zadání parametrů h = 4,774 a k =,5. Z grafu regulačního diagramu pro individuální hodnoty na obrázku 16 je vidět, že pouze jeden bod (pozorování č. 8) je mimo regulační meze. Diagram zareagoval na zřejmě přechodnou větší změnu střední hodnoty. V případě klouzavých rozpětí (obr. 17) jsou to body 81, 124, 242 a 28. U EMWA (obr. 18) jsou mimo meze pozorování 51, 52, 117 a 123. V případě CUSUM diagramu (obr. 19) překročily meze body 52, 57 a skupina třinácti pozorování v okolí čísla 121. Poslední dva jmenované diagramy reagovaly na určitou dobu přetrvávající pokles kolem 12. pozorování. 39

1 11 21 31 41 51 61 71 81 91 11 111 121 131 141 151 161 171 181 191 21 211 221 231 241 251 261 271 281 291 31 311 MR 1 11 21 31 41 51 61 71 81 91 11 111 121 131 141 151 161 171 181 191 21 211 221 231 241 251 261 271 281 291 31 311 Rezidua 1,5 1, Individuální hodnoty pro rezidua ARIMA (1,,1)c UCL 1,1945,5, -,5-1, LCL -1,1935-1,5 Pozorování Obr. 16 Regulační diagram individuálních hodnot pro rezidua ARIMA modelu (MS Excel) Klouzavá rozpětí pro rezidua ARIMA (1,,1)c 1,8 1,6 UCL 1,4669 1,4 1,2 1,,8,6,4,2, Pozorování Obr. 17 Regulační diagram klouzavá rozpětí pro rezidua ARIMA modelu (MS Excel) 4

1 11 21 31 41 51 61 71 81 91 11 111 121 131 141 151 161 171 181 191 21 211 221 231 241 251 261 271 281 291 31 311 CUSUM 1 11 21 31 41 51 61 71 81 91 11 111 121 131 141 151 161 171 181 191 21 211 221 231 241 251 261 271 281 291 31 311 EWMA EWMA pro rezidua ARIMA (1,,1)c,5,4 UCL,3799,3,2,1, -,1 -,2 LCL -,3 -,4 -,3789 -,5 Pozorování Obr. 18 EWMA pro rezidua ARIMA modelu (MS Excel) 3, CUSUM pro rezidua ARIMA (1,,1)c 2, 1,91 1,, -1, -2, - 1,91-3, -4, Pozorování Obr. 19 CUSUM pro rezidua ARIMA modelu (MS Excel) 41

2.1.2 Aproximační postup založený na využití statistiky EWMA Protože v praxi může být obtížné zvolit vhodný model ARIMA, Montgomery a Mastrangelo (1991) navrhli aproximační metodu založenou na statistice EWMA. Postačující předpoklady k použití této metody jsou pozitivní autokorelace a střední hodnota, která se nemění příliš rychle. Autoři uvádějí, že nejlepších výsledků dosahuje tato metoda v situaci, kdy lze daný proces popsat modelem ARIMA (,1,1). Z tabulky 8 je patrné, že Statgraphics zařadil tento model na druhé místo. Pro zjednodušení budeme předpokládat, že model je vhodný pro danou řadu pozorování. Odhady parametrů modelu ARIMA (,1,1) jsou statisticky významné, rezidua mají normální rozdělení, nejsou korelována a neprojevila se heteroskedasticita (viz příloha č. 3). Odhad parametru =,2435 byl získán iteračním postupem minimalizací součtu čtverců chyb jednokrokové predikce. Na obrázku 2 jsou znázorněny odhady autokorelační a parciální autokorelační funkce reziduí. Protože všechny hodnoty ACF a PACF leží uvnitř mezí, rezidua modelu nevykazují autokorelaci. 1. ACF-Res_EWMA 1. PACF-Res_EWMA.75.75.5.5.25.25.. -.25 -.25 -.5 -.5 -.75 -.75 5 1 15 5 1 15 Obr. 2 Reziduální ACF a PACF - rezidua z modelu (68) (GiveWin) Dle vysokých p-hodnot testů normality v tabulce 11 můžeme předpoklad normality považovat za splněný. Tab. 11 Testy normality reziduí aproximační metody (Statgraphics) Test Testová statistika p-hodnota Chí-kvadrát 3,347,766 Shapirův-Wilkův,9858,677 Šikmost Z-score 1,1673,2431 Špičatost Z-score,9168,368 Kolmogorovův-Smirnovův,7162 42

1 11 21 31 41 51 61 71 81 91 11 111 121 131 141 151 161 171 181 191 21 211 221 231 241 251 261 271 281 291 31 311 Rezidua V regulačním diagramu pro individuální hodnoty aplikovaném na rezidua (obr. 21) jsou mimo regulační meze pozorování číslo 8 a 54. Výsledný diagram aproximační metody EWMA je velmi podobný s regulačním diagramem na obrázku 16. 1,5 1, Aproximační metoda EWMA UCL 1,1918,5, -,5-1, LCL -1,1812-1,5 Pozorování Obr. 21 Regulační diagram aproximační metoda EWMA (MS Excel) 2.1.3 Dynamický diagram EWMA V souvislosti s doporučením vést dva regulační diagramy pro aproximační metodu (viz oddíl 1.1.2) navrhli Montgomery a Mastrangelo (1991) způsob jak tyto dva diagramy zkombinovat. Nejdříve, jako u předcházející metody, odhadneme parametr a následně vypočteme směrodatnou odchylku rozdělení chyb jednokrokové predikce n 2 eˆ t t1 opt 54, 4253 ˆ D, 4144. n 317 Výpočet regulačních mezí provedeme dosazením do vzorců (69) a (7). Dynamický regulační diagram EWMA (obr. 22) již obsahuje informaci o stavu statistické kontroly i dynamice procesu. Výsledek regulačního diagramu je shodný s diagramem pro aproximační metodu EWMA (signál v pozorování 8 a 54), ale v tomto případě je grafická interpretace pro obsluhu mnohem srozumitelnější. 43