SPC v případě autokorelovaných dat. Jiří Michálek, Jan Král OSSM,

Podobné dokumenty
Regulační diagramy (RD)

Q-diagramy. Jiří Michálek ÚTIA AVČR

PRINCIPY ZABEZPEČENÍ KVALITY

Národní informační středisko pro podporu kvality

Tématické okruhy pro státní závěrečné zkoušky. Navazující magisterské studium. studijní obor "Management jakosti"

Rozšířené regulační diagramy

Tématické okruhy pro státní závěrečné zkoušky. Navazující magisterské studium. studijní obor "Management kvality"

Statistické řízení jakosti. Deming: Klíč k jakosti je v pochopení variability procesu.

10 KONTROLA A ŘÍZENÍ JAKOSTI

Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných)

Vícerozměrné regulační diagramy. Josef Křepela, Jiří Michálek OSSM

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

SW podpora při řešení projektů s aplikací statistických metod

Statistické řízení jakosti - regulace procesu měřením a srovnáváním

4EK211 Základy ekonometrie

Testy nezávislosti kardinálních veličin

Časové řady, typy trendových funkcí a odhady trendů

Národní informační středisko pro podporu kvality

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

Národní informační středisko pro podporu kvality

Rozdíl rizik zbytečného signálu v regulačním diagramu (I,MR) a (xbar,r)

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Časové řady, typy trendových funkcí a odhady trendů

PRINCIPY ZABEZPEČENÍ KVALITY

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Pearsonův korelační koeficient

Inovace bakalářského studijního oboru Aplikovaná chemie

Úvod do analýzy časových řad

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

4EK211 Základy ekonometrie

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

STATISTICKÉ ŘÍZENÍ PROCESŮ SE SW PODPOROU

Korelace. Komentované řešení pomocí MS Excel

Karta předmětu prezenční studium

Tématické okruhy pro státní závěrečné zkoušky. magisterské studium

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Statistická analýza jednorozměrných dat

INDUKTIVNÍ STATISTIKA

Zápočtová práce STATISTIKA I

1.1 Využití tabulkového procesoru jako laboratorního deníku. 1.3 Systém jakosti a počítačová kontrola jakosti

Testy statistických hypotéz

Řízení jakosti 2. Užitná hodnota I. JiříMilitký. Užitná hodnota Regulační diagramy Jakost textilních útvarů

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

Vícerozměrná rozdělení

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )

AVDAT Geometrie metody nejmenších čtverců

Statistická analýza jednorozměrných dat

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

KORELACE. Komentované řešení pomocí programu Statistica

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

, Brno Hanuš Vavrčík Základy statistiky ve vědě

Vlastnosti odhadů ukazatelů způsobilosti

Ilustrační příklad odhadu LRM v SW Gretl

Lineární regrese. Komentované řešení pomocí MS Excel

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

Principy zajištění spolehlivosti. Zdenek Kubíček

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

SEMINÁRNÍ PRÁCE Z 4ST432 Tereza Michlíková (xmict05) ZS 06/07

Inovace bakalářského studijního oboru Aplikovaná chemie

Semestrální práce. 3.3 Tvorba nelineárních regresních modelů v analýze dat

STATISTIKA I Metodický list č. 1 Název tématického celku:

Příklady ke čtvrtému testu - Pravděpodobnost

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

6. Lineární regresní modely

4EK211 Základy ekonometrie

Korelační a regresní analýza

Vybrané praktické aplikace statistické regulace procesu

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Regresní analýza 1. Regresní analýza

4ST201 STATISTIKA CVIČENÍ Č. 10

Intervalové Odhady Parametrů

Normální rozložení a odvozená rozložení

Regulační diagramy EWMA. Eva Jarošová Škoda Auto Vysoká škola

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Přehled metod regulace procesů při různých typech chování procesu

VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA METALURGIE A MATERIÁLOVÉHO INŽENÝRSTVÍ KATEDRA KONTROLY A ŘÍZENÍ JAKOSTI

Jednofaktorová analýza rozptylu

Náhodné vektory a matice

Modul Základní statistika

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

UNIVERZITA PARDUBICE CHEMICKO-TECHNOLOGICKÁ FAKULTA KATEDRA ANALYTICKÉ CHEMIE

Simulace. Simulace dat. Parametry

KGG/STG Statistika pro geografy

8 ANALÝZA ČASOVÝCH ŘAD SEZÓNNÍ SLOŽKA

Regresní a korelační analýza

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Pokročilé metody geostatistiky v R-projektu

Národní informační středisko pro podporu jakosti

Diagnostika regrese pomocí grafu 7krát jinak

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

Statistická analýza jednorozměrných dat

Cvičení 9 dekompozice časových řad a ARMA procesy

Transkript:

SPC v případě autokorelovaných dat Jiří Michálek, Jan Král OSSM, 2.6.202

Pojem korelace Statistická vazba mezi veličinami Korelace vs. stochastická nezávislost Koeficient korelace = míra lineární vazby mezi veličinami Autokorelace = korelace mezi sousedícími daty v jedné časové řadě Autokorelační funkce, odhad autokorelace pořízený z dat

Předpoklady pro Shewhartovy diagramy Normálně rozdělený znak jakosti Sbíraná data z procesu jsou nezávislá jak mezi podskupinami, tak i uvnitř podskupin Parametr polohy a úroveň variability jsou konstantní Regulační meze jsou pak počítány na základě těchto předpokladů

Porušení předpokladů Závislost mezi daty v rámci podskupiny může mít vliv na vyhodnocování průběhu diagramu, odhad směrodatné odchylky pro výpočet regulačních mezí Závislost mezi podskupinami může podstatně ovlivnit výskyt falešných poplachů

Podezření na autokorelaci Vysoká frekvence sběru dat, hlavně při automatickém odběru Fyzikální důvody např. vliv teploty, vliv okolního prostředí Setrvačnost v datech vyvolaná např. způsobem měření, systematickými vlivy Záměrná manipulace s daty opisování, falšování

Moving Range Individual Value Příklad regulačního diagramu I-MR Chart of Ohm 6000 UC L=5387 5000 _ X=4450 4000 3000 2 3 4 5 O bser vation 6 7 8 9 LC L=354 600 200 UC L=50 800 400 MR=352 0 LC L=0 2 3 4 5 O bser vation 6 7 8 9

Autocorrelation Odhad autokorelační funkce,0 0,8 0,6 Autocorrelation Function for Ohm (with 5% significance limits for the autocorrelations) 0,4 0,2 0,0-0,2-0,4-0,6-0,8 -,0 2 4 6 8 0 2 4 Lag 6 8 20 22 24

Co říká koeficient korelace? Koeficient korelace je mezi - a Čím je koeficient korelace v absolutní hodnotě blíže k, tím je větší stochastická vazba mezi veličinami Čím je koeficient korelace v absolutní hodnotě blíže 0, tím je menší stochastická vazba mezi veličinami Pro hodnoty - a stochastická vazba přechází dokonce ve funkční lineární vztah

Test korelace mezi 2 veličinami Data jsou spárována do dvojic Vypočte se odhad r koeficientu korelace Vypočte se statistika t r (n 2) / ( r 2 ), která za nulové hypotézy o nekorelovanosti má přibližně t-rozdělení o n-2 stupňů volnosti ( n je počet dvojic) Pozn. U normálně rozdělených veličin nekorelovanost = nezávislost

Jak se s korelací vyrovnat? Pro praktické účely má cenu se zabývat korelací, pokud odhad koeficientu korelace má hodnotu nad 0,75 0,80 Znaky kvality na jednom výrobku mohou být vzájemně korelovány vylepšení jednoho znaku může vyvolat zhoršení jiného znaku Použití vícerozměrných regulačních diagramů odhad korelační matice

Jak se s korelací vyrovnat? Při zjištěné silné korelaci uvnitř podskupin je nutno toto zohlednit při výpočtu regulačních mezí zásadní roli hraje špatný odhad směrodatné odchylky na základě výběrového rozpětí či výběrové směrodatné odchylky počítaných uvnitř podskupin Korelace může způsobit podhodnocení úrovně variability a toto může vést ke zvýšenému počtu falešných poplachů, protože regulační meze jsou pak blíže u sebe

Jak se s korelací vyrovnat? Zvláště je nutné si dát pozor u regulačního diagramu pro individuální data při sériové korelaci odhad založený na klouzavém rozpětí opět může podhodnotit úroveň variability V tomto případě v praxi stačí se zaměřit pouze na autokorelaci.řádu a použít faktor ( r 2 ) pro úpravu regulačních mezí

Jak se s korelací vyrovnat? Pro výpočet klasických regulačních mezí nepoužijeme Rbar či sbar, ale jejich hodnoty získané z dat podělíme právě faktorem ( r 2 ), čímž dosáhneme rozšíření regulačních mezí Pokud jsou mezi daty autokorelace vyšších řádů, je obvykle možno v praxi je ignorovat

Jak se vyrovnat s korelací? Komplikovanější přístup je založen na nalezení vhodného modelu pro sledovanou časovou řadu (AR, ARMA, ARIMA či další modely) a pracovat s rezidui získanými při použití vhodného modelu Obvykle se vyžaduje, aby rezidua byla vzájemně nekorelovaná se střední hodnotou nula a konstantní úrovní variability (či dokonce normálně rozdělená) a na jejich sledování pak lze použít klasické Shewhartovy regulační diagramy

Příklad na úpravu mezí Na následujícím diagramu je vidět, že první 3-4 zleva, které jsou mimo regulační meze, by mohly znamenat pouze falěšný poplach Je nutné prošetřit autokorelaci a zjistíme, že korelační koeficient mezi sousedícími daty bude významný, jeho odhad je sice pouze 0,48, ale je mimo konfidenční meze

Příklad na úpravu mezí Původní meze pro individuální hodnoty: UCL = 5387, LCL = 354 CL = 4450 Faktor opravy je při r = 0,4845 roven 0,8748 a přepočtené meze jsou: UCL = 552, LCL = 3379

Moving Range Individual Value Graf s upravenými mezemi I-MR Chart of Ohm 6000 UC L=552 5000 _ X=4450 4000 3000 2 3 4 5 O bser vation 6 7 8 9 LC L=3379 600 200 UC L=36 800 400 MR=403 0 LC L=0 2 3 4 5 O bser vation 6 7 8 9

Použití modelu časové řady Na základě odhadu autokorelační funkce budeme uvažovat model typu AR(): X(i+) = µ + αx(i) + e(i+), kde chyby jsou normálně rozdělené se střední hodnotou 0 a nezávislé, µ je aditivní konstanta Vhodnost modelu posoudíme podle chování reziduí a průběh původního procesu pomocí regulačního diagramu pro rezidua

Autocorrelation Použití modelu časové řady,0 0,8 0,6 ACF of Residuals for Ohm (with 5% significance limits for the autocorrelations) 0,4 0,2 0,0-0,2-0,4-0,6-0,8 -,0 2 4 6 8 0 2 4 Lag 6 8 20 22 24

Použití modelu časové řady Summary for Res(Ohm) A nderson-darling Normality Test A -S quared 0,67 P-V alue 0,079 Mean -4,33 StDev 47,3 V ariance 73996,2 Skew ness -0,02060 Kurtosis,77335 N 00-500 -000-500 0 500 000 M inimum -597,99 st Q uartile -296,75 M edian -60,62 3rd Q uartile 224,53 M aximum 232,80 95% C onfidence Interv al for Mean -87,09 78,44 95% C onfidence Interv al for Median -6,23 62,65 9 5 % Confidence Intervals 95% C onfidence Interv al for StDev 366,24 484,57 Mean Median -00-50 0 50 00

Moving Range Individual Value Použití modelu časové řady I-MR Chart of Res(Ohm) 000 UC L=246 0 _ X=-4-000 LC L=-254-2000 2 3 4 5 O bser vation 6 7 8 9 2000 500 UC L=536 000 500 MR=470 0 LC L=0 2 3 4 5 O bser vation 6 7 8 9

Použití modelu časové řady Nalezený model má tvar: X(i+) = 2262,73 + 0,4922X(i) + e(i+), kde rezidua jakožto odhady chyb mají rozdělení N(µ,σ 2 ). µ -4,33 σ 47,3

Srovnání obou přístupů Lze říci, že přístup založený na úpravě regulačních mezí se zdá přísnější, ale v žádném případě si oba přístupy neodporují a možné ovlivněné podskupiny označily podobně. Je zřejmé, že přístup založený na úpravě mezí je daleko jednodušší, přístup založený na modelování časové řady vyžaduje již vhodný software.