Národní informační středisko pro podporu kvality

Podobné dokumenty
Inovace bakalářského studijního oboru Aplikovaná chemie

SW podpora při řešení projektů s aplikací statistických metod

Statistické řízení jakosti - regulace procesu měřením a srovnáváním

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Regulační diagramy (RD)

Normy ČSN a ČSN ISO z oblasti aplikované statistiky (stav aktualizovaný k )

Národní informační středisko pro podporu kvality

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

Národní informační středisko pro podporu kvality

HODNOCENÍ VÝKONNOSTI ATRIBUTIVNÍCH ZNAKŮ JAKOSTI. Josef Křepela, Jiří Michálek. OSSM při ČSJ

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Národní informační středisko pro podporu jakosti

Statistické regulační diagramy

Statistické řízení jakosti. Deming: Klíč k jakosti je v pochopení variability procesu.

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Národní informační středisko pro podporu jakosti

UNIVERZITA PARDUBICE CHEMICKO-TECHNOLOGICKÁ FAKULTA KATEDRA ANALYTICKÉ CHEMIE

Simulace. Simulace dat. Parametry

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

Hodnocení vlastností materiálů podle ČSN EN 1990, přílohy D

Tématické okruhy pro státní závěrečné zkoušky. Navazující magisterské studium. studijní obor "Management jakosti"

Úvod do problematiky měření

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)

Rozdíl rizik zbytečného signálu v regulačním diagramu (I,MR) a (xbar,r)

Normy ČSN,ČSN ISO a ČSN EN

Regulační diagramy (Control charts, Shewhart s diagrams)

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

STANOVENÍ SPOLEHLIVOSTI GEOTECHNICKÝCH KONSTRUKCÍ. J. Pruška, T. Parák

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

ISO 8258 je první ze čtyř norem ISO, které budou věnovány metodám statistické regulace. Zbývající tři, které jsou nyní v přípravě, jsou

Statistická analýza dat podzemních vod. Statistical analysis of ground water data. Vladimír Sosna 1

, Brno Hanuš Vavrčík Základy statistiky ve vědě

SPC v případě autokorelovaných dat. Jiří Michálek, Jan Král OSSM,

Tématické okruhy pro státní závěrečné zkoušky. Navazující magisterské studium. studijní obor "Management kvality"

Vybrané praktické aplikace statistické regulace procesu

Posouzení přesnosti měření

Vyhodnocování způsobilosti a výkonnosti výrobního procesu

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

VYUŽITÍ MATLAB WEB SERVERU PRO INTERNETOVOU VÝUKU ANALÝZY DAT A ŘÍZENÍ JAKOSTI

Hodnocení vlastností materiálů podle ČSN EN 1990, přílohy D

Statistika pro geografy

PRINCIPY ZABEZPEČENÍ KVALITY

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky

Kvalita v laboratorní a kontrolní praxi

Zápočtová práce STATISTIKA I

UNIVERZITA PARDUBICE

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Analytické znaky laboratorní metody Interní kontrola kvality Externí kontrola kvality

Střední průmyslová škola strojnická Olomouc, tř. 17. listopadu 49. Výukový materiál zpracovaný v rámci projektu Výuka moderně

Popisná statistika kvantitativní veličiny


Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

Analýza způsobilosti procesů. Studijní opory

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Zaokrouhlování: Směrodatná odchylka se zaokrouhluje nahoru na stanovený počet platných cifer. Míry

Národní informační středisko pro podporu jakosti

KGG/STG Statistika pro geografy

Ekonomické aspekty statistické regulace pro vysoce způsobilé procesy. Kateřina Brodecká

Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat )

Jak správně interpretovat ukazatele způsobilosti a výkonnosti výrobního procesu

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

VŠB Technická univerzita Ostrava BIOSTATISTIKA


STATISTICKÉ CHARAKTERISTIKY

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

Návrh a vyhodnocení experimentu

Různé metody manažerství kvality. Práce č.12: Výpočet PPM a způsobilost procesů

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA Sylabus pro předmět STATISTIKA Pomůcky... 7

Testování statistických hypotéz

Hodnocení vlastností materiálů podle ČSN EN 1990, přílohy D

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

Sigma Metric: yes or no?

Návrh a vyhodnocení experimentu

Národní informační středisko pro podporu jakosti

Minimální hodnota. Tabulka 11

VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA METALURGIE A MATERIÁLOVÉHO INŽENÝRSTVÍ KATEDRA KONTROLY A ŘÍZENÍ JAKOSTI

Statistické vyhodnocování ankety pilotního projektu Kvalita výuky na Západočeské univerzitě v Plzni

PRŮZKUM VÝŽIVY LESA NA ÚZEMÍ ČESKÉ REPUBLIKY

1) Jsou normy v ČR závazné a jaká je jejich úloha? normy nejsou v ČR závazné od roku 2000 od roku 2000 mají pouze doporučující charakter

Základy pravděpodobnosti a statistiky. Popisná statistika

Úvod do kurzu. Moodle kurz. (a) (b) heslo pro hosty: statistika (c) skripta na pravděpodobnost

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

Obsah. Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku

ZÁKLADNÍ NÁSTROJE ŘÍZENÍ JAKOSTI

Manuál pro zaokrouhlování

Způsobilost. Data a parametry. Menu: QCExpert Způsobilost

Ústav teorie informace a automatizace RESEARCH REPORT. Nestandardní regulační diagramy pro SPC. No December 2011

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:

Q-diagramy. Jiří Michálek ÚTIA AVČR

Stavba slovníku VIM 3: Zásady terminologické práce

Transkript:

Národní informační středisko pro podporu kvality

Využití metody bootstrapping při analýze dat II.část Doc. Ing. Olga TŮMOVÁ, CSc.

Obsah Klasické procedury a statistické SW - metody výpočtů konfidenčních intervalů: - popisných statistik, - indexů způsobilosti a výkonnosti. Bootstrap - metoda alternativního odhadu konfidenčních intervalů: - popisných charakteristik, - indexů výkonnosti.

Normované normální rozdělení N(0,1)

Odhady statistik včetně konfidenčních intervalů - klasické metody x s t 1 / 2;( n 1) 1 / 2;( n 1) n x s t n medián x ~ ~ x s ~. t ~ x ~ x s x 1 / 2,( n 1) ~ x. t 1 / 2,( n 1)

Odhady statistik včetně konfidenčních intervalů - klasické metody výběrová směrodatná odchylka s s ~ x ~ x ( n k 1) 2. u /2 ~ x ( k) k n 1 2 u / 2. n 4 u p kvantil normovaného normálního rozdělení

Odhady statistik včetně konfidenčních intervalů - klasické metody směrodatná odchylka ( n 1) s 2 1/ 2 ( n 1) s 2 1/ 2 2 / 2; n 1 2 (1 / 2); n 1

Indexy způsobilosti a výkonnosti Při statistické regulaci technologického, výrobního nebo měřicího procesu je proces charakterizován souborem naměřených hodnot. S ohledem na náklady při produkci, neshody apod., je proces nutno udržet ve stabilním (predikovatelném) stavu.

Indexy způsobilosti a výkonnosti Hodnoty naměřené v regulovaném procesu: - mají být centrovány mezi horní a dolní specifikační (toleranční) mezí (USL, LSL), - v datech se nemá vyskytovat žádné seskupení dat podle vzoru systematických (vymezitelných) příčin (viz ČSN ISO 8258). Jak dobře hodnoty odpovídají specifikacím, je vyjádřeno indexy způsobilosti a výkonnosti. Pro vyšší hodnoty indexů je nutná redukce variability.

Indexy způsobilosti a výkonnosti S ohledem na způsob získání/záznamu dat rozlišujeme: - Krátkodobá variabilita (inherentní, vnitroskupinová) odhad z krátkého časového období, obsahuje minimální množství rušivých vlivů a procesních posuvů. Dlouhodobá variabilita (celková, meziskupinová) - může obsahovat celý proces měření s možnými změnami a posuny.

Indexy způsobilosti a výkonnosti Volba správného typu variability je zásadní pro správné určení ukazatele: USL LSL C P 6s kde s je výběrová směrodatná odchylka uvnitř podskupin, P P USL 6s TOT LSL kde stot je výběrová směrodatná odchylka mezi podskupinami.

Indexy způsobilosti a výkonnosti Informace o centrování procesu - kritické indexy. Soubor naměřených hodnot představuje pouze výběr z celé populace, proto výpočty všech indexů musí být doplněny konfidenčními intervaly.

Index výkonnosti Příklad odhadu intervalů

Kritický index výkonnosti P pk min USL 3 ; LSL 3

Příklad použití bootstrap Pro ověření této metody byl zvolen: Základní soubor - cca 10 mil.hodnot (generátor náhodných čísel SW Statistica), Výběr - 30 000 generovaných simulačních podskupin programovací jazyk C++

Příklad použití bootstrap Ze zdrojového souboru byly generovány podskupiny metodou náhodných výběrů. Požadovaná statistika: - průměr, - medián, - směrodatná odchylka, - index výkonnosti je určena z každé podskupiny a tyto výsledky jsou vzestupně setříděny.

Ilustrativní příklad řazení náhodných vzorků v podskupinách (n = 5) Vstupní data 1 2 3 4 5 Průměr Setřídění průměrů 1.Podskupina 1 3 2 1 5 2,4 2,2 2.podskupina 5 2 2 4 3 3,2 2,4 3.podskupina 4 1 3 1 2 2,2 3,2 atd........

Počet dat pro hodnocení procesu - bootstrap B = 40. n n B počet vstupních dat v jednotlivých podskupinách počet simulačních podskupin (bootstrap)

Příklad použití bootstrap Grafická ilustrace generovaných podskupin - následující obr. odhad hustoty pravděpodobnosti pomocí histogramů z prvých devíti generovaných podskupin. Pozn.: Z důvodu náhodného převzorkování je každý histogram poněkud odlišný od ostatních.

Příklad použití bootstrap n = 20,B = 800

Příklad použití bootstrap n = 100,B = 1200 Grafické hodnocení - SW STATISTICA 6.0

Příklad použití bootstrap Vzestupné setřídění je uvedeno na obr., které ilustrují odhad aritmetického průměru (mediánu, směrodatné odchylky)a 95% konfidenčního intervalu. Použito 30 000 generovaných podskupin. 95% konfidenční interval - leží v rozmezí setříděných hodnot od 750. podskupiny do 29250. podskupiny. Centrální hodnota průměru leží pak uprostřed tohoto intervalu.

Příklad použití bootstrap

Příklad použití bootstrap

Příklad použití bootstrap

Příklad použití bootstrap Ukázka shody výsledků mezi metodou bootstrappingu a tradičním odhadem pro vybrané statistické charakteristiky: - průměr - medián - směrodatná odchylka

Příklad použití bootstrap Ověření správné funkce programu v C++ na jednoduchých příkladech

Příklady použití bootstrap - Grafické porovnání odhadů parametrů a konfidenčních intervalů - metoda bootstrap černé značení - Klasická metoda barevné značení

Odhad průměrů a konfidenčních intervalů

Odhad směrodatné odchylky

Odhad indexu výkonnosti

Odhad kritického indexu výkonnosti

Odhad střední hodnoty

Příklad - Regulační diagram měřicího procesu

Porovnání výsledků obou metod

Index Pp a konfidenční intervaly (bez korekce)

Index Pp a kondidenční intervaly (po Efronově korekci)

Hlavní faktory odlišnosti výsledků Rozdíl mezi klasickým výpočtem a metodou bootstrap: - způsobí nepřesnost výsledků v odhadu parametrů souboru, - je ovlivněn špičatostí základního souboru dat (viz Tab. Korelace mezi rozdílem výsledků a špičatostí souboru dat), - odlehlými hodnotami, - vyšší počet vstupních dat ovlivní lepší shodu výsledků.

Hlavní faktory odlišnosti výsledků

Výhody simulačních metod: - metoda bootstrap je jednoduchá a intuitivní, - poskytuje výsledky, které jsou velmi blízké tradičním odhadům, - poskytuje relevantní odhady popisných statistik, indexů výkonnosti a konfidencích intervalů i pro malé soubory dat, - je velmi vhodná v případech, kdy nahrazuje komplikované výpočty.

Nevýhody (1): -velký počet (tisíce) simulací mohou být časově náročné, - v případě odhadů klasických a kritických indexů výkonnosti je nutná korekce strannosti, - chyba metody bootstrap je rozdíl mezi skutečnou a simulovanou distribucí hodnot.

Nevýhody (2): Chyba metody sestává ze dvou základních složek: - statistická chyba (závisí na počtu vstupních dat a na jejich správnosti), nelze ji touto metodou eliminovat, - chyba simulací (nedostatečná náhodnost, nedostatek podskupin), lze redukovat zvýšením počtu generovaných podskupin, - Bootstrapping není rezistentní vůči odlehlým hodnotám.

Literatura: [1] Breyfogle F.: Implementing Six Sigm., New Jersey 2003. [2] Burget D., Tůmová O., Čtvrtník V.: Bootstrapping Technique and Confidence Intervals. In Proceedings of the 12th IMEKO TC1-TC7 Joint Symposium on Man, Science & Measurement. Annecy: Université de Savoie, 2008. s. 125-132. ISBN 2-9516453-8-4. [3] Herout P.: Učebnice jazyka C, III. upravené vydání, České Budějovice 2001. [4] Kupka K.: Statistické řízení jakosti. TriloByte Ltd., Pardubice 1997. [5] Matyáš V.: Měření, analýza a vytváření náhodných procesů. SNTL Praha 1976. [6] Michálek J.: Vyhodnocování způsobilosti a výkonnosti výrobního procesu. CQR, Praha 2009. [7] Reif J.: Metody matematické statistiky. Vydavatelství ZČU Plzeň 2000. [8] Tůmová O., Pirich D.: Nástroje řízení jakosti a základy technické diagnostiky. Vydavatelství ZČU Plzeň 2003. [9] Tůmová O., Veverková M., Burget D.: Měřicí procesy a analýza dat při sledování interaktivních dějů v elektrotechnice, dílčí zpráva pro MSM 4977751310, FEL ZČU Plzeň 2008. [10] ČSN ISO 8258 Shewhartovy regulační diagramy.

Závěr Děkuji za pozornost O.Tůmová