HODNOCENÍ VÝKONNOSTI ATRIBUTIVNÍCH ZNAKŮ JAKOSTI. Josef Křepela, Jiří Michálek. OSSM při ČSJ



Podobné dokumenty
Národní informační středisko pro podporu kvality

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Návrh a vyhodnocení experimentu

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Náhodná veličina a rozdělení pravděpodobnosti

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Testování statistických hypotéz. Obecný postup

VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA METALURGIE A MATERIÁLOVÉHO INŽENÝRSTVÍ KATEDRA KONTROLY A ŘÍZENÍ JAKOSTI

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Tématické okruhy pro státní závěrečné zkoušky. bakalářské studium. studijní obor "Management jakosti"

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

Jednostranné intervaly spolehlivosti

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

2 ) 4, Φ 1 (1 0,005)

Národní informační středisko pro podporu kvality

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

= = 2368

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Návrh a vyhodnocení experimentu

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Zápočtová práce STATISTIKA I

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

KGG/STG Statistika pro geografy

Charakteristika datového souboru

PRAVDĚPODOBNOST A STATISTIKA. Testování hypotéz o rozdělení

PRAVDĚPODOBNOST A STATISTIKA

Národní informační středisko pro podporu jakosti

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Vybraná rozdělení náhodné veličiny

SW podpora při řešení projektů s aplikací statistických metod

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Vlastnosti odhadů ukazatelů způsobilosti

Normy ČSN a ČSN ISO z oblasti aplikované statistiky (stav aktualizovaný k )

Národníinformačnístředisko pro podporu jakosti

STATISTICKÉ ZJIŠŤOVÁNÍ

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Lineární regrese. Komentované řešení pomocí MS Excel

4ST201 STATISTIKA CVIČENÍ Č. 7

Inovace bakalářského studijního oboru Aplikovaná chemie

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Q-diagramy. Jiří Michálek ÚTIA AVČR

Národní informační středisko pro podporu jakosti

Testování statistických hypotéz

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Národní informační středisko pro podporu kvality

Statistické řízení jakosti - regulace procesu měřením a srovnáváním

ROZDĚLENÍ NÁHODNÝCH VELIČIN

Testování statistických hypotéz

Testy. Pavel Provinský. 19. listopadu 2013

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

y = 0, ,19716x.

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

Národní informační středisko pro podporu jakosti

LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

Rozdělení přenosové rychlosti disku

Tomáš Karel LS 2012/2013

7.1. Podstata testu statistické hypotézy

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Statistika I (KMI/PSTAT)

Výběrové charakteristiky a jejich rozdělení

Tomáš Karel LS 2012/2013

Test dobré shody v KONTINGENČNÍCH TABULKÁCH

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

Ilustrační příklad odhadu LRM v SW Gretl

Regresní analýza 1. Regresní analýza

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

Základní statistické metody v rizikovém inženýrství

Přednáška X. Testování hypotéz o kvantitativních proměnných

Národní informační středisko pro podporu kvality

LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR

15. T e s t o v á n í h y p o t é z

Testování hypotéz Biolog Statistik: Matematik: Informatik:

Statistické řízení jakosti. Deming: Klíč k jakosti je v pochopení variability procesu.

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

5 Parametrické testy hypotéz

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

Co je to statistika? Úvod statistické myšlení. Základy statistického hodnocení výsledků zkoušek. Petr Misák

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Jana Vránová, 3. lékařská fakulta UK

Semestrální práce z předmětu Pravděpodobnost, statistika a teorie informace

Vícerozměrné regulační diagramy. Josef Křepela, Jiří Michálek OSSM

Tomáš Karel LS 2012/2013

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Cvičení ze statistiky - 9. Filip Děchtěrenko

Ústav teorie informace a automatizace RESEARCH REPORT. Nestandardní regulační diagramy pro SPC. No December 2011

Transkript:

HODNOCENÍ VÝKONNOSTI ATRIBUTIVNÍCH ZNAKŮ JAKOSTI Josef Křepela, Jiří Michálek OSSM při ČSJ Červen 009

Hodnocení způsobilosti atributivních znaků jakosti (počet neshodných jednotek) Nechť p je pravděpodobnost výskytu neshodné jednotky v dávce. Relativní četnost je pak nejlepším bodovým odhadem této pravděpodobnosti z pˆ =, n z je počet zjištěných neshodných jednotek ve výběru rozsahu n. Od relativní četnosti se odvozuje konfidenční interval, pokrývající se zadanou pravděpodobností (konfidenční úrovní - α) skutečnou hodnotu pravděpodobnosti p. Vychází se z předpokladu, že proces je statisticky zvládnut a řízen např. pomocí regulačního diagramu. S touto pravděpodobností p lze spojit jednoznačným způsobem hodnotu ukazatele výkonnosti procesu, a to p = Φ(-3P p ) p/ = Φ(-3P p ) na základě představy, že výrobek je neshodný s pravděpodobností p, když sledovaný znak jakosti rozměr padne mimo mezní hodnoty, Φ( ) je distribuční funkce normovaného normálního rozdělení N(0, ). Příklad Uvažujme dávku rozsahu n = 365 jednotek a počet zjištěných neshodných jednotek z = 0,,,.... Potom z výše uvedeného vztahu plyne -3P p = Φ - (p/) P p = - 3 Φ - (p/) P p = - 3 up/ kde u p/ je odpovídající kvantil rozdělení N(0, ). Tento vztah slouží k přenesení konfidenčního intervalu pro p na konfidenční interval pro P p. Konfidenční interval pro parametr p binomického rozdělení při n pokusech (rozsah výběru) a z zjištěných neshodných jednotkách, při konfidenční úrovni - α má tvar z (z + ) F α( ν3, ν4) ; z (n z + ) F ( ν, ν ) n z + (z + ) F ( ν, ) + α α 3 ν4 kde F -α (ν, ν ), resp. F -α (ν 3, ν 4 ) jsou (-α) - kvantily F-rozdějení o stupních volnosti ν = (n-z+) ; ν = z ; ν 3 = (z+) ; ν 4 = (n-z). Uvedený konfidenční interval můžeme vypočítat s využitím funkce FINV programu MS Excel.

Pro n = 365 dostaneme: {0,000000; 0,00699} pro z = 0, {0,00009; 0,004075} pro z =, {0,00077; 0,00583} pro z =, {0,000453; 0,006409} pro z = 3, {0,000799; 0,007486} pro z = 4, {0,0090; 0,00857} pro z = 5. Těmto hodnotám konfidenčních intervalů pro p odpovídají konfidenční intervaly pro ukazatele P p následovně: {,0000; neexistuje} pro z = 0, {0,9574;,47} pro z =, {0,998;,497} pro z =, {0,9087;,689} pro z = 3, {0,895;,77} pro z = 4, {0,8768;,0804} pro z = 5. Z toho plyne, že při kontrole n = 365 jednotek a při nenalezení žádné neshodné jednotky lze tvrdit, že výkonnost procesu není s pravděpodobností 0,975 horší nežli P p =. Naopak při nalezení z = 5 neshodných jednotek lze tvrdit, že s pravděpodobností 0,05 výkonnost procesu není lepší než P p =,08. Aby tedy výkonnost procesu byla srovnatelná s požadavkem např. P p >,33, bylo by nutno překontrolovat zhruba 47 000 jednotek, z nichž by žádná nesměla být neshodná.v řeči matematické statistiky to znamená zamítnout hypotézu P p =,33 ve prospěch alternativní hypotézy, že P p >,33 na hladině významnosti α=0,05. Tento postup je v praxi těžko použitelný, ukazuje se opět, že hodnocení procesu na základě atributivních znaků je nevýhodné. Výpočet s podporou MS Excel je proveden s využitím funkce FINV(prst; volnost ; volnost ). Konfidenční interval na konfidenční úrovni -α n = 365 α = 0,05 z p dolní p horní P p dolní P p horní 0 xxx 0,00699,0000 xxx 0,00009 0,004075 0,9574,47 0,00077 0,00583 0,998,497 3 0,000453 0,006409 0,9087,689 4 0,000799 0,007486 0,895,77 5 0,0090 0,00857 0,8768,0804 6 0,0065 0,009543 0,8640,05 7 0,00064 0,00537 0,856,069 8 0,00534 0,055 0,84,0064 9 0,00309 0,0479 0,838 0,9886 0 0,00359 0,0343 0,840 0,978 3

Konstrukce přejímacího plánu pro neshodné jednotky Máme zajistit způsobilost procesu a navrhnout test hypotézy, že podíl neshodných jednotek je přijatelný p = 0,000064 (odpovídá P p =,33) proti alternativní hypotéze, p = 0,007 (odpovídá P p =,0) při riziku α = 0,05 a síle testu -β = 0,90. Zjistíme kolik je třeba odebrat a překontrolovat jednotek (rozsah výběru n =?). K řešení této otázky je třeba použít vhodný software, např. Minitab (nástroj Power and Sample Size for Proportion ). Zadání se zapíše do následujících dialogových oken: p = 0,007 -β = 0,90 p = 0,000064 Grafický výstup: Power Curve for Test for One Proportion Power 0,000064,0 0,8 0,6 0,4 0,007 0,9 Sample Size 94 A ssumptions A lpha 0,05 Hypothesized p 0,000064 A lternativ e > Silofunkce testu prochází body: p = 0,000064; α = 0,05 a p = 0,000064; -β = 0,90 0, 0,0 0,000 0,00 0,00 0,003 Alternative Proportion 0,004 0,005 0,05 Číselný výstup: 4

Zadání vyhovuje rozsah výběru n = 94 jednotek. Nyní uvažujme, že provedeme test a v náhodném výběru tohoto rozsahu zjistíme z = 0,,,... neshodných jednotek. K vyhodnocení testu s podporou Minitabu použijeme nástroj Basic Statistics - Proportion, kde vyplníme dialogová okna Uvažované počty neshodných jednotek z =,, 3,... ; ve výběru rozsahu n = 94; testovaný podíl p = 0,000064. Číselný výstup: Vyhodnocení testu: V případě, že bude ve výběru n = 94 jednotek zjištěno z = 0, případně z = neshodných jednotek (z je značeno ve výpisu X), není důvod zamítnout testovanou hypotézu že p = 0,000064, jelikož odpovídající p-hodnoty jsou větší, než zvolená hladina významnosti α = 0,05. V případě nalezení dvou či více neshodných jednotek (z =, 3,...) se zamítá testovaná hypotéza p = 0,000064 ve prospěch alternativní hypotézy p = 0,007. Jinými slovy, v tomto případě se zamítá hypotéza že P p,33 ve prospěch hypotézy P p,0. 5

Hodnocení způsobilosti atributivních znaků jakosti (počet neshod) Tak jako byl analyzován problém neshodných jednotek, tak lze postupovat i v případě neshod, když na jedné jednotce je možno zjisti více neshod (vad, defektů). V tomto případě jsou výpočty založeny na Poissonově rozdělení pravděpodobnosti s parametrem λ, který představuje střední hodnotu výskytu neshod. Nejlepším bodovým odhadem parametru λ je pak zjištěný počet neshod, v kontrolovaném výběru (podskupině), případně průměrný počet zjištěných neshod ve výběru, při m kontrolovaných výběrech. Konfidenční interval, pokrývající s pravděpodobností - α skutečnou hodnotu parametru λ má tvar m χ ( ν ) ; α kde ( - α) je zvolená konfidenční úroveň; ν = mx 0 a ν = (mx 0 + ) jsou stupně volnost; x 0 je průměrný počet zjištěných neshod v dávce, z m kontrolovaných dávek. χ α ( ν ) a χ α ( ν ) jsou α a -α kvantily χ rozdělení o ν a ν stupních volnosti. Tyto kvantily a tedy celý konfidenční interval můžeme vypočítat s využitím funkce CHIINV programu MS Excel. Budeme interpretovat λ jako n p, kde p je pravděpodobnost výskytu neshody a n je maximální možný počet neshod. V případě m kontrolovaných dávek označíme k maximální možný počet neshod v dávce. Potom n = m k. V konkrétním případě bude potenciální počet neshod n fixován a měnit se bude parametr λ = n p. To se přímo promítne do konfidenčních mezí ukazatele výkonnosti procesu m χ α p = Φ(-3P p ). ( ν ) Příklad Uvažujme kontrolu m = 30 jednotek (dávek), které obsahují po stejném počtu k = 00 součástek (tištěné spoje desky do televizorů, osazené součástkami). Bylo zjištěno celkem z = 555 neshod. To znamená, že odhad očekávaného počtu neshod na jednu jednotku je 555 / 30 = 8,5. Pro konfidenční úroveň -α = 0,95 (α = 0,05) a pro ν = mx 0 = 60 8,5 = 0, ν = (mx 0 + ) = 0 + =, je χ α ( ν ) = χ 0,05(0) = 09,56 a χ α ( ν ) = χ 0,975() = 06,30. Potom konfidenční interval pro parametr λ je m χα ( ν) = 6,997 ; χ α( ν) = 0,05. m Výpočet konfidenčního intervalu s podporou softwaru Minitab provedeme pomocí nástroje Sample Poisson Rate kde vyplníme dialogová okna následovně: 6

Rozsah výběru m = 30 jednotek Počet zjištěných neshod Číselný výstup: Jelikož celkový možný počet neshod je n m = 00 30 = 3000, potom máme při λ = n m p pro odhad pravděpodobnosti výskytu jedné neshody λˆ 8,5 pˆ = = = n m 3000 0,0067. Při použití konfidenčních mezí pro λ získáme interval, ve kterém leží pravděpodobnost p při úrovní konfidence - α = 0,95: 6,997 / 3000 = 0,00566 < p < 0,05 / 3000 = 0,00670. Odtud již snadno pomocí vztahu P p = ( λ Φ ) 3 nm získáme konfidenční interval pro ukazatel výkonnosti P p : 0,00566 Φ ( ) > P p > 0,00670 Φ ( ) 3 3 0,9038 < P p < 0,95. Výkonnost procesu není uspokojivá, neboť ukazatel P p je s pravděpodobností 0,975 pouze lepší než 0,9038 a požadováno je, aby byl roven alespoň. Výrobu je nutno zlepšit. Maximální počet případných neshod by musel být P p > Φ (x) =, 3 tedy x = Φ(-3) tj. x = -0,0035. Pak pravděpodobnost výskytu neshody nesmí být větší než 0,007. Tomu odpovídá při celkovém počtu možných neshod 3000 očekávaný počet neshod na jednotku λ = 3000 0,007 = 8,. 7

Z toho plyne, že přijatelný počet neshod zjištěných při kontrole 30 jednotek by se měl pohybovat okolo 43 neshod, aby bylo možno říci, že proces pracuje s výkonností nejméně P p =. S podporou Minitabu, nástroje Sample Poisson Rate, můžeme tento závěr upřesnit a vypočítat dolní 95% - ní mez konfidenčního intervalu pro zvolené počty zjištěných neshod (např. 55, 60, až 80). Zjistíme, že při výskytu méně než 70 neshod, při kontrole 30 jednotek, bychom neměli důvod pochybovat, že ukazatel výkonnosti P p =, na hladině významnosti α 0,05. 8