Design of experiment Návrh experimentu



Podobné dokumenty
Design of experiment Návrh experimentu

Navrhování experimentů a jejich analýza. Eva Jarošová

= = 2368

DOE (Design of Experiments)

Design of Experiment (DOE) Petr Misák. Brno 2017

Plánování experimentu

Statistická analýza jednorozměrných dat

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

Optimalizace provozních podmínek. Eva Jarošová

Pravděpodobnost, náhoda, kostky

Jednofaktorová analýza rozptylu

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu.

Normální (Gaussovo) rozdělení

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

You created this PDF from an application that is not licensed to print to novapdf printer (

Základy navrhování průmyslových experimentů DOE

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

Regresní analýza. Eva Jarošová

Testování statistických hypotéz

Pravděpodobnost, náhoda, kostky

Základy navrhování průmyslových experimentů DOE

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

, Brno Hanuš Vavrčík Základy statistiky ve vědě

Tomáš Karel LS 2012/2013

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

LINEÁRNÍ MODELY. Zdeňka Veselá

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Stručný úvod do testování statistických hypotéz

Úvod do analýzy rozptylu

Lineární regrese. Komentované řešení pomocí MS Excel

STATISTICA Téma 7. Testy na základě více než 2 výběrů

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Ilustrační příklad odhadu LRM v SW Gretl

Jednostranné intervaly spolehlivosti

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

PRAVDĚPODOBNOST A STATISTIKA

Národní informační středisko pro podporu jakosti

Regresní a korelační analýza

Normální (Gaussovo) rozdělení

Stav Svobodný Rozvedený Vdovec. Svobodná Rozvedená Vdova 5 8 6

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Testy statistických hypotéz

přesnost (reprodukovatelnost) správnost (skutečná hodnota)? Skutečná hodnota použití různých metod

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Regresní a korelační analýza

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Regulační diagramy (RD)

STATISTICAL DESIGN OF EXPERIMENT FOR SOLDER JOINTS QUALITY EVALUATION STATISTICKÉ PLÁNOVÁNÍ EXPERIMENTŮ PRO ÚČELY VYHODNOCOVÁNÍ KVALITY PÁJENÝCH SPOJŮ

Statistická analýza dat

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

4ST201 STATISTIKA CVIČENÍ Č. 7

ANALÝZA DAT V R 9. VÝPOČET VELIKOSTI SOUBORU. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Inovace bakalářského studijního oboru Aplikovaná chemie

Tématické okruhy pro státní závěrečné zkoušky. Navazující magisterské studium. studijní obor "Management jakosti"

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

Korelační a regresní analýza

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

Statistické řízení jakosti - regulace procesu měřením a srovnáváním

Tématické okruhy pro státní závěrečné zkoušky. Navazující magisterské studium. studijní obor "Management kvality"

KGG/STG Statistika pro geografy

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Zadání Máme data hdp.wf1, která najdete zde: Bodová předpověď: Intervalová předpověď:

Analýza rozptylu. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Srovnávání více než dvou průměrů

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

Odhady parametrů základního souboru. Cvičení 6 Statistické metody a zpracování dat 1 (podzim 2016) Brno, říjen listopad 2016 Ambrožová Klára

Plánování experimentu

Jednofaktorová analýza rozptylu

PRAVDĚPODOBNOST A STATISTIKA

Způsobilost systému měření podle normy ČSN ISO doc. Ing. Eva Jarošová, CSc.

10. Předpovídání - aplikace regresní úlohy

Korelace. Komentované řešení pomocí MS Excel

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

Testování hypotéz o parametrech regresního modelu

4EK211 Základy ekonometrie

4. Zpracování číselných dat

Testování hypotéz o parametrech regresního modelu

Analýza rozptylu. Přednáška STATISTIKA II - EKONOMETRIE. Jiří Neubauer

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

ADDS cviceni. Pavlina Kuranova

Porovnání dvou výběrů

VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA METALURGIE A MATERIÁLOVÉHO INŽENÝRSTVÍ KATEDRA KONTROLY A ŘÍZENÍ JAKOSTI

Technický experiment, příprava, provedení, hodnocení výsledků

PRAVDĚPODOBNOST A STATISTIKA

Tomáš Karel LS 2012/2013

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie

Transkript:

Design of experiment Návrh experimentu 19.7.2010

Cíl kurzu Seznámit studenty s metodologií, postupy a software pro návrh experimentu pomocí teorie a praktických ukázek Kurz je úspěšný pokud: Student si uvědomí jak sám provádí experimenty Student si pamatuje co je DOE a proč se používá Student šíří nabité poznání dále Vyučující poslední den přednáší pro více než dva studenty

Osnova Den 1. DOE teorie + software + příklady Den 2. Praktická ukázka (vrtulník - soutěž týmů)

Osnova Den 1. DOE teorie + software + příklady Co je to experiment Jak experimentujeme Co je DOE K čemu je to dobré Kroky DOE Předpoklady DOE DOE v krocích Software Příklady Matematika v pozadí F test, ANOVA

Osnova Den 2. Praktická ukázka (soutěž týmů) Zadání úlohy Poznání problému Návrh experimentu Měření Vyhodnocení experimentu Soutěž Vyhlášení vítězů

DOE - vrtulník Návrh konstrukce papírového vrtulníku Na začátku je třeba prozkoumat úlohu Zjistit všechny možné faktory Cíl 1) maximalizovat dobu letu vrtulníku 2) dosáhnout požadovanou dobu letu vrtulníku

Co je to experiment Experiment je test nebo série testů kdy se ze změn vstupních proměnných nebo faktorů systému (řízených X neřízených) snažíme určit vztahy mezi změnami vstupu a změnami pozorovanými na výstupu systému (Montgomery, 2001) Co se stane s výstupem když kombinujeme vstupy a nastavení systému Experimentování je vědecká metoda, která má za cíl testování hypotéz čí existujících teorií Vyplňuje mezeru mezi teorií a skutečností

Každodenní experiment Experiment je jednou ze základních metod poznání Experiment je starý jako lidstvo samo Neandrtálec Co se stane když sním tuhle krásnou zelenou houbu Chytrý neandrtálec - testování nesmí ovlivnit normální chování systému provede test na kolegovi neandrtálci Experiment v každodenním životě Fotografie objektiv, expozičníčas, ISO,. Pěstování květin frekvence zalévání, světlo, povídání (experimentálně neprokázané) Nejlevnější studentské jídlo? Jaký další experiment vás napadá?

Průmyslový experiment Výrobní proces je jednou z oblastí s největším počtem experimentů Zisk = velká motivace pro experimentování (optimalizaci) Produkce sýra: Cíl : dosažení požadované chuti a vůně, konzistence a ceny Vstupní proměnné: Suroviny Doba a teplota zrání U průmyslového experimentu jde nejčastěji o maximalizaci zisku

Vědecký experiment Experiment je nedílnou součástí vědecké práce Použití k ověření hypotéz Maximalizace výtěžnosti proteinu Cíl maximální množství proteinu Vstupní proměnné: Otáčky třepačky Médium Teplota Počáteční OD

Jak experimentujeme Zamyslete se nad tím jak provádíte experiment Máme systém, který neznáme, se dvěma vstupy a jedním výstupem Jak nalezneme maximální hodnotu výstupu při nejmenším počtu měření?

Standardní přístup One factor at a time (OFAT) Změna pouze jednoho parametru ostatní zafixované Nejprve měníme X1 a po nalezení optima měníme X2 Optimum nalezené pomocí OFAT Responce surface Skutečné optimum

Standardní přístup Nevýhody OFAT: Nemusí najít skutečné optimum Neurčíme jaký vliv má daný faktor na výstup systému Nelze zjistit vzájemné interakce mezi faktory Není znám počet experimentů Pro každý sledovaný výstup systému je nutné provést OFAT samostatně Minimální poznání systému a jeho chování Jde to udělat lépe? Nejpřesnější experiment změřit vše

DOE - SixSigma DOE Design Of Experiement Návrh experimentu či experimentální design Metoda pro návrh efektivního experimetnu Je součástí SixSigma metodologie Strategie řízení a zlepšování procesů (kvality firmy) Vyvinuto Motorola 1986, zdokonaleno Honeywell Sada nástrojů pro řízení procesů - DMAIC SixSigma - šest směrodatných odchylek

Motivační příklad Co musíme vědět před prováděním experimentu? Co od experimentu očekáváme?

Motivační příklad Co musíme vědět před návrhem: Znalost procesu Vstupní proměnné Měřitelné Neměřitelné Neznámé Znalost limitů Chyby měření Co od návrhu očekáváme: Lépe poznat proces Nalézt významné faktory Zjistit, které proměnné jsou na sobě závislé Vytvořit matematický model pro predikci a optimalizaci Udělat to co nejefektivněji

Standardní přístup Optimalizace procesu Jak provést optimalizaci procesu s dvěma vstupními parametry a jedním výstupem? Proces je reprezentován rovnicí do které dosazujeme OFAT

DOE Historie 1920 full faktorial design - Fisher 1930 fractional factorial design 1935 první použití pro optimalizaci produkce brambor 1950 DOE Taguchi vytvořil jednoduché a srozumitelné nástroje a postupy pro DOE 1950 současnost velmi sporadické využití DOE Nejrozšířenější technikou provádění experimentu je stále OFAT

DOE co to je Množina nástrojů a postupů pro optimální návrh a vyhodnocení plánovaného experimentu Plánovaný experiment : cílená změna vstupních faktorů Bez cílených změn nelze poznat proces Základní kroky DOE: Definice nebo popis problému Stanovení sledované proměnné response Výběr faktorů a úrovní Výběr plánu experimentu Provedení experimentu Analýza dat Závěry a doporučení

DOE cíl Co nejvíce poznat proces Co nejmenší počet měření Matematický model systému možnost optimalizace faktorů Určení vlivu řiditelných a neřiditelných proměnných na systém Neřiditelné proměnné odpovídají za variabilitu výsledného produktu Snažíme se najít optimální nastavenířiditelných proměnných, tak abychom minimalizovali vliv neřiditelných proměnných Nastavit faktory tak, abychom dosáhli požadovaného výstupu Nastavit faktory tak, aby byla variabilita výstupu co nejmenší

DOE - responce Poskytuje užitečnou informaci o procesu Více odezev cena X kvalita Často se sleduje aritmetický průměr nebo směrodatná odchylka zákazníkem požadované charakteristiky Kvalita měřicího procesu při malé přesnosti měření se dají odhalit pouze velké efekty zvolených faktorů.

DOE - faktory Nutná znalost procesu Osvědčuje se kombinace praktických zkušeností a teoretických vědomostí Musí se vybrat faktory, jež se budou v procesu měnit Vybrat důležité faktory V jaké oblasti se budou měnit Ve kterých hodnotách faktorů se budou provádět měření

DOE - Pojmy Vstupní proměnné faktory Spojitéči kategorické Stroje nebo přístroje a jejich nastavení Různé technologie nebo metody výroby Používaný vstupní materiál Operátoři nebo směny Vše, co transformuje vstupní materiál na výstupní produkt Výstupní proměnná odezva (responce) Odezva může obsahovat jednu nebo více jakostních charakteristik (objektivní X subjektivní) Je to ta veličina nebo ty veličiny, jež sledujeme, abychom zlepšili proces či uspokojili zákazníka

DOE - stručně Určit nastavení faktorů pro měření odezvy Výstupem je tabulka hodnot pro měření Měřený výstup se zapisuje do této tabulky Počet měření závisí na počtu faktorů, počtu úrovní a počtu replikací Určit významné faktory - ANOVA Určit vliv faktorů na výstup metoda nejstrmějšího spádu Ověřit splnění předpokladů Určit matematický model popisující systém

DOE plán a provedení experimentu Plán experimentu: matice s hodnotami faktorů Počet sloupců = počet faktorů Počet řádků = počet měření = počet úrovnípočet faktorů * počet replikací 3 faktory Faktor na spodní úrovni -, faktor na horní úrovni + Zobrazení v 3D prostoru

DOE plán a provedení experimentu Počet opakovaní měření Pořadí jednotlivých měření - znáhodnění Výběr typu návrhu experimentu Dodržení návrhu experimentu Chyby provedené při experimentu mohou zásadně ovlivnit výsledek analýzy

DOE analýza naměřených dat Ruční analýza - Excel Statistickéči DOE software: Unscrambler Minitab Design expert Musíme rozumět jednotlivým krokům

DOE kroky efektivního designu Definice problému: Stanovení cíle Počet faktorů a jejich limity DOE responce: Nalezení nejdůležitějších faktorů, hodně faktorů Nalezení hlavních efektů a interakcí, malé množství faktorů Optimalizace,málo faktorů Diskuze expertů First screening Advanced screening Optimization DOE Optimalizace, hodně faktorů Nelze pomocí DOE

DOE typ úkolu Cíl Předpoklad Problém Nevýhody Typ návrhu First screening Najít hlavní efekty Hodně faktorů Najít hlavní efekty a určit jejich vliv na systém Není možné rozlišit mezi vlivem hlavních faktorů a interakcí Fractional factorial Advaced screening Najít hlavní efekty a interakce Málo faktorů Interakce mezi dvojicemi faktorů, Detekovat nelinearitu Exponenciální množství experimetů Full factorial Fractional factorial

DOE typ návrhu Full factorial dvě úrovně Počet měření = 2^n, n = počet faktorů Hlavní efekty a interakce Fractional factorial dvě úrovně Počet měření = 2^(n p), p = velikost částečného faktoriálu Nejistota:

DOE počet opakování měření Odhalení chyby měření Hodnota výstupu Vliv faktoru na výstup faktor

DOE znáhodnění Odhalení neznámých faktorů Pokovení materiálu v lázní Kvalita pokovení Teplota T1 Teplota T2 čas Jaká teplota je lepší?

DOE centrální vzorek Očekáváme nelinearitu v závislosti výstupu na vstupu? Skutečná odezva Hodnota výstupu Předpokládaná odezva faktor

DOE uspořádání do bloků Využívá ke snížení variability náhodné složky V případě, kdy očekáváme významnou variabilitu odezvy a daný faktor nelze z experimentů vyloučit Experimenty jsou uspořádány do bloků, tak aby v rámci bloku probíhaly experimenty za podobných podmínek Vliv operátora, směny, dávky,

DOE analýza dat 1. Popis dat pomocí modelu 2. Vyhodnocení modelu 3. Vyhodnocení jednotlivých faktorů a interakcí Analýza efektů ANOVA analýza variance Testování významnosti Regrese MLR: multiple linear regression PLS: partial least squares regression Výsledek Vliv faktoru na výsledek Významnost faktoru

DOE - model Modely používané pro DOE: Lineární model pro hlavní faktory: Lineární model pro hlavní faktory a interakce:

DOE určení vlivu faktorů Cílem je zjistit jaký vliv má faktor na výstupní proměnnou a jak významný faktor je Vliv faktoru metoda nejstrmějšího spádu Významnost faktorů ANOVA ANalysis Of Variance Testování hypotéz o vlivu faktorů Testování na 5% hladině významnosti P hodnota - určuje významnost daného faktoru Testování hypotéz významnosti jednotlivých faktorů Jakou měrou přispívají jednotlivé faktory k varianci výstupu

Pěkné obrázky Graf hlavních faktorů graf interakcí

DOE ANOVA Předpoklad odezva systému má normální rozdělení DOE vyšetřování faktorů = Multi way ANOVA Měří efekt jednotlivých faktorů najednou Nejdůležitější pro nás ANOVA table Příklad na 2 way ANOVA pro dva faktory

DOE ANOVA T-test používá se k porovnání dvou náhodných proměnný, porovnání středních hodnot dvou proměnných (musí mít stejné rozptyly) Pokud chceme testovat více proměnných je lepší použít ANOVA protože se dopouštíme menší chyby než použitím T testu pro všechny kombinace proměnných ANOVA se používá k testování hypotéz, že proměnné neovlivňují odezvu testujeme jestli různé úrovně faktoru ovlivňují odezvu

DOE ANOVA P-hodnota typickým výstupem počítačových programů pro testování hypotéz Udává mezní hladinu významnosti, při které bychom hypotézu ještě zamítali Hypotézu H0 zamítneme na hladině významnosti alfa, právě když p-hodnota < alfa V případě DOE platí, že hypotézu o tom, že faktor neovlivňuje významně odezvu zamítneme pokud P- hodnota je menší než alfa

DOE ANOVA Hladina významnosti alfa = 0,05, 0,01 0,001 Udává nám pravděpodobnost správnosti rozhodnutí o zamítnutí hypotézy (chyba 1. druhu) Pokud nám testování hypotézy na hladině významnosti alfa=0,05 řekne, že můžeme hypotézu zamítnout, pak víme, že správnost tohoto rozhodnutí je 95% Čím nižší hladina významnosti tím důvěryhodnější výsledky V případě DOE potřebujeme vědět, zda můžeme hypotézu zamítnout, proto používáme hladinu významnosti

DOE ANOVA T-test test o rozdílu středních hodnot n1 a n2 dvou nezávislých náhodných výběrů V našem případě odpovídají dva výběry různým nastavením faktoru, který ovlivňuje odezvu systému y Testem zjistíme zda má změna faktoru vliv na odezvu systému Pokud se potvrdí hypotéza o rovnosti středních hodnot pak změna faktoru nemá významný vliv na odezvu Pokud se hypotéza o rovnosti středních hodnot zamítne pak změna faktoru má významný vliv na odezvu

DOE ANOVA Jak již bylo výše uvedeno, při jedno faktorové analýze rozptylu se předpokládá, že k nezávislých výběrů hodnot znaku Y pochází z normálních rozdělení se stejnými rozptyly. To znamená, že před vlastním testem by měl být ověřen předpoklad o normalitě a předpoklad stejných rozptylech. K ověření předpokladu o normalitě lze použít některý z testů hypotéz o modelu rozdělení, ale v praxi se od toho obvykle upouští. Mimo jiné i proto, že pokud odchylky skutečného rozdělení od normálního rozdělení nejsou příliš markantní, neovlivňují zpravidla závěry, k nimž se při analýze rozptylu dochází. Navíc máme v mnoha praktických úlohách, zejména v psychologickém a pedagogickém výzkumu, dobré důvody být o normalitě studovaných proměnných přesvědčeni.

DOE 2 way ANOVA Hlavní myšlenka: rozdělit varianci do dvou tříd Variance mezi faktory Variance v rámci jednoho faktoru Jestliže je variance mezi faktory větší než uvnitř faktoru můžeme říci, že je zde významný rozdíl mezi faktory 2 way ANOVA dva faktory Variance je rozdělena do čtyř tříd Faktor A Faktor B Kombinace faktorů A a B Variance uvnitř tříd

DOE 2 way ANOVA 3 samostatné statistické testy (založené na F testu) Porovnání prvních tří zdrojů variance s variancí uvnitř tříd Výpočet p hodnoty pro každý test testujeme jednotlivé hypotézy, že faktor není významným zdrojem variance Na základě velikosti p hodnoty můžeme určit významnost daného faktoru

DOE 2 way ANOVA Dva faktory: A B Faktor A má a úrovní (2) Faktor B má b úrovní (2) Kombinace úrovní faktorů = ab Každá kombinace má r opakování Yijk odezva systému pro i úroveň faktoru A, j úroveň faktoru B a r opakování

DOE 2 way ANOVA

DOE 2 way ANOVA DF = stupeň volnosti = počet úrovní - 1 SS = součet čtverců = součet mocnin vzdáleností měření od střední hodnoty MS = mean squares = SS/DF normalizace variance pro porovnání F hodnota poměr mezi SS pro danou třídu a všechny třídy P hodnota = 1/F, hodnota menší než 0.05 určuje významný faktor

DOE - ANOVA table

DOE kroky efektivního designu Definice problému: Stanovení cíle Počet faktorů a jejich limity DOE responce: Nalezení nejdůležitějších faktorů, hodně faktorů Nalezení hlavních efektů a interakcí, malé množství faktorů Optimalizace,málo faktorů Diskuze expertů First screening Advanced screening Optimization DOE Optimalizace, hodně faktorů Nelze pomocí DOE

Přirovnání Snažit se poznat systém pomocí DOE z již změřených dat je jako volat doktora na pitevnu Již změřená data jsou většinou nepoužitelná měření za nevhodných podmínek Neznalost podmínek měření

DOE ukázka na konkrétním příkladu Unsrambler Výroba sýra Faktory Přídavná sušina 0-3 PH 5,7 6,1 Sušina 36-40 Zrání 2-8 After creaming 15-45 Chlazení 5 15 Odezva Tvar Lepivost

Ústav fyzikální biologie www.ufb.jcu.cz