12. licenční studium Statistické zpracování dat při managementu jakosti. Lenka Hromádková

Podobné dokumenty
Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )

Semestrální práce. 2. semestr

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA

Příloha č. 1 Grafy a protokoly výstupy z adstatu

Inovace bakalářského studijního oboru Aplikovaná chemie

6. Lineární regresní modely

http: //meloun.upce.cz,

Úloha 1: Lineární kalibrace

UNIVERZITA PARDUBICE

Tvorba nelineárních regresních

KALIBRACE A LIMITY JEJÍ PŘESNOSTI. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Fakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Kalibrace a limity její přesnosti

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie

Kalibrace a limity její přesnosti

KALIBRACE A LIMITY JEJÍ PŘESNOSTI 2015

Univerzita Pardubice SEMESTRÁLNÍ PRÁCE. Tvorba nelineárních regresních modelů v analýze dat. 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D.

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

Kalibrace a limity její přesnosti

Tvorba modelu sorpce a desorpce 85 Sr na krystalických horninách za dynamických podmínek metodou nelineární regrese

Semestrální práce. 2. semestr

Kalibrace a limity její přesnosti

Tvorba nelineárních regresních modelů v analýze dat

Kalibrace a limity její přesnosti

2.2 Kalibrace a limity její p esnosti

Univerzita Pardubice SEMESTRÁLNÍ PRÁCE. Tvorba lineárních regresních modelů. 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D.

6. Lineární regresní modely

Semestrální práce. 3.3 Tvorba nelineárních regresních modelů v analýze dat

LINEÁRNÍ REGRESE. Lineární regresní model

TVORBA LINEÁRNÍCH REGRESNÍCH MODELŮ PŘI ANALÝZE DAT. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Statistická analýza jednorozměrných dat

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

POLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými.

Semestrální práce. 2. semestr

UNIVERZITA PARDUBICE FAKULTA CHEMICKO-TECHNOLOGICKÁ

Tabulka č. 1 95%ní intervaly Úsek Směrnice model L1 L2 L1 L2 Leco1-0, , , ,15618 OES -0, , , ,21271

6. Lineární regresní modely

UNIVERZITA PARDUBICE

UNIVERZITA PARDUBICE

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie

Regresní analýza 1. Regresní analýza

Tvorba lineárních regresních modelů při analýze dat

Tvorba lineárních regresních modelů

Statistická analýza jednorozměrných dat

Licenční studium Galileo: Statistické zpracování dat. Tvorba lineárních regresních modelů při analýze dat. Semestrální práce

Univerzita Pardubice

Tvorba nelineárních regresních modelů v analýze dat

6. Lineární regresní modely

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

6. Lineární regresní modely

Tvorba nelineárních regresních modelů v analýze dat

Lineární regrese. Komentované řešení pomocí MS Excel

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

Korelační a regresní analýza

Fakulta chemicko technologická Katedra analytické chemie

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Regresní analýza. Eva Jarošová

Plánování experimentu

Tvorba lineárních regresních modelů při analýze dat

VÍCEROZMĚRNÝ STATISTICKÝ SOUBOR

UNIVERZITA PARDUBICE. 4.4 Aproximace křivek a vyhlazování křivek

Aproximace a vyhlazování křivek

Úvodem Dříve les než stromy 3 Operace s maticemi

UNIVERZITA PARDUBICE

S E M E S T R Á L N Í

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

Zadání Vypracujte písemně s využitím paketu ADSTAT a vyřešte 3 příklady. Příklady postavte z dat vašeho pracoviště nebo nalezněte v literatuře. Každý

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Viktor Kanický Kurs ICP Přírodovědecká fakulta Masarykovy univerzity

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

Ilustrační příklad odhadu LRM v SW Gretl

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Statistická analýza jednorozměrných dat

4EK211 Základy ekonometrie

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

III. Semestrální práce

Úloha 1. Napište matici pro případ lineárního regresního spline vyjádřeného přes useknuté

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

Reologie tavenin polystyrenových plastů. Závěrečná práce LS Pythagoras

Tématické okruhy pro státní závěrečné zkoušky. Navazující magisterské studium. studijní obor "Management jakosti"

Regresní a korelační analýza

Diagnostika regrese pomocí grafu 7krát jinak

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

Regresní a korelační analýza

Tématické okruhy pro státní závěrečné zkoušky. Navazující magisterské studium. studijní obor "Management kvality"

Univerzita Pardubice. Fakulta chemicko-technologická Katedra analytické chemie. Licenční studium Statistické zpracování dat

Posouzení linearity kalibrační závislosti

Regresní a korelační analýza

AVDAT Geometrie metody nejmenších čtverců

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

odpovídá jedna a jen jedna hodnota jiných

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Semestrální práce str. 1. Semestrální práce. 2.1 Tvorba lineárních regresních modelů při analýze dat. 2.3 Kalibrace a limity její přesnosti

Transkript:

12. licenční studium Statistické zpracování dat při managementu jakosti Lenka Hromádková

Desinfekční přípravky slouží k zneškodňování mikroorganismů (MO) vyvolávající onemocnění člověka nebo zvířat Druhy přípravků Desinfekcia odstranění MO z povrchů a kůže Antiseptika terapeutický zásah Desinfekční přípravky mohou obsahoval různé účinné látky Fenoly Tenzidy Přípravky na bázi chlóru či jódu Metody ověřování účinnosti v současné době prochází prověřováním a harmonizací (OECD) Fáze ověřování 1) suspenzní test na principu konduktometrie 2) suspenzní test s použitím nosičů 3) terénní ověření 23.10.2010 2

Přesné stanovení počtu přežívajících mikroorganismů (MO) je podmínkou pokud chceme stanovit antibakteriální aktivitu látky Pro stanovení se používají rychlé mikrobiologické metody pracující na základě měření elektrické vodivosti živné půdy Zvýšení vodivosti je vyvoláno metabolickou aktivitou MO Mikrobiální růst je charakterizován zvýšenou vodivostí, která je zaznamenána jako růstová křivka (viz. dále) Antibakteriální účinnost je stanovena pomocí zařízení Malthus Při působení střídavého proudu se mění elektrická vodivost Na základě stanovení detekčních časů MO se určí počty živných zárodků odečtením z kalibrační křivky růstu standardního kmene 23.10.2010 3

Růstová křivka závislost množení MO v novém prostředí na čase Fáze růstové křivky Lag fáze (adaptační fáze) Fáze zrychlujícího růstu Exponenciální fáze růstu Fáze zpomalujícího růstu Stacionární fáze Fáze odumírání 23.10.2010 4

Přípravek SAVO Chlornan sodný Testovaný kmen E. coli CCM 3988 Použité koncentrace 0,2%; 0,3%; 0,4%; 0,5%; 0,6%; 0,7% a kontrolní vzorek 23.10.2010 5

Cílem práce bylo: Navrhnout vhodný nelineární model popisující růstovou křivku Najít optimální parametry funkce A pokud to lze, určit kritérium, na základě kterého je možné kvantifikovat koncentraci desinfekčního přípravku 23.10.2010 6

Ve všech případech byl k vyhodnocení použit program OPstat 6.29, který pro nelineární regresi používá metodu OPTIM 1) Návrh regresního modelu Byla navržena funkce: f[k]:=p[7]*x[1,k]/(1+p[6]*x[1,k])+(p[3]*expbeta+p[4]*x[1,k]+p[5])/(1+exp Beta); Kde ExpBeta y[k] x[1,k] = exp(ln10*(p[1]-p[2]*x[1,k])) Naměřená vodivost Detekční čas DT Výše popsaná funkce platí pro všechna experimentálně získaná měření 2) Odhad parametrů Interaktivní optimalizace parametrů s počátečními hodnotami Obvyklé pořadí metod: Genetický algoritmus -> Simplexova metoda -> Levenberg-Marquardtova metoda Ukončení optimalizace nemění se residuální směrodatná odchylka 23.10.2010 7

3) Posouzení kvality odhadů Kvalita nalezených odhadů se posuzuje podle jejich rozptylů, nebo intervalů spolehlivosti Konc (Savo) % p1 s(p1) p2 s(p2) p3 s(p3) p4 s(p4) P5 s(p5) p6 s(p6) p7 s(p7) Savo K 0 3,60E+00 1,29E-02 8,48E-01 2,96E-03 1,15E+01 3,13E-01 7,08E+00 2,83E-02 2,25E+02 5,69E-01 5,40E+00 4,00E-01 1,25E+02 8,84E+00 Savo 2 0,2 3,23E+00 2,53E-02 7,06E-01 5,21E-03 1,08E+01 4,09E-01 6,31E+00 3,31E-02 1,96E+02 9,66E-01 Savo 3 0,3 5,95E+00 2,58E-02 6,14E-01 2,71E-03 1,15E+01 2,14E-01 7,45E+00 3,72E-02 1,17E+02 6,81E-01 6,91E+00 2,87E-01 1,43E+02 6,33E+00 Savo 4 0,4 7,71E+00 4,01E-02 4,70E-01 2,83E-03 9,61E+00 2,72E-01 5,71E+00 3,50E-01 5,40E+01 7,03E+00 3,45E+00 1,59E-01 7,61E+01 4,05E+00 Savo 5 0,5 1,19E+01 1,10E-01 7,28E-01 7,02E-03 6,48E+00 6,35E-01 1,71E+02 6,15E+00 7,32E+00 4,78E-01 2,41E+02 1,93E+01 Savo 6 0,6 1,25E+01 6,86E-02 7,38E-01 4,26E-03 7,59E+00 3,11E-01 1,34E+02 5,80E+00 4,57E+00 1,65E-01 1,33E+02 5,73E+00 Savo 7 0,7 2,17E-01 2,34E-04 3,20E+07 6,46E-08 1,30E+00 4,22E-03 7,55E+01 6,06E-02 23.10.2010 8

4) Grafické posouzení vhodnosti modelu Graf regresní křivky určuje jak daný model proloží experimentální data Savo K Savo3 23.10.2010 9

Savo 5 Savo7 23.10.2010 10

Graf analýzy klasických reziduí ukazuje že rezidua vytváří náhodný mrak, což potvrzuje vhodnost modelu Savo K Savo3 23.10.2010 11

Savo 5 Savo7 23.10.2010 12

5) Základní statistické charakteristiky Regresní rabat vyjadřuje % bodů, které vyhovují regresnímu modelu Konc (Savo) % D AIC RSC s(ê) Savo K 0 1,00E+02-3,24E+01 1,28E+00 3,13E-01 Savo 2 0,2 1,00E+02-2,18E+01 2,17E+00 4,09E-01 Savo 3 0,3 1,00E+02-4,74E+01 6,04E-01 2,16E-01 Savo 4 0,4 1,00E+02-5,08E+01 5,09E-01 1,98E-01 Savo 5 0,5 1,00E+02-3,13E+01 1,35E+00 3,22E-01 Savo 6 0,6 1,00E+02-4,83E+01 5,77E-01 2,11E-01 Savo 7 0,7 9,99E+01-8,30E+01 1,02E-01 8,84E-02 23.10.2010 13

Růstové křivky pro jednotlivé koncentrace dezinfekčního přípravku Savo mají podobný průběh. Tyto křivky se liší pouze délkou prvního plata, tj. délkou lagfáze. Délka lag-fáze závisí na podmínkách prostředí, čím jsou podmínky horší, tím je délka lag-fáze delší. Pak lze konstatovat, že se zvyšující se koncentrací dezinfekčního přípravku se podmínky prostředí zhoršují, množení organismů není tak rychlé a lag-fáze se prodlužuje Parametr p1 výše uvedené funkce určuje inflexní bod na růstové křivce. Inflexní bod vyjadřuje přechod z lag-fáze do fáze zrychlujícího se růstu organismů Z tohoto důvodu byl parametr p1 zvolen jako možné kritérium, na základě kterého lze kvantifikovat koncentraci dezinfekčního přípravku Pomocí lineární regrese byla vyhodnocena závislost koncentrace desinfekčního přípravku na parametru p1 parametr p1 u vzorku SAVO K a SAVO 7 byl z vyhodnocení vyloučen Odhady parametrů a testy významnosti: Parametr Odhad Směrodatná odchylka Test H0: B[j]=0 vs. HA: B[j]<>0 t-kritérium Hypotéza H0 je Hladina významnosti B[0] -1,54E+00 1,15E+00-1,34E+00 Akceptována 0,272 B[1] 2,45E+01 2,70E+00 9,06E+00 Zamítnuta 0,003 23.10.2010 14

Lineární model má tvar: y[k] = β 0 + β 1 * x[1,k] kde β 0 : není významný β 1 : = 24,49 se směrodatnou odchylkou s = 2,7023 y[k] : Koncentrace dezinfekčního vzorku x[1,k]: Parametr p1 modelu růstové křivky odpovídající detekčnímu času DT inflexního bodu Po posouzení základních statistických charakteristik lze konstatovat, že navržený model ve tvaru f[k]:=p[7]*x[1,k]/(1+p[6]*x[1,k])+(p[3]*expbeta+p[4]*x[1,k]+p[5])/(1+expbeta) kde ExpBeta: =exp(ln10*(p[1]-p[2]*x[1,k])); y[k] : Naměřená vodivost x[1,k]: Detekční čas DT h Vyhovuje pro všechna experimentální měření Výsledkem lineární závislosti koncentrace na parametru p1 je kalibrační přímka, jejíž tvar je: y[k] = 24,49 (2,70) * x[1,k] 23.10.2010 15

1. Výstavba a hledání nejlepšího nelineárního regresního modelu a ověření statistické významnosti jednotlivých nezávisle proměnných. 2. Nejlepší rozhodčí kritéria při výstavbě nelineárního regresního modelu. 3.Využití regresní diagnostiky založené na statistické analýze různých druhů reziduí při řešení regresního tripletu. 4. Využití regresní diagnostiky v průzkumové analýze dat EDA. Cíle hledání vlivných bodů při posouzení kvality dat kritika dat. 5. Posouzení predikční schopnosti nalezeného regresního modelu a správnost modelu. 23.10.2010 16

1. Návrh regresního modelu Obvykle se jako nelineární regresní model používá nějaká fyzikální nebo empirická závislost 2. Odhadování parametrů Interaktivní algoritmy Kriterium minima součtu čtverců odchylek (reziduí) 3. Posouzení kvality odhadů Posuzuje se podle jejich intervalů spolehlivosti nebo pouze jejich rozptylů D. 4. Grafické posouzení vhodnosti modelu Grafická analýza reziduí => graf závislosti reziduí na predikci Lze odhalit: - odlehlé hodnoty - trend v reziduích - nedostatečné střídání znaménka u reziduí - heteroskedasticita k ověření normality rozdělení reziduí lze využít i rankilových grafů a vyčíslení koeficientu šikmosti a špičatosti 23.10.2010 17

5. Základní statistické charakteristiky Regresní rabat - D[%] - vyjadřuje % bodů, které vyhovují regresnímu modelu Akaikeho informační kritérium - AIC 6. Regresní diagnostika Obsahuje pomůcky a postupy analýzy regresního tripletu (tj. pro kritiku dat, modelu, metody) A) analýza klasických reziduí B) analýza vlivných bodů 7. Mapa citlivostní funkce Vyjadřuje změnu regresního modelu při změně parametru o ±5% Parametry jsou dobře podmíněny, pokud jejich změna způsobí změnu účelové funkce (větší změna => větší citlivost) 8. Predikční schopnost modelu Postup cross-validation k se blíží k 1 MEP - střední kvadratická chyba predikce 9. Souhlas s požadavky fyzikálního smyslu 23.10.2010 18

Mezi základní statistické charakteristiky patří 1. Hodnoty regresního rabatu D[%] Vyjadřuje % bodů, které vyhovují regresnímu modelu 2. Hodnoty Akaikeho informačního kritéria AIC Za optimální se považuje model, pro který dosahuje AIC minimální hodnoty 3. Hodnoty Střední kvadratické chyby predikce MEP Čím je MEP nižší, tím je model věrohodnější a má lepší predikční schopnost 23.10.2010 19

Regresní diagnostika zahrnuje postupy a pomůcky pro analýzu dat (kritika dat, modelu, metoda) A) kvalita dat pro navržený model B) kvalita modelu pro daná data C) splnění předpokladů metody MNČ Regresní diagnostika zahrnuje analýzu grafických diagnostik a tabulek různých druhů reziduí Statistická analýza reziduí Odhalení vlivných bodů různými druhy reziduí: Klasická rezidua Efekt supernormality Rozptyl je nekonstantní, i když rozptyl chyb je konstantní Korelace reziduí Neindikují extrémy Normovaná rezidua Standardizovaná rezidua Jackknife rezidua Predikované reziduum Rekurzivní rezidua 23.10.2010 20

Diagnostické účely: 1) K identifikaci heteroskedasticity standardizovaná rezidua 2) Vybočující body Jackknife rezidua - predikovaná rezidua 3) Detekce autokorelace - rekurzivní rezidua K analýze reziduí se používá různých typů grafů. Existují 3 typy grafů: I. Typ Graf závislosti reziduí na indexu II. Typ Graf závislosti reziduí na proměnné x III. Typ Graf závislosti reziduí na predikci y Pokud se v těchto grafech objeví tvar mraku bodů Pokud se v těchto grafech objeví jiné obrazce => správnost metody nejmenších čtverců. => nesprávnost modelu, nesprávnost v datech I., II., III. Typ I., II. Typ III. Typ I., II., III. Typ - tvar výseče heteroskedasticita - tvar pásu chyba ve výpočtu - nepřítomnost x j - důsledkem vybočujících hodnot - tvar pásu chybný výpočet nebo v regresním modelu chybí absolutní člen - nelineární tvar nesprávně navržený model 23.10.2010 21

Pro určení statistických zvláštností jednotlivých proměnných nebo reziduí K posouzení vztahů mezi sledovanými proměnnými K ověření předpokladů o rozdělení proměnných nebo reziduí Mezi techniky regresní diagnostiky patří: Stanovení rozmezí dat Stanovení variability dat Přítomnost vybočujících pozorování Techniky identifikují Nevhodnost dat (malé rozmezí, nebo vybočující body) Nesprávnost navrženého modelu Multikolinearitu Nenormalitu Kvalita dat úzce souvisí s užitým regresním modelem.při posuzování se sleduje výskyt vlivných bodů 23.10.2010 22

Skupiny vlivných bodů: 1) Hrubé chyby jsou způsobeny měřenou veličinou vybočující pozorování - jsou způsobeny nevhodným nastavením vysvětlujících proměnných extrémy => důsledek chyb při manipulaci s daty 2) Body s vysokým vlivem speciálně vybrané body, které byly přesně změřeny a které obvykle rozšiřují predikční schopnost modelu 3) Zdánlivě vlivné body vznik jako důsledek nesprávně navrženého regresního modelu Podle místa výskytu vlivných bodů rozlišujeme: Vybočující pozorování outliers Extrémy Kombinace výše uvedených K identifikaci vlivných bodů typu vybočujícího pozorování se využívá reziduí K identifikaci extrémů se využívají diagonální prvky H ii projekční matice H 23.10.2010 23

Cross-validation data se rozdělí na dvě podskupiny dat M 1 a M 2 => body b(m 1 ) a b(m 2 ) K = U(b) Σ [ y i f(x i, b(m 2 ))] 2 + Σ [ y i f(x i, b(m 1 ))] 2 U(b) je hodnota sumy čtverců reziduí v minimu Predikční schopnost modelu je tím vyšší, čím více se hodnota k blíží k 1 Střední kvadratická chyba predikce MEP MEP = 1/n Σ [ y i f(x i, b i )] 2 Čím je hodnota MEP nižší, tím má model lepší predikční schopnost Správnost navrženého modelu Je určována z grafického záznamu v případě, že nezávisle proměnná x je skalár Whitem navržený test δf(x i, b) C = (n-1) Σ δf(x i, b) ê i - δβ j δβ k U(b) n Pro správný model je C = 0 23.10.2010 24