Fakulta chemicko technologická Katedra analytické chemie

Podobné dokumenty
Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

Kalibrace a limity její přesnosti

Fakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Kalibrace a limity její přesnosti

Univerzita Pardubice SEMESTRÁLNÍ PRÁCE. Tvorba lineárních regresních modelů. 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D.

Kalibrace a limity její přesnosti

6. Lineární regresní modely

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )

Tvorba lineárních regresních modelů při analýze dat

Úloha 1: Lineární kalibrace

KALIBRACE A LIMITY JEJÍ PŘESNOSTI. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

TVORBA LINEÁRNÍCH REGRESNÍCH MODELŮ PŘI ANALÝZE DAT. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Kalibrace a limity její přesnosti

Inovace bakalářského studijního oboru Aplikovaná chemie

2.2 Kalibrace a limity její p esnosti

KALIBRACE A LIMITY JEJÍ PŘESNOSTI 2015

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Příloha č. 1 Grafy a protokoly výstupy z adstatu

Semestrální práce. 2. semestr

Tvorba lineárních regresních modelů

Semestrální práce. 2. semestr

Univerzita Pardubice

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie

UNIVERZITA PARDUBICE FAKULTA CHEMICKO-TECHNOLOGICKÁ

Tvorba nelineárních regresních modelů v analýze dat

Tvorba lineárních regresních modelů při analýze dat

Kalibrace a limity její přesnosti

UNIVERZITA PARDUBICE

Tvorba nelineárních regresních

Semestrální práce. 3.3 Tvorba nelineárních regresních modelů v analýze dat

6. Lineární regresní modely

UNIVERZITA PARDUBICE

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

Tvorba nelineárních regresních modelů v analýze dat

UNIVERZITA PARDUBICE

Licenční studium Galileo: Statistické zpracování dat. Tvorba lineárních regresních modelů při analýze dat. Semestrální práce

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie

http: //meloun.upce.cz,

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

Tabulka č. 1 95%ní intervaly Úsek Směrnice model L1 L2 L1 L2 Leco1-0, , , ,15618 OES -0, , , ,21271

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

6. Lineární regresní modely

S E M E S T R Á L N Í

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie

PRAVDĚPODOBNOST A STATISTIKA

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

Semestrální práce. 2. semestr

Tvorba modelu sorpce a desorpce 85 Sr na krystalických horninách za dynamických podmínek metodou nelineární regrese

UNIVERZITA PARDUBICE

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Semestrální práce str. 1. Semestrální práce. 2.1 Tvorba lineárních regresních modelů při analýze dat. 2.3 Kalibrace a limity její přesnosti

PRAVDĚPODOBNOST A STATISTIKA

Univerzita Pardubice Fakulta chemicko-technologická. Licenční studium Statistické zpracování dat

FAKULTA CHEMICKO-TECHNOLOGICKÁ KATEDRA ANALYTICKÉ CHEMIE. Semestrální práce z CHEMOMETRE. TOMÁŠ SYROVÝ 4.ročník

LINEÁRNÍ REGRESE. Lineární regresní model

POLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými.

Univerzita Pardubice SEMESTRÁLNÍ PRÁCE. Tvorba nelineárních regresních modelů v analýze dat. 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D.

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Tvorba nelineárních regresních modelů v analýze dat

6. Lineární regresní modely

Licenční studium Galileo: Statistické zpracování dat. Kalibrace a limity její přesnosti. Semestrální práce

2.1 Tvorba lineárních regresních

Aproximace a vyhlazování křivek

Statistická analýza jednorozměrných dat

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA. Semestrální práce

III. Semestrální práce

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

PYTHAGORAS Statistické zpracování experimentálních dat

Plánování experimentu

Regresní analýza. Eva Jarošová

Statistická analýza jednorozměrných dat

vzorek vzorek

KALIBRACE. Definice kalibrace: mezinárodní metrologický slovník (VIM 3)

Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat )

Analýza rozptylu ANOVA

Posouzení linearity kalibrační závislosti

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Semestrální práce z CHEMOMETRIE I Statistické zpracování jednorozměrných dat

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

Úloha 1. Napište matici pro případ lineárního regresního spline vyjádřeného přes useknuté

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

12. licenční studium Statistické zpracování dat při managementu jakosti. Lenka Hromádková

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie

Charakteristika datového souboru

6. Lineární regresní modely

Lineární regrese. Komentované řešení pomocí MS Excel

Úlohy. Kompendium 2012, Úloha B8.01a, str. 785, Model y = P1 * exp( P2/(B801x + P3)

UNIVERZITA PARDUBICE

UNIVERZITA PARDUBICE. 4.4 Aproximace křivek a vyhlazování křivek

přesnost (reprodukovatelnost) správnost (skutečná hodnota)? Skutečná hodnota použití různých metod

UNIVERZITA PARDUBICE CHEMICKO-TECHNOLOGICKÁ FAKULTA KATEDRA ANALYTICKÉ CHEMIE

4EK211 Základy ekonometrie

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

Statistická analýza jednorozměrných dat

Aproximace křivek a vyhlazování křivek

Menu: QCExpert Nelineární regrese Modul nelineární regrese slouží pro tvorbu a analýzu explicitních nelineárních regresních modelů v obecném tvaru

Statistická analýza. jednorozměrných dat

LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica

SEMESTRÁLNÍ PRÁCE UNIVERZITA PARDUBICE. Fakulta chemicko - technologická Katedra analytické chemie

Transkript:

Fakulta chemicko technologická Katedra analytické chemie Licenční studium statistické zpracování dat Tvorba lineárních a kalibračních modelů při analýze dat Pavel Valášek Školní rok 2001 02

OBSAH 1 POROVNÁNÍ DVOU REGRESNÍCH PŘÍMEK U JEDNODUCHÉHO REGRESNÍHO MODELU... 3 1.1 Úkol... 3 1.2 Zpracovávaná data... 3 1.3 Lineární regresní model... 4 1.3.1 Data získaná pro laboratorní pícku... 4 1.3.2 Data získaná pro provozní pec... 9 1.4 Porovnání modelů... 14 1.4.1 Společný lineární model... 14 1.4.2 Test shody dvou lineárních modelů... 17 1.5 Závěr... 18 1.5.1 Statistický... 18 1.5.2 Aplikační... Chyba! Záložka není definována. 2 VALIDACE NOVÉ ANALYTICKÉ METODY... 19 2.1 Úkol... 19 2.2 Zpracovávaná data... 19 2.3 Lineární regresní model... 20 2.3.1 Regresní diagnostika... 22 2.4 Závěr... 24 2.4.1 Statistický... 24 2.4.2 Aplikační... Chyba! Záložka není definována. 3 LINEÁRNÍ REGRESE POLYNOMEM... 25 3.1 Úkol... 25 3.2 Zpracovávaná data... 25 3.3 Nalezení stupně polynomu... 26 3.3.1 Stupeń polynomu 2... 26 3.3.2 Stupeń polynomu 3... 26 3.3.3 Stupeń polynomu 4... 26 3.3.4 Stupeń polynomu 5... 27 3.3.5 Stupeń polynomu 6... 27 3.3.6 Závěr... 27 3.4 Metoda racionálních hodností korekce hodností... 28 3.5 Závěr... 30 3.5.1 Statistický... 30 3.5.2 Aplikační... Chyba! Záložka není definována. 1

4 VÍCEROZMĚRNÝ LINEÁRNÍ REGRESNÍ MODEL... 31 4.1 Úkol... 31 4.2 Zpracovávaná data... 31 4.3 Lineární regresní model... 32 4.3.1 Regresní diagnostika... 33 4.4 Závěr... 36 4.4.1 Statistický... 36 4.4.2 Aplikační... Chyba! Záložka není definována. 5 LINEÁRNÍ KALIBRAČNÍ MODEL... 37 5.1 Úkol... 37 5.2 Data pro kalibrační model... 37 5.3 Regresní diagnostika... 38 5.4 Kalibrace... 39 5.5 Závěr... 40 5.5.1 Statistický... 40 5.5.2 Aplikační... Chyba! Záložka není definována. 6 NELINEÁRNÍ KALIBRAČNÍ MODEL... 41 6.1 Úkol... 41 6.2 Data pro kalibrační model... 41 6.3 Regresní diagnostika... 42 6.4 Kalibrace... 43 6.5 Závěr... 44 7 ROZLIŠENÍ MEZI LINEÁRNÍ A NELINEÁRNÍ KALIBRACÍ... 45 7.1 Úkol... 45 7.2 Data pro kalibrační model... 45 7.3 Regresní diagnostika... 46 7.4 Kalibrace... 47 7.4.1 Porovnání kalibračních závislostí... 47 7.5 Závěr... 48 2

1 Porovnání dvou regresních přímek u jednoduchého regresního modelu 1.1 Úkol Záměrem tohoto hodnocení je porovnání zjištěných závislostí mezi vzorky pigmentů, které byly připraveny v laboratorní pícce a které jsou vyráběny kontinuální výrobou. K testování byla vybrána závislost obsahu celkového železa v zelené skalici na odstínovém úhlu (h o ) pigmentu. Je nutné podotknout, že vzorky byly připraveny a analyzovány při stejných podmínkách, a vlastní měření barevných vlastností (v tomto případě h o ) prováděla pouze jedna laborantka aby se předešlo případné vyšší variabilitě získaných výsledků. 1.2 Zpracovávaná data K hodnocení jsem použil statistický program QCExpert K dispozici bylo u laboratorní pícky 12 hodnot a u provozní pece 20 hodnot. Tabulka I. [x celkové Fe ve skalici (%)]; [y - odstínový úhel h o pigmentu] Laboratorní pícka x y x y 18.01 19.79 18.22 20.01 18.48 20.3 18.39 19.94 18.7 20.49 18.65 20.35 18.89 20.86 18.55 20.22 19.16 20.26 18.2 19.9 18.1 19.8 18.6 20.74 Tabulka II. [x celkové Fe ve skalici (%)]; [y - odstínový úhel h o pigmentu] Provozní pec x y x y 18.61 20.39 18.55 20.80 18.51 20.04 18.57 20.97 18.46 19.71 18.52 20.65 18.52 20.79 18.56 20.30 18.51 20.82 18.60 20.60 18.53 20.43 18.65 21.15 18.60 20.73 18.55 20.21 18.58 20.74 18.62 20.84 18.56 20.46 18.71 21.00 18.55 20.68 18.69 21.21 3

1.3 Lineární regresní model 1.3.1 Data získaná pro laboratorní pícku Nejprve byla u dat ověřena normalita a pak provedena regresní diagnostika na odhalení vlivných bodů. Obr. I - 1 Obr. I - 2 Obr. I 3 Obr. I 4 Na základě grafických diagnostik byly určeny dva vlivné body (12 O, 5 - OE) a jeden je podezřelý z vlivu (4). Numerickým hodnocením na základě Atkinsonovy vzdálenosti, Andrews- Pregibonovy diagnostiky byl určen bod 5 také jako vlivný. Vzhledem k počtu dat a testovaných parametrů jsem pro další hodnocení odstranil dvě odlehlé hodnoty (5,12). 4

Jak je vidět po odstranění dvou odlehlých hodnot ukazují grafy regresní přímky, predikovaných hodnot a reziduí dobrý regresní model. Obr. I 5 Obr. I 6 Obr. I 7 Obr. I 8 Obr. 9 Obr. - 10 5

1.3.1.1 Regresní diagnostika Název úlohy : Laboratorní pícka Hladina významnosti : 0.05 Kvantil t(1-alfa/2,n-m) : 2.30600413519908 Kvantil F(1-alfa,m,n-m) : 5.31765507155526 Absolutní člen : Ano Počet platných řádků : 10 Počet parametrů : 2 Metoda : Nejmenší čtverce Transformace : Bez transformace Základní analýza Charakteristiky proměnných Proměnná Průměr Směr.Odch. Kor.vs.Y Významnost Fe 18.419 0.2852854321 0.9543512405 1.797640 E-005 Analýza rozptylu Průměr Y : 20.166 Zdroj Součet čtverců Průměrný čtverec Rozptyl Celková variabilita 1.06284 0.106284 0.1180933333 Variabilita vysvětlená modelem 0.9680201008 0.09680201008 0.107557789 Reziduální variabilita 0.09481989925 0.009481989925 0.01053554436 Hodnota kritéria F : 81.67231633 Kvantil F (1-alfa, m-1, n-m) : 5.317655072 Pravděpodobnost : 1.797640 E-005 Model je významný Odhady parametrů Proměnná Odhad Směr.Odch. Závěr Pravděpodobnost Abs -1.008218269 2.3432403 Nevýznamný 0.6783577532 Spodní mez Horní mez -6.411740092 4.395303553 Fe Odhad Směr.Odch. Závěr Pravděpodobnost 1.14958566 0.1272049177 Významný 1.797640725E-005 Spodní mez Horní mez 0.8562505937 1.442920726 6

Statistické charakteristiky regrese Vícenásobný korelační koeficient R : 0.9543512405 Koeficient determinace R^2 : 0.9107862903 Predikovaný korelační koeficient Rp : 0.8442682756 Střední kvadratická chyba predikce MEP : 0.01655179059 Akaikeho informační kritérium : -42.58361077 Analýza klasických reziduí Reziduální součet čtverců : 0.09481989925 Průměr absolutních reziduí : 0.07701055304 Reziduální směr. odchylka : 0.1088691297 Reziduální rozptyl : 0.01185248741 Šikmost reziduí : 0.149242777 Špičatost reziduí : 2.418013433 Testování regresního tripletu Fisher-Snedecorův test významnosti modelu Hodnota kritéria F : 81.67231633 Kvantil F (1-alfa, m-1, n-m) : 5.317655072 Pravděpodobnost : 1.797640725E-005 Model je významný Scottovo kritérium multikolinearity Hodnota kritéria SC : 81.85744577 Model je nekorektní! Cook-Weisbergův test heteroskedasticity Hodnota kritéria CW : 0.3239768934 Kvantil Chi^2(1-alfa,1) : 3.841458829 Pravděpodobnost : 0.5692274225 Rezidua vykazují homoskedasticitu. Jarque-Berrův test normality Hodnota kritéria JB : 0.3898664469 Kvantil Chi^2(1-alfa,2) : 5.991464547 Pravděpodobnost : 0.822889606 Rezidua mají normální rozdělení. Waldův test autokorelace Hodnota kritéria WA : 0.2711826143 Kvantil Chi^2(1-alfa,1) : 3.841458829 Pravděpodobnost : 0.5692274225 Autokorelace je nevýznamná 7

Durbin-Watsonův test autokorelace Hodnota kritéria DW : 1.538718243 Rezidua nejsou autokorelována Znaménkový test reziduí Hodnota kritéria Sg : 2.318049884 Kvantil N(1-alfa/2) : 1.959963999 Pravděpodobnost : 0.02044661015 V reziduích je trend! Závěr: Na základě testu modelu byl model určen jako významný, ale testem na multikolinearitu byl model určen jako nekorektní, i když číslo podmíněnosti K a VIF faktor multikolinearitu neprokazují. Absolutní člen regresní přímky byl také určen jako nevýznamný, a na základě tohoto hodnocení se může z rovnice lineární přímky vypustit a takto upravený model má tvar Odstínový úhel [h o ]= 1.0948 (+0.0017). Celkové Fe [x] Znaménkovým testem byl určen trend v reziduích, což detekuje, že navržený model není zcela v pořádku z grafických diagnostik tento závěr není zcela patrný, protože rezidua jsou chaoticky uspořádána. Jen pro ověření jsem vypustil bod č.4 (byl detekován jako podezřelý z vlivu) a pro tyto hodnoty znaménkový test reziduí již vykazuje, že v reziduích trend není a tudíž je model v pořádku. Znaménkový test reziduí po odstranění vlivného bodu č.4. Hodnota kritéria Sg : 0.6827364296 Kvantil N(1-alfa/2) : 1.959963999 Pravděpodobnost : 0.4947734057 V reziduích není trend. Pro větší věrohodnost této závislosti je nutno provést ještě několik měření, ale pro porovnání s jiným modelem lze použít. 8

1.3.2 Data získaná pro provozní pec Nejprve byla u dat tak jako u prvního modelu ověřena normalita a pak provedena regresní diagnostika na odhalení vlivných bodů. Obr. I 11 Obr. I - 11 Obr. I 12 Obr.I - 13 Na základě grafických diagnostik byly určeny čtyři vlivné body (5 O; 3 OE; 19, 20 - E. Pro další hodnocení modelu jsem z dat odstranil pouze odlehlé body 3 a 5. Extrémy (19,20) jsem v datech ponechal. 9

Jak je vidět po odstranění odlehlých bodů ukazují grafy regresní přímky, predikovaných hodnot a reziduí v celku dobrý regresní model. Obr. I 14 Obr. I - 15 Obr. I 16 Obr. I - 17 Obr. I 18 Obr. I - 19 10

1.3.2.1 Regresní diagnostika Název úlohy : Provozní pec Hladina významnosti : 0.05 Kvantil t(1-alfa/2,n-m) : 2.11990529922106 Kvantil F(1-alfa,m,n-m) : 4.49399847766554 Absolutní člen : Ano Počet platných řádků : 18 Počet parametrů : 2 Metoda : Nejmenší čtverce Transformace : Bez transformace Základní analýza Charakteristiky proměnných Proměnná Průměr Směr.Odch. Kor.vs.Y Významnost Fe 18.58222222 0.05704029077 0.6566666942 0.003073133 Analýza rozptylu Průměr Y : 20.66611111 Zdroj Součet čtverců Průměrný čtverec Rozptyl Celková variabilita 1.720227778 0.09556820988 0.1011898693 Variabilita vysvětlená modelem 0.7417813937 0.04121007743 0.04363419963 Reziduální variabilita 0.9784463841 0.05435813245 0.05755566965 Hodnota kritéria F : 12.12994651 Kvantil F (1-alfa, m-1, n-m) : 4.493998478 Pravděpodobnost : 0.003073133113 Model je významný Odhady parametrů Proměnná Odhad Směr.Odch. Závěr Pravděpodobnost Abs -47.384092 19.53898122 Významný 0.02750789072 Spodní mez Horní mez -88.80488183-5.963302181 Fe Odhad Směr.Odch. Závěr Pravděpodobnost 3.662113299 1.051483189 Významný 0.003073133113 Spodní mez Horní mez 1.433068514 5.891158083 11

Statistické charakteristiky regrese Vícenásobný korelační koeficient R : 0.6566666942 Koeficient determinace R^2 : 0.4312111473 Predikovaný korelační koeficient Rp : 0.28419124 Střední kvadratická chyba predikce MEP : 0.06840856181 Akaikeho informační kritérium : -48.41889882 Analýza klasických reziduí Reziduální součet čtverců : 0.9784463841 Průměr absolutních reziduí : 0.1998198741 Reziduální směr. odchylka : 0.247291122 Reziduální rozptyl : 0.06115289901 Šikmost reziduí : 0.02920146146 Špičatost reziduí : 1.843327626 Testování regresního tripletu Fisher-Snedecorův test významnosti modelu Hodnota kritéria F : 12.12994651 Kvantil F (1-alfa, m-1, n-m) : 4.493998478 Pravděpodobnost : 0.003073133113 Model je významný Scottovo kritérium multikolinearity Hodnota kritéria SC : 18.01108349 Model je nekorektní! Cook-Weisbergův test heteroskedasticity Hodnota kritéria CW : 0.714791117 Kvantil Chi^2(1-alfa,1) : 3.841458829 Pravděpodobnost : 0.3978578508 Rezidua vykazují homoskedasticitu. Jarque-Berrův test normality Hodnota kritéria JB : 1.091022621 Kvantil Chi^2(1-alfa,2) : 5.991464547 Pravděpodobnost : 0.5795453801 Rezidua mají normální rozdělení. Waldův test autokorelace Hodnota kritéria WA : 0.001211745305 Kvantil Chi^2(1-alfa,1) : 3.841458829 Pravděpodobnost : 0.3978578508 Autokorelace je nevýznamná 12

Durbin-Watsonův test autokorelace Hodnota kritéria DW : 1.848780164 Rezidua nejsou autokorelována Znaménkový test reziduí Hodnota kritéria Sg : 1.214781645 Kvantil N(1-alfa/2) : 1.959963999 Pravděpodobnost : 0.2244493833 V reziduích není trend. Odstínový úhel [h o ]= -47,384 (+19,539) + 3,662 (+1,051). Celkové Fe [x] Závěr: Na základě testu modelu byl model určen jako významný, ale testem na multikolinearitu byl model opět určen jako nekorektní, i když číslo podmíněnosti K a VIF faktor multikolinearitu neprokazují. Jednotlivé parametry regresní přímky byly určeny jako významné. Znaménkovým testem nebyl určen trend v reziduích, což detekuje, že navržený model je zcela v pořádku z grafických diagnostik tento závěr je taká zcela patrný, protože rezidua jsou náhodně uspořádána. 13

1.4 Porovnání modelů 1.4.1 Společný lineární model Obr.I - 20 1.4.1.1 Regresní diagnostika Název úlohy : Společný model Hladina významnosti : 0.05 Kvantil t(1-alfa/2,n-m) : 2.05552943864224 Kvantil F(1-alfa,m,n-m) : 4.22520127312487 Absolutní člen : Ano Počet platných řádků : 28 Počet parametrů : 2 Metoda : Nejmenší čtverce Transformace : Bez transformace Základní analýza Charakteristiky proměnných Proměnná Průměr Směr.Odch. Kor.vs.Y Významnost Fe 18.52392857 0.188470241 0.7647580418 2.152412E-006 Analýza rozptylu Průměr Y : 20.4875 Zdroj Součet čtverců Průměrný čtverec Rozptyl Celková variabilita 4.390925 0.15681875 0.1626268519 Variabilita vysvětlená modelem 2.568053837 0.09171620847 0.09511310508 Reziduální variabilita 1.822871163 0.06510254153 0.06751374677 Hodnota kritéria F : 36.62869934 Kvantil F (1-alfa, m-1, n-m) : 4.225201273 Pravděpodobnost : 2.152412581E-006 Model je významný 14

Odhady parametrů Proměnná Odhad Směr.Odch. Závěr Pravděpodobnost Abs -9.824213801 5.008658457 Nevýznamný 0.06061823008 Fe Spodní mez Horní mez -20.11965871 0.4712311052 Odhad Směr.Odch. Závěr Pravděpodobnost 1.636354496 0.2703750703 Významný 2.152412581E-006 Spodní mez Horní mez 1.08059058 2.192118412 Statistické charakteristiky regrese Vícenásobný korelační koeficient R : 0.7647580418 Koeficient determinace R^2 : 0.5848548625 Predikovaný korelační koeficient Rp : 0.5337231333 Střední kvadratická chyba predikce MEP : 0.07312095538 Akaikeho informační kritérium : -72.49016732 Analýza klasických reziduí Reziduální součet čtverců : 1.822871163 Průměr absolutních reziduí : 0.2187984108 Reziduální směr. odchylka : 0.2647837407 Reziduální rozptyl : 0.07011042934 Šikmost reziduí : 0.01402913843 Špičatost reziduí : 1.910871907 Testování regresního tripletu Fisher-Snedecorův test významnosti modelu Hodnota kritéria F : 36.62869934 Kvantil F (1-alfa, m-1, n-m) : 4.225201273 Pravděpodobnost : 2.152412581E-006 Model je významný Scottovo kritérium multikolinearity Hodnota kritéria SC : 40.47597031 Model je nekorektní! Cook-Weisbergův test heteroskedasticity Hodnota kritéria CW : 1.405930352 Kvantil Chi^2(1-alfa,1) : 3.841458829 Pravděpodobnost : 0.2357331545 Rezidua vykazují homoskedasticitu. 15

Jarque-Berrův test normality Hodnota kritéria JB : 1.449369316 Kvantil Chi^2(1-alfa,2) : 5.991464547 Pravděpodobnost : 0.4844773208 Rezidua mají normální rozdělení. Waldův test autokorelace Hodnota kritéria WA : 1.373763261 Kvantil Chi^2(1-alfa,1) : 3.841458829 Pravděpodobnost : 0.2357331545 Autokorelace je nevýznamná Durbin-Watsonův test autokorelace Hodnota kritéria DW : 1.517871027 Rezidua nejsou autokorelována Znaménkový test reziduí Hodnota kritéria Sg : 0.5777466649 Kvantil N(1-alfa/2) : 1.959963999 Pravděpodobnost : 0.5634351687 V reziduích není trend. 16

1.4.2 Test shody dvou lineárních modelů Vzhledem k tomu, že absolutní člen u společného modelu vyšel nevýznamný, tak jsem k dalšímu porovnání použil hodnot modelu bez absolutního členu. Z následujícího obrázku není zcela zjevné, že oba soubory dat mají shodné rozptyly, a tak tato shoda byla ověřena F- testem (byl použit stat. program ADSTAT), takže k testování Chowowým testem bude postačující Fisherovo-Snedecorovo rozdělení s m a n-2m stupni volnosti. Fisher-Snedecor F-test: Počet stupňů volnosti v 1 9 v 2 17 Tabulkový kvantil F(1-alfa/2, v 1, v 2 ) 2.9849 F-statistika 1.1670 Závěr: Rozptyly se považují za shodné Vypočtená hladina významnosti 0.374 Jacknife F-test Počet stupňů volnosti v 1 2 v 2 26 Tabulkový kvantil F(1-alfa/2, v 1, v 2 ) 4.2655 F-statistika 1.7327E-01 Závěr Rozptyly se považují za shodné Vypočtená hladina významnosti 0.842 21.4 Porovnání modelů Provozní pec Laboratorní pec Společný Lineární (Laboratorní pec) Lineární (Provozní pec) Lineární (Společný) 21.2 21 20.8 20.6 h o 20.4 20.2 20 19.8 19.6 19.4 17.9 18 18.1 18.2 18.3 18.4 18.5 18.6 18.7 18.8 18.9 19 Celk. Fe 17

Testační kritérium: F c (RSC RSC1 RSC 2)(n 2m) = = 11.350 (RSC1 + RSC 2)(m) Hodnoty: m = 2; n = 28; n 1 = 10; n 2 = 18 b 11 = 1.0948 (+0.0017) RSC 1 = 0.09701 b 02 = -47.384 (+19.538) b 12 = 3.662 (+1.051) RSC 2 = 0.9784 σ = 0.10382 1 σ = 0.2472 2 b 13 = 1.1060 (+0.0022) RSC = 2.0926 Kvantil F-rozdělení F 0.95 (2,24) = 3.403 (určeno z tabulek) je nižší než Fc, a je tedy nutno nulovou hypotézu o shodě parametrů dvou lineárních modelů zamítnout. 1.5 Závěr 1.5.1 Statistický Porovnáním těchto dvou lineárních modelů bylo prokázáno, že se závislost odstínového úhlu a celkového Fe ve skalici se statisticky výrazně liší pro provozní a laboratorní pec. 1.5.2 Aplikační Na základě zjištění neshody lineárních modelů je nutno k modelování provozních situací, které ovlivňují optické parametry pigmentů na laboratorní peci, přistupovat velmi obezřetně, z důvodů právě zjištěné skutečnosti rozdílnosti modelů. Jak již bylo uvedeno, při hodnocení dat pro laboratorní pícku je nutné provést ještě několik měření (při shodných podmínkách), a následné opětovné porovnání obou modelů. Poznámka: Data byla také hodnocena programem ADSTAT ve kterém vycházejí oba jednotlivé modely na základě Scottova kritéria multikolinearity M jako korektní. 18

2 Validace nové analytické metody 2.1 Úkol 3 V provozní laboratoři se měří množství PO 4 (jako množství P 2 O 5 mg/l) ve vodě, která je určena pro parní kotel. Analýza se provádí tzv. žlutou kolorimetrií, při které se měří absorbance žlutého fosformolybdenanového komplexu. Vzhledem k časové náročnosti a stáří přístroje bylo navrhnuto tuto metodu nahradit novou, která je podstatně méně časově náročná a jejíž princip spočívá v porovnání vybarveného komplexu s definovanou škálou etalonů - PALINTEST. Je nutné prověřit výsledky obou metod před zavedením do praxe. 2.2 Zpracovávaná data K hodnocení jsem použil statistický program QCExpert K dispozici bylo 37 vzorků, které byly proměřeny oběma metodami.. Tabulka II. [x obsah P 2 O 5 (mg/l) - kolorimetricky]; [y - obsah P 2 O 5 (mg/l) - PALINTEST ] x y x y 0.85 1 3.1 3 1.8 2 16.8 18 4.2 5 5.05 5 1.95 2 6.15 6 2.6 3 8.65 9 6.25 6 7.55 8 7.95 8 6.75 7 9.1 9 4.95 5 2.05 2 6.05 6 4.95 5 8.6 9 5.6 6 15.4 16 7.85 8 11.5 12 7.25 7 9.6 10 5.1 5 4.1 5 2.95 3 7.8 8 4.45 5 8.6 9 7.65 8 7.65 8 8.5 9 7.85 9 9.1 10 - - 19

2.3 Lineární regresní model Nejprve byla u dat provedena regresní diagnostika na odhalení vlivných bodů. Obr. II. 1 Obr. II. - 2 Obr. II. 3 Obr. II. - 4 Na základě grafických diagnostik bylo určeno pět vlivných bodů (3, 13, 21, 33 O; 30, 37 - E ). Tyto body byly detekovány i numerickým hodnocení pomocí Atkinsonovy vzdálenosti, Andrews- Pregibonovy diagnostiky. Pro další hodnocení modelu jsem z dat odstranil pouze odlehlé body 3, 13, 21, 33. Extrémy (30, 37) jsem v datech ponechal. Odstranění vlivných bodů jsem provedl, protože při vlastním stanovením jde pouze o subjektivní srovnání vybarvení roztoku s řadou etalonů. Dalším zdůvodněním odstranění těchto bodů je i to, že analýzu jednotlivých vzorků prováděli tři laborantky, u kterých by bylo nejprve nutno provést tes opakovatelnosti a reprodukovatelnosti výsledků pomocí statistického modelu ANOVA. 20

Po odstranění odlehlých hodnot je patrné z příslušných grafů, že se jedná o dobrý lineární model. Obr. II. 5 Obr. II. - 6 Obr. II. 7 Obr. II. - 8 Obr. II. 9 Obr. II. - 10 21

2.3.1 Regresní diagnostika Název úlohy : Validace nové metody Hladina významnosti : 0.05 Kvantil t(1-alfa/2,n-m) : 2.03951344639575 Kvantil F(1-alfa,m,n-m) : 4.15961509802907 Absolutní člen : Ano Počet platných řádků : 33 Počet parametrů : 2 Metoda : Nejmenší čtverce Transformace : Bez transformace Analýza rozptylu Průměr Y : 6.727272727 Zdroj Součet čtverců Průměrný čtverec Rozptyl Celková variabilita 334.5454545 10.13774105 10.45454545 Variabilita vysvětlená modelem 332.1361564 10.06473201 10.37925489 Reziduální variabilita 2.409298124 0.07300903406 0.07529056638 Hodnota kritéria F : 4273.535411 Kvantil F (1-alfa, m-1, n-m) : 4.159615098 Pravděpodobnost : 8.799953107E-035 Model je významný Odhady parametrů Proměnná Odhad Směr.Odch. Závěr Pravděpodobnost Abs -0.04746194044 0.1144331982 Nevýznamný 0.6811763297 Spodní mez Horní mez -0.2808499869 0.1859261061 Odhad Směr.Odch. Závěr Pravděpodobnost x 1.044946221 0.01598454529 Významný 0 Spodní mez Horní mez 1.012345526 1.077546916 Statistické charakteristiky regrese Vícenásobný korelační koeficient R : 0.9963926403 Koeficient determinace R^2 : 0.9927982937 Predikovaný korelační koeficient Rp : 0.9921092721 Střední kvadratická chyba predikce MEP : 0.07999415636 Akaikeho informační kritérium : -82.36667901 22

Analýza klasických reziduí Reziduální součet čtverců : 2.409298124 Průměr absolutních reziduí : 0.1969941271 Reziduální směr. odchylka : 0.2787818041 Reziduální rozptyl : 0.07771929432 Šikmost reziduí : 0.6573599065 Špičatost reziduí : 4.41600912 Testování regresního tripletu Fisher-Snedecorův test významnosti modelu Hodnota kritéria F : 4273.535411 Kvantil F (1-alfa, m-1, n-m) : 4.159615098 Pravděpodobnost : 8.799953107E-035 Model je významný Scottovo kritérium multikolinearity Hodnota kritéria SC : 4273.707434 Model je nekorektní! Cook-Weisbergův test heteroskedasticity Hodnota kritéria CW : 0.2587777247 Kvantil Chi^2(1-alfa,1) : 3.841458829 Pravděpodobnost : 0.6109611204 Rezidua vykazují homoskedasticitu. Jarque-Berrův test normality Hodnota kritéria JB : 6.372466998 Kvantil Chi^2(1-alfa,2) : 5.991464547 Pravděpodobnost : 0.04132723724 Rezidua nemají normální rozdělení! Waldův test autokorelace Hodnota kritéria WA : 0.6941351788 Kvantil Chi^2(1-alfa,1) : 3.841458829 Pravděpodobnost : 0.6109611204 Autokorelace je nevýznamná Durbin-Watsonův test autokorelace Hodnota kritéria DW : 1.397045734 Rezidua jsou pozitivně autokorelována! Znaménkový test reziduí Hodnota kritéria Sg : 1.410882485 Kvantil N(1-alfa/2) : 1.959963999 Pravděpodobnost : 0.1582792675 V reziduích není trend. 23

Podstatou validace nové metody je lineární model y = b 0 + b 1 x s nulovým úsekem b 0 = 0 a jednotkovou směrnicí b 1 = 1. Proměnná Odhad Směr.Odch. b 0-0.04746194044 0.1144331982 b 1 1.044946221 0.01598454529 Kvantil t(1-alfa/2,n-m) : 2.03951344639575 Vztah pro interval spolehlivosti: b 0 t 1-α/2. D ( b0) b 0 b 0 + t 1-α/2. D( b0) Pak pro úsek : -0.28084 b 0 0.18592 Pak pro směrnici : 1.0123 b 1 1.07754 2.4 Závěr 2.4.1 Statistický Interval spolehlivosti pro úsek obsahuje nulu, a tudíž nelze úsek b 0 považovat za významně odchýlený od nuly. Interval spolehlivosti pro směrnici neobsahuje jedničku (tudíž lze říci, že nová metoda mírně nadhodnocuje a bylo by nutno použít opravný koeficient 1 / b 1 ), ale odchylka od jedničky je minimální a vzhledem k tomu, že se v podstatě jedná o porovnání objektivního a subjektivního měření je to nad očekávání dobré, protože lineární regrese je strašně přísná a je možné, že párové porovnání výsledků by to prohlásilo za shodné bez problémů. 2.4.2 Aplikační Na základě statistického závěru byla nová analytická metoda pro kontrolu obsahu P 2 O 5 v kotelní vodě shledána za způsobilou i díky tomu, že naměřené hodnoty jsou hluboko pod vnitropodnikovou normou max. 50 mg/l. 24

3 Lineární regrese polynomem 3.1 Úkol K řízení kalcinačního režimu při výrobě železitých červení je důležitý parametr stupeň rozkladu, který je sledován třikrát za směnu v analytické laboratoři provozu. Pro kontinuální sledování tohoto režimu jsem navrhl vypracovat metodiku kontinuálního sledování tohoto parametru na základě závislosti obsahu Fe 2+ (g/l) a měrná vodivosti (ms/cm) suspenze rozplaveného kalcinátu za určitých zjednodušujících fyzikálních podmínek týkající se vodivosti doprovodných iontů. 3.2 Zpracovávaná data K hodnocení jsem použil statistický program QCExpert K dispozici bylo 29 naměřených hodnot Tabulka III. [x měrná vodivost (ms/cm)]; [y obsah Fe 2+ (g/l) ] x y x y 10.5 3.4 11.3 3.8 11.6 4.1 10.0 3.5 11.8 4.8 11.2 4.3 11.4 4.6 11.8 3.9 11.2 4.2 12.6 5.0 11.2 3.9 12.9 5.1 12.0 5.2 11.5 3.7 11.2 4.2 11.2 4.6 11.8 5.2 11.1 4.2 11.6 4.1 11.1 4.2 11.3 3.7 9.2 3.6 11.7 4.0 10.4 3.6 11.5 4.0 10.6 4.1 9.8 3.0 17.1 11.6 12.3 5.0 25

3.3 Nalezení stupně polynomu Pro nalezení optimálního stupně polynomu n byla použita MNČ a při výpočtu byl měněn stupeň polynomu a sledována hodnota MEP a AIC, která musí být pro optimální n co nejmenší MEP má větší váhu než AIC. 3.3.1 Stupeń polynomu 2 Proměnná Odhad Směr.Odch. Závěr Abs 12.08728569 2.943611528 Významný x -2.021398535 0.4550906426 Významný x^2 0.1164900226 0.01728945894 Významný Vícenásobný korelační koeficient R : 0.9714210667 Koeficient determinace R^2 0.9436588889 Predikovaný korelační koeficient Rp : 0.923066762 Střední kvadratická chyba predikce MEP : 0.1649701103 Akaikeho informační kritérium : -55.29163033 3.3.2 Stupeń polynomu 3 Proměnná Odhad Směr.Odch. Závěr Abs 8.62241866 26.54583285 Nevýznamný x -1.174492699 6.463588783 Nevýznamný x^2 0.04900847041 0.513993357 Nevýznamný x^3 0.001744260495 0.01327786618 Nevýznamný Vícenásobný korelační koeficient R : 0.9714410704 Koeficient determinace R^2 : 0.9436977533 Predikovaný korelační koeficient Rp : -2.91758346 Střední kvadratická chyba predikce MEP : 8.400584613 Akaikeho informační kritérium : -53.31164158 3.3.3 Stupeń polynomu 4 Proměnná Odhad Směr.Odch. Závěr Abs 288.9375975 276.2673226 Nevýznamný x -95.00736115 92.27694803 Nevýznamný x^2 11.66713231 11.40902054 Nevýznamný x^3-0.6279898078 0.6179156487 Nevýznamný x^4 0.01258173416 0.01234276264 Nevýznamný Vícenásobný korelační koeficient R : 0.9726429142 Koeficient determinace R^2 : 0.9460342385 Predikovaný korelační koeficient Rp : 0.9157145326 Střední kvadratická chyba predikce MEP : 0.180735703 Akaikeho informační kritérium : -52.5407962 26

3.3.4 Stupeń polynomu 5 Proměnná Odhad Směr.Odch. Závěr Abs 1040.040897 3382.876328 Nevýznamný x -416.3327322 1445.246599 Nevýznamný x^2 66.13747621 244.7514197 Nevýznamný x^3-5.198235378 20.52191307 Nevýznamný x^4 0.2022003205 0.8511413442 Nevýznamný x^5-0.003108514014 0.01395166594 Nevýznamný Vícenásobný korelační koeficient R : 0.972702629 Koeficient determinace R^2 : 0.9461504044 Predikovaný korelační koeficient Rp : -61.69261888 Střední kvadratická chyba predikce MEP : 134.4335494 Akaikeho informační kritérium : -50.60328846 3.3.5 Stupeń polynomu 6 Proměnná Odhad Směr.Odch. Závěr Abs 82966.67139 49783.02806 Nevýznamný x -42856.7854 25769.29834 Nevýznamný x^2 9164.946289 5521.284019 Nevýznamný x^3-1038.153687 626.5209336 Nevýznamný x^4 65.66436005 39.69226459 Nevýznamný x^5-2.197595417 1.330361283 Nevýznamný x^6 0.0303795191 0.01841588912 Nevýznamný Vícenásobný korelační koeficient R : 0.9728661866 Koeficient determinace R^2 : 0.9464686171 Predikovaný korelační koeficient Rp : -1700.914308 Střední kvadratická chyba predikce MEP : 3649.462812 Akaikeho informační kritérium : -48.77516607 3.3.6 Závěr Optimální stupeň polynomu je n = 2 kdy je MEP a AIC mají nejmenší hodnoty. Model však vykazuje multikolinearitu a není tedy možno použít metodu MNČ, ale metodu MRH. 27

3.4 Metoda racionálních hodností korekce hodností Název úlohy : Lineární regrese polynomem Hladina významnosti : 0.05 Kvantil t(1-alfa/2,n-m) : 2.05552943864224 Kvantil F(1-alfa,m,n-m) : 3.36901635949544 Absolutní člen : Ano Počet platných řádků : 29 Počet parametrů : 3 Metoda : Korekce hodnosti omezení=0.6931 Transformace : Polynom 2. stupně Odhady parametrů Proměnná Odhad Směr.Odch. Závěr Pravděpodobnost Abs 12.03172749 5.852241363 Významný 0.04995981532 Spodní mez Horní mez 0.002273089146 24.0611819 x Odhad Směr.Odch. Závěr Pravděpodobnost -2.381100145 0.9130430043 Významný 0.01489683678 Spodní mez Horní mez -4.257886919-0.5043133715 x^2 Odhad Směr.Odch. Závěr Pravděpodobnost 0.1467229543 0.03588570501 Významný 0.0003709132344 Spodní mez Horní mez 0.07295883127 0.2204870774 Statistické charakteristiky regrese Vícenásobný korelační koeficient R : 0.8816508088 Koeficient determinace R^2 : 0.7773081487 Predikovaný korelační koeficient Rp : 0.7536591459 Střední kvadratická chyba predikce MEP : 0.5282356355 Akaikeho informační kritérium : -15.43505986 28

Testování regresního tripletu Fisher-Snedecorův test významnosti modelu Hodnota kritéria F : 45.37663088 Kvantil F (1-alfa, m-1, n-m) : 3.369016359 Pravděpodobnost : 3.312502639E-009 Model je významný Scottovo kritérium multikolinearity Hodnota kritéria SC : 13.87230002 Model je nekorektní! Cook-Weisbergův test heteroskedasticity Hodnota kritéria CW : 58.59443559 Kvantil Chi^2(1-alfa,1) : 3.841458829 Pravděpodobnost : 1.942890293E-014 Rezidua vykazují heteroskedasticitu! Jarque-Berrův test normality Hodnota kritéria JB : 36.6891179 Kvantil Chi^2(1-alfa,2) : 5.991464547 Pravděpodobnost : 1.079093992E-008 Rezidua nemají normální rozdělení! Waldův test autokorelace Hodnota kritéria WA : 0.3363791917 Kvantil Chi^2(1-alfa,1) : 3.841458829 Pravděpodobnost : 1.942890293E-014 Autokorelace je nevýznamná Durbin-Watsonův test autokorelace Hodnota kritéria DW : 1.271659502 Rezidua jsou pozitivně autokorelována! Znaménkový test reziduí Hodnota kritéria Sg : 1.67257437 Kvantil N(1-alfa/2) : 1.959963999 Pravděpodobnost : 0.09441111596 V reziduích není trend. 29

3.5 Závěr 3.5.1 Statistický U dat nebyla vyšetřena diagnostika na odhalení vlivných bodů, protože při jejich odstranění by mohlo dojít k narušení polynomické závislosti. (diagnostika by se musela provádět pro každý model zvlášť). Pro hledanou závislost byl nalezen polynomický model ve tvaru: Fe 2+ = 12.0317 (+ 5.8522) 2.3811 (+ 0.913). vodivost (x) + 0.1467 (+ 0.0358). vodivost 2 (x 2 ) Model byl na základě testů určen jako významný, ale Scottový testem na multikolinearitu byl model označen jako nekorektní, i když multikolinearita byly detekována pouze VIF faktorem (76.919). 3.5.2 Aplikační Na základě zjištěné závislosti byla zhotovena tabulka závislosti stupně rozkladu na vodivosti, kterou obsluha kalcinační pece používá k řízení kalcinačního režimu při výrobě železitých pigmentů. Je nutno však podotknout, že při změně suroviny se tato závislost podstatně změní, protože dojde ke změně prvkového složení suroviny. 30

4 Vícerozměrný Lineární regresní model 4.1 Úkol Pro koncového zákazníka je jedním z nejdůležitějších parametrů pigmentu Barva a její číselné hodnoty. Vzhledem k technologii výroby železitých pigmentů je možno barevné parametry převážně ovlivnit pouze při kalcinaci. Na základě této skutečnosti jsem si vybral k hodnocení vliv parametrů, sledovaných při kalcinaci na sytost C* pigmentové suspenze kalcinátu. 4.2 Zpracovávaná data K hodnocení jsem použil statistický program QCExpert K dispozici bylo 50 naměřených vzorků (řádků) Tabulka IV. [x 1 stupeň rozkladu (%)];[x 2 otáčky pece (s)]; [x 3 teplota kalcinátu ( o C)]; [y C* - sytost suspenze (-) ] y x 1 x 2 x 3 y x 1 x 2 x 3 18.01 93.30 360 880 15.54 96.40 355 890 18.28 94.70 360 880 15.57 97.00 355 890 17.06 94.40 360 870 18.75 94.20 355 880 17.53 94.80 370 870 15.52 96.40 355 880 17.22 96.20 370 890 17.43 97.00 355 880 18.01 96.50 370 890 15.97 96.20 355 880 17.97 96.60 370 890 17.35 96.10 350 880 16.43 96.20 370 890 16.55 95.90 350 880 16.53 95.90 350 890 19.03 96.30 350 890 19.48 95.40 350 880 20.62 93.08 350 870 19.66 95.90 350 880 16.65 95.00 350 880 17.10 96.20 350 880 17.39 95.65 350 870 17.55 96.00 350 890 18.43 96.00 350 880 14.83 96.40 350 880 17.76 96.90 350 880 16.79 95.90 350 880 17.07 96.10 350 880 17.75 95.90 350 880 16.30 95.80 350 880 17.41 97.10 350 890 16.40 96.50 355 890 17.88 95.60 350 890 16.15 96.40 355 890 18.57 95.20 350 890 16.12 95.50 355 880 18.38 95.40 350 890 16.07 95.90 355 880 19.14 94.40 350 880 19.62 95.50 350 880 15.71 95.95 350 880 17.67 94.60 350 880 17.66 97.00 355 880 16.53 95.30 350 880 15.56 97.10 355 870 16.85 95.80 350 880 15.32 97.10 355 890 17.19 95.00 350 870 31

4.3 Lineární regresní model Nejprve byla provedena diagnostika vlivných hodnot Obr. IV. 1 Obr. IV. - 2 Obr. IV. 3 Obr. IV. - 4 Obr. IV. 5 Obr. IV. - 6 Na základě těchto grafických diagnostik jsou řádky 1, 4, 5, 6, 7, 8, 24, 35 označeny jako extrémy, ale tyto extrémy z dat vyloučeny nebudou. Zobrazení Wiliamsova grafu zobrazilo řádky 10, 11, 14, 34 jako odlehlé, tak tuto skutečnost ostatní grafické diagnostiky nepotvrdily. 32

4.3.1 Regresní diagnostika Obr. IV. 7 Obr. IV. - 8 Obr. IV. 9 Obr. IV. - 10 Název úlohy : Vícenásobná lineární regrese Hladina významnosti : 0.05 Kvantil t(1-alfa/2,n-m) : 2.01289559891854 Kvantil F(1-alfa,m,n-m) : 2.80684492880651 Absolutní člen : Ano Počet platných řádků : 50 Počet parametrů : 4 Metoda : Nejmenší čtverce Základní analýza Charakteristiky proměnných Proměnná Průměr Směr.Odch. Kor.vs.Y Významnost St.r (%) 95.7936 0.9160847479-0.4985230622 0.0002291278 otáčky pece [s] 353.9 6.168550916-0.08857385485 0.5407530475 teplota kalcinátu 882 6.38876565-0.1071902244 0.4587436123 33

Indikace multikolinearity Proměnná Vlas. čísla kor. m. Podmíněnost kappa VI faktor Vícenás. kor. Abs 0.5518957211 1 1 0 St.r (%) 1 1.811936498 1.23212513 0.434043919 otáčky pece [s] 0.9678811392 1.753739162 1.02696949 0.162053204 teplota kalcinátu 1.48022314 2.682070332 1.26160040 0.455363583 Analýza rozptylu Průměr Y : 17.2872 Zdroj Součet čtverců Průměrný čtverec Rozptyl Celková variabilita 79.047208 1.58094416 1.613208327 Variabilita vysvětlená modelem 21.3530437 0.4270608739 0.4357764019 Reziduální variabilita 57.6941643 1.153883286 1.177431925 Hodnota kritéria F : 5.674981874 Kvantil F (1-alfa, m-1, n-m) : 2.806844929 Pravděpodobnost : 0.002154853273 Model je významný Odhady parametrů Proměnná Odhad Směr.Odch. Závěr Pravděpodobnost Abs 71.60304754 2 4.19790827 Významný 0.00486233423 Spodní mez Horní mez 22.89518449 20.3109106 St.r Odhad Směr.Odch. Závěr Pravděpodobnost -0.774731361 0.1938566679 Významný 0.00023045560 Spodní mez Horní mez -1.164944595-0.3845181273 otáčky pece Odhad Směr.Odch. Závěr Pravděpodobnost -0.01743954325 0.02628358524 Nevýznamný 0.5103128274 Spodní mez Horní mez -0.0703456563 0.0354665698 teplota kal. Odhad Směr.Odch. Závěr Pravděpodobnost 0.02955817792 0.02812761698 Nevýznamný 0.2988125349 Spodní mez Horní mez -0.02705977852 0.08617613435 34

Statistické charakteristiky regrese Vícenásobný korelační koeficient R : 0.5197405802 Koeficient determinace R^2 : 0.2701302707 Predikovaný korelační koeficient Rp : 0.1537598136 Střední kvdratická chyba predikce MEP : 1.337858481 Akaikeho informační kritérium : 15.15665122 Analýza klasických reziduí Reziduální součet čtverců : 57.6941643 Průměr absolutních reziduí : 0.907962787 Reziduální směr. odchylka : 1.11992007 Reziduální rozptyl : 1.254220963 Šikmost reziduí : 0.1387352775 Špičatost reziduí : 2.214301115 Testování regresního tripletu Fisher-Snedecorův test významnosti modelu Hodnota kritéria F : 5.674981874 Kvantil F (1-alfa, m-1, n-m) : 2.806844929 Pravděpodobnost : 0.002154853273 Model je významný Scottovo kritérium multikolinearity Hodnota kritéria SC : 8.757303058 Model je nekorektní! Cook-Weisbergův test heteroskedasticity Hodnota kritéria CW : 0.114675581 Kvantil Chi^2(1-alfa,1) : 3.841458829 Pravděpodobnost : 0.7348825792 Rezidua vykazují homoskedasticitu. Jarque-Berrův test normality Hodnota kritéria JB : 2.442216351 Kvantil Chi^2(1-alfa,2) : 5.991464547 Pravděpodobnost : 0.2949031812 Rezidua mají normální rozdělení. Waldův test autokorelace Hodnota kritéria WA : 0.3828417415 Kvantil Chi^2(1-alfa,1) : 3.841458829 Pravděpodobnost : 0.7348825792 Autokorelace je nevýznamná Durbin-Watsonův test autokorelace Hodnota kritéria DW : 1.792277523 Rezidua nejsou autokorelována 35

Znaménkový test reziduí Hodnota kritéria Sg : 0.7041536742 Kvantil N(1-alfa/2) : 1.959963999 Pravděpodobnost : 0.4813370771 V reziduích není trend. 4.4 Závěr 4.4.1 Statistický Pro hledanou závislost byl nalezen lineární model ve tvaru: C* = 71.603 (+ 4,1979) 0.7747 (+ 0.1938). st.r (x 1 ) 0.0174 (+ 0.0262). otáčky pece (x 2 ) 0.0295 (+ 0.0281). teplota kalcinátu (x 3 ) Jako významné byly určeny pouze parametry absolutní člen a stupeň rozkladu. Ostatní parametry modelu (otáčky kalcinační pece a teplota kalcinátu) byly určeny jako nevýznamné a opravený model má tvar C* = 83.458 (+ 16.618) 0.6911 (+ 0.1734). st.r (x 1 ) Model byl na základě testů určen jako významný, ale Scottový testem na multikolinearitu byl model označen jako nekorektní, i když multikolinearita nebyla detekována VIF faktorem ani číslem podmíněnosti K. 4.4.2 Aplikační Statistickým hodnocením byly parametry (otáčky pece a teplota kalcinátu) určeny jako nevýznamné, ale z hlediska chemizmu jsou tyto parametry důležité, protože charakterizují dobu zdržení materiálu v peci a energii dodanou chemickému rozkladu - a tudíž mají vliv na stupeň rozkladu. Tyto poznatky nebyly ani zcela detekovány analýzou párových korelací. Nevýznamnost těchto parametrů je pravděpodobně způsobena špatným odečtem příslušných hodnot v době odběru vzorku. 36

5 Lineární kalibrační model 5.1 Úkol V provozní laboratoři se provádí kolorimetrické stanovení obsahu Fe 2+ v napájecí vodě pro parní kotel. K tomuto stanovení se využívá měření absorbance roztoku po přídavku a výpočtu příslušné koncentrace na základě kalibrační křivky.tato kalibrační křivka se zhotovuje z 10-ti měření roztoků různé koncentrace, které se připravují ze standardního roztoku Mohrovy soli. Úkolem je sestrojení kalibračního modelu a zjištění koncentrací Fe 2+ ve čtyřech neznámých vzorcích. Absorbance neznámých vzorků: A 1 = 0.0212, A 2 = 0.0689, A 3 = 0.1252, A 4 = 0.0986 5.2 Data pro kalibrační model K hodnocení jsem použil statistický program ADSTAT- Lineární diagnostika, Kalibrace K dispozici bylo 10 naměřených hodnot Tabulka V. [x koncentrace Fe 2+ (mg/l)]; [y Absorbance (-) ] x y 0.005 0.008 0.01 0.0185 0.015 0.0278 0.025 0.047 0.03 0.052 0.035 0.065 0.045 0.0825 0.05 0.0925 0.055 0.1002 0.06 0.1125 37

5.3 Regresní diagnostika Regresní diagnostika spočívá v určení vlivných a odlehlých hodnot. Obr. V. 1 Obr. V. 2 Obr. V. 3 Obr. V. 4 Na základě těchto grafických diagnostik jsem určil bod č.5 jako odlehlý. Bod č.10 se je podezřelý z vlivu a na základě hodnocení pomocí L-R grafu je identifikován jako odlehlý. ostatní grafické diagnostiky bod č.10 jako odlehlý nevykazují. Numerickým hodnocením byl určen jako odlehlý pouze bod č.5. Pro další šetření kalibrační křivky jsem bod č.5 odstranil, i když je zde porušeno pravidlo o počtu minimálním hodnot. Metoda nejmenších čtverců MNČ odhady parametrů Parametr Odhad s Kvantil t H 0 : β = 0 Abs. -0.000808 0.000955-0.84584 Akceptována x 1.8609 0.025320 73.492 Zamítnuta Počáteční podmínky: Omezení P = 1.10-34 (MNČ) na hladině významnosti α = 0,05 Tabulkové kvantily : t (1-α/2,n-m) = 2.306 χ 2 (1-α,m) = 5.991 y = -0.000808( 0.000955) + 1.8609( 0.02532)x 38

5.4 Kalibrace Obr.V. 5 kalibrační přímka Určení statistických charakteristik proměnných (hladina významnosti α = 0,05) Proměnná Průměr Směrodatná odchylka x 0.03333 0.02046 y 0.06155 0.03803 Určení parametrů kalibrace (H 0 : β j = 0 vs. H A : β j <>0) Parametr Odhad Směrodatná odchylka H 0 úsek -0.0003731 0,00066954 Akceptována směrnice 1.8579 0.01738 Zamítnuta Analýza reziduí Reziduální součet čtverců RSC 7.0869.10-6 Odhad reziduálního rozptylu s 2 (e) 1.0124.10-6 Odhad sm. odchylky reziduí s (e) 1.0062.10-3 39

Určení kalibračních mezí Kritická úroveň y c 0.0012 x c 0.00085 Limita detekce y d 0.0027 x d 0.00167 Mez stanovitelnosti y s 0.0120 x s 0.00670 Kalibrační tabulka Absorbance Odhad c[mg/l] L D L H 0.0212 0.0116 1.0179.10-2 1.3045.10-2 0.0689 0.0373 3.5934.10-2 3.8639.10-2 0.1252 0.0676 6.6042.10-2 6.9138.10-2 0.0986 0.0053 5.1852.10-2 5.4693.10-2 5.5 Závěr 5.5.1 Statistický Jako významná byla určena pouze směrnice přímky a nalezená kalibrační závislost má pak tvar: y = 1.8579 (+ 0.017384). x Přímkový kalibrační model, má limitu detekce y d = 0.0027 a x d = 0.00167. Z čehož vyplívá, že minimální koncentrace, která jde odlišit od šumu je 0.001672 mg/l a odpovídající úroveň signálu (absorbance) 0.0027. 5.5.2 Aplikační Takto stanovená kalibrační přímka je jednoduše použitelná pro laboratorní stanovení obsahu Fe 2+ v napájecí vodě pro parní kotel. Bylo dohodnuto, že stanovení kalibrační přímky se bude opakovat každý měsíc, aby tím se vyloučily a detekovaly případné poruchy přístroje. 40

6 Nelineární kalibrační model 6.1 Úkol Stanovení p-dichlorbenzenu v chlorbenzenu se provádí metodou plynové chromatografie na vnitřní standard toluen. Proměřením kalibračních roztoků byla získána nelineární závislost poměru ploch p-dichlorbenzenu a vnitřního standardu na procentickém obsahu p-dichlorbenzenu. Odezvy neznámých vzorků: n 1 = 0.024, n 2 = 0.048, n 3 = 0.056 6.2 Data pro kalibrační model K hodnocení jsem použil statistický program ADSTAT- Lineární diagnostika, Kalibrace kvadratický spline K dispozici bylo 12 naměřených hodnot Tabulka V. [x obsah p-dcb (%)]; [y odezva (-) ] x y 0.01 0.013 0.02 0.027 0.03 0.04 0.04 0.048 0.05 0.053 0.08 0.07 0.1 0.09 0.15 0.12 0.2 0.15 0.3 0.22 0.4 0.27 0.5 0.32 41

6.3 Regresní diagnostika Regresní diagnostika spočívá v určení vlivných a odlehlých hodnot. Obr. VI. 1 Obr. VI. 2 Obr. VI. 3 Obr. VI. 4 Na základě těchto grafických diagnostik jsem určil bod č.1 jako odlehlý. Bod č.12 jako extrém. Pro kontrolu jsem testoval, jak by vypadal model v případě odstranění bodu č. 1 a došel k závěru na základě hodnot AIC a MEP ( jsou mírně vyšší než u základního modelu), že bod č.1 odstranit nelze, protože by došlo k zkreslení kalibrační závislosti. Metoda nejmenších čtverců MNČ odhady parametrů Parametr Odhad s Kvantil t H 0 : β = 0 Abs. 0.012679 0.00235 5.3953 Zamítnuta x 0.77463 0.03032 25.548 Zamítnuta x 2-0.32076 0.06170-5.1987 Zamítnuta Počáteční podmínky: Omezení P = 1.10-34 (MNČ) na hladině významnosti α = 0,05 Tabulkové kvantily : t (1-α/2,n-m) = 2.262 χ 2 (1-α,m) = 7.815 42

6.4 Kalibrace Obr.VI. 5 kalibrační přímka Parametry kalibrace Koeficienty rovnice : f[i]*x 2 +g[i]*x+h[i] pro k[i-1] < x <= k[i] k[i] f[i] g[i] h[i] 0.05-0.32076 0.77463 0.012679 Analýza reziduí Reziduální součet čtverců RSC 1.6171.10-4 Odhad reziduálního rozptylu s 2 (e) 1.7968.10-5 Odhad sm. odchylky reziduí s (e) 4.2388.10-3 43

Určení kalibračních mezí Kritická úroveň y c 0.017995 x c 0.006882 Limita detekce y d 0.022658 x d 0.012952 Kalibrační tabulka odezva Odhad obsahu [%] L D L H 0.024 0.0116 8.3369.10-3 2.0382.10-2 0.048 0.0373 4.1663.10-2 5.1057.10-2 0.056 0.0676 5.2733.10-2 6.1688.10-2 6.5 Závěr Nalezená kalibrační závislost má pak tvar: y = -0.32076 (+ 0.0617).x 2 + 0.7746 (+ 0.03032).x + 0.01267 (+ 0.00235) Všechny parametry kalibrační závislosti byly určeny jako statisticky významné a model má limitu detekce y d = 0.02266 a x d = 0.01295. Z čehož vyplývá, že minimální obsah p-dcb, který jde odlišit od šumu, je 0.01295 % a odpovídající úroveň odezvy je 0.02266. Byly testovány i jiné typy kalibračních závislostí (Lineární spline s jedním a dvěma uzly), ale kvadratický spline má nejužší proložení konfidenčních intervalů okolo kalibrační křivky. 44

7 Rozlišení mezi lineární a nelineární kalibrací 7.1 Úkol Stanovení fenolů se provádí pomocí spektrofotometrie. Proměřením kalibračních roztoků byla získána závislost absorbance a koncentrace standardních roztoků. Úkolem je prověřit, o jakou kalibrační závislost se jedná. Absorbance neznámých vzorků neznámých vzorků: n 1 = 0.12, n 2 = 0.42, n 3 = 0.56 7.2 Data pro kalibrační model K hodnocení jsem použil statistický program ADSTAT- Lineární diagnostika, Kalibrace přímková, lineární spline, kvadratický spline. K dispozici bylo 9 naměřených hodnot Tabulka V. [x koncentrace fenolu (mg/l)]; [y Absorbance (-) ] x y 0.08 0.05 0.159 0.1 0.227 0.15 0.315 0.2 0.398 0.25 0.495 0.3 0.598 0.35 0.707 0.4 0.836 0.45 45

7.3 Regresní diagnostika Regresní diagnostika spočívá v určení vlivných a odlehlých hodnot. Obr. VII. 1 Obr. VII. 2 Obr. VII. 3 Obr. VII. 4 Na základě těchto grafických diagnostik lze určil bod č.2 jako odlehlý, bod č. 3 podezřelý a bod č.9 jako extrém. Numerickým hodnocením byl na základě Cookovy a Atkinsonovy vzdálenosti taktéž určen bod č. 2 jako odlehlý. Pro kontrolu jsem testoval, jak by vypadal model v případě odstranění bodu č. 2 a došel k závěru na základě hodnot AIC a MEP ( jsou mírně nižší než u základního modelu), že bod č.2 odstranit lze, i když pro další testování zůstane pouze 8 hodnot. 46

7.4 Kalibrace 7.4.1 Porovnání kalibračních závislostí Vhodnost použitého modelu lze posoudit jak z grafického zobrazení kalibrace, tak pomocí odhadu směrodatné odchylky reziduí s ((e) a limity detekce x d pro optimální model jsou tyto hodnoty nejmenší Model Odhad směrodatné odchylky reziduí s (e) Limita detekce x d Přímkový 0.013627 0.09017 Lineární spline - 1 uzel Lineární spline - 2 uzly 0.003973 0.03975 0.003132 0.03322 Kvadratický spline 0.001441 0.01278 Kvadratický spline - 1 uzel 0.001508 0.01815 47

Parametry kalibrace Koeficienty rovnice : f[i]*x 2 +g[i]*x+h[i] pro k[i-1] < x <= k[i] k[i] f[i] g[i] h[i] 0.0836-0.2170 0.7266-0.00589 Analýza reziduí Reziduální součet čtverců RSC 1.0394.10-5 Odhad reziduálního rozptylu s 2 (e) 2.0788.10-6 Odhad sm. odchylky reziduí s (e) 1.4418.10-3 Určení kalibračních mezí Kritická úroveň y c -0.001139 x c 0.006562 Limita detekce y d 0.003358 x d 0.01278 Kalibrační tabulka Absorbance Odhad koncentrace [mg/l] L D L H 0.12 0.18329 0.18005 0.18646 0.42 0.07574 0.75195 0.76330 0.56 1.2323 1.7448 1.3392 7.5 Závěr Nalezená kvadratická kalibrační závislost pro má pak tvar: y = -0.00589 (+ 0.00185).x 2 + 0.7266 (+ 0.00895).x - 0.21701(+ 0.0094181) Všechny parametry kalibrační závislosti byly regresní diágnostikou určeny jako statisticky významné a model má limitu detekce y d = 0.003358 a x d = 0.01278. Z čehož vyplívá, že minimální obsah fenolů, který jde odlišit od nuly je 0.01278 mg/l a odpovídající úroveň Absorbance je 0.003358. Odhad koncentrace pro absorbanci 0.56 je vypočítaný na základě zjištěné kalibrační závislosti, ale při konstrukci kalibrační křivky byla detekována pouze maximální absorbance 0.45. Pro ověření správnosti kalibrační křivky je nutno změřit i roztoky s vyšší absorbancí než je v tomto příkladu uvedeno. 48