Univerzita Pardubice 8. licenční studium chemometrie Statistické zpracování dat při managementu jakosti Semestrální práce Lineární regrese Ing. Jan Balcárek, Ph.D. vedoucí Centrálních laboratoří Precheza a.s., Přerov Přerov, 18.4.2000
Obsah Příklad 1 Porovnání dvou regresních přímek u jednoduchého lineárního regresního modelu 3 Příklad 2. Určení stupně polynomu metodou MNČ a RH křivkové závislosti 12 Příklad 3 Validace nové analytické metody 21 Příklad 4 Vícerozměrný lineární regresní model o 4 proměnných 24
Příklad 1 Porovnání dvou regresních přímek u jednoduchého lineárního regresního modelu Stanovení obsahu rutilové modifikace oxidu titaničitého je důle!itý kontrolní mechanismus průběhu kalcinace hydratovaného oxidu titaničitého. Její stanovení se provádí metodou rentgenové difrakce. K tomuto účelu jsou pou!ívány dvě rentgenové aparatury. Jedna z nich slou!í jako záloha. Oba přístroje byly kalibrovány stejnou řadou standardů. Byly získány lineární regresní modely pro jednotlivé aparatury. Porovnáním regresních přímek, testem homogenity směrnic a úseků je nutno posoudit zda se tyto modely statisticky významně liší na hladině!=0,05. Data: Difraktometr 1- model 1 Difraktometr 2 - model 2 koncentrace rutilu [%] počet pulsů [kcp/s] počet pulsů [kcp/s] 1 40,17200 36,23160 3 137,0140 130,0948 5 230,1410 223,9580 10 469,8400 498,6160 25 1200,511 1202,590 50 2362,880 2335,880 75 3521,439 3509,170 90 4229,163 4203,144 95 4471,021 4447,802 97 4569,741 4541,665 99 4651,212 4635,528 3
Statistické vyhodnocení I. Regresní diagnostika Model 1 Zvolená strategie regresní analýzy: Omezení, P: 1.10-34 Transformace: Ne Váhy: Ne Absolutní člen zahrnut: Ano Podmínky a kvantily pro statistické testy: Hladina významnosti,!: 0,050 Počet bodů, n: 11 Počet parametrů, m: 2 Kvantil Studentova rozdělení t(1-!/2, n-m): 2,262 Kvantil rozdělení " 2 (1-!, m): 5,991 Předbě!ná statistická analýza: Proměnná Průměr Směrodatná odchylka Párový korelační koeficient y 2353,0 1980,1 1,0000 x 1 50,0 42,095 0,9996 Odhady parametrů a testy významnosti: Test H 0 : B j = 0 vs. H A : B j! 0 Parametr Odhad Směrodatná odchylka t-kritérium hypotéza H 0 je B 0 1,1080 4,9369 0,2244 Akceptována B 1 47,038 0,077 610,89 Zamítnuta Statistické charakteristiky regrese: Vícenásobný korelační koeficient, R: 0,9999 Koeficient determinace, R 2 : 0,99998 Predikovaný korelační koeficient, R p2 : 0,9998 Střední kvadratická chyba predikce, MEP: 1,185.10 2 Akaikeho informační kritérium, AIC: 52,993 Odhad reziduálního rozptylu, # 2 (e): 105,06 4
Testování regresního tripletu (data + model + metoda): Fisher-Snedocorův test významnosti regrese,f: 3,7318.10 5 Tabulkový kvantil, F(1-!, m-1, n-m): 5,1174 Závěr: Navr!ený model je přijat jako významný Scottovo kriterium multikolinearity, M: 3,2186.10-13 Závěr: Navr!ený model je korektní Cook-Weisbergův test heteroskedasticity, S f : 20,582 Tabulkový kvantil, " 2 (1-!, 1): 3,8415 Závěr: Rezidua vykazují heteroskedasticitu Jarque-Berraův test normality reziduí, L(e): 4,0740 Tabulkový kvantil, " 2 (1-!,2): 5,9915 Závěr: Normalita je přijata Waldův test autokorelace, W a : 0,5930 Tabulkový kvantil, " 2 (1-!, 1): 3,8415 Závěr: Rezidua nejsou autokorelována Znaménkový test, D t : -0,4095 Tabulkový kvantil, N(1-!/2): 1,6449 Závěr: Rezidua nevykazují trend 5
Model 2 Zvolená strategie regresní analýzy: Omezení, P: 1.10-34 Transformace: Ne Váhy: Ne Absolutní člen zahrnut: Ano Podmínky a kvantily pro statistické testy: Hladina významnosti,!: 0,050 Počet bodů, n: 11 Počet parametrů, m: 2 Kvantil Studentova rozdělení t(1-!/2, n-m): 2,262 Kvantil rozdělení " 2 (1-!, m): 5,991 Předbě!ná statistická analýza: Proměnná Průměr Směrodatná odchylka Párový korelační koeficient y 2342,2 1968,5 1,0000 x 1 50,0 42,095 0,9996 Odhady parametrů a testy významnosti: Test H 0 : B j = 0 vs. H A : B j! 0 Parametr Odhad Směrodatná odchylka t-kritérium hypotéza H 0 je B 0 4.1287 7.7775 5.3085E-01 Akceptována B 1 4.6762E+01 1.2130E-01 3.8550E+02 Zamítnuta Statistické charakteristiky regrese: Vícenásobný korelační koeficient, R: 0,99997 Koeficient determinace, R 2 : 0,99994 Predikovaný korelační koeficient, R p2 : 0,9996 Střední kvadratická chyba predikce, MEP: 31,051 Akaikeho informační kritérium, AIC: 62,991 Odhad reziduálního rozptylu, # 2 (e): 260,74 6
Testování regresního tripletu (data + model + metoda): Fisher-Snedocorův test významnosti regrese,f: 1.4861.10 5 Tabulkový kvantil, F(1-!, m-1, n-m): 5,1174 Závěr: Navr!ený model je přijat jako významný Scottovo kriterium multikolinearity, M: 2,1954.10-13 Závěr: Navr!ený model je korektní Cook-Weisbergův test heteroskedasticity, S f : 20,261 Tabulkový kvantil, " 2 (1-!, 1): 3,8415 Závěr: Rezidua vykazují heteroskedasticitu Jarque-Berraův test normality reziduí, L(e): 1,9129 Tabulkový kvantil, " 2 (1-!,2): 5,9915 Závěr: Normalita je přijata Waldův test autokorelace, W a : 0,9619 Tabulkový kvantil, " 2 (1-!, 1): 3,8415 Závěr: Rezidua nejsou autokorelována Znaménkový test, D t : -1,2539 Tabulkový kvantil, N(1-!/2): 1,6449 Závěr: Rezidua nevykazují trend Závěr z regresní diagnostiky: oba modely splňují všechna obvyklá statistická kriteria. 7
II. Porovnání regresních přímek Na základě provedené regresní diagnostiky je dalším krokem testování shody rozptylů reziduí. Proto!e v tomto případě se jedná o dvě skupiny dat tj. M=2 je mo!no testovat shodu dvou rozptylů reziduí H 0 : # 12 (e)=# 22 (e) pomocí testační statistiky: která má za předpokladu nulové hypotézy H 0 F-rozdělení s (n 1-2) a (n 2-2) stupni volnosti, je-li # 12 (e)># 22 (e). V opačném případě se mění pouze pořadí stupňů volnosti. Je-li F 2 <F(n 1-2, n 2-2), pak platí H 0. Pro model 1 je # 12 (e)=105,06, pro model 2 je # 12 (e)=260,74. Počet stupňů volnosti je pro oba modely stejný(n 1-2)=(n 2-2)=9. F 2 =2,48, F(9,9)=3,18. Na základě tohoto výsledku lze konstatovat platnost hypotézy H 0 o shodě rozptylů. II.1 Test homogenity úseků Při platnosti H 0 : $ 21 =$ 22 =...=$ 2j =...=$ 2c lze získat sdru!ený odhad úseku $ 2c jako vá!enou kombinaci odhadů jednotlivých úseků b 2j podle vztahu: (1) kde w Bj je j-tý váhový koeficient odpovídající úseku j-té přímky a je dán vztahem: (2) Testační charakteristika má tvar: (3) kde Platí-li nulová hypotéza H 0, má testační statistika F I F-rozdělení s M-1 a n-2m stupni volnosti. Rezidua e ij jsou určována na základě jednotlivých regresních přímek. Platí vztah: 8
(4) kde RSC j je reziduální součet čtverců v j-té skupině. Bude-li F I <F 1-! (M-1, n-2m), mají na hladině významnosti! všechny přímky stejný úsek a jeho odhad je dán vztahem pro b 2c. Pomocná data výpočtu n 1 11 n 2 11 n="n j 22 M 2 úsek b 21 1,108 úsek b 22 4,1287 RSC 1 945,54 RSC 2 2346,6 odhad směrodatné odchylky reziduí # j1 (e) 10,25 odhad směrodatné odchylky reziduí # j2 (e) 16,147 w B1 4,3105 w B2 4,3106 "w Bj 8,6211 b 2c 2,6184 F I 0,1075 hladina významnosti! 0,05 F 0,95 (1,18) ~ 248 Závěr: F I <F 0,95 (1,18) # úseky regresní přímky jsou shodné. 9
II.2 Test homogenity směrnic Při platnosti H 0 : $ 11 =$ 12 =...=$ 1j =...=$ 1c lze získat sdru!ený odhad celkové směrnice $ 1c jako vá!enou kombinaci odhadů jednotlivých odhadů směrnic b 1j podle vztahu: (1) kde (2) Testační statistika má tvar: (3) Bude-li F S <F 1-! (M-1, n-2m), jsou regresní přímky na hladině významnosti! rovnobě!né. Nejlepším odhadem celkové směrnice je vztah (1) pro b 1c. 10
Pomocná data pro výpočet n 1 11 n 2 11 n="n j 22 M 2 směrnice b 11 47,038 směrnice b 12 46,762 RSC 1 945,54 RSC 2 2346,6 w S1 17720,0000 w S2 17720,0000 "w Sj 35440,0000 b 2c 46,9 F I 3,6902 hladina významnosti! 0,05 F 0,95 (1,18) ~ 248 Závěr: F I <F 0,95 (1,18) # směrnice regresní přímky jsou shodné. Z provedené statistické analýzy lze konstatovat shodu obou lineárních regresních modelů, z čeho! plyne,!e oba difraktometry poskytují stejné výsledky analýzy 11
Příklad 2. Určení stupně polynomu metodou MNČ a RH křivkové závislosti Oxid titaničitý je pou!íván jako vynikající nosič katalyzátorů v mnoha průmyslových chemických procesech, např. v odstraňování oxidů dusíku v odpadních plynech. Pro tento účel je pou!íván speciálně připravovaný TiO 2 s vysokým měrným povrchem tzv. nanokrystalický TiO 2. Jednou z mo!ností jeho přípravy je hydrolýza alkoxidů titanu v organickém rozpouštědle při vysoké teplotě. Hiroshi Kominami a kol. [Ind. Eng. Chem. Res. 1999, 38, 3925-3931] připravili nanokrystalický TiO 2 hydrolýzou n-butoxidu titanu. U takto připraveného preparátu byla sledována velikost měrného povrchu v závislosti na teplotě kalcinace. Metodou lineární regrese je nutno najít stupeň polynomu vztahu měrný povrch = F(teplota). Data Teplota kalcinace [ o C ] Měrný povrch [m 2 /g] 130 103 450 97 550 85 700 71 800 51 900 40 950 18 1000 10 Vyšetření stupně polynomu metodou nejmenších čtverců Pro nalezení optimálního stupně polynomu n byl při výpočtu měněn stupeň polynomu a sledována hodnota MEP, která musí být pro optimální n minimální. I. Stupeň polynomu: 2 Omezení, P: 1.10-34 Transformace: Polynom Váhy: Ne Absolutní člen zahrnut: Ano Podmínky a kvantily pro statistické testy: Hladina významnosti,!: 0,050 Počet bodů, n: 8 Počet parametrů, m: 3 Kvantil Studentova rozdělení t(1-!/2,n-m): 2,571 Kvantil rozdělení " 2 (1-!,m): 7,815 12
Předbě!ná statistická analýza: Proměnná Průměr Směrodatná odchylka Párový korelační koeficient y 59,375 35,266 1,0000 x 1 685,00 295,34-0.9325 x 2 5,45.10 5 3,53.10 5-0,9866 Odhady parametrů a testy významnosti: Test H 0 : B j = 0 vs. H A : B j! 0 Parametr Odhad Směrodatná odchylka t-kritérium hypotéza H 0 je B 0 96,107 6,149 15,63 Zamítnuta B 1 0,071 0,023 3,093 Zamítnuta B 2-1,565.10-4 1,922.10-5 -8,144 Zamítnuta Statistické charakteristiky regrese: Vícenásobný korelační koeficient, R: 0,9954 Koeficient determinace, R 2 : 0,9909 Predikovaný korelační koeficient, R p2 : 0,9896 Střední kvadratická chyba predikce, MEP: 22,627 Akaikeho informační kritérium, AIC: 24,387 Indikace multikolinearity: Č [j] Vlastní čísla korel. matice l[j] Čísla podmíněnosti K[j] Variance inflation factor VIF[j] Vícenás.korel koef pro X[j] 1 0,025 78,868 20,220 0,9750 2 1,975 1,000 20,220 0,9750 Model vykazuje multikolinearitu proto!e VIF[j] > 10. 13
Testování regresního tripletu (data + model + metoda): Fisher-Snedocorův test významnosti regrese,f: 270,69 Tabulkový kvantil, F(1-!, m-1, n-m): 5,7861 Závěr: Navr!ený model je přijat jako významný Scottovo kriterium multikolinearity, M: 0,754 Závěr: Navr!ený model není korektní Cook-Weisbergův test heteroskedasticity, S f : 2,593 Tabulkový kvantil, " 2 (1-!, 1): 3,842 Závěr: Rezidua vykazují homoskedasticitu Jarque-Berraův test normality reziduí, L(e): 0,888 Tabulkový kvantil, " 2 (1-!,2): 5,992 Závěr: Normalita je přijata Waldův test autokorelace, W a : 4,789 Tabulkový kvantil, " 2 (1-!, 1): 3,842 Závěr: Rezidua jsou autokorelována Znaménkový test, D t : 0,382 Tabulkový kvantil, N(1-!/2): 1,645 Závěr: Rezidua nevykazují trend 14
II. Stupeň polynomu: 3 Omezení, P: 1.10-34 Transformace: Polynom Váhy: Ne Absolutní člen zahrnut: Ano Podmínky a kvantily pro statistické testy: Hladina významnosti,!: 0,050 Počet bodů, n: 8 Počet parametrů, m: 4 Kvantil Studentova rozdělení t(1-!/2,n-m): 2,776 Kvantil rozdělení " 2 (1-!,m): 9,488 Předbě!ná statistická analýza: Proměnná Průměr Směrodatná odchylka Párový korelační koeficient y 59,375 35,266 1,0000 x 1 685,00 295,34-0,9325 x 2 5,4555.10 5 3,5297.10 5-0,9866 x 3 4,6263.10 8 3,7227.10 8-0,9955 Odhady parametrů a testy významnosti: Test H 0 : B j = 0 vs. H A : B j! 0 Parametr Odhad Směrodatná odchylka t-kritérium hypotéza H 0 je B 0 100,87 114,55 8,806 Zamítnuta B 1 0,027 0,090 0,296 Akceptována B 2 6,282.10-5 1,844.10-4 -0,341 Akceptována B 3 5,515.10-8 1,078.10-7 -0,511 Akceptována Statistické charakteristiky regrese: Vícenásobný korelační koeficient, R: 0,9957 Koeficient determinace, R 2 : 0,9914 Predikovaný korelační koeficient, R p2 : 0,8329 Střední kvadratická chyba predikce, MEP: 333,28 Akaikeho informační kritérium, AIC: 25,881 15
Indikace multikolinearity: Č [j] Vlastní čísla korel. matice l[j] Čísla podmíněnosti K[j] Variance inflation factor VIF[j] Vícenás.korel koef pro X[j] 1 4,098.10-4 7152,9 265,64 0,9981 2 0,068 42,97 1586,0 0,9997 3 2.931 1.000 603,46 0,9992 Model vykazuje multikolinearitu proto!e VIF[j] > 10 a K[j], K > 1000. Testování regresního tripletu (data + model + metoda): Fisher-Snedocorův test významnosti regrese,f: 153,90 Tabulkový kvantil, F(1-!, m-1, n-m): 6,591 Závěr: Navr!ený model je přijat jako významný Scottovo kriterium multikolinearity, M: 0,9978 Závěr: Navr!ený model není korektní Cook-Weisbergův test heteroskedasticity, S f : 1,5824 Tabulkový kvantil, " 2 (1-!, 1): 3,8415 Závěr: Rezidua vykazují homoskedasticitu Jarque-Berraův test normality reziduí, L(e): 0,4759 Tabulkový kvantil, " 2 (1-!,2): 5,9915 Závěr: Normalita je přijata Waldův test autokorelace, W a : 10,233 Tabulkový kvantil, " 2 (1-!, 1): 3,8415 Závěr: Rezidua jsou autokorelována Znaménkový test, D t : 1,9094 Tabulkový kvantil, N(1-!/2): 1,6449 Závěr: Rezidua vykazují trend 16
Závěr: Optimální stupeň polynomu je n=2 kdy MEP má minimální hodnotu. Model však vykazuje multikolinearitu a není mo!no pou!ít metodu nejmenších čtverců. Je nutno pou!ít metodu racionálních hodností, která spočívá v nalezení optimálního filtru omezení P. III. Metoda racionálních hodností Jako optimální byl nalezen filtr omezení P=0,965. Transformace: Polynom Stupeň polynomu: 2 Váhy: Ne Absolutní člen zahrnut: Ano Podmínky a kvantily pro statistické testy: Hladina významnosti,!: 0,050 Počet bodů, n: 8 Počet parametrů, m: 3 Kvantil Studentova rozdělení t(1-!/2,n-m): 2,571 Kvantil rozdělení " 2 (1-!,m): 7,815 Předbě!ná statistická analýza: Proměnná Průměr Směrodatná odchylka Párový korelační koeficient y 59,375 35,266 1,0000 x 1 685,00 295,34-0.9325 x 2 5,45.10 5 3,53.10 5-0,9866 V souboru dat je jeden odlehlý bod - č. 1 - viz obr. 2-1.McCulloh-Meeterův graf Odhady parametrů a testy významnosti: Test H 0 : B j = 0 vs. H A : B j! 0 Parametr Odhad Směrodatná odchylka t-kritérium hypotéza H 0 je B 0 124,55 8,963 138,96 Zamítnuta B 1-0,0534 0,0132-4,049 Zamítnuta B 2-5,24.10-5 1,104.10-5 -4,742 Zamítnuta 17
Statistické charakteristiky regrese: Vícenásobný korelační koeficient, R: 0,9677 Koeficient determinace, R 2 : 0,9364 Predikovaný korelační koeficient, R p2 : 0,9059 Střední kvadratická chyba predikce, MEP: 195,21 Akaikeho informační kritérium, AIC: 39,894 Testování regresního tripletu (data + model + metoda): Fisher-Snedocorův test významnosti regrese,f: 36,824 Tabulkový kvantil, F(1-!, m-1, n-m): 5,7861 Závěr: Navr!ený model je přijat jako významný Scottovo kriterium multikolinearity, M: 0,3090 Závěr: Navr!ený model je korektní Cook-Weisbergův test heteroskedasticity, S f : 6,2092 Tabulkový kvantil, " 2 (1-!, 1): 3,8415 Závěr: Rezidua vykazují heteroskedasticitu Jarque-Berraův test normality reziduí, L(e): 1,0073 Tabulkový kvantil, " 2 (1-!,2): 5,9915 Závěr: Normalita je přijata Waldův test autokorelace, W a : 0,1409 Tabulkový kvantil, " 2 (1-!, 1): 3,8415 Závěr: Rezidua nejsou autokorelována Znaménkový test, D t : -1,0299 Tabulkový kvantil, N(1-!/2): 1,6449 Závěr: Rezidua nevykazují trend 18
Obr. 1 Graf vlivných bodů Výsledný regresní vztah modelu Povrch = f(teplota) má tvar: kde Y měrný povrch [m 2 /g] x teplota [ o C] Graf regresního modelu je uveden na obr. 2 19
Obr. 2 Graf funkce povrch =f(teplota) 20
Příklad 3 Validace nové analytické metody Základní surovinou pro výrobu pigmentového oxidu titaničitého - titanové běloby (TB) je ilmenit FeTiO 3. Tento minerál obsahuje celou řadu minoritních prvků ovlivňujících jeho pou!itelnost v technologii výroby TB. Jedním z důle!itých prvků je fosfor. Jeho stanovení se provádí tzv.!lutou kolorimetrií, při které se měří absorbance!lutého fosfomolybdenanového komplexu. Tato klasická metoda je však velmi pracná a časově náročná. Jako velmi efektivní se jeví stanovení fosforu v ilmenitu rentgenovou fluorescenční analýzou (XRF). K tomu, aby bylo mo!no zavést tuto metodu do rutinní praxe bylo nutno provést porovnání výsledků analýzy klasické a nově navrhované. Oběma metodami bylo analyzováno deset vzorků ilmenitu. Metodou lineární regrese bylo zkoumáno, zda obě metody dávají shodné výsledky. Data: klasická fotometrická metoda metoda XRF 0,059 0,057 0,035 0,037 0,098 0,100 0,115 0,115 0,126 0,124 0,140 0,142 0,156 0,160 0,212 0,216 0,238 0,237 0,261 0,264 21
Statistická analýza: Zvolená strategie regresní analýzy: Omezení, P: 1.10-34 Transformace: Ne Váhy: Ne Absolutní člen zahrnut: Ano Podmínky a kvantily pro statistické testy: Hladina významnosti,!: 0,050 Počet bodů, n: 10 Počet parametrů, m: 2 Kvantil Studentova rozdělení t(1-!/2,n-m): 2,306 Kvantil rozdělení " 2 (1-!,m): 5,991 Předbě!ná statistická analýza: Proměnná Průměr Směrodatná odchylka Párový korelační koeficient y 0,1452 0,0750 1,0000 x 1 0,1440 0,7431 0,9996 Odhady parametrů a testy významnosti: Test H 0 : B j = 0 vs. H A : B j! 0 Parametr Odhad Směrodatná odchylka t-kritérium hypotéza H 0 je B 0-1,474.10-4 1,6722.10-3 -8,8140.10-2 Akceptována B 1 1,0094 1,430.10-2 96,775 Zamítnuta Statistické charakteristiky regrese: Vícenásobný korelační koeficient, R: 0,99957 Koeficient determinace, R 2 : 0,99915 Predikovaný korelační koeficient, R p2 : 0,99932 Střední kvadratická chyba predikce, MEP: 6,8904.10-6 Akaikeho informační kritérium, AIC: -119,51 22
Testování regresního tripletu (data + model + metoda): Fisher-Snedocorův test významnosti regrese,f: 9,3653.10 3 Tabulkový kvantil, F(1-!, m-1, n-m): 5,3177 Závěr: Navr!ený model je přijat jako významný Scottovo kriterium multikolinearity, M: -2,6512.10-14 Závěr: Navr!ený model je korektní Cook-Weisbergův test heteroskedasticity, S f : 14,717 Tabulkový kvantil, " 2 (1-!, 1): 3,8415 Závěr: Rezidua vykazují heteroskedasticitu Jarque-Berraův test normality reziduí, L(e): 1,0627 Tabulkový kvantil, " 2 (1-!,2): 5,9915 Závěr: Normalita je přijata Waldův test autokorelace, W a : 0,0785 Tabulkový kvantil, " 2 (1-!, 1): 3,8415 Závěr: Rezidua nejsou autokorelována Znaménkový test, D t : -0,2107 Tabulkový kvantil, N(1-!/2): 1,6449 Závěr: Rezidua nevykazují trend Závěr: Na základě provedené statistické analýzy lze konstatovat shodu výsledků získaných oběma typy analýzy. Toto konstatování plyne z faktu,!e je akceptována hypotéza o nulovém úseku regresní přímky. 23
Příklad 4 Vícerozměrný lineární regresní model o 4 proměnných U vzorků kalcinátu oxidu titaničitého byla metodou rentgenové difrakce stanovena velikost krystalitu L. K jejímu stanovení bylo pou!ito Scherrerovy rovnice: kde K je konstanta mající hodnotu zpravidla 0,9 % - vlnová délka pou!itého rentgenového záření [nm] & - úhel v maximu intenzity difrakčního vrcholu [rad] w - čisté rozšíření difrakční linie [rad] kde w exp - experimentálně naměřené rozšíření difrakčního vrcholu [rad] w p - přístrojové rozšíření difrakčního vrcholu [rad] Pro mo!né pou!ití parametru velikost krystalitu pro řízení kalcinačního procesu bylo třeba zjistit, zda je ve funkčním vztahu k barvivosti a bělosti kalcinátu, dále pak k obsahu!eleza a fosforu. K statistickým výpočtům bylo změřeno 32 vzorků kalcinátu oxidu titaničitého. Data jsou uvedena v následující tabulce. Barvivost [body] Bělost [%] Fe [%] P2O5 [%] Velikost krystalitu [nm] 1825 95,9 0,0019 0,208 1066 1890 95,5 0,0029 0,205 960 1900 95,5 0,0029 0,206 738 1920 95,6 0,0029 0,209 267 1900 95,6 0,0028 0,207 565 1825 95,0 0,0023 0,211 872 1950 95,1 0,0025 0,209 640 1860 96,1 0,0028 0,211 738 1890 96,2 0,0028 0,214 960 1825 94,8 0,0028 0,208 600 1880 94,8 0,0032 0,212 686 1845 96,4 0,0029 0,218 384 1880 96,5 0,0033 0,219 356 1845 95,4 0,0027 0,222 480 1835 95,7 0,0022 0,223 384 1860 94,6 0,0024 0,222 505 1845 95,4 0,0020 0,217 480 1830 96,4 0,0019 0,219 436 1840 96,1 0,0021 0,217 480 1840 94,5 0,0025 0,219 872 1835 94,7 0,0024 0,218 738 1830 94,6 0,0031 0,217 533 1845 96,4 0,0022 0,218 355 1880 95,9 0,0023 0,218 640 1830 96,3 0,0025 0,219 533 1860 96,7 0,0022 0,223 533 1830 95,2 0,0025 0,228 480 1835 95,1 0,0025 0,227 480 1850 96,9 0,0019 0,224 565 1830 96,9 0,0018 0,215 505 1830 95,8 0,0022 0,214 738 1830 94,6 0,0022 0,215 873 Statistická analýza 24
Zvolená strategie regresní analýzy: Omezení, P: 1.10-34 Transformace: Ne Váhy: Ne Absolutní člen zahrnut: Ano Podmínky a kvantily pro statistické testy: Hladina významnosti,!: 0,050 Počet bodů, n: 32 Počet parametrů, m: 5 Kvantil Studentova rozdělení t(1-!/2,n-m): 2,052 Kvantil rozdělení " 2 (1-!,m): 11,070 Předbě!ná statistická analýza: Proměnná Průměr Směrodatná odchylka Párový korelační koeficient y velikost krystalitu 607,6 200,03 1,0000 x 1 barvivost 1855 31,55-0,0096 x 2 bělost 95,63 0,725-0,2924 x 3 obsah Fe 0,0025 4,04.10-4 -0,0379 x 4 obsah P 2 O 5 0,216 6,1.10-3 -0,4766 V souboru jsou dva odlehlé body (č. 4 a 9) a jeden extrém (č.7) - viz obr.3 Williamsův graf vlivných bodů. Odhady parametrů a testy významnosti: Test H 0 : B j = 0 vs. H A : B j! 0 Parametr Odhad Směrodatná odchylka t-kritérium hypotéza H 0 je B 0 1,43.10 4 4,72.10 3 3,026 Zamítnuta B 1-1,095 1,208-0,907 Akceptována B 2-76,19 45,37-1,679 Akceptována B 3-1,04.10 5 9,1.10 4-1,145 Akceptována B 4-1,90.10 4 5,71.10 3-3,323 Zamítnuta Statistické charakteristiky regrese: Vícenásobný korelační koeficient, R: 0,606 Koeficient determinace, R 2 : 0,367 Predikovaný korelační koeficient, R p2 : 0,354 Střední kvadratická chyba predikce, MEP: 3,39.10 4 Akaikeho informační kritérium, AIC: 333,4 25
Testování regresního tripletu (data + model + metoda) Fisher-Snedocorův test významnosti regrese,f: 3,914 Tabulkový kvantil, F(1-!, m-1, n-m): 2,728 Závěr: Navr!ený model je přijat jako významný Scottovo kriterium multikolinearity, M: -0,012 Závěr: Navr!ený model je korektní Cook-Weisbergův test heteroskedasticity, S f : 34,4 Tabulkový kvantil, " 2 (1-!, 1): 38,42 Závěr: Rezidua vykazují heteroskedasticitu Jarque-Berraův test normality reziduí, L(e): 0,642 Tabulkový kvantil, " 2 (1-!,2): 5,992 Závěr: Normalita je přijata Waldův test autokorelace, W a : 0,214 Tabulkový kvantil, " 2 (1-!, 1): 3,842 Závěr: Rezidua nejsou autokorelována - viz obr.4 - rezidua tvoří "mrak" Znaménkový test, D t : -1,24 Tabulkový kvantil, N(1-!/2): 1.645 Závěr: Rezidua nevykazují trend Závěr: Z provedené statistické analýzy plyne,!e velikost krystalitů kalcinátu oxidu titaničitého závisí pouze na obsahu fosforu. Optické vlastnosti (barvivost a bělost) a obsah!eleza nejsou ve funkčním vztahu s velikostí krystalitu. Nelze proto pou!ít parametr velikost krystalitu k řízení kalcinačního procesu, proto!e jeho řízení spočívá v nastavení takových podmínek, aby bylo dosa!eno co nejvyšších hodnot barvivosti a bělosti. 26
Obr. 3 Williamsův graf vlivných bodů 27
Obr. 4 Graf autokorelace reziduí 28