Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti. Autor práce: Přednášející: Prof. RNDr. Milan Meloun, DrSc
Zpracovávaná data jsou výstupem z výrobních procesů při výrobě pigmentu TiO. - -
Obsah Metoda hlavních komponent (Principal Components Analysis).... Zadání.... Naměřená data.... Indexový graf úpatí vlastních čísel.... Graf komponentních vah....5 Rozptylový diagram komponentního skóre....6 Dvojný graf (Biplot)... 5.7 Numerické výpočty pro neredukované proměnné... 5.8 Graf komponentních vah po první redukci... 6.9 Rozptylový diagram komponentního skóre po první redukci... 7.0 Numerické výpočty po první redukci... 7. Graf komponentních vah po druhé redukci... 8. Rozptylový diagram komponentního skóre po druhé redukci... 8. Numerické výpočty po druhé redukci... 9. Závěr... 9 Faktorová analýza.... Vypočtené parametry.... Grafické zobrazení.... Závěr:... Hierarchické klastrování.... Grafické zobrazení.... Závěr:... Přílohy... - -
Metoda hlavních komponent (Principal Components Analysis). Zadání Pigment TiO je vyráběn kontinuálním procesem, přesto dochází při výrobě ke změně některých podmínek (změna vstupní suroviny, odchýlení technologických parametrů atd.), které mohou ovlivnit výsledné vlastnosti výrobku. Proto je pigment expedován po výrobních šaržích, které vzhledem k velikosti ( tun) zaručují stejnou kvalitu. V průběhu delšího období se však mohou tyto šarže u jednoho typu výrobku lišit, přestože stanovení sledovaných parametrů (vzhledem k jejich počtu a vzájemných vazeb) toto neodhalíné. Posuďte u typu R00M vzájemné vztahy mezi stanovovanými parametry a pokuste se najít takové charakteristiky, které by pomohly včas odhalit případné odchýlení, aniž by bylo nutno pracně analyzovat celou škálu parametrů. Zjistěte, zdali ve sledovaném období byly šarže R00M shodné. K dispozici je 66 šarží.. Naměřená data U 66 šarží R00M bylo sledováno 0 parametrů (viz. příloha ). Tabulka I: Sledované parametry označení parametr TiO_% obsah TiO tek_lat těkavé látky mer_vod měrná vodivost ph_vyluh ph výluhu zb_b zbytek B Sp_olej spotřeba oleje Ba barvivost Podton podtón L_pasta L* v bílé pastě b_pasta b* v bílé pastě HEMP_85 dispergace HEMP_85 rutil obsah rutilu C_% obcah C d 50 velikost částic (d 50) AlO_% obsah Al O PO5_% obsah P O 5 KO_% obsah K O NbO5_% obsah Nb O 5 S_% obsah S ZrO_% obsah ZrO Data byla zpracována v programu CSAN. pomocí algoritmu NIPALS. - -
. Indexový graf úpatí vlastních čísel Vlastní čísla (Eigenvalues) slouží k určení počtu hlavních komponent (Components). NIPALS Eigenvalue (Scree) Plot 5 eigenvalues 0 5 6 7 8 9 0 components Obrázek : Indexový graf úpatí vlastních čísel Na indexovém grafu vlastních čísel (velikost vlastních čísel proti stoupající hodnotě indexu) vidíme užitečné hlavní komponenty odděleny zlomem. Význam mají nanejvýš tři.. Graf komponentních vah NIPALS Loading Plot 0.5 Sp_olej second component 0.5 0.5 0.05-0.05-0.5 S_% d 50 mer_vod AlO_% ph_vyluh rutil ZrO_% Ba C_% b_pasta KO_% TiO_% -0.5-0.5 HEMP_85 tek_lat zb_b NbO5_% Podton L_pasta PO5_% -0. -0. -0. -0. 0.0 0. 0. 0. 0. first component Obrázek : Graf komponentních vah pro 66 objektů a 0 proměnných Porovnáním vzdáleností a úhlů mezi jednotlivými průvodiči (úhel je nepřímo úměrný velikosti korelace mezi proměnnými) určíme společné nebo velmi podobné vlastnosti..5 Rozptylový diagram komponentního skóre Tento diagram ukazuje celou strukturu objektů (shluky, izolované objekty, odlehlé objekty). - -
NIPALS Score Plot second component 5 - - -5 6 9 8 0 7 5 6 5 9 09 08 05 0 95 76 6 9 5 07 88 9 98 0 8 77 09 75 7 87 96 8 69 86 7 8 7 85 60 7 80 7 78 79 70 68 5 58 9 58 8 6 55 5 5 577 6 56 56 58 0 8 7 5 5059 5 6 6 6 60 57 8 9 0 7 8 7 5 6 9 5 0 6 5 9 66 6 65 5 7 59 55 5 6 6 9 97 8 5 0 5 50 8 6 5 7 99 0 00 97 90 98 89 8 9 0 06 0 6 65 67 66 6 6-7 0-8 - first component.6 Dvojný graf (Biplot) Obrázek : Rozptylový diagram komponentního skóre pro 66 objektů a 0 proměnných. Tento graf je kombinací dvou předchozích a zobrazuje současně objekty a průvodiče proměnných. Je-li některý objekt umístěn ve dvojném grafu na místě (nebo poblíž) proměnné, je s ní v interakci. NIPALS Biplot second component - 6 9 8 7 0 5 9900 0 98 97 90 890 06 0 5 09 08 05 0 9 9 95 76 6 5 07 88 9 9 8 0 877 09 75 7 Sp_olej 96 87 S_% AlO_% d 50 C_% 8 69 86 b_pasta 7 8 85 7 7 80 mer_vod 79 7 60 78 6 6 7068 65 5 58 9 6 58 ph_vyluh 8 KO_% 55 67 666 6 6 ZrO_% Ba rutil 58 5 57 5 7 TiO_% 56 56 0 5 8 7 8 9 50 59 5 HEMP_85 L_pasta tek_lat NbO5_% Podton PO5_% 6 6 6 60 0 57 8 7 7 56 zb_b 9 5 0 65 9 66665 5 59 55 7 5 6 55 50 8 9 6 9 7 8 0 6 9 5 8 7-6 0-8 - first component Obrázek : Dvojný graf pro 66 objektů a 0 proměnných. Z grafů jsou je vidět, v souboru jsou čtyři odlehlé objekty (0,, 6, 7), které jsou mimo dva hlavní shluky..7 Numerické výpočty pro neredukované proměnné Tabulka II: Sledované parametry - 5 -
Hlavní Hlavní Eigenvalue Proporčně Kumulativně komponenta komponenta Eigenvalue Proporčně Kumulativně.9 0.6 0.6 6.0 0.05 0.7.0975 0.05 0.50 7 0.9 0.06 0.778.085 0.0 0.55 8 0.75 0.07 0.8.68 0.07 0.6 9 0.608 0.00 0.8 5.0 0.057 0.680 0 0.59 0.06 0.87 První tři latentní proměnné vysvětlují 55. % variability. Vysoké korelace a tedy i podobné vlastnosti v tomto souboru mají: Podtón a obsah Nb O 5 L* v bílé pastě a obsah P O 5 Zbytek B a Hempl_85 Barvivost a Rutil Měrná vodivost, ph výluhu a obsah Al O d 50 a obsah S b* v bílé pastě a obsah uhlíku Na základě vyšetření grafu komponentních vah a znalosti problematiky stanovení analytických parametrů bylo rozhodnuto o vypuštění následujících parametrů: Podtón L* v bílé pastě Zbytek B Barvivost Rutil Měrná vodivost, ph výluhu b* v bílé pastě.8 Graf komponentních vah po první redukci NIPALS Loading Plot 0.5 0. C_% - 6 - Sp_olej
.9 Rozptylový diagram komponentního skóre po první redukci NIPALS Score Plot second component 0 - - - - 6 8 9 0 7 5 99 97 98 6 0 00 5 95 0 9 0 96 0 909 9 08 8 07 8988 906 5 05 76 0 009 7 7 9 8 77 86 8 87 75 8 7 77980 85 8 78 7 5 5 9 55 7 69 59 8 6 0 6 69 770 65 7 0 5 56 68 60 67 66 6 57 56 7 6 57 5 56 9 56 5 6 6 66 58 50 8 5 58 8 65 60 6 6 5 6 55 59 5 5 7 9 8 6 0 6 5 5 50 9 8 5 6 9 7 8 9 7 8 0-5 0-6 -8 - first component Obrázek 6: Rozptylový diagram komponentního skóre pro proměnných. Z grafů je vidět, že po první redukci proměnných se shluky změnily na tři. Stále je mimo šarže 0 (odlehlý bod)..0 Numerické výpočty po první redukci Tabulka III: Sledované parametry Hlavní Eigenvalue Proporčně Kumulativně komponenta Hlavní komponenta Eigenvalue Proporčně Kumulativně - 7 -
. 0.0 0.0 6 0.596 0.05 0.900.555 0. 0.56 7 0.07 0.07 0.98.9 0.6 0.67 8 0.55 0.09 0.966.7 0.0 0.775 9 0. 0.0 0.987 5 0.7857 0.07 0.86 0 0. 0.0 0.999 Po první redukci proměnných došlo ke zvýšení vysvětlené variability z 55. % na 67. %.. Graf komponentních vah po druhé redukci NIPALS Loading Plot 0. C_% Sp_olej second component 0. 0. 0. 0.0-0. -0. AlO_% ZrO_% S_% TiO_% -0. -0. -0.5 tek_lat NbO5_% PO5_% -0.5 0.0 first component 0.5 Obrázek 7: Graf komponentních vah pro 8 proměnných. Na grafu je vidět že proměnné se rozdělily v prostoru a mají přibližně stejnou míru informace. Teoreticky by se daly nahradit (zaměnit mezi sebou) proměnné AlO_% a TiO_%. Leží proti sobě a jsou přibližně stejně vzdáleny od počátku.. Rozptylový diagram komponentního skóre po druhé redukci NIPALS Score Plot nent 0 6 9 8 7-8 - 6 5 5 56 7 6 57 99 5 97 0 00 098 95 9 90 0 9 96 08 0 8 9 89889 0706 05 76 0 7 7 9 0 809 86 5 7 8 87 75 77 79 78 9 55 8 597 5 6 87 80 09 9 8 6 857 69 68 67 66 6 7 770 6 65 57 56 0 5 60 5 65
Po druhé redukci se shluky ještě výrazněji oddělily, Šarže 0 zůstává jako odlehlý objekt.. Numerické výpočty po druhé redukci Tabulka IV: Sledované parametry Hlavní Hlavní Eigenvalue Proporčně Kumulativně komponenta komponenta Eigenvalue Proporčně Kumulativně.56 0.5 0.5 6 0.5 0.09 0.95.58 0.8 0.6 7 0.66 0.09 0.97.0889 0. 0.75 8 0.88 0.05 0.999 0.875 0.097 0.850 9 0.008 0.00.000 5 0.987 0.055 0.905 - - - -. Závěr Jak se ukazuje z porovnání tabulek, podařilo se druhou redukcí zvýšit vysvětlenou variabilitu pro tři latentní proměnné o 0. % (z 55. % na 75. %). Pro dvě latentní proměnné y a y je zvýšení o 9.7 % (z 5.5 na 6. %). Latentní proměnné mají následující tvar: y = 0.8*TiO_% - 0.0*tek_latky + 0.88*Sp_olej 0.8*C_% - 0.8*AlO + 0.*PO5 + + 0.08*NbO5 0.5*S% y = 0.0*TiO_% - 0.*tek_latky + 0.*Sp_olej + 0.75*C_% - 0.07*AlO - 0.86*PO5-0.90*NbO5 + 0.7*S% Na rozptylovém grafu jsou patrné dva shluky, které jsou mimo hlavní mrak bodů. Tyto šarže jsou odlišné od ostatních. Tuto skutečnost lze odhalit u tohoto materiálu již při stanovení devíti parametrů (místo původních dvaceti). Výhodou je, že stanovení prvkového pozadí (obsahu Al O, P O 5, Nb O 5, S) lze provést při jednom měření pomocí rentgenové fluorescenční spektrometrie. - 9 -
Tato analýza vícerozměrných dat slouží jako podklad pro bližší zkoumání podmínek, při kterých došlo k odchýlení od standardní produkce u některých šarží. Latentní proměnné nelze jednoznačně pojmenovat, obě mají vazbu na fyzikální i chemické vlastnosti zkoumaného pigmentu. - 0 -
Faktorová analýza Při faktorové analýze byly vypočteny komunality při použití 5 faktorů. Pro rotaci bylo využito metody EQUIMAX (při rotaci je minimalizován rozptyl čtverců faktorových vah a současně je maximalizován součet čtvrtých mocnin faktorových zátěží).. Vypočtené parametry Tabulka V: Komunality a vysvětlený rozptyl pro zvolený počet faktorů Proměnná Komunalita pro zvolený počet faktorů 5 TiO_% 0.65 0.88 0.99 0.967 0.99 tek_latky 0.06 0.7 0.788 0.790 0.86 Sp_olej 0.00 0.77 0.60 0.899 0.97 C_% 0.9 0. 0.605 0.95 0.97 AlO_% 0.6 0.86 0.956 0.97 0.99 PO5_% 0.69 0.70 0.777 0.780 0.867 NbO_% 0.99 0.6 0.7 0.7 0.99 S_% 0.50 0.5 0.87 0.8 0.855 Vysvětlený rozptyl 0.5 0.650 0.779 0.86 0.97. Grafické zobrazení Factor Analysis Score Plot Unrotated Factors Rotated Factors.5.5 second factor 0 - - second factor.5 0.5-0.5 -.5 -.5 - -.5 - - 0 first factor - 0 first factor 5 6 Obrázek 9: Graf pro dva faktory před a po rotaci - -
. Závěr: Pro popis souboru je možné použít dvou (65 % variability), popřípadě tří faktorů (77.9 % variability). Po rotaci EQUIMAX byly získány následující komponentní váhy. Tabulka VI: Komponentní váhy po rotaci Proměnná Faktor Faktor Faktor Faktor Faktor TiO_% -0. -0.009-0.58 0.08-0.06 tek_latky 0.60-0.5 0.07 0.07-0.95 Sp_olej -0.60 0.9 0.06-0.0 0.7 C_% 0.00 0.5 0. -0.08 0.8 AlO_% 0.0 0.0 0.6-0.089 0.07 PO5_% -0.50-0.7-0.0-0.86-0.00 NbO_% 0.0-0.9 0. -0.7-0.09 S_% 0.69 0.97-0.7 0.5-0. - -
Hierarchické klastrování. Grafické zobrazení Bylo použito klastrování podle Eukleidovské vzdálenosti. Jde o grafické zobrazení závislosti veličin pomocí dendrogramů. Similarity 0.00 Dendrogram. 66.67 00.00 Observations Obrázek 0: Dendrogram Eukleidovská vzdálenost V dalším hodnocení bylo použito průměru a Eukleidovské vzdálenosti. Similarity.0 Dendrogram 6.67 8. 00.00 Observations Obrázek : Průměr a Eukleidovská vzdálenost. Závěr: Objekty je možné klasifikovat různými způsoby. Dendrogramy dokreslují PCA i FA. Objekty jsou seřaditelné do několika skupin podle podobnosti. - -
Přílohy Použitá data Výstup z programu SCAN. - -