Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

Podobné dokumenty
Vyhodnocení průměrných denních analýz kalcinátu ananasového typu. ( Metoda hlavních komponent )

Fakulta chemicko technologická Katedra analytické chemie

SEMESTRÁLNÍ PRÁCE. Určení vnitřní struktury analýzou vícerozměrných dat. Ing. Pavel Bouchalík

Počítačová analýza vícerozměrných dat v oborech přírodních, technických a společenských věd

Fakulta chemicko-technologická Katedra analytické chemie. Licenční studium Statistické zpracování dat při managementu jakosti. Semestrální práce:

Příklad 2: Určení cihlářských surovin na základě chemické silikátové analýzy

3.4 Určení vnitřní struktury analýzou vícerozměrných dat

Univerzita Pardubice 8. licenční studium chemometrie

Úvod do vícerozměrných metod. Statistické metody a zpracování dat. Faktorová a komponentní analýza (Úvod do vícerozměrných metod)

Statistické metody a zpracování dat. IX Faktorová a komponentní analýza (Úvod do vícerozměrných metod) Petr Dobrovolný

Příklad 2: Obsah PCB v játrech zemřelých lidí. Zadání: Data: Program:

Aproximace a vyhlazování křivek

Fakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy

Univerzita Pardubice. Fakulta chemicko-technologická. Katedra analytické chemie. Semestrální práce. Licenční studium

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie

Odhalení skryté struktury a vnitřních vazeb dat metodami vícerozměrné statistické analýzy

Faktorová analýza příklad. Obrázek 1 Ukázka části vstupních dat

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

AVDAT Mnohorozměrné metody metody redukce dimenze

Plánování experimentu

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

S E M E S T R Á L N Í

vzorek vzorek

Závěrečná práce Ing. Jiří Pokorný

KVALITA GELU HYDRATOVANÉHO OXIDU TITANIČITÉHO Z HLEDISKA KALCINAČNÍHO CHOVÁNÍ

Počítačová analýza vícerozměrných dat

Faktorová analýza (FACT)

PŘÍKLAD 4.5 Chromatografická analýza farmakologických sloučenin Byly měřeny hodnoty R F pro 20 sloučenin s 18 eluenty. Žádné eluční činidlo však nepro

Semestrální práce. 3.1 Matematické principy analýzy vícerozměrných dat

Tvorba lineárních regresních modelů při analýze dat

SEMESTRÁ LNÍ PRÁ CE. Licenč ní studium STATISTICKÉZPRACOVÁ NÍ DAT PŘ I KONTROLE A Ř ÍZENÍ JAKOSTI. Předmě t POČ ÍTAČ OVÁ ANALÝ ZA VÍCEROZMĚ RNÝ CH DAT

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

ZX510 Pokročilé statistické metody geografického výzkumu

Optimalizace parametrů hmotnostního detektoru (MS/MS) s využitím vícerozměrných statistických analýz

SEMESTRÁLNÍ PRÁCE 3.5 Klasifikace analýzou vícerozměrných dat

Univerzita Pardubice FAKULTA CHEMICKO TECHNOLOGICKÁ

Analýzy regionálního trhu práce v České republice Analysis of regional labour market in Czech Republic

Počet světlo-absorbujících částic v rovnovážné směsi faktorovou analýzou spekter

LEKCE 11 FAKTOROVÁ ANALÝZA

SEMESTRÁLNÍ PRÁCE UNIVERZITA PARDUBICE. Fakulta chemicko - technologická Katedra analytické chemie

Vícerozměrné statistické metody

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA. Semestrální práce

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

UNIVERZITA PARDUBICE

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

Odhalení skryté struktury a vnitřních vazeb dat vícerozměrnou statistickou analýzou pitné vody

Vícerozm rná analýza dat metodou hlavních komponent a shluk

TVORBA GRAFŮ A DIAGRAMŮ V ORIGIN. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Kalibrace a limity její přesnosti

UNIVERZITA PARDUBICE. Semestrální práce z 5. soustředění

Faktorová analýza. PSY252 Statistická analýza dat v psychologii II

Univerzita Pardubice. Fakulta chemicko-technologická Katedra analytické chemie. Licenční studium Statistické zpracování dat

UNIVERZITA PARDUBICE

Identifikace zdrojů znečištění ovzduší měření a postupy

Počítačová analýza vícerozměrných dat v oborech přírodních, technických a společenských věd

Výstupy z výukové jednotky. 2. Princip faktorové analýzy

Předmět: 1.1 Využití tabulkového procesu jako laboratorního deníku Přednášející: Doc. Ing. Stanislava Šimonová, Ph.D., Doc. Ing. Milan Javůrek, CSc.

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Státnice odborné č. 20

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Explorační faktorová analýza - analýza hlavních komponent

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie

(n, m) (n, p) (p, m) (n, m)

Vícerozměrné metody. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Schematický úvod

UNIVERZITA PARDUBICE

Partial Least Squares regrese (PLS-R)

UNIVERZITA PARDUBICE

Internal bounds and hidden structure of the metallurgic data with the use of Multivariate Data Analysis MDA

Vnitřní vazby a skrytá struktura v hutnických datech vícerozměrnou statistickou analýzou

Vícerozměrné statistické metody

Tvorba grafů v programu ORIGIN

Tvorba nelineárních regresních modelů v analýze dat

Analýza hlavních komponent

PYTHAGORAS Statistické zpracování experimentálních dat

Univerzita Pardubice

Vícerozměrné statistické metody

Tvorba grafů a diagramů v ORIGIN

Statistické zpracování naměřených experimentálních dat za rok 2012

PCA BIPLOT ŠKÁLOVÁNÍ OS (1)

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE

Inovace bakalářského studijního oboru Aplikovaná chemie

UNIVERZITA PARDUBICE FAKULTA EKONOMICKO SPRÁVNÍ BAKALÁŘSKÁ PRÁCE 2008 PETR ŠIMER

Cronbachův koeficient α nová adaptovaná metoda uvedení vlastností položkové analýzy deskriptivní induktivní parametrické

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

11.Metody molekulové spektrometrie pro kvantitativní analýzu léčiv

DISPARITY KRAJŮ ČR. Pavla Jindrová Univerzita Pardubice, Fakulta ekonomicko-správní, Ústav matematiky

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Thermodynamické disociační konstanty antidepresiva Vortioxetinu

Statistika (KMI/PSTAT)

Regresní analýza 1. Regresní analýza

magnetizace M(t) potom, co těsně po rychlé změně získal vzorek magnetizaci M 0. T 1, (2)

SEMESTRÁLNÍ PRÁCE. Klasifikace analýzou vícerozměrných dat. Ing. Pavel Bouchalík

Statistika pro geografy

Úvodem Dříve les než stromy 3 Operace s maticemi

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

Statistická analýza jednorozměrných dat

Protonační rovnováhy léčiv faktorovou analýzou a nelineární regresí absorbanční responzní plochy

VI. česko-slovenská konference Doprava, zdraví a životní prostředí Brno

Transkript:

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti. Autor práce: Přednášející: Prof. RNDr. Milan Meloun, DrSc

Zpracovávaná data jsou výstupem z výrobních procesů při výrobě pigmentu TiO. - -

Obsah Metoda hlavních komponent (Principal Components Analysis).... Zadání.... Naměřená data.... Indexový graf úpatí vlastních čísel.... Graf komponentních vah....5 Rozptylový diagram komponentního skóre....6 Dvojný graf (Biplot)... 5.7 Numerické výpočty pro neredukované proměnné... 5.8 Graf komponentních vah po první redukci... 6.9 Rozptylový diagram komponentního skóre po první redukci... 7.0 Numerické výpočty po první redukci... 7. Graf komponentních vah po druhé redukci... 8. Rozptylový diagram komponentního skóre po druhé redukci... 8. Numerické výpočty po druhé redukci... 9. Závěr... 9 Faktorová analýza.... Vypočtené parametry.... Grafické zobrazení.... Závěr:... Hierarchické klastrování.... Grafické zobrazení.... Závěr:... Přílohy... - -

Metoda hlavních komponent (Principal Components Analysis). Zadání Pigment TiO je vyráběn kontinuálním procesem, přesto dochází při výrobě ke změně některých podmínek (změna vstupní suroviny, odchýlení technologických parametrů atd.), které mohou ovlivnit výsledné vlastnosti výrobku. Proto je pigment expedován po výrobních šaržích, které vzhledem k velikosti ( tun) zaručují stejnou kvalitu. V průběhu delšího období se však mohou tyto šarže u jednoho typu výrobku lišit, přestože stanovení sledovaných parametrů (vzhledem k jejich počtu a vzájemných vazeb) toto neodhalíné. Posuďte u typu R00M vzájemné vztahy mezi stanovovanými parametry a pokuste se najít takové charakteristiky, které by pomohly včas odhalit případné odchýlení, aniž by bylo nutno pracně analyzovat celou škálu parametrů. Zjistěte, zdali ve sledovaném období byly šarže R00M shodné. K dispozici je 66 šarží.. Naměřená data U 66 šarží R00M bylo sledováno 0 parametrů (viz. příloha ). Tabulka I: Sledované parametry označení parametr TiO_% obsah TiO tek_lat těkavé látky mer_vod měrná vodivost ph_vyluh ph výluhu zb_b zbytek B Sp_olej spotřeba oleje Ba barvivost Podton podtón L_pasta L* v bílé pastě b_pasta b* v bílé pastě HEMP_85 dispergace HEMP_85 rutil obsah rutilu C_% obcah C d 50 velikost částic (d 50) AlO_% obsah Al O PO5_% obsah P O 5 KO_% obsah K O NbO5_% obsah Nb O 5 S_% obsah S ZrO_% obsah ZrO Data byla zpracována v programu CSAN. pomocí algoritmu NIPALS. - -

. Indexový graf úpatí vlastních čísel Vlastní čísla (Eigenvalues) slouží k určení počtu hlavních komponent (Components). NIPALS Eigenvalue (Scree) Plot 5 eigenvalues 0 5 6 7 8 9 0 components Obrázek : Indexový graf úpatí vlastních čísel Na indexovém grafu vlastních čísel (velikost vlastních čísel proti stoupající hodnotě indexu) vidíme užitečné hlavní komponenty odděleny zlomem. Význam mají nanejvýš tři.. Graf komponentních vah NIPALS Loading Plot 0.5 Sp_olej second component 0.5 0.5 0.05-0.05-0.5 S_% d 50 mer_vod AlO_% ph_vyluh rutil ZrO_% Ba C_% b_pasta KO_% TiO_% -0.5-0.5 HEMP_85 tek_lat zb_b NbO5_% Podton L_pasta PO5_% -0. -0. -0. -0. 0.0 0. 0. 0. 0. first component Obrázek : Graf komponentních vah pro 66 objektů a 0 proměnných Porovnáním vzdáleností a úhlů mezi jednotlivými průvodiči (úhel je nepřímo úměrný velikosti korelace mezi proměnnými) určíme společné nebo velmi podobné vlastnosti..5 Rozptylový diagram komponentního skóre Tento diagram ukazuje celou strukturu objektů (shluky, izolované objekty, odlehlé objekty). - -

NIPALS Score Plot second component 5 - - -5 6 9 8 0 7 5 6 5 9 09 08 05 0 95 76 6 9 5 07 88 9 98 0 8 77 09 75 7 87 96 8 69 86 7 8 7 85 60 7 80 7 78 79 70 68 5 58 9 58 8 6 55 5 5 577 6 56 56 58 0 8 7 5 5059 5 6 6 6 60 57 8 9 0 7 8 7 5 6 9 5 0 6 5 9 66 6 65 5 7 59 55 5 6 6 9 97 8 5 0 5 50 8 6 5 7 99 0 00 97 90 98 89 8 9 0 06 0 6 65 67 66 6 6-7 0-8 - first component.6 Dvojný graf (Biplot) Obrázek : Rozptylový diagram komponentního skóre pro 66 objektů a 0 proměnných. Tento graf je kombinací dvou předchozích a zobrazuje současně objekty a průvodiče proměnných. Je-li některý objekt umístěn ve dvojném grafu na místě (nebo poblíž) proměnné, je s ní v interakci. NIPALS Biplot second component - 6 9 8 7 0 5 9900 0 98 97 90 890 06 0 5 09 08 05 0 9 9 95 76 6 5 07 88 9 9 8 0 877 09 75 7 Sp_olej 96 87 S_% AlO_% d 50 C_% 8 69 86 b_pasta 7 8 85 7 7 80 mer_vod 79 7 60 78 6 6 7068 65 5 58 9 6 58 ph_vyluh 8 KO_% 55 67 666 6 6 ZrO_% Ba rutil 58 5 57 5 7 TiO_% 56 56 0 5 8 7 8 9 50 59 5 HEMP_85 L_pasta tek_lat NbO5_% Podton PO5_% 6 6 6 60 0 57 8 7 7 56 zb_b 9 5 0 65 9 66665 5 59 55 7 5 6 55 50 8 9 6 9 7 8 0 6 9 5 8 7-6 0-8 - first component Obrázek : Dvojný graf pro 66 objektů a 0 proměnných. Z grafů jsou je vidět, v souboru jsou čtyři odlehlé objekty (0,, 6, 7), které jsou mimo dva hlavní shluky..7 Numerické výpočty pro neredukované proměnné Tabulka II: Sledované parametry - 5 -

Hlavní Hlavní Eigenvalue Proporčně Kumulativně komponenta komponenta Eigenvalue Proporčně Kumulativně.9 0.6 0.6 6.0 0.05 0.7.0975 0.05 0.50 7 0.9 0.06 0.778.085 0.0 0.55 8 0.75 0.07 0.8.68 0.07 0.6 9 0.608 0.00 0.8 5.0 0.057 0.680 0 0.59 0.06 0.87 První tři latentní proměnné vysvětlují 55. % variability. Vysoké korelace a tedy i podobné vlastnosti v tomto souboru mají: Podtón a obsah Nb O 5 L* v bílé pastě a obsah P O 5 Zbytek B a Hempl_85 Barvivost a Rutil Měrná vodivost, ph výluhu a obsah Al O d 50 a obsah S b* v bílé pastě a obsah uhlíku Na základě vyšetření grafu komponentních vah a znalosti problematiky stanovení analytických parametrů bylo rozhodnuto o vypuštění následujících parametrů: Podtón L* v bílé pastě Zbytek B Barvivost Rutil Měrná vodivost, ph výluhu b* v bílé pastě.8 Graf komponentních vah po první redukci NIPALS Loading Plot 0.5 0. C_% - 6 - Sp_olej

.9 Rozptylový diagram komponentního skóre po první redukci NIPALS Score Plot second component 0 - - - - 6 8 9 0 7 5 99 97 98 6 0 00 5 95 0 9 0 96 0 909 9 08 8 07 8988 906 5 05 76 0 009 7 7 9 8 77 86 8 87 75 8 7 77980 85 8 78 7 5 5 9 55 7 69 59 8 6 0 6 69 770 65 7 0 5 56 68 60 67 66 6 57 56 7 6 57 5 56 9 56 5 6 6 66 58 50 8 5 58 8 65 60 6 6 5 6 55 59 5 5 7 9 8 6 0 6 5 5 50 9 8 5 6 9 7 8 9 7 8 0-5 0-6 -8 - first component Obrázek 6: Rozptylový diagram komponentního skóre pro proměnných. Z grafů je vidět, že po první redukci proměnných se shluky změnily na tři. Stále je mimo šarže 0 (odlehlý bod)..0 Numerické výpočty po první redukci Tabulka III: Sledované parametry Hlavní Eigenvalue Proporčně Kumulativně komponenta Hlavní komponenta Eigenvalue Proporčně Kumulativně - 7 -

. 0.0 0.0 6 0.596 0.05 0.900.555 0. 0.56 7 0.07 0.07 0.98.9 0.6 0.67 8 0.55 0.09 0.966.7 0.0 0.775 9 0. 0.0 0.987 5 0.7857 0.07 0.86 0 0. 0.0 0.999 Po první redukci proměnných došlo ke zvýšení vysvětlené variability z 55. % na 67. %.. Graf komponentních vah po druhé redukci NIPALS Loading Plot 0. C_% Sp_olej second component 0. 0. 0. 0.0-0. -0. AlO_% ZrO_% S_% TiO_% -0. -0. -0.5 tek_lat NbO5_% PO5_% -0.5 0.0 first component 0.5 Obrázek 7: Graf komponentních vah pro 8 proměnných. Na grafu je vidět že proměnné se rozdělily v prostoru a mají přibližně stejnou míru informace. Teoreticky by se daly nahradit (zaměnit mezi sebou) proměnné AlO_% a TiO_%. Leží proti sobě a jsou přibližně stejně vzdáleny od počátku.. Rozptylový diagram komponentního skóre po druhé redukci NIPALS Score Plot nent 0 6 9 8 7-8 - 6 5 5 56 7 6 57 99 5 97 0 00 098 95 9 90 0 9 96 08 0 8 9 89889 0706 05 76 0 7 7 9 0 809 86 5 7 8 87 75 77 79 78 9 55 8 597 5 6 87 80 09 9 8 6 857 69 68 67 66 6 7 770 6 65 57 56 0 5 60 5 65

Po druhé redukci se shluky ještě výrazněji oddělily, Šarže 0 zůstává jako odlehlý objekt.. Numerické výpočty po druhé redukci Tabulka IV: Sledované parametry Hlavní Hlavní Eigenvalue Proporčně Kumulativně komponenta komponenta Eigenvalue Proporčně Kumulativně.56 0.5 0.5 6 0.5 0.09 0.95.58 0.8 0.6 7 0.66 0.09 0.97.0889 0. 0.75 8 0.88 0.05 0.999 0.875 0.097 0.850 9 0.008 0.00.000 5 0.987 0.055 0.905 - - - -. Závěr Jak se ukazuje z porovnání tabulek, podařilo se druhou redukcí zvýšit vysvětlenou variabilitu pro tři latentní proměnné o 0. % (z 55. % na 75. %). Pro dvě latentní proměnné y a y je zvýšení o 9.7 % (z 5.5 na 6. %). Latentní proměnné mají následující tvar: y = 0.8*TiO_% - 0.0*tek_latky + 0.88*Sp_olej 0.8*C_% - 0.8*AlO + 0.*PO5 + + 0.08*NbO5 0.5*S% y = 0.0*TiO_% - 0.*tek_latky + 0.*Sp_olej + 0.75*C_% - 0.07*AlO - 0.86*PO5-0.90*NbO5 + 0.7*S% Na rozptylovém grafu jsou patrné dva shluky, které jsou mimo hlavní mrak bodů. Tyto šarže jsou odlišné od ostatních. Tuto skutečnost lze odhalit u tohoto materiálu již při stanovení devíti parametrů (místo původních dvaceti). Výhodou je, že stanovení prvkového pozadí (obsahu Al O, P O 5, Nb O 5, S) lze provést při jednom měření pomocí rentgenové fluorescenční spektrometrie. - 9 -

Tato analýza vícerozměrných dat slouží jako podklad pro bližší zkoumání podmínek, při kterých došlo k odchýlení od standardní produkce u některých šarží. Latentní proměnné nelze jednoznačně pojmenovat, obě mají vazbu na fyzikální i chemické vlastnosti zkoumaného pigmentu. - 0 -

Faktorová analýza Při faktorové analýze byly vypočteny komunality při použití 5 faktorů. Pro rotaci bylo využito metody EQUIMAX (při rotaci je minimalizován rozptyl čtverců faktorových vah a současně je maximalizován součet čtvrtých mocnin faktorových zátěží).. Vypočtené parametry Tabulka V: Komunality a vysvětlený rozptyl pro zvolený počet faktorů Proměnná Komunalita pro zvolený počet faktorů 5 TiO_% 0.65 0.88 0.99 0.967 0.99 tek_latky 0.06 0.7 0.788 0.790 0.86 Sp_olej 0.00 0.77 0.60 0.899 0.97 C_% 0.9 0. 0.605 0.95 0.97 AlO_% 0.6 0.86 0.956 0.97 0.99 PO5_% 0.69 0.70 0.777 0.780 0.867 NbO_% 0.99 0.6 0.7 0.7 0.99 S_% 0.50 0.5 0.87 0.8 0.855 Vysvětlený rozptyl 0.5 0.650 0.779 0.86 0.97. Grafické zobrazení Factor Analysis Score Plot Unrotated Factors Rotated Factors.5.5 second factor 0 - - second factor.5 0.5-0.5 -.5 -.5 - -.5 - - 0 first factor - 0 first factor 5 6 Obrázek 9: Graf pro dva faktory před a po rotaci - -

. Závěr: Pro popis souboru je možné použít dvou (65 % variability), popřípadě tří faktorů (77.9 % variability). Po rotaci EQUIMAX byly získány následující komponentní váhy. Tabulka VI: Komponentní váhy po rotaci Proměnná Faktor Faktor Faktor Faktor Faktor TiO_% -0. -0.009-0.58 0.08-0.06 tek_latky 0.60-0.5 0.07 0.07-0.95 Sp_olej -0.60 0.9 0.06-0.0 0.7 C_% 0.00 0.5 0. -0.08 0.8 AlO_% 0.0 0.0 0.6-0.089 0.07 PO5_% -0.50-0.7-0.0-0.86-0.00 NbO_% 0.0-0.9 0. -0.7-0.09 S_% 0.69 0.97-0.7 0.5-0. - -

Hierarchické klastrování. Grafické zobrazení Bylo použito klastrování podle Eukleidovské vzdálenosti. Jde o grafické zobrazení závislosti veličin pomocí dendrogramů. Similarity 0.00 Dendrogram. 66.67 00.00 Observations Obrázek 0: Dendrogram Eukleidovská vzdálenost V dalším hodnocení bylo použito průměru a Eukleidovské vzdálenosti. Similarity.0 Dendrogram 6.67 8. 00.00 Observations Obrázek : Průměr a Eukleidovská vzdálenost. Závěr: Objekty je možné klasifikovat různými způsoby. Dendrogramy dokreslují PCA i FA. Objekty jsou seřaditelné do několika skupin podle podobnosti. - -

Přílohy Použitá data Výstup z programu SCAN. - -