Základy. analýzy hlavních komponent a multivariačních regresních metod pro spektrální analýzu



Podobné dokumenty
11.Metody molekulové spektrometrie pro kvantitativní analýzu léčiv

Zpracování a vyhodnocování analytických dat

Tvorba trendové funkce a extrapolace pro roční časové řady

(n, m) (n, p) (p, m) (n, m)

SPOLEHLIVOST KONSTRUKCÍ & TEORIE SPOLEHLIVOSTI část 2: Statistika a pravděpodobnost

Řešení: ( x = (1 + 2t, 2 5t, 2 + 3t, t); X = [1, 2, 2, 0] + t(2, 5, 3, 1), přímka v E 4 ; (1, 2, 2, 0), 0, 9 )

Lokální a globální extrémy funkcí jedné reálné proměnné

Úvod. Analýza závislostí. Přednáška STATISTIKA II - EKONOMETRIE. Jiří Neubauer

Kvadratické rovnice pro učební obory

Dopravní úloha. Jiří Neubauer. Katedra ekonometrie FEM UO Brno

Infračervená spektroskopie - alternativní instrumentální technika při kontrole výroby bioethanolu

STANOVENÍ ETHANOLU V ALKOHOLICKÉM NÁPOJI POMOCÍ NIR SPEKTROMETRIE

M - Rovnice - lineární a s absolutní hodnotou

KIV/ZI Základy informatiky. MS Excel maticové funkce a souhrny

(a) = (a) = 0. x (a) > 0 a 2 ( pak funkce má v bodě a ostré lokální maximum, resp. ostré lokální minimum. Pokud je. x 2 (a) 2 y (a) f.

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie

Téma 10: Podnikový zisk a dividendová politika

Kvadratické rovnice pro studijní obory

Zvyšování kvality výuky technických oborů

Téma 8. Řešené příklady

Hodnocení způsobilosti procesu. Řízení jakosti

L 12 Statistická adaptace. Oddělení numerické předpovědi počasí ČHMÚ 2007

( ) Kreslení grafů funkcí metodou dělení definičního oboru I. Předpoklady: 2401, 2208

vzorek vzorek

Herní plán. Magic Stars

IS BENEFIT7 POKYNY PRO VYPLNĚNÍ ZJEDNODUŠENÉ ŽÁDOSTI O PLATBU EX-ANTE ZÁLOŽKA ŽÁDOST O PLATBU

Katedra matematiky Matematika a byznys Příklady odhadů a předpovědí časových posloupností

KVADRATICKÉ ROVNICE A NEROVNICE (včetně řešení v C)

6. Lineární regresní modely

ELEKTROTECHNICKÁ MĚŘENÍ PRACOVNÍ SEŠIT 2-3

Kvantové počítače algoritmy (RSA a faktorizace čísla)

4. Výčtem prvků f: {[2,0],[3,1],[4,2],[5,3]}

E-ZAK. metody hodnocení nabídek. verze dokumentu: QCM, s.r.o.

Pingpongový míček. Petr Školník, Michal Menkina. TECHNICKÁ UNIVERZITA V LIBERCI Fakulta mechatroniky, informatiky a mezioborových studií

Energetický regulační

1. Programování, typy programovacích jazyků, historie.

INŽENÝRSKÁ MATEMATIKA LOKÁLNÍ EXTRÉMY

ALGEBRA LINEÁRNÍ, KVADRATICKÉ ROVNICE

Umělá inteligence. Příklady využití umělé inteligence : I. konstrukce adaptivních systémů pro řízení technologických procesů

Vzdělávací oblast: Matematika a její aplikace. Obor vzdělávací oblasti: Seminář z matematiky. Ročník: 7. Poznámky

SPEKTROMETRIE V BLÍZKÉ INFRAČERVENÉ OBLASTI

Nerovnice s absolutní hodnotou

4. R O V N I C E A N E R O V N I C E

Univerzita Pardubice 8. licenční studium chemometrie

Popis připojení elektroměru k modulům SDS Micro, Macro a TTC.

Zadání Máme data hdp.wf1, která najdete zde: Bodová předpověď: Intervalová předpověď:

AUTORKA Barbora Sýkorová

JAK PŘIDAT UŽIVATELE PRO ADMINISTRÁTORY

Využití válcových zkušeben při ověřování tachografů. Prezentace pro 45. konferenci ČKS 1. část: metrologické požadavky

APLIKACE POKROČILÝCH METOD IČ SPEKTROSKOPIE

4.6.6 Složený sériový RLC obvod střídavého proudu

Odhalení skryté struktury a vnitřních vazeb dat vícerozměrnou statistickou analýzou pitné vody

Úloha č. 6 Stanovení průběhu koncentrace příměsí polovodičů

Peer Group User Quick Reference Cards

Matice a maticová algebra, soustavy lineárních rovnic, kořeny polynomu a soustava nelin.rovnic

{ } Kombinace II. Předpoklady: =. Vypiš všechny dvoučlenné kombinace sestavené z těchto pěti prvků. Urči počet kombinací pomocí vzorce.

STEREOMETRIE. Vzdálenost bodu od přímky. Mgr. Jakub Němec. VY_32_INOVACE_M3r0113

UNIVERZITA V PLZNI. Model ALADIN A08N0205P MAN/MA

SPEKTROMETRIE V BLÍZKÉ INFRAČERVENÉ OBLASTI

Pro vš echny body platí U CC = ± 15 V (pokud není uvedeno jinak). Ke kaž dému bodu nakreslete jednoduché schéma zapojení.

Klasifikace a rozpoznávání. Extrakce příznaků

Potravinárstvo. Zuzana Procházková, Michaela Králová, Hana Přidalová, Lenka Vorlová

Sada 2 Geodezie II. 11. Určování ploch z map a plánů

Optimalizace podmínek měření při práci s AAS Teorie:

Každý jednotlivý záznam datového souboru (tzn. řádek) musí být ukončen koncovým znakem záznamu CR + LF.

Komentář k datovému standardu a automatizovaným kontrolám obsahu F_ODPRZ_PNEU

Lineární algebra. Vektorové prostory

Historie výpočetní techniky Vývoj počítačů 4. generace. 4. generace mikroprocesor

1.3.1 Kruhový pohyb. Předpoklady: 1105

Strukturální regresní modely. určitý nadhled nad rozličnými typy modelů

SUPPORT VECTOR MACHINES

Pořízení licencí statistického SW

Dualita v úlohách LP Ekonomická interpretace duální úlohy. Jiří Neubauer. Katedra ekonometrie FEM UO Brno

INMED Klasifikační systém DRG 2014

STATISTICKÁ PŘEDPOVĚĎ ZNEČIŠTĚNÍ OVZDUŠÍ, NÁVRH A TESTY METODY. Josef Keder. ČHMÚ ÚOČO, Observatoř Tušimice keder@chmi.cz

Využití ICT pro rozvoj klíčových kompetencí CZ.1.07/1.5.00/

Výukový materiál zpracovaný v rámci projektu Výuka moderně

2.8.9 Parametrické rovnice a nerovnice s absolutní hodnotou

Leonardo. Montážní návod a schéma zapojení řídící jednotky. Programovaní řídící jednotky. 14.Kde nás najdete

Vývoj počítačů. Mgr. Renáta Rellová. Výukový materiál zpracován v rámci projektu EU peníze školám

Jakub Kákona,

3.2.4 Podobnost trojúhelníků II

( ) Neúplné kvadratické rovnice. Předpoklady:

Poznámky k verzi. Scania Diagnos & Programmer 3, verze 2.27

Dálkový průzkum Země. Ústav geoinformačních technologií Lesnická a dřevařská fakulta MENDELU

GIS analýza povrchového odtoku, erozních procesů a transportu splavenin. T. Dostal, J. Krasa, M. Štich, ČVUT v Praze

3D analýza dat Proces interpolace

Vyhledávání v databázi CINAHL with Fulltext prostřednictvím EBSCOhost. Příklad vyhledávání tématu pomocí předmětových hesel

( ) ( ) ( ) 2 ( ) Rovnice s neznámou pod odmocninou II. Předpoklady: 2715

Praktikum II Elektřina a magnetismus

3. Ve zbylé množině hledat prvky, které ve srovnání nikdy nejsou napravo (nevedou do nich šipky). Dát do třetí

DUM téma: KALK Výrobek sestavy

Postup práce s elektronickým podpisem

Zateplovací systémy Baumit. Požární bezpečnost staveb PKO PKO PKO

Luděk Jančář, Irena Jančářová

Zvyšování kvality výuky technických oborů

PŘEJÍMACÍ A PERIODICKÉ ZKOUŠKY SOUŘADNICOVÝCH MĚŘICÍCH STROJŮ

Označování dle 11/2002 označování dle ADR, označování dle CLP

KONSTRUKČNÍ ÚLOHY ŘEŠENÉ UŽITÍM MNOŽIN BODŮ

Oddělení teplárenství sekce regulace VYHODNOCENÍ CEN TEPELNÉ ENERGIE

Transkript:

Základy analýzy hlavních komponent a multivariačních regresních metod pro spektrální analýzu

Multivariační analýza dat použití mnoha proměnných zároveň základem tabulka - matice dat řádky - vzorky sloupce - proměnné proměnné - závislé - např. koncentrace proměnné - nezávislé - spektrální data proměnné - klasifikační ( category ) - třídění vzorků do skupin

Označení metod CLS - classical least squares ILS - inverse least squares MLR - multiple linear regression PCA - principal component analysis PCR - principal component regression PLS1 - partial least squares 1 PLS2 - partial least squares 2

Regrese CLS klasická metoda nejmenších čtverců - K-matrix předpoklad platnosti Lambertova-Beerova zákona při všech frekvencích - absorbance je funkcí koncentrace chyby modelu jsou přiřazeny chybám v určení absorbancí použitelná i pro celá spektra všechny komponenty musí být známy a zahrnuty do kalibrace

Regrese ILS inverzní metoda nejmenších čtverců - P-matrix předpoklad platnosti inverzního Lambertova- Beerova zákona pro všechny koncentrace - koncentrace je funkcí absorbance chyby modelu jsou přiřazeny chybám v určení koncentrací použitelná pro omezený počet frekvencí - obtíže jejich výběru komponenty nezávislé, postačuje znalost jedné složky v kalibračních směsích

Regrese MLR - vychází z ILS vícenásobná lineární regrese modely pro nekorelované spektrální proměnné NELZE JEDNODUŠE POUŽÍT PRO SPEKTRÁLNÍ INTERVALY separátní modely pro jednotlivé komponenty nemusí být známy všechny komponenty

Analýza hlavních komponent reorganizace informace v souboru dat hledání struktury dat NIKOLI REGRESE, NIKOLI KVANTITA analýza samotných spektrálních dat analýza souboru dat s velkým počtem proměnných redukce počtu proměnných na relevantní proměnné popisující variabilitu dat, zachování informačního obsahu

Analýza hlavních komponent Analýza dat s mnoha proměnnými určení hlavních komponent PC s - transformace spekter do jiného systému souřadnic uspořádání dat podél PC s - SCORES hledání spektrálních intervalů významně přispívajících k distribuci dat - ZÁTĚŽE - loadings

Analýza hlavních komponent Analýza dat s mnoha proměnnými První hlavní komponenta má směr největší variability dat Druhá a každá následující hlavní komponenta je ortogonální (kolmá na všechny předcházející) a popisuje maximální množství zbývající variability

Analýza hlavních komponent VÝPOČET HLAVNÍCH KOMPONENT nelineární iterační algoritmy příklad - NIPALS nonlinear iterative partial least squares method * postupný výpočet jednotlivých hlavních komponent * vhodný algoritmus pro malé počítače

Analýza hlavních komponent PŘÍKLAD

Analýza hlavních komponent PŘÍKLAD

Analýza hlavních komponent PŘÍKLAD

Analýza hlavních komponent PŘÍKLAD

Analýza hlavních komponent PŘÍKLAD

Analýza hlavních komponent PŘÍKLAD zátěže, váhy, loadings Velikost absolutní hodnoty Znaménko Příspěvek dané proměnné k jednotlivým hlavním komponentám

Analýza hlavních komponent PŘÍKLAD zátěže, váhy, loadings Pro více proměnných

Analýza hlavních komponent Data pro tři složky o různých koncentracích

Analýza hlavních komponent Data pro tři složky o různých koncentracích průměr a popis variability

Analýza hlavních komponent Příklad složení vody

Analýza hlavních komponent Příklad složení vody Ca Mg Na Cl - SO 4 2-

Analýza hlavních komponent Příklad složení vody

Analýza hlavních komponent Příklad složení vody

Analýza hlavních komponent Příklad složení vody Ca Mg Na 2- SO 4 Cl -

Analýza hlavních komponent Příklad složení vody

Analýza hlavních komponent Příklad složení vody

Analýza hlavních komponent Příklad složení vody

Regrese PCR regrese hlavních komponent PCA + regresní krok ILS modely pro více sledovaných analytů zároveň - multikomponentní separátní modely pro jednotlivé komponenty (počítány zároveň) nemusí být známy všechny komponenty modely pro celá spektra či široké spektrální intervaly

Regrese PLS ortogonální transformace dat do systému souřadnic označovaného jako hlavní komponenty - PC - redukce počtu potřebných proměnných

Regrese PLS 1 modely vždy pro jeden sledovaný analyt - 1 komponenta modely pro celá spektra či široké spektrální intervaly kalibrace - validace hledání optimálního počtu PC s

Regrese PLS 2 modely pro více sledovaných analytů zároveň - multikomponentní nemusí být známy všechny komponenty společný model pro všechny komponenty modely pro celá spektra či široké spektrální intervaly kalibrace - validace hledání optimálního počtu PC s

Hledání optimálního počtu hlavních komponent VYHODNOCENÍ PRESS prediction error sum of squares počítáno pro všechny zvažované počty hlavních komponent nalezení minima na křivce závislosti PRESS na počtu hlavních komponent

Výběr metody kvantitativní analýzy či klasifikace

Popis sledovaných analytů složek směsi

Výběr a popis kalibračních a validačních standardů

Výběr proměnných z kalibračních měření např. výběr spektrálního intervalu

Výběr proměnných z kalibračních měření např. výběr spektrálního intervalu - využití korelačních záznamů pro optimální volbu oblasti

Výběr proměnných z kalibračních měření např. výběr spektrálního intervalu - využití spočítaných (předpovídaných) spekter čistých složek

Nastavení dalších parametrů

Výsledky kalibrace - predikované vs. zadané hodnoty - diference

Výsledky kalibrace - tabulková forma

DIAGNOSTIKA - rezidua pro jednotlivé komponenty

DIAGNOSTIKA - rezidua pro jednotlivé komponenty Predicted Residual Error Sum of Squares (PRESS) Root Mean Square Error of Cross Validation (RMSECV) odmocnina střední kvadratické chyby křížové validace střední kvadratická chyba predikce RMSECV value for a given component and factor or shape is equal to the square root of the quotient of the PRESS value and the number of calibration standards.

Tabulka dat kalibračních, validačních, (neznámých) - Naměřená data, údaje o složení

Výběr metody kvantitativní analýzy

Výběr kalibračních vzorků

Výběr naměřených proměnných

Výběr stanovovaných proměnných koncentrací

Výběr validační metody

Výběr velikosti modelu počtu PC, centrování dat

Přehled výsledků kalibrace včetně základní diagnostiky

Přehled další diagnostiky

VALIDACE kalibračních modelů - postupy - sada validačních standardů, které nebyly použity při kalibraci - matematické postupy - metoda jeden vynech ( leave-one-out ) - úplná křížová validace ( crossvalidation ) - další cross-validace - náhodná, systematická (po segmentech)

VALIDACE kalibračních modelů

Regrese PLS pro MS spektra