Mendelova univerzita v Brně Agronomická fakulta Ústav technologie potravin Kalibrace NIR spektrometru pro aplikaci kvality obilovin Bakalářská práce Vedoucí práce: Ing. Viera Šottníková, Ph.D. Vypracovala: Jitka Vrbasová Brno 2010
PROHLÁŠENÍ Prohlašuji, že jsem bakalářskou práci na téma Kalibrace NIR spektrometru pro aplikaci kvality obilovin vypracovala samostatně a použila jen pramenů, které cituji a uvádím v přiloženém seznamu literatury. Bakalářská práce je školním dílem a může být použita ke komerčním účelům jen se souhlasem vedoucího diplomové práce a děkana Agronomické fakulty Mendelovy univerzity v Brně. dne. podpis diplomanta.
Poděkování Ráda bych poděkovala za odbornou pomoc a konzultace při zpracování zadaného tématu mé bakalářské práce především paní Ing. Viere Šottníkové, Ph.D. Dále bych chtěla poděkovat především rodině a přátelům za podporu při studiu.
ANOTACE Spektrometrie v blízké infračervené oblasti ( near-infrared spectrometry NIR spectrometry) je metodou molekulové spektroskopie, která využívá spektrální oblast blízkého infračerveného záření, tj. oblast vlnových délek 780 nm až 2500 nm resp. vlnočtů 12850 4000 cm -1. Tato technologie umožňuje rychlou, nedestruktivní a přesnou analýzu vzorků. Používá se především pro analýzu rozsáhlých sérií vzorků. Velmi důležitá je při používání NIR spektrofotometru kalibrace. Ta nám umožňuje kvantifikaci neznámého množství stanovované látky. Pro kalibraci je nutné mít dostatečný počet vzorků. Mezi základní ukazatele kvality obilnin patří obsah bílkovin u pšenice dále obsah mokrého lepku, hodnota Zelenyho sedimentace, u pšeničné mouky je důležitým ukazatelem číslo kyselosti. Tyto parametry se dají stanovovat referenčními metodami ale také pomocí NIR spektroskopie. Klíčová slova: NIR spektroskopie, kalibrace, obiloviny ANNOTATION Near-infrared spectrometry (hereinafter NIR) is a method of molecular spectroscopy that uses spectral region of near-infrared radiation, i.e. region of wave-length from 780 nm to 2 500 nm or 12 850 4 000 wave number cm-1. This technology provides fast, non-destructive and accurate analysis of assays. It is primarily used for the analysis of extensive series of assays. Calibration is also very important for the use of NIR spectrophotometer. It enables us to quantify unknown amount of a given compound. It is necessary to work with an adequate number of assays during a calibration process. The basic indicators of crops quality include the protein content; regarding wheat, these indicators are also the content of wet gluten and Zeleny s sedimentation value. An important indicator of wheat flour is an acid number. These parameters can be specified by reference methods or through the use of NIR spectroscopy. Key words: NIR Spectroscopy, Calibration, Cereals
OBSAH 1 ÚVOD... 7 2 CÍL PRÁCE... 9 3 LITERÁRNÍ PŘEHLED... 10 3.1 Princip a teorie infračervené spektroskopie... 10 3.2 Spektroskopie v blízké infračervené oblasti (NIR)... 13 3.3 Získávání NIR spekter... 13 3.3.1 Metody získávání NIR spekter... 15 3.3.2 Přístroje pro měření NIR spekter... 16 3.3.3 Srovnání FT NIR spektrometru s disperzním spektrometrem... 19 3.3.4 FT NIR spektroskopie její výhody a nevýhody... 20 3.3.5 Ovlivnění NIR měření... 21 3.4 Chemometrie... 22 3.4.1 Hodnocení a úprava spektrálních dat... 23 3.4.2 Metody vícerozměrné analýzy... 27 3.4.3 Jednorozměrná a vícerozměrná kalibrace... 28 3.4.4 Posuzováni spolehlivosti kalibrace... 32 3.4 Vybrané jakostní znaky obilovin... 37 3.5.1 Pšenice... 37 3.5.2 Žito... 42 3.5.3 Mouka... 46 4 ZÁVĚR... 48 5 POUŽITÁ LITERATURA... 50 6 PŘÍLOHY... 54 6.1 Přehled obrázků... 54
1 ÚVOD Spektrometrie v blízké infračervené oblasti ( near-infrared spectrometry NIR spectrometry) je metodou molekulové spektroskopie, která využívá spektrální oblast blízkého infračerveného záření, tj. oblast vlnových délek 780 nm až 2500 nm resp. vlnočtů 12850 4000 cm -1. Z jedné strany NIR oblast navazuje na viditelnou oblast, z druhé strany je ohraničena střední infračervenou oblastí. Tyto hranice nejsou zcela ostré, ale pohybují se v závislosti na tom, jestli jsou dané hranice vyvozeny z možností spektrometrů pokrýt danou oblast, nebo jsou vyvozeny z typu energetických přechodů, které se v dané oblasti pozorují. NIR spektroskopie se v současné době často využívá v různých odvětvích průmyslu, např. farmaceutický, papírenský či potravinářský. Dá se využít jak ke kvantitativnímu, tak i kvalitativnímu stanovení, častěji se ovšem využívá ke kvantitativnímu stanovení různých látek. Tato technologie umožňuje rychlou, nedestruktivní a přesnou analýzu vzorků. Používá se především pro analýzu rozsáhlých sérií vzorků, protože při jednom měření se stanoví velký počet parametrů. Další výhodou je, že pro analýzu je potřebné pouze malé množství vzorku, tudíž je možné oproti klasickým přímým metodám, získat potřebné údaje z malého množství vzorku ve velmi krátké době. Tato metoda se může tedy stát nástrojem on-line analýzy kvality. Mezi základní ukazatele kvality pšeničné mouky patří obsah bílkovin a mokrého lepku, hodnota Zelenyho sedimentace (ukazatel bobtnavosti lepku) a číslo poklesu (ukazatel stavu škrobovo-amylasového komplexu, zejména aktivity α-amylasy). V 80. letech byla NIR spektroskopie zavedena do mlýnsko-pekárenské praxe, stanovováním touto metodou bylo docíleno takové přesnosti, že nahradila doposud používané instrumentální metody. NIR technologie je velmi vhodnou metodou pro stanovení obsahu bílkovin, vlhkosti a popela v mouce a semolině. Dále se dají získat informace o vaznosti, poškození škrobu a granulaci či barvě. Metoda se dá aplikovat také na sledování kvalitativních ukazatelů mouky (Zelenyho test, číslo poklesu, vaznost mouky aj.) Velmi důležitá je při používání NIR spektrofotometru kalibrace. Ta nám umožňuje kvantifikaci neznámého množství stanovované látky. Pro kalibraci je nutné mít dostatečný počet vzorků. V této skupině vzorků by měla být zastoupena co nejširší 7
variabilita koncentrace. Dané vzorky jsou analyzovány nejprve referenční metodou, načež jsou následně proměřeny NIR technikou. Takto získaná data slouží k vytvoření kalibračního modelu. 8
2 CÍL PRÁCE Cílem bakalářské práce bylo: Vypracovat literární rešerši na téma Kalibrace NIR spektrometru pro aplikaci kvality obilovin Seznámit se s postupy, které jsou využívány při zjišťování kvality obilovin pomocí NIR spektroskopie Seznámit se s postupem kalibrace NIR spektrofotometru Ze zjištěných poznatků zpracovat bakalářskou práci 9
3 LITERÁRNÍ PŘEHLED 3.1 Princip a teorie infračervené spektroskopie Principem infračervené spektroskopie je pohlcování infračerveného záření molekulami stanovovaných látek. U infračervené spektroskopie se běžně místo vlnové délky udává vlnočet. Nejdůležitější oblast pro infračervenou spektrometrii je 4000-670 cm -1. Infračervenou spektrální zónu dělíme na 3 části: a) Blízká infračervená oblast (0,78 2,5 µm tzn. 12800 4000 cm -1 ) b) Střední infračervená oblast (2,50 50 µm tzn.4000-200 cm -1 ) c) Vzdálená infračervená oblast (50 1000 µm tzn. 200 10 cm -1 ) Infračervená spektra jsou vibračně rotační, jelikož energie infračerveného záření způsobuje pouze vibrační a rotační změny, ovšem již nedostačuje na změny elektronových stavů. Energetické hladiny rotačních stavů jsou si podstatně blíže než energetické hladiny vibračních stavů. Nastávají-li změny vibračních stavů, jsou doprovázeny i změnami rotačních stavů. Obr. 1 nám ukazuje rozvrstvení vibračních a rotačních energetických hladin (KLOUDA 2003). Obr. 1 Schéma některých vibračních (v), vibračně-rotačních (vr) a rotačních (r) přechodů v molekule (KLOUDA 2003) 10
NOVOTNÁ (1996), tvrdí, že vibrační pohyb molekuly, lze v nejjednodušším případě popsat modelem harmonického oscilátoru. Podle kvantové mechaniky mají stacionární stavy harmonického oscilátoru s vibračním kvantovým číslem n energii E (n), určenou vztahem: 1 E ( n) = h * v * n + 2 kde h je Planckova konstanta (6,626. 10 31 J.s), n = 0,1,2,3 vibrační kvantové číslo a v frekvence. V normálním stavu má molekula kvantové číslo n s nulovou hodnotou. U harmonického oscilátoru dochází ke změnám vibračního kvantového čísla pouze o jedničku. Tak je tomu i u nejčastějšího přechodu (1 0), tzv. fundamentálního přechodu. Frekvence pohlceného záření pak musí podle Planckovy podmínky odpovídat frekvenci vibrace oscilátoru. Záření o stejné frekvenci absorbuje oscilátor také při tzv. horských přechodech (n + 1 n), kde n 1, které vycházejí z tepelně excitovaných vibračních hladin. Ve skutečnosti se molekula chová jako oscilátor anharmonický. Energetické hladiny takového oscilátoru jsou určeny vztahem: E( n) 1 = n + x h c 2 2 1 n + 2 kde x e je tzv. konstanta anharmonicity. Tento model ukazuje, že se zmenšují diferenciace s rostoucím kvantovým číslem mezi sousedními hladinami. Anharmonicita vede k projevu tzv. svrchních tónů (overtony) ve spektru. Tyto tóny odpovídají přechodům, při nichž se kvantové číslo mění více než o jedničku. U spektra víceatomových molekul se projevují také přechody kombinační, které vznikají současnou změnou vibračního a kvantového čísla několika harmonických oscilátorů. Vlnočet kombinačních přechodů je přibližně roven součtu vlnočtů vibrací podílejících se na přechodu (NOVOTNÁ, 1996). Existence dipólového momentu molekuly je důležitou podmínkou pro absorpci infračerveného záření. Vnitřní energie molekuly se může zvýšit absorpcí elektromagnetického záření pouze za předpokladu, že zároveň dojde ke změně dipólového momentu. Intenzita infračervených pásů je úměrná velikosti změny dipólového momentu. Symetrická dvouatomová molekula, která má ve všech vibračních 11 e
stavech nulový dipólový moment, neabsorbuje žádné infračervené záření (VOLKA 1997). Dipólový moment a jeho změna úzce souvisí se symetrií molekuly, která představuje tyto prvky: rovinu symetrie, zrcadlovou rovinu symetrie a osy symetrie. Dále je rozlišována symetrie vibrační (symetrické nebo asymetrické vibrace) Vibrace molekuly se s rostoucím počtem atomů komplikují, neboť vedle valenční vibrace, kterou představovalo natahování a smršťování délky vazby u dvouatomové molekuly, může u víceatomové molekuly docházet také k vibracím, kdy se mění úhel mezi dvěma či více vazbami v molekule. Takové vibrace označujeme jako deformační vibrace. Jednotlivé deformační vibrace mají svoje bližší označení (obr. 2). Obr. 2 Znázornění některých vibrací Valenční vibrace: a symetrická, b antisymetrická, deformační vibrace rovinné: c kyvadlová (rocking), d nůžková (scissoring), deformační vibrace mimorovinné: e vějířová (waaging), f kroutivá (twisting) (VOLKA 1997) Jedná se o přibližný popis vibračního pohybu molekuly. Ve skutečnosti lze vibrační pohyb molekuly rozložit na 3n-6, pro lineární molekulu 3n-5 normálních kmitů (modů). Molekula s n atomy se chová jako soubor, v prvním přiblížení nezávislých, 3n-6 (3n-5) oscilátorů (VOLKA 1997). 12
3.2 Spektroskopie v blízké infračervené oblasti (NIR) V blízké infračervené oblasti (NIR) je identifikace absorpčních pásů značně složitější, protože v NIR spektru se projevují především svrchní tóny a kombinační přechody. Vzhledem k tomu, že pásy NIR oblasti jsou lineárními kombinacemi absorpčních pásů nalezených ve střední oblasti, je možné NIR spektrum modelovat na stejném principu. Pro praktické využití NIR spektroskopie, je spektrum hodnoceno globálně, za použití chemometrických metod. Právě z tohoto důvodu se NIR spektroskopie využívá především ke kvantitativní analýze (NOVOTNÁ, 1996). Absorpce molekuly v běžném IR spektru se projeví při přechodu ze základního stavu na první excitovanou hladinu, v NIR oblasti se projeví přechod na druhou, nebo třetí hladinu. Je možné také pozorovat kombinovanou absorpci, která vzniká kvůli interakci dvou vibrací v molekule. Intenzita absorpce je v NIR oblasti obecně mnohem nižší než v IR. Z toho plyne, že je nutné analyzovat koncentrovanější vzorky. Přestože jsou absorpční pásy v NIR spektru mnohem širší než v MIR, není možná identifikace látek na základě přiřazení pásů jednotlivým funkčním skupinám (CENTNER,1999). Spektroskopie v blízké infračervené oblasti, prakticky využívá rozsahu vlnočtů 4000-12000 cm -1 (vlnových délek 2,5 0,8 µm), vychází z významného objevu, který učinil matematik, astronom a hudební skladatel sir William Herschel. Již v roce 1800 dokončil práci, která prokázala existenci energie v prostoru mimo možnost detekce lidským okem, kterému dodnes říkáme blízká infračervená oblast (NIR) (ŠIKOLA, 2002). 3.3 Získávání NIR spekter Infračervená spektra látek je možné měřit u pevných, kapalných či plynných vzorků, jako absorpční či emisní spektra. Při chemických aplikacích NIR spektroskopie se většinou měří absorpce infračerveného záření. 13
Absorbance A = vyjádření množství pohlceného záření v procentech a je popsána vztahem: A = ( I I ) 0 I 0 100 (%) Transmitance T = propustnost, platí pro ni vztah: I I 0 T = T 100( %) kde I 0 vyjadřuje intenzitu monochromatického záření a I intenzitu záření po průchodu absorbujícím prostředím. Hodnoty T jsou vždy menší nebo rovny jedné. = I I 0 Dle Lamber-Beerova zákona platí: I 0 E = log = ε c d I z tohoto vztahu jasně plyne, že množství pohlceného záření, závisí na tloušťce vrstvy dané látky (d) nebo na její koncentraci (c). Dále v tomto vztahu E znamená optickou hustotu (absorbance, extinkce) a ε je dekadický extinkční koeficient. Všechny uvedené veličiny popisují velikost pohlceného záření (tj. T, A, E, respektive ε) a jsou závislé na vlnové délce záření a infračervené spektrum je znázorněním této závislosti, a to ve formě grafu, nebo v digitální formě jako soubor dvojic číselných hodnot absorpce-vlnová délka (HORÁK a PAPOUŠEK, 1976). Předpokladem klasické absorpční spektroskopie je, že měrný roztok je homogenní a nerozptyluje dopadající záření. Prakticky je ale splnění tohoto předpokladu nemožné, protože vždy dochází ke ztrátám energie, např. odrazem záření od vzorku. V NIR spektroskopii se většinou měří difúzní reflektance. Difúzně reflektanční spektroskopie předpokládá, že měřený vzorek je nehomogenní, dochází k rozptylu záření a pouze část odražené energie je zachycena detektory. Tato část odražené energie dříve než dopadne na detektor, projde více nebo méně vzorkem. Termín absorbance je u difúzní reflektance nahrazen termínem optická hustota OD (optical density) (WILSON, 1994). 14
Techniky měření NIR spekter lze rozdělit na techniky měřící absorbanci záření po průchodu vzorkem (transmitance) a techniky měřící absorpci záření po odrazu paprsku od povrchu vzorku ( reflaktanci) (WILSON, 1994). 3.3.1 Metody získávání NIR spekter a) Měření transmitance se používá pro získávání spekter kapalných nebo kašovitých vzorků. Je možné měřit též vlastnosti zakalených kapalin (např. mléka). b) Spekulární reflaktanci je možné využít při měření nerovnosti povrchu. V případě, že je povrch dokonale hladký a úhel odrazu se rovná úhlu dopadu, je vzorkem absorbována jen malá nebo žádná energie. Při nerovnostech povrchu dochází k odklonu odraženého paprsku záření. Tato odchylka je snadno měřitelná a můžeme tudíž takto získat informace o povrchu vzorku. Protože nedochází k žádné interakci záření se vzorkem, nelze získat mnoho informací o složení vzorku. c) Transflektační uspořádání se využívá v přístrojích, které zpracovávají pouze reflaktanční spektra při měření transmitance. Při tomhle uspořádání prochází záření vzorkem dvakrát, než dopadne na detektor. Tento typ měření není vhodný pro měření vzorků s vysokou optickou hustotou. d) Difúzní reflaktance je běžnou technikou pro měření NIR spekter suchých vzorků, složených z malých částic, která produkují difúzně reflaktanční spektra. Přístroje využívající tuto techniku obsahují integrační koule nebo víc než jeden detektor, které slouží k zaznamenání co největší části odraženého záření. Dnes většina přístrojů zaznamenává záření odražené od povrchu vzorku pod úhlem 45, při tom záření dopadá na povrch vzorku přímo. Spektra tudíž neobsahují téměř žádnou část spekulárně odraženého záření. Tato technika je nejpoužívanější v NIR spektroskopii. e) Interaktance při tomto typu měření je zaznamenáváno pouze záření, které projde vzorkem. Spektra tudíž neobsahují žádný typ odraženého záření. Touto technikou je možné měřit povrchové charakteristiky vzorků o větší tloušťce (př. Využití při hodnocení kvality ovoce a zeleniny) (WILSON, 1994). 15
3.3.2 Přístroje pro měření NIR spekter NIR spektrometry můžeme rozdělit do tří základních skupin. Vývojově nejstaršími přístroji jsou filtrové spektrometry. Tyto přístroje pracují pouze s určitými vlnovými délkami. Dále jsou to disperzní přístroje, tyto přístroje převádějí záření ze zdroje na monochromatické pomocí různě širokých štěrbin. Tento typ přístrojů se již dnes nahrazuje přístroji s Fourierovou transformací. Tyto přístroje zaznamenávají na detektoru tzv. interfenogram, který je následně převeden pomocí Fourierovy transformace na infračervené spektrum (STRAUCH, 1988). 3.3.2.1 Filtrové přístroje Tyto přístroje pracovaly s pevnými filtry, které měly úzce vymezený rozsah vlnových délek. Komerční filtrové přístroje disponují pevnými filtry. Počet těchto filtrů je různý, většinou je to 3-19 filtrů. Tyto filtry jsou umístěny na vodorovném otočném kotouči, schéma tohoto typu spektrometru je uvedeno na obr. 3. Rozsah měření a rozsah vlnových délek závisí na těchto filtrech a také na jejich počtu. Obr. 3 Schéma spektrometru s pevnými filtry na otočném kotouči (PERTEN INSTRUMENTS) 16
Filtrové přístroje mohou být vybaveny také nakloněnými filtry, které jsou umístěny v otočném prstenci. Nejnovější filtrové přístroje, měřící v NIR oblasti, mohou obsahovat až 20 filtrů, pro měření velmi širokého spektra (PERTEN INSTRUMENTS). 3.3.2.2 Disperzní spektrometry U disperzního spektrometru se záření, které vychází ze zdroje, dělí na dva rovnocenné svazky za pomoci zrcadel. Tyto svazky paprsků se nazývají měrný a srovnávací. Dále tyto paprsky prochází kyvetovým prostorem za kterým jsou pomocí rotujícího zrcadla střídavě přiváděny na vstupní štěrbinu monochromátoru. Zde je, na vhodném rozptylujícím prvku, záření spektrálně rozloženo. Rozptylujícím prvkem často bývá odrazná mřížka. Vybraná vlnová délka je definována konkrétní výstupní štěrbinou monochromátoru. Takto vymezený svazek záření je následně přiveden na detektor. Většinou se k detekci používá termočlánek. Vlnová délka záření dopadajícího na detektor se mění natočením rozptylujícího prvku. Monochromatičnost záření je zajištěna nastavením šířky štěrbin. Tímto postupem je na detektor přivedeno celé spektrum vlnových délek. Na detektor střídavě dopadá měrný a srovnávací paprsek, což je zajištěno rotací půlkruhového zrcadla. Jestliže se zrcadlo pohybuje rychle, vzniká na detektoru střídavá složka napětí, ta je kompenzována, u přístrojů pracujících na principu optické nuly, zasunutím hřebenové clony do srovnávacího svazku paprsků. Analogový záznam spektra se následně získá mechanickým převodem (KLÍČ et al, 1999). 3.3.2.3 FT NIR spektrometry V současnosti nejvíce využívané přístroje pro měření v NIR oblasti, jsou spektrometry s Fourierovou transformací (FT NIR). Principem funkce těchto přístrojů je interference záření. Infračervené spektrum získáme takzvanou Fourierovou transformací, což je matematická operace, která umožňuje převedení získaného signálu na infračervené spektrum. Díky tomu se podstatně zvyšuje citlivost, vlnočtová přesnost, rychlost a možnosti rozlišení (STRAUCH, 1988). 17
Základem metody infračervené spektroskopie s Fourierovou transformací je spojení interferometru (nejčastěji Michelsonova typu) s citlivým detektorem a počítačem. Spektrometry FTIR (obr. 4) používaní místo monochromátoru Michelsonova interferometru, který na principu interference zesiluje, resp. zeslabuje záření z polychromatického zdroje. Jedna část paprsku, který dopadá na polopropustný dělič paprsků, se od něj odráží na pevné zrcadlo, tady se odráží a vrací zpět k děliči paprsků. Druhá část paprsku přes polopropustný dělič paprsků prochází, odráží se od pohyblivého zrcadla zpět a od polopropustného děliče paprsků se odráží dolů. V tomto místě se setkává s první částí paprsku a interferuje s ní. Interferencí se zesilují paprsky, které se setkávají ve fázi. Postupně se mění vzdálenost pohyblivého zrcadla, a tím i vlnové délky zesíleného záření (KLOUDA, 2003). Obr. 4 Spektromert FTIR (KLOUDA, 2003) Výsledkem měření FT NIR spektrometrem je tzv. interferogram, který ukazuje závislost odezvy detektoru na čase. Infračervené spektrum se získá teprve upravením interferogramu pomocí matematického postupu tzv. Fourierové transformace (KLÍČ et al.,1999). 18
Zdrojem záření v NIR spektroskopii je wolframová nebo halogenová žárovka. Důležitou součástí zdroje ve spektrometru je také zobrazovací optika, která má za úkol vytvořit ze záření vycházejícího od zdroje svazek rovnoběžných paprsků. Pro větší spektrální rozlišení je nutné zmenšit prostorový úhel svazku přicházejícího ze zdroje zařazením vhodné clony. Spektrální rozlišení bude dáno maximálním dráhovým rozdílem dosažitelným interferometrem. Záření prochází dále děličem svazku paprsků, který musí mít vysokou propustnost i reflaktanci. Nejlépe tenké filmy s vysokým indexem lomu. V NIR oblasti je to především oxid železitý, který je nanesen na vhodném nosiči, tím je přesně zbroušené okénko (NOVOTNÁ 1998). Pro přesnou funkci interferometru je důležité přesné řízení pohyblivého zrcadla. Vychýlení zrcadla může způsobit to, že svazky paprsků nemohou interferovat. K detekci se používají fotovodivostní detektory např. křemíková dioda. Je nutné, aby detektor měl rychlou odezvu, protože signál zpracovávaný detektorem mívá dosti vysoké frekvence (STRAUCH, 1988). 3.3.3 Srovnání FT NIR spektrometru s disperzním spektrometrem U FT NIR spektrometru dopadá na detektor záření všech vlnových délek současně, kdežto u disperzního spektrometru dopadá v daném okamžiku pouze záření jedné vlnové délky. Na FT NIR detektor dopadá většina emitovaného záření ze zdroje, oproti disperznímu přístroji, kde se na detektor dostává pouze malá část záření, která je závislá na spektrální šířce štěrbiny monochromátoru. U disperzního přístroje je veškeré záření modulováno rotujícím polokruhovým zrcadlem na stejnou frekvenci. Takže se na detektor dostává i záření o jiné vlnové délce. Kdežto v interferometru je záření každé frekvence modulováno odlišně, takže nemůže nastat analogický jev. FT NIR spektrometry jsou schopné snadno změnit spektrální rozsah. Pomocí změny zdroje záření, děliče svazků a detektoru, což u disperzních spektrometrů není možné. Bylo provedeno porovnání disperzních (rozptylových) a fourier transformačních (FT) NIR přístrojů. Testy obou typů přístrojů byly provedeny na několika stanovovaných technologických znacích pšenice a pšeničné mouky. Jedná se především o stanovení obsahu bílkovin, stanovení vlhkosti a indexu tvrdosti - tyto znaky byly 19
sledovány u celé pšenice. Na pšeničné mouce byly testovány tyto hodnoty: bílkovina, amyláza a popel. FT NIR a NIR byly porovnatelné v tom, s jakou přesností provedly jednotlivá měření. Pokud se jedná o další hodnocení přístrojů, tak FT NIR měl snadnější přípravu vzorků, avšak požadované množství vzorku bylo 2krát větší než u NIR přístroje (ARMSTRONG et al., 2006). 3.3.4 FT NIR spektroskopie její výhody a nevýhody Výhody: a) Rychlost NIR spektroskopie poskytuje velmi rychle výsledky pro široké spektrum parametrů. Ve srovnání s klasickými, časově náročnějšími, laboratorními postupy se jedná o opravdu velmi rychlou metodu, jelikož klasické metody mohou trvat až několik hodin. b) Přesnost lze dosáhnout téměř shodných výsledků jako u referenčních metod. Podle kterých je NIR přístroj kalibrován. c) Nedestruktivní metoda d) Snadná obsluha e) Vzorek se nemusí speciálně připravovat a pro analýzu je potřeba jen malé množství vzorku. f) Je možné měřit přes transparentní obaly (např. sklo) g) Ideální metoda pro analýzu vzorků s vysokým obsahem vody h) Jedno NIR spektrum lze použít ke stanovení více parametrů Nevýhody: a) Není vhodné stanovovat obsah minoritních složek ve směsích b) Interpretace naměřených spekter je podmíněna použitím počítače s náležitým chemometrickým softwarem c) Při použití nepřesné referenční metody dojde k ovlivnění kalibrace a tím i k nechtěnému ovlivnění věrohodnosti kvantitativních výsledků d) Pro vytvoření kalibračního modelu je třeba velký počet vzorků, což je spojeno s vyššími náklady e) Vyšší pořizovací cena přístroje (CENTNER 1999) 20
f) Pravidla pro použití NIR přístrojů: a) Kalibrace NIR přístroje by měla být prováděna pomocí přesných a spolehlivých referenčních metod. b) NIR spektroskopie by měla být považována za druhotnou techniku c) Kalibraci přístroje je nutné pravidelně kontrolovat d) Kalibraci je možné přenášet pouze mezi stejnými přístroji e) Při proměřování vzorků je nutné dbát na to, aby proměřované vzorky byly podobné vzorkům kalibračním (SHADOW, 1997) 3.3.5 Ovlivnění NIR měření Jisté vlivy mohou ovlivnit přesnost měření jak vzorků, tak i vytváření kalibračního modelu. Za určitých podmínek se můžou naskytnout problémy, které jsou spojeny se spektroskopickým měřením v NIR oblasti. Měření může být ovlivněno jak ze strany vzorku tak i přístroje. Jestliže se ovšem zamyslíme nad jednotlivými faktory ovlivňujícími měření, zjistíme, že jsou shodné s faktory ovlivňujícími i jiné spektroskopické metody. Faktory spojené s přístrojem: a) Spektrální šum b) Rozptýlené světlo c) Nelineární signál d) Výběr vlnové délky e) Matematická úprava spekter f) Vyhlazování optického signálu g) Statická elektřina h) Zdroj energie i) Teplota přístroje 21
Faktory spojené se vzorky a) Účinek chemických složek na fyzikální stav vzorku b) Interakce mezi chemickými složkami c) Chemické složení vzorku zahrnující přítomné absorbující skupiny d) Vlhkost vzorku před a po mlecím procesu e) Hustota vzorku f) Fyzikální struktura g) Vnější faktory ovlivňující fyzikální podstatu vzorku (poškození způsobeno např. počasím mráz, slunce, atd.) h) Teplota vzorku i) Teplota okolí j) Druh vzorku a jeho různé podoby k) Míchání po drcení l) Chemické nebo fyzikální analýzy m) Skladování vzorku před měřením a po drcení nebo mletí n) Čistota a balení o) Všeobecné neopatrnosti (GIANGIACOMO, NZABONIMPA, 1994) 3.4 Chemometrie Dříve byla využívána při analýze výsledků, především logika. V dnešní době jsou výsledky kvalitativních pokusů zpracovávány především matematickými metodami za použití počítače. Z tohoto důvodu je chemická analýza úzce spjata s oborem chemometrie, což je chemická disciplína, která využívá matematických metod: 1. K volbě optimální experimentální strategie 2. K získání maxima relevantních informací z experimentálních výsledků a k jejich prezentaci. Chemometrické zpracování umožňuje získat z dat informace, které nejsou bez takového zpracování patrné a tím ulehčuje výklad určitého chemického jevu a jeho příčiny. Chemometrie vznikla koncem šedesátých a začátkem sedmdesátých let a od té doby se stále vyvíjí. Poprvé použil název chemometrie Wold v roce 1972. V první polovině 22
sedmdesátých let bylo charakteristické zaměření se na fyzikálně-chemické metody a výsledky. V druhé polovině sedmdesátých let vzrostl zájem o komplikované systémy s velkým počtem subsystémů a složitými reakcemi mezi nimi. Tyto složité systémy navíc disponují celou řadou faktorů, které ovlivňují funkci systému a podléhají vzájemným interakcím. Z čehož plyne, že je nutné zpracovávat vícerozměrné soubory dat, je nutné využít faktorovou analýzu, multikriteriální rozhodování atd. V NIR spektroskopii bylo nutné zavést nové vylepšené moderní vyhodnocovací programy, které pracují na principu vícenásobné lineární regrese. Mezi tyto metody patří: a) Metoda hlavních komponent (PCR) b) Metoda částečných nejmenších čtverců (PLS) Cílem zavedení těchto metod, bylo vyvinutí přesnějšího kalibračního modelu a získání propracovaného systému možností statistického zpracování výsledků (ECKSCHLAGER, 1991). 3.4.1 Hodnocení a úprava spektrálních dat Typická NIR spektra jsou charakterizována lineárním rostoucím trendem od kratších k delším vlnovým délkám, což je způsobeno rozptylem, který závisí na velikosti pevných částic vzorku a vlnové délce dopadajícího záření. NIR spektra (16000-4000 cm -1 ) jsou v porovnání se spektry ve střední oblasti IR (MIR) prakticky prázdná. Protože vícekvantové přechody, tzv. overtony, jsou vzhledem k základním, tzv. fundamentálním, (tvořící MIR spektra), méně pravděpodobné. Proto pozorujeme v NIR spektru jen obalovou křivku těchto absorpčních čar a změny v jejich počtu, intenzitě nebo poloze se projeví většinou jen nepatrnou změnou na této obalové křivce. Proto na rozdíl od experimentální snadnosti, je jak kvalitativní tak i kvantitativní vyhodnocení NIR měření poměrně komplikovanou matematickou záležitostí. 1) Úprava spekter derivací Derivováním se vizuálně zúží široký absorpční signál. Při první derivaci je nula v místě maxima signálu, takže odečtení jeho polohy může být těžší. Z tohoto důvodu se používá druhá derivace, která má v místě maxima signálu ostrý, záporný pík. Někdy je 23
takto možné odhalit ve spektru přítomnost signálů, které by jinak zanikly pod obalovou křivkou. Polohy signálů se udávají buď ve vlnočtech (cm -1 ), nebo ve vlnových délkách (nm). Přepočet mezi těmito jednotkami je velmi jednoduchý. Údaj v cm -1 (nm) dostaneme, když jeden tisíc vydělíme desítitisícinou údaje v nm (cm -1 ), např.: 1000:0,2500 = 4000 resp. 1000:0,4000 = 2500 2) Úprava spekter Fourierovou transformací Fourierova transformace je matematická operace, díky které je možné převést data z časové oblasti do oblasti frekvenční a naopak. Jestliže f (λ) = 1, 2, n, jsou absorbance pro n stejně od sebe vzdálených vlnových délek a je-li n číslo sudé, pak je možno spektrum aproximovat následující rovnicí: n / 2 n / 2 2πkλ f ( λ) = a0 + ak cos + b k 1 n k = 1 2πkλ sin k = n kde a k a b k jsou Fourierovy koeficienty. Zatímco NIR spektrum se skládá třeba z 500 bodů, je potřebná informace o něm obsažena asi jen v 50 100 Fourierových koeficientech. Další a k a b k (k>100) obsahují jen informace o šumu či jiných ostrých změnách NIR linie. Fourierovou transformací NIR spektra a jeho zpětnou generací pomocí menšího počtu Fourierových koeficientů lze spektrum očistit od značné části experimentálního šumu. 3) Metoda hlavních komponent (PCA) V rozsahu 12000 až 4000 cm -1 změříme ve spektru po 4 cm -1 absorbance, tj. 2000 údajů. Je to tzv. originální spektrum. Tahle měření několikrát zopakujeme pro různá nastavení sondy, v různých dnech, na různých vzorcích zkoumané látky tak, aby byla proměřena co největší variabilita měření. Po zprůměrování těchto měření dostaneme tzv. průměrné spektrum zkoumané látky. Toto průměrné spektrum je vektor o rozměru d 1,2000. Můžeme si ho představit jako bod v n-rozměrném prostoru (n = 2000). Od látek, které přichází v úvahu, pro kvalitní analýzu změříme jak originální tak i průměrná spektra. Tímto postupem získáme soubor např. deseti průměrných spekter matici o rozměru D 10,2000. Tato spektra charakterizují analyzované látky, ale pro mnoho vlnočtů jsou absorpční údaje shodné nebo podobné. Důležitá je možnost získat formu 24
hlavních komponent, které vypočítáme např. singulárním rozkladem matice dat. Matici D nejdříve centrujeme a před singulárním rozkladem transponujeme v matici D. potom D 2000,10 =U 2000,10 x S 2000,10 x V 10,10 D 10,2000 =V 10,10 x S 10,10 x U 10,2000 Potom dvě hlavní komponenty: p 1 = V 10,1 x S 1,1 x S 1,1 p 2 = V 10,2 x S 2,2 tohle jsou souřadnice deseti bodů ve dvourozměrném grafickém znázornění. První dvě hlavní komponenty (p 1 a p 2 ) dostaneme výpočtem. Vyneseme je do grafu jako prázdné kroužky. Hlavní komponenty (P1 a P2) určíme z matic originálních spekter. Po zanesení do grafu vytvoří tyto body tzv. toleranční sféry, kolem bodů získaných z průměrných spekter. Největší vzdálenost bodu originálního spektra od odpovídajícího průměru označíme a 1 a a 2. Vzdálenost průměrů 1 a 2 označíme b 12. Poloměr toleranční sféry r 1 a r 2 je: a1 + b r1 = 10 12 r 2 a2 + b = 10 Překryv tolerančních sfér je možné charakterizovat jako tzv. interferenci: I 12 = ( r + r ) 1 b 12 Se spektrem neznámého vzorku postupujeme jako se spektry originálními. Po centrování ho vynásobíme maticí U 2000,2 a souřadnice pak vyneseme do grafu. Na základě toho, zda nový bod padne do některé z tolerančních zón, rozhodneme o výsledku analýzy. Jsou 3 varianty výsledku: a) Nový bod neleží v žádné toleranční sféře vzorek nelze přiřadit b) Nový bod leží v toleranční sféře průměru 1, ale je blíže průměru 2 přiřazené je nejisté c) Nový bod leží v toleranční sféře průměru a je k němu blíže než k průměrům jiným přiřazení vzorku je přípustné 2 12 25
Obr. 5 Toleranční sféry průměrů 1,2 a 3 a umístění nového bodu a ( ), b ( ( ) (HOLÍK, 1998) ) a c V předchozích kapitolách jsme se zabývali jen dvěma hlavními komponentami. Pro rozlišení některých analytů je potřeba znát ještě další hlavní komponenty, tj. třetí, čtvrtou atd. Pakliže jsou významné tři hlavní komponenty, je možné místo dvourozměrného zobrazení zvolit trojrozměrné. Takže místo tolerančních elips nebo kruhů v grafu vyznačíme toleranční elipsoidy nebo koule. Důležité je vědět, že celkovou variabilitu v matici vysvětlují hlavní komponenty postupně, tzn. První, vysvětluje největší důvod variability, druhá vysvětluje variabilitu, která nebyla zahrnuta do první. Variabilita, jež nebyla vysvětlena první a druhou hlavní komponentou je osvětlena třetí komponentou atd. Z tohoto je jasně patrné, že význam hlavních komponent postupně klesá. Čím vyšší hlavní komponenta, tím je vyšší pravděpodobnost, že bude zahrnovat už jen variabilitu šumu, tudíž nemá pro analýzu význam. Z tohoto důvodu je lepší rozdělit soubor na několik podsouborů které obsahují látky sobě více podobné (HOLÍK, 1998). 26
3.4.2 Metody vícerozměrné analýzy Zabývá se zkoumáním vztahů mezi složkami náhodného vektoru. V tomto případě se volí koncepce latentních proměnných (hlavních komponent, faktorů, kanonických proměnných) y, které jsou lineární kombinací původních proměnných x s vhodně volenými vazbami. Latentní proměnná y je kombinací m-tice sledovaných (měřených, či jinak získaných) proměnných x 1, x 2,.,x m ve tvaru: y=w 1 x 1 +w 2 x 2 + +w m x m. U různých vícerozměrných metod mohou být stanoveny vahové koeficienty (w 1,w 2, w m ) různými způsoby. Vícerozměrné metody statistické analýzy umožňují většinou zpracování lineárních vícerozměrných modelů. U těchto modelů jsou vazby mezi proměnnými lineární. Techniky redukce proměnných na latentní proměnné jsou potřebné k určení struktury a vzájemných vazeb mezi proměnnými, ale i mezi objekty. Mezi tyto metody patří: analýza hlavních komponent (PCA) a metoda faktorové analýzy (FA). Důležitá metoda je i kanonická korelační analýza (CA), která slouží k určení vzájemných vazeb mezi proměnnými a nachází využití při zkoumání závislosti mezi dvěma skupinami proměnných. Jedna z těchto skupin je při tom považována za nezávisle proměnnou a druhá je považována za závisle proměnnou (MELOUN, MILITKÝ, 2002). Do více rozměrné můžeme zahrnout i několik dalších disciplín, kterými jsou: shluková analýza (cluster analysis), analýza hlavních komponent (principal komponent analysis-pca), faktorová analýza (factor analysis-fa) a diskriminační analýza. Shluková analýza nazývá se tak celá řada výpočetních postupů, které mají za cíl rozložit daný soubor na několik relativně homogenních podsouborů (shluků) tak, aby jednotky (objekty) obsaženy v podsouborech si byly co nejméně podobné. Každá jednotka je popsána skupinou znaků (proměnných). U tohoto typu analýzy se jedná o podobnost resp. nepodobnost sledovaných jednotek. Tuto podobnost (nepodobnost) je třeba vyjádřit číselně, k tomu se používají tzv. míry vzdálenosti. Nejfrekventovanějšími mírami vzdálenosti jsou: a) Euklidovská vzdálenost (d E ) objektů i, j Definována vztahem: d p E ( X b, X i ) = ( xik x jk k = 1 ) 2 27
kde x ik je hodnota k-té proměnné i-tého objektu a x jk je hodnota k-té proměnné j-tého objektu. Nespornou výhodou Euklidovské vzdálenosti je její výpočetní jednoduchost, naopak nevýhodou předpoklad nekorelovanosti proměnných, jež je v praxi splněn jen zřídka. b) Mahalanobisova vzdálenost (d M ) objektů i, j 1 Definován vztahem: d ( P, P ) = ( p p ) C ( p p ) M i j i kde p i a p j jsou p-členné vektory proměnných i-tého a j-tého objektu a C je kovariační matice. Tato míra vzdálenosti přihlíží k vzájemným interkorelacím proměnných (ECKSCHLAGER et al., 1980). Diskriminační analýza je metodou, která zkoumá závislosti mezi skupinou p-nezávisle proměnných (tzv. diskriminátory, což jsou sloupce zdrojové matice na jedné straně) a jednou kvalitní závisle proměnnou (na straně druhé). Pomocí této analýzy je možné zařadit objekt do jedné z již existujících tříd. U vstupních dat jsou dány hodnoty diskriminátorů, na základě čehož jsou objekty zařazeny do primárních tříd. Dále jsou dány nezařazené objekty, pro něž budeme hledat zařazení do třídy. Objekt je zařazen do třídy na základě jeho největší míry podobnosti, např. nejmenší Mahalanobisovy vzdálenosti. Faktorová analýza řadí se k metodám redukce počtu původních proměnných (stejně jako metoda hlavních komponent). Při faktorové analýze předpokládáme, že každou vstupující proměnnou je možné vyjádřit jako lineární kombinaci nevelkého počtu společných skrytých faktorů a jediného chybového faktoru. Při faktorové analýze se snažíme vysvětlit závislost proměnných na rozdíl od komponentní analýzy. Nevýhodou této metody může být to, že je nutné zadat počet společných faktorů ještě před prováděním vlastní analýzy (MELOUN, MILITKÝ, 2002). j i j 3.4.3 Jednorozměrná a vícerozměrná kalibrace Kalibrace patří k základním úlohám praxe, které se řeší využitím regresních metod. Používá se při vývoji nových instrumentálních metod a také při konstrukci snímačů fyzikálních veličin a také přístrojů. Skládá se ze 2 fází: a) Sestavení kalibračního modelu 28
b) Použití kalibračního modelu Sestavení kalibračního modelu je shodné s hledáním regresního modelu. Ve druhé fázi se řeší úloha inverzí, tj. pro naměřenou odezvu y* je třeba najít odpovídající hodnota x* a její statistické charakteristiky (MELOUN, MILITKÝ, 1998). Kalibrace nám slouží ke zjištění závislosti mezi měřenou veličinou a požadovanou informací. Provádí se za využití standardů se známým obsahem analytu. Standardy můžeme rozdělit na vnější a vnitřní, podle způsobu použití. Nezávisle na analyzovaném vzorku je možno použít vnější standardy. Tyto standardy se analyzují současně se vzorky neznámého složení. Vnitřní standardy se přidávají přímo do analyzovaného vzorku. Kalibrace pomocí vnějších standardů se provádí tak, že se na m standardech obsahujících známé množství analytu x A změří intenzita signálu y, následně se tento vztah vyjádří kalibrační funkcí: y = f K ( x A ). Předem je nutné znát tvar funkce f K, velmi častou je lineární závislost, kde platí: y = a + bx A a= y 0 neboli: y = y 0 + bx A Citlivost charakterizuje směrnice kalibrační přímky b. Jelikož y je náhodná veličina, má kalibrační i analytická vyhodnocovací funkce charakter regresního vztahu. Tudíž závislost mezi signálem a obsahem analytu je tím těsnější, čím více se korelační koeficient kalibrace R blíží ±1 (ECKSCHLAGER, 1991). Vícerozměrná kalibrace se používá především v analytické chemii, podobně jako jednorozměrná kalibrace. U spektroskopie je hlavním cílem popis závislosti mezi naměřenými daty, např. spektrem X, a veličinami kalibračního modelu, např. koncentracemi látek ve směsi C. Proto je možné stanovit hodnoty koncentrací jednotlivých složek v neznámém vzorku (c*) z naměřeného spektra (x*). Stejně jako u jednorozměrné kalibrace, také u vícerozměrné existují dvě varianty kalibrace, a to: klasická kalibrace a kalibrace inverzní. a) Klasická vícerozměrná kalibrace Uplatňuje se v případě, jsou-li všechny sledované látky směsi známy stejně jako 29
látky, které s nimi mohou interferovat. Látky i interferenty je třeba mít fyzicky k dispozici. Následně je možné připravit umělé standardy, které jsou následně proměřeny při uvažovaných m vlnových délkách. Matice absorbancí X je výsledkem přítomnosti p látek o koncentracích C s absorpčními koeficienty β dle vztahu: X = C. β + E x (n, m) (n, p) (p, m) (n, m) x x x 11 21 n1... x... x... x 1m 2m... nm = c c c 11 21 n1... c... c... c 1p 2 p... np β... β 11 β... β 21 p1... β 1m 2m... β pm + e e e 11 21 n1... e... e... e 1m 2m... nm kde x ij je absorbance vzorku i při vlnové délce j, c ir je koncentrace látky r ve vzorku i, β ij je molární absorpční koeficient látky r, při vlnové délce j a e ij je chyba absorbance pro vzorek i, při vlnové délce j. Řešení této rovnice je možné pomocí metody nejmenších čtverců (MNČ), kdy se minimalizuje součet reziduí čtverců v matici E x. Výsledkem je odhad neznámých parametrů β klasického kalibračního modelu: β = (C r. C) -1. C r.x (p, m) (p, n) (n, p) (p, n) (n, m) každý r-tý řádek matice β představuje absorpční spektrum látky r při jednotkové koncentraci a jednotkové délce kyvety čili molární absorpční koeficient. Stanovení koncentrace všech p látek obsažených v neznámém vzorku (tj. c*), je možné při znalosti β. Na základě naměřeného spektra x* dle vztahu: c * r = β β β x r 1 ( ) * r (p, l) (p, m)(m, p ) (p, m)(m, l) 30
Klasická vícerozměrná kalibrace má v porovnání s jednorozměrnou kalibrací jisté výhody: 1) Lepší přesnost stanovení koncentrací neznámých vzorků 2) Absorpční měření X, použitá ke kalibraci, nemusí být selektivní vzhledem k C, čistá spektra stanovovaných látek se mohou libovolně překrývat 3) Je možná automatická korelace změny průběhu základní spektrální linie 4) Čistá a reziduální spektra stanovovaných látek je možné odhadnout. Což může vést k snadnějšímu pochopení studovaného kalibrovaného systému. Nevýhodou vícerozměrné kalibrace je omezení na případy, ve kterých jsou všechny látky směsi známé včetně interferentů a je nutné, aby byly tyto složky fyzicky k dispozici. V praxi je více využívána inverzní vícerozměrná kalibrace. b) Inverzní vícerozměrná kalibrace Při tomto typu kalibrace jsou požadavky minimální, oproti klasické kalibraci. Je nutná znalost koncentrace sledované látky v kalibračních vzorcích. Kalibrační vzorky mohou být komplexní směsi se složitou matricí a neznámými interferenty, např. přírodní, potravinářské nebo petrochemické materiály. U vzorků je zaznamenáno spektrum absorbance X a je sestrojen kalibrační model, který popisuje vztah mezi koncentrací sledované látky c a absorbancí X pomocí rovnice: c = X β + e c (n, l) (n,m) (m, l) (n, l) c c 1 2... = x x 11 21... x... x 1m 2m... β β 1 2... + e e 1 2... c n x n1... x nm β m e n 31
kde c i vyjadřuje koncentraci sledované látky v kalibračním vzorku i, x ij značí absorbanci tohoto vzorku při j-té vlnové délce, β j je regresní koeficient neboli molární absorpční koeficient pro vlnovou délku j a e i je koncentrační reziduum vzorku i, což znamená rozdíl mezi koncentrací stanovenou referenční metodou a koncentrací vypočtenou proložením kalibračních dat modelem. Odhad parametrů modelu pomocí metody nejmenších čtverců, je vyjádřeno vztahem: β = (X T. X) -1.X T.c (m, l) (m, n) (n, m) (m, n) (n, l) Je nezbytné, aby počet kalibračních vzorků n byl větší než počet vlnových délek m spektra, m>n, v případě že tato podmínka není splněna, neexistuje řešení pro danou rovnici, nelze totiž invertovat součin X T. X, a tudíž není možné odhadnout parametry β. Nejpoužívanější metodou konstrukce latentních proměnných je metoda hlavních komponent PCA a metoda nejmenších částečných čtverců PLS (Partial Least Squares). 3.4.4 Posuzováni spolehlivosti kalibrace V NIR analyzátorech jsou dnes kalibrace zpracovány částečně automaticky. V programovém vybavení přístrojů jsou dnes již běžně obsaženy kalibrační a regresní metody. Je nutné zvolit vhodnou kalibrační metodu, dále také vhodnou vlnovou délku pro kalibraci. Následně je nutné vyhodnotit spolehlivost vytvořeného kalibračního modelu. Praktickým cílem kalibrace je správné předpovězení určovaných parametrů nového vzorku s obdobnými vlastnostmi, jež má soubor kalibračních vzorků. (OSBORNE, 1993). 1) Směrodatná odchylka kalibrace (SEC) Směrodatná odchylka kalibrace je definována vztahem: N 1 SEC = ( y NIR xi ) N 1 i= 1 2 32
V tomto vztahu y NIR vyjadřuje předpověděnou hodnotu z NIR spektra, x i je referenční laboratorní hodnota i-tého vzorku a N značí počet kalibračních vzorků. 2) Směrodatná odchylka predikce (SEP) Spočívá v testování kalibračního modelu nezávislým souborem vzorků o známém složení. Na základě vytvořené kalibrační rovnice je určena koncentrace složky ze spektra. Tato metoda je definována vztahem: SEP = 1 M 1 M i= 1 ( y NIR x i bias) 2 V tomto vztahu y NIR udává hodnotu předpověděnou z NIR spektra, x i je referenční laboratorní hodnota validačního vzorku a M je počet validačních vzorků. Hodnota bias (průměrná diference mezi předpověděnými hodnotami z NIR spekter y NIR a referenčními hodnotami x i pro vzorky validačního souboru) je vyjádřena vztahem: M 1 bias = ( y NIR xi ) M i= 1 Je důležité aby SEP byla minimální, protože tato odchylka se očekává i v budoucích předpovědích. SEP spolehlivé kalibrace je obvykle jen o trochu větší než SEC. Optimální hodnota obou odchylek je hodnota 0 (MASSART et al, 1988). 3) Kalibrační variační koeficient (CCV) Využívá se pro porovnání spolehlivosti kalibrace NIR přístroje pro různé složky. Kalibrační variační koeficient je udáván v procentech a vypočítá se: CCV = SEC X prum 100 V tomto vztahu je SEC směrodatná odchylka kalibrace. X prum je poměr laboratorních hodnot složky. Výhodou této metody je nezávislost na použitých jednotkách. U velmi spolehlivé kalibrace se hodnota CCV pohybuje pod 5 %, u dobré kalibrace je CCV pod 10 % (MEIER, 1993). 4) Predikční variační koeficient (PCV) Predikční variační koeficient je obdobou kalibračního variačního koeficientu, je vyjádřen v procentech, tímto vztahem: 33
PCV = SEP X prum 100 V tomto vzorci je SEP směrodatná odchylka predikce a X prum je průměr laboratorních hodnot složky (MEIER, 1993). 5) Korelační koeficient (R) Jedná se o míru lineární závislosti mezi naměřenými spektry a referenčními laboratorními hodnotami. Nabývá hodnot od -1 (dokonalá negativní závislost) do +1 (dokonalá pozitivní závislost). Výpočet korelačního koeficientu mezi referenčními a předpověděnými hodnotami z NIR spekter je dán vztahem: R = N 2 [ ( xi x prum ) ( yi, NIR y NI, prum )] i= 1 N N ( xi x prum ) ( yi, NIR y NIR, prum ) i= 1 2 i= 1 V této rovnici je y NIR hodnota předpověděná z NIR spektra, x i je referenční hodnota i-tého kalibračního vzorku, y NIR, prum je průměrná hodnota y NIR, x prum je průměrná hodnota x i a N vyjadřuje počet vzorků. V některých případech je místo korelačního koeficientu uváděna jeho druhá mocnina, tzv. koeficient determinace (R 2 ). 2 6) Optimální počet PLS faktorů PLS faktory použité v kalibračním modelu zahrnují spektrální a současně koncentrační informaci. Faktory jsou řazeny podle množství variability, kterou reprezentují. Nejvíce variability kalibračních standardů popisuje první faktor. Každý následující faktor popisuje většinu ze zbývající variability. Většinu společné informace obsažené v datech obsahuje faktor první. Zbylé faktory popisují specifičtější informace reprezentující malé změny v datech. Tyto změny jsou však často pro analýzu důležité. Důležitým nástrojem pro vývoj kalibračního modelu, který umožňuje odhadnout optimální počet faktorů, je závislost PRESS (predicted residual error sum of squares) na počtu faktorů použitých ke kalibraci komponent PLS metody. Jestliže hodnota PRESS bude minimální, bude nalezen optimální počet PLS faktorů. Hodnota PRESS indikuje chyby kalibrace PLS metody. Vysoký počet PLS faktorů snižuje schopnost predikce, protože PRESS zahrnuje i spektrální šum (ESBENSEN, 1998). 34
7) Křížová validace Využívá se, jestliže není při zhotovování kalibračního modelu k dispozici nezávislý soubor vzorků. Principem kontroly je vyloučení určitého vzorku (nebo skupiny vzorků) z kalibračního souboru. Ostatní vzorky se použijí jako kalibrační a validační vzorek, postup se opakuje se všemi vzorky (EBSENSEN, 1998). 8) Identifikace odlehlých standardů K identifikaci odlehlých standardů se používají tři diagnostiky, které vyloučí kalibrační standardy ze souboru na základě spektrální nebo koncentrační odlišnosti (THERMONICOLET,2004). a) Principal Component Scores (PC Scores) znázorňuje graficky, jak je každý standard metody PLS, PCR, Discriminant Analysis nebo Distance Match reprezentován pomocí PC (všechny důležité spektrální informace analyzované oblasti jsou v průběhu kalibrace kondenzovány do souboru nových proměnných, tzv. principal components PC), které byly vypočítány pro kalibrovanou metodu. Každá PC představuje nezávislý zdroj spektrální proměnlivosti v kalibračních datech. PC se řadí podle množství variability, kterou reprezentují. Platí, že první PC popisuje nejvíce variability kalibračních spekter, každá další PC popisuje většinu ze zbývající variability. Tento způsob nám ověří, zda PC vypočítány pro kalibrační metodu, správně reprezentují spektrální data každého standardu. Body, které jsou izolované od ostatních, indikují, že korespondující standard je rozdílný od ostatních standardů v metodě. Je nezbytné, aby byla metoda před použitím diagnostiky kalibrována. b) Spectrum Outlier počítá Mahalanobisovu vzdálenost od průměrného spektra pro spektrum každého kalibračního standardu aktivní metody. Spektra, jež jsou nejvíce odlišná od ostatních standardů, jsou vyhledána a pomocí Dixonova nebo Chauvenetova testu je zjištěno, zda je odlišnost důležitá či nikoliv. Pro výpočet Mahalanobisovy vzdálenosti jsou využívány koncentrační a spektrální informace pro každý standard a stanovovanou složku. Diagnostika je založena na spektrálních informacích o všech standardech. 35
c) Leverage tato diagnostika nás seznamuje s tím, jaký vliv má každý ze standardů na kalibrační model a jak přesně kalibrační model popisuje každý standard. Po celém rozsahu generovaného grafu by měly být rovnoměrně distribuovány datové body. Izolovaný bod poukazuje na odlišnost příslušného standardu od ostatních v metodě. Vysoká hodnota Leverage (tj. vzdálenost bodu od těžiště modelu) značí, že standard má významný vliv na kalibrační model pro vybranou komponentu. Tuto diagnostiku je možné použít pouze pro algoritmus PLS. Je nutné, aby byla posuzovaná metoda kalibrována. 9) Testování parametrů U reálných případů je nutné předpokládat, že směrodatná odchylka referenční metody není zanedbatelná a je třeba uvažovat o působení náhodných chyb na výsledek měření touto metodou. Je posuzována správnost dvou souborů vzorků n 1 a n 2 s průměry x 1 a x 2 a rozptyly s 2 1 a s 2 2 pocházející z jedné populace s průměrem µ = µ 1 = µ 2. K porovnávání párových hodnot se používají dvě metody: a) Z-test je určen pro velké soubory (n>30) hodnot x i a y i je získán soubor odchylek výsledků párových měření d i charakterizovaný průměrem d prum a rozptylem s 2 d d. Statistika z, vypočítaná ze vztahu: z = s n představuje jednotkovou proměnnou, tzn. proměnnou s normálním rozdělením charakterizovaným průměrem 0 a rozptylem 1. Vypočtená hodnota se následně porovná s tabelovanou teoretickou hodnotou pro zvolenou hladinu významnosti. Platnost nulové hypotézy H 0 (oproti alternativní hypotéze H 1 ) se ověřuje použitím oboustranného testu: H 0 : µ 1 = µ 2 H 1 : µ 1 µ 2 Je důležité zvolení hladiny významnosti, na které se vybraný test provede. Tato hladina je označena jako α, a je definována jako pravděpodobnost odmítnutí nulové hypotézy. Obvykle se volí hodnota 0,05. Představuje tolerované riziko, které je definované jako pravděpodobnost, že hypotéza H 0 bude odmítnuta, přestože ve skutečnosti platí. Je možné připustit i opačný případ tzn., že nulová hypotéza bude přijata, přestože ve skutečnosti neplatí. Pravděpodobnost této odchylky se vyjadřuje jako β. Hodnota této odchylky se většinou volí 0,1. prum d 36