KVALIMETRIE Miloslav Sucháek 16. Statistické metody v metrologii a aalytické chemii Řešeé příklady a CD-ROM v Excelu Eurachem ZAOSTŘENO NA ANALYTICKOU CHEMII V EVROPĚ
Kvalimetrie 16 je zatím posledí z řady příruček KVALIMETRIE, vydávaých odborým sdružeím EURACHEM-ČR. Příručka obsahuje přehled statistických metod, které se využívají v chemických laboratořích, a je doplěa přiložeým CD se šabloami a řešeými příklady růzých statistických postupů s využitím programu MS-Excel. Autor věří, že příručka dojde širokého uplatěí v chemických i kliických laboratořích. Příručka Kvalimetrie 16 vzikla v rámci projektů PRM VIII/18/09 Úřadu pro techickou ormalizaci, metrologii a státí zkušebictví a INGO LA 09014 MŠMT. Autor děkuje především Ig. Davidu Mildemu, Ph.D. za revizi výpočetí části příručky a RNDr. Pavlu Koříkovi, Ph.D. za techické práce při přípravě CD. Miloslav Sucháek Miloslav Sucháek: Statistické metody v metrologii a aalytické chemii. Řešeé příklady v Excelu a CD-ROM Editor Miloslav Sucháek K tisku připravil Iva Korua Miloslav Sucháek 009 EURACHEM-ČR 009 Vydal EURACHEM-ČR, Techická 5, Praha 6. IČ 48550400 www.eurachem.cz ISBN 80-863-04-1
OBSAH Úvod 5 1 Základí statistické parametry a testy hypotéz 7 1.1 Základí soubor a typy statistických rozděleí 7 1.1.1 Základí pojmy 7 1.1. Náhodé veličiy 8 1.1.3 Základí typy rozděleí 10 1. Statistika opakovaých měřeí, áhodý výběr 1 1.3 Nejistota výsledku 14 1.4 Nejistoty elemetárích operací v chemické a biologické laboratoři 17 1.4.1 Volumetrické operace 17 1.4. Vážeí 17 1.4.3 Nejistota hodoty měřeého sigálu 17 1.4.4 Titračí staoveí 18 1.5 Vyhodocováí ejistot postupy zdola ahoru a shora dolů 18 1.6 Testy hypotéz 19 1.6.1 Statistika opakovaých pokusů 0 1.6. Testováí hypotéz s použitím ejistoty výsledku 1 1.7 Příklady ke kapitole 1 Optimalizace měřicích postupů v chemii a biologických vědách 3.1 Pláováí experimetů 3. Experimetálí optimalizace 8.3 Příklady ke kapitole 31 3 Hodoceí závislosti mezi proměými 33 3.1 Lieárí regrese 33 3. Vážeá lieárí regrese 37 3.3 Lieárí regrese s ejistotami v obou proměých (bivariátí, bilieárí regrese) 38 3.4 Nelieárí regrese v biologických měřicích postupech 40 3.5 Další experimetálí pláy v kalibraci 4 3.5.1 Metoda přídavku stadardu (SAM) 4 3.5. Metoda bracketig 44 3.6 Příklady ke kapitole 3 45 4 Validace měřicích postupů 47 4.1 Termiologie 47 4. Experimetálí plá pro validaci 48 4.3 Selektivita (iterferece) 48 4.4 Rozsah měřeí, liearita 49 4.5 Opakovatelost 50 4.6 Reprodukovatelost 50 4.7 Výtěžost 50 4.8 Mez detekce, mez staovitelosti 51 4.9 Robustost měřicího postupu 53 4.10 Příklady ke kapitole 4 54 3
5 Statistické metody při přípravě a používáí referečích materiálů 55 5.1 Statistické pricipy certifikace 55 5.1.1 Staoveí ejistoty homogeity 55 5.1. Staoveí ejistoty stability 57 5. Použití certifikovaých referečích materiálů 58 5.3 Příklady ke kapitole 5 58 6 Mezilaboratorí porováí 59 6.1 Norma ISO 1358 59 6. Harmoizovaý protokol IUPAC 61 6.3 Kvalitativí zkoušky 61 7 Kotigečí tabulky 63 7.1 Příklady ke kapitole 7 66 8 Vícerozměré metody 67 8.1 Kovariačí matice a testy hypotéz 67 8. Boxův test 69 8.3 Ověřeí úplé ezávislosti zkoumaých proměých 69 8.4 Lieárí diskrimiačí aalýza 70 8.5 Lieárí diskrimiačí aalýza pro více skupi (k > ) 7 8.6 Příklady ke kapitole 8 73 9 Používáí referečích materiálů při řízeí kvality (ISO Guide 80) 75 9.1 Homogeita 75 9. Dlouhodobá stabilita 76 9.3 Použití QCM při tvorbě regulačích diagramů 77 10 Literatura 79 11 Sezam zkratek 81 4
Úvod V příručce Kvalimetrie 16 jsme se pokusili podat přehled statistických a chemometrických postupů, které mohou být využity při zpracováí a iterpretaci experimetálích dat. Pracovíci laboratoří, pracující v oborech přírodích věd, používají často při zpracováí experimetálích dat des běžě dostupé programové vybaveí tabulkový procesor MS-Excel. Přílohou této příručky je CD-ROM, který obsahuje jedak řešeé příklady, jedak šabloy (templáty) pro řešeí jedotlivých statistických postupů. Excelové sešity jsou otevřeé, tedy ezamčeé, a mohou být využity při řešeí obdobých problémů. Pro validaci zmíěých sešitů a jiých počítačích jsou přiložey výsledky příkladů v souborech formátu MS-Word. Uživatelům příručky doporučujeme, aby příliš ezasahovali do struktury sešitů, zvláště v případech, kdy je použito makro. Doporučujeme pouze jedoduché úpravy, apř. rozšířeí počtu vstupích údajů ebo zaokrouhleí výstupích dat. Používaí excelových sešitů vyžaduje pouze základí zalosti Excelu. V případě jakékoliv pochybosti ebo efukčosti ěkterého z přiložeých sešitů kotaktujte autora této příručky a emailových adresách miloslav.suchaek@vscht.cz ebo sekretariat@eurachem.cz. Výčet statistických a chemometrických postupů eí samozřejmě úplý. Soustředili jsme se pouze a ty, které jsou jedoduché a které se dají zvládout v prostředí Excelu. V příkladech je použita verze Microsoft Excel 000. 5
6
1 Základí statistické parametry a testy hypotéz 1.1 Základí soubor a typy statistických rozděleí 1.1.1 Základí pojmy Při hodoceí aalytických metod a výsledků ebo při formulaci fyzikálě-chemických modelů popisujících vztahy mezi proměými veličiami, z ichž se většia získává experimetálě, využíváme matematicko-statistické metody. Matematicko-statistické metody jsou vhodým ástrojem zkoumáí systému v případech, kdy je uto učiit objektiví závěr o celku složeém z velkého možství jedotek, přičemž z ějakých důvodů je možo prozkoumat je malou, vybraou část tohoto celku. Hromadé jevy jsou takové, které se vyskytují za určitých podmíek opakovaě ve velkém počtu a lze je přitom pozorovat ebo získávat experimetem. Speciálím případem hromadého jevu je áhodý jev. Te za daých podmíek může a emusí astat, jeho výskyt závisí pak a áhodě. Číselá veličia, která měí svou hodotu působeím áhodých jevů, se azývá áhodá veličia. Zjistitelá hodota áhodé veličiy musí být jedozačě určea, tz. musí v kokrétě sledovaém případě abýt jedié hodoty. Náhodost jevu zameá emožost předpovědět s jistotou, zda při určitém experimetu kdykoli v budoucu jev astae či eastae. Je tomu tak proto, že ezáme všechy příčiy výskytu áhodého jevu, kterých je moho a které jsou samy o sobě epostižitelé a ekotrolovatelé. Náhodou veličiu charakterizují pravděpodobosti, s íž se vyskytují její hodoty v předem zvoleých mezích. Distribučí fukce áhodé veličiy ξ je fukcí reálé proměé x a její hodota v daém bodě x 0 je pravděpodobost, že ξ abude hodoty meší ebo rové x 0 : F(x 0 ) = P{ξ x 0 } pro x = x 0 (1.1) Všechy hodoty, kterých může áhodá veličia abýt, tvoří spolu s distribučí fukcí její rozděleí pravděpodobostí. Základí soubor je možia hodot áhodé veličiy s daým rozděleím pravděpodobostí, z íž se vybírají pozorovaé hodoty této veličiy. Základí soubor obsahuje hodoty áhodé veličiy skutečě pozorovaé a teoreticky možé. Teoreticky proto, že emáme techické, časové ebo jié možosti pozorováí uskutečit, ale víme, jak bychom každé jedotlivé pozorováí mohli uskutečit. Vlastosti základího souboru pozáváme je do určité míry prostředictvím áhodého výběru. Příkladem základího souboru mohou být apř. výsledky všech možých aalýz stejého vzorku (ekoečě velký soubor), všechy možé kocetrace H SO 4, které můžeme obdržet od výrobce (ekoečý), dodávka 5 vagóů železé rudy (koečý) apod. Náhodý výběr je potom apř. pět aalýz stejého vzorku, deset růzých kocetraci H SO 4, pět vzorků po 1 kg odebraých áhodě z každého vagóu atd. 7
1.1. Náhodé veličiy Jak bylo uvedeo výše, áhodá veličia je charakterizováa distribučí fukcí a rozděleím pravděpodobostí. Probereme si ěkteré vlastosti distribučích fukcí. Distribučí fukce má tyto vlastosti: 1. Hodoty distribučí fukce leží mezi 0 a 1, tedy 0 F(x) 1. (1.). Distribučí fukce je eklesající: F(x ) > F(x 1 ) pro všecha x > x 1. (1.3) 3. Distribučí fukce je spojitá zleva. 4. Každá distribučí fukce splňuje podmíky F( ) = 0 a F( ) = 1. (1.4) Jestliže možé hodoty áhodé veličiy patří do itervalu (a ; b), potom aalogicky platí F(a) = 0 a F(b) = 1. (1.5) Z defiice distribučí fukce a z vlastostí distribučí fukce plyou ěkteré další důležité vztahy: P(x 1 ξ x ) = F(x ) F(x 1 ) (1.6) pro spojitou áhodou veličiu, a pro diskrétí áhodou veličiu. Dále platí vztah P(x 1 < ξ < x ) = F(x ) F(x 1 ) (1.7) P(ξ > x) = 1 F(x). (1.8) Pomocí distribučí fukce může být urče záko rozděleí jak diskrétí, tak spojité áhodé veličiy. Záko rozděleí diskrétí áhodé veličiy ξ lze kromě tohoto způsobu popsat také možiou hodot x a odpovídajících pravděpodobostí P(ξ = x), které budeme ozačovat p(x) a azveme pravděpodobostí ebo frekvečí fukcí. Tyto pravděpodobosti splňují vztahy p ( x ) = 1 (1.9) x P(x 1 < ξ < x ) = x p ( x). (1.10) x 1 Pravděpodobosti p(x) a jejich rozděleí lze vyjádřit trojím způsobem: matematickou fukcí, tabulkou hodot a grafem. Záko rozděleí spojité áhodé veličiy ξ vyjádříme, kromě distribučí fukcí, pomocí tzv. hustoty pravděpodobosti (frekvečí fukce), pro iž platí x F(x) = f ( z)dz. (1.11) Kvatily jsou body, rozdělující obor hodot áhodé veličiy v určitém pravděpodobostím poměru. 100P% kvatil, x P, je hodota, která současě splňuje erovosti 8
V případě spojité veličiy platí P(ξ x P ) P P(ξ x P ) 1 P. F(x P ) = P. (1.1) Tak apříklad 50% kvatil zameá, že 50 % všech možých hodot áhodé veličiy ξ leží pod hodotou tohoto kvatilu, x 0,5. Teto kvatil se azývá mediá. Záko rozděleí podává o áhodé veličiě obraz sice úplý, ale často dost epřehledý. Proto shrujeme iformaci o áhodé veličiě do jedoho ebo ěkolika čísel, která veličiu dobře charakterizují. Tato čísla azýváme charakteristikami. Z velkého možství charakteristik se budeme zabývat pouze dvěma: charakteristikou polohy a charakteristikou variability. Základí charakteristikou polohy je středí (očekávaá) hodota, E(ξ) ebo µ. Základí charakteristikou variability je rozptyl, D(ξ), ebo σ. Jeho odmociu azýváme směrodatou odchylkou, σ. Důležitou charakteristikou dvou áhodých veliči, apř. ξ a η, je kovariace C(ξ,η): Koeficiet korelace, ρ, je defiová vztahem: C(ξ,η) = E{[ξ E(ξ)][η E(η)]}. (1.13) ρ(ξ,η) = C(ξ,η) / [ρ(ξ) ρ(η)]. (1.14) který charakterizuje těsost vztahu mezi dvěma veličiami. Koeficiet korelace může abývat hodot z itervalu < 1 ; 1>. Je-li koeficiet korelace ulový, potom se áhodé veličiy ξ a η azývají ekorelovaé. Věty o středí hodotě a rozptylu (platí pro ezávislé áhodé veličiy): 1. E(k) = k D(k) = 0 (k je kostata). E(kξ) = ke(ξ) D(kξ) = k D(ξ) 3. E(ξ ± η) = E(ξ) ± E(η) D(ξ ± η) = D(ξ) + D(η) (1.15) 4. E(ξη) = E(ξ) E(η) 5. D(ξ) = E(ξ ) [E(ξ)] Důležitou veličiou je ormovaá áhodá veličia, ζ, která má ulovou středí hodotu a jedotkový rozptyl: ζ = [ξ E(ξ)] / D(ξ). (1.16) Příklad Diferečí metoda vážeí spočívá ve dvou postupých vážeích, jedak vážeky se vzorkem, jedak vážeky se zbytkem. Obě hmotosti můžeme považovat za ezávislé áhodé veličiy ξ 1 a ξ. Zjistěte středí hodotu a rozptyl rozdílu obou hmotostí. E(ξ 1 ξ ) = E(ξ 1 ) E(ξ ) D(ξ 1 ξ ) = D(ξ 1 ) + D(ξ ), je-li D(ξ 1 ) = D(ξ ) = σ, potom D(ξ 1 - ξ ) = σ. 9
1.1.3 Základí typy rozděleí Nejdůležitějším a v teorii měřeí ejběžějším rozděleím pravděpodobostí spojité áhodé veličiy je tzv. ormálí (Gaussovo) rozděleí. Tímto rozděleím se dají aproximovat i ěkterá rozděleí spojitá i diskrétí. Toto rozděleí je použitelé vždy, když je kolísáí hodot áhodé veličiy způsobeo součtem velkého počtu epatrých a vzájemě ezávislých vlivů. Tak apř. při chemické aalýze vzorku ovlivňuje výsledek kolísající kvalita chemikálií, růzá vlhkost vzduchu, teplota, tlak, stabilita přístrojů, mometálí schoposti pracovíka, kolísáí apětí v síti. Normálí rozděleí je charakterizováo dvěma parametry: středí (očekávaou) hodotou µ a rozptylem σ. Začí se N(µ,σ ). Normálí rozděleí je symetrické kolem středí hodoty. Distribučí fukce ormálího rozděleí, stejě jako hustota pravděpodobosti, jsou tabelováy pro hodoty ormovaé áhodé veličiy ζ. Pro výpočet hodot z této ormovaé áhodé veličiy z hodot x eormovaé veličiy platí z = (x µ)/σ. (1.17) Normovaé rozděleí budeme začit N(0,1). Tabelováy jsou hodoty F(z) a f(z) pro ezáporé z. Platí F( z) = 1 F(z) a f( z) = f(z). (1.18) Uvažujme yí pravděpodobost, že ormovaá áhodá veličia, ormálě rozděleá, bude uvitř itervalu symetrického kolem uly. Tuto pravděpodobost můžeme apř. vyjádřit vztahem což je ekvivaletí vztahu P( z z α ) = 1 α, P( z > z α ) = α. Hodotu z α azýváme 100α% kritickou hodotou. Příklad Vypočtěte kritickou hodotu z α pro α = 0,05. Podle předchozích vztahů můžeme psát: P( z α ζ z α ) = F(z α ) F( z α ) = F(z α ) 1 = 1 α, tedy F(z α ) = 1 (α/). Podle zavedeé defiice kvatilu je z α = z P 100P% kvatilem pro P = 1 (α/). Pro α = 0,05 je F(z α ) = 0,975 a z tabulek zjistíme z α = 1,96, což je 97,5% kvatil. 10
Příklad Kotrolujeme kvalitu při výrobě kaprolaktamu. Přitom požadujeme, aby bod tuhutí, Θ, byl v mezích 67, o C až 69,9 o C. Z dlouhodobého pozorováí je zámo, že středí hodota bodu tuhutí suroviy, odebíráme-li vzorek z jedoho pytle, je 67,7 o C se směrodatou odchylkou 0,3 o C. Staovte podíl pytlů, které leží mimo požadovaé meze. Předpokládejme, že áhodá veličia (ormálě rozděleá) bod tuhutí, Θ, suroviy v jedom pytli má rozděleí N(67,7; 0,09). Naším úkolem je vypočítat pravděpodobosti P(Θ < 67,) a P(Θ > 69,9) Vytvořme ormovaou veličiu ζ, jejíž hodoty požadovaého itervalu vypočteme podle Požadovaé pravděpodobosti: z 1 = (69,9 67,7) / 0,3 = 7,33 F(7,33) = 1 z = (67, 67,7) / 0,3 = 1,67 F( 1,67) = 1 F(1,67) = 0,047 P(Θ < 67,) = 0,047 P(Θ > 69,9) = 1 F(7,33) = 0 Odpověď a požadovaou otázku je: 4,7 % pytlů bude mít ižší bod tuhutí ež 67, o C a žádý pytel vyšší bod tuhutí ež 69,9 o C. Příklad Náhodá veličia ξ má rozděleí N(µ,σ ). Vypočtěte s jakou pravděpodobostí se hodoty této áhodé veličiy budou vyskytovat v itervalu µ ± σ. Hodoty ormovaé áhodé veličiy, ζ, vypočteme takto: z = (µ ± σ µ) / σ = ±1 F(1) = 0,841 F( 1) = 1 F(1) = 0,159 P = 0,841 0,159 = 0,68 t.j. 68, %. Rozděleí χ je charakterizováo počtem stupňů volosti, ν. Středí hodota tohoto rozděleí je ν, rozptyl je ν. Tabelováy jsou kvatily, χ ( ) P ν, pro které platí P [ ( ) P ( )] χ ν < χ ν = P. (1.19) Tak apř. kvatil χ pro α = 0,05 [ χ ] má hodotu 14,4. (6) 1 α / 0,975 (6) Rozděleí t (Studetovo rozděleí) je rověž charakterizováo počtem stupňů volosti ν. Je to symetrické rozděleí a pro vyšší ν (ν > 30) se blíží ormálímu rozděleí. V praxi ho používáme tam, kde ezáme rozptyl σ áhodé veličiy a ahrazujeme ho odhadem rozptylu s (viz dále). V tabulkách jsou uvedey kvatily t pro zvoleé P tak, aby platil vztah P[t(ν) < t P ] = P. (1.0) 11
F-rozděleí (Sedecorovo rozděleí) Toto rozděleí budeme používat při aalýze rozptylu. Mějme dvě ezávislé áhodé veličiy ξ 1 a ξ o rozděleích χ (ν 1 ) a χ (ν ). Náhodá veličia φ = (ξ 1 /ν 1 )/(ξ /ν ) (1.1) má F rozděleí o ν 1 a ν stupích volosti. V tabulkách alezeme kvatily F, pro které platí P[F < F P (ν 1,ν )] = P. (1.) Poissoovo rozděleí Pro rozděleí espojité áhodé veličiy si uveďme Poissoovo rozděleí. Poissoovo rozděleí je limitím případem biomického rozděleí, když se počet pokusů blíží ekoeču, pravděpodobost p(x) se blíží k ule a parametr λ = p(x) = kost. Parametr λ je parametrem charakterizujícím daý typ rozděleí Po(λ). Pro určité hodoty λ je Poissoovo rozděleí tabelováo. Středí hodota i rozptyl rozděleí Po(λ) je λ. Rozděleím Po(λ) můžeme ahradit biomické rozděleí při p(x) < 0,05. Řídí se jím apř. četost impulsů aměřeých Geigerovou Müllerovou trubicí, četost červeých krviek v zorém poli mikroskopu, četost zmetků v dodávce zboží apod. 1. Statistika opakovaých měřeí, áhodý výběr Uvažujme áhodý pokus, jehož výsledkem je hodota x áhodé veličiy ξ, která má distribučí fukci F(x). Opakujeme-li áhodý pokus ezávisle krát, dostaeme hodoty x 1, x,, x. Možia těchto hodot se azývá áhodým výběrem rozsahu z rozděleí, majícího distribučí fukci F(x). Vzhledem k tomu, že hodoty áhodého výběru pocházejí z téhož základího souboru, mají stejou středí hodotu a stejý rozptyl. K charakterizaci áhodého výběru používáme charakteristik, které azýváme výběrovými charakteristikami. Zmííme se hlavě o dvou výběrovém průměru a výběrovém rozptylu. Výběrový průměr (aritmetický průměr) je defiová jako 1 x = x i. (1.3) Středí hodota výběrového průměru je µ, rozptyl je σ /. Středí hodota výběrového průměru je tedy stejá jako středí hodota základího souboru, zatímco rozptyl výběrového průměru je rove tiě rozptylu rozděleí, z ěhož pochází. Výběrový rozptyl (odhad rozptylu) je defiová vztahem ebo vztahem 1 s = ( x x) (1.4) i 1 1
1 1 = xi xi 1 s. (1.5) Podobě jako v případě výběrového průměru se dá dokázat, že očekávaá hodota výběrového rozptylu je σ. Výběrová směrodatá odchylka, s, je druhá odmocia výběrového rozptylu. Srováme-li vztah pro výběrový rozptyl se vztahem pro výběrový druhý cetrálí momet xi x (1.6) M = ( ) vidíme, že druhý cetrálí momet ( 1)krát větší ež odhad rozptylu áhodého výběru. Připomíáme, že uvedeé vztahy platí pro jakékoli rozděleí základího souboru. Defiujme si jedu důležitou charakteristiku, Studetův poměr T: Tato veličia má t-rozděleí o ( 1) stupích volosti. x µ T =. (1.7) s Defiujme ještě výběrový třetí a čtvrtý cetrálí momet áhodého výběru: 3 xi 3 x (1.8) M = ( ) 4 xi 4 x (1.9) M = ( ) Potom výběrový koeficiet šikmosti je urče rovicí a výběrový koeficiet špičatosti rovicí A M 3 = (1.30) 3 3 M B M = (1.31) 4 4 M Obě výběrové charakteristiky používáme k testováí typů rozděleí. Rozpětí, R, je defiovaé jako rozdíl mezi ejvyšší (x ) a ejižší (x 1 ) hodotou jedotlivých výsledků v sérii měřeí: Z rozpětí můžeme vypočítat odhad směrodaté odchylky s: R = x x 1 (1.3) s = k R (1.33) Hodoty koeficietu k jsou tabelováy v běžých statistických tabulkách. 13
1.3 Nejistota výsledku Podle termiologického slovíku VIM 3 [cit. 1] je ejistota defiováa jako ezáporý parametr charakterizující rozptýleí hodot veličiy přiřazeých měřeé veličiě a základě použité iformace. V úvodu této kapitoly si ejprve vysvětlíme ěkteré základí pojmy, které se k defiici ejistoty vztahují. Základím iformačím zdrojem pro všechy defiice a vysvětleí ěkterých důležitých pojmů je výše zmíěý metrologický slovík VIM 3. Měřeí je proces experimetálího získáváí jedé ebo více hodot veličiy, které mohou být důvodě přiřazey veličiě. Měřeí v sobě obsahuje porováí veliči a zahruje zjišťováí počtu etit. Měřeí předem předpokládá popis veličiy přiměřeý určeému použití výsledku měřeí, popis postupu měřeí a kalibrovaého měřicího systému pracujícího v souladu se specifikovaým postupem měřeí, včetě podmíek měřeí. Měřeá veličia (agl. measurad) je veličia, která má být měřea. Specifikace měřeé veličiy vyžaduje zalost druhu veličiy, popis stavu jevu, tělesa ebo látky esoucích veličiu, včetě jakékoliv relevatí složky a zahrutých chemických etit. Měřeá veličia je charakterizováa hodotou a příslušou jedotkou měřeí. Příkladem měřeé veličiy může být celkový obsah olova ve vzorku půdy (mg kg -1 ) kocetrace celkového cholesterolu v séru (mmol L -1 ) obsah alkoholu v krvi (mg g -1 ) obsah dioxiu (,3,7,8-TCDBD) v mase (µg kg -1 ) V chemii se pro měřeou veličiu ěkdy používá termí aalyt ebo ázev sloučeiy. Takové použití je chybé, protože tyto výrazy eodkazují a veličiy. Výsledek měřeí je defiová jako soubor hodot veličiy přiřazeý měřeé veličiě společě s jakoukoliv další dostupou relevatí iformací (obvykle ejistota výsledku). Nový metrologický slovík VIM 3 [cit. 1] zavedl tzv. ejistotový přístup k měřeí a vyjadřováí výsledků. V této publikaci se budeme tohoto pricipu důsledě držet. Na rozdíl od chybového přístupu evyžaduje ejistotový přístup odhad chyby (áhodé, systematické), pouze odhad ejistoty výsledku. K tomuto přístupu se váží další důležité pojmy. Pravdivost měřeí (agl. trueess) je těsost shody mezi aritmetickým průměrem ekoečého počtu opakovaých aměřeých hodot veličiy a referečí hodotou veličiy. Pravdivost je kvalitativí pojem a emůže být vyjádřea číselě. Míra těsosti shody se azývá vychýleí (agl. bias). Precizost měřeí (agl. precisio) je těsost shody mezi idikacemi (sigály) ebo aměřeými hodotami veličiy získaých opakovaými měřeími a stejém objektu za specifikovaých podmíek. Precizost měřeí se zpravidla vyjadřuje výběrovou směrodatou odchylkou ebo odhadem rozptylu za specifikovaých podmíek. Specifikovaými podmíkami mohou být apř. podmíky opakovatelosti, podmíky mezilehlé precizosti ebo podmíky reprodukovatelosti. Precizost se používá pro defiováí ěkterých validačích parametrů (viz další kapitoly). Stadardí ejistota, u(x), je ejistota hodoty veličiy x vyjádřeá jako směrodatá odchylka. Vyhodoceí ejistoty měřeí způsobem A je postup vyhodoceí složky ejistoty měřeí statistickou aalýzou opakovaých aměřeých hodot veličiy získaých za defiovaých 14
podmíek měřeí (opakovatelost, mezilehlá precizost, reprodukovatelost). Výsledkem je stadardí ejistota příslušé veličiy. Vyhodoceí ejistoty měřeí způsobem B je postup vyhodoceí složky ejistoty měřeí staoveé jiými způsoby ež vyhodoceím ejistoty měřeí způsobem A. Používají se přitom iformace z kalibračích listů, certifikátů referečích materiálů, údajů výrobce přístrojů, údajů v odboré literatuře apod. Výsledkem je stadardí ejistota příslušé veličiy. Nyí přistoupíme k výkladu o ejistotě výsledku. V moha případech aalytických měřeí eí měřeá veličia (apř. látkové možství daého aalytu) měřea přímo, ale její hodota se staoví epřímo pomocí hodot jiých veliči prostředictvím fukčího vztahu (modelu měřeí) ψ = f(ξ 1, ξ,..., ξ Ν ), (1.34) ve kterém ψ je měřeá veličia abývající hodot y, a kde ξ 1 až ξ Ν jsou jié veličiy, abývající hodot x 1 až x N. V dalším textu budeme považovat hodoty všech veliči za jejich odhady. Veličia ψ se azývá výstupí veličiou, ξ 1 až ξ Ν veličiami vstupími. Vstupí veličiy zahrují i všechy korekce a korekčí faktory, které přispívají k ejistotě výsledku měřeí. Pokud data idikují, že fukce f evyjadřuje model měřeí dostatečě, musíme rozšířit vstupí veličiy o další čley. Iformace můžeme získat apř. z validačí studie. Kromě zalosti hodot vstupích veliči musíme zát i jejich stadardí ejistoty. Vstupí veličiy, x 1 až x N, mohou být děley a a) veličiy, jejichž hodoty (odhad) a ejistoty (rověž odhad) se staovují přímo současým měřeím (způsob A). Odhady hodot a jejich ejistot lze získat jedím měřeím, opakovaým měřeím, ebo odhadem založeým a zkušeosti. Zahrují rověž korekce měřicích přístrojů, korekce a vliv okolího prostředí apod. Stadardí ejistota se odhade pomocí výběrové směrodaté odchylky opakovaých měřeí; b) veličiy, jejichž hodoty a ejistoty se získávají z exterích zdrojů (způsob B), jako jsou veličiy spojeé s etaloem (stadardem), certifikovaým referečím materiálem ebo veličiy, jejichž hodoty jsou převzaty z tabulek ebo mauálů výrobce přístrojů. Stadardí ejistota se odhade apř. pomocí rovoměrého rozděleí (viz další kapitolu). Odhad hodoty y veličiy ψ pomocí odhadů hodot x 1 až x N je dá rovicí y = f(x 1,, x N ). (1.35) Kombiovaá stadardí ejistota a záko propagace ejistot Vztah mezi kombiovaou stadardí ejistotou u(y) hodoty y veličiy ψ a stadardími ejistotami u(x i ) hodot x i veliči ξ i vychází ze zákoa propagace ejistot: a) pro ezávislé veličiy x i : N u( y) = c u( x ), (1.36) i = 1 i i 15
f ve kterém c = je citlivost (selektivití koeficiet) měřeé hodoty y vzhledem i xi k hodotám jedotlivých vstupích veliči. Jedotlivé citlivosti mohou být získáy experimetálě. Je třeba připomeout, že uvedeý vztah je vztahem aproximativím, ve kterém jsou vyecháy čley s parciálími derivacemi vyšších řádů. V chemických měřeích je tato aproximace dostačující. b) pro závislé veličiy x i : N N 1 N u( y) = ci u( xi ) + ci c j u( xi, x j ) i = 1 i = 1 j = i+ 1 (1.37) ebo po zavedeí odhadu korelačího koeficietu, r: N N 1 N i i i j i j i j i = 1 i = 1 j = i + 1. (1.38) u( y) = c u( x ) + c c u( x )u( x )r( x, x ) Existují jedoduchá pravidla pro výpočet kombiovaé stadardí ejistoty. Pravidlo 1: Pro model měřeí, který zahruje pouze součet ebo rozdíl vstupích veliči, apř. y = k(x 1 + x + x 3 ) (k je kostata), (1.39) je kombiovaá stadardí ejistota dáa vztahem u( y) = k u( x ) + u( x ) + u( x ). (1.40) 1 3 Pravidlo : Pro model měřeí, který azýváme multiplikativí: y = k(x 1 x x 3 ) (k je kostata) (1.41) je kombiovaá ejistota dáa vztahem u( y) y k u(x ) u( x ) u( x ) 1 3 = + + x1 x x3 (1.4) Kombiovaá rozšířeá ejistota Kombiovaá rozšířeá ejistota určuje iterval, ve kterém se s daou pravděpodobostí dá předpokládat skutečá hodota měřeé veličiy. Kombiovaá rozšířeá ejistota se odhaduje podle vztahu U(y) = k u(y), (1.43) ve kterém k je koeficiet rozšířeí. Ve většiě případů se hodota koeficietu rozšířeí volí rova. Pokud v kombiovaé stadardí ejistotě převládá jeda složka s malým počtem stupňů volosti (apř. ν < 6), potom koeficiet rozšířeí můžeme zaměit za kvatil t-rozděleí a pro daou hladiu výzamosti α platí t-rozděleí, t 1 α/; ν. 16
Presetace výsledku Výsledek měřeí presetujeme vždy ve tvaru: výsledek = hodota měřeé veličiy ± rozšířeá ejistota (použitá hodota k) tedy V = y ± U(y) (k = ) [ebo: (k = 3)]. (1.44) 1.4 Nejistoty elemetárích operací v chemické a biologické laboratoři 1.4.1 Volumetrické operace Nejistoty volumetrických operací jsou řešey v Metodickém listě EURACHEM-ČR []. Metodické listy jsou jako excelové soubory ke stažeí a iteretové adrese http://www.eurachem.cz/metodicke-listy.php. 1.4. Vážeí Při gravimetrických operacích se v chemické aalýze uplatňují hlavě dvě složky ejistoty: ejistota spojeá s opakováím gravimetrické operace (vážeí) a ejistota spojeá s kalibrací vah. Nejistotu spojeou s opakovaým vážeím získáme experimetálě (typ A). Opakovaě zvážíme (apř. 15krát) závaží o určité hmotosti, apř. 0 g. Výběrová směrodatá odchylka takového pokusu je zároveň stadardí ejistotou operace, u(m 1 ). Při diferečím vážeí započítáváme teto příspěvek dvakrát. Nejistotu spojeou s kalibrací vah lze rozdělit a tři příspěvky: ejistota liearity deklarovaá výrobcem, ejistota kalibrace způsobeá odchylkou kalibrovaého závaží od omiálí hodoty a ejistota omiálí hodoty. Výrobce deklaruje odchylku od liearity jako toleračí limit, ±t. Tato hodota udává maximálí odchylku mezi skutečou hmotostí a misce vah a hmotostí odečítaou z displeje. Předpokládáme, že tolerace má rovoměré rozděleí a lze tedy převést toleraci a směrodatou odchylku (typ B). Při diferečím vážeí započítáváme teto příspěvek dvakrát. Nejistotu omiálí hodoty závaží, u(m 3 ), lze získat z kalibračího certifikátu po kalibrací závaží v Českém metrologickém istitutu. Její příspěvek k celkové ejistotě je obvykle zaedbatelý. 1.4.3 Nejistota hodoty měřeého sigálu Při měřeí jakéhokoliv sigálu (absorbace, plocha píku, atd.) uvažujeme, že stadardí ejistota hodoty sigálu se skládá ze tří příspěvků: pravdivosti, reprodukovatelosti a opakovatelosti hodoty měřeého sigálu, získaých z validace přístroje (typ A). Prví dva příspěvky bývají uvedey v příručce k přístroji jako toleračí iterval (typ B, rovoměré rozděleí). Následující příklad objasňuje odhad stadardí ejistoty hodoty měřeého sigálu. 17
Příklad Údaje výrobce přístroje: pravdivost (trueess), přesost (accuracy) reprodukovatelost Validace přístroje: opakovatelost ( = 10) 0,005 a.u. 0,005 a.u. 0,005 a.u. 0, 005 0, 005 u(sigál) 0, 005 0, 004 = + + = a.u. 3 3 Pokud údaje výrobce chybí, je stadardí ejistota hodoty měřeého sigálu dáa pouze opakovatelostí. Připomíáme, že stadardí ejistota hodoty měřeého sigálu může být závislá a hodotě měřeého sigálu, takže je třeba ji odhadout v celém měřicím rozsahu. V tomto případě se doporučuje zjistit závislost ejistoty a hodotě měřeé veličiě. 1.4.4 Titračí staoveí Ukážeme si příklad staoveí látkové kocetrace EDTA (titr odměrého roztoku). Odvážeé možství chloridu olovatého se titruje odměrým roztokem EDTA a idikátor xyleolovou oraž. Kocetrace EDTA se vypočte podle vztahu: ve kterém mpbcl m c = M PbCl PbCl V je hmotost avážeého chloridu olovatého, kt, M PbCl je molárí hmotost chloridu olovatého, V kt je objem EDTA spotřebovaý do koce titrace. Idikátorová chyba je zaedbatelá, což lze odhadout s použitím rovovážých údajů o titračím systému. Rověž systematická chyba způsobeá ečistotou chloridu olovatého je malá, což lze vysvětlit způsobem přípravy základí látky. Stadardí ejistota hmotosti se odhade výše uvedeým postupem, stadardí ejistotu spotřebovaého objemu můžeme odhadout hodotou 0,03 ml, což je přibližý objem kapky titračího čiidla. Stadardí ejistota molárí hmotosti chloridu olovatého byla z tabulek odhaduta a 0,05 g mol -1 [3]. Kombiovaá stadardí ejistota kocetrace EDTA se vypočte podle rovice [u( m )] [u( V )] [u( M )] u( c) = c + + ( m ) ( V ) ( M ) PbCl kt PbCl PbCl kt PbCl Další příklady jsou uvedey v přílohách a CD-ROM. 1.5 Vyhodocováí ejistot postupy zdola ahoru a shora dolů Postup zdola ahoru (bottom up) Při tomto způsobu vyhodoceí vycházíme z úplé rovice měřeí. Pro výpočet ejistoty budeme používat Kragteovo schéma vyhodoceí, které bylo publikováo apř. v Kvalimetrii 11 [cit. 4]. Kragteův způsob je založe a aproximaci zákoa o propagaci ejistot. 18
Záko o propagaci ejistot: N u( y) = c u( x ) (1.45) i =1 i i kde Parciálí derivace můžeme aproximovat vztahem y x i y ci = (1.46) x y[ xi + u( xi )] y( xi ) u( x ) a dílčí příspěvek jedotlivé vstupí veličiy x i k celkové ejistotě aproximovat vztahem i i (1.47) u(y,x ii ) = y{x 1, x,, [x i + u(x i )],, x N } y(x 1, x,, x i,, x N ) (1.48) Na základě této aproximace je vytvoře algoritmus výpočtu v souboru kragte_vysvetlei.xls: 1. avrhout model měřeí y = f(x i ), i = 1,, p (p je počet vstupích veliči),. vložit hodoty vstupích veliči a jejich stadardích ejistot do sloupců, 3. zkopírovat sloupec hodot do matice p p pomocí F4 ($ před ozačeím sloupce), 4. diagoálí prvky matice zvětšit o stadardí ejistotu příslušé veličiy, 5. vypočítat výstupí veličiu pod sloupcem původích hodot, 6. zkopírovat vzorec (model měřeí) do řádků pod matici, 7. vypočítat diferece hodoty výstupí veličiy ezměěé a změěé, 8. vypočítat druhé mociy diferecí, 9. vypočítat sumu moci diferecí, 10. odmocia ze sumy je kombiovaá stadardí ejistota, 11. vypočítat příspěvky jedotlivých veliči k celkové ejistotě. Postup shora dolů (top dow) Při tomto způsobu vycházíme z předpokladu, že ejvětšími příspěvky k celkové ejistotě je vitrolaboratorí reprodukovatelost, vyjádřeá směrodatou odchylkou s repro a vychýleí, reprezetující pravdivost výsledku. Oba parametry se získají při validaci postupu měřeí. Kombiovaá ejistota se počítá podle rovice ve kterém je B vychýleí. u( y) = y (s ) + u(b), (1.49) repro rel rel 1.6 Testy hypotéz Testováí hypotéz je důležitou součástí iterpretace výsledků měřeí. Postup spočívá v tom, že ejprve vytvoříme tzv. ulovou hypotézu, tj. hypotézu, že studovaý soubor (resp. jeho charakteristický parametr) má určitou očekávaou vlastost Jsou to obvykle hypotézy o základích parametrech rozděleí pravděpodobosti měřeé veličiy. Hypotézy vždy testujeme a určité hladiě výzamosti α, obvykle volíme hodotu α = 0,05. Tradičí, klasický způsob testováí hypotéz vychází pouze z dat získaých opakovaým měřeím. Je to však způsob velice ilustra- 19
tiví a slouží i k pochopeí testováí hypotéz datových souborů, u kterých záme ejistotu měřeí. 1.6.1 Statistika opakovaých pokusů Testy hypotéz pro opakovaé pokusy eberou v úvahu ejistotu výsledku. Mírou promělivosti je pouze výběrová směrodatá odchylka opakovatelosti ebo reprodukovatelosti. Vstupími hodotami pro všechy testy jsou hodoty ěkterých charakteristik výběru: aritmetický průměr x, směrodatá odchylka výběru, s, rozsah měřeí,, kvatily t- a F-rozděleí pro určitý počet stupňů volosti a hladiu výzamosti α. Test hypotézy H 0 : µ = µ 0 Testujeme hypotézu, že středí hodota áhodé veličiy abývá určité hodoty. Hypotéza H 0 platí, když je hodota µ 0 uvitř oboustraého itervalu spolehlivosti L 1 : Test hypotézy H 0 : µ < µ 0 s L1 = x ± t. (1.50) 1 α / ;( 1) Testujeme hypotézu, že středí hodota áhodé veličiy abývá hodot meších ež je určitá hodota. Hypotéza H 0 platí, jestliže hodota µ 0 je uvitř jedostraého itervalu <L 1 ; >. Iterval L 1 se vypočte podle rovice Test hypotézy H 0 : µ > µ 0 s L1 = x t 1 α ; ( 1). (1.51) Testujeme hypotézu, že středí hodota áhodé veličiy abývá hodot větších ež je určitá hodota. Hypotéza H 0 platí, jestliže hodota µ 0 je uvitř jedostraého itervalu <- ; L >. Iterval L se vypočte podle rovice s L = x + t 1 α ; ( 1). (1.5) Testováí hypotézy H 0 : σ = σ 1 Testujeme hypotézu, že rozptyly dvou áhodých veliči jsou shodé. Hypotéza H 0 platí, jestliže vypočteá hodota F F 1 α /; νčit; νjme, ν čit je počet stupňů volosti v čitateli vztahu pro výpočet F, ν jme je počet stupňů volosti ve jmeovateli stejého vztahu: s1 F = pro s 1 > s (1.53) s ebo s F = pro s > s 1. (1.54) s 1 0
Test hypotézy H 0 : µ 1 = µ Testujeme hypotézu, že středí hodoty dvou ezávislých áhodých veliči jsou shodé za předpokladu shodosti rozptylů. Před testem této hypotézy musíme provést test hypotézy σ = σ 1. Mějme hodoty aritmetických průměrů a výběrových směrodatých odchylek dvou ezávislých souborů: x ; s ; x ; s. Za předpokladu platosti hypotézy σ = σ 1 1 1 platí pro odhad společé výběrové směrodaté odchylky s = ( 1) s + ( 1) s + 1 1 1. (1.55) Hypotéza H 0 platí, když vypočteá hodota T < t1 α / ;( 1 + ) T = x x 1 1 1 s + 1. (1.56) 1.6. Testováí hypotéz s použitím ejistoty výsledku Předpokladem vhodosti těchto testů je zalost stadardí kombiovaé ejistoty výsledku. Ve všech testech je u stadardí kombiovaá ejistota a U je rozšířeá ejistota U = k u. Pro 5% hladiu výzamosti volíme k =. Test hypotézy H 0 : µ = µ 0 Hypotéza H 0 platí, když x u µ 0 1, 96 (x je výsledek měřeí) (1.57) Test hypotézy H 0 : µ < µ 0 Hypotéza H 0 platí, když x (µ + 1, 64u) (x je výsledek měřeí) (1.58) 0 Test hypotézy H 0 : µ > µ 0 Hypotéza platí, když x (µ 1, 64u) (x je výsledek měřeí) (1.59) 0 1
Test hypotézy H 0 : µ 1 = µ Hypotéza platí, když x x 1 u + u 1 1, 96 (1.60) (x 1 a x jsou výsledky měřeí dvou ezávislých souborů, u 1 a u jsou příslušé stadardí kombiovaé ejistoty). 1.7 Příklady ke kapitole 1 excel_sytaxe.pdf obsahuje vysvětleí ěkterých fukcí v programu MS-Excel hypotezy_1.xls hypotezy_.xls kragte_vysvetlei.xls spreadsheed36.xls vazei.xls molari_hmotosti.xls mohrova_sul_koc.xls zakladi_operace.xls ejistoty_kalibracich_roztoku.xls titrace_1.xls titrace_.xls fotometrie.xls ejistoty_top dow.xls obsahuje řešeé příklady testováí hypotéz obsahuje řešeé příklady testováí hypotéz obsahuje vysvětleí výpočtu ejistot podle Kragtea obsahuje šabloy pro výpočet ejistot podle Kragtea pro 3-6 vstupích veliči (aglická verse) obsahuje řešeý příklad výpočtu ejistoty při gravimetrickém staoveí železa obsahuje řešeé příklady výpočtu ejistot molárích hmotostí sloučei obsahuje řešeý příklad výpočtu kocetrace a ejistoty roztoku Mohrovy soli obsahuje řešeé příklady výpočtu ejistot ěkterých základích operací: opakovatelost, ejistota istrumetálího sigálu, ejistota volumetrických operací obsahuje šablou pro výpočet kocetrace pěti kalibračích roztoků postupým ředěím stadardího roztoku obsahuje řešeý příklad odměrého magaometrického staoveí peroxidu vodíku obsahuje řešeý příklad odměrého chelatometrického staoveí Ni obsahuje řešeý příklad staoveí M fotometricky obsahuje šablou pro vypočet ejistoty měřicího postupu metodou shora dolů
Optimalizace měřicích postupů v chemii a biologických vědách.1 Pláováí experimetů Chceme-li ajít optimálí podmíky měřicích postupů, musíme ejprve zjistit, které faktory statisticky výzamě ovlivňují hodotu závisle proměé veličiy. Závisle proměou veličiou bývá obvykle fyzikálí (istrumetálí) sigál. Faktory, které hodotu závisle proměé veličiy ovlivňují, budeme považovat za ezávisle proměé veličiy. Faktory mohou být kvatitativí (kocetrace, teplota, tlak) ebo kvalitativí (druh metody, způsob techologického řešeí). Cíleou kombiaci všech faktorů podle určitého schématu azýváme plá experimetu. Jedou z metod, kterými zjišťujeme statistickou výzamost působeí faktorů a hodotu závisle proměé veličiy, je metoda aalýzy rozptylu. Aalýza rozptylu Defiujme ěkteré základí pojmy. Faktory začíme velkými písmey latiské abecedy, tedy A, B, C atd. Hodotám, kterých jedotlivé faktory mohou abývat, říkáme úrově faktorů. Tak apř. budeme-li sledovat vliv teploty a výtěžek techologického procesu při dvou teplotách 5 o C a 50 o C, říkáme, že vliv teploty sledujeme a dvou úrovích. Nižší úroveň ozačíme idexem 1 a vyšší úroveň idexem. Studujeme-li vliv většího možství faktorů při více úrovích každého z faktorů, říkáme kombiacím úroví všech faktorů postupy. Např. při studiu vlivu 3 faktorů A, B, C, které jsou a úrovích A 1, A, B 1, B, C 1, C, C 3, budou ěkteré z postupů A 1 B 1 C 1, A B 1 C 3 apod. Postupy mohou být s jedím ebo více opakováími. Při experimetálím provedeí je zajímavé, že ačkoli musíme pečlivě astavovat hodoty úroví jedotlivých faktorů a držet je při experimetu eměé, při statistickém zpracováí se hodoty těchto faktorů epoužívají (viz dále). Úrově jedotlivých faktorů jsou ve statistickém modelu vlastě ormalizováy a hodoty 0, ±1, ± atd. Matematický model aalýzy rozptylu vyjádříme takto: Mějme sigálů áhodé veličiy, y 1,, y, které jsou lieárí fukcí parametrů (počet p) a áhodých chyb e 1,..., e. Parametry ztotožíme s faktory. Model má potom tvar: y = x β + e. (.1) i ji j i p (i = 1,, ; j = 1,..., p), kde x ji jsou pevé kostaty (zpravidla 0, ±1, ±, atd.), β j jsou tzv. efekty faktorů, které mohou být odhaduty regresí aalýzou. O áhodých chybách předpokládáme, že mají ulovou středí hodotu, všechy stejý rozptyl, jsou ekorelovaé a mají ormálí rozděleí. Celková promělivost výsledků, S, je dáa součtem čtverců odchylek jedotlivých pozorováí od celkového aritmetického průměru: 3
yi y. (.) S = ( ) Aalýza rozptylu spočívá v rozděleí celkové promělivosti a složky příslušející jedotlivým faktorům a tzv. reziduálí promělivosti, která odpovídá áhodým chybám. F-Testem potom zjistíme statistickou výzamost jedotlivých složek celkového rozptylu a tím i vliv jedotlivých faktorů a hodotu závisle proměé veličiy. Plá experimetu pro jede faktor a aalýza rozptylu Uvažujme experimet, v ěmž je vyšetřová vliv jedoho faktoru, apř. A, který bude sledová a I úrovích (I > ). Při každé úrovi provedeme stejý počet opakováí měřeí závisle proměé veličiy (vyvážeý plá), r, přičemž pro celkový počet pokusů platí = r I. (.3) Výsledky pokusů tvoří tzv. experimetálí matici (viz tabulku.1), jejíž obecý čle ozačíme y iν, kde ν je počet opakováí měřeí sigálu a ité úrovi. Tabulka.1. Experimetálí plá pro jede faktor Faktor Opakováí A 1 y 11 y 1 y 1r A i y i1 y i y iν y ir A I y I1 y I y Ir Pro i-tou úroveň můžeme model pro aalýzu rozptylu vyjádřit vztahem: y iν = µ + α i + e iν, (.4) ve kterém µ je středí hodota závisle proměé pro všechy úrově, eboť experimetálí matici si můžeme představit jako áhodý výběr ze základího souboru. Parametr α i je vliv faktoru A a ité úrovi. Defiujme si yí pomocé mezisoučty v experimetálí matici: = y (.5) Y.. Y i. y i ν r Odhady parametrů jsou potom vyjádřey rovicemi I r i ν =. (.6) 4
Y.. µ ˆ = Y ˆ ˆ r Y eiν = yiν r i. α = µ Nyí budeme testovat hypotézu, že vlivy faktoru A a všech úrovích jsou stejé (a zároveň ulové), tedy hypotézu H 0 : proti alterativí hypotéze H A : i. α 1 = α = = α I = 0 I i= 1 α i > 0 Celkovou promělivost experimetálí matice, S, můžeme rozdělit a část odpovídající vlivu faktoru A, S A, a část odpovídající reziduálí promělivosti, S r : Nulová hypotéza se dá potom vyjádřit takto: (.7) S = S A + S r. (.8) H : σ σ 0 A r kde σ je rozptyl odpovídající promělivosti vyšetřovaého faktoru A, σ A r je rozptyl odpovídající reziduálí promělivosti. Testovací kritérium F je potom vyjádřeo rovicí: ve kterém S = r F = SA I 1 Sr, (.9) I 1 1 S A = Y.., (.10) r 1 y iν Y (.11) i. I r r I Hodotu F srováváme s F 1 α, (I 1; I). Odhad rozptylu měřeé veličiy vypočteme z residuálí promělivosti: s = S r / ( I). (.1) Faktoriálí experimety a aalýza rozptylu V případě, že vyšetřujeme vliv více faktorů, bude model pro aalýzu rozptylu vyjádře vztahem, apříklad pro dva faktory A, B, 5
y ijν = µ + α i x 1i + β j x j + α i β j x 1i x j + e ijν, (.13) takže faktor A vyšetřujeme a I a faktor B a J úrovích (i = 1,,, I; j = 1,,, J). Součiu α i β j říkáme iterakce faktorů. Z ekoomického i časového hlediska je výhodé pracovat a dvou úrovích pro každý faktor (I = J = ). Experimetálí pláy v takovém případě začíme N, kde N je počet vyšetřovaých faktorů. Při tomto typu pokusů měříme závisle proměou veličiu při všech kombiacích faktorů, takže celkový počet pokusů je dá hodotou r N, kde r je počet opakováí každého měřeí, stejý pro všechy postupy. Jedotlivým kombiacím úroví studovaých faktorů říkáme postupy a podle zavedeé Yatesovy symboliky [5] je ozačujeme kombiací malých písme. Tak apř. pro dva faktory A, B máme tyto postupy (v závorce je uvedeo začeí postupů): A 1 B 1 ( 1), A 1 B (b), A B 1 (a), A B (ab). Z uvedeého příkladu je zřejmé, že při ozačeí postupu použijeme malé písmeo k ozačeí faktoru, který je a vyšší úrovi. Z experimetálě zjištěých hodot závisle proměé veličiy při všech postupech vypočteme součty čtverců odchylek odpovídající vlivu jedotlivých faktorů a výsledek, součty čtverců odchylek odpovídající iterakcím faktorů, tj. spolupůsobeí kombiace faktorů a výsledek pokusu, a reziduálí rozptyl. Test výzamosti je založe a F-testu, tz. a porováí rozptylů odpovídajících vlivu jedotlivých faktorů a reziduálího rozptylu. Uveďme si příklad experimetálí matice faktoriálího pokusu 3 : Tabulka.. Experimetálí matice faktoriálího pokusu 3 C 1 C B 1 B B 1 B A 1 A A 1 A A 1 A A 1 A y 11 y 1 y 31 y 41 y 51 y 61 y 71 y 81 y 1 y y 3 y 4 y 5 y 6 y 7 y 8 (-1) a b ab c ac bc abc Yatesovo začeí pokusů vyjadřuje v tomto případě součet jedotlivých hodot pokusů, Y i.. Promělivost odpovídající vlivu jedotlivých faktorů a iterakcí, P, je dáa vztahem S P [ P] =, (.14) N r kde [P] je algebraický součet hodot jedotlivých pokusů, resp. jejich součtu (viz experimetálí matici). Zaméka jedotlivých čleů součtu alezeme pomocí zamékového schématu (viz tabulku.3). Vypočteá promělivost má jede stupeň volosti. 6
Tabulka.3. Zamékové schéma pro faktoriálí pokus 3 Postup Efekt (-1) a b ab c ac bc abc A + + + + B + + + + AB + + + + C + + + + AC + + + + BC + + + + ABC + + + + Uvedeé zamékové schéma můžeme používat i pro působeí dvou faktorů. Neuvádíme zamékové schéma pro působeí více ež tří faktorů, eboť pro vyšetřováí vlivu takového počtu faktorů se používají jié experimety, tzv. kráceé faktoriálí experimety. Podle ašich zkušeostí z používáí faktoriálích pokusů vystačíme většiou s 3 faktory. Vysvětlíme si použití zamékového schématu ve faktoriálím pokusu 3. Pro výpočet promělivosti odpovídající vlivu faktoru A dostaeme pro [A] pro [B] a apř. pro [AC] [A] = ( 1) + a b + ab c + ac bc + abc [B] = ( 1) a + b + ab c ac + bc + abc [AC] = +( 1) a + b ab c + ac bc + abc. Připomíáme, že do těchto vztahů dosazujeme za jedotlivé postupy hodoty závisle proměé veličiy. Pokud máme více opakováí (r > 1), dosazujeme součet hodot závisle proměé veličiy pro všecha opakováí. Odhad rozptylu s pro N faktorů se vypočte z rovice kde r s = N (r 1) r iν i. N r N r Odhad rozptylu má N (r 1) stupňů volosti. S, (.15) 1 S = y Y. (.16) Vypočteou hodotu F P S F = (.17) s P P porováváme obvyklým způsobem s tabelovaou hodotou F 1 α, [(1; N (r 1)]. 7
. Experimetálí optimalizace Pro optimalizaci je výhodé formulovat závislost aalytického sigálu a hodotách výzamých faktorů. Zmíěé faktoriálí pokusy (str. 5) ám skýtají příležitost aproximace roviou podle rovice Y reg = b 0 + b 1x1 +...+ bn x N, (.18) ve které jsou veličiy x ormalizovaé hodoty výzamých faktorů. Koeficiety b se vypočtou podle vztahů b 0 = yi. (.19) kde y i. jsou průměré hodoty Y i.. N b = x y, (.0) j ji i N Vzhledem k tomu, že je výhodější zát koeficiety regresího vztahu v původích proměých x puv, můžeme přepočítat ormalizovaé hodoty a původí podle vztahů 1/ = (x max x mi )/ (.1) x stred = (x max + x mi )/ (.) x puv = x 1/ + x stred, (.3) x max je hodota faktoru a vyšší úrovi, x mi je hodota faktoru a ižší úrovi. Rovice výsledkové (odezvové, respose surface) plochy, v ašem případě roviy, můžeme použít v ěkteré z optimalizačích metod. Optimalizačí metody jsou vesměs založey a zalosti velikosti a směru gradietu výsledkové plochy, který má pro rovici roviy tvar grad Y = b 1 dx 1 + b dx +... + b N dx N, (.4) kde dx i jsou jedotkové vektory ve směru os výzamých faktorů. Pokud chceme zát rovici výsledkové plochy v okolí maxima (miima) této plochy, musíme použít jiý experimetálí plá, který umožňuje odhadout rovici plochy vyššího řádu. Ukažme si uvedeý případ pro experimetálí plá 3, ve kterém jsou dva výzamé faktory a třech úrovích. Proměé x (faktory) trasformujeme do úroví 1, 0, +1. Rovice plochy odezvy je dáa rovicí η = β + β x + β x + β x + β x + β x x. (.5) 0 1 1 11 1 1 1 8
Experimetálí matice má tvar Bod Úrově faktorů Výsledek x 1 x y 1. 1 1 y 1. 1 0 y 3. 1 +1 y 3 4. 0 1 y 4 5. 0 0 y 5 6. 0 +1 y 6 7. +1 1 y 7 8. +1 0 y 8 9. +1 +1 y 9 Odhady koeficietů β i regresí rovice jsou veličiy b 1 = (1/6)( y 1 y y 3 + y 7 + y 8 +y 9 ) (.6) b = (1/6)( y 1 + y 3 y 4 + y 6 y 7 + y 9 ) (.7) b 11 = (1/6)(y 1 + y + y 3 y 4 y 5 y 6 + y 7 + y 8 + y 9 ) (.8) b = (1/6)(y 1 y + y 3 + y 4 y 5 + y 6 + y 7 y 8 + y 9 ) (.9) b 1 = (1/4)(y 1 y 3 y 7 + y 9 ) (.30) b 0 = (1/)Σy i (/3)(b 11 + b ) (.31) Regresí rovice plochy odezvy má tvar Y = b + b x + b x + b x + b x + b x x. (.3) reg 0 1 1 11 1 1 1 Maximum (miimum) fukce popisující plochu odezvy azýváme stacioárím bodem a vypočteme ho řešeím rovic pro x 1 a x Y reg x 1 = 0 a Y x reg = 0. (.33) Simplexová metoda Pomocí aalýzy rozptylu experimetálích hodot závisle proměé veličiy určíme, které z původě uvažovaých faktorů výzamě ovlivňují závisle proměou veličiu. Dále je třeba zjistit optimálí kombiaci hodot výzamých faktorů, tj. alézt oblast, ve které má závisle proměá veličia z hlediska použití aalytického postupu ejlepší hodotu. Může to být apříklad ejvyšší absorbace roztoku, ejkratší doba ebo ejižší áklady a aalýzu apod. Možý tvar výsledkové plochy (plochy odezvy) zázorňuje obrázek.1. 9
Oblast optima, charakterizovaá optimálí kombiací výzamých faktorů Optimalizace Oblast faktoriálích experimetů Obrázek.1. Možý tvar výsledkové plochy a optimalizace Pro alezeí optimálích podmíek můžeme použít řady metod, které byly vypracováy pro aplikace v jiých oblastech přírodích ebo ekoomických věd. Pro experimetálí optimalizaci v chemii je ejvhodější tzv. simplexová metoda, která je velmi jedoduchá a rychle vede k alezeí optima. Pricipem metody je pohyb experimetálě zjištěého bodu v N-rozměrém faktorovém prostoru (N je počet výzamých faktorů) ve směru ejvětšího gradietu závisle proměé veličiy. Souřadice bodu jsou dáy hodotami výzamých faktorů. Experimetálí plá simplexové metody spočívá v umerickém sestrojeí pravidelého N-rozměrého tělesa (simplexu), které má N + 1 vrcholů, a v postupém sestrojováí dalších simplexů, které se vytvářejí podle určitých pravidel. V počátečím simplexu změříme hodotu závisle proměé veličiy ve všech vrcholech tělesa a rozhodeme, která je ejhorší, tj. která má ejižší (ejvyšší) hodotu sigálu. K ejhoršímu vrcholu umericky sestrojíme zrcadlový obraz, takže vzike ový simplex, který má s předchozím společé všechy vrcholy kromě jedoho. V tomto ovém vrcholu opět změříme hodotu závisle proměé a zovu rozhodeme, který vrchol má ejhorší hodotu závisle proměé veličiy. Postupujeme tak dlouho, až alezeme optimum. Při volbě počátečího simplexu postupujeme takto: Ve faktoriálím pokusu N, který musí předcházet simplexové metodě, přiřadíme ižší úrovi faktorů hodotu 0 a vyšší úrovi hodotu 1 podle vztahu x j, x = x j max x mi x mi, (.34) ve kterém x j, je ormalizovaá hodota faktoru, x j je skutečá hodota faktoru, x max a x mi jsou maximálí a miimálí hodoty jedotlivých faktorů (vyšší a ižší úrově). Volbu N + 1 vrcholů počátečího simplexu provádíme podle ásledující tabulky.3, ve které jsou uvedey ormalizovaé hodoty pro 4 sledovaé faktory. 30