CHEMOMETRIKA a STATISTIKA. Prozatímní učební text (srpen 2012) Miloslav Suchánek



Podobné dokumenty
Úvod do zpracování měření

ij m, velikosti n je tvořen (n m) rozměr-ným polem dat x x x 22 x n1 ... x n2 7.1 Druhy korelačních koeficientů

2. část: Základy matematického programování, dopravní úloha. Ing. Michal Dorda, Ph.D.

17. Statistické hypotézy parametrické testy

z možností, jak tuto veličinu charakterizovat, je určit součet

Předmět: Ročník: Vytvořil: Datum: MATEMATIKA TŘETÍ MGR. JÜTTNEROVÁ Název zpracovaného celku: KOMBINACE, POČÍTÁNÍ S KOMBINAČNÍM ČÍSLY

OPTIMÁLNÍ FILTRACE METALURGICKÝCH SIGNÁLŮ POMOCÍ INFORMAČNÍCH KRITÉRIÍ

Přímá úměrnost

Periodicita v časové řadě, její popis a identifikace

Skupina Testování obsahuje následující moduly: Síla a rozsah výběru, Testy a Kontingenční tabulka.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

20. Kontingenční tabulky

Dopravní stroje a zařízení odborný základ

SEMESTRÁ LNÍ PRÁ CE. Licenč ní studium STATISTICKÉZPRACOVÁ NÍ DAT PŘ I KONTROLE A Ř ÍZENÍ JAKOSTI

2 Trochu teorie. Tab. 1: Tabulka pˇrepravních nákladů

Katedra elektrotechniky Fakulta elektrotechniky a informatiky, VŠB - TU Ostrava

Soustava kapalina + tuhá látka Izobarický fázový diagram pro soustavu obsahující vodu a chlorid sodný

Exponenciála matice a její užití. fundamentálních matic. Užití mocninných řad pro rovnice druhého řádu

Konzultace z předmětu MATEMATIKA pro čtvrtý ročník dálkového studia

Úvod do lineárního programování

FINANČNÍ MATEMATIKA. Jarmila Radová KBP VŠE Praha

1. Základy počtu pravděpodobnosti:

SYLABUS PŘEDNÁŠKY 6b Z INŽENÝRSKÉ GEODÉZIE (Polohové vytyčování) 4. ročník bakalářského studia studijní program G studijní obor G

Parametry kvality elektrické energie ČÁST 6: OMEZENÍ ZPĚTNÝCH VLIVŮ NA HROMADNÉ DÁLKOVÉ OVLÁDÁNÍ

STP097 STATISTIKA CVIČENÍ EMPIRICKÁ DISTRIBUČNÍ FUNKCE, JEDNOVÝBĚROVÉ TESTY

35! n! n k! = n k k! n k! k! = n k

3. Polynomy Verze 338.

Neuronová síť. x 2 x 3. σ j. x 4. x 5. Menu: QCExpert Prediktivní metody

Úlohy domácího kola kategorie C

c sin Příklad 2 : v trojúhelníku ABC platí : a = 11,6 dm, c = 9 dm, α = Vypočtěte stranu b a zbývající úhly.

Odhad parametru p binomického rozdělení a test hypotézy o tomto parametru. Test hypotézy o parametru p binomického rozdělení

Národní informační středisko pro podporu kvality Tůmová

Měření hustoty kapaliny z periody kmitů zkumavky

Regresní analýza. Statistika II. Jiří Neubauer. Katedra ekonometrie FEM UO Brno kancelář 69a, tel

Statistika ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA DOPRAVNÍ. Jiří Volf, Adam Kratochvíl, Kateřina Žáková. Semestrální práce - 0 -

Pravděpodobnost a statistika - absolutní minumum

I. Objemové tíhy, vlastní tíha a užitná zatížení pozemních staveb

Dne obdržel zadavatel tyto dotazy týkající se zadávací dokumentace:

a m1 a m2 a mn zobrazení. Operaci násobení u matic budeme definovat jiným způsobem.

Číslicová technika 3 učební texty (SPŠ Zlín) str.: - 1 -

MATEMATIKA A BYZNYS. Finanční řízení firmy. Příjmení: Rajská Jméno: Ivana

Miroslav Čepek

5. cvičení 4ST201_řešení

Univerzita Pardubice

M - Příprava na čtvrtletní písemnou práci

Příprava na 1. čtvrtletní písemku pro třídu 1EB

Mechanismy. Vazby členů v mechanismech (v rovině):

MMEE cv Stanovení množství obchodovatelného zboží mezi zákazníkem a dodavatelem

5 ZKOUŠENÍ CIHLÁŘSKÝCH VÝROBKŮ

6. T e s t o v á n í h y p o t é z

51/2006 Sb. ze dne 17. února o podmínkách připojení k elektrizační soustavě

PRAKTIKUM... Oddělení fyzikálních praktik při Kabinetu výuky obecné fyziky MFF UK. Odevzdal dne: Seznam použité literatury 0 1. Celkem max.

Zobrazení v rovině je předpis, který každému bodu X roviny připisuje právě jeden bod X roviny. Bod X se nazývá vzor, bod X se nazývá obraz.

Obchodní podmínky PRESPLAST s.r.o.

2.2.2 Zlomky I. Předpoklady:

L 110/18 Úřední věstník Evropské unie

PROVOZNÍ CHARAKTERISTIKY OTOPNÝCH TĚLES

EXPERTNÍ POSUDEK Doc. RNDr. Martin Ouředníček, Ph.D. Stručný výtah z posudku.

2 EXPLORATORNÍ ANALÝZA

Využití pojistné matematiky v práci pojišťovacího zprostředkovatele

Analýza oběžného kola

7. Stropní chlazení, Sálavé panely a pasy - 1. část

Mezní kalibry. Druhy kalibrů podle přesnosti: - dílenské kalibry - používají ve výrobě, - porovnávací kalibry - pro kontrolu dílenských kalibrů.

1.7. Mechanické kmitání

12. N á h o d n ý v ý b ě r

Poměry a úměrnosti I

2.1 Pokyny k otevřeným úlohám. 2.2 Pokyny k uzavřeným úlohám TESTOVÝ SEŠIT NEOTVÍREJTE, POČKEJTE NA POKYN!

Lineární Regrese Hašovací Funkce

Náhodný výběr 1. Náhodný výběr

Spoje se styčníkovými deskami s prolisovanými trny

Matematický KLOKAN kategorie Benjamín

DRAŽEBNÍ ŘÁD PRO DRAŽBU NEMOVITOSTÍ

INSTITUT FYZIKY. Měření voltampérové charakteristiky polovodičové diody

Seznámíte se s pojmem Riemannova integrálu funkce jedné proměnné a geometrickým významem tohoto integrálu.

4.5.1 Magnety, magnetické pole

1.3 Druhy a metody měření

3.5.8 Otočení. Předpoklady: 3506

3 nadbytek. 4 bez starostí

Ėlektroakustika a televize. TV norma ... Petr Česák, studijní skupina 205

Osvětlovací modely v počítačové grafice

269/2015 Sb. VYHLÁŠKA

MATEMATIKA I VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FAKULTA STAVEBNÍ JIŘÍ NOVOTNÝ ZÁKLADY LINEÁRNÍ ALGEBRY

ZEMNÍ ODPOR ZEMNIČE REZISTIVITA PŮDY

Investice a akvizice

Metodika k hodnocení biologické účinnosti insekticidních přípravků mořidel proti křísku polnímu v obilninách

Orientační průvodce mateřstvím a rodičovstvím v zadávacích dokumentacích poskytovatele

Technická hodnota věcí a zařízení

TECHNICKÁ UNIVERZITA V LIBERCI

ČÁST PÁTÁ POZEMKY V KATASTRU NEMOVITOSTÍ

VYSOKÁ ŠKOLA FINANČNÍ A SPRÁVNÍ, o.p.s. Fakulta ekonomických studií katedra řízení podniku. Předmět: ŘÍZENÍ LIDSKÝCH ZDROJŮ (B-RLZ)

DYNAMICKÉ VÝPOČTY PROGRAMEM ESA PT

Metody hodnocení rizik

( ) Úloha č. 9. Měření rychlosti zvuku a Poissonovy konstanty

Testy statistických hypotéz

Tel/fax: IČO:

9. února algoritmech k otáčení nedochází). Výsledek potom vstupuje do druhé fáze, ve které se určuje, jestli se

PRINCIPY ŠLECHTĚNÍ KONÍ

Zadávací dokumentace pro podlimitní veřejnou zakázku na dodávky

Algoritmizace a programování

Pro získání zápočtu je nutno mimo docházky (max. 3 absence) získat ze dvou napsaných písemek dohromady alespoň dva příklady.

Transkript:

CHEMOMETRIKA a STATISTIKA Prozatímí učebí text (srpe 01) Miloslav Sucháek

1. Základí pojmy Při hodoceí aalytických metod a výsledků ebo při formulaci fyzikálě-chemických modelů popisujících vztahy mezi proměými veličiami, z ichž se většia získává experimetálě, využíváme matematicko-statistické metody. Matematicko-statistické metody jsou vhodým ástrojem zkoumáí systému v případech, kdy je uto učiit objektiví závěr o celku složeém z velkého možství jedotek, přičemž z ějakých důvodů je možo prozkoumat je malou, vybraou část tohoto celku. Hromadé jevy jsou takové, které se vyskytují za určitých podmíek opakovaě ve velkém počtu a lze je přitom pozorovat ebo získávat experimetem. Speciálím případem hromadého jevu je áhodý jev. Te za daých podmíek může a emusí astat, jeho výskyt závisí pak a áhodě. Číselá veličia, která měí svou hodotu působeím áhodých jevů, se azývá áhodá veličia. Zjistitelá hodota áhodé veličiy musí být jedozačě určea, tz. musí v kokrétě sledovaém případě abýt jedié hodoty. Náhodost jevu zameá emožost předpovědět s jistotou, zda při určitém experimetu kdykoli v budoucu jev astae či eastae. Je tomu tak proto, že ezáme všechy příčiy výskytu áhodého jevu, kterých je moho a které jsou samy o sobě epostižitelé a ekotrolovatelé. Náhodou veličiu charakterizují pravděpodobosti, s íž se vyskytují její hodoty v předem zvoleých mezích. Distribučí fukce áhodé veličiy ξ je fukcí reálé proměé x a její hodota v daém bodě x 0 je pravděpodobost, že ξ abude hodoty meší ebo rové x 0 : F(x 0 ) = P{ ξ < x 0 } pro x = x 0 (1) Všechy hodoty, kterých může áhodá veličia abýt, tvoří spolu s distribučí fukcí její rozděleí pravděpodobostí. Základí soubor je možia hodot áhodé veličiy s daým rozděleím pravděpodobostí, z íž se vybírají pozorovaé hodoty této veličiy. Základí soubor obsahuje hodoty áhodé veličiy skutečě pozorovaé a teoreticky pozorovaé. Teoreticky proto, že emáme techické, časové ebo jié možosti pozorováí uskutečit, ale víme, jak bychom každé jedotlivé pozorováí mohli uskutečit. Vlastosti základího souboru pozáváme je do určité míry prostředictvím áhodého výběru. Příkladem základího souboru mohou být apř. výsledky všech možých aalýz stejého vzorku (ekoečě velký soubor), všechy možé kocetrace H SO 4, které můžeme obdržet od výrobce (ekoečý), dodávka 5 vagóů železé rudy (koečý) apod. Náhodý výběr je potom apř. 5 aalýz stejého vzorku, 10 růzých kocetraci H SO 4, 5 vzorků po 1 kg odebraých áhodě z každého vagóu atd.. Náhodé veličiy, typy rozděleí Jak bylo uvedeo v předchozí kapitole, áhodá veličia je charakterizováa distribučí fukcí a rozděleím pravděpodobostí. Probereme si ěkteré vlastosti distribučích fukcí. Distribučí fukce má tyto vlastosti:

1. Hodoty distribučí fukce leží mezi 0 a 1, tedy. Distribučí fukce je eklesající 3. Distribučí fukce je spojitá zleva 0< F(x) <1 () F(x ) > F(x 1 ), pro všecha x >x 1 (3) 4. Každá distribučí fukce splňuje podmíky F(- ) = 0 a F( ) = 1 (4) Jestliže možé hodoty áhodé veličiy patří do itervalu (a,b), potom aalogicky platí: F(a) = 0 a F(b) = 1 (5) Z defiice distribučí fukce a vlastostí distribučí fukce plyou ěkteré další důležité vztahy: P( x 1 < ξ < x ) = F(x ) - F(x 1 ) (6) pro diskrétí áhodou veličiu P( x 1 < ξ < x ) = F(x ) - F(x 1 ) (7) P ( ξ > x ) = 1 - F(x) (8) Pomocí distribučí fukce může být udá záko rozděleí jak diskrétí, tak spojité áhodé veličiy. Záko rozděleí diskrétí áhodé veličiy ξ lze vedle tohoto způsobu popsat také možiou hodot x a odpovídajících pravděpodobostí P(ξ = x), které budeme ozačovat p(x) a azveme pravděpodobostí ebo frekvečí fukcí. Tyto pravděpodobosti splňují vztahy p( x) = 1 (9) x x P( x 1 < ξ < x ) = p( x) (10) x1 Pravděpodobosti p(x) a jejich rozděleí lze vyjádřit trojím způsobem: matematickou fukcí, tabulkou hodot a grafem. Záko rozděleí spojité áhodé veličiy ξ vyjádříme, kromě distribučí fukce, pomocí tzv. hustoty pravděpodobosti (frekvečí fukce), pro iž platí: F(x) = x f ( z) dz (11) Kvatily jsou body, rozdělující obor hodot áhodé veličiy v určitém pravděpodobostím poměru. 100.P%í kvatil, x P, je hodota, která současě splňuje erovosti: P(ξ < x P ) < P

V případě spojité veličiy platí: P(ξ > x P ) > 1 - P. F(x P ) = P (1) Tak apř. 50% kvatil, zameá, že 50% všech možých hodot áhodé veličiy ξ leží pod hodotou tohoto kvatilu, x 0,5. Teto kvatil se azývá mediá. Záko rozděleí podává o áhodé veličiě obraz sice úplý, ale často dost epřehledý. Proto shrujeme iformaci o áhodé veličiě do jedoho ebo ěkolika čísel, která veličiu dobře charakterizují. tato čísla azýváme charakteristikami. Z velkého možství charakteristik se budeme zabývat pouze dvěma: charakteristikou polohy a charakteristikou variability. Základí charakteristikou polohy je středí (očekávaá) hodota, E(ξ) ebo. Základí charakteristikou variability rozptyl, D(ξ) ebo σ, jeho odmociu azýváme směrodatou odchylkou, σ. Důležitou charakteristikou dvou áhodých veliči, apř. ξ a η, azýváme kovariací C(ξ,η): C(ξ,η)= E{[ξ - E(ξ)][η -E(η)]} (13) Koeficiet korelace, ρ, je defiová vztahem: ρ(ξ, η) = C(ξ,η)/(ρ(ξ).ρ(η)) (14) který charakterizuje těsost vztahu mezi dvěma veličiami. Koeficiet korelace může abývat hodot z itervalu <-1,1>. Je-li koeficiet korelace ulový, potom se áhodé veličiy ξ a η azývají ekorelovaé. Věty o středí hodotě a rozptylu (platí pro ezávislé áhodé veličiy): 1. E(k) = k D(k) = 0 (k je kostata). E(k.ξ) =k.e(ξ) D(k.ξ) = k.d(ξ) 3. E(ξ - η) = E(ξ)-E(η) D(ξ-η) = D(ξ) + D(η) (15) 4. E(ξ.η) = E(ξ).E(η) 5. D(ξ) = E(ξ ) - [E(ξ)] Důležitou veličiou je ormovaá áhodá veličia, ζ,která má ulovou středí hodotu a jedotkový rozptyl: ζ = (ξ - E(ξ))/D(ξ) (16) Příklad: Diferečí metoda vážeí spočívá ve dvou postupých vážeí, jedak vážeky se vzorkem, jedak vážeky se zbytkem.obě hmotosti můžeme považovat za ezávislé áhodé veličiy ξ 1 a ξ. Zjistěte středí hodotu a rozptyl rozdílu obou hmotostí. E(ξ 1 - ξ ) = E(ξ 1 ) - E(ξ )

D(ξ 1 - ξ ) = D(ξ 1 )+ D(ξ ), je-li D(ξ 1 ) = D(ξ ) = σ, potom D(ξ 1 - ξ ) =.σ. Základí typy rozděleí Nejdůležitějším a v teorii měřeí ejběžějším rozděleím pravděpodobostí spojité áhodé veličiy je tzv. ormálí (Gaussovo) rozděleí. Tímto rozděleím se dají aproximovat i ěkterá rozděleí spojitá i diskrétí. Toto rozděleí je použitelé všude tam, kde kolísáí hodot áhodé veličiy je způsobeo součtem velkého počtu epatrých a vzájemě ezávislých vlivů. Tak apř. při chemické aalýze vzorku ovlivňuje výsledek kolísající kvalita chemikálií, růzá vlhkost vzduchu, teplota, tlak, stabilita přístrojů, mometálí schoposti pracovíka, kolísáí apětí v síti. Normálí rozděleí je charakterizováo dvěma parametry: středí (očekávaou hodotou) µ a rozptylem σ. Začí se N(µ, σ ) a jeho hustota pravděpodobosti je ukázáa a obr. 1. Obr. 1 Normálí rozděleí pro dvě růzé hodoty σ Normálí rozděleí je symetrické kolem středí hodoty. Distribučí fukce ormálího rozděleí, stejě jako hustota pravděpodobosti, jsou tabelováy pro hodoty ormovaé áhodé veličiy ζ. Pro výpočet hodot z této ormovaé áhodé veličiy z hodot x eormovaé veličiy platí: z = (x - µ)/σ (17) Toto rozděleí budeme začit N(0,1). Tabelováy jsou hodoty F(z) a f(z) pro ezáporé z. Platí: F(-z) = 1 - F(z) a f(-z) = f(z). (18)

Uvažujme yí pravděpodobost, že ormovaá áhodá veličia ormálě rozděleá bude uvitř itervalu symetrického kolem 0. Tuto pravděpodobost může apř. vyjádřit vztahem: P( z < z α ) = 1 - α což je ekvivaletí vztahu P( z > z α ) = α Hodotu z α azýváme 100.α% í kritickou hodotou. Příklad Vypočtěte kritickou hodotu z α pro α = 0,05. Podle předchozích vztahů můžeme psát: P( - z α < ζ < z α ) = F(z α ) - F(-z α ) = F(z α ) - 1 = 1 - α tedy F(z α ) = 1 - (α/) Podle zavedeé defiice kvatilu je z α = z P P.100%ím kvatilem pro P = 1-(α /). Pro α = 0,05 je F(z α ) = 0,975 a z tabulek zjistíme z α = 1,96, což je 97,5%í kvatil. Příklad Kotrolujeme jakost při výrobě kaprolaktamu. Přitom požadujeme, aby bod tuhutí, Θ, byl v mezích 67, - 69,9 0 C. Z dlouhodobého pozorováí je zámo, že středí hodota bodu tuhutí suroviy, odebíráme-li vzorek z jedoho pytle, je 67,7 0 C se směrodatou odchylkou 0,3 0 C. Staovte podíl pytlů, které leží mimo požadovaé meze. Předpokládejme, že áhodá veličia (ormálě rozděleá) bod tuhutí, Θ, suroviy v jedom pytli má rozděleí N(67,7;0,09). Naším úkolem je vypočítat pravděpodobosti: P(Θ < 67,) a P(Θ > 69,9) Vytvořme ormovaou veličiu ζ, jejíž hodoty požadovaého itervalu vypočteme podle: z 1 = (69,9-67,7)/0,3 = 7,33 F(7,33) = 1 z = (67, - 67,7)/0,3 = -1,67 F(-1,67) = 1 - F(1,67) = 0,047 Požadovaé pravděpodobosti: P(Θ < 67,) = 0,047 P(Θ > 69,9) = 1 - F(7,33) = 0 Odpověď a požadovaou otázku je: 4,7% pytlů bude mít ižší bod tuhutí ež 67, a žádý pytel vyšší bod tuhutí ež 69,9 0 C. Příklad Náhodá veličia ξ má rozděleí N(µ, σ ). Vypočtěte s jakou pravděpodobostí se hodoty této áhodé veličiy budou vyskytovat v itervalu µ ± σ. Hodoty ormovaé áhodé veličiy,ζ, vypočteme takto: z = (µ ± σ - µ)/σ = ± 1 F(1) = 0,841

F(-1) = 1 - F(1) = 0,159 P = 0,841-0,159 = 0,68 t.j. 68,%. Rozděleí χ Rozděleí χ je charakterizováo počtem stupňů volosti, k. Středí hodota tohoto rozděleí je k, rozptyl je.k. Tabelováy jsou kvatily, χ P(k), pro které platí P(χ (k) < χ P(k)) = P (19) Tak apř. kvatil χ 1-α/(6) pro α = 0,05 (χ 0,975(6) ) má hodotu 14,4. Rozděleí t (Studetovo rozděleí) Rozděleí t je rověž charakterizováo počtem stupňů volosti k. Je to symetrické rozděleí a pro vyšší k (k>30) se blíží ormálímu rozděleí. V praxi ho používáme tam, kde ezáme rozptyl σ áhodé veličiy a ahrazujeme ho odhadem rozptylu s (viz dále). V tabulkách jsou uvedey kvatily t pro zvoleé P tak, aby platil vztah: P( t(k) <t P ) = P (0) F-rozděleí (Sedecorovo rozděleí) Toto rozděleí budeme používat při aalýze rozptylu. Mějme dvě ezávislé áhodé veličiy ξ 1 a ξ o rozděleích χ (k 1 ) a χ (k ). Náhodá veličia f = (ξ 1 /k 1 )/(ξ /k ) (1) má F rozděleí o k 1 a k stupích volosti. V tabulkách alezeme kvatily F, pro které platí: P(F<F P (k 1,k ))= P () Pro rozděleí espojité áhodé veličiy si uveďme Poissoovo rozděleí. Poissoovo rozděleí,po Poissoovo rozděleí je limitím případem biomického rozděleí, jestliže počet pokusů,, se blíží q, pravděpodobost p(x) se blíží k ule a parametr λ=.p(x) = kost. Parametr λ je parametrem charakterizujícím daý typ rozděleí Po(λ). Pro určité hodoty λ je Poissoovo rozděleí tabelováo. Středí hodota i rozptyl rozděleí Po(λ) je λ. Rozděleím Po(λ) můžeme ahradit biomické rozděleí při p(x)<0,05. Řídí se jím apř. četost impulsů aměřeých Geigerovou-Müllerovou trubicí, četost červeých krviek v zorém poli mikroskopu, četost zmetků v dodávce zboží apod.

3. Náhodý výběr Uvažujme áhodý pokus, jehož výsledkem je hodota x áhodé veličiy ξ, která má distribučí fukci F(x). Opakujeme-li áhodý pokus ezávisle -krát, dostaeme hodoty x 1,x,..x. Možia těchto hodot se azývá áhodým výběrem rozsahu z rozděleí, majícího distribučí fukci F(x). Vzhledem k tomu, že hodoty áhodého výběru pocházejí z téhož základího souboru, mají stejou středí hodotu a stejý rozptyl. K charakterizaci áhodého výběru používáme charakteristik, které azýváme výběrovými charakteristikami. Zmííme se hlavě o dvou - výběrovém průměru a výběrovém rozptylu. Výběrový průměr (aritmetický průměr) je defiová jako x = (1/) xi (3) Středí hodota výběrového průměru je µ, rozptyl je σ /. Středí hodota výběrového průměru je tedy stejá jako středí hodota základího souboru, zatímco rozptyl výběrového průměru je rove jedé -tiě rozptylu rozděleí, z ěhož pochází. Výběrový rozptyl (odhad rozptylu) je defiová vztahem ebo vztahem s = s = 1 xi x 1 ( ) (4) 1 1 x i xi 1 ( ( ) ) (5) Podobě jako v případě výběrového průměru se dá dokázat, že očekávaá hodota výběrového rozptylu je σ. Srováme-li vztah pro výběrový rozptyl se vztahem pro výběrový druhý cetrálí momet: M = ( xi x) vidíme, že druhý cetrálí momet "podceňuje" odhad rozptylu áhodého výběru. Připomíáme, že uvedeé vztahy platí pro jakékoli rozděleí základího souboru. Defiujme si ještě jedu důležitou charakteristiku, Studetův poměr T: T = x µ s (6) (7) Tato veličia má t-rozděleí o (-1) stupích volosti. Defiujme ještě výběrový třetí a čtvrtý cetrálí momet áhodého výběru: M 3 = ( xi x) 3 (8)

M 4 = ( xi x) Potom výběrový koeficiet šikmosti je urče rovicí: 3/ A 3 = M 3 /M a výběrový koeficiet špičatosti rovicí B 4 = M 4 /M Obě výběrové charakteristiky používáme pro testy typů rozděleí. 4 (9) (30) (31) Rozpětí, R, defiovaé jako rozdíl mezi ejvyšší (x ) a ejižší (x 1 ) hodotou jedotlivých výsledků v sérii měřeí: R = x - x 1 (3) Z rozpětí můžeme vypočítat odhad směrodaté odchylky s: s = k.r (33) Hodoty koeficietu k jsou tabelováy v běžých statistických tabulkách. 4. Teorie odhadu V experimetálí oblasti (testováí, zkoušeí) epracujeme ikdy se základím souborem, ale s áhodým výběrem. Statistickým zpracováím získaých výsledků chceme odhadout parametry základího souboru, hlavě středí hodotu a rozptyl, a dále testovat určité hypotézy o těchto parametrech. Mějme áhodý výběr rozsahu z rozděleí, které závisí a ěkolika parametrech p i (i=1,..,r). Uspořádaá r-tice tvoří bod parametrického prostoru, který je podmožiou r- rozměrého euklidovského prostoru. Z tohoto áhodého výběru chceme odhadout ějakou reálou fukci parametru p 1 = g 1 (x 1,x,..,x ). Fukci g 1 a podobě ostatí fukce g i, azýváme bodovými odhady parametru p 1, resp. p i. Vzhledem k tomu, že odhady jsou rověž fukcemi áhodých veliči, jsou samoté odhady také áhodé veličiy. Reálou fukci g(x) azýváme parametrickou fukcí. Tak apř. pro rozděleí N(µ,σ ) je parametrickým prostorem polorovia Příklady parametrických fukcí jsou: parametr µ : g(x) = x g(x) = (x 1 + x )/ g(x) = ~ x - < µ < ; σ > 0 (aritmetický průměr) (střed rozpětí uspořádaého výběru) (mediá eboli hodota středu uspořádaého výběru)

parametr σ: g(x) = s (odhad rozptylu, viz rovice (4)) Pro každý parametr můžeme sestrojit celou řadu odhadů. Protože parametrické fukce jsou také áhodé veličiy, budou hodoty odhadů kolísat od výběru k výběru. Výhodost odhadu budeme tedy posuzovat a základě rozděleí pravděpodobostí odhadu g(x), a to a základě charakteristik tohoto rozděleí - středí hodoty a rozptylu. Nestraým odhadem parametru p i se azývá taková parametrická fukce, která splňuje podmíku: E(g i ) = p i (34) (E(g i ) je očekávaá hodota g i ) pro každé p i z euklidovského prostoru. Máme-li dva estraé odhady téhož parametru p i, je lepší (vydatější) te odhad, který má meší rozptyl. Tak apř. výběrový průměr je estraým odhadem parametru u ormálího rozděleí N(µ,σ ), stejě jako odhad rozptylu s je estraým odhadem parametru σ téhož rozděleí. Odhady, které jsme uvažovali, odhadovaly ezámý parametr jediou hodotou. Nazýváme je proto bodovými odhady. Jak již bylo řečeo, aritmetický průměr ebo odhad směrodaté odchylky ejsou jediými možými odhady základích statistik. Uveďme si jiý typ bodového odhadu středí hodoty, tzv. mediá. Nejprve setřiďme aměřeé hodoty vzestupě podle velikosti. Pro lichý počet měřeí ztotožíme mediá s prostředí hodotou setříděého souboru. Pro sudý počet měřeí je mediáem aritmetický průměr dvou středích čleů uspořádaé poslouposti. Mediáu se používá pro charakterizaci meších souborů, eboť u větších je jeho zjišťováí epohodlé. Mediá patří mezi statistické charakteristiky, kterým říkáme robustí charakteristiky. Staovme yí pro bodový odhad parametru p dvě hodoty h 1,h takové, že s pravděpodobostí 1-α bude platit: h 1 < p < h (35) Je třeba zdůrazit, že etvrdíme, že p má pravděpodobost 1-α, že pade mezi daé meze, ale tvrdíme, že s pravděpodobostí 1-α pokryje iterval <h 1,h > pevou, ale ezámou hodotu p. Při itervalových odhadech je odhadem parametru p iterval, jehož kocové body h 1 a h jsou fukcemi áhodých veliči x 1...x.Teto iterval azýváme 100(1-α)%ím itervalem spolehlivosti parametru p, (1-α) je koeficiet spolehlivosti. Pokud můžeme a rozdělit a dvě hodoty α 1 a α, azýváme iterval <h 1,h > dvoustraým itervalem spolehlivosti. Pro případ, že jede z koeficietů má ulovou hodotu, mluvíme o jedostraém itervalu spolehlivosti. Dvoustraý iterval spolehlivosti, L 1, můžeme sestrojit z experimetálích hodot (předpoklad: ormálí rozděleí) jako L 1 = x - t 1-α/,-1.s/ (36) ve kterém t 1-α/,-1 je tabelovaý kvatil Studetova rozděleí pro hladiu výzamosti α. Hodotu koeficietu α volíme obvykle 0,05. Obdobě můžeme sestrojit jedostraý iterval spolehlivosti <-,L > ebo <L 1, > podle vztahů L 1 = x - t 1-α,-1.s/ (37) L = x + t 1-α,-1.s/ (38)

Pozor! Pro stejou hladiu výzamosti se kritické hodoty t Studetova rozděleí liší pro dvoustraý a jedostraý iterval spolehlivosti. Použití itervalových odhadů při testováí hypotéz si ukážeme dále. V tabulce 1 jsou uvedey ěkteré hodoty kritických hodot Studetova rozděleí pro oba případy. Tabulka 1 Kritické hodoty Studetova rozděleí pro α = 0,05 (k je počet stupňů volosti) k Dvoustraý iterval spolehlivosti jedostraý iterval spolehlivosti t 0,975 t 0,95 4,30,9 3 3,18,35 4,77,13 5,57,01 6,44 1,94 7,36 1,90 8,31 1,86 9,6 1,83 10,3 1,81 15,13 1,75 0,09 1,73 Příklad Řada šesti aalýz poskytla tyto hodoty obsahu účié látky ve vzorku: 68,5 69, 68,6 68, 68,8 68,9 Vypočtěte iterval spolehlivosti pro µ pro α=0,05. x = 68,70 s = 0,35 t(5) =,57 L 1 = <68,33;69,07> 5. Testováí hypotéz V předchozí kapitole jsme se zabývali bodovými a itervalovými odhady. Někdy ás zajímá, zda se určitý parametr p i liší od ějaké, ámi předpokládaé hodoty, ebo zda se liší dva parametry p i a p j. Tak apř. chceme zjistit, zda dvě testovací metody dávají shodé výsledky, tj. zda poskytují přesé i správé výsledky. Přitom předpokládáme, že typ rozděleí, apř. ormálí, je zám.

Úvahu začeme vytvořeím tzv. ulové hypotézy H 0, kterou ověřujeme testem výzamosti. Test provádíme pomocí testového kriteria, apř. t, F, které srováváme s kritickou hodotou (kvatilem) příslušého rozděleí a určité hladiě výzamosti a. Nabude-li hodota testového kriteria hodoty meší ež je kritická hodota, ulovou hypotézu přijímáme, ovšem s určitým rizikem. V opačém případě hypotézu zamítáme. V každém případě může ale být aše rozhodutí esprávé, eboť a) zamíteme hypotézu, která je správá (chyba I. druhu) b) přijmeme hypotézu, která je esprává (chyba II. druhu). Rizika obou rozhodutí volíme apriorě, apř. α = 0,05 (5%). Testy jedoduchých hypotéz budeme řešit pomocí itervalových odhadů. Zvolíme pouze takové příklady, ve kterých jsou základí parametry rozděleí ezámé, tz., že budeme testovat hypotézy pouze a základě experimetálích dat. Pro jedoduchost se spokojíme s testy hypotéz o středí hodotě. Uveďme si jedoduchý příklad. Chceme určit, zda bodový odhad středí hodoty (aritmetický průměr) se eliší od předpokládaé hodoty (středí hodota, správá hodota). Test takové hypotézy zapisujeme jako alterativí hypotézu H : µ µ 0 Alterativí hypotéze říkáme dvoustraá hypotéza. H 0 : µ = µ 0 (39) Předpokládejme dále, že jsme aměřili experimetálí data poskytující iterval spolehlivosti pro µ: L 1 : < 9,89; 10,05> Test hypotézy spočívá v tom, že zjistíme, zda iterval spolehlivosti obsahuje či eobsahuje µ. Pokud ao, hypotéza platí. V ašem případě apř. hypotéza µ = 10,00 platí, jiá hypotéza apř. µ = 9,80 eplatí. Zvolme jiý příklad. Chceme vědět, zda u sportovce ebyl překroče povoleý limit obsahu drogy v moči. Předpokládejme, že maximálě povoleý obsah drogy je 10 g/ml. Hypotézu formulujeme jako H 0 : µ 10,00 alterativí hypotézu jako H : µ > 10,00 a azýváme ji jedostraou hypotézou. Test této hypotézy spočívá v tom, že zjistíme, zda jedostraý iterval <L 1, > obsahuje testovaou středí hodotu µ.pokud ao, hypotéza platí. Zvolme příklad, kdy byl z experimetálích údajů zjiště jedostraý iterval spolehlivosti <9,97; >, hypotéza o epřekročeí povoleého limitu 10 g/ml byla potvrzea. Jiý příklad: Aalýzou čisté chemikálie byl experimetálě aleze průměrý obsah účié látky 99,85%. Miimálí obsah látky musí být podle ormy 99,90%. Platí hypotéza o tom, že chemikálie vyhovuje ormě? V tomto případě testujeme hypotézu H 0 : µ 99,90

alterativí hypotéza H : µ < 99,99 a je to opět jedostraá hypotéza. Postupujeme obdobě jako v předchozím příkladě. Z experimetálích dat vypočteme jedostraý iterval spolehlivosti <-,L >. Pokud iterval spolehlivosti obsahuje středí (testovaou) hodotu, hypotéza je potvrzea. Pro áš příklad byl jedostraý iterval spolehlivosti <- ;99,95>, chemikálie vyhovuje ormě. Srováí dvou středích hodot Velmi častým úkolem je srováí dvou středích hodot, které pocházejí ze dvou základích souborů N(µ 1,σ 1 ) a N(µ,σ ). V ašich výpočtech budeme předpokládat, že z obou základích souborů jsme vybrali ezávislé áhodé výběry o rozsahu 1 a. Budeme rozlišovat dva případy: rozptyly obou souborů jsou stejé ebo ejsou stejé. V každém případě musíme tuto hypotézu ejprve potvrdit ebo vyvrátit. V algoritmu testu hypotézy o rovosti dvou středích hodot tedy ejprve provedeme F test a základě srováí vypočteé hodoty F s kritickou hodotou F 1-α/ (( 1-1);( -1)): F = 1 s s (40) Připomíáme, že do čitatele uvedeého vztahu dosazujeme vždy vyšší hodotu odhadu rozptylu! Nyí postupujeme dvojím způsobem. a) Pokud je hodota F ižší ež kritická, použijeme pro test hypotézy vztahy H 0 : µ 1 = µ s 1 1 ( 1). s + ( 1). s = + 1 (41) T = x x 1 s. 1/ + 1/ 1 Srováím absolutí hodoty testového kriteria T s kritickou hodotou t 1-α/ ( 1 + -) vede k přijmutí ebo zamítutí hypotézy. Příklad Při výrobě chlorovaého polymeru se sleduje obsah chloru v šaržích. V každé ze dvou po sobě ásledujících šaržích byl staove chlor desetkrát. Bylo použito stejé aalytické metody, šarže jsou podobé, takže eí důvodu pochybovat o rovosti rozptylů. Testujte hypotézu o rovosti skutečých obsahů chloru v obou šaržích. Výsledky:

I. šarže: 58,59 58,45 59,64 58,64 58,00 57,03 57,33 57,80 58,04 58,41 x 1 = 58,193 s 1 = 0,5419 II.šarže: 55,71 56,65 56,7 57,56 58,37 56,58 57,08 57,13 57,9 56,1 x = 56,993 s = 0,6361 s = 0,589 T = 3,50 z tabulek: t 0,975 (18) =,10 Hypotézu o rovosti skutečých obsahů zamítáme. Odhad rozdílu ve skutečých obsazích chloru můžeme vyjádřit itervalem spolehlivosti, vypočteým ze vztahu: L 1 = ( x x ) + t 1-α/ ( 1 + -).s. (( 1 + )/( 1 )) 1 Pro áš příklad: L 1 = <0,50;1,9> Iterval spolehlivosti můžeme použít i pro test ulové hypotézy. V případě, že vypočteý iterval spolehlivosti obsahuje ulovou hodotu, hypotéza platí. V ašem případě ulovou hodotu eobsahuje, hypotéza tedy eplatí. b) Pokud je hodota F vyšší ež kritická, postupujeme takto: Vypočteme hodotu T: x1 x T = s kde s, resp. s, je vyjádřea vztahem s = S 1 +S (43) S 1 = (s 1 / 1 ) S = (s / ) (44) Hodotu T srováme s kritickou hodotou t, vypočteou podle vztahu: t krit S. t α + S. t = S + S 1 1 /,( 1 1) 1 α /,( 1) 1 V případě T >t krit zamítáme hypotézu o rovosti obou středích hodot. Připomíáme, že v laboratorí praxi je teto případ málo obvyklý. (4) (45)

6. Vylučováí odlehlých výsledků V praxi jsme často postavei před rozhodutí, zda ámi alezeé výsledky opakovaých pokusů pocházejí všechy ze stejého základího souboru. Ukažme si ěkteré testy odlehlých výsledků. Budeme předpokládat, že experimetálí výsledky mají ormálí rozděleí. Dixoův test Teto test je výhodý vzhledem k tomu, že epotřebuje odhad směrodaté odchylky. Postup je ásledující (uvádíme pro <10): seřadíme hodoty vzestupě podle hodot (x 1 je ejižší hodota souboru, x je ejvyšší hodota experimetálího souboru rozhodeme, zda chceme vylučovat ejižší a ejvyšší hodotu souboru zvolíme hladiu výzamosti vypočteme ásledující poměry: poměr pro vyloučeí x pro vyloučeí x 1 3<<7 t 10 (x -x -1 )/(x -x 1 ) (x -x 1 )/(x -x 1 ) 8<<10 t 11 (x -x -1 )/(x -x ) (x -x 1 )/(x -1 -x 1 ) porováme vypočteé hodoty poměrů s tabelovaými. Pokud vypočteá hodota přesáhe tabelovaou, hodotu x 1 ebo x vyloučíme Tabulka. Kritické poměry t pro hladiu výzamosti 0,05 Krit. poměr Hodota krit. poměru t 10 3 0,941 4 0,765 5 0,64 6 0,560 7 0,507 t 11 8 0,554 9 0,51 10 0,477

Příklad: Setříděá aalytická data (apř. hmotostí obsahy): 10,3 10,7 10,3 10,33 10,45 10,49 10,50 10,61. Testujeme, zda lze vyloučit hodotu 10,61. Vypočteme t 11 : t 11 = (10,61-10,50)/(10,61-10,7) = 0,33 < 0,554 Neí statistický důvod pro vyloučeí hodoty 10,61! Grubbsův test Postup je ásledující: seřadíme hodoty vzestupě odhademe směrodatou odchylku souboru s vypočteme hodoty T 1 a T : T 1 x x = s 1 T = x x (46) s kde x 1, x mají stejý výzam jako v předchozím textu, x je aritmetický průměr porováme vypočteé hodoty s tabelovaými a určité hladiě výzamosti Pokud vypočteá hodota přesáhe tabelovaou, vyloučíme x 1 ebo x. Tabulka 3. Kritické poměry T pro hladiu výzamosti 0,05 3 4 5 6 7 8 9 10 T 1,155 1,481 1,715 1,887,00,16,15,90 (převzato z ISO 575-:1994(E)) Pro předchozí příklad: s = 0,17 x = 10,40 T 1 = 1,338 T =1,653 Obě hodoty jsou ižší ež tabelovaá hodota,16, emůžeme vyloučit žádou hodotu. 7. Hodoceí závislosti mezi proměými V laboratorí i techologické praxi je velmi častý případ, kdy jeda či více měřeých veliči jsou závislé a jiých, experimetálě zjištěých veličiách. Zázoríme-li graficky tuto závislost, apř. pro dvě veličiy x, y, dostaeme tzv. korelačí diagram, který je grafickým zobrazeím fukce y = f(x), popř. x = f(y). Vzhledem k tomu, že obě veličiy jsou získaé měřeím, můžeme obvykle rozhodout, která z ich je veličiou ezávisle a která je závisle proměou. V dalším výkladu budeme předpokládat, že

existuje vztah mezi závisle proměou veličiou (veličiami) a ezávisle proměou veličiou (veličiami), ezávisle proměé veličiy ejsou zatížey systematickými či áhodými chybami, ebo áhodé chyby těchto veliči jsou zaedbatelé vůči áhodým chybám, kterými jsou zatížey závisle proměé veličiy, rozděleí závisle proměé je ormálí jedotlivé hodoty závisle proměé veličiy jsou získaé ezávislým měřeím Metody, kterými zjišťujeme matematické vyjádřeí fukčího vztahu mezi měřeými veličiami, azýváme metodami regresí aalýzy. Při regresí aalýze ejprve formulujeme tvar fukčí závislosti mezi proměými. Fukčí závislost obsahuje, kromě zámých veliči (ezávisle a závisle proměá) ještě tzv. parametry, které fukčí vztah charakterizují. Model může být buď lieárí ebo elieárí v parametrech. Je-li model lieárí v parametrech, platí pro vztah mezi závisle a ezávisle proměými rovice y = d 1 f 1 + d f +...+ d p f p (47) kde f i = fi(x 1, x,...,x k ) je zámou fukcí ezávisle proměých eobsahující parametry d j. Tak apř. pro regresí přímku y = ß 0 + ß 1 x (48) je d 1 = ß 0, d = ß 1, f 1 = 1, f = x. Kalibračí křivka Kalibrace metody je v aalytickém procesu stěžejí záležitost. Většia metod vyžaduje kalibraci s pomocí stadardů růzé úrově. Hlavím smyslem je alézt vztah mezi experimetálě zjištěými veličiami, tj.závisle a ezávisle proměými. Matematickostatistické vyhodoceí tohoto vztahu vyžaduje ěkolik předpokladů. Za prvé musíme rozhodout, zda je uté, aby kalibračí závislost byla lieárí, za druhé, pokud chceme teto požadavek split, musíme se přesvědčit, zda skutečě lieárí je. Teto druhý požadavek se většiou mlčky předpokládá i když jeho oprávěost eí vždy samozřejmá. Za třetí musíme testovat, zda platí předpoklad o rovosti rozptylů závisle proměé podél celé kalibračí křivky. Z uvedeých předpokladů vychází i experimetálí postup při tvorbě kalibračí křivky. a) testováí typu rozděleí a rovosti rozptylů Experimetálí schéma pro testováí je v tomto případě ukázáo v ásledující tabulce: Hodoty závisle proměé, y pro x = c 1 x = c y 11 y 1 y 1 y... y 1 y

Z tabulky je patré, že zvolíme dvě úrově hodoty ezávisle proměé, při kterých aměříme větší počet hodot závisle proměé. aa) test typu rozděleí - test ormality Normálí rozděleí je ejběžější, tudíž ejprve testujeme ormalitu rozděleí v celém rozsahu kalibračí křivky. Ukažme si příklad testováí ormality při jedé hodotě ezávisle proměé, která má ulovou středí hodotu (tzv.blak). Naměřeé hodoty sigálu blaku = 50 0.00 0.004 0.006-0.003 0.001 0.006-0.004-0.001 0.003 0.007 0.003-0.008 0.01 0.00-0.006 0.003 0.006 0.005-0.007 0.008 0.007 0.00-0.009-0.00 0.009 0.008 0.00 0.000 0.00 0.009-0.007 0.003 0.013-0.008 0.00 0.001 0.000 0.003 0.008 0.00-0.006-0.003 0.008 0.003 0.001 0.003-0.007 0.005 0.004 0.001 x = 0.00186 s = 0.0053605 Hypotéza: µ = 0.000 σ = 0.005 (apriorí volba!) Ukažme si Kolmogorovův-Smirovův test. Seskupíme pozorovaé hodoty závisle proměé do tříd šířky 0,00 a sestrojíme tabulku, jejíž kostrukce je zřejmá z popisu. tř. zak četost kumul. č. emp. d.f. z=(x i -0,0+0,001)/0,005 teor.d.f. rozdíl -0,009 3 3 0,06-1,6 0,055 0,005-0,007 5 8 0,16-1, 0,115 0,045-0,005 1 9 0,18-0,8 0,1-0,03-0,003 3 1 0,4-0,4 0,345-0,105-0,001 3 15 0,30 0,0 0,500-0,00 0,001 11 6 0,5 0,4 0,655-0,135 0,003 9 35 0,70 0,8 0,788-0,088 0,005 5 40 0,80 1, 0,885-0,085 0,007 6 46 0,9 1,6 0,945-0,05 0,009 48 0,96,0 0,977-0,017 0,011 1 49 0,98,4 0,99-0,01 0,013 1 50 1,00,8 0,997 0,003 Pozámky:- třídí zak je polovia zvoleého itervalu

- empir. d.f. je empirická distribučí fukce, vypočteá jako poměr kumulativí četosti k celkovému počtu měřeí - teor. d.f. je teoretická distribučí fukce ormovaého ormálího rozděleí, alezeá v tabulkách pro příslušé z Test je založe a porováí maximálího absolutího rozdílu teoretické a empirické distribučí fukce s tabelovaou kritickou hodotou tohoto rozdílu pro 50 měřeí. Tabelovaá hodota je pro hladiu výzamosti 0,05 D = 0,188. Z aší tabulky vidíme, že absolutí hodota -0,00 je vyšší, rozděleí tedy eí ormálí s parametry µ = =0,000 a σ = 0,005. Pokud provedeme stejý test pro hypotézu µ = 0,001 a σ = 0,005, je maximálí absolutí hodota rozdílu 0,11, což je ižší ež hodota tabelovaá. Podle získaých výsledků testováí má blak ormálí rozděleí N(0,001; 0,005 ). ab) testováí rovosti rozptylů Test hypotézy o rovosti rozptylů je založe a výpočtu F-kriteria F s = 1 s (49) a porováím s kritickou hodotou F 0.975 {(-1);(-1)} pro hladiu výzamosti 0,05. Tímto testem se přesvědčíme, zda je splě základí požadavek pro lieárí regresi, tj. kostatost rozptylů závisle proměé podél celé kalibračí přímky. Všiměte si, že pro test používáme pouze dvou měřeí závisle proměé veličiy, obvykle při ejižší a ejvyšší hodotě ezávisle proměé veličiy. b) sestrojeí kalibračí křivky a její vyhodoceí Mějme dvojic x i (obsah aalytu v kalibračím vzorku) a y i (aměřeý sigál) a ozačme: x = ( 0 x ) / i (50) x0 = ( x ) / i (51) y0 = ( y ) / i (5) Závislost y = f(x) se azývá kalibračí závislost. lieárí kalibračí závislost : y = b 0 + b 1 x směrice kalibračí závislosti b 0 odhade metodou ejmeších čtverců jako:

b 1 = ( x x ) y i ( x x ) i 0 0 i (53) kostata b 0 se odhade: b 0 = y 0 - b 1.x 0 (54) Reziduálí rozptyl kalibračí závislosti, s e, se vypočte podle vztahu: s 1 = y b0 b1 x (. ) (55) e i i Iterval spolehlivosti pro parametr b 0 se vypočte: L = b ± t s 1 0 1 α/,( ) e x i ( x x ) Kostata b 0 je statisticky odlišá od uly, jestliže absolutí hodota veličiy: b0 T = s e ( x x ) i x i 0 i 0 (56) (57) přesáhe 1-α/ kvatil Studetova rozděleí. Iterval spolehlivosti pro parametr b 1 se určí jako: L = b ± t s 1 1 1 α/,( ) e 1 ( x x ) i 0 (58) Iterval spolehlivosti pro kalibračí závislost v bodě x se vypočte: 1 ( x x0 ) L1 = x ± t1 α/,( ) se + x i (59)

Test liearity kalibračí závislosti: Po zjištěí rovice regresí přímky se musíme přesvědčit, zda přímka vystihuje vztah mezi experimetálími hodotami dvojic bodů x i, y i alespoň s takovou přesostí, s jakou byly experimetálě určey hodoty závisle proměé. Předpokládejme proto, že fukčí vztah je vyjádře regresí rovicí y = β 0 + β 1 x + δ, kde δ =δ(x) je odchylka od přímky, která je také ezámým parametrem. Test liearity spočívá v testu hypotézy H 0 : δ = 0 a pro teto případ se použije jako testového kriteria F rozděleí. Ozačme y lk závisle proměou (aalytický sigál) a uvažujme případ, kdy z hodot x 1, x,... x je jich růzých je m, přičemž hodota x 1 se vyskytuje 1 krát, x krát, až x m m krát, a platí: l = (60) m Ozačme dále y l průměrou hodotu opakovaých měřeí pro určité x l a y průměr všech hodot. Testové kriterium má potom tvar: F = ( m) ( m ) m m ( y Y ) l l reg, l l ( y y ) lk l (61) (l = 1,...m; k = 1,... l ) Porováím F s hodotou F 1-α,(m-; -m) rozhodeme o platosti lieárího vztahu. V případě, že F F 1-α,(m-; -m), vyhovují experimetálí data lieárímu modelu. c) robustí regrese Pokud kalibračí závislosti ejsou lieárí, jak může ukázat test liearity, je vhodé experimetálí data ejprve zpracovat robustí regresí. Robustí regrese má schopost vyloučit vliv odlehlých bodů kalibračí křivky a mohdy zlepšit kvalitu proložeí experimetálích dat. Odlehlost ěkterých bodů a kalibračích závislostech může idikovat hrubé či systematické chyby v práci laboratoře a umožňuje rychlejší ápravá opatřeí, ež je to možé pomocí regulačích diagramů. Algoritmus obyčejé robustí lieárí regrese, tj. regrese vztahu y = b 0 + b 1 x si můžeme popsat ásledujícími kroky. 1. vyber dvě dvojice [x i, y i ]. prolož jimi přímku 3. pro alezeé parametry přímky (b 0,b 1 ) vypočítej mediá m čtverců odchylek pro aměřeé všechy body y i podle vzorce m = med (y i -Y reg,i ) (6)

4. Vyber jiou dvojici bodů a pokračuj bodem, dokud ebudou zpracováy všechy možé dvojice bodů Řešeím problému lieárí regrese metodou LMS (Least Media of Squares) jsou parametry b 0 a b 1 přímky s ejmeší hodotou m podle bodu 3. 8. Optimalizace Chceme-li ajít optimálí podmíky zkušebích metod ebo techologického procesu, musíme ejprve zjistit, které faktory statisticky výzamě ovlivňují hodotu závisle proměé veličiy, kterou měříme ebo optimalizujeme. Závisle proměou veličiou bývá obvykle fyzikálí sigál. Faktory, které hodotu závisle proměé veličiy ovlivňují, budeme považovat za ezávisle proměé veličiy. Faktory mohou být kvatitativí (kocetrace, teplota, tlak) ebo kvalitativí (druh metody, způsob techologického řešeí). Jedou z metod, kterými zjišťujeme statistickou výzamost působeí faktorů a hodotu závisle proměé veličiy, je metoda aalýzy rozptylu. Aalýza rozptylu Defiujme si ěkteré základí pojmy. Faktory budeme začit velkými písmey latiské abecedy, tedy A, B, C atd. Možiě hodot, kterých jedotlivé faktory mohou abývat, říkáme úrově faktorů. Tak apř. budeme-li sledovat vliv teploty a výtěžek techologického procesu při dvou teplotách 5 a 50 0 C, říkáme, že vliv teploty sledujeme a dvou úrovích. Nižší úroveň budeme začit idexem 1 vyšší úroveň idexem. Studujeme-li vliv většího možství faktorů při více úrovích každého z faktorů, říkáme kombiacím úroví všech faktorů postupy. Např. při studiu vlivu 3 faktorů A, B, C, které jsou a úrovích A 1,A,B 1,B,C 1,C,C 3, budou ěkteré z postupů: A 1B 1 C 1, A B 1 C 3 atd. Postupy mohou být s jedím ebo více opakováími. Při experimetálím provedeí je zajímavé, že ačkoli musíme pečlivě astavovat hodoty úroví jedotlivých faktorů a držet je při experimetu eměé, při statistickém zpracováí se hodoty těchto faktorů epoužívají, jak bude dále uvedeo. Úrově jedotlivých faktorů jsou ve statistickém modelu vlastě ormalizováy a hodoty 0,1, -1, - atd. Matematický model aalýzy rozptylu vyjádříme takto: Mějme sigálů áhodé veličiy, y 1,...y, které jsou lieárí fukcí parametrů (počet p) a áhodých chyb e 1,... e. Parametry ztotožíme s faktory. Model má potom tvar: yi = x β ji j + e (63) i (i=1,..; j=1,...p) p kde x ji jsou pevé kostaty (zpravidla 0, 1, -1, - atd.), β j jsou tzv. efekty faktorů, které mohou být odhaduty regresí metodou. O áhodých chybách předpokládáme, že mají ulovou středí hodotu, všechy stejý rozptyl, jsou ekorelovaé a mají ormálí rozděleí. Celková promělivost výsledků, S, je dáa součtem čtverců odchylek jedotlivých pozorováí od celkového aritmetického průměru:

S = ( yi y ) (64) Aalýza rozptylu spočívá v rozděleí celkové promělivosti a složky příslušející jedotlivým faktorům a tzv. reziduálí promělivosti, která odpovídá áhodým chybám. F- testem potom zjistíme statistickou výzamost jedotlivých složek a tím i vliv jedotlivých faktorů a hodotu závisle proměé veličiy. Aalýza rozptylu pro jede faktor Uvažujme experimet, v ěmž je vyšetřová vliv jedoho faktoru, apř. A, který bude sledová a I úrovích (I>). Při každé úrovi provedeme stejý počet opakováí měřeí, r, přičemž pro celkový počet pokusů platí: = r.i (65) Výsledky pokusů tvoří tzv. experimetálí matici, jejíž obecý čle ozačíme y iν, kde ν je počet opakováí měřeí a i-té úrovi. Pro i-tou úroveň můžeme model pro aalýzu rozptylu vyjádřit vztahem: y iν = µ + α i + e iν (66) ve kterém µ je středí hodota závisle proměé pro všechy úrově, eboť experimetálí matici si můžeme představit jako áhodý výběr ze základího souboru. α i je vliv faktoru A a i-té úrovi. Defiujme si yí pomocé mezisoučty v experimetálí matici tak, jak je v aalýze rozptylu zvykem: Y.. = y i ν I r Yi. = y (67) iν Odhady parametrů jsou potom vyjádřey rovicemi: r $ µ = 1 Y (68).. $ α = 1 Y $. µ r i (69) e = y r Y ν 1 (70). iν i i Nyí budeme testovat hypotézu o tom, že vlivy faktoru A a všech úrovích jsou stejé, tedy hypotézu: proti alterativí hypotéze H 0 : α 1 = α =...= α I H: Σα i > 0 Testové kriterium F je potom vyjádřeo vztahem:

ve kterém F = S S A r ( I 1) ( I) (71) S 1 1 Y A = Y r. i.. S = r I y 1 iν r I r I. i Y (7) Hodotu F srováváme s F 1-α,(I-1;-I) Odhad rozptylu měřeé veličiy vypočteme z residuálí promělivosti: s = S r /(-I) (73) Příklad: Každé ze tří laboratoří byl dodá stejý vzorek určitého materiálu. Následující tabulka udává alezeé hodoty změřeé vlastosti ze všech tří laboratoří. Máme zjistit, zda existují výzamé rozdíly mezi jedotlivými laboratořemi. Při řešeí tohoto příkladu uvažujeme kvalitativí faktor - laboratoř, přičemž je teto faktor a třech úrovích. Počet opakováí pro každou úroveň je stejá a rova 10. lab. I lab.ii lab.iii 194,6 190, 194,5 193,5 191,3 195, 194,6 19,4 194,5 194,6 191,3 195, 19,4 19,4 193,6 194,6 190, 194,7 194,6 190, 193,6 19,4 191,3 194,3 194,6 190, 194,5 194,6 191,3 193,4 Y i. : 1940,5 1910,8 1943,5 Y.. : 5794,8 y i ν = 1119407, S A = 65,343 S r = 18,306 F = 48,19 F 0,5 (,7) = 3,35 I r

Hypotézu o eexisteci výzamých rozdílů mezi laboratořemi zamítáme! Faktoriálí experimety V případě, že vyšetřujeme vliv více faktorů, bude model pro aalýzu rozptylu vyjádře vztahem, apř. pro dva faktory A, B: y ijν = µ + α i.x 1i + β j.x j + α i.β j x 1i x j + e ijν (74) přičemž faktor A vyšetřujeme a I a faktor B a J úrovích. Součiu α i.β říkáme iterakce faktorů. Z ekoomického i časového hlediska je výhodé pracovat a dvou úrovích pro každý faktor (I=J=). tyto experimety začíme N, kde N je počet vyšetřovaých faktorů. Při tomto typu pokusů měříme závisle proměou veličiu při všech kombiacích faktorů, takže celkový počet pokusů je dá hodotou r. N, kde r je počet opakováí každého měřeí a je stejý pro všechy postupy. Jedotlivým kombiacím úroví studovaých faktorů říkáme postupy a podle zavedeé Yatesovy symboliky je ozačujeme kombiací malých písme. Tak apř. pro dva faktory A, B máme tyto postupy ( v závorce je uvedeo začeí postupů): A 1 B 1 (-1), A 1 B (b), A B 1 (a), A B (ab). Z uvedeého příkladu je zřejmé,že při ozačeí postupu použijeme malého písmea ozačujícího faktor, který je a vyšší úrovi. Z experimetálě zjištěých hodot závisle proměé veličiy při všech postupech vypočteme součty čtverců odchylek odpovídající vlivu jedotlivých faktorů a výsledek, součty čtverců odchylek odpovídající iterakcím faktorů, tj. spolupůsobeí kombiace faktorů a výsledek pokusu, a reziduálí rozptyl. Test výzamosti je založe a F-testu, tz. a porováí rozptylů odpovídajících vlivu jedotlivých faktorů a reziduálího rozptylu. Uveďme si příklad experimetálí matice faktorového pokusu. : B 1 B A 1 A A 1 A r r r r Y i. : (-1) a b ab Yatesovo začeí pokusů vyjadřuje v tomto případě součet jedotlivých hodot pokusů. Promělivost odpovídající vlivu jedotlivých faktorů a iterakcí, P, je dáa vztahem: S P = [P] /(r. N ) (75) kde [P] je algebraický součet hodot jedotlivých pokusů, resp. jejich součtu (viz tabulka). Zaméka jedotlivých čleů součtu alezeme pomocí zamékového schématu. Vypočteá promělivost má jede stupeň volosti.

Zamékové schema pro faktorový pokus 3 postup: (-1) a b ab c ac bc abc efekt: A - + - + - + - + B - - + + - - + + AB + - - + + - - + C - - - - + + + + AC + - + - - + - + BC + + - - - - + + ABC - + + - + - - + Uvedeé zamékové schéma můžeme používat i pro působeí dvou faktorů. Neuvádíme zamékové schéma pro působeí více ež tří faktorů, eboť pro vyšetřováí vlivu takového počtu faktorů se používají jié experimety, tzv. kráceé faktoriálí experimety. Podle ašich zkušeostí z používáí faktoriálích pokusů vystačíme většiou s - 3 faktory. Vysvětlíme si použití zamékového schématu ve faktoriálím pokusu 3. Pro výpočet promělivosti odpovídající vlivu faktoru A dostaeme pro [A]: [A] = -(-1) + a - b + ab - c + ac - bc + abc pro [B]: [B] = -(-1) - a + b + ab - c - ac + bc + abc a apř. pro [AC]: [AC] = +(-1) - a + b - ab - c + ac - bc + abc Připomíáme, že do těchto vztahů dosazujeme za jedotlivé postupy hodoty závisle proměé veličiy. Pokud máme více opakováí (r>1), dosazujeme součet hodot závisle proměé veličiy pro všecha opakováí. Odhad rozptylu s pro N faktorů se vypočte z rovice: kde s = S r /( N (r-1)) (76) S = r 1 yiν Y r. i (77) N r N Odhad rozptylu má N (r-1) stupňů volosti. Vypočteou hodotu F P : F P = S P /s (78) porováváme obvyklým způsobem s tabelovaou hodotou F 1-α,(1; N (r-1)).

Příklad: Experimetálí matice pokusu N : B 1 B A 1 A A 1 A 0,60 0,508 0,648 0,508 0,64 0,514 0,67 0,503 0,648 0,481 0,64 0,473 Y i. : 0,789 0,7503 0,7899 0,7484 [A] = -0,789 + 0,7503-0,7899 + 0,7484 = -0,0804 [B] = -0,789-0,7503 + 0,7899 + 0,7484 = -0,001 [AB] = +0,789-0,7503-0,7899 + 0,7484 = -0,006 S A = -0,0804 /1 = 5,39.10-4 S B = -0,001 /1 = 1,0.10-7 S AB = -0,006 /1 = 5,63.10-7 S r =,13.10-5 s =,66.10-6 F A = 03 F B = 0,04 F AB = 0, F 0,95 (1,8) = 5,3 Z výsledků aalýzy rozptylu faktoriálího pokusu je zřejmé, že výzamý vliv a hodotu závisle proměé veličiy má pouze faktor A. Experimetálí optimalizace Pro optimalizaci je výhodé aproximovat závislost aalytického sigálu a hodotách výzamých faktorů. Zmíěé faktorové pokusy ám skýtají příležitost aproximace roviou podle rovice: Y reg = b 0 + b 1 x 1 +...+ b N x N (79) ve které veličiy x jsou ormalizovaé hodoty výzamých faktorů. Koeficiety b vypočítáváme podle vztahů: b b 0 = y i. N = x y j ji i N kde y i. jsou průměré hodoty Y i.. Vzhledem k tomu, že je výhodější zát koeficiety regresího vztahu v původích proměých x puv, můžeme přepočítat ormalizovaé hodoty a původí podle vztahů: (80)

x max je hodota faktoru a vyšší úrovi x mi je hodota faktoru a ižší úrovi 1/ = (x max - x mi )/ x stred = (x max + x mi )/ (81) x puv = x 1/ + x stred Rovice výsledkové (odezvové, respose surface) plochy, v ašem případě roviy, můžeme použít pro ěkterou z optimalizačích metod. Optimalizačí metody jsou vesměs založey a zalosti velikosti a směru gradietu výsledkové plochy, který pro rovici roviy má tvar: grad Y= b 1 dx 1 + b dx +... b N dx N (8) kde dx i jsou jedotkové vektory ve směru os výzamých faktorů. Při metodě ejvětšího spádu určíme experimetálě jedotkové vektory z předchozích faktorových pokusů a potom postupujeme ve směru gradietu. Simplexová metoda experimetálí optimalizace sleduje také směr gradietu výsledkové plochy, i když gradiet přímo evyužívá. Simplexová metoda Pomocí aalysy rozptylu experimetálích hodot závisle proměé veličiy určíme,které z původě uvažovaých faktorů výzamě ovlivňují závisle proměou veličiu.dále je třeba zjistit optimálí kombiaci hodot výzamých faktorů,tj.alézt oblast,ve které má závisle proměá veličia z hlediska použití aalytického postupu "ejlepší" hodotu.může to být apř.ejvětší absorbace roztoku,ejkratší doba ebo ejižší áklady a aalýzu apod.pro alezeí optimálích podmíek můžeme použít řady metod, které byly vypracováy pro aplikace v jiých oblastech přírodích ebo ekoomických věd. Pro je ejvhodější tzv. simplexová metoda, která je velmi jedoduchá a rychle vede k alezeí optima.pricipem metody je pohyb experimetálě zjištěého bodu v N-rozměrém faktorovém prostoru (N je počet výzamých faktorů) ve směru ejvětšího gradietu závisle proměé veličiy.souřadice bodu jsou dáy hodotami výzamých faktorů. Experimetálí plá simplexové metody spočívá v umerickém "sestrojeí" pravidelého N- rozměrého tělesa (simplexu), který má N+1 vrcholů, a v postupém "sestrojováí" dalších simplexů, které se vytvářejí podle určitých pravidel. V počátečím simplexu změříme hodotu závisle proměé veličiy ve všech vrcholech tělesa a rozhodeme, která je ejhorší, tj. která má ejižší (ejvyšší) hodotu sigálu. K ejhoršímu vrcholu umericky sestrojíme zrcadlový obraz, takže vzike ový simplex, který má s předchozím společé všechy vrcholy, kromě jedoho. V tomto ovém vrcholu opět změříme hodotu závisle proměé a zovu rozhodeme, který vrchol má ejhorší hodotu závisle proměé veličiy. Postupujeme tak dlouho, až alezeme optimum. Při volbě počátečího simplexu postupujeme takto: Ve faktoriálím pokusu N, který musí předcházet simplexové metodě, přiřadíme ižší úrovi faktorů hodotu 0 a vyšší úrovi hodotu 1 podle vztahu: x j, = x x j max x mi x mi (83)

ve kterém x j, je ormalizovaá hodota faktoru, x j je skutečá hodota faktoru, x max a x mi jsou maximálí a miimálí hodoty jedotlivých faktorů (vyšší a ižší úrově). volbu N+1 vrcholů počátečího simplexu provádíme podle ásledující tabulky, ve které jsou uvedey ormalizovaé hodoty pro 4 sledovaé faktory: Faktory: A B C D 1.vrchol 0. 0. 0. 0..vrchol 1. 0. 0. 0. 3.vrchol 0,5 0,866 0. 0. 4.vrchol 0,5 0,89 0,817 0. 5.vrchol 0,5 0,89 0,04 0,791 Po sestrojeí počátečího simplexu se opět vrátíme ke skutečým hodotám jedotlivých faktorů a další postup simplexu se děje v původím souřadicovém systému. Postup bodu lze vektorově vyjádřit vztahem : P * j = P - - P j (84) kde P - = (1/N) (P 1 + P +...+ P j-1 + P j+1 +...+ P N+1 ) (85) P j je souřadice "ejhoršího"bodu a P * j je ová souřadice. Vzhledem k tomu, že každý vektor se skládá ze složek podél jedotlivých os, platí předchozí rovice také pro složky vektoru a jedotlivých osách. Postup bodu ve faktorovém prostoru se řídí ěkolika pravidly: 1. Postup bodu se děje po každém měřeí závisle proměé veličiy. Nový vrchol se počítá podle uvedeých rovic pro každou osu 3. Jestliže ový vrchol má v ovém simplexu opět ejhorší hodotu sigálu, vrátíme se zpět k předchozímu simplexu a vyloučíme druhý ejhorší bod 4. Jestliže ějaký vrchol zůstává v N+1 postupých simplexech, alézáme se v okolí optima ebo jsme při měřeí závisle proměé veličiy udělali hrubou chybu. proto musíme zovu v tomto vrcholu přeměřit hodotu závisle proměé.

Příklad: Při optimalizaci staoveí amoiaku v ovzduší idofeolovou metodou byl faktoriálím pokusem 3 zjiště výzamý vliv procetového obsahu feolu, ph a procetového obsahu chlorau sodého a absorbaci roztoku při kostatí kocetraci amoiaku. Úrově jedotlivých faktorů byly: A(% NaClO) : 0,0 a 0,07 B(pH) : 10,7 a 11,3 C(% feolu): 1,50 a,00 Volba počátečího simplexu: Faktor A: x max = 0,07 x mi = 0,0 ormalizovaé hodoty 0: 0,0 1: 0,07 0,5: 0,045 Faktor B: x max = 11,3 x mi = 10,7 ormalizovaé hodoty 0: 10,7 0,866: 11, 0,89: 10,87 Faktor C: x max =,00 x mi = 1,50 ormalizovaé hodoty 0: 1,50 0,817: 1,91 0.04: 1,60 Poz.: U faktoru B ebylo možo úplě přesě dodržet vypočteé hodoty během optimalizace. Postup simplexu Vrchol Vyloučeý Poechaé A B C y exp vrchol vrcholy 1. 0,0 10,7 1,50 0,098. 0,07 10,7 1,50 0,183 3. 0,045 11, 1,50 0,193 4. 0,045 10,95 1,91 0,154 5. 1,3,4 0,090 11,13 1,77 0,197 6. 4,3,5 0,095 11,13 1,7 0,5

7. 3,5,6 0,080 11,58 1,53 0.3 8. 3 5,6,7 0,136 11,40 1,55 0,37 9. 5 6,7,8 0,10 11,65 1,13 0,58 10. 6 7,8,9 0,15 11,87 1,54 0,68 max. 9. Testováí robustosti Kritické parametry měřeí a jejich tolerace musí být zámy pro každý aalytický postup. Příklady takových kritických parametrů jsou apř. teplota, tlak, vlhkost, chemické faktory jako kocetrace čiidel, ph, apětí a frekvece elektrických přístrojů. Nejsou to tedy parametry, které přímo ovlivňují závisle proměou veličiu, ale jsou to další, mohdy těžko odhalitelé vlivy, které ovšem musíme brát v úvahu při sestavováí SOP. Kritické parametry odhalíme experimetálě pomocí testu robustosti parametrů. Postup Youdeova testu je ukázá v ásledující tabulce. Velkými písmey jsou ozačey omiálí hodoty parametrů, tedy ty hodoty, jež uvádíme v SOP. Malými písmey jsou ozačey alterativí hodoty, tedy takové, které se odchylují od omiálích o malou hodotu. Pokud je parametr kvalitativího rázu, vyjádříme jak omiálí, tak alterativí hodoty verbálě. Tabulka testu robustosti Kombiace Parametry 1 3 4 5 6 7 8 A/a A A A A a a a a B/b B B b b B B b b C/c C c C c C c C c D/d D D d D d d D D E/e E e E E e E e E F/f F f f F F f f F G/g G g g G g G G g Výsledky: r t u v w x y z Výpočetí schéma pro test robustosti je ukázá v další tabulce: Schéma pro test robustosti V A = 1/4(r+t+u+v)-1/4(w+x+y+z) =(A-a) V B = 1/4(r+t+w+x)-1/4(u+v+y+z) = (B-b) V C = 1/4(r+u+w+y)-1/4(t+v+x+z) = (C-c) V D = 1/4(r+t+y+z)-1/4(u+v+w+x) = (D-d) (86)

V E = 1/4(r+u+x+z)-1/4(t+v+w+y) = (E-e) V F = 1/4(r+v+w+z)-1/4(t+u+x+y) = (F-f) V G = 1/4(r+v+x+y)-1/4(t+u+w+z) = (G-g) Test robustosti spočívá v testu hypotézy H 0 : V i = 0, tj. že všechy kotrasty V jsou ulové. Vypočteme-li iterval spolehlivosti kotrastu jako L 1, = V i - t 1-α/;7.s/ (87) a obsahuje-li vypočteý iterval spolehlivosti bod ula, potom kotrast je statisticky evýzamý a metoda/postup je pro daý parametr robustí. Hodotu odhadu směrodaté odchylky vypočteme obvyklým způsobem ze sedmi měřeí 1 (( )... ( ) ) s = r x + + z x (88) 7 Pokud prověřujeme tímto testem méě ež sedm parametrů, můžeme doplit soubor formálími parametry, apř. kvalitativími a pracovat s imi jako s reálými parametry. Takovým formálím parametrem může oko v laboratoři, omiálí hodota je zavřeé, alterativí je otevřeé. Toto možá připadá podivé, icméě to fuguje. Větší počet parametrů pro běžou metodu připadá v úvahu zřídkakdy. V těchto ojediělých případech volíme jiý typ kráceého faktoriálího pokusu, eboť schéma pro Youdeův test robustosti je vlastě kráceý faktoriálí pokus (1/16). 7.