FAKULTA CHEMICKO-TECHNOLOGICKÁ KATEDRA ANALYTICKÉ CHEMIE. Semestrální práce z CHEMOMETRE. TOMÁŠ SYROVÝ 4.ročník

Podobné dokumenty
Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

Příloha č. 1 Grafy a protokoly výstupy z adstatu

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )

Tvorba lineárních regresních modelů

Úloha 1: Lineární kalibrace

Semestrální práce. 2. semestr

Tabulka č. 1 95%ní intervaly Úsek Směrnice model L1 L2 L1 L2 Leco1-0, , , ,15618 OES -0, , , ,21271

KALIBRACE A LIMITY JEJÍ PŘESNOSTI. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Kalibrace a limity její přesnosti

Kalibrace a limity její přesnosti

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Kalibrace a limity její přesnosti

UNIVERZITA PARDUBICE

Univerzita Pardubice SEMESTRÁLNÍ PRÁCE. Tvorba lineárních regresních modelů. 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D.

TVORBA LINEÁRNÍCH REGRESNÍCH MODELŮ PŘI ANALÝZE DAT. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Tvorba nelineárních regresních

Univerzita Pardubice

Fakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Kalibrace a limity její přesnosti

Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat )

Inovace bakalářského studijního oboru Aplikovaná chemie

UNIVERZITA PARDUBICE FAKULTA CHEMICKO-TECHNOLOGICKÁ

Statistická analýza. jednorozměrných dat

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

S E M E S T R Á L N Í

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

Semestrální práce. 2. semestr

Tvorba lineárních regresních modelů při analýze dat

UNIVERZITA PARDUBICE

Kalibrace a limity její přesnosti

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie

2.2 Kalibrace a limity její p esnosti

Tvorba nelineárních regresních modelů v analýze dat

Semestrální práce. 3.3 Tvorba nelineárních regresních modelů v analýze dat

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

6. Lineární regresní modely

KALIBRACE A LIMITY JEJÍ PŘESNOSTI 2015

UNIVERZITA PARDUBICE

Licenční studium Galileo: Statistické zpracování dat. Tvorba lineárních regresních modelů při analýze dat. Semestrální práce

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie

Tvorba lineárních regresních modelů při analýze dat

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie

Fakulta chemicko technologická Katedra analytické chemie

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

6. Lineární regresní modely

Statistická analýza jednorozměrných dat

Semestrální práce. 2. semestr

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

Semestrální práce z CHEMOMETRIE I Statistické zpracování jednorozměrných dat

http: //meloun.upce.cz,

UNIVERZITA PARDUBICE

UNIVERZITA PARDUBICE CHEMICKO-TECHNOLOGICKÁ FAKULTA KATEDRA ANALYTICKÉ CHEMIE

Statistická analýza jednorozměrných dat

PYTHAGORAS Statistické zpracování experimentálních dat

6. Lineární regresní modely

S E M E S T R Á L N Í

Tvorba nelineárních regresních modelů v analýze dat

Kvantily a písmenové hodnoty E E E E-02

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA. Semestrální práce

III. Semestrální práce

Aproximace křivek a vyhlazování křivek

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

Statistická analýza jednorozměrných dat

POLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými.

UNIVERZITA PARDUBICE

Analýza rozptylu ANOVA

Univerzita Pardubice SEMESTRÁLNÍ PRÁCE. Tvorba nelineárních regresních modelů v analýze dat. 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D.

Statistická analýza jednorozměrných dat

Tvorba modelu sorpce a desorpce 85 Sr na krystalických horninách za dynamických podmínek metodou nelineární regrese

Semestrální práce str. 1. Semestrální práce. 2.1 Tvorba lineárních regresních modelů při analýze dat. 2.3 Kalibrace a limity její přesnosti

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)

PRAVDĚPODOBNOST A STATISTIKA

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

Tvorba nelineárních regresních modelů v analýze dat

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

Regresní analýza. Eva Jarošová

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie

Statistická analýza jednorozměrných dat

Porovnání dvou reaktorů

Licenční studium Galileo: Statistické zpracování dat. Kalibrace a limity její přesnosti. Semestrální práce

PRAVDĚPODOBNOST A STATISTIKA

6. Lineární regresní modely

STATISTICKÁ ANALÝZA JEDNOROZMĚRNÝCH DAT. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Plánování experimentu

Charakteristika datového souboru

12. licenční studium Statistické zpracování dat při managementu jakosti. Lenka Hromádková

Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj.

Porovnání dvou výběrů

Posouzení linearity kalibrační závislosti

LINEÁRNÍ REGRESE. Lineární regresní model

Lineární regrese. Komentované řešení pomocí MS Excel

VÍCEROZMĚRNÝ STATISTICKÝ SOUBOR

SEMESTRÁ LNÍ PRÁ CE. Licenč ní studium STATISTICKÉZPRACOVÁ NÍ DAT PŘ I KONTROLE A Ř ÍZENÍ JAKOSTI

Statistická analýza jednorozměrných dat

Regresní a korelační analýza

odpovídá jedna a jen jedna hodnota jiných

Statistická analýza jednorozměrných dat

Aproximace a vyhlazování křivek

Korelační a regresní analýza

Transkript:

FAKULTA CHEMICKO-TECHNOLOGICKÁ KATEDRA ANALYTICKÉ CHEMIE Semestrální práce z CHEMOMETRE TOMÁŠ SYROVÝ 4.ročník

OBSAH: 1.Příklad C112 CHYBY A VARIABILITA INSTRUMENTÁLNÍCH MĚŘENÍ... 3 2. Příklad H207 PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT.. 4 3. Příklad H313 STATISTICKÁ ANALÝZA MALÝCH VÝBĚRŮ....8 4. Příklad B317 POROVNÁNÍ DVOU VÝBĚRŮ... 12 5.příklad H503 6.Příklad V609 7.Příklad E809 8.Příklad K601 9.Příklad M612 10.Příklad J607 ANALÝZA ROZPTYLU...14 LINEÁRNÍ REGRESNI MODELY...16 NELINEÁRNÍ REGRESNÍ MODELY...20 KALIBRACE...22 LINEÁRNÍ REGRESE...25 JEDNOROZMĚRNÉ LINEÁRNÍ REGRESNÍ MODELY...29 2

CHYBY A VARIABILITA INSTRUMENTÁLNÍCH MĚŘENÍ Syrový Tomáš Příklad :C112 Zadání: Určete variabilitu procentního obsahu KCN v neznámém vzorku, když se na navážku 0,3826 (0,0003)g vzorku spotřebovalo při argentometrické titraci 27,18(0,03) ml rostoku 0,09633 (0,001)M Ag(NO 3 ). Molekulová hmotnost KCN je 65,12 (0,00001)g. Program: ADSTAT Jednorozměrná data Šíření chyb Řešení: Teoretický základ: Pro procentický obsah látky ve vzorku platí: % = c (AgNO 3 )*(V AgNO3 )*M KCN /1000*m vzorku Přepsání finálního vztahu do jazyku BASIC Z = (x1*x2*x3)/(1000*x4) Fyzikální smysl Proměnná Střední hodnota Směr. odchylka c (AgNO 3 ) [mol/l] x 1 0.09633 0.001 (V AgNO3 ) [ml] x 2 27.18 0.03 M KCN [g/mol] x 3 65.12 0.00001 m vzorku [g] x 4 0.3826 0.0003 Výsledky: 1) Metoda Taylorova rozvoje: Průměr : 4.4564E-01 Směrodatná odchylka : 4.6653E-03 Rozptyl : 2.1765E-05 Relativní směrodatná odch. : 1.05 2) Metoda bodového určování: Průměr : 4.4564E-01 Směrodatná odchylka : 4.6653E-03 Rozptyl : 2.1765E-05 Relativní směrodatná odch. : 1.05 3) Metoda simulace MONTE CARLO: Počet simulací : 999 Průměr : 4.4566E-01 Směrodatná odchylka : 4.4965E-03 Rozptyl : 2.0218E-05 Relativní směrodatná odch. : 1.01 Závěr: Všechny tři metody poskytují řádově shodné výsledky. Pouze metoda Monte-Carlo se mírně odlišuje a má nepatrně lepší hodnoty rozptylu a směrodatné odchylky. 3

Příklad :H 207 PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Syrový Tomáš Zadání: Rozdělení výběru přírodního pozadí ekvivalentu záření gama. Měření hodnoty přírodního pozadí fotonového dávkového ekvivalentu záření gama bylo provedeno na referenční ploše přístrojem D300 s nastavením časové konstanty 10 s. Proveďte průzkumovou analýzu spojitých dat, ověření předpokladů a transformaci dat. Je rozdělení symetrické? Data:[µGy/h] 0,124 0,101 0,115 0,121 0,121 0,115 0,123 0,122 0,124 0,121 0,115 0,101 0,111 0,115 0,119 0,122 0,124 0,118 0,117 0,118 0,121 0,118 0,119 0,121 0,124 0,112 0,122 0,121 0,123 0,122 0,122 0,122 0,120 0,120 0,115 0,121 0,118 0,122 0,121 0,125 0,123 0,114 0,111 0,124 0,120 0,114 0,119 0,119 0,125 0,125 Program: ADSTAT Exploratorní analýza Základní předpoklady-transformace Řešení: 1. Exploratorní analýza Obr. 1 Kvantilový graf Obr. 2 Bodové a krabicové grafy Obr. 3 Graf hustoty pravděpodobnosti Obr. 4 Graf rozptýlení s kvantily 4

Obr. 5 Kruhový graf Závěr EDA: Obr.1 - Kvantilový graf indikuje minimálně 2O dole, mírné asymetrické rozdělení; Obr.2 - Tyto grafy indikují 2O dole a ukazují asymetrii; Obr.3 - Křivky normálního a empirického rozdělení se od sebe velmi odlišují což ukazuje na asymetrické rozdělení. Systematické sešikmení je způsobeno dvěmi vybočujícími body; Obr.4 - Tento graf indikuje 2O dole; Obr.5 - Grafem je elipsa na úhlopříčku, což indikuje asymetrii. Rozdělení je asymetrické s minimálně s dvěmi odlehlými hodnotami dole. 2.Základní předpoklady Hladina významnosti alfa : 0.050 TEST NORMALITY: Tabulkový kvantil Chi^2(1-alfa,2) : 5.9915E+00 Chi^2-statistika : 5.9220E+01 Závěr: Předpoklad normality zamítnut Vypočtená hladina významnosti TEST NEZÁVISLOSTI: Tabulkový kvantil t(1-alfa/2,n+1) : 2.0076E+00 Test autokorelace : 1.3178E+00 Závěr: Předpoklad nezávislosti přijat.vypočtená hladina významnosti DETEKCE ODLEHLÝCH BODŮ: Bod číslo 6 (spodní): 1.0100E-01 Bod číslo 7 (spodní): 1.0100E-01 Počet odlehlých bodů : 2 Parametry s vynechanými odlehlými hodnotami: Průměr :1.1982E-01 Směrodatná odchylka :3,7763E-03 Rozptyl :1,4261E-05 Šikmost :-7,2329E+00 Špičatost :2,7714E+00 : 1.3822E-13 : 9.6737E-02 Závěr základních předpokladů: Normalita zamítnuta a nezávislost je přijata, jsou zde dva odlehlé body, rozdělení pravděpodobně Laplaceovo. Nutno použít transformaci. 5

Transformace: Mocninná transformace 1) ANALÝZA PŮVODNÍCH DAT: A) Klasické odhady parametrů Průměr Rozptyl Směrodatná odchylka Šikmost Špičatost : 1.1900E-01 : 2.7388E-05 : 5.2333E-03 : -1.7105E+00 : 6.4292E+00 B) Kvantilové míry: Kvantil P Spodní mez Horní mez Polorozptyl Medián 0.5 1.2100E-01 - - Kvartil 0.25 1.1650E-01 1.2200E-01 5.5000E-03 Syrový Tomáš 2) PROSTÁ MOCNINNÁ TRANSFORMACE: A) Optimální hodnoty mocniny pro vybraná kritéri Optimální mocnina: 4.0000E+00 pro šikmost : 1.2351E+00 Optimální mocnina: 4.0000E+00 pro špičatost : 4.6202E+00 Optimální mocnina:-4.0000e+00 pro asymetrii : 7.8964E-02 Optimální mocnina: 4.0000E+00 pro asymetrii, rob. : 6.1496E-01 Optimální mocnina: 4.0000E+00 pro Hinkley-asymetrii: 3.3790E-05 Zvolená mocnina : 4.00 Průměr : 2.0271E-04 Rozptyl : 1.0192E-09 Směrodatná odchylka : 3.1925E-05 Šikmost : -1.2351E+00 Špičatost : 4.6202E+00 Opravený průměr :1.1932E-01 B) Kvantilové míry: Kvantil P Spodní mez Horní mez Polorozptyl Medián 0.5 2.1436E-04 - - Kvartil 0.25 1.8427E-04 2.2153E-04 3.7267E-05 3) BOX-COXOVA TRANSFORMACE: A) Optimální hodnoty mocniny pro vybraná kritéria Optimální mocnina: 4.0000E+00 pro šikmost : 1.2351E+00 Optimální mocnina: 4.0000E+00 pro špičatost : 4.6202E+00 Optimální mocnina:-4.0000e+00 pro asymetrii : 7.8964E-02 Optimální mocnina: 4.0000E+00 pro asymetrii, rob. : 6.1496E-01 Optimální mocnina: 4.0000E+00 pro Hinkley-asymetrii: 8.4475E-06 Optimální mocnina: 4.0000E+00 pro věrohodnost : 2.6748E+02 Zvolená mocnina : 4.00 Průměr : -2.4995E-01 Rozptyl : 6.3700E-11 Směrodatná odchylka : 7.9812E-06 Šikmost : -1.2351E+00 6

Špičatost : 4.6202E+00 Opravený průměr : 1.1932E-01 B) Kvantilové míry: Kvantil P Spodní mez Horní mez Polorozptyl Medián 0.5-2.4995E-01 - - Kvartil 0.25-2.4995E-01-2.4994E-01 9.3167E-06 Syrový Tomáš Transformační grafy: Obr.6 Graf Hines Hines Obr. 7 Graf maximální věrohodnosti Obr.6 - Tento graf indikuje optimální mocninu použitou k prosté mocninné transformaci. Z grafu vyplývá, že by tato mocnina měla mít hodnotu větší než 3. A tedy numerickou hodnotu 4 bych považoval za korektní; Obr.7-Protože konfidenční interval neobsahuje číslo 1 lze považovat tento model Box Coxovi transformace za statisticky významný. Závěr: Provedl jsem průzkumovou analýzu spojitých dat, ověřil jsem předpoklady a provedl transformace, s jejichž pomocí jsem se pokusil odstranit asymetrii, kterou vykazovala původní data. 7

STATISTICKÁ ANALÝZA JEDNOROZMĚRNÝCH DAT ANALÝZA MALÝCH VÝBĚRŮ Příklad :H 313 Zadání:Určete míry polohy, rozptýlení a tvaru výběru obsahu síry v cinvaldidu v jednotkách ppm. Jsou v datech vybočující hodnoty? Je třeba užít mocninné transformace? Je rozdělení symetrické? Data:Obsah S v cinvalditu [ppm] 29 190 200 245 300 311 320 376 400 400 400 Program: ADSTAT- Exploratorní analýza Základní předpoklady Řešení: I. Hornův postup 1. Pořádkové statistiky i 1 2 3 4 5 6 7 8 9 10 11 x i 29 190 200 245 300 311 320 376 400 400 400 2. Hloubka pivotu n= 10 - sudé H = integer {[(n + 1)/2] +1}/2 H = integer 3,25 H = 3 3. Pivoty x D = x (H) = x (3) = 200 x H = x (n+1-h) = x (9) = 400 4. Pivotová polosuma P L = (x D + x H )/2 P L = (200+400)/2 P L = 300 5. Pivotové rozpětí R L = x H - x D R L = 400-200 R L = 200 6. Interval spolehlivosti střední hodnoty P L R L. t L,0,975(n) µ P L + R L. t L,0,975(a t L,0,975(n) = 0,545 191 µ 409 8

II. S využitím ADSTATU 1.Exploratorní analýza Obr. 1 Kvantilový graf Obr. 2 Bodové a krabicové grafy Obr. 3 Graf s rozptýlenými kvantily Obr. 4 Kruhový graf. Obr. 5 Hustota pravděpodobnosti. 9

Obr.1 - Indikuje mírné asymetrické rozdělení, M x; Obr.2 - Tyto grafy neindikují žádné odlehlé body, různá délka fousů značí mírnou asymetrii v koncích; Obr.3- Indikuje 2O, jeden nahoře, jeden dole. Dále indikuje mírnou asymetrii; Obr.4 - Grafem je kruh až elipsa s malým zešikmením k vyšším hodnotám, z čehož lze usoudit mírnou asymetrii rozdělení; Obr.5 - Tento graf identifikuje L aplaceovo rozdělení. Je zde vidět, že se aritmetický průměr se od mediánu značně liší. Závěr EDA: Jedná se pravděpodobně o L aplaceovo rozdělení, což potvrdil modul Porovnání rozdělení v ADSTATU. Je zde podezření na 1-2 odlehlé body. Aritmetický průměr se od mediánu relativně značně liší. 2.Základní předpoklady Hladina významnosti alfa : 0,050 A) TEST NORMALITY Tabulkový kvantil Chi^2(1-alfa,2) : 5,9915 Chi^2-statistika : 3,8056 Závěr: Předpoklad normality přijat Vypočtená hladina významnosti : 0,114915 B) TEST NEZÁVISLOSTI Tabulkový kvantil t(1-alfa/2,n+1) : 2,1788 Test autokorelace : 1,10586 Závěr: Předpoklad nezávislosti přijat Vypočtená hladina významnosti : 0,15531 C) DETEKCE ODLEHLÝCH BODŮ: Ve výběru nejsou odlehlé body 3.Analýza jednoho výběru A) PARAMETRY TVARU Šikmost : -0,97003 Špičatost : 3,2194 B) KLASICKÉ ODHADY PARAMETRŮ : Průměr : 288,27 Směr. odchylka : 115,48 Rozptyl : 13335 95.0% spolehlivost: Spodní mez: 210,69 Horní mez: 365,85 C) ROBUSTNÍ ODHADY PARAMETRŮ : Medián : 311,00 Směr. odchylka mediánu: 165,38 Rozptyl mediánu : 27350 Rozptyl (nepar.) : 2820,4 Směr. odchylka mediánu: 53,108 95.0% spolehlivost: Spodní mez: 209,8 Horní mez: 412,2 10

Závěr analýzy jednoho výběru: Ve statistikách nebyly plně prokázány odlehlé body (viz oddíl 2 Základní předpoklady), byly vyčísleny klasické (průměr) i robustní (medián) odhady polohy a rozptýlení s 95% intervaly spolehlivosti. Závěr: Na tento příklad byla aplikována Hornova metoda analýzy malých výběrů. Výsledky jsem srovnal s klasickými i robustními statistikami polohy a rozptýlení v ADSTATU. Číselné hodnoty jsou uvedeny výše. Protože se jedná o malý výběr budou směrodatné výsledky Hornova postupu. Odchylky obou početních postupů jsou poměrně odlišné. Rozdělení je mírně asymetrické, s mírným podezřením na 1-2 vybočující body. 11

STATISTICKÁ ANALÝZA JEDNOROZMĚRNÝCH DAT POROVNÁNÍ DVOU VÝBĚRŮ Příklad : B 317 Zadání: Stanovení penicilinu v krvi bylo provedeno dvěma metodami, HPLC a spektrofotometricky. Zjistěte, zda oba postupy dávají stejné výsledky na hladině významnosti α = 0,05. Data:obsah penicilinu v krvi [mg/l] Výběr A 6,58 6,52 6,57 6,56 6,56 6,51 6,61 6,55 Výběr B 6,56 6,50 6,55 6,54 6,53 6,49 6,60 6,57 Program: ADSTAT Jednorozměrná data Porovnání 2 výběrů 1) Klasické odhady parametrů: Parametr Výběr A Výběr A celkově Velikost výběru 7 7 14 Průměr 6,5543 6,5400 6,5471 Rozptyl 0,0010952 0,0014667 0,0011824 Šikmost 0,24813 0,17306 0,2041 Špičatost 2,4196 2,0429 2,2235 2) Test homogenity rozptylu (hypotéza H0: s1^2=s2^2): A) Fisher-Snedecor F-test: Počet stupňů volnosti Df1 : 6 Df2 : 6 Tabulkový kvantil F(1-alfa/2,Df1,Df2) : 5,8198 F-statistika : 1,3391 Závěr: Rozptyly se považují za shodné, H0 přijata Vypočtená hladina významnosti : 0.366 B)Korigovaný F-test : Počet stupňů volnosti Df1 : 9 Df2 : 9 Tabulkový kvantil F(1-alfa/2,Df1,Df2) : 4.0260 F-statistika : 1,3391 Závěr: Rozptyly se považují za shodné, H0 přijata Vypočtená hladina významnosti : 0.335 C)Jacknife F-test Počet stupňů volnosti Df1 : 2 Df2 : 12 Tabulkový kvantil F(1-alfa/2,Df1,Df2) : 5,0959 F-statistika : 0,064466 Závěr: Rozptyly se považují za shodné, H0 přijata Vypočtená hladina významnosti : 0,938 12

3) Test shody průměru (hypotéza H0: µ1=µ2): Shoda rozptylů se dá předpokládat. t-test(pro shodné rozptyly) Počet stupňů volnosti Df1 : 12 Tabulkový kvantil t(1-alfa/2,df1) : 2,1788 t-statistika : 0,74674 Závěr: Průměry se považují za shodné, H0 přijata Vypočtená hladina významnosti : 0,470 Program: ADSTAT Jednorozměrná data Základní předpoklady 4)Základní předpoklady Test Normality : Přijat pro oba výběry Test Nezávislosti : Přijat pro oba výběry Závěr: Výše uvedená data prokazují shodu homogenity rozptylu a shodu průměru, což potvrzuje, že oba způsoby stanovení penicilinu v krvi podávají shodné výsledky na hladině významnosti α = 0,05. 13

Příklad :H 503 ANALÝZA ROZPTYLU Zadání: Byl vyšetřován obsah síry v uhlí dvěma nezávislými analytickými metodami v 7 laboratořích. Každé měření bylo opakováno 2x. Na hladině významnosti α = 0,05 vyšetřete, zda obsah síry v uhlí je ovlivněn analytickou metodou (Faktor A) nebo laboratoří (Faktor B), kde byla analýza provedena. Jaký je praktický výklad interakce užité metody a laboratoře? Je možné eliminovat interakci mocninnou transformací? Je v datech přesvědčivý důkaz, že každá laboratoř dospěla k jinému obsahu síry a každá metoda rovněž k jinému obsahu? Určete 95%ní intervalový odhad obsahu síry v uhlí na základě výsledků dvou analytických metod. Data:Obsah síry v uhlí v % metodami A 1 a A 2 v laboratořích L 1 až L 7 L1 L2 L3 L4 L5 L6 L7 A 1 0.107 0.127 0.115 0.108 0.097 0.114 0.155 0.105 0.122 0.112 0.108 0.096 0.119 0.145 A 2 0.105 0.127 0.109 0.117 0.110 0.116 0.164 0.103 0.124 0.111 0.115 0.097 0.122 0.160 1)Průměry a efekty úrovní: Celkový průměr = 1,1821E-01 Reziduální rozptyl = 1,4500E-05 FAKTOR A: FAKTOR B: Úroveň Průměr Efekt Úroveň Průměr Efekt 1 1,1643E-01-1,7857E-03 1 1,05E-01-1,3214E-02 2 1,2000E-01 1,7857E-03 2 1,25E-01 6,7857E-03 3 1,1175E-01-6,4643E-03 4 1,1200E-01-6,2143E-03 5 1,0000E-01-1,8214E-02 6 1,1775E-01-4,6429E-04 7 1,5600E-01 3,7786E-02 2) Tabulka ANOVA Je sestavena tabulka ANOVA a provedeny F-testy významnosti faktorů, resp. Interakcí, včetně kombinovaných testů pro ověření celkové významnosti faktorů A, B. H0: Efekty faktoru A jsou nulové, HA:... nejsou nulové Kvantil F(1-alfa,n-1,mn(o-1) = 4,600 H0: Efekty faktoru B jsou nulové, HA:... nejsou nulové Kvantil F(1-alfa,m-1,mn(o-1) = 2,848 H0: Interakce I je nulová, HA:... není nulová Kvantil F(1-alfa,(n-1)(m-1),nm(o-1)) = 2,848 (Zde I znamená efekty interakcí A a B dohromady 14

Zdroj rozrtylu Stupně Součet Průměrný Testovací H 0 je Spočtená α volnosti čtverců čtverec kritérium Mezi ůrovněmi A 1 8,929E-05 8,93E-05 6,158 Zamítnuta 0,026 Mezi ůrovněmi B 6 8,243E-03 1,37E-03 94,75 Zamitnuta 0,000 Interakce 6 4,912E-04 3,19E-05 2,198 Akceptována 0,105 Rezidua 49 2,030E-04 1,45E-05 - - Celkově 27 8,727E-03 3,23E-04 - - Závěr: Jelikož hodnota testačního kritéria 6,158 je vyšší než kvantil Fisher-Snedecorova rozdělení 4,600, je nulová hypotéza o nevýznamnosti faktoru A (druh analytické metody) zamítnuta a druh analytické metody je statisticky významným faktorem. Jelikož je hodnota druhého testačního kritéria 94,75 vyšší než kvantil Fisher-Snedecorova rozdělení 2,848, je nulová hypotéza o nevýznamnosti faktoru B(vliv laboratoře) zamítnuta a vliv laboratoří je zde statisticky významným faktorem. Interakce má fyzikální význam, a proto ji budeme testovat:jelikož hodnota testačního kritéria 2,198 je nižší než kvantil Fisher-Snedecorova rozdělení 2,848, je nulová hypotéza o nevýznamnosti interakčního členu AB(interakce použité metody s určitou laboratoří) přijata a interakce je statisticky nevýznamná. 15

LINEÁRNÍ REGRESNI MODELY Příklad: V609 Zadání: Proveďte posouzení nové analytické metody (HPLC) stanovení obsahu org. látek v Perunitu, a to porovnáním výsledků y vůči výsledkům x standardní extrakční metody měření se zanedbatelným rozptylem. Dvojice x,y představují obsah organických látek v Perunitu v %. Testujte úsek b 0,(β 0 = 0), a směrnici b 1,(β 1 = 1), individuálními t-testy parametrů i kombinovaným testem obou, a konečně elipsou spolehlivosti v modelu: y = β 0 + β 1 x Data:Obsah [%], standardní metoda x a HPLC metoda y: x 32,96 32,99 32,41 32,09 32,28 32,64 33,15 31,83 32,85 x 32,51 32,2 31,16 32,84 32,79 32,18 31,85 32,46 y 32,05 31,50 31,89 31,55 32,07 32,00 33,07 33,34 33,19 y 32,95 31,83 31,26 32,89 33,30 32,00 31,46 32,00 1)Předběžná analýza dat: Proměnná Průměr Směrodatná Párový korelační Spočtená odchylka koeficient hladina výz. y 3,2256E+01 7,057E-01 1,0000 -------- x 3,2423E+01 5,1239E-01 0,4475 0,072 2)Odhady parametrů a testy významnosti Kvantil Studentova rozdělení t(1-alfa/2,n-m) 2,131 Parametr Odhad Směrodatná Test HO: B[j] = 0 vs. HA: B[j] <> 0 odchylka t-kritérium hyp. HO je Hlad.význa. B[0] 1,2272E+01 1,0312E+01 1,1901E+00 Akceptována 0,253 B[1] 6,1634E-01 3,1801E-01 1,9381E+00 Akceptována 0,072 3)Základní statistické charakteristiky: Vícenásobný korelační koeficient,r : 4,4751E-01 Koeficient determinace, D : 2,0027E-01 Predikovaný koeficient determinace, Rp 2 : 0,0000 Střední kvadratická chyba predikce, MEP : 4,8952E-01 Akaikeho informační kritérium, AIC :-1,2681E+01 R ukazuje, že navržený lineární regresní model je statisticky nevýznamný. Nízká hodnota D =R 2 (20,03 %), představující procento bodů, vyhovujících regresnímu modelu ukazuje, že body nekorespondují s modelem přímky.mep a AIC se využívají k rozlišení mezi několika navrženými modely. Optimální jest ten model, který nabývá minimálních hodnot MEP a maximálních hodnot AIC. 16

4) Testování regresního tripletu (Data + model + metoda) Fisher-Snedocorův test významnosti regrese,f : 3,7563E+00 Tabulkový kvantil, F(1-alpha,m-1,n-m) : 4,5431E+00 Závěr: Navržený model není přijat jako významný. Spočtená hladina významnosti : 0.072 Scottovo kriterium multikolinearity, M Závěr: Navržený model je korektní. :-1,7734E-15 Cook-Weisbergův test heteroskedasticity, Sf : 5,8113E+01 Tabulkový kvantil, Chi^2(1-alpha,1) : 3.8415E+00 Závěr: Rezidua vykazují heteroskedasticitu. Spočtená hladina významnosti : 0.000 Jarque-Berraův test normality reziduí, L(e) :1,0572E+00 Tabulkový kvantil, Chi^2(1-alpha,2) :5,9915E+00 Závěr: Normalita je přijata. Spočtená hladina významnosti :0.589 Waldův test autokorelace, Wa : 6,0935E+00 Tabulkový kvantil, Chi^2(1-alpha,1) :3.8415E+00 Závěr: Rezidua nejsou autokorelována. Spočtená hladina významnosti : 0.014 Znamékový test, Dt : -1,8018E+00 Tabulkový kvantil, N(1-alpha/2) :1.6449E+00 Závěr: Rezidua nevykazují trend. Spočtená hladina významnosti : 0.036 5)Detekce vlivných bodů: Obr.1 Graf predikovaných reziduí Obr.2 Pregibonův graf 17

Obr.3 Williamsův graf Obr.4 McCulloh-Meeterův graf Obr.5 L-R graf Obr.1-Vykazuje 1 odlehlý bod (8); Obr.2-Odhaluje 2 vlivné body (8,12); Obr.3-Odhaluje 1O(8) a 1 E (12); Obr.4-Odhaluje 1 O(8) a 1 E(12); Obr.5- Odhaluje 2 O (8,2) a 1 E (12). Celkově data obsahují 1 O(8),1 E(12) a podezření na O (2) Závěr: Jelikož daný výběr obsahuje vlivné body, přistupuji ke konstrukci zpřesněného modelu 6)Konstrukce zpřesněného modelu: Po vypuštění bodů 8 a 2 byly nalezeny nové odhady parametrů zpřesněného modelu. Kvantil Studentova rozdělení t(1-alfa/2,n-m) 2,160 Parametr Odhad Směrodatná Test HO: B[j] = 0 vs. HA: B[j] <> 0 odchylka t-kritérium hyp. HO je Hlad.význa. B[0] -1,4182E+00 7,4412E+00-1,1901E-01 Akceptována 0,852 B[1] 1,0379E+00 2,2946E-01 4,5229E+00 Zamítnuta 0,001 Zpřesněný model : y = -1,4182(7,4412) + 1,0379(0,22946)x Je doložen statistickými hodnotami :MEP a AIC, které mají nižší hodnoty. 18

Vícenásobný korelační koeficient,r : 7,8195E-01 Koeficient determinace, D : 6,1144E-01 Predikovaný koeficient determinace, Rp 2 : 6,7484 Střední kvadratická chyba predikce, MEP : 2,2562E-01 Akaikeho informační kritérium, AIC :-2,3398E+01 Jelikož rezidua vykazují heteroskedasticitu použiji metodu vážených nejmenších čtverců. Užitím statistické váhy (w i = 1/y i 2 ) kompenzujeme heteroskedasticitu v datech. Obdržíme nové správnější odhady parametrů: Kvantil Studentova rozdělení t(1-alfa/2,n-m) 2,160 Parametr Odhad Směrodatná Test HO: B[j] = 0 vs. HA: B[j] <> 0 odchylka t-kritérium hyp. HO je Hlad.význa. B[0] -8,7318-E01 7,3016E+00-1,1959E-01 Akceptována 0,907 B[1] 1,0207E+00 2,2526E-01 4,5313E+00 Zamítnuta 0,001 2.zpřesněný model : y = -0,87318(7,3016) + 1,0207(0,22526)x Je doložen statistickými hodnotami : MEP a AIC, které mají nižší hodnoty. Vícenásobný korelační koeficient,r : 7,8251E-01 Koeficient determinace, D : 6,1232E-01 Predikovaný koeficient determinace, Rp 2 : 6,7250 Střední kvadratická chyba predikce, MEP : 2,2349E-01 Akaikeho informační kritérium, AIC :-2,3663E+01 Jelikož došlo ke snížení rozhodujících kritérií - MEP a AIC budou tyto odhady lepší než předešlé. 7) Testování úseku t (1-α,n-m) = -1,1959E-01 β 0 t (1-α,n-m). D(β 0 ) β 0 β 0 + t (1-α,n-m). D(β 0 ) -0,87318 2,160*7,3016 β 0-0,87318 + 2,160*7,3016-16,645 β 0 14,898 Interval spolehlivosti úseku regresní přímky obsahuje 0, úsek se tím pádem významně neodchyluje od 0. 8) Testování směrnice t (1-α,n-m) = 4,5313 β 1 t (1-α,n-m). D(β 1 ) β 1 β 1 + t (1-α,n-m). D(β 0 ) 1,0207 2,160*0,22526 β 1 1,0207 + 2,160*0,22526 0,534 β 1 1,507 Interval spolehlivosti směrnice regresní přímky obsahuje 1, směrnici lze považovat za jednotkovou. Závěr: Intervaly spolehlivosti úseku a směrnice indikují, že úsek β 0 lze považovat za nulový, směrnici β 1 lze považovat za jednotkovou. Výsledky nové metody(hplc) se statisticky neliší od standardní extrakční metody. Tvar přímky zpřesněného modelu je y = -0,87318(7,3016) + 1,0207(0,22526)x 19

NELINEÁRNÍ REGRESNÍ MODELY Příklad :E 809 Zadání: Pří sběru kaučuku se také sleduje velikost obvodu kmene stromu kaučukovníku na intenzitě hnojení S využitím modelů a na základě analýzy regresního tripletu a regresní diagnostiky rozhodněte, který z předložených modelů nejlépe odpovídá naměřeným datům, tj. velikosti obvodu kaučukovníku na intenzitě hnojení. K rozlišení mezi modely využijte především kritérií těsnosti proložení, MEPu a Akaikova informačního kritéria AIC. Data: Intenzita hnojení x,obvod stromu kaučukovníku y x 0 1,0 3,0 5,0 7,0 y 20,518 21,138 21,734 22,218 22,286 Použité modely: Výchozí hodnoty parametrů: p1=1; p2=1; p3=1 Model Vzorec Zápis v ADSTATU A x y = p 1 p 2 p 3 p1-(p2*(p3^(x))) B y = p 1 p 2 e (-p x) 3 p1-(p2*(exp(-p3*x))) C y = p 1 (1- e -(x + p )p 2 3 ) p1*(1-(exp(-(x+p2)*p3))) D y = p 1 e (-(p + p x)) 2 3 p1-(exp(-(p2+(p3*x)))) E y = p 1 e (-p p3^x) 2 p1-(exp(-(p2*(p3^(x))))) F x y = 1/p 1 p 2 p 3 (1/p1)-(p2*(p3^(x))) G Y = e p 1 p x 2p 3 (exp(p1))- (p2*(p3^(x))) Tabulka s informačními kriterii o těsnosti proložení: Počet Iterací: 500 Model MEP AIC RSC g1(e) g2(e) D A 1,2207E-02-2,4265E+01 1,1753E-02 2,171E-01 1,7768 99,478 B 1,2215E-02-2,4265E+01 1,1753E-02 2,1820E-01 1,7758 99,478 C 1,2206E-02-2,4265E+01 1,1753E-02 2,1714E-01 1,7761 99,478 D 1,2216E-02-2,4265E+01 1,1753E-02 2,1736E-01 1,7761 99,478 E 1,0818E-02-2,4048E+01 1,2275E-02 5,0415E-01 2,0596 99,455 F 1,2217E-02-2,4265E+01 1,1753E-02 2,1743E-01 1,7760 99,478 G 1,2218E-02-2,4265E+01 1,1753E-02 2,1761E-01 1,7759 99,478 Z tabulky je zřejmé, že nejlepšího proložení dosáhneme pomocí modelu E, který má nejnižší hodnoty MEP, RSC a nejvyšší hodnotu AIC. Na základě tohoto zjištění provedeme: Program:ADSTAT-nelineární regrese-minopt 1)Odhady parametrů modelu a statistiky Regresní funkce: y = p 1 e (-p p3^x) 2 p[ 1] : 1.000000E+00 p[ 2] : 1.000000E+00 p[ 3] : 1.000000E+00 20

1) Bodové odhady parametrů: Parametr Bodový Směrodatná Absolutní Relativní. odhad odchylka vychýlení vychýlení[%] p[ 1] 2,3623E+01 1,9665E-01 3,5840E-02 1,5171E-01 p[ 2] -1,1318E+00 6,0095E-02-1,0059E-02 8,8879E-01 p[ 3] 8,1114E-01 4,3979E-02-1,2135E-03-1,4961E-01 2) Statistické charakteristiky regrese: Reziduální součet čtverců, RSC : 1,2275E-02 Regresní rabat, D^2 [%] : 99,455 Akaikeho informační kriterium, AIC : -2.4048E+01 Průměr absolutních hodnot reziduí, MA : 4,0795E-02 Průměr relativních hodnot reziduí, MR : 1,8589E-01 Odhad reziduálního rozptylu, s^2(e) : 6,1374E-03 Odhad reziduální směrodatná odchylky, s(e) : 7,8341E-02 Odhad šikmosti reziduí, g1(e) : 5,0415E-01 Odhad špičatosti reziduí, g2(e) : 2,0596E+00 Mean error of prediction 1 : 1,0818E-02 Grafy: Obr.1 Regresní model Obr.2 Graf predikce-reziduum Závěr: Určil jsem hodnoty parametrů β 1 = 23,623(0,19665), β 2 = -1,1318(0,060095) a β 3 = 0,81114(0,043979). Vyšetření regresního tripletu potvrdilo správnost modelu. 21

KALIBRACE Příklad: K 601 Zadání: Nefelometr je kalibrován na obsah pevné fáze dispergované ve vodě. Pro standardní suspenzi jsou změřena kalibrační data. Zjistěte míry přesnosti kalibrace a obsah neznámých vzorků, jež vykazovaly na stupnici hodnoty 39,46,66 a 80 dílků. Jsou v kalibračních datech nějaké odlehlé hodnoty? Jsou splněny předpoklady na metodu nejmenších čtverců? Jde o lineární nebo nelineární kalibraci? Je rozdíl mezi hodnotou limity detekce lineární a nelineární kalibrace? Data:Obsah pevné fáze c [ppm], y [dílky] c 0,15 0,30 0,40 0,50 0,60 0,70 y 23 38 45 61 76 82 c 0,23 0,086 0,25 0,45 0,55 0,044 y 31,6 14,1 34,2 52 69,2 5,94 Program:ADSTAT - Lineární závislost-regresní diagnostika, Kalibrace- kvadratický spline A)Lineární regrese-regresní diagnostika 1)Zjištění vlivných bodů Obr.1 Pregibonův graf Obr.2Williamsův graf Obr.3 McCulloh-Meeterův graf Obr.4 L-R graf 22

Ani jeden z uvedených obrázků neindikuje vlivné body 2)Odhady parametrů a testy významnosti Kvantil Studentova rozdělení t(1-alfa/2,n-m) 2,228 Syrový Tomáš Parametr Odhad Směrodatná Test HO: B[j] = 0 vs. HA: B[j] <> 0 odchylka t-kritérium hyp. HO je Hlad.význa. B[0] 3,5946E+00 1,5658E+00 2,2956E+00 Zamítnuta 0,045 B[1] 1,1477E+02 3,8333E+00 2,9939E+01 Zamítnuta 0,000 3)Základní statistické charakteristiky: Vícenásobný korelační koeficient,r : 9,9447E-01 Koeficient determinace, D : 9,8897E-01 Predikovaný koeficient determinace, Rp 2 : 9,9201 Střední kvadratická chyba predikce, MEP : 8,6590E-01 Akaikeho informační kritérium, AIC 4) Testování regresního tripletu(data + model + metoda) :2,5500E+01 Fisher-Snedocorův test významnosti regrese,f : 8,9635E+02 Tabulkový kvantil, F(1-alpha,m-1,n-m) : 4,9646E+00 Závěr: Navržený model je přijat jako významný. Spočtená hladina významnosti : 0.000 Scottovo kriterium multikolinearity, M Závěr: Navržený model je korektní. :-8,2443E-16 Cook-Weisbergův test heteroskedasticity, Sf : 2,8199E+01 Tabulkový kvantil, Chi^2(1-alpha,1) : 3.8415E+00 Závěr: Rezidua vykazují heteroskedasticitu. Spočtená hladina významnosti : 0.000 Jarque-Berraův test normality reziduí, L(e) :9,0604E-01 Tabulkový kvantil, Chi^2(1-alpha,2) :5,9915E+00 Závěr: Normalita je přijata. Spočtená hladina významnosti :0.636 Waldův test autokorelace, Wa : 1,5166E+00 Tabulkový kvantil, Chi^2(1-alpha,1) :3.8415E+00 Závěr: Rezidua nejsou autokorelována. Spočtená hladina významnosti : 0.218 Znamékový test, Dt : -8,3282E-01 Tabulkový kvantil, N(1-alpha/2) :1.6449E+00 Závěr: Rezidua nevykazují trend. Spočtená hladina významnosti : 0.036 b)kalibrace - kvadratický spline: 1)Volba počtu uzlů: Počet uzlů 1 2 3 Limita detekce x D 8,854014E-02 2,887882E-02 2,981577E-02 23

2)Analýza reziduí Reziduální součet čtverců,rsc 8,9313 Průměr absolutních hodnot reziduí,me 7,0907E-01 Průměr relativních reziduí,mer[%] 2,135 Odhad reziduálního rozptylu,s 2 (e) 1,2759 Odhad směrodatné odchylky reziduí,s(e) 1,1296 3)Kalibrační meze Kritická úroveň y C = -5,047467E-01 x C = 1,670997E-02 Limita detekce y D = 2,322668 x D = 2,887882E-02 4)Kalibrační tabulka Měřená hodnota Inverzní odhad Konfidenční interval y exp [i] x vyp [i] L 1 x vyp [i] L u y exp [i] 39 3,3733E-01 3,1858E-01 3,5565E-01 46 4,0147E-01 3,8745E-01 4,1386E-01 66 5,2890E-01 5,1902E-01 8,8161E-01 80 8,7877E-01 6,3636E-01 -------------- Graf: Obr.1 Kvadratický spline v kalibraci Závěr: Vyšetřením dat získaných kalibrací nefelometru jsem stanovil v modulu lineární regrese nepřítomnost odlehlých bodů, které by rušily stanovení. Vyšetřením kalibračního modelu jsem určil, že jde o nelineární kalibraci a k proložení křivky jsem využil přítomnost dvou uzlů. Počet uzlů jsem stanovil na základě limity detekce. Míra přesnosti kalibrace vyjádřená limitou detekce x D = 2,8879E-02. Obsah neznámých vzorků jsem vypočetl a uvedl v kalibrační tabulce. 24

LINEÁRNÍ REGRESE Příklad: M 612 Zadání: Laboratorně byl sledován vliv teploty reakční směsi x 1, koncentrace HNO 3 x 2 a doby reakce x 3 na konečný výtěžek y při výrobě kyseliny šťavelové. Navrhněte regresní model,diskutujte významnost jednotlivých parametrů v modelu. Jsou v datech vlivné body? Určete, který parametr je statisticky významný? Data: x 1 [ 0 C], x 2 [%], x 3 [hod], y [g] x 1 x 2 x 3 y 3.250000E+01 4.400000E+01 8.000000 0 3.450000E+01 4.400000E+01 8.000000 0 3.800000E+01 4.500000E+01 8.000000 1.230000E+01 4.230000E+01 4.600000E+01 8.000000 1.790000E+01 4.470000E+01 4.800000E+01 1.000000E+01 2.240000E+01 4.820000E+01 4.800000E+01 1.200000E+01 2.580000E+01 5.010000E+01 4.800000E+01 1.200000E+01 2.730000E+01 5.300000E+01 4.900000E+01 1.400000E+01 2.980000E+01 5.470000E+01 5.000000E+01 1.500000E+01 3.180000E+01 5.710000E+01 5.000000E+01 1.800000E+01 3.320000E+01 Program:ADSTAT -Lineární regrese-regresní diagnostika Řešení: 1)Zjištění vlivných bodů Obr.1 Graf predikovaných reziduí Obr.2 Pregibonův graf 25

Obr.3 Williamsův graf Obr.4 McCulloh-Meeterův graf Obr.5 L-R graf Obr.1 Indikuje 2O jeden nahoře a jeden dole; Obr.2 Neindikuje vlivné body; Obr.3 Indikuje 1O (2); Obr.4 Indikuje 1O (2) a další 2 jako podezřelé; Obr.5 Poukazuje na 1O (2) a podezření na 1E (10) Celkově lze říci, že data obsahují 1O (2). 2)Model: Při řešení úlohy je uvažován lineární regresní model ve tvaru E(y/x) = β 0 + β 1 *x 1 + β 2 *x 2 + β 3 *x 3 3)Statistická významnost: a) Indikace multikolinearity Č Vlastní čísla Čísla podmí- Variance inflation Vícenás.korel. [j] korel. matice l[j] něnosti K[j] factor VIF[j] koef pro X[j] 1 1,7134E-02 1,6805E+02 3,4028E+01 0.9852 26

2 1,0348E-01 2,7824E+01 2,7118E+01 0.9814 3 2,8794E+00 1.0000E+00 7,2281E+00 0.9283 Maximální číslo podmíněnosti K : (K[j], K > 1000 indikuje silnou multikolinearitu) (VIF[j] > 10 indikuje silnou multikolinearitu) Hodnoty VIF[j] indikují silnou multikolinearitu b) Odhady parametrů a testy významnosti: 1,6805E+02 Syrový Tomáš Parametr Odhad Směrodatná Test H0: B[j] = 0 vs. HA: B[j] <> 0. odchylka t- kriterium hypoteza H0 je Hlad. výz B[ 0] -1,1699E+02 4,7216E+01-2,4777E+00 Zamítnuta 0.048 B[ 1] 1,5472E+00 4,0206E-01 3,8481E+00 Zamítnuta 0.008 B[ 2] 1,7991E+00 1,3375E+00 1,3450E+00 Akceptována 0.227 B[ 3] -1,6185E+00 4,4998E-01-3,5968E+00 Zamítnuta 0.011 koeficient B[2] byl shledán jako statisticky nevýznamný. c) Statistické charakteristiky regrese: Vícenásobný korelační koeficient, R : 9,9308E-01 Koeficient determinace, R^2 : 9,8621E-01 Predikovaný korelační koeficient, Rp^2 : 9,8253E-01 Střední kvadratická chyba predikce, MEP : 4,7314E+00 Akaikeho informační kritérium, AIC : 1,4335E+01 Rezidualní součet čtverců, RSC : 1,8842E+01 Kvantil Studentova rozdělení t(1-alpha/2,n-m): 2.447 4) Testování regresního tripletu(data + model + metoda) Fisher-Snedocorův test významnosti regrese,f : 1.4299E+02 Tabulkový kvantil, F(1-alpha,m-1,n-m) : 4,7571E+00 Závěr: Navržený model je přijat jako významný. Spočtená hladina významnosti : 0.000 Cook-Weisbergův test heteroskedasticity, Sf : 4,2283E+00 Tabulkový kvantil, Chi^2(1-alpha,1) : 3.8415E+00 Závěr: Rezidua vykazují heteroskedasticitu. Spočtená hladina významnosti : 0.040 Jarque-Berraův test normality reziduí, L(e) : 7,7022E-02 Tabulkový kvantil, Chi^2(1-alpha,2) : 5,9915E+00 Závěr: Normalita je přijata. Spočtená hladina významnosti : 0.962 Waldův test autokorelace, Wa : 3,6250E+00 Tabulkový kvantil, Chi^2(1-alpha,1) : 3.8415E+00 Závěr: Rezidua nejsou autokorelována. Spočtená hladina významnosti : 0.057 27

Znamékový test, Dt : 3,3541E-01 Tabulkový kvantil, N(1-alpha/2) : 1.6449E+00 Závěr: Rezidua nevykazují trend. Spočtená hladina významnosti : 0.369 Závěr: Byl nalezen lineární regresní model ve tvaru: Y = -116,99(47,216) + 1,55(0,402)x 1 + 1,799(1,338)x 2 1,619(0,45)x 3 I když má tento model statistickou významnost, bylo by potřeba zkoumaný systém podrobit důkladnějšímu experimentálnímu vyšetření. Důvodem je prokázaná multikolinearita. V datech je jeden 1O a to bod č.2. Jako statisticky významný parametr se jeví parametr x 1 teplota reakční směsi a parametr x 3 doba reakce. 28

JEDNOROZMĚRNÉ LINEÁRNÍ REGRESNÍ MODELY Příklad: J 607 Zadání: Při výrobě ostazinové modře byla sledována závislost množství meziproduktu y na množství výchozí reakční komponenty x za jinak stejných provozních podmínek. Obsah meziproduktu v reakční směsi byl stanovován po skončení reakce, jednak dusitanem sodným y 1,jednak spektrofotometricky. Očekávalo se, že bude-li potvrzena shoda obou lineárních závislostí, bude možné tvrdit, že obě metody analýzy meziproduktu jsou rovnocenné. Data: Množství komponenty x [ kg], množství meziproduktu pomocí NaNO 2 y 1 [ kg] x y 1 x y 2 9.000000 2.430000E+01 9.000000 2.430000E+01 1.020000E+01 2.742000E+01 1.020000E+01 2.742000E+01 1.160000E+01 3.140000E+01 1.160000E+01 3.140000E+01 1.200000E+01 3.236000E+01 1.200000E+01 3.236000E+01 5.500000 1.325000E+01 5.500000 1.325000E+01 1.300000E+01 3.405000E+01 1.300000E+01 3.405000E+01 1.050000E+01 2.579000E+01 1.050000E+01 2.579000E+01 1.050000E+01 2.590000E+01 1.050000E+01 2.590000E+01 1.150000E+01 3.081000E+01 1.150000E+01 3.081000E+01 9.000000 2.393000E+01 9.000000 2.393000E+01 Program:ADSTAT-Lineární regrese Řešení: Za předpokladu, že obě lineární závislosti budou shodné lze tvrdit, že obě metody analýzy meziproduktu jsou rovnocenné. K testování shody přímek použiji testační kritérium F c. A)Stanovení dusitanem sodným 1)Hledání vlivných bodů Obr.1 Pregibonův graf Obr.2 Williamsův graf 29

Obr.3 McCulloh-Meeterův graf Obr.4 L-R graf Všechny obrázky Obr.1-Obr.4 indikují 1E (5) 2) Odhady parametrů a testy významnosti: Parametr Odhad Směrodatná Test H0: B[j] = 0 vs. HA: B[j] <> 0. odchylka t- kriterium hypoteza H0 je Hlad. výz B[ 0] -1,8463E+00 1.7678E+00-1,0444E+00 Akceptována 0.327 B[ 1] 2,7984E+00 1.6882E-01 1,6576E+01 Zamítnuta 0.000 3) Statistické charakteristiky regrese: Vícenásobný korelační koeficient, R A : Střední kvadratická chyba predikce, MEP A : Akaikeho informační kritérium, AIC A : Rezidualní součet čtverců, RSC A : Odhad směrodatné odchylky reziduí s(e) A : 9,8575E-01 1,2455E+00 3,0326E+00 9,0779E+00 1,0652E+00 B)Stanovení spektrofotometrické 1)Hledání vlivných bodů Obr.5 Pregibonův graf Obr.6 Williamsův graf 30

Obr.7 McCulloh-Meeterův graf Všechny obrázky Obr.5-Obr.8 indikují 1E (5) 2) Odhady parametrů a testy významnosti: Obr.8 L-R graf Parametr Odhad Směrodatná Test H0: B[j] = 0 vs. HA: B[j] <> 0. odchylka t- kriterium hypoteza H0 je Hlad. výz B[ 0] -2,3403E+00 1,6137E+00-1,4503E+00 Akceptována 0.185 B[ 1] 2,9280E+00 1,5410E-01 1,9001E+01 Zamítnuta 0.000 3) Statistické charakteristiky regrese: Vícenásobný korelační koeficient, R B : Střední kvadratická chyba predikce, MEP B : Akaikeho informační kritérium, AIC B : Rezidualní součet čtverců, RSC B : Odhad směrodatné odchylky reziduí s(e) B : 9,8910E-01 1,7397E+00 1,2077E+00 7,5636E+00 9,7235E-01 C)Pro sloučené obě skupiny C = A+ B 1) Odhady parametrů a testy významnosti: Parametr Odhad Směrodatná Test H0: B[j] = 0 vs. HA: B[j] <> 0. odchylka t- kriterium hypoteza H0 je Hlad. výz B[ 0] -2,0933E+00 1,2522E+00-1,6717E+00 Akceptována 0.112 B[ 1] 2,8632E+00 1,1958E-01 2,3944E+01 Zamítnuta 0.000 2) Statistické charakteristiky regrese: Vícenásobný korelační koeficient, R C : Střední kvadratická chyba predikce, MEP C : Akaikeho informační kritérium, AIC C : Rezidualní součet čtverců, RSC C : Odhad směrodatné odchylky reziduí s(e) C : 9,8466E-01 1,2210E+00 4,4898E+00 2,0496E+01 1,0671E+00 31

D)Dosazení do testačního kritéria F C = ( RSC( C) RSC( A) RSC( B)) * ( n ( RSC( A) RSC( B) * ( m) 2 * m) = (20,496 9,0779 7,5636) * (20 2 * 2) (9,0779 + 7,5636) * 2 = 1,8529 Jelikož je kvantil F-rozdělení F 0,95 = 4,4139 vyšší než testovaná experimentální charakteristika F C nelze zamítnout nulovou hypotézu o rovnocennosti obou metod analýzy produktu. Grafy: Obr.9 Graf regresního modelu Obr.10 Graf predikce-rezidua Obr.9 - Představuje regresní model spojených dat obou metod; Obr.10- Ukazuje, že data vytváří mrak, což značí, že regresní model je správný. Závěr: Na základě testování Chowovým testem lze vyslovit závěr, že obě metody analýzy meziproduktu jsou rovnocenné.hodnoty koeficientů jednotlivých regresních modelů pro jednotlivá stanovení jsou uvedena ve výše vypracovaných tabulkách. 32