Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA. Semestrální práce

Podobné dokumenty
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

S E M E S T R Á L N Í

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

PYTHAGORAS Statistické zpracování experimentálních dat

Tvorba nelineárních regresních modelů v analýze dat

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Analýza rozptylu ANOVA

Statistická analýza jednorozměrných dat

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

UNIVERZITA PARDUBICE

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

Tvorba nelineárních regresních modelů v analýze dat

UNIVERZITA PARDUBICE CHEMICKO-TECHNOLOGICKÁ FAKULTA KATEDRA ANALYTICKÉ CHEMIE

Plánování experimentu

Porovnání dvou výběrů

Tvorba grafů a diagramů v ORIGIN

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

UNIVERZITA PARDUBICE

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

S E M E S T R Á L N Í

Kalibrace a limity její přesnosti

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Jednofaktorová analýza rozptylu

1.4 ANOVA. Vliv druhu plodiny na míru napadení houbami Fusarium culmorum a Fusarium graminearum v systému ekologického hospodaření

UNIVERZITA PARDUBICE

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat )

Kalibrace a limity její přesnosti

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat

Zápočtová práce STATISTIKA I

Dvouvýběrové a párové testy. Komentované řešení pomocí MS Excel

Vzorová prezentace do předmětu Statistika

Univerzita Pardubice SEMESTRÁLNÍ PRÁCE. Tvorba lineárních regresních modelů. 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D.

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie

Statistická analýza. jednorozměrných dat

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu.

2.2 Kalibrace a limity její p esnosti

TVORBA LINEÁRNÍCH REGRESNÍCH MODELŮ PŘI ANALÝZE DAT. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

SEMESTRÁLNÍ PRÁCE UNIVERZITA PARDUBICE. Fakulta chemicko - technologická Katedra analytické chemie

STATISTICA Téma 7. Testy na základě více než 2 výběrů

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

Tvorba nelineárních regresních

KALIBRACE A LIMITY JEJÍ PŘESNOSTI 2015

UNIVERZITA PARDUBICE

PRAVDĚPODOBNOST A STATISTIKA

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Fakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Kalibrace a limity její přesnosti

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )

Cvičení 9: Neparametrické úlohy o mediánech

Kvantily a písmenové hodnoty E E E E-02

Inovace bakalářského studijního oboru Aplikovaná chemie

KALIBRACE A LIMITY JEJÍ PŘESNOSTI. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Charakteristika datového souboru

Aproximace a vyhlazování křivek

Testování hypotéz o parametrech regresního modelu

Průzkumová analýza dat

Testování hypotéz o parametrech regresního modelu

SEMESTRÁ LNÍ PRÁ CE. Licenč ní studium STATISTICKÉZPRACOVÁ NÍ DAT PŘ I KONTROLE A Ř ÍZENÍ JAKOSTI

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

STATISTICKÁ ANALÝZA JEDNOROZMĚRNÝCH DAT. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Regresní a korelační analýza

Úloha 1: Lineární kalibrace

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

6. Lineární regresní modely

Regresní a korelační analýza

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

= = 2368

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Lineární regrese. Komentované řešení pomocí MS Excel

Korelace. Komentované řešení pomocí MS Excel

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky

Testování statistických hypotéz

Jednofaktorová analýza rozptylu

Regresní a korelační analýza

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

TVORBA GRAFŮ A DIAGRAMŮ V ORIGIN. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Statistická analýza jednorozměrných dat

Tvorba lineárních regresních modelů při analýze dat

KORELACE. Komentované řešení pomocí programu Statistica

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Regresní a korelační analýza

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

KGG/STG Statistika pro geografy

Přednáška IX. Analýza rozptylu (ANOVA)

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD

Kalibrace a limity její přesnosti

Univerzita Pardubice. Fakulta chemicko-technologická Katedra analytické chemie. Licenční studium Statistické zpracování dat

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Transkript:

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA Semestrální práce Licenční studium GALILEO Interaktivní statistická analýza dat Brno, 2015 Doc. Mgr. Jan Muselík, Ph.D. VFU Brno, Ústav technologie léků

Obsah Úloha 1. Jednofaktorová ANOVA... 3 Úloha 2. Dvoufaktorová ANOVA bez opakování... 6 Úloha 3. Dvoufaktorová ANOVA s opakováním (nevyvážená)... 9 2

Úloha 1. Jednofaktorová ANOVA Zadání: Cílem úlohy je ověřit zda různé druhy Staphylea L. (faktor A) významně ovlivňují obsah celkových flavonů a flavonolů v extraktech připravených z těchto rostlin. Celkový obsah flavonů a flavonolů je vyjádřen jako ekvivalent kvercetinu (QE g/100 g suchého extraktu) a byl změřen u 4 extraktů z různých druhů Staphylea L. Data: QE (g/100 g); n = 15, k = 4 Opakování S. colchica SC S. elegans SE S. holocarpa SH S. pinnata SP 1 0,311 0,501 0,427 0,472 2 0,292 0,497 0,412 0,457 3 0,285 0,489 0,404 0,461 4 0,320 0,473 0,444 - Užitý program: QC Expert Řešení: H 0 : Faktor A nemá vliv na měření v jednotlivých skupinách dat; druh Staphylea L. nemá vliv na obsah celkových flavonů a flavonolů. H A : Faktor A má vliv na měření v jednotlivých skupinách dat; druh Staphylea L. má vliv na obsah celkových flavonů a flavonolů. EDA Graf 1.1 Krabicový graf Graf 1.2 Diagram rozptýlení I. 3

Z krabicových grafů pro všechny skupiny na první pohled vyplývá, že jeden datový soubor vybočuje. Hodnoty pro vzorek SC se zdají být významně odlišné od všech ostatních. Vnitřní hradby vzorku SH se nepřekrývají s vnitřními hradbami ostatních vzorků, proto je možné soudit, že i tato skupina dat bude významně odlišná od ostatních vzorků. II. Ověření předpokladů výběru Hladina významnosti: α = 0,05 skupina SC SE SH SP Střední hodnota 0,303 0,487 0,424 0,463 * Pivotové rozpětí 0,035 0,028 0,040 0,037 * Homogenita Přijata Přijata Přijata - vybočující b. 0 0 0 - * zvláště malé výběry (n = 3) Střední hodnoty jednotlivých skupin dat se pohybují kolem hodnoty 0,45, až na vzorek SC, kde je střední hodnota 0,30. Již z tohoto porovnání je patrné, že se tato skupina dat liší od ostatních a je tedy pravděpodobné, že díky tomu bude nulová hypotéza testu ANOVA. III. ANOVA Tabulka ANOVA Teoretický Vypočítaný závěr p-hodnota H 3,6 128,5 0 je 7,63E-009 Párové porovnávání dvojic úrovní Scheffého metoda Srovnávaná dvojice Rozdíl Významnost Pravděpodobnost SC - SE -0,188 Významný 1,56E-008 SC - SH -0,120 Významný 1,71E-006 SC - SP -0,161 Významný 1,76E-007 SE - SH 0,068 Významný 0,000354 SE - SP 0,027 Nevýznamný 0,182 SH - SP -0,042 Významný 0,0238 4

Závěr: V této úloze bylo snahou statisticky vyhodnotit vliv druhu Staphylea L. na obsah celkových flavonů a flavonolů. Nulová hypotéza o nevýznamnosti vlivu faktoru na naměřená data byla. Pomocí Scheffého metody vzájemného porovnání skupin byly potvrzeny významné rozdíly mezi všemi dvojicemi mimo dvojice SE SP. 5

Úloha 2. Dvoufaktorová ANOVA bez opakování Zadání: Byla provedena zkouška obsahové stejnoměrnosti tablet klatrátu sodné soli warfarinu. Tablety byly lisovány z tabletových směsí mísených různě dlouhý čas (faktor A) a lišily se použitým plnivem (faktor B). U každé připravené šarže bylo analyzováno 10 tablet a ze zjištěných výsledků byla spočítána relativní směrodatná odchylka (RSD). Záměrem je zjistit, zda má délka mísení směsí a jejich složení významný vliv na obsahovou stejnoměrnost vyjádřenou jako RSD. Data: relativní směrodatná odchylka (%) plnivo 1 plnivo 2 plnivo 3 5 min 5,3 5,9 4,1 10 min 4,1 6,2 3,5 15 min 4,3 4,3 2,6 Užitý program: QC Expert Řešení: H 0 : Faktory A, B a interakce mezi nimi nemají významný vliv na výsledky v jednotlivých skupinách dat; délka mísení (faktor A) a složení tablet (faktor B) nemají významný vliv na hodnotu RSD. H A : Faktory A, B, nebo interakce mezi nimi mají významný vliv na výsledky v jednotlivých skupinách dat; délka mísení (faktor A) nebo složení tablet (faktor B) mají významný vliv na hodnotu RSD. I. Grafické diagnostiky Graf 1.3 Q-Q graf reziduí Graf 1.4 Graf interakce 6

Graf 1.5 Graf heteroskedasticity Graf 1.6 Graf středních hodnot Graf 1.7 Graf souhrnného vlivu (faktor A) Graf 1.8 Graf souhrnného vlivu (faktor B) Pro posouzení normality reziduí byl sestrojen Q-Q graf. Body leží přibližně na přímce, dá se tedy říci, že rezidua mají normální rozdělení bez vybočujících hodnot. Významnost interakce byla posouzena podle grafu interakce. Body jsou v prostoru rozmístěny spíše náhodně, přímka nevykazuje rostoucí tendenci, proto se dá interakce mezi faktory A a B považovat za statisticky nevýznamnou. Z grafu heteroskedasticity je patrné, že data vykazují mírnou nekonstantnost rozptylu, jelikož modrá křivka neparametrického vyhlazení čtverce reziduí nekopíruje přesně černou vodorovnou přímku. Tento fakt může mít mírný vliv na spolehlivost výsledků získaných metodou ANOVA. První porovnání vlivu faktoru A a B na data je možné provést na základě grafu středních hodnot. Z grafu je patrné, že faktro A ani faktro B příliš velký vliv nevykazuje. Lépe je významnost vlivu jednotlivých faktorů vidět z grafů souhrnného vlivu. Druh použitého plniva ovlivňuje výsledek, což je potvrzeno i zobrazením středních hodnot v grafu červeně. Naopak délka mísení tabletové směsi významný vliv nemá, protože jsou hodnoty napříč všemi čtyřmi úrovněmi faktoru značně podobné. 7

II. ANOVA Tabulka ANOVA; hladina významnosti: α = 0,05 zdroj variability délka mísení stupně volnosti součet čtverců průměrný čtverec testovací F-kritérium kritický kvantil 2 2,869 1,434 4,844 6,944 složení 2 6,442 3,221 10,878 6,944 interakce 1 0,010 0,010 0,025 10,127 reziduální 3 1,175 0,392 celkový 8 10,496 1,312 závěr H 0 není H 0 je H 0 není p-hodnota 0,085 0,024 0,884 Protože F-kritérium (4,844) je menší než kritický kvantil (6,944) není nulová hypotéza H 0 a faktor A je statisticky nevýznamný. Protože F-kritérium (10,878) je větší než kritický kvantil (6,944) je nulová hypotéza H 0 a faktor B je statisticky významný. Protože F-kritérium (0,025) je menší kritický kvantil (10,127) je nulová hypotéza H 0 přijata a interakce faktorů A a B je statisticky nevýznamný. Závěr: Cílem této úlohy bylo zjistit, které faktory (délka mísení tabletové směsi a složení tablet, případně interakce mezi nimi) mají vliv na obsahovou stejnoměrnost produktu vyjádřenou jako RSD. Pomocí dvoufaktorové metody ANOVA bez opakování bylo zjištěno, že významný vliv má pouze faktor B, tedy složení tablet, zatímco délka mísení a interakce mezi faktory se jeví jako statisticky nevýznamné. 8

Úloha 3. Dvoufaktorová ANOVA s opakováním (nevyvážená) Zadání: Cílem je zjistit vliv použitého ph modifikátoru (faktor A) a jeho obsahu v tabletě (faktor B) na množství uvolněného verapamil hydrochloridu zjištěného zkouškou disoluce (čas 360 minut). Pro analýzu souboru je nutné použít nevyvážený model testu ANOVA, jelikož existuje pro každou kombinaci faktorů různý počet měření. Data: množství uvolněného léčiva (%); n = 22 kyselina obsah ph modifikátoru v tabletě 50 mg citronová 52,94 52,49 51,46 52,01 fumarová 60,22 51,78 53,18 56,45 itakonová 52,76 51,21 52,42 52,86 obsah ph modifikátoru v tabletě 100 mg citronová 63,43 59,65 55,71 fumarová 53,26 59,77 57,93 57,02 itakonová 55,69 53,59 50,87 Užitý program: QC Expert Řešení: H 0 : Faktory A, B a interakce mezi nimi nemají významný vliv na měření v jednotlivých skupinách dat; použitý ph modifikátor (faktor A) a jeho obsah v tabletě (faktor B) nemají významný vliv na množství uvolněného léčiva v čase 360 minut. H A : Faktory A, B, nebo interakce mezi nimi mají významný vliv na měření v jednotlivých skupinách dat; použitý ph modifikátor (faktor A) a jeho obsah v tabletě (faktor B) mají významný vliv na množství uvolněného léčiva v čase 360 minut. 9

I. Grafické diagnostiky Graf 1.9 Q-Q graf reziduí Graf 1.10 Graf interakce Graf 1.11 Graf heteroskedasticity Graf 1.12 Graf středních hodnot Graf 1.13 Graf souhrnného vlivu (faktor A) Graf 1.14 Graf souhrnného vlivu (faktor B) V Q-Q grafu jsou vidět dva body, které se odchylují od přímky, což může ukazovat na asymetrii rozdělení. Graf interakce prokázal nevýznamnost interakce mezi faktory A a B, body leží víceméně na přímce rovnoběžné s osou x. Z grafu heteroskedasticity je patrná nekonstantnost rozptylu, což může mít mírný vliv na spolehlivost výsledků získaných metodou ANOVA. 10

Graf středních hodnot poskytl první porovnání vlivu faktoru A a B na datový soubor. Z tohoto znázornění se však s jistotou nedá říci, zda mají jednotlivé faktory na výsledek vliv. Významnost vlivu jednotlivých faktorů je lépe znázorněná pomocí grafů souhrnného vlivu. Je vidět, že u různých ph modifikátorů je střední hodnota uvolněného množství léčiva rozdílná. Podobně můžeme pozorovat rozdílné střední hodnoty uvolněného množství léčiva pro různé obsahy ph modifikátorů v tabletě. II. ANOVA Tabulka ANOVA; hladina významnosti: α = 0,05 zdroj variability stupně volnosti součet čtverců průměrný čtverec testovací F-kritérium kritický kvantil A 2 49,706 24,853 3,638 3,634 B 1 60,361 60,361 8,835 4,494 interakce 2 44,054 22,027 3,224 3,634 reziduální 16 109,317 6,832 celkový 21 256,739 12,226 závěr H 0 je H 0 je H 0 není p-hodnota 0,0499 0,0090 0,0666 Analýza dat metodou ANOVA zamítla nulovou hypotézu pro oba faktory i pro jejich interakci. Protože F-kritérium (3,638) je větší než kritický kvantil (3,634) je nulová hypotéza H 0 a faktor A je statisticky významný. Nicméně p-hodnota se velmi blíží stanovené hladině významnosti, což značí, že tento závěr nemusí být zcela spolehlivý. Protože F-kritérium (8,835) je větší než kritický kvantil (4,494) je nulová hypotéza H 0 a faktor B je statisticky významný. Protože F-kritérium (3,224) je menší kritický kvantil (10,127) je nulová hypotéza H 0 přijata a interakce faktorů A a B je statisticky nevýznamný. Závěr: Záměrem úlohy bylo zjistit, které faktory (druh modifikátoru a jeho obsah v tabletě) mají vliv na množství uvolněného léčiva v čase. Pomocí dvoufaktorové metody ANOVA s opakováním (nevyvážený model) byla zjištěna statistická významnost obou faktorů, jejich interakce je nevýznamná. Druh ph modifikátoru i jeho obsah v tabletě mají na vliv na množství uvolněného léčiva v čase. 11