Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )

Podobné dokumenty
Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

Příloha č. 1 Grafy a protokoly výstupy z adstatu

Semestrální práce. 2. semestr

Tvorba lineárních regresních modelů

Tabulka č. 1 95%ní intervaly Úsek Směrnice model L1 L2 L1 L2 Leco1-0, , , ,15618 OES -0, , , ,21271

Úloha 1: Lineární kalibrace

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Kalibrace a limity její přesnosti

Univerzita Pardubice

Semestrální práce. 2. semestr

Univerzita Pardubice SEMESTRÁLNÍ PRÁCE. Tvorba lineárních regresních modelů. 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D.

TVORBA LINEÁRNÍCH REGRESNÍCH MODELŮ PŘI ANALÝZE DAT. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

KALIBRACE A LIMITY JEJÍ PŘESNOSTI. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

6. Lineární regresní modely

Licenční studium Galileo: Statistické zpracování dat. Tvorba lineárních regresních modelů při analýze dat. Semestrální práce

Tvorba lineárních regresních modelů při analýze dat

Kalibrace a limity její přesnosti

2.2 Kalibrace a limity její p esnosti

Inovace bakalářského studijního oboru Aplikovaná chemie

Tvorba lineárních regresních modelů při analýze dat

Kalibrace a limity její přesnosti

Fakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Kalibrace a limity její přesnosti

Tvorba nelineárních regresních

KALIBRACE A LIMITY JEJÍ PŘESNOSTI 2015

Semestrální práce. 3.3 Tvorba nelineárních regresních modelů v analýze dat

III. Semestrální práce

6. Lineární regresní modely

Fakulta chemicko technologická Katedra analytické chemie

Tvorba nelineárních regresních modelů v analýze dat

FAKULTA CHEMICKO-TECHNOLOGICKÁ KATEDRA ANALYTICKÉ CHEMIE. Semestrální práce z CHEMOMETRE. TOMÁŠ SYROVÝ 4.ročník

UNIVERZITA PARDUBICE

UNIVERZITA PARDUBICE FAKULTA CHEMICKO-TECHNOLOGICKÁ

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie

Semestrální práce. 2. semestr

Aproximace křivek a vyhlazování křivek

POLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými.

PRAVDĚPODOBNOST A STATISTIKA

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

UNIVERZITA PARDUBICE

Kalibrace a limity její přesnosti

PRAVDĚPODOBNOST A STATISTIKA

http: //meloun.upce.cz,

Tvorba modelu sorpce a desorpce 85 Sr na krystalických horninách za dynamických podmínek metodou nelineární regrese

6. Lineární regresní modely

Univerzita Pardubice SEMESTRÁLNÍ PRÁCE. Tvorba nelineárních regresních modelů v analýze dat. 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D.

6. Lineární regresní modely

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie

Semestrální práce z CHEMOMETRIE I Statistické zpracování jednorozměrných dat

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Statistická analýza jednorozměrných dat

UNIVERZITA PARDUBICE

Tvorba nelineárních regresních modelů v analýze dat

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie

Tvorba nelineárních regresních modelů v analýze dat

Semestrální práce str. 1. Semestrální práce. 2.1 Tvorba lineárních regresních modelů při analýze dat. 2.3 Kalibrace a limity její přesnosti

Licenční studium Galileo: Statistické zpracování dat. Kalibrace a limity její přesnosti. Semestrální práce

UNIVERZITA PARDUBICE

Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat )

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

Posouzení linearity kalibrační závislosti

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

12. licenční studium Statistické zpracování dat při managementu jakosti. Lenka Hromádková

Úlohy. Kompendium 2012, Úloha B8.01a, str. 785, Model y = P1 * exp( P2/(B801x + P3)

S E M E S T R Á L N Í

Univerzita Pardubice Fakulta chemicko-technologická. Licenční studium Statistické zpracování dat

Statistická analýza jednorozměrných dat

VÍCEROZMĚRNÝ STATISTICKÝ SOUBOR

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

4EK211 Základy ekonometrie

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

6. Lineární regresní modely

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie

LINEÁRNÍ REGRESE. Lineární regresní model

Menu: QCExpert Nelineární regrese Modul nelineární regrese slouží pro tvorbu a analýzu explicitních nelineárních regresních modelů v obecném tvaru

Statistika (KMI/PSTAT)

Regresní analýza. Eva Jarošová

4EK211 Základy ekonometrie

Korelační a regresní analýza

Plánování experimentu

Bodové a intervalové odhady parametrů v regresním modelu

SEMESTRÁ LNÍ PRÁ CE. Licenč ní studium STATISTICKÉZPRACOVÁ NÍ DAT PŘ I KONTROLE A Ř ÍZENÍ JAKOSTI. Předmě t KALIBRACE A LIMITY JEJÍ PŘ ESNOSTI

odpovídá jedna a jen jedna hodnota jiných

Analýza rozptylu ANOVA

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

Cvičící Kuba Kubina Kubinčák Body u závěrečného testu

Statistická analýza jednorozměrných dat

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

Testování hypotéz o parametrech regresního modelu

6.2 Validace nové analytické metody

Statistická analýza jednorozměrných dat

4EK211 Základy ekonometrie

PYTHAGORAS Statistické zpracování experimentálních dat

UNIVERZITA PARDUBICE

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Kanonická korelační analýza

Testování hypotéz o parametrech regresního modelu

Statistická analýza. jednorozměrných dat

2.1 Tvorba lineárních regresních

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Transkript:

Úloha M608 Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely ) Zadání : Při kvantitativní analýze lidského krevního séra ovlivňují hodnotu obsahu vysokohustotního lipoproteinu (y) tři proměnné, a to obsah celkového cholesterolu (x 1 ), obsah celkového triglyceridu (x 2 ) a konečně tzv. pre-beta komponenty (x 3 ), které jsou buď přítomné (x 3 = 1) nebo nepřítomné (x 3 = 0), str. 141 v cit 65. (1) Navrhněte regresní model a rozhodněte, zda (2) x 1, x 2, x 3 samostatně ovlivňují v predikci model jako celek, (3) x 1, x 2, x 3 společně ovlivňují v predikci model jako celek, (4) testujte i členy x 1 x 2 a x 2 x 3. Testy proveďte na hladině významnosti α = 0,05. (5) Jsou v datech vlivné body? Je třeba odstranit vybočující hodnoty? Data : Obsah Obsah triglyceridu cholesterolu x 1 x 2 Přítomnost pre-beta komponenty x 3 Obsah lipoproteidu y Obsah Obsah triglyceridu cholesterolu x 1 x 2 Přítomnost pre-beta komponenty x 3 Obsah lipoproteidu y 287 111 0 47 192 115 1 57 236 135 0 38 349 408 1 42 255 98 0 47 263 103 1 54 135 63 0 39 223 102 1 60 121 46 0 44 316 274 0 33 171 103 0 64 288 130 0 55 260 227 0 58 256 149 0 36 237 157 0 49 318 180 0 36 261 266 0 55 270 134 0 42 397 167 0 52 262 154 0 41 295 164 0 49 264 86 0 42 261 119 1 47 325 148 0 39 258 145 1 40 388 191 0 27 280 247 1 42 260 123 0 31 339 168 1 63 284 135 0 39 161 68 1 40 326 236 1 56 324 92 1 59 248 92 1 40 171 56 1 56 285 153 1 58 265 240 1 76 361 126 1 43 280 306 1 67 248 226 1 40 248 93 1 57 280 176 1 46 M608 Závislost obsahu lipoproteinu v krevním séru na třech faktorech Strana č. 1 ze 7

Řešení : Program ADSTAT : Lineární regrese Lineární regrese MNČ Regresní diagnostika Při řešení úlohy bylo využito lineárního regresního modelu ve tvaru : E (y/x) = β 0 + β 1. x 1 + β 2. x 2 + β 3. x 3 V S T U P 1. ZVOLENÁ STRATEGIE REGRESNÍ ANALÝZY : Omezení, P : 1.0000. 10-34 Transformace : Ne Váhy : Ne Absolutní člen zahrnut : Ano 2. PODMÍNKY A KVANTILY PRO STATISTICKÉ TESTY : Hladina významnosti, α : 0.050 Počet bodů, n : 42 Počet parametrů, m : 4 Kvantil Studentova rozdělení t ( 1 - α / 2, n m ) : 2.024 Kvantil rozdělení χ 2 ( 1 α, m ) : 9.488 V Ý S T U P 1. PŘEDBĚŽNÁ STATISTICKÁ ANALÝZA: Proměnná Průměr Směrodatná odchylka Párový korelační koeficient y 47.7620 10.6080 1.0000 x 1 267.810 60.4030-0.1001 x 2 155.050 73.7500 0.0680 x 3 0.47619 0.50549 0.3992 Párové korelační koeficienty mezi dvojicemi vysvětlujících proměnných x 1 versus x 2 : 0.51276 x 1 versus x 3 : 4.6407. 10-03 x 2 versus x 3 : 0.11125 M608 Závislost obsahu lipoproteinu v krevním séru na třech faktorech Strana č. 2 ze 7

2. INDIKACE MULTIKOLINEARITY : Č j Vlastní čísla korelační matice l j Čísla podmíněnosti K j Variance inflation factor VIF j 1 0.47626 3.2034 1.3618 2 0.99808 1.5286 1.3789 3 1.52570 1.0000 1.0164 Maximální číslo podmíněnosti K : 3.20340 Protože K > 1000 indikuje silnou multikolinearitu a VIF j > 10 indikuje silnou multikolinearitu nebyla v našem případě multikolinearita indikována ani jedním z kritérií, neboť jednotlivá K j < 1000 a také jednotlivá VIF j < 10. 3. ODHADY PARAMETRŮ A TESTY VÝZNAMNOSTI : Parametr Odhad Směrodatná odchylka Test H 0 : β j = 0 vs. H A : β j <> 0 t kriterium hypotéza H 0 je Hladina význ. β 0 48.86500 7.249900 6.74010 Zamítnuta 0.000 β 1-0.027312 0.030148-0.90594 Akceptována 0.371 β 2 0.015039 0.024846 0.60529 Akceptována 0.549 β 3 8.148300 3.112200 2.61810 Zamítnuta 0.013 Vliv vysvětlujících proměnných x 1 a x 2 je zamítnut, význam má pouze x 3. 4. STATISTICKÉ CHARAKTERISTIKY REGRESE : Vícenásobný korelační koeficient, R : 0.42152 Koeficient determinace, R 2 : 0.17768 Predikovaný korelační koeficient, Rp 2 : 0.00000 Střední kvadratická chyba predikce, MEP : 115.02000 Akaikeho informační kritérium, AIC : 197.15000 5. ANALÝZA KLASICKÝCH REZIDUÍ : Rezidualní součet čtverců, RSC : 3 793.90000 Průměr absolutních hodnot reziduí, Me : 8.20180 Průměr relativních reziduí, Mer : 17.88800 Odhad reziduálního rozptylu, s 2 (e) : 99.83900 Odhad směrodatné odchylky reziduí, s (e) : 9.99190 Odhad šikmosti reziduí, g1 (e) : 0.29118 Odhad špičatosti reziduí, g2 (e) : 2.20520 M608 Závislost obsahu lipoproteinu v krevním séru na třech faktorech Strana č. 3 ze 7

6. TESTOVÁNÍ REGRESNÍHO TRIPLETU ( DATA + MODEL + METODA ) : Fisher-Snedocorův test významnosti regrese, F : 2.736900 Tabulkový kvantil, F ( 1 α, m 1, n m ) : 2.851700 Závěr : Navržený model není přijat jako významný. Spočtená hladina významnosti : 0.057000 Scottovo kriterium multikolinearity, M : 0.010393 Závěr : Navržený model je korektní. Cook-Weisbergův test heteroskedasticity, Sf : 111.150000 Tabulkový kvantil, χ 2 ( 1 α,1 ) : 3.841500 Závěr : Rezidua vykazují heteroskedasticitu. Spočtená hladina významnosti : 0.000000 Jarque-Berraův test normality reziduí, L (e) : 1.699000 Tabulkový kvantil, χ 2 ( 1 α, 2 ) : 5.991500 Závěr : Normalita je přijata. Spočtená hladina významnosti : 0.428000 Waldův test autokorelace, Wa : 0.938630 Tabulkový kvantil, χ 2 ( 1 α, 1 ) : 3.841500 Závěr : Rezidua nejsou autokorelována. Spočtená hladina významnosti : 0.333000 Znaménkový test, Dt : -0.331230 Tabulkový kvantil, N ( 1 α / 2 ) : 1.644900 Závěr : Rezidua nevykazují trend. Spočtená hladina významnosti : 0.370000 7. INDIKACE VLIVNÝCH BODŮ : Podezřelé body stanovené podle výpočtů : č. 6, 19, 20, 23, 34 8. GRAFICKÁ INDIKACE : Graf predikovaných reziduí : O body 6, 19, 20,34; E 23 Williamsův graf : O 19, E 23 Pregibonův graf : Silně vlivný 23 McCulloh Meeterův graf : O bod 19; E 23; O, E 6 L R graf : Silně vlivné body č. 6, 19, 23 M608 Závislost obsahu lipoproteinu v krevním séru na třech faktorech Strana č. 4 ze 7

Obr.1 Graf predikovaných reziduí Graf ukazuje možnost extrému (E) u bodu č. 23, vybočující body (O) č. 6, 19, 20, 34. Obr.2 Williamsův graf Graf indikuje extrémní hodnotu bod č. 23 a podezřelý č.5, vybočující bod č. 19 a podezřelý č 6. M608 Závislost obsahu lipoproteinu v krevním séru na třech faktorech Strana č. 5 ze 7

Obr.3 Pregibonův graf Graf indikuje silně vlivný bod č. 23 Obr.4 McCulloh Meeterův graf Graf indikuje extrém v bodě č. 23, vybočující bod č. 19. Obojí vlivný (E, O) může být bod č. 6 M608 Závislost obsahu lipoproteinu v krevním séru na třech faktorech Strana č. 6 ze 7

Obr.5 L R graf Jako silně vlivné body se jeví bod č.6, 19 a 23. Závěr : Testováním modelu závislosti obsahu vysokohustotního litoproteinu (y) na obsahu celkového cholesterolu (x 1 ), triglyceridu (x 2 ) a pre-beta komponenty (x 3 ) byl zjištěn lineární regresní model ve tvaru : y = 48.87 (±7.25) 0.03 (±0.03). x 1 + 0.02 (±0.02). x 2 + 8.15 (±3.11). x 3 V datech byl indikován extrémní bod č.23 a odlehlý bod č.19. Po jejich vyloučení však nedošlo k výrazné změně ve výsledcích. V modelu nebyla prokázána multikolinearita. V modelu je významně odlišný od nuly pouze absolutní člen a koeficient x 3. Jako statisticky významný se jeví parametr x 3, což je obsah pre-beta komponenty. M608 Závislost obsahu lipoproteinu v krevním séru na třech faktorech Strana č. 7 ze 7