6. Lineární regresní modely

Podobné dokumenty
6. Lineární regresní modely

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

Analýza variance (ANOVA) - jednocestná; faktor s pevným efektem; mnohonásobná srovnání

SEMESTRÁ LNÍ PRÁ CE. Licenč ní studium STATISTICKÉZPRACOVÁ NÍ DAT PŘ I KONTROLE A Ř ÍZENÍ JAKOSTI

6. Lineární regresní modely

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

UNIVERZITA PARDUBICE FAKULTA CHEMICKO-TECHNOLOGICKÁ

Inovace bakalářského studijního oboru Aplikovaná chemie

V tabulce jsou uvedeny roční náklady na údržbu (v dolarech) a cena domu (v tis. dolarů).

Kalibrace a limity její přesnosti

Semestrální práce. 3.3 Tvorba nelineárních regresních modelů v analýze dat

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie

Univerzita Pardubice SEMESTRÁLNÍ PRÁCE. Tvorba lineárních regresních modelů. 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D.

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )

Příloha č. 1 Grafy a protokoly výstupy z adstatu

Fakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Kalibrace a limity její přesnosti

Kalibrace a limity její přesnosti

VÍCEROZMĚRNÝ STATISTICKÝ SOUBOR

Přílohy. Spotřeba elektřiny. Model závislosti spotřeby elektřiny

TVORBA LINEÁRNÍCH REGRESNÍCH MODELŮ PŘI ANALÝZE DAT. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

Tvorba lineárních regresních modelů při analýze dat

Lineární Regrese Hašovací Funkce

KALIBRACE A LIMITY JEJÍ PŘESNOSTI 2015

Tvorba nelineárních regresních modelů v analýze dat

Tvorba nelineárních regresních modelů v analýze dat

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie

Univerzita Pardubice

2.2 Kalibrace a limity její p esnosti

Protokol o testování systému glukometr měřící proužky Glukometr Contour PLUS

Tvorba lineárních regresních modelů při analýze dat

Tvorba lineárních regresních modelů

Tvorba nelineárních regresních

Karta předmětu prezenční studium

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

6. Lineární regresní modely

Uni- and multi-dimensional parametric tests for comparison of sample results

Tvorba modelu sorpce a desorpce 85 Sr na krystalických horninách za dynamických podmínek metodou nelineární regrese

Fakulta chemicko technologická Katedra analytické chemie

Regresní analýza. Statistika II. Jiří Neubauer. Katedra ekonometrie FEM UO Brno kancelář 69a, tel

UNIVERZITA PARDUBICE

6. Lineární regresní modely

Neuronová síť. x 2 x 3. σ j. x 4. x 5. Menu: QCExpert Prediktivní metody

Tabulka č. 1 95%ní intervaly Úsek Směrnice model L1 L2 L1 L2 Leco1-0, , , ,15618 OES -0, , , ,21271

Úloha 1: Lineární kalibrace

Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných)

Licenční studium Galileo: Statistické zpracování dat. Tvorba lineárních regresních modelů při analýze dat. Semestrální práce

UNIVERZITA PARDUBICE

Semestrální práce. 2. semestr

ij m, velikosti n je tvořen (n m) rozměr-ným polem dat x x x 22 x n1 ... x n2 7.1 Druhy korelačních koeficientů

Univerzita Pardubice

Regresní analýza. Eva Jarošová

Dynamické metody pro predikci rizika

5EN306 Aplikované kvantitativní metody I

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

Kalibrace a limity její přesnosti

4EK211 Základy ekonometrie

Univerzita Pardubice Fakulta chemicko-technologická. Licenční studium Statistické zpracování dat

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie

KALIBRACE A LIMITY JEJÍ PŘESNOSTI. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

MODELOVÁNÍ CENOVÉ ELASTICITY POPTÁVKY PO VJEZDU NA AUTOBUSOVÉ NÁDRAŽÍ MODELLING OF PRICE DEMAND ELASTICITY FOR ENTRY TO BUS TERMINAL

Zpracování a vyhodnocování analytických dat

III. Semestrální práce

ÚKOL ,77 5,00 5 2,531,003,056 -,869,113

4EK211 Základy ekonometrie

ZATÍŽENÍ SNĚHEM A VĚTREM

Pro získání zápočtu je nutno mimo docházky (max. 3 absence) získat ze dvou napsaných písemek dohromady alespoň dva příklady.

ANALÝZA ZAJIŠTĚNÝCH FONDŮ

Korelační a regresní analýza

Skupina Testování obsahuje následující moduly: Síla a rozsah výběru, Testy a Kontingenční tabulka.

STP097 STATISTIKA CVIČENÍ EMPIRICKÁ DISTRIBUČNÍ FUNKCE, JEDNOVÝBĚROVÉ TESTY

KGG/STG Statistika pro geografy

Semestrální práce. 2. semestr

6 TESTY HYPOTÉZ NEPARAMETRICKÉ TESTY

Ploché výrobky z konstrukčních ocelí s vyšší mezí kluzu po zušlechťování technické dodací podmínky

Vliv nehodovosti na silnicích České republiky na objem uzavřených smluv havarijního pojištění

Analýza oběžného kola

VYUŽITÍ NEURONOVÝCH SÍTÍ PROSTŘEDÍ MATLAB K PREDIKCI HODNOT NÁKLADŮ PRO ELEKTRICKÉ OBLOUKOVÉ PECE

STATISTICA Téma 8. Regresní a korelační analýza, regrese prostá

Bezpečnostní list. Ultramid B36 LN. 1. Identifikace látky / směsi a společnosti / podniku. 2. Identifikace rizik. Identifikátor výrobku

1.2.7 Druhá odmocnina

6. Lineární regresní modely

6. Lineární regresní modely

Abstrakt. Klíčová slova. Statistika v Excelu, analýza dat, soubor, Excel. Abstract

Jste aktivní sportovec?(pravidelně sportuji alespoň 2x týdně) Jakým sportovním činnostem se pravidelně věnujete? (alespoň 1 x za dva týdny v sezóně)

Matematický ústav v Opavě. Studijní text k předmětu. Softwarová podpora matematických metod v ekonomice

SEZNAM DOKUMENTACE K ZADÁVACÍMU ŘÍZENÍ PRV,

Možnosti využití archivu historických povodní v operativní hydrologii na p íkladu povodí Otavy

Zadání Máme data hdp.wf1, která najdete zde: Bodová předpověď: Intervalová předpověď:

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Fakulta strojního inženýrství Ústav strojírenské technologie odbor slévárenství. Ing. Martin Svadbík

PRAVDĚPODOBNOST A STATISTIKA

Oblastní stavební bytové družstvo, Jeronýmova 425/15, Děčín IV

PRINCIPY ŠLECHTĚNÍ KONÍ

Příloha Průběžné zprávy. Shrnutí návrhu algoritmu

http: //meloun.upce.cz,

Radioaktivita a ochrana před zářením

Obec Málkov. Málkov. Číslo jednací: Vaše č.j./ze dne: Vyřizuje / linka: Dne: OO-5/ / Vojtíšková Marie Ing./

2.1 Pokyny k otevřeným úlohám. 2.2 Pokyny k uzavřeným úlohám TESTOVÝ SEŠIT NEOTVÍREJTE, POČKEJTE NA POKYN!

Metodika k hodnocení biologické účinnosti insekticidních přípravků mořidel proti křísku polnímu v obilninách

Marta Vomlelová

Transkript:

6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu 6.6 Kritika metody v regresním tripletu 6.7 Lineární a nelineární kalibrace 7. Korelační modely 1

PODSTATNÉ TESTY VÝZNAMNOSTI V KORELAČNÍ A REGRESNÍ ANALÝZE test významnosti korelačního koeficientu test významnosti modelu jako celku test významnosti jednotlivých regresních parametrů test shody lineárních regresních modelů a mnoho dalších testů..

TEST VÝZNAMNOSTI R Test významnosti odpovídá, zda je korelace R mezi výběrovými proměnnými natolik silná, abychom ji mohli považovat za prokázanou i pro základní soubor ρ. Pro párový R: Pro násobný R: t R F R = R n 2 1 R 2 2 R ( n m) ( 2 1 R )( m 1) t α,n-2 = t α,n-m n je počet hodnot výběru m je počet proměnných Pro parciální R: t R = R n k 1 R 2 2 t α,n-k-2 k je počet vyloučených proměnných

TEST VÝZNAMNOSTI REGRESNÍHO MODELU Co vlastně testujeme? Y = b 0 + b 1 x 1 + b 2 x 2 + b 3 x 3 + + b m x m Testujeme významnost odhadů jednotlivých parametrů: když je testovaný odhad parametru statisticky nevýznamný, pak jeho příslušná proměnná x j nepřispívá ke zpřesnění odhadu závisle proměnné y a tato proměnná x j je pak v modelu zbytečná. Testujeme model jako celek: tj. zda příslušná kombinace všech nezávisle proměnných statisticky významně zpřesní odhad závisle proměnné y oproti použití pouhého průměru hodnot y.

TEST VÝZNAMNOSTI REGRESNÍCH PARAMETRŮ H 0 : β j = 0, tj. j-tý regresní parametr je nevýznamný t b β j j = pro β j = 0 s b t = b s j b Pokud platí, že t > t α2;n-m, potom je j-tý regresní parametr statisticky významný a příslušná proměnná musí zůstat v modelu.

Úloha J6.24 Závislost tělesného tuku atletů-běžců na obsahu tuku ve stravě Zadání: Cílem je nalézt závislost mezi tělesným tukem lehkých atletů, kteří týdně trénují asi 12 hodin a zkonzumovaným tukem v jejich stravě x. U náhodného vzorku 18 běžců byl měřen tělesný podkožní tuk y [%] a sledován v závislosti na zkonzumovaném tuku ve stravě x [%]. Úkoly: Lze tuto závislost popsat jednoduchým lineárním regresním modelem y = β 0 + β 1 x a testujte, zda jsou oba parametry statisticky významné. Data: Spotřebovaný tuk ve stravě x [%], tělesný podkožní tuk y [%]: x y 22 9.8...... 14 7.9 6

Software QC-EXPERT 3.1 (TriloByte) Odhady parametrů Proměnná Odhad Směr.Odch. Závěr Pravděpodobnost Spodní mez Horní mez Abs 7.314069 1.005954 Významný 0.000002 5.181541 9.446597 J624x 0.11623 0.037399 Významný 0.006768 0.036947 0.195512 Statistické charakteristiky regrese Vícenásobný korelační koeficient R : 0.6135 Koeficient determinace R^2 : 0.3764 Predikovaný korelační koeficient Rp : 0.0629 Střední kvadratická chyba predikce MEP : 1.5092 Akaikeho informační kritérium : 8.1074 7 Testování regresního tripletu Fisher-Snedecorův test významnosti modelu Hodnota kritéria F : 9.658629 Kvantil F (1-alfa, m-1, n-m) : 4.493998 Pravděpodobnost : 0.006768 Závěr : Model je významný

Úloha J6.25 Závislost celkového cholesterolu v krvi na denní spotřebě tuku Zadání: U vzorku 20 Američanů byla v analýze krve sledována denní spotřeba tuku ve stravě x v gramech a obsah celkového cholesterolu y v mg na 100 ml krve. Byl navržen jednoduchý lineární regresní model y = β 0 + β 1 x. Úkoly: Ukažte (1) platnost navrženého regresního modelu a existenci vlivných bodů. (2) Testujte statistickou významnost obou parametrů, úseku β 0 a směrnice β 1. (3) Sestrojte 95%ní interval spolehlivosti úseku β 0 a vysvětlete fakt, že β 0 = 0. (4) Sestrojte 95 % oboustranný interval spolehlivosti směrnice β 1. (5) Nalezněte 95 % interval spolehlivosti celkového cholesterolu u lidí, kteří denně spotřebují 50 g tuku. (6) Jaký je Pearsonův korelační koeficient mezi celkovým cholesterolem v krvi y a denní spotřebou tuku x u sledovaných jedinců? Data: Denní spotřeba tuku x [g], obsah celkového cholesterolu v krvi y [mg/100 ml]: x y 21 130...... 134 8 271

Software QC-EXPERT 3.1 (TriloByte) Odhady parametrů Proměnná Odhad Směr.odch. Závěr Pravděpodobnost Spodní mez Horní mez Abs 90.705314 17.420915 Významný 0.000059 54.10533 127.305298 J625x 1.427174 0.177707 Významný 0.0 1.053825 1.800523 Statistické charakteristiky regrese Vícenásobný korelační koeficient R : 0.884201 Koeficient determinace R^2 : 0.781812 Predikovaný korelační koeficient Rp : 0.555095 Střední kvdratická chyba predikce MEP : 919.087734 Akaikeho informační kritérium : 137.35316 9 Testování regresního tripletu Fisher-Snedecorův test významnosti modelu Hodnota kritéria F : 64.497725 Kvantil F (1-alfa, m-1, n-m) : 4.413873 Pravděpodobnost : 0.0 Závěr : Model je významný

Software QC-EXPERT 3.1 (TriloByte) Odhady parametrů Proměnná Odhad Směr.Odch. Závěr Pravděpodobnost Spodní mez Horní mez Abs 0.000146 0.003986 Nevýznamný 0.972517-0.010921 0.011214 P610x 0.145923 0.000908 Významný 0.0 0.143401 0.148445 Statistické charakteristiky regrese Vícenásobný korelační koeficient R : 0.999923 Koeficient determinace R^2 : 0.999845 Predikovaný korelační koeficient Rp : 0.999175 Střední kvdratická chyba predikce MEP : 0.000023 Akaikeho informační kritérium : -66.0296 15 Testování regresního tripletu Fisher-Snedecorův test významnosti modelu Hodnota kritéria F : 25808.841262 Kvantil F (1-alfa, m-1, n-m) : 7.708647 Pravděpodobnost : 0.0 Závěr : Model je významný

TEST SHODY REGRESNÍCH MODELŮ Porovnává se: empirický model (modely) s teoretickým dva nebo více empirických modelů mezi sebou H 0 : Porovnávané modely jsou shodné (tj. shodují se ve směrnici i v úseku).

TEST SHODY DVOU EMPIRICKÝCH MODELŮ H 0 : β j,1 = β j,2, tj. regresní koeficienty obou modelů jsou v základním souboru shodné Vycházíme z testování shody regresních parametrů dvou lineárních modelů y 1 = X 1 β 1 + ε 1 a y 2 = X 2 β 2 + ε 2 Při tomto testu využijeme tzv. složeného modelu, tj. oba porovnávané výběry sloučíme do jednoho a také pro něj stanovíme parametry stejného modelu jako pro oba dílčí výběry

Porovnání regresních přímek A B C D

20.09

HODNOCENÍ KVALITY LINEÁRNÍHO REGRESNÍHO MODELU Střední kvadratická chyba predikce (MEP) MEP = 1 n n ( 1 H ) i= 1 e 2 i ii 2 e i 2 čtverec reziduí modelu H ii i-tý diagonální prvek projekční matice H Akaikovo informační kritérium (AIC) RSC AIC = n ln + n 2m RSC m reziduální součet čtverců počet parametrů Čím je AIC (MEP) menší, tím je model vhodnější.

6.2 Úlohy na testy v lineární regresi Úloha J6.03 Vyšetření závislosti obsahu křemíku v surovém železe na teplotě strusky Zadání: Procentuální obsah křemíku v surovém železe y závisí na teplotě strusky x. Úkoly: (1) Regresní diagnostikou navrhněte lineární regresní model. (2)Vyšetřete regresní triplet a odstraňte vybočující hodnoty. (3) Komentujte velikost korelačního r a koeficientu determinace D mezi proměnnými x a y a proveďte test celkové regrese F R. (4) Odhadněte predikci procentuální obsah křemíku v surovém železe pro teplotu strusky 1350 C a 1450 C. Data: Teplota strusky x [ C], obsah křemíku y [%]: x y 1300 0.300...... 1340 0.350 59

60

Multivariate Linear Regression Task name : Data: J601-J635 All Significance level : 0,05 Quantile t(1-alfa/2,n-m) : 2,17881282966717 Quantile F(1-alfa,m,n-m) : 4,74722534672227 Absolute term : Yes No. of valid data : 14 No. of parameters : 2 Method : Columns used : Transformation : 61 Least squares J603y Abs J603x No transformation

Parameter estimates Variable Estimate Std. deviation Conclusion Probability CI lower bound CI upper bound Abs -2,772119509 0,2716422791 Significant 2,874841785E-007-3,363977191-2,180261826 J603x 0,002303834237 0,0001930221942 Significant 5,134666448E-008 0,001883275004 0,00272439347 Statistical characteristics of regression Multiple correlation coeff. R : 0,9603692839 Determination coeff. R^2 : 0,9223091615 Predicted correl. coeff. Rp : 0,7837942454 Mean quadratic error of prediction MEP : 0,002434254317 Akaike information criterion : -85,70513433 Analysis of classical residuals Residual sum of squares : 0,02308776939 Mean absolute residual : 0,03496683476 Residual std. deviation : 0,04386320534 Residual variance : 0,001923980783 Residual skewness : 0,008839401391 Residual kurtosis : 2,388148665 Testing of the regression triplet (DATA+MODEL+METHOD) Fisher-Snedecor test for model significance Computed F-statistic : 142,4583663 Quantile F (1-alfa, m-1, n-m) : 4,747225347 Probability : 5,134666446E-008 Conclusion : Model is significant Scott's test of multicollinearity Computed SC statistic : 0,07208710692 Conclusion : Model is correct. 62

Cook-Weisberg test of heteroscedasticity Computed CW Statistic : 1,843939522 Quantile Chi^2(1-alfa,1) : 3,841458829 Probability : 0,1744899122 Conclusion : Residuals exhibit homoscedasticity. Jarque-Berra test for normality Computed JB statistic: 0,2390031361 Quantile Chi^2(1-alfa,2) : 5,991464547 Probability : 0,8873626164 Conclusion : Normality of residuals is accepted. Wald's test for autocorrelation Computed WA statsitic : 0,268364325 Quantile Chi^2(1-alfa,1) : 3,841458829 Probability : 0,6044311132 Conclusion : Autocorrelation is insignificant Durbin-Watson's test for autocorrelation Computed DW statistic: -1 Critical values of DW 0 Conclusion : Positive autocorrelation is not proved. Sign test for dependence Computed Sg statistic: 0,2031885063 Critical quantile N(1-alfa/2) : 1,959963999 Probability : 0,8389876961 Conclusion : There is no trend in residuals. 63

Úloha J6.04 Užití titrační a spektrofotometrické metody pro dva typy vázaného dusíku Zadání: U dusíkatých hnojiv se množství čpavkového dusíku a amidického dusíku stanoví titrační a spektrofotometrickou metodou. Úkoly: (1) Určete regresní přímku závislosti naměřeného dusíku metodou kolorimetrickou na metodě titrační a popište test vhodnosti lineárního modelu dle Uttsové. (2) Rozhodněte, zda regresní přímky, stanovené pro nízké hodnoty obsahu dusíku čpavkového a vyšší hodnoty dusíku amidického, jsou totožné. (3) Na oba druhy dusíku aplikujte Chowův test shody dvou lineárních modelů za předešlého vyšetření homoskedasticity. Data: Čpavkový dusík [%] metodou titrační x a kolorimetrickou y: x y 6.24 6.36...... 7.70 7.71 Amidický dusík [%] metodou titrační x a kolorimetrickou y. 64 x y 15.49 15.55...... 14.42 14.41

65

66

Multivariate Linear Regression Task name : J601-J635 Data: All Significance level : 0,05 Quantile t(1-alfa/2,n-m) : 2,02868733789593 Quantile F(1-alfa,m,n-m) : 4,11557231493928 Absolute term : Yes No. of valid data : 25 No. of parameters : 2 Method : Least squares Columns used : J604ay Abs J604ax Transformation : No transformation Parameter estimates VariableEstimate Std. Deviation Conclusion Probability CI lower bound CI upper bound Abs 0,472287279 0,170742235 Significant 0,0101365803 0,1259046688 0,8186698892 J604ax 0,9362405024 0,02336712814 Significant 0 0,8888359055 0,9836450994 Statistical characteristics of regression Multiple correlation coeff. R : 0,9929124303 Determination coeff. R^2 : 0,9858750942 Predicted correl. coeff. Rp : 0,9674014876 Mean quadratic error of prediction MEP : 0,002675724799 67

Analysis of classical residuals Residual sum of squares : 0,05749311274 Mean absolute residual : 0,03511683384 Residual std. deviation : 0,04999700545 Residual variance : 0,002499700554 Residual skewness : 0,05949934088 Residual kurtosis : 3,312662713 Testing of the regression triplet (DATA+MODEL+METHOD) Fisher-Snedecor test for model significance Computed F-statistic : 1605,329439 Quantile F (1-alfa, m-1, n-m) : 4,115572315 Probability : 8,106379467E-023 Conclusion : Model is significant Scott's test of multicollinearity Computed SC statistic : 0,3312184108 Conclusion : Model exhibits multicollinearity! Cook-Weisberg test of heteroscedasticity Computed CW Statistic : 0,2408484276 Quantile Chi^2(1-alfa,1) : 3,841458829 Probability : 0,6235940061 Conclusion : Residuals exhibit homoscedasticity. 68

Jarque-Berra test for normality Computed JB statistic: 0,3497451415 Quantile Chi^2(1-alfa,2) : 5,991464547 Probability : 0,839563999 Conclusion : Normality of residuals is accepted. Wald's test for autocorrelation Computed WA statsitic : 3,224253662 Quantile Chi^2(1-alfa,1) : 3,841458829 Probability : 0,07255486306 Conclusion : Autocorrelation is insignificant Durbin-Watson's test for autocorrelation Computed DW statistic: -1 Critical values of DW 1,21 1,55 Conclusion : Positive autocorrelation is not proved. Sign test for dependence Computed Sg statistic: 0,8103872031 Critical quantile N(1-alfa/2) : 1,959963999 Probability : 0,4177176704 Conclusion : There is no trend in residuals. 69

Úloha J6.24 Závislost tělesného tuku atletů na obsahu tuku ve stravě Zadání: Nalézt závislost mezi tělesným tukem lehkých atletů-běžců y, kteří týdně trénují asi 12 hodin, a zkonzumovaným tukem v jejich každodenní stravě x. U náhodného vzorku 18 běžců byl měřen jejich tělesný podkožní tuk y [%] a sledován v závislosti na zkonzumovaném tuku ve stravě x [%]. Ověřte, zda lze uvedenou závislost popsat jednoduchým lineárním regresním modelem y = β 0 + β 1 x. Úkoly: (1) Predikujte, jaký lze očekávat tělesný tuk u běžce, který spotřeboval ve stravě 25 % tuku? (2) Analýzou regresního tripletu potvrďte navržený regresní model a odhalte také vlivné body. (3) Komentujte rankitové grafy rozličných druhů reziduí. (4) K čemu v regresním tripletu využíváme regresní diagnostiku založenou na statistické analýze různých druhů reziduí? (5) Co je cílem posouzení kvality dat hledání vlivných bodů, t.zv. kritiky dat? (6) Vysvětlete pět grafů vlivných bodů a uveďte k čemu slouží indexové a rankitové grafy? Data: Spotřebovaný tuk ve stravě x [%], tělesný podkožní tuk y [%]: x y 22 9.8...... 14 7.9 70

71

72

Vícenásobná lineární regrese Název úlohy : Data: Sloupce pro výpočet : J601-J635 Všechna J624y Abs J624x Hladina významnosti : 0,05 Kvantil t(1-alfa/2,n-m) : 2,11990529922106 Kvantil F(1-alfa,m,n-m) : 4,49399847766553 Absolutní člen : Ano Počet platných řádků : 18 Počet parametrů : 2 Metoda : Nejmenší čtverce Transformace : Bez transformace Odhady parametrů Proměnná Odhad Směr.Odch. Závěr Pravděpodobnost Spodní mez Horní mez Abs 7,314068943 1,005954238 Významný 1,872740527E-006 5,181541224 9,446596662 J624x 0,1162295893 0,03739891103 Významný 0,006767895781 0,03694743963 0,195511739 Statistické charakteristiky regrese Vícenásobný korelační koeficient R : 0,6135373713 Koeficient determinace R^2 : 0,376428106 Predikovaný korelační koeficient Rp : 0,06296570169 Střední kvadratická chyba predikce MEP : 1,50916863 Akaikeho informační kritérium : 8,107422115 73

Reziduální součet čtverců : 22,61383474 Průměr absolutních reziduí : 0,8406252863 Reziduální směr. odchylka : 1,188850147 Reziduální rozptyl : 1,413364671 Šikmost reziduí : 74 3,667716375E-006 Špičatost reziduí : 2,894038348 Testování regresního tripletu Fisher-Snedecorův test významnosti modelu Hodnota kritéria F : 9,658629188 Kvantil F (1-alfa, m-1, n-m) : 4,493998478 Pravděpodobnost : 0,006767895781 Závěr : Model je významný Scottovo kritérium multikolinearity Hodnota kritéria SC : -0,5279267325 Závěr : Model je korektní. Cook-Weisbergův test heteroskedasticity Hodnota kritéria CW : 0,4998390928 Kvantil Chi^2(1-alfa,1) : 3,841458829 Pravděpodobnost : 0,4795708319 Závěr : Rezidua vykazují homoskedasticitu. Jarque-Berrův test normality Hodnota kritéria JB : 0,008431906961 Kvantil Chi^2(1-alfa,2) : 5,991464547 Pravděpodobnost : 0,9957929212 Závěr : Waldův test autokorelace Hodnota kritéria WA : 0,6899145553 Kvantil Chi^2(1-alfa,1) : 3,841458829 Pravděpodobnost : 0,4061934451 Rezidua mají normální rozdělení. Závěr : Durbin-Watsonův test autokorelace Hodnota kritéria DW : -1 Kritické hodnoty DW 1,05 1,53 Autokorelace je nevýznamná Závěr : Znaménkový test reziduí Hodnota kritéria Sg : 0,1914777595 Kvantil N(1-alfa/2) : 1,959963999 Pravděpodobnost : 0,8481513035 Závěr : Rezidua nejsou autokorelována V reziduích není trend.

Úloha J6.25 Závislost celkového cholesterolu v krvi na denní spotřebě tuku Zadání: U vzorku 20 Američanů byla provedena analýza krve a sledována denní spotřeba tuku ve stravě x v gramech a hodnota celkového cholesterolu y v mg na 100 ml krve. Pro závislost byl navržen lineární regresní model y = β 0 + β 1 x. Úkoly: (1) Dokažte platnost navrženého regresního modelu a existenci vlivných bodů. (2) Testujte statistickou významnost parametrů úseku β 0 a směrnice β 1. (3) Sestrojte 95%ní jednostranný interval spolehlivosti úseku β 0 včetně testu β 0 = 0 a také oboustranný interval spolehlivosti směrnice β 1. (4) Nalezněte 95 % interval spolehlivosti celkového cholesterolu u lidí, kteří denně spotřebují 50 g tuku. (5) Komentujte Pearsonův korelační koeficient mezi celkovým cholesterolem v krvi y a denní spotřebou tuku x u sledovaných jedinců? Data: Denní spotřeba tuku x [g], obsah celkového cholesterolu v krvi y [mg/100 ml]: x y 21 130...... 134 271 75

76

77

Vícenásobná lineární regrese Název úlohy : Data: Sloupce pro výpočet : Sheet1 Všechna J625y Abs J625x Hladina významnosti : 0,05 Kvantil t(1-alfa/2,n-m) : 2,10092204024043 Kvantil F(1-alfa,m,n-m) : 4,41387341916799 Absolutní člen : Ano Počet platných řádků : 20 Počet parametrů : 2 Metoda : Nejmenší čtverce Transformace : Bez transformace Odhady parametrů Proměnná Odhad Směr.Odch. Závěr Pravděpodobnost Spodní mez Horní mez Abs 90,70531397 17,42091474 Významný 5,948452832E-005 54,10533025 127,3052977 J625x 1,427174047 0,1777070846 Významný 2,319086703E-007 1,053825316 1,800522777 Statistické charakteristiky regrese Vícenásobný korelační koeficient R : 0,8842014275 Koeficient determinace R^2 : 0,7818121644 Predikovaný korelační koeficient Rp : 0,5550947623 Střední kvdratická chyba predikce MEP : 919,0877338 Akaikeho informační kritérium : 137,3531597 78

Reziduální součet čtverců : 15731,02657 Průměr absolutních reziduí : 20,78284865 Reziduální směr. odchylka : 29,56257636 Reziduální rozptyl : 873,9459207 Šikmost reziduí : 2,450041735 Špičatost reziduí : 6,078201018 Testování regresního tripletu Fisher-Snedecorův test významnosti modelu Hodnota kritéria F : 64,49772473 Kvantil F (1-alfa, m-1, n-m) : 4,413873419 Pravděpodobnost : 2,319086703E-007 Závěr : Model je významný Scottovo kritérium multikolinearity Hodnota kritéria SC : 0,1694815154 Závěr : Model je korektní. Cook-Weisbergův test heteroskedasticity Hodnota kritéria CW : 0,4181478432 Kvantil Chi^2(1-alfa,1) : 3,841458829 Pravděpodobnost : 0,5178626842 Závěr : Rezidua vykazují homoskedasticitu. Jarque-Berrův test normality Hodnota kritéria JB : 16,06290704 Kvantil Chi^2(-alfa,2) : 5,991464547 Pravděpodobnost : 0,0003250753625 Závěr : Rezidua nemají normální rozdělení! Durbin-Watsonův test autokorelace Hodnota kritéria DW : -1 Kritické hodnoty DW 1,1 1,54 Závěr : Negativní autokorelace reziduí není prokázána. Znaménkový test reziduí Hodnota kritéria Sg : 0,9114766748 Kvantil N(1-alfa/2) : 1,959963999 Pravděpodobnost : 0,3620442701 Závěr : V reziduích není trend. Waldův test autokorelace Hodnota kritéria WA : 4,143626545 Kvantil Chi^2(1-alfa,1) : 3,841458829 Pravděpodobnost : 0,04179154533 Závěr : Autokorelace je významná 79

Úloha J6.26 Regresní model vztahu mezi koncentrací TSH a odezvou přístroje Zadání: Mezinárodní standard TSH byl postupně ředěn nulovaným lidským sérem (komerčně dostupné směsné sérum s cíleně sníženým obsahem antigenu). Vzorky byly zpracovány pomocí soupravy pro immunoradiometrické stanovení TSH. Pomocí gama-čítače Berthold s účinností 74.6 % byly naměřeny odezvy (v cpm) jednotlivých vzorků. Ředění bylo provedeno v oblasti, kde se očekává lineární vztah mezi koncentrací a odezvou. Úkoly: Ověřte předpoklad lineárního vztahu a nalezněte vhodný lineární regresní model. Data: Koncentrace TSH x [miu/l], odezva y [cpm]: x y 0.334 0.466...... 17134 23039 80

81

82

83

84

85

86