Semestrální práce. 2. semestr

Podobné dokumenty
Příloha č. 1 Grafy a protokoly výstupy z adstatu

Semestrální práce. 2. semestr

Tabulka č. 1 95%ní intervaly Úsek Směrnice model L1 L2 L1 L2 Leco1-0, , , ,15618 OES -0, , , ,21271

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Univerzita Pardubice SEMESTRÁLNÍ PRÁCE. Tvorba lineárních regresních modelů. 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D.

Tvorba lineárních regresních modelů

TVORBA LINEÁRNÍCH REGRESNÍCH MODELŮ PŘI ANALÝZE DAT. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Tvorba lineárních regresních modelů při analýze dat

KALIBRACE A LIMITY JEJÍ PŘESNOSTI. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Úloha 1: Lineární kalibrace

Semestrální práce. 2. semestr

Kalibrace a limity její přesnosti

III. Semestrální práce

Univerzita Pardubice

Inovace bakalářského studijního oboru Aplikovaná chemie

Kalibrace a limity její přesnosti

Tvorba nelineárních regresních

Kalibrace a limity její přesnosti

Kalibrace a limity její přesnosti

Licenční studium Galileo: Statistické zpracování dat. Tvorba lineárních regresních modelů při analýze dat. Semestrální práce

6. Lineární regresní modely

UNIVERZITA PARDUBICE

KALIBRACE A LIMITY JEJÍ PŘESNOSTI 2015

UNIVERZITA PARDUBICE

Fakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Kalibrace a limity její přesnosti

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie

http: //meloun.upce.cz,

Tvorba lineárních regresních modelů při analýze dat

Semestrální práce. 3.3 Tvorba nelineárních regresních modelů v analýze dat

FAKULTA CHEMICKO-TECHNOLOGICKÁ KATEDRA ANALYTICKÉ CHEMIE. Semestrální práce z CHEMOMETRE. TOMÁŠ SYROVÝ 4.ročník

2.2 Kalibrace a limity její p esnosti

Tvorba nelineárních regresních modelů v analýze dat

Tvorba modelu sorpce a desorpce 85 Sr na krystalických horninách za dynamických podmínek metodou nelineární regrese

6. Lineární regresní modely

UNIVERZITA PARDUBICE FAKULTA CHEMICKO-TECHNOLOGICKÁ

Fakulta chemicko technologická Katedra analytické chemie

PRAVDĚPODOBNOST A STATISTIKA

Tvorba nelineárních regresních modelů v analýze dat

Univerzita Pardubice SEMESTRÁLNÍ PRÁCE. Tvorba nelineárních regresních modelů v analýze dat. 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D.

UNIVERZITA PARDUBICE

Aproximace křivek a vyhlazování křivek

Statistická analýza jednorozměrných dat

6.2 Validace nové analytické metody

6. Lineární regresní modely

PRAVDĚPODOBNOST A STATISTIKA

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

12. licenční studium Statistické zpracování dat při managementu jakosti. Lenka Hromádková

Tvorba nelineárních regresních modelů v analýze dat

LINEÁRNÍ REGRESE. Lineární regresní model

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

UNIVERZITA PARDUBICE

POLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými.

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Statistická analýza jednorozměrných dat

SEMESTRÁ LNÍ PRÁ CE. Licenč ní studium STATISTICKÉZPRACOVÁ NÍ DAT PŘ I KONTROLE A Ř ÍZENÍ JAKOSTI. Předmě t KALIBRACE A LIMITY JEJÍ PŘ ESNOSTI

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie

Semestrální práce str. 1. Semestrální práce. 2.1 Tvorba lineárních regresních modelů při analýze dat. 2.3 Kalibrace a limity její přesnosti

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Statistická analýza jednorozměrných dat

Semestrální práce z CHEMOMETRIE I Statistické zpracování jednorozměrných dat

Posouzení linearity kalibrační závislosti

Licenční studium Galileo: Statistické zpracování dat. Kalibrace a limity její přesnosti. Semestrální práce

Regresní analýza 1. Regresní analýza

S E M E S T R Á L N Í

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie

Úlohy. Kompendium 2012, Úloha B8.01a, str. 785, Model y = P1 * exp( P2/(B801x + P3)

AVDAT Geometrie metody nejmenších čtverců

Regresní analýza. Eva Jarošová

Statistická analýza jednorozměrných dat

Menu: QCExpert Nelineární regrese Modul nelineární regrese slouží pro tvorbu a analýzu explicitních nelineárních regresních modelů v obecném tvaru

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

VÍCEROZMĚRNÝ STATISTICKÝ SOUBOR

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie

6. Lineární regresní modely

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

Univerzita Pardubice Fakulta chemicko-technologická. Licenční studium Statistické zpracování dat

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

UNIVERZITA PARDUBICE. 4.4 Aproximace křivek a vyhlazování křivek

6. Lineární regresní modely

Úloha 1. Napište matici pro případ lineárního regresního spline vyjádřeného přes useknuté

Korelační a regresní analýza

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie

Lineární regrese. Komentované řešení pomocí MS Excel

Bodové a intervalové odhady parametrů v regresním modelu

odpovídá jedna a jen jedna hodnota jiných

Statistická analýza jednorozměrných dat

4EK211 Základy ekonometrie

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

Plánování experimentu

Úvodem Dříve les než stromy 3 Operace s maticemi

UNIVERZITA PARDUBICE CHEMICKO-TECHNOLOGICKÁ FAKULTA KATEDRA ANALYTICKÉ CHEMIE

Kanonická korelační analýza

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

Transkript:

Licenční studium č. 89002 Semestrální práce 2. semestr Tvorba lineárních regresních modelů při analýze dat Příklad 1 Porovnání dvou regresních přímek u jednoduchého lineárního regresního modelu. Počet stran celkem: 23

Strana 2 / 23 Licenční studium č. 89002... 1 Semestrální práce... 1 2. semestr... 1 Tvorba lineárních regresních modelů při analýze dat... 1 Zadání... 3 Data... 3 Laboratoř č. 1... 3 Laboratoř č. 2... 3 1. Řešení pro data laboratoře č. 1... 4 1.1 Návrh modelu... 4 1.2 Předběžná statistická analýza... 4 1.3 Odhad parametrů a testy významnosti... 4 1.4 Základní statistické charakteristiky... 4 1.5 Regresní diagnostika... 5 1.5.1 Kritika dat... 5 1.5.2 Model... 9 1.5.3 Metoda... 9 1.6 Konstrukce zpřesněného modelu... 10 1.6.1 Nové odhady parametrů po odstranění bodu 7... 10 1.6.2 Vyloučení parametru β 0 (včetně odstranění bodu 7)... 10 1.6.3 Metoda vážených nejmenších čtverců pro původní data... 12 1.6.4 Metoda vážených nejmenších čtverců svyloučením bodu 7... 12 1.6.5 Závěr zpřesněný model pro data laboratoře č. 1... 12 2. Řešení pro data laboratoře č. 2... 13 2.1 Návrh modelu... 13 2.2 Předběžná statistická analýza... 13 2.3 Odhad parametrů a testy významnosti... 13 2.4 Základní statistické charakteristiky... 14 2.5 Regresní diagnostika... 15 2.5.1 Kritika dat... 15 2.5.2 Model... 19 2.5.3 Metoda... 20 2.6 Konstrukce zpřesněného modelu... 21 2.6.1 Nové odhady parametrů po odstranění vlivných bodů 1, 14 a 15... 21 2.6.2 Závěr zpřesněný model pro data laboratoře č. 2... 22 3. Porovnání dvou lineárních závislostí... 22 3.1 Test shody rozptylů... 22 3.2 Chowův test... 22

Strana 3 / 23 Zadání Porovnání dvou regresních přímek u jednoduchého regresního modelu (včetně testování úseku a směrnice, s vyšetřením vlivných bodů a jejich event. odstraněním, posouzením míry spolehlivosti navrženého modelu). Test shodnosti dvou (i více) přímek, test jejich paralelity a společného úseku. Porovnání výsledků kalibrace anemometru TESTO 452 ve dvou různých laboratořích. Data Laboratoř č.1 Název souboru: TestoCIA Počet n: 7 Číslo měření Údaj měřidla [m.s -1 ] Údaj normálu [m.s -1 ] 1 1.31 1.28 2 6.05 5.87 3 10.75 10.48 4 15.45 15.09 5 20.11 19.70 6 25.60 25.10 7 30.50 30.10 Laboratoř č.2 Název souboru: TestoCHU Počet n: 15 Číslo měření Údaj měřidla [m.s -1 ] Údaj normálu [m.s -1 ] 1 0.50 0.50 2 1.10 1.00 3 1.50 1.40 4 2.00 2.40 5 3.00 2.90 6 4.00 3.90 7 5.00 4.90 8 6.00 5.80 9 8.00 7.80 10 10.00 9.80 11 15.00 14.80 12 20.00 19.80 13 25.00 24.90 14 30.00 30.00 15 35.20 35.20

Strana 4 / 23 1. Řešení pro data laboratoře č. 1 1.1 Návrh modelu Použijeme lineární regresní model y = β 0 + β 1 x, kde x = údaj měřidla a y = údaj normálu. 1.2 Předběžná statistická analýza Poloha a proměnlivost dat je vyjádřena pomocí průměru a směrodatné odchylky hodnot proměnných. Oba průměry jsou si velmi blízké; podobně je tomu u směrodatných odchylek, které ukazují na vysokou variabilitu dat. Párový korelační koeficient je vysoký a signalizuje tak vysokou korelaci mezi oběma proměnnými. Proměnná Průměr Směrodatná odchylka Párový korelační koeficient Spočtená hladina významnosti Y 1.5374E+01 1.0353E+01 1.0000 ----- X1 1.5681E+01 1.0498E+01 1.0000 0.000 1.3 Odhad parametrů a testy významnosti Klasickou metodou nejmenších čtverců byly určeny odhady parametrů β 0 a β 1. Studentův t-test ukázal, že úsek β 0 je statisticky nevýznamný a směrnice β 1 je statisticky významná. Parametr Odhad Směrodatná TestH0:B[j]=0vs.HA:B[j]<>0 odchylka t-kriterium hypotéza H0 je Hlad. výz. B[ 0] -9.0799E-02 5.3384E-02-1.7009E+00 Akceptována 0.150 B[ 1] 9.8620E-01 2.8936E-03 3.4083E+02 Zamítnuta 0.000 1.4 Základní statistické charakteristiky Tyto statistiky (vícenásobný korelační koeficient, koeficient determinace a predikovaný korelační koeficient) jsou velmi vysoké. Koeficient determinace ukazuje, že model vystihuje data v 99.996 %. Akaikeho informační kritérium a střední kvadratická chyba predikce slouží pro optimalizaci modelu (při minimalizaci obou parametrů. Vícenásobný korelační koeficient, R Koeficient determinace, R 2 Predikovaný korelační koeficient, Rp 2 Střední kvadratická chyba predikce, MEP Akaikeho informační kritérium, AIC 9.9998E-01 9.9996E-01 9.9994E-01 1.1526E-02-3.4730E+01

Strana 5 / 23 1.5 Regresní diagnostika 1.5.1 Kritika dat 1.5.1.a.1 Klasická rezidua Obr. 1.1a: Graf regresního modelu Obr. 1.1b: Analýza klasických reziduí Grafická analýza klasických reziduí vzhledem k predikci ukazuje na nekonstantnost rozptylu. Bod Meřená hodnota yexp[i] Predikovaná hodnota yvyp[i] Směrodatná odchylka s(yvyp[i]) Klasické reziduum e[i] Relativní reziduum er[i] I 1 1.2800E+00 1.2011E+00 5.0202E-02 7.8872E-02 6.1618E+00 2 5.8700E+00 5.8757E+00 3.9593E-02-5.7347E-03-9.7695E-02 3 1.0480E+01 1.0511E+01 3.1536E-02-3.0893E-02-2.9478E-01 4 1.5090E+01 1.5146E+01 2.8131E-02-5.6050E-02-3.7144E-01 5 1.9700E+01 1.9742E+01 3.0905E-02-4.1759E-02-2.1198E-01 6 2.5100E+01 2.5156E+01 4.0182E-02-5.6018E-02-2.2318E-01 7 3.0100E+01 2.9988E+01 5.1278E-02 1.1158E-01 3.7071E-01 Průměr absolutních hodnot reziduí, Me Průměr relativních reziduí, Mer Odhad reziduálního rozptylu, s^2(e) Odhad směrodatné odchylky reziduí, s(e) Odhad šikmosti reziduí, g1(e) Odhad špičatosti reziduí, g2(e) 5.4416E-02 1.1045E+00 5.5365E-03 7.4407E-02 8.1891E-01 1.9858E+00

Strana 6 / 23 1.5.1.a.2 Analýza ostatních reziduí Odlehlé body: Jackknife rezidua ej [i] - bod 7 Extrémy: Zobecněné diagonální prvky bod 7 Podezřelé body: Cookova vzdálenost bod 1, 6, 7 Atkinsonova vzdálenost bod 1, 7 Vliv na predikci bod 1, 7 Bod Standardizované reziduum es[i] Jackknife reziduum ej[i] Predikované reziduum ep[i] Diagonální prvky H[i,i] I 1 1.4361E+00 1.6758E+00 1.4477E-01 4.5520E-01 2-9.1028E-02-8.1486E-02-7.9998E-03 2.8314E-01 3-4.5839E-01-4.1889E-01-3.7657E-02 1.7963E-01 4-8.1367E-01-7.8134E-01-6.5397E-02 1.4294E-01 5-6.1696E-01-5.7411E-01-5.0466E-02 1.7252E-01 6-8.9451E-01-8.7297E-01-7.9081E-02 2.9163E-01 7 2.0696E+00 4.8885E+00* 2.1251E-01 4.7494E-01 Bod 1.5.1.a.3 Zobecněné diag. prvky Hm[i,i] Cookova vzdálenost D[i] Atkinsonova vzdálenost A[i] Vliv na predikci DF[i] I 1 6.7992E-01 8.6160E-01* 2.4220E+00* 1.5318E+00* 2 2.8433E-01 1.6364E-03 8.0973E-02-5.1212E-02 3 2.1411E-01 2.3005E-02 3.0993E-01-1.9602E-01 4 2.5642E-01 5.5209E-02 5.0452E-01-3.1909E-01 5 2.3551E-01 3.9679E-02 4.1448E-01-2.6214E-01 6 4.0499E-01 1.6471E-01* 8.8564E-01-5.6013E-01 7 9.2471E-01* 1.9371E+00* 7.3511E+00* 4.6493E+00* Bod V ě rohodnostní vzdálenosti I LD(b)[i] LD(s 2 )[i] LD(b,s 2 )[i] 1 2.0729E+00 5.6855E-01 4.0881E+00 2 4.5805E-03 7.7404E-02 8.1338E-02 3 6.4119E-02 4.1732E-02 9.9366E-02 4 1.5290E-01 5.1129E-04 1.5323E-01 5 1.1023E-01 1.9188E-02 1.2226E-01 6 4.4663E-01 1.4433E-03 4.7206E-01 7 4.0160E+00 2.2329E+01* 5.4752E+01* Grafy vlivných bodů Tyto grafy indikují přítomnost vlivných bodů a extrémů. Graf predikovaných reziduí indikuje jako vlivné body (extrémy) 1, 6 a 7. Pregibonův graf indikuje jako vlivný bod 7. Williamsův graf indikuje jako odlehlý bod 7. McCulloh-Meeterův graf indikuje jako odlehlý bod 7, jako vlivné body 1 a 6. L-R graf indikuje jako vlivné body 1 a 7. Obr. 2.1a: Graf predikovaných reziduí Obr. 2.1b: Pregibonův graf

Strana 7 / 23 Obr. 2.1c: Williamsův graf Obr. 2.1d: McCulloh-Meeterův graf Obr. 2.1d: L-R graf 1.5.1.a.4 Indexové grafy Andrewsův indexový graf indikuje jako podezřelé body 1 a 7, graf normovaných reziduí rovněž body 1 a 7. Graf prvků Hprojekční matice označuje body 1 a 7 jako extrémy. Obr. 3.1a: Andrewsův indexový graf Obr. 3.1b: Graf normovaných reziduí

Strana 8 / 23 Obr. 3.1c: Graf prvků Hprojekční matice 1.5.1.a.5 Rankitové grafy Tyto grafy indikují vedle normality reziduí také vlivné body. Graf normovaných reziduí, Andrewsův graf, graf predikovaných reziduí a graf Jackknife reziduí indikují jako vlivné body 1 a 7. Obr. 4.1b: Graf normovaných reziduí Obr. 4.1a: Andrewsův graf Obr. 4.1c: Graf predikovaných reziduí Obr. 4.1d: Graf Jackknife reziduí

Strana 9 / 23 1.5.1.a.6 Závěr kritikydat Bod 7 je odlehlý vyloučit a znovu určit regresní parametry. 1.5.2 Model Z grafu proložení regresní přímky body je zřejmé, že data nevykazují nelineární průběh a proto je lineární model vyhovující. 1.5.3 Metoda 1.5.3.a.1 Testy předpokladů MNČ Fisher-Snedocorův test významnosti regrese potvrdil lineární regresní model jako významný. Scottovo kritérium nemá pro závislost y na jednom parametru smysl. Cook-Weisbergův test heteroskedasticity reziduí indikuje heteroskedasticitu (nekonstantnost rozptylu reziduí). Jarque- Berraův test potvrdil normalitu reziduí. Waldův test autokorelace potvrdil, že rezidua nejsou autokorelována a znaménkový test že rezidua nevykazují trend. Předpoklady MNČ jsou splněny mimo požadavek konstantního rozptylu reziduí. Heteroskedasticita je zřejmě způsobena odlehlým bodem 7. Fisher-Snedocorův test významnosti regrese, F 1.1616E+05 Tabulkový kvantil, F(1-alpha,m-1,n-m) 6.6079E+00 Závěr: Navržený model je přijat jako významný. Spočtená hladina významnosti 0.000 Scottovo kriterium multikolinearity, M Závěr: Navržený model je korektní. 8.4620E-14 Cook-Weisbergův test heteroskedasticity, Sf 8.5959E+00 Tabulkový kvantil, Chi^2(1-alpha,1) 3.8415E+00 Závěr: Rezidua vykazují heteroskedasticitu. Spočtená hladina významnosti 0.003 Jarque-Berraův test normality reziduí, L(e) 1.0824E+00 Tabulkový kvantil, Chi^2(1-alpha,2) 5.9915E+00 Závěr: Normalita je přijata. Spočtená hladina významnosti 0.582 Waldův test autokorelace, Wa 3.9518E-04 Tabulkový kvantil, Chi^2(1-alpha,1) 3.8415E+00 Závěr: Rezidua nejsou autokorelována. Spočtená hladina významnosti 0.984 Znaménkový test, Dt -3.7978E-01

Strana 10 / 23 Tabulkový kvantil, N(1-alpha/2) 1.6449E+00 Závěr: Rezidua nevykazují trend. Spočtená hladina významnosti 0.352 1.5.3.a.2 Grafy autokorelace a heterokedasticity Obr. 5.1a: Graf autokorelace Obr. 5.1b: Graf heteroskedasticity Graf autokorelace není jednoznačně mrak bodů, jak by měl být dle závěru Waldova testu. Graf heteroskedasticity tvoří klín daný bodem 7 a potvrzuje závěr Cook-Weisbergova testu. 1.6 Konstrukce zpřesněného modelu 1.6.1 Nové odhady parametrů po odstranění bodu 7 Parametr Odhad Směrodatná TestH0:B[j]=0vs.HA:B[j]<>0 odchylka t-kriterium hypotéza H0 je Hlad. výz. B[ 0] -4.6477E-02 2.4351E-02-1.9086E+00 Akceptována 0.129 B[ 1] 9.8144E-01 1.5652E-03 6.2705E+02 Zamítnuta 0.000 Vícenásobný korelační koeficient, R Koeficient determinace, R 2 Predikovaný korelační koeficient, Rp 2 Střední kvadratická chyba predikce, MEP Akaikeho informační kritérium, AIC 9.9999E-01 9.9999E-01 9.9998E-01 2.0634E-03-3.9926E+01 Parametry AIC a MEP dosáhly nižších hodnot než u původního modelu. Cook-Weisbergův test heteroskedasticity reziduí indikuje nadále heteroskedasticitu. Ostatní předpoklady MNČ zůstaly příznivé. Jelikož parametr β 0 je opět nevýznamný, provedeme další úpravu modelu jeho vyloučením. 1.6.2 Vyloučení parametru β 0 (včetně odstranění bodu 7) Parametr Odhad Směrodatná TestH0:B[j]=0vs.HA:B[j]<>0 odchylka t-kriterium hypotéza H0 je Hlad. výz.

Strana 11 / 23 B[ 0] -4.6477E-02 2.4351E-02-1.9086E+00 Akceptována 0.129 B[ 1] 9.8144E-01 1.5652E-03 6.2705E+02 Zamítnuta 0.000 Vícenásobný korelační koeficient, R Koeficient determinace, R 2 Predikovaný korelační koeficient, Rp 2 Střední kvadratická chyba predikce, MEP Akaikeho informační kritérium, AIC 9.9999E-01 9.9999E-01 9.9998E-01 2.0634E-03-3.9926E+01 Parametry AIC a MEP dosáhly mírně vyšších hodnot než u předcházejícího modelu. Cook- Weisbergův test heteroskedasticity reziduí indikuje opět heteroskedasticitu a Waldův test indikuje autokorelaci. Ostatní předpoklady MNČ zůstaly příznivé. K odstranění heteroskedasticity reziduí použijeme v dalším kroku metodu vážených nejmenších čtverců.

Strana 12 / 23 1.6.3 Metoda vážených nejmenších čtverců pro původní data Heteroskedasticitu v datech kompenzujeme použitím kvadratické statistické váhy (w i =y i 2 ). Odhady parametrů provedeme pro původní data. Parametr Odhad Směrodatná TestH0:B[j]=0vs.HA:B[j]<>0 odchylka t-kriterium hypotéza H0 je Hlad. výz. B[ 0] -2.8776E-01 1.0139E-01-2.8382E+00 Zamítnuta 0.036 B[ 1] 9.9481E-01 3.9935E-03 2.4910E+02 Zamítnuta 0.000 Vícenásobný korelační koeficient, R Koeficient determinace, R 2 Predikovaný korelační koeficient, Rp 2 Střední kvadratická chyba predikce, MEP Akaikeho informační kritérium, AIC 9.9996E-01 9.9992E-01 9.9979E-01 1.6448E-02-3.6325E+01 Parametry AIC a MEP dosáhly horších hodnot než u původního modelu. Cook-Weisbergův test heteroskedasticity reziduí indikuje opět heteroskedasticitu. Ostatní předpoklady MNČ zůstaly příznivé. Parametry β 0 a β 1 jsou významné. Další úpravu provedeme vyloučením bodu 7. 1.6.4 Metoda vážených nejmenších čtverců s vyloučením bodu 7 Heteroskedasticitu v datech kompenzujeme použitím kvadratické statistické váhy (w i =y i 2 ). Odhady parametrů provedeme pro původní data bez bodu 7. Parametr Odhad Směrodatná TestH0:B[j]=0vs.HA:B[j]<>0 odchylka t-kriterium hypotéza H0 je Hlad. výz. B[ 0] -1.0839E-01 1.6755E-02-6.4693E+00 Zamítnuta 0.003 B[ 1] 9.8470E-01 7.8245E-04 1.2585E+03 Zamítnuta 0.000 Vícenásobný korelační koeficient, R Koeficient determinace, R 2 Predikovaný korelační koeficient, Rp 2 Střední kvadratická chyba predikce, MEP Akaikeho informační kritérium, AIC 1.0000E-00 1.0000E-00 1.0000E-00 1.3283E-04-5.3585E+01 Parametry AIC a MEP dosáhly nižších (lepších) hodnot než všechny předcházející modely. Všechny předpoklady MNČ jsou splněny. Parametry β 0 a β 1 jsou významné. 1.6.5 Závěr zpřesněný model pro data laboratoře č. 1 Zpřesněný model má tvar (v závorkách jsou uvedeny směrodatné odchylky parametrů): y = - 0.108 (0.017) + 0.9847 (0.0008) x

Strana 13 / 23 Intervalový odhad parametru úseku β 0 asměrnice β 1 bude b 0 t a / 2 + b ( 4) D( b0 ) β 0 b0 ta / 2 (4) D( 0 ) po dosazení vyjde -0.108 2.7765 x 0.017 β 0-0.108 + 2.7765 x 0.017-0.155 β 0-0.061 Tento interval spolehlivosti úseku regresní přímky nezahrnuje nulu, takže úsek β 0 považovat za nulový. nelze Analogicky dosazením do intervalu spolehlivosti směrnice obdržíme nerovnost 0.9847 2.7765 x 0.0008 β 1 0.9847 + 2.7765 x 0.0008 po vyčíslení 0.982 β 1 0.987 Tento interval spolehlivosti směrnice regresní přímky nezahrnuje jedničku, takže směrnici β 1 nelze považovat za jednotkovou. Přístroj (anemometr TESTO 452) vzhledem k normálu ČIA nadhodnocuje. 2. Řešení pro data laboratoře č. 2 2.1 Návrh modelu Použijeme lineární regresní model y = β 0 + β 1 x, kde x = údaj měřidla a y = údaj normálu. 2.2 Předběžná statistická analýza Poloha a proměnlivost dat je vyjádřena pomocí průměru a směrodatné odchylky hodnot proměnných. Oba průměry jsou si velmi blízké; podobně je tomu u směrodatných odchylek, které ukazují na vysokou variabilitu dat. Párový korelační koeficient je vysoký a signalizuje tak vysokou korelaci mezi oběma proměnnými. Proměnná Průměr Směrodatná odchylka Párový korelační koeficient Spočtená hladina významnosti Y 1.1007E+01 1.1339E+01 1.0000 ----- X1 1.1120E+01 1.1321E+01 1.0000 0.000 2.3 Odhad parametrů atestyvýznamnosti Klasickou metodou nejmenších čtverců byly určeny odhady parametrů β 0 a β 1. Studentův t-test ukázal, že úsek β 0 asměrnice β 1 jsou statisticky významné. Parametr Odhad Směrodatná TestH0:B[j]=0vs.HA:B[j]<>0 odchylka t-kriterium hypotéza H0 je Hlad. výz. B[ 0] -1.3127E-01 2.7530E-02-4.7683E+00 Zamítnuta 0.000 B[ 1] 1.0016E+00 1.7651E-03 5.6747E+02 Zamítnuta 0.000

Strana 14 / 23 2.4 Základní statistické charakteristiky Tyto statistiky (vícenásobný korelační koeficient, koeficient determinace a predikovaný korelační koeficient) jsou velmi vysoké. Koeficient determinace ukazuje, že model vystihuje data v 99.9996 %. Akaikeho informační kritérium a střední kvadratická chyba predikce slouží pro optimalizaci modelu (při minimalizaci obou parametrů). Vícenásobný korelační koeficient, R Koeficient determinace, R 2 Predikovaný korelační koeficient, Rp 2 Střední kvadratická chyba predikce, MEP Akaikeho informační kritérium, AIC 9.9998E-01 9.9996E-01 9.9997E-01 6.7938E-03-7.5949E+01

Strana 15 / 23 2.5 Regresní diagnostika 2.5.1 Kritika dat 2.5.1.a.1 Klasická rezidua Obr. 1.2a: Graf regresního modelu Obr. 1.2b: Analýza klasických reziduí Grafická analýza klasických reziduí vzhledem k predikci ukazuje na nekonstantnost rozptylu. Bod Meřená hodnota yexp[i] Predikovaná hodnota yvyp[i] Směrodatná odchylka s(yvyp[i]) Klasické reziduum e[i] Relativní reziduum er[i] i 1 5.0000E-01 3.6954E-01 2.6908E-02 1.3046E-01 2.6093E+01 2 1.0000E+00 9.7050E-01 2.6181E-02 2.9495E-02 2.9495E+00 3 1.4000E+00 1.3711E+00 2.5709E-02 2.8850E-02 2.0607E+00 4 2.4000E+00 2.3728E+00 2.4579E-02 2.7237E-02 1.1349E+00 5 2.9000E+00 2.8736E+00 2.4043E-02 2.6431E-02 9.1141E-01 6 3.9000E+00 3.8752E+00 2.3034E-02 2.4818E-02 6.3636E-01 7 4.9000E+00 4.8768E+00 2.2121E-02 2.3205E-02 4.7357E-01 8 5.8000E+00 5.8784E+00 2.1315E-02-7.8408E-02-1.3519E+00 9 7.8000E+00 7.8816E+00 2.0074E-02-8.1634E-02-1.0466E+00 10 9.8000E+00 9.8849E+00 1.9405E-02-8.4860E-02-8.6592E-01 11 1.4800E+01 1.4893E+01 2.0483E-02-9.2925E-02-6.2787E-01 12 1.9800E+01 1.9901E+01 2.4866E-02-1.0099E-01-5.1005E-01 13 2.4900E+01 2.4909E+01 3.1190E-02-9.0552E-03-3.6366E-02 14 3.0000E+01 2.9917E+01 3.8512E-02 8.2880E-02 2.7627E-01 15 3.5200E+01 3.5126E+01 4.6681E-02 7.4493E-02 2.1163E-01 Reziduální součet čtverců, RSC Průměr absolutních hodnot reziduí, Me Průměr relativních reziduí, Mer Odhad reziduálního rozptylu, s^2(e) Odhad směrodatné odchylky reziduí, s(e) Odhad šikmosti reziduí, g1(e) Odhad špičatosti reziduí, g2(e) 7.2665E-02 5.9716E-02 2.6124E+00 5.5896E-03 7.4764E-02-2.9843E-02 1.9416E+00

Strana 16 / 23 2.5.1.a.2 Analýza ostatních reziduí Odlehlé body: Nejsou indikovány Bod Extrémy: Diagonální prvky H ii bod 15 Zobecněné diagonální prvky H mii bod 15 Podezřelé body: Cookova vzdálenost bod 1, 12, 14, 15 Atkinsonova vzdálenost bod 1, 14, 15 Vliv na predikci bod 1, 14, 15 Standardizované reziduum es[i] Jackknife reziduum ej[i] Predikované reziduum ep[i] Diagonální prvky H[i,i] i 1 1.8703E+00 2.1019E+00 1.4988E-01 1.2953E-01 2 4.2118E-01 4.0745E-01 3.3618E-02 1.2263E-01 3 4.1094E-01 3.9741E-01 3.2719E-02 1.1825E-01 4 3.8575E-01 3.7276E-01 3.0538E-02 1.0808E-01 5 3.7336E-01 3.6065E-01 2.9479E-02 1.0342E-01 6 3.4892E-01 3.3681E-01 2.7421E-02 9.4922E-02 7 3.2492E-01 3.1345E-01 2.5431E-02 8.7542E-02 8-1.0941E+00-1.1032E+00-8.5345E-02 8.1277E-02 9-1.1335E+00-1.1472E+00-8.7976E-02 7.2092E-02 10-1.1753E+00-1.1945E+00-9.0990E-02 6.7366E-02 11-1.2924E+00-1.3300E+00-1.0047E-01 7.5057E-02 12-1.4323E+00-1.4995E+00-1.1355E-01 1.1062E-01 13-1.3327E-01-1.2813E-01-1.0963E-02 1.7404E-01 14 1.2933E+00 1.3312E+00 1.1281E-01 2.6534E-01 15 1.2756E+00 1.3103E+00 1.2209E-01 3.8985E-01* Bod Zobecněné diag. prvky Hm[i,i] Cookova vzdálenost D[i] Atkinsonova vzdálenost A[i] Vliv na predikci DF[i] I 1 3.6376E-01 2.6026E-01* 2.0671E+00* 8.1079E-01* 2 1.3460E-01 1.2397E-02 3.8835E-01 1.5232E-01 3 1.2970E-01 1.1323E-02 3.7104E-01 1.4553E-01 4 1.1829E-01 9.0160E-03 3.3082E-01 1.2976E-01 5 1.1303E-01 8.0392E-03 3.1228E-01 1.2248E-01 6 1.0340E-01 6.3842E-03 2.7809E-01 1.0908E-01 7 9.4952E-02 5.0645E-03 2.4753E-01 9.7090E-02 8 1.6588E-01 5.2955E-02 8.3661E-01-3.2815E-01 9 1.6380E-01 4.9912E-02 8.1525E-01-3.1977E-01 10 1.6647E-01 4.9889E-02 8.1844E-01-3.2102E-01 11 1.9389E-01 6.7766E-02 9.6596E-01-3.7888E-01 12 2.5097E-01 1.2758E-01* 1.3483E+00-5.2884E-01 13 1.7517E-01 1.8712E-03 1.4995E-01-5.8816E-02 14 3.5987E-01 3.0207E-01* 2.0397E+00* 8.0002E-01* 15 4.6621E-01* 5.1980E-01* 2.6702E+00* 1.0473E+00* Bod V ě rohodnostní vzdálenosti I LD(b)[i] LD(s 2 )[i] LD(b,s 2 )[i] 1 5.8890E-01 4.8711E-01 1.2541E+00 2 2.8580E-02 2.2481E-02 4.9551E-02 3 2.6108E-02 2.3020E-02 4.7730E-02 4 2.0792E-02 2.4312E-02 4.3956E-02 5 1.8540E-02 2.4929E-02 4.2432E-02 6 1.4726E-02 2.6105E-02 3.9986E-02

Strana 17 / 23 2.5.1.a.3 7 1.1683E-02 2.7205E-02 3.8203E-02 8 1.2171E-01 5.7730E-03 1.3140E-01 9 1.1474E-01 9.3351E-03 1.2863E-01 10 1.1469E-01 1.4298E-02 1.3453E-01 11 1.5557E-01 3.6029E-02 2.0350E-01 12 2.9157E-01 8.1984E-02 4.0827E-01 13 4.3176E-03 3.3539E-02 3.7575E-02 14 6.8138E-01 3.6271E-02 7.8297E-01 15 1.1540E+00 3.2104E-02 1.3118E+00 Grafy vlivných bodů Tyto grafy indikují přítomnost vlivných bodů a extrémů. Graf predikovaných reziduí indikuje jako vlivné body (extrémy) 1, 14 a 15. Pregibonův graf indikuje jako vlivný bod 15. Williamsův graf indikuje jako extrém bod 15. McCulloh-Meeterův graf indikuje jako extrém bod 15, jako vlivné body 1, 11, 12 a 14. L-R graf indikuje jako vlivné body 1 a 4, bod 15 jako extrém. Obr. 2.2a: Graf predikovaných reziduí Obr. 2.2b: Pregibonův graf Obr. 2.2c: Williamsův graf Obr. 2.2d: McCulloh-Meeterův graf

Strana 18 / 23 Obr. 2.2d: L-R graf 2.5.1.a.4 Indexové grafy Andrewsův indexový graf indikuje jako podezřelé body 1, 12 a 15, graf normovaných reziduí rovněž body 1 a 14. Graf prvků H projekční matice označuje bod 15 jako extrém. Obr. 3.2a: Andrewsův indexový graf Obr. 3.2b: Graf normovaných reziduí Obr. 3.2c: Graf prvků Hprojekční matice

Strana 19 / 23 2.5.1.a.5 Rankitové grafy Tyto grafy indikují vedle normality reziduí také vlivné body. Graf normovaných reziduí, Andrewsův graf, graf predikovaných reziduí a graf Jackknife reziduí indikují jako vlivné (odlehlé) body 1, 14 a 15. Body tvoří odstupňované skupiny. Obr. 4.2b: Graf normovaných reziduí Obr. 4.2a: Andrewsův graf Obr. 4.2c: Graf predikovaných reziduí Obr. 4.2d: Graf Jackknife reziduí 2.5.1.a.6 Závěr kritikydat Bod 15 je extrém. Body 1 a 14 jsou indikovány převážně jednoznačně indikovány nejsou. jako vlivné. Odlehlé body 2.5.2 Model Z grafu proložení regresní přímky body je zřejmé, že data nevykazují nelineární průběh a proto je lineární model vyhovující.

Strana 20 / 23 2.5.3 Metoda 2.5.3.a.1 Testy předpokladů MNČ Fisher-Snedocorův testvýznamnosti regrese potvrdil lineární regresní model jako významný. Scottovo kritérium nemá pro závislost y na jednom parametru smysl. Cook-Weisbergův test heteroskedasticity reziduí indikuje heteroskedasticitu (nekonstantnost rozptylu reziduí). Jarque- Berraův test potvrdil normalitu reziduí. Waldův test autokorelace potvrdil, že rezidua jsou autokorelována a znaménkový test že rezidua vykazují trend. Fisher-Snedocorův testvýznamnosti regrese,f 3.2202E+05 Tabulkový kvantil, F(1-alpha,m-1,n-m) 4.6672E+00 Závěr: Navržený model je přijat jako významný. Spočtená hladina významnosti 0.000 Scottovo kriterium multikolinearity, M -3.2654E-13 Závěr: Navržený model je korektní. Cook-Weisbergův test heteroskedasticity, Sf 4.4459E+01 Tabulkový kvantil, Chi^2(1-alpha,1) 3.8415E+00 Závěr: Rezidua vykazují heteroskedasticitu. Spočtená hladina významnosti 0.000 Jarque-Berraův test normality reziduí, L(e) 7.0229E-01 Tabulkový kvantil, Chi^2(1-alpha,2) 5.9915E+00 Závěr: Normalita je přijata. Spočtená hladina významnosti 0.704 Waldův test autokorelace, Wa 1.0083E+01 Tabulkový kvantil, Chi^2(1-alpha,1) 3.8415E+00 Závěr: Rezidua jsou autokorelována. Spočtená hladina významnosti 0.001 Znamékový test, Dt -2.6321E+00 Tabulkový kvantil, N(1-alpha/2) 1.6449E+00 Závěr: Rezidua vykazují trend. Spočtená hladina významnosti 0.004

Strana 21 / 23 2.5.3.a.2 Grafy autokorelace a heterokedasticity Obr. 5.2a: Graf autokorelace Obr. 5.2b: Graf heteroskedasticity Body grafech netvoří náhodný mrak bodů, což potvrzuje závěry Waldova a Cook- Weisbergova testu. 2.6 Konstrukce zpřesněného modelu Bod číslo 15 je indikován jako extrém. Body číslo 1 a 14 jsou indikovány jako podezřelé. Odstraněním bodů 1a14(apoužitím váhy w = y -2 ) nadále zůstává problémem heteroskedasticita a autokorelace. V daném případě je nejlepším kompromisem odstranění všech vlivných bodů (1, 14 a 15) a použití metody vážených nejmenších čtverců sváhou w = y -2. Heteroskedasticita je i nadále neodstraněna. 2.6.1 Nové odhady parametrů po odstranění vlivných bodů 1, 14 a 15 Odstranění všech vlivných bodů (1, 14 a 15) a použití metody vážených nejmenších čtverců sváhou w = y -2. Parametr Odhad Směrodatná TestH0:B[j]=0vs.HA:B[j]<>0 odchylka t-kriterium hypotéza H0 je Hlad. výz. B[ 0] -9.0053E-02 5.9870E-03-1.5041E+01 Zamítnuta 0.000 B[ 1] 9.9297E-01 2.3497E-03 4.2260E+02 Zamítnuta 0.000 Vícenásobný korelační koeficient, R Koeficient determinace, R 2 Predikovaný korelační koeficient, Rp 2 Střední kvadratická chyba predikce, MEP Akaikeho informační kritérium, AIC 9.9997E-01 9.9994E-01 9.9996E-01 2.2016E-04-1.0054E+02

Strana 22 / 23 Parametry AIC a MEP dosáhly nižších hodnot než upůvodního modelu. Cook-Weisbergův test heteroskedasticity reziduí indikuje nadále heteroskedasticitu. Ostatní předpoklady MNČ jsou splněny. Parametry β 0 a β 1 jsou významné. 2.6.2 Závěr zpřesněný model pro data laboratoře č. 2 Zpřesněný model má tvar (v závorkách jsou uvedeny směrodatné odchylky parametrů): y = - 0.090 (0.006) + 0.993 (0.002) x Intervalový odhad parametru úseku β 0 asměrnice β 1 bude po dosazení b 0 t a / 2 + b ( 10) D( b0 ) β 0 b0 ta / 2 (10) D( 0 ) vyjde -0.090 2.228 x 0.006 β 0-0.090 + 2.228 x 0.006-0.103 β 0-0.077 Tento interval spolehlivosti úseku regresní přímky nezahrnuje nulu, takže úsek β 0 považovat za nulový. nelze Analogicky dosazením do intervalu spolehlivosti směrnice obdržíme nerovnost 0.993 2.228 x 0.002 β 1 0.993 + 2.228 x 0.002 po vyčíslení 0.989 β 1 0.997 Tento interval spolehlivosti směrnice regresní přímky nezahrnuje jedničku, takže směrnici β 1 nelze považovat za jednotkovou. Přístroj (anemometr TESTO 452) vzhledem k normálu ČHMÚ nadhodnocuje. 3. Porovnání dvou lineárních závislostí 3.1 Test shody rozptylů 2 2 max( σ 1, σ 2 ) 1.9757E 2 Testační statistika F = = = 1. 9577 2 2 min(, ) 1.0092E 2 σ 1 σ Tuto statistiku porovnáme s tabulkovou hodnotou F 0.95 (4,10) = 3.478 2 Testační statistika je menší než tabulková hodnota F-rozdělení, rozptyly jsou shodné. 3.2 Chowův test Testujeme hypotézu H 0 : β 1 = β 2 oproti H A : β 1 β 2. Test je založen na testačním kritériu: ( RSC RSC1 RSC2)( n 2m) F c = ( RSC1 + RSC2)( m) kde RSC reziduální součet čtverců pro složený model

Strana 23 / 23 RSCi reziduální součet pro i-tý model n = n1 + n2, m = 2 (pro lineární závislost) Vtomtopřípadě RSC1 = 0.010404 RSC2 = 0.038652 RSC = 0.13633 n = 6 + 12 = 18 F c = 12.45 porovnáme s tabulkovou hodnotou F 0.95 (2,14) = 3.7389 Hodnota testačního kritéria F c je větší než kvantil F-rozdělení lineární závislosti nejsou shodné. Kalibrace anemometru provedené ve dvou různých laboratořích jsou statisticky významně odlišné.

Název souboru: pavek-lin1 Adresář: E:\Pom Šablona: D:\Program Files\Microsoft Office\Sablony\Normal.dot Název: 1 Předmět: Autor: Ing. Karel Pávek Klíčová slova: Komentáře: Datum vytvoření: 25.05.00 10:40 Číslo revize: 55 Poslední uložení: 15.09.00 06:42 Uložil: Milan Meloun Celková doba úprav: 1 482 min. Poslední tisk: 15.09.00 06:42 Jako poslední úplný tisk Počet stránek: 23 Počet slov: 4 222 (přibližně) Počet znaků: 24 066 (přibližně)