2.1 Tvorba lineárních regresních

Podobné dokumenty
6. Lineární regresní modely

Univerzita Pardubice SEMESTRÁLNÍ PRÁCE. Tvorba lineárních regresních modelů. 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D.

Tvorba lineárních regresních modelů při analýze dat

Kalibrace a limity její přesnosti

Fakulta chemicko technologická Katedra analytické chemie licenční studium Management systému jakosti Kalibrace a limity její přesnosti

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

Kalibrace a limity její přesnosti

TVORBA LINEÁRNÍCH REGRESNÍCH MODELŮ PŘI ANALÝZE DAT. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Inovace bakalářského studijního oboru Aplikovaná chemie

Fakulta chemicko technologická Katedra analytické chemie

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )

KALIBRACE A LIMITY JEJÍ PŘESNOSTI 2015

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie

Příloha č. 1 Grafy a protokoly výstupy z adstatu

Úloha 1: Lineární kalibrace

Tvorba nelineárních regresních modelů v analýze dat

Tvorba lineárních regresních modelů při analýze dat

2.2 Kalibrace a limity její p esnosti

UNIVERZITA PARDUBICE

Tvorba nelineárních regresních

Semestrální práce. 3.3 Tvorba nelineárních regresních modelů v analýze dat

Semestrální práce. 2. semestr

KALIBRACE A LIMITY JEJÍ PŘESNOSTI. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

UNIVERZITA PARDUBICE

Tvorba lineárních regresních modelů

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Univerzita Pardubice

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

Tvorba nelineárních regresních modelů v analýze dat

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

6. Lineární regresní modely

Kalibrace a limity její přesnosti

6. Lineární regresní modely

UNIVERZITA PARDUBICE FAKULTA CHEMICKO-TECHNOLOGICKÁ

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium chemometrie

Tabulka č. 1 95%ní intervaly Úsek Směrnice model L1 L2 L1 L2 Leco1-0, , , ,15618 OES -0, , , ,21271

Licenční studium Galileo: Statistické zpracování dat. Tvorba lineárních regresních modelů při analýze dat. Semestrální práce

S E M E S T R Á L N Í

http: //meloun.upce.cz,

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie

Tvorba modelu sorpce a desorpce 85 Sr na krystalických horninách za dynamických podmínek metodou nelineární regrese

PRAVDĚPODOBNOST A STATISTIKA

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Univerzita Pardubice Fakulta chemicko technologická Katedra analytické chemie Licenční studium Management systému jakosti

PRAVDĚPODOBNOST A STATISTIKA

6. Lineární regresní modely

Semestrální práce. 2. semestr

Semestrální práce. 2. semestr

Univerzita Pardubice SEMESTRÁLNÍ PRÁCE. Tvorba nelineárních regresních modelů v analýze dat. 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D.

Plánování experimentu

Univerzita Pardubice Fakulta chemicko-technologická. Licenční studium Statistické zpracování dat

POLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými.

Kalibrace a limity její přesnosti

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

Statistická analýza jednorozměrných dat

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Regresní analýza. Eva Jarošová

Korelační a regresní analýza

Lineární regrese. Komentované řešení pomocí MS Excel

LINEÁRNÍ REGRESE. Lineární regresní model

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA. Semestrální práce

UNIVERZITA PARDUBICE

Tvorba nelineárních regresních modelů v analýze dat

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

FAKULTA CHEMICKO-TECHNOLOGICKÁ KATEDRA ANALYTICKÉ CHEMIE. Semestrální práce z CHEMOMETRE. TOMÁŠ SYROVÝ 4.ročník

Statistická analýza jednorozměrných dat

koksárenství Kompozice uhelných vsázek s využitím statistických metod

Univerzita Pardubice. Fakulta chemicko-technologická Katedra analytické chemie. Licenční studium Statistické zpracování dat

Porovnání dvou výběrů

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

III. Semestrální práce

Tomáš Karel LS 2012/2013

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

Ilustrační příklad odhadu LRM v SW Gretl

Regresní analýza 1. Regresní analýza

UNIVERZITA PARDUBICE

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie

Statistická analýza jednorozměrných dat

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Aproximace a vyhlazování křivek

Regresní a korelační analýza

Regresní a korelační analýza

UNIVERZITA PARDUBICE

KGG/STG Statistika pro geografy

Analýza rozptylu ANOVA

PYTHAGORAS Statistické zpracování experimentálních dat

LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica

Licenční studium Galileo: Statistické zpracování dat. Kalibrace a limity její přesnosti. Semestrální práce

UNIVERZITA PARDUBICE CHEMICKO-TECHNOLOGICKÁ FAKULTA KATEDRA ANALYTICKÉ CHEMIE

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

6. Lineární regresní modely

KVALITA GELU HYDRATOVANÉHO OXIDU TITANIČITÉHO Z HLEDISKA KALCINAČNÍHO CHOVÁNÍ

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

4EK211 Základy ekonometrie

Úvodem Dříve les než stromy 3 Operace s maticemi

You created this PDF from an application that is not licensed to print to novapdf printer (

Transkript:

UNIVERZITA PARDUBICE Òkolní rok 2000/2001 Fakulta chemicko-technologická, Katedra analytické chemie LICEN NÍ STUDIUM STATISTICKÉ ZPRACOVÁNÍ DAT PÌI MANAGEMENTU JAKOSTI P EDM T: 2.1 Tvorba lineárních regresních model p i analýze dat Vypracoval: Ing. Adolf Goebel VPÍerov, února 2000

OBSAH 2.1.1 Porovnání dvou regresních přímek u jednoduchého lineárního modelu Porovnání průměrného věku přímých předků mužského a ženského pohlaví 3 2.1.2 Validace nové metody Možnost posouzení změn četnosti výskytu ptačích druhů v lokalitě 18 2.1.3 Lineární regrese polynomem Možnost vyjádření závislosti četnosti uhynulého ptactva na vzdálenosti od obce 23 2.1.4 Vícerozměrný lineární regresní model Vlastnosti povrchové úpravy titanové běloby 32

2.1.1 Porovnání dvou regresních přímek u jednoduchého lineárního modelu Porovnání průměrného věku přímých předků mužského a ženského pohlaví 2.1.1.1 Úvod Pro hodnocení bylo použito autentických dat o mých vlastních předcích. Data jsem získal sám v průběhu svých genealogických bádání v příslušných oblastních archivech. V genealogické praxi je nesmírně obtížné získat úplná data. Navíc, rozložení dat týkajících se přímých předků v časové ose je velmi nerovnoměrné. To plyne z několika základních zákonitostí genealogie. Počet přímých předků roste s každou generací (tedy průměrně každých30let)s druhou mocninou čísla dvě (dva rodiče, čtyři prarodiče, osm praprarodičů...), takže pro vzdálenější minulost existuje více sledovaných osob, než pro nedávnou minulost. Současně však s časovým odstupem klesá pravděpodobnost, že se zachovaly příslušné matriky. Navíc, především po zrušení nevolnictví v roce 1781, docházelo ke stěhování, čímž se zcela některé linie přerušily, protože většinou není jasné, odkud příslušný předek přišel a kde pokračovat v hledání jeho předků. Zcela zásadním problémem, pokud jde o věk, bývá častá situace, kdy je znám buď údaj o narození nebo o úmrtí. Je logické, že soubor je ovlivněn také dostupností pramenů z hlediska toho, ve kterém městě je archiv umístěn. Některé větve předků tak zůstávají zatím neprobádány, i když pravděpodobně existují prameny, ze kterých bude možné čerpat. Pokud jde o zpracovávaná data, věk byl vypočítáván jako rozdíl roku úmrtí a roku narození. To umožnilo do zpracování zařadit i předky, u kterých nebyl k dispozici přesný údaj o narození, avšak v záznamu o pohřbu byl uveden dožitý věk. V některých případech byla i ve starých matrikách uvedena také příčina smrti, která mohla pomoci při vyřazování odlehlých dat (úmrtí v příliš mladém věku). Obecně vzato byla řešena lineární závislost dožitého věku na roku narození a to zvlášť promužskéazvlášť pro ženské přímé předky. Smyslem bylo posoudit, zda se v datech projevily obecně uznávané zákonitosti platné pro velké lidské populace: průměrný věksezvyšuje průměrný věk žen je vyšší než mužů protože výše dosaženého věku je geneticky podmíněná, využít vztahu pro predikci věku osoby (takzvaný probant, neboli v heraldické staročeštině střeň), pro kterou je rodokmen sestaven 3

2.1.1.2 Zpracovávaná data a) předci mužského pohlaví K dispozici bylo celkem 45 přímých předků mužského pohlaví narozených v rozmezí let 1590 až 1917 (zahrnuje deset generací předcházejících probantovi), z nichž však bylo možné získat údaje o věku pouze pro 19 předků narozených mezi lety 1616 až 1917. Údaje shrnuje tabulka I-1. Tabulka I-1 Dožitý věk předků mužského pohlaví Rok narození Dosažený věk Příčina smrti 1917 80 skleróza a selhání mozkových funkcí 1878 80 bronchopneumonie 1847 74 selhání srdce 1803 77 sešlost stářím 1767 54 kolika 1833 64 rakovina žaludku 1770 68 zápal plic 1736 64 sešlost věkem 1656 60 neuvedena 1616 80 neuvedena 1652 46 neuvedena 1685 61 neuvedena 1662 45 neuvedena 1896 79 vleklý zánětprůdušek 1852 81 neuvedena 1858 75 rozedma plic 1846 71 plicní neduh 1822 81 sešlost věkem 1835 75 sešlost věkem b) předci ženského pohlaví K dispozici bylo celkem 36 přímých předků ženského pohlaví narozenýchvrozmezí let 1649 až 1926 (zahrnuje devět generací předcházejících probantovi), z nichž však bylo možné získat údaje o věku pouze pro 12 předků narozených mezi lety 1649 až 1926. Údaje shrnuje tabulka I-2. 4

Tabulka I-2 Dosažený věk předků ženského pohlaví Rok narození Dosažený věk Příčina smrti 1926 72 všeobecné kornatění cév 1876 67 rakovina prsu 1846 33 tyfus 1837 50 souchotiny 1777 40 při porodu 1649 80 neuvedena 1707 34 neuvedena 1667 43 neuvedena 1899 40 tyfus 1864 52 žaludeční astřevní katar 1834 53 křeče kostcové 1859 79 zauzlení střev 2.1.1.3 Lineární regresní model a) předci mužského pohlaví Udatbylatestyprokázána normalita. Indikace vlivných bodů vedla k závěru, že 10. bod je možno považovat každopádně za extrém a na základě několika testů rovněž za odlehlý bod. Tento závěr je logický rovněž zvěcného posouzení. Věk 80letuosobynarozené v roce 1616 je nepochybně zcela mimořádný a odpovídá spíše současnosti, než takto vzdálené době. V důsledku toho by hodnocení a regresní vztah byly zkreslené. Proto byl tento bod (předek) z hodnocení vyřazen. Obr. I-1 Obr. I-2 5

Obr. I-3 Obr. I-4 Jak ukazují grafy regresní přímky, predikovaných hodnot a reziduí i rankitový graf, po vyloučení uvedeného bodu byl získán velmi dobrý model, vyhovující požadavkům lineární regrese: Obr. I-5 Obr. I-6 Obr. I-7 Obr. I-8 Obr. I-9 6

Vícenásobná lineární regrese Název úlohy : Dožitý věkmužských předků Hladina významnosti : 0,05 Kvantil t(1-alfa/2,n-m) : 2,11990529922106 Kvantil F(1-alfa,m,n-m) : 4,49399847766553 Absolutní člen : Ano Počet platných řádků : 18 Počet parametrů : 2 Metoda : Nejmenší čtverce Sloupce pro výpočet : B (dožitý věk) Abs A Transformace : Bez transformace Základní analýza Charakteristiky proměnných Proměnná Průměr Směr.Odch. Kor.vs.Y Významnost A 1795,277778 84,98498522 0,8583165515 5,184281808E-006 Analýza rozptylu Průměr Y : 68,61111111 Zdroj Součet čtverců Průměrný čtverec Rozptyl Celková variabilita 2318,277778 128,7932099 136,369281 Variabilita vysvětlená modelem 1707,892168 94,88289823 100,464245 Reziduální variabilita 610,3856097 33,91031165 35,9050358 Hodnota kritéria F : 44,76887111 Kvantil F (1-alfa, m-1, n-m) : 4,493998478 Pravděpodobnost : 5,184281808E-006 Model je významný Odhady parametrů Proměnná Odhad Směr.Odch. Závěr Pravděpodobnost Abs -143,1251377 31,67861805 Významný 0,0003502368214 Spodní mez Horní mez -210,280808-75,96946745 7

Proměnná Odhad Směr.Odch. Závěr Pravděpodobnost A 0,1179406616 0,01762688162 Významný 5,184281808E-006 Spodní mez Horní mez 0,08057334182 0,1553079813 Statistické charakteristiky regrese Vícenásobný korelační koeficient R : 0,8583165515 Koeficient determinace R^2 : 0,7367073025 Predikovaný korelační koeficient Rp : 0,6632684596 Střední kvdratická chyba predikce MEP : 43,36873595 Akaikeho informační kritérium : 67,42694464 Testování regresního tripletu Fisher-Snedecorův testvýznamnosti modelu Hodnota kritéria F : 44,76887111 Kvantil F (1-alfa, m-1, n-m) : 4,493998478 Pravděpodobnost : 5,184281808E-006 Modeljevýznamný Scottovo kritérium multikolinearity Hodnota kritéria SC : 65,18152069 Model je nekorektní! Cook-Weisbergův test heteroskedasticity Hodnota kritéria CW : 0,9827977036 Kvantil Chi^2(1-alfa,1) : 3,841458829 Pravděpodobnost : 0,3215090729 Rezidua vykazují homoskedasticitu. Jarque-Berrův test normality Hodnota kritéria JB : 0,7393597634 Kvantil Chi^2(1-alfa,2) : 5,991464547 Pravděpodobnost : 0,6909554827 Rezidua mají normální rozdělení. Waldův test autokorelace Hodnota kritéria WA : 0,695333371 Kvantil Chi^2(1-alfa,1) : 3,841458829 Pravděpodobnost : 0,3215090729 Autokorelace je nevýznamná 8

Durbin-Watsonův test autokorelace Hodnota kritéria DW : 2,390635554 Rezidua nejsou autokorelována Znaménkový test reziduí Hodnota kritéria Sg : 1,214781645 Kvantil N(1-alfa/2) : 1,959963999 Pravděpodobnost : 0,2244493833 V reziduích není trend. věkmužů [roky] = -143,1251(±31,6786) + 0,11794(±0,01763). rok narození b) předci ženského pohlaví Udatbylatestyprokázána normalita. Indikace vlivných bodů vedla k závěru, že 6.bodje možno považovat každopádně za extréma na základě několika testů rovněž za odlehlý bod. Tento závěr jelogický rovněž zvěcného posouzení. Věk 80 let u osoby narozené v roce 1649 je opět nepochybně zcela mimořádný a odpovídá spíše současnosti, než takto vzdálené době. V důsledku toho by hodnocení a regresní vztah byly zkreslené. Proto byl tento bod (ženský předek) z hodnocení vyřazen. Obr. I-10 Obr. I -11 Obr. I-12 9

V získaném modelu byl nevýznamný absolutní člen, proto byl vynechán. Nicméně ani potom, i když byl koeficient u proměnné x statistickyvýznamný, byla kvalita modelu velmi špatná, což ukazuje i následující obrázek: Obr. I-13 Ve snaze zvýšit těsnost modelu byli ze souboru vyřazeni dva ženští předkové, kteří zemřeli na tyfus ve velmi nízkémvěku (*1846-33 let a *1899-40 let). Je zjevné, že vtakmalémsouboru dat, tato data zcela poškozují a znehodnocují celý soubor. Jejich odstranění souboru prospělo, jak ukazují následující obrázky (zleva doprava I-14, I-15; dole I-16 a I-17): 10

Obr. I-18 Vícenásobná lineární regrese Název úlohy : Dožitý věk ženských předků Hladina významnosti : 0,05 Kvantil t(1-alfa/2,n-m) : 2,36462425159257 Kvantil F(1-alfa,m,n-m) : 5,59144785121972 Absolutní člen : Ano Počet platných řádků : 9 Počet parametrů : 2 Metoda : Sloupce pro výpočet : Transformace : Nejmenší čtverce B (věk) Abs A Bez transformace Základní analýza Charakteristiky proměnných Proměnná Průměr Směr.Odch. Kor.vs.Y Významnost A 1816,333333 83,83018549 0,7836098117 0,01246767619 Analýza rozptylu Průměr Y : 54,44444444 Zdroj Součet čtvercůp průměrný čtverec Rozptyl 11

Celková variabilita 1854,222222 206,0246914 231,777777 Variabilita vysvětlená modelem 1138,574655 126,508295 142,321831 Reziduální variabilita 715,6475671 79,51639634 89,4559458 Hodnota kritéria F : 11,13679827 Kvantil F (1-alfa, m-1, n-m) : 5,591447851 Pravděpodobnost : 0,01246767619 Závěr: Modeljevýznamný Odhady parametrů Proměnná Odhad Směr.Odch. Závěr Pravděpodobnost Abs -204,0379027 77,52851831 Významný 0,03382507006 Spodní mez Horní mez -387,3637173-20,71208809 Proměnná Odhad Směr.Odch. Závěr Pravděpodobnost A 0,1423099727 0,04264372745 Významný 0,01246767619 Spodní mez Horní mez 0,04147358062 0,2431463648 Statistické charakteristiky regrese Vícenásobný korelační koeficient R : 0,7836098117 Koeficient determinace R^2 : 0,614044337 Predikovaný korelační koeficient Rp : 0,3196477196 Střední kvdratická chyba predikce MEP : 140,1693686 Akaikeho informační kritérium : 43,38366919 Testování regresního tripletu Fisher-Snedecorův testvýznamnosti modelu Hodnota kritéria F : 11,13679827 Kvantil F (1-alfa, m-1, n-m) : 5,591447851 Pravděpodobnost : 0,01246767619 Model je významný Scottovo kritérium multikolinearity Hodnota kritéria SC : 18,06305736 Model je nekorektní! Cook-Weisbergův test heteroskedasticity 12

Hodnota kritéria CW : 0,001647304125 Kvantil Chi^2(1-alfa,1) : 3,841458829 Pravděpodobnost : 0,9676251525 Rezidua vykazují homoskedasticitu. Jarque-Berrův test normality Hodnota kritéria JB : 1,110356776 Kvantil Chi^2(1-alfa,2) : 5,991464547 Pravděpodobnost : 0,5739698629 Rezidua mají normální rozdělení. Waldův test autokorelace Hodnota kritéria WA : 0,1068401056 Kvantil Chi^2(1-alfa,1) : 3,841458829 Pravděpodobnost : 0,9676251525 Autokorelace je nevýznamná Durbin-Watsonův test autokorelace Hodnota kritéria DW : 1,764872827 Rezidua nejsou autokorelována Znaménkový test reziduí Hodnota kritéria Sg : 0,04016096645 Kvantil N(1-alfa/2) : 1,959963999 Pravděpodobnost : 0,9679647968 V reziduích není trend. věk žen [roky] = -204,0379(±77,5285) + 0,1423(±0,04264). rok narození c) porovnání obou modelů Nejprve byl vytvořen model pro sloučená data: Vícenásobná lineární regrese Název úlohy : Společný soubor muži+ženy Hladina významnosti : 0,05 Kvantil t(1-alfa/2,n-m) : 2,05953855275281 Kvantil F(1-alfa,m,n-m) : 4,24169905027515 Absolutní člen : Ano Počet platných řádků : 27 Počet parametrů : 2 Metoda : Nejmenší čtverce Sloupce pro výpočet : B 13

Transformace : Abs A Bez transformace Základní analýza Charakteristiky proměnných Proměnná Průměr Směr.Odch. Kor.vs.Y Významnost A 1802,296296 83,58819148 0,6620823012 0,0001687664782 Analýza rozptylu Průměr Y : 63,88888889 Zdroj Součet čtverců Průměrný čtverec Rozptyl Celková variabilita 5376,666667 199,1358025 206,794871 Variabilita vysvět. modelem 2356,877821 87,29177115 90,6491469 Reziduální variabilita 3019,788846 111,8440313 116,145724 Hodnota kritéria F : 19,51194224 Kvantil F (1-alfa, m-1, n-m) : 4,24169905 Pravděpodobnost : 0,0001687664782 Model je významný Odhady parametrů Proměnná Odhad Směr.Odch. Závěr Pravděpodobnost Abs -141,3989024 46,52240818 Významný 0,005492076991 Spodní mez Horní mez -237,2135956-45,58420918 Proměnná Odhad Směr.Odch. Závěr Pravděpodobnost A 0,113903464 0,02578616047 Významný 0,00016876647820 Spodní mez Horní mez 0,06079587236 0,1670110556 Statistické charakteristiky regrese Vícenásobný korelační koeficient R : 0,6620823012 Koeficient determinace R^2 : 0,4383529735 Predikovaný korelační koeficient Rp : 0,3590513795 Střední kvdratická chyba predikce MEP : 127,6358179 Akaikeho informační kritérium : 131,3618437 14

Testování regresního tripletu Fisher-Snedecorův testvýznamnosti modelu Hodnota kritéria F : 19,51194224 Kvantil F (1-alfa, m-1, n-m) : 4,24169905 Pravděpodobnost : 0,0001687664782 Model je významný Scottovo kritérium multikolinearity Hodnota kritéria SC : 28,74972408 Model je nekorektní! Cook-Weisbergův test heteroskedasticity Hodnota kritéria CW : 0,0867104589 Kvantil Chi^2(1-alfa,1) : 3,841458829 Pravděpodobnost : 0,7684015371 Rezidua vykazují homoskedasticitu. Jarque-Berrův test normality Hodnota kritéria JB : 2,315171212 Kvantil Chi^2(1-alfa,2) : 5,991464547 Pravděpodobnost : 0,3142439744 Rezidua mají normální rozdělení. Waldův test autokorelace Hodnota kritéria WA : 9,614534144 Kvantil Chi^2(1-alfa,1) : 3,841458829 Pravděpodobnost : 0,7684015371 Autokorelace je významná Durbin-Watsonův test autokorelace Hodnota kritéria DW : 0,9062753863 Rezidua jsou pozitivně autokorelována! Znaménkový test reziduí Hodnota kritéria Sg : 1,921869163 Kvantil N(1-alfa/2) : 1,959963999 Pravděpodobnost : 0,05462222283 V reziduích není trend. věkpředka [roky] = -141,3989(±46,5224) + 0,1139(±0,02579). rok narození 15

Jak je zjevné i z následujícího obrázku, nemají oba soubory totožné rozptyly (bylo potvrzeno i F-testem), takže k testování Chowovým testem shodnosti bude nutné Fisherovo- Snedecorovo rozdělení s m a r stupni volnosti. Dožitý věk předků v ě k 90 80 70 60 50 40 30 1650 1700 1750 1800 1850 1900 1950 rok narození muži ženy regrese-muži regrese-ženy regrese-vše Obr. I-19 Dosažením do testačního kritéria se získá: Vzhledem k rozdílnosti v rozptylu obou souborů dat se určí stupně volnosti: 16

Kvantil F-rozdělení F 0,95(2, 22) = 2,64 je nižší než F C, je tedy nutno zamítnout nulovou hypotézu ostejnémvěku dožití mužských a ženských přímých předků. Závěry: 1. Průměrný věk dožití předků roste s rokem narození. Tatoskutečnost se dá popsat matematicky regresními vztahy: věkmužů [roky] = -143,1251(±31,6786) + 0,11794(±0,01763). rok narození věk žen [roky] = -204,0379(±77,5285) + 0,1423(±0,04264). rok narození věkpředka obecně [roky] = -141,3989(±46,5224) + 0,1139(±0,02579). rok narození 2. Bylo prokázáno, že vztahy pro dožití mužů a žen se statisticky významně liší. Oproti obecnému trendu, ženy dosahovaly v průběhu sledovaných posledních zhruba 300 až 400 letech nižšího věku a to i po vyřazení těch případů, které se staly obětmi tyfových epidemií. 3. K předpovědi věku dožití probanta (rok narození 1954) bylo použito vztahu pro muže zezávěru 1. Pravděpodobné dožití je asi 87 let. 17

2.1.2 Validace nové metody Možnost posouzení změn četnosti výskytu ptačích druhů v lokalitě 2.1.2.1 Úvod Ve čtvrtletníku Ptáci kolem nás 4/99 vydávaného Moravským ornitologickým spolkem v Přerově publikoval Jiří Šafránek článek Negativní dopady dopravy na ptactvo. Jsou v něm údaje o dvouletémsledování lokality mezi obcemi Horní Moštěnice a Beňov (okr. Přerov), která se nachází 210-220 m. n. m. Konkrétně byl sledován úsek silnice spojující obě obce, který začínal na konci Horní Moštěnice (1 500 obyvatel) a procházel mezi zahradami, byl lemován travnatým příkopem a osázen vzrostlými ovocnými stromy a končil v polích ještě před obcí Beňov. Sledování bylo prováděno v období od 1.10.1984 až 30.9.1986 tak, že celý kilometrový úsek byl procházen každé dva až třidny pěšky a mimo cesty byly prohledávány rovněž obě krajnice a identifikovány kadavery (mrtvá těla) ptáků. V prvním roce sledování bylo provedeno 160 kontrol, ve druhém 120 kontrol. Toto sledování je zcela ojedinělé. Jiná publikovaná sledování byla prováděna obvykle z auta (nepodchytí mrtvé ptáky v příkopech) nebo sice pěšky, ale jen po krátkou dobu (nezaznamená se velmi výrazná změna četností způsobená ročním obdobím, do které se promítá jak migrace ptactva, hnízdění, nezkušenost mláďat, zemědělská činnost, rekreační aktivity atd.). Cílem mého matematicko- statistického hodnocení bylo posoudit, zda by se metody dalo použít ke kontrole výrazných změn ve stavu ptactva ve sledované oblasti za delší dobu. Jinak řečeno, jak významně je možné výsledky získané za období 1.10.1984 až 30.9.1985 považovat za shodné s rokem 1.10.1985 až 30.9.1986. V daném období nebyly výrazně kruté zimy, povodně a jiné situace, které by mohly způsobit zdecimování stavu ptactva, ani nebyly prováděny změny v dopravě, které by se mohly projevit výraznou změnou ve frekvenci průjezdů vozidel. Mohlo se však projevit osetí polí nestejnými plodinami, které může významně ovlivnit zájem ptáků o lokalitu z hlediska dostupné potravy. Vzhledem k tomu, že se jedná o údaje s oboru terénní biologie, nelze u nich předvídat nějakou dokonalou přesnost požadovanou pro analytickou metodu, takže i mírně odlišné výsledky od statistické významnosti jsou pro praxi cenné a motivující pro další testování. 18

2.1.2.2 Zpracovávaná data Zpracovávaná data shrnuje tabulka číslo II-1 Tabulka II-1 Počty ptáku usmrcených projíždějícími vozidly Druh 1.10.84 až 30.9.85 1.10.85 až 30.9.86 vrabec domácí (Passer domesticus) 19 28 bažant obecný (Phasianus colchicus) 5 7 vlaštovka obecná (Hirundo rustica) 7 10 pěnkava obecná (Fringilla coelebs) 3 4 vrabec polní (Passer montanus) 2 4 zvonek zelený (Carduelis chloris) 2 5 ťuhýk obecný (Lanius collurio) 2 0 rákosník zpěvný (Acrocephalus palustris) 1 0 konopka obecná (Carduelis cannabina) 2 1 kos černý (Turdus murula) 3 0 strnad obecný (Emberisa citrinella) 2 0 zvonohlík zahradní (Serinus serinus) 0 2 stehlík obecný (Cardelis carduelis) 2 0 konipas bílý (Motacilla alba) 1 1 bramborníček černohlavý (Saxicola torquata) 1 1 hrdlička zahradní (Streptopelia decaocto) 0 2 krutihlav obecný (jynx torquilla) 1 0 straka obecná (Pica pica) 0 1 pěnice hnědokřídlá (Sylvia communis) 0 1 leisek černohlavý (Ficedula hypoleuca) 0 1 neurčení pěvci 2 6 2.1.2.3. Vlastní hodnocení K hodnocení bylo použito metody lineární regrese, kdy jako nezávisle proměnné bylo použito počtu usmrcených ptáků příslušného druhu v období 1.10.1984 až 30.9.1985 a jako závislé proměnné stejných údajů pro období 1.10.1985 až 30.9.1986. Exaktně vzato, pokud by se nezměnil počet ptáků a jeho druhové zastoupení v lokalitě ani hustota provozu, měly by si údaje odpovídat s vysokou přesností, což by se mělo projevit tím, že regresní přímka bude procházet zpočátku (bodu 0) a její směrnice by měla býtjednotková. Vzhledem k tomu, o jaký typ sběru dat se jedná i tomu,že absolutní počtyptáků jednotlivých druhů jsou většinou poměrně nízké a tím vysoce ovlivněné každým jednotlivým nalezeným nebo nenalezeným ptákem, dá se očekávat, že i v případě, že se podmínky na lokalitě nijak výrazně nezměnily, těžko se dá dosáhnout tak exaktní shody, jak tomu bývá upřesných analytických metod. 19

Při kontrole předpokladů bylo zjištěno, že zahrnutí údajů o vrabci domácím výrazně ovlivňujekvalitudat ato jakzhlediskazhoršení předpokladů o normalitě, tak i z hlediska regrese, kdy je tento druh možné rovněž považovat za odlehlý bod. Z biologického hlediska se jedná o výrazně sinantropní druh (žijící v lidských sídlištích), který často podléhá výrazným lokálním populačnímexplozím. I z tohoto hlediska je rozumné ho z hodnocení vyřadit. Získaný regresní graf, graf predikce (absolutní člen byl vyřazen - nevýznamný) a grafy reziduí jsou uvedeny na následujících obrázcích II-1, II-2, II-3 a II-4: Obr. II-1 Obr. II-2 Obr. II-3 Obr. II-4 Vícenásobná lineární regrese Název úlohy : Ptáci usmrcení vozidly Hladina významnosti : 0,05 Kvantil t(1-alfa/2,n-m) : 2,0930240544081 Kvantil F(1-alfa,m,n-m) : 4,38074969233094 Absolutní člen : Ne Počet platných řádků : 20 Počet parametrů : 1 20

Metoda : Sloupce pro výpočet : Transformace : Nejmenší čtverce B A Bez transformace Základní analýza Charakteristiky proměnných Proměnná Průměr Směr.Odch. Kor.vs.Y Významnost A 1,8 1,7651599 0,7232501876 0,0003139219506 Analýza rozptylu Průměr Y: 2,3 Zdroj Součet čtverců Průměrný čtverec Rozptyl Celková variabilita 150,2 7,51 7,90526315 Variabilita vysvětlená modelem 78,07903226 4,401048387 4,62038994 Reziduální variabilita 72,12096774 3,606048387 3,78354783 Hodnota kritéria F : 20,56962988 Kvantil F (1-alfa, m-1, n-m) : 4,380749692 Pravděpodobnost : 0,0002262795662 Model je významný Odhady parametrů Proměnná Odhad Směr.Odch. Závěr Pravděpodobnost A 1,217741935 0,1749617564 Významný 1,242266672E-006 Statistické charakteristiky regrese Spodní mez Horní mez 0,8515427708 1,5839411 Interval spolehlivosti zahrnuje hodnotu 1,0000 Vícenásobný korelační koeficient R : 0,7209949861 Koeficient determinace R^2 : 0,51983377 Predikovaný korelační koeficient Rp : 0,4578712731 Střední kvdratická chyba predikce MEP : 4,071386739 Akaikeho informační kritérium : 27,65225086 21

Testování regresního tripletu Fisher-Snedecorův testvýznamnosti modelu Hodnota kritéria F : 20,56962988 Kvantil F (1-alfa, m-1, n-m) : 4,380749692 Pravděpodobnost : 0,0002262795662 Modeljevýznamný Cook-Weisbergův test heteroskedasticity Hodnota kritéria CW :0,05627508477 Kvantil Chi^2(1-alfa,1) : 3,841458829 Pravděpodobnost : 0,8124832495 Rezidua vykazují homoskedasticitu. Jarque-Berrův test normality Hodnota kritéria JB : 0,7073634878 Kvantil Chi^2(1-alfa,2) : 5,991464547 Pravděpodobnost : 0,7020983789 Rezidua mají normální rozdělení. Waldův test autokorelace Hodnota kritéria WA : 0,5063121161 Kvantil Chi^2(1-alfa,1) : 3,841458829 Pravděpodobnost : 0,8124832495 Autokorelace je nevýznamná Durbin-Watsonův test autokorelace Hodnota kritéria DW : 1,498047671 Rezidua jsou pozitivně autokorelována! Znaménkový test reziduí Hodnota kritéria Sg : 1,578858163 Kvantil N(1-alfa/2) : 1,959963999 Pravděpodobnost : 0,114368594 V reziduích není trend. Závěr: Sběr ptáků uhynulých vdůsledku kolize s vozidly může přinést cenné informace o rozšíření jednotlivých druhů na biotopu a zároveň signalizovat nastávající výrazné změny v jeho osídlení. Je však nutné sledovat četnost dopravy a brát vúvahu i další faktory, které by mohly ovlivnit získávané výsledky. 22

2.1.3 Lineární regrese polynomem Možnost vyjádření závislosti četnosti uhynulého ptactva na vzdálenosti od obce 2.1.3.1 Úvod K vyhodnocení bylo využito dat ze stejného zdroje jako v části 2.1.2. V tomto případě byly zpracovávány údaje o četnosti všech nalezených mrtvých ptáků bez ohledu na druh. Nálezy byly rozděleny na úseky silnice dlouhé 200 m. Je logické, že se četnost výskytu ptactva a tímipočet úhynů výrazně mění s ohledem na typ krajiny. V konkrétnímpřípadě, bylyprvních 700 metrů od okraje obce Horní Moštěnice zahrady, dalších 800 metrů pole, následovalo 150 metrů remízku, 350 metrů pole a 150 metrů meze. Získaná křivka tedy měla komplikovaný tvar a úkolem zpracování bylo nalézt vhodný polynom pro její proložení. 2.1.3.2 Zpracovávaná data Přehled dat je uveden v tabulce III-1. Tabulka III-1 Počet nalezených mrtvých ptáků vrůzné vzdálenosti od obce Vzdálenost od obce [m] Počet usmrcenýchptáků 200 2 400 17 600 27 800 16 1000 13 1200 1 1400 9 1600 11 1800 5 2000 9 Data byla prokládána polynomem, přičemž bylo použito programu QCExpert. Tento program standardně nabízí použití parametru omezení na vlastní čísla spoužitím metody korekce hodnosti. Výpočet byl proveden s doporučeným nastavením pro hodnotu parametru omezení 0,01. Hodnota 0 odpovídá klasické metodě nejmenších čtverců. Ipřesto, že hodnotaje nastavitelná až do čísla 1, nedoporučuje sepoužití hodnoty vyšší než 0,1. Přehled získaných výstupů pro různý stupeň polynomu 23

Polynom 2. stupně s absolutním členem Odhady parametrů Proměnná Odhad Směr.Odch. Závěr Abs 10,55 9,588309267 Nevýznamný A 0,008231060606 0,0200224109 Nevýznamný A^2-5,587121212E-006 8,869551505E-006 Nevýznamný Statistické charakteristiky regrese Vícenásobný korelační koeficient R : 0,3846489607 Koeficient determinace R^2 : 0,147954823 Predikovaný korelační koeficient Rp : -1,494563189 Střední kvdratická chyba predikce MEP : 136,2031501 Akaikeho informační kritérium : 44,39918154 Polynom 2. stupně bez absolutního členu Odhady parametrů Proměnná Odhad Směr.Odch. Závěr A 0,02825063892 0,008466979608 Významný A^2-1,353139832E-005 5,218979264E-006 Významný Statistické charakteristiky regrese Vícenásobný korelační koeficient R : 0,02434846157 Koeficient determinace R^2 : 0,0005928475808 Predikovaný korelační koeficient Rp : -0,6951455557 Střední kvdratická chyba predikce MEP : 92,55494734 Akaikeho informační kritérium : 43,99440859 Polynom 3. stupně s absolutním členem Odhady parametrů Proměnná Odhad Směr.Odch. Závěr Abs -12,5 12,33312097 Nevýznamný A 0,1104516317 0,04622129825 Nevýznamný A^2-0,0001164044289 4,766943513E-005 Nevýznamný A^3 3,358100233E-008 1,429254327E-008 Nevýznamný 24

Statistické charakteristiky regrese Vícenásobný korelační koeficient R : 0,7458155052 Koeficient determinace R^2 : 0,5562407678 Predikovaný korelační koeficient Rp : -0,7820414196 Střední kvdratická chyba predikce MEP : 97,29946151 Akaikeho informační kritérium : 39,87560749 Polynom 3. stupně bez absolutního členu Odhady parametrů Proměnná Odhad Směr.Odch. Závěr A 0,06666475855 0,01646268742 Významný A^2-7,492212802E-005 2,448586429E-005 Významný A^3 2,205814097E-008 8,678364167E-009 Významný Statistické charakteristiky regrese Vícenásobný korelační koeficient R : 0,6930121628 Koeficient determinace R^2 : 0,4802658577 Predikovaný korelační koeficient Rp : 0,05912657919 Střední kvdratická chyba predikce MEP : 51,37168878 Akaikeho informační kritérium : 39,4559602 Polynom 4. stupně s absolutním členem Odhady parametrů Proměnná Odhad Směr.Odch. Závěr Abs -42,75 15,79812335 Významný A 0,3043618881 0,08903127136 Významný A^2-0,0004711720571 0,0001541752957 Významný A^3 2,759688228E-007 1,030098206E-007 Významný A^4-5,508814102E-011 2,328339117E-011 Nevýznamný Statistické charakteristiky regrese Vícenásobný korelační koeficient R : 0,8891781492 Koeficient determinace R^2 : 0,790637781 Predikovaný korelační koeficient Rp : -0,6275841 25

Střední kvdratická chyba predikce MEP : 88,86609186 Akaikeho informační kritérium : 34,36344461 Polynom 4. stupně bez absolutního členu Odhady parametrů Proměnná Odhad Směr.Odch. Závěr A 0,07320730796 0,03595826772 Nevýznamný A^2-9,384619833E-005 9,426478996E-005 Nevýznamný A^3 3,801557857E-008 7,688761483E-008 Nevýznamný A^4-4,09816011E-012 1,959991302E-011 Nevýznamný Statistické charakteristiky regrese Vícenásobný korelační koeficient R : 0,695719412 Koeficient determinace R^2 : 0,4840255002 Predikovaný korelační koeficient Rp : -0,2279068029 Střední kvdratická chyba predikce MEP : 67,04371144 Akaikeho informační kritérium : 41,38335949 Polynom 5. stupně s absolutním členem Odhady parametrů Proměnná Odhad Směr.Odch. Závěr Abs -51 32,20393327 Nevýznamný A 0,3723618881 0,2437770505 Nevýznamný A^2-0,0006496576341 0,0006097130893 Nevýznamný A^3 4,754880537E-007 6,64235072E-007 Nevýznamný A^4-1,542467949E-010 3,262478595E-010 Nevýznamný A^5 1,802884616E-014 5,913296701E-014 Nevýznamný Statistické charakteristiky regrese Vícenásobný korelační koeficient R : 0,8918478803 Koeficient determinace R^2 : 0,7953926415 Predikovaný korelační koeficient Rp : -12,86764107 26

Střední kvdratická chyba predikce MEP : 757,1732024 Akaikeho informační kritérium : 36,13371422 Polynom 5 stupně bez absolutního členu Odhady parametrů Proměnná Odhad Směr.Odch. Závěr A -0,005491343494 0,0570383943 Nevýznamný A^2 0,0002616697897 0,0002298764896 Nevýznamný A^3-4,78759029E-007 3,188960528E-007 Nevýznamný A^4 2,964096235E-010 1,820378399E-010 Nevýznamný A^5-6,065719514E-014 3,657889067E-014 Nevýznamný Statistické charakteristiky regrese Vícenásobný korelační koeficient R : 0,8167651495 Koeficient determinace R^2 : 0,6671053095 Predikovaný korelační koeficient Rp : -9,362688502 Střední kvdratická chyba predikce MEP : 565,8027922 Akaikeho informační kritérium : 39,00104799 Polynom 6. stupně s absolutním členem Odhady parametrů Proměnná Odhad Směr.Odch. Závěr Abs 39,56666176 49,44267035 Nevýznamný A -0,5211130637 0,4640726243 Nevýznamný A^2 0,002398720675 0,00152742899 Nevýznamný A^3-4,341308564E-006 2,35805736E-006 Nevýznamný A^4 3,684511682E-009 1,853962174E-009 Nevýznamný A^5-1,478715866E-012 7,180822908E-013 Nevýznamný A^6 2,26779502E-016 1,085996893E-016 Nevýznamný Statistické charakteristiky regrese 27

Vícenásobný korelační koeficient R : 0,9573962282 Koeficient determinace R^2 : 0,9166075378 Predikovaný korelační koeficient Rp : -0,5011463053 Střední kvdratická chyba predikce MEP : 81,96258827 Akaikeho informační kritérium : 29,15836528 Polynom 6. stupně bez absolutního členu Odhady parametrů Proměnná Odhad Směr.Odch. Závěr A -0,1531807772 0,06014817272 Nevýznamný A^2 0,00121098216 0,0003442053282 Významný A^3-2,551425329E-006 7,125308681E-007 Významný A^4 2,313476948E-009 6,758866669E-010 Významný A^5-9,614991714E-013 2,985211743E-013 Významný A^6 1,505457488E-016 4,974536383E-017 Významný Statistické charakteristiky regrese Vícenásobný korelační koeficient R : 0,948053729 Koeficient determinace R^2 : 0,8988058731 Predikovaný korelační koeficient Rp : -2,526042214 Střední kvdratická chyba predikce MEP : 192,5219049 Akaikeho informační kritérium : 29,09319324 Polynom 7. stupně s absolutním členem Odhady parametrů Proměnná Odhad Směr.Odch. Závěr Abs 3,40000072 1 46,0513476 Nevýznamný A -0,1129671742 1,605538276 Nevýznamný A^2 0,0007039027226 0,006515452185 Nevýznamný A^3-8,763865711E-007 1,30907495E-005 Nevýznamný A^4-1,712798974E-010 1,439521495E-008 Nevýznamný A^5 8,982587688E-013 8,809514375E-012 Nevýznamný A^6-5,350030611E-016 2,812741093E-015 Nevýznamný A^7 9,893280214E-020 3,64896909E-019 Nevýznamný Statistické charakteristiky regrese 28

Vícenásobný korelační koeficient R : 0,9589389554 Koeficient determinace R^2 : 0,9195639202 Predikovaný korelační koeficient Rp : -64,55564934 Střední kvdratická chyba predikce MEP : 3579,338454 Akaikeho informační kritérium : 30,79741432 Polynom 7. stupně bez absolutního členu Odhady parametrů Proměnná Odhad Směr.Odch. Závěr A -0,07571734681 0,1076854182 Nevýznamný A^2 0,0005540692225 0,0008268771326 Nevýznamný A^3-5,791591278E-007 2,35990406E-006 Nevýznamný A^4-4,931921777E-010 3,26688387E-009 Nevýznamný A^5 1,09203445E-012 2,355534139E-012 Nevýznamný A^6-5,958295071E-016 8,503641555E-016 Nevýznamný A^7 1,066912773E-019 1,213353703E-019 Nevýznamný Statistické charakteristiky regrese Vícenásobný korelační koeficient R : 0,958927591 Koeficient determinace R^2 : 0,9195421247 Predikovaný korelační koeficient Rp : 0,4971647797 Střední kvdratická chyba predikce MEP : 27,45480303 Akaikeho informační kritérium : 28,80012363 Polynom 8. stupně s absolutním členem Odhady parametrů Proměnná Odhad Směr.Odch. Závěr Abs 195,4631771 603,6204733 Nevýznamný A -2,520261103 7,473313138 Nevýznamný A^2 0,01233181723 0,03565522499 Nevýznamný A^3-2,984602168E-005 8,789435762E-005 Nevýznamný A^4 4,127113957E-008 1,247077071E-007 Nevýznamný A^5-3,443214969E-011 1,056969446E-010 Nevýznamný A^6 1,717925235E-014 5,279824588E-014 Nevýznamný A^7-4,7171068E-018 1,43261608E-017 Nevýznamný A^8 5,472776166E-022 1,627024932E-021 Nevýznamný 29

Statistické charakteristiky regrese Vícenásobný korelační koeficient R : 0,9631931249 Koeficient determinace R^2 : 0,9277409959 Predikovaný korelační koeficient Rp : -4948,447743 Střední kvdratická chyba predikce MEP : 270239,8468 Akaikeho informační kritérium : 31,72535547 Polynom 8. stupně bez absolutního členu Odhady parametrů Proměnná Odhad Směr.Odch. Závěr A -0,1027961093 0,2538453377 Nevýznamný A^2 0,000836750445 0,002481722274 Nevýznamný A^3-1,667331117E-006 9,191007104E-006 Nevýznamný A^4 1,584770124E-009 1,713761009E-008 Nevýznamný A^5-1,086558026E-012 1,770960019E-011 Nevýznamný A^6 6,79850816E-016 1,028491705E-014 Nevýznamný A^7-2,844383188E-019 3,140810414E-018 Nevýznamný A^8 4,889623539E-023 3,922054064E-022 Nevýznamný Statistické charakteristiky regrese Vícenásobný korelační koeficient R : 0,9592510453 Koeficient determinace R^2 : 0,9201625679 Predikovaný korelační koeficient Rp : -18,31153219 Střední kvdratická chyba predikce MEP : 1054,409658 Akaikeho informační kritérium : 30,72271072 Poznámka: Výrazně nejnižší MEP (27,45) bylo programem QCExpert zjištěno absurdně pro polynom 7. stupně bez absolutního členu (koeficienty nevýznamné). To však v žádném případě nepotvrdil program ADSTAT, který dospěl k hodnotě MEP přes tisíc. Závěr: 30

Nejlepším proložením vztahu mezi počtem ptáků usmrcených dopravou a vzdáleností od obce Horní Moštěnice poskytuje vztah s polynomem třetího stupně bez absolutního členu: Počet usmrcených ptáků = + 0,066665(±0,01646) x vzdálenost -5-5 2-7,4922.10 (±2,4486.10 )x vzdálenost + 2,2058.10 (±8,6784.10 ) x vzdálenost -8-9 3 31

2.1.4 Vícerozměrný lineární regresní model Vlastnosti povrchové úpravy titanové běloby 2.1.4.1 Úvod Vzhledem k tomu, že titanová běloba je fotoaktivní a vlivem UV světla přítomného v běžnémslunečnímzáření je schopna způsobovat přenos kyslíku a tím idestrukciorganických látek přítomných vbarvách, lacích a plastech, pokrývá se takzvanou anorganickou povrchovou úpravou.tajetvořena nasráženými sloučeninami na bázi hydratovaných oxidů hliníku a křemíku. Klepšímu zapracování se polarita povrchu upravuje ještě takzvanou organickou povrchovou úpravou, která spočívá v pokrytí anorganické povrchové úpravy vhodnými organickými sloučeninami. Vrámci výstupní kontroly se povrchová úprava posuzuje na základě obsahů Al2O 3, SiO2 ac, které vyjadřují složení povrchové úpravy. Dalšími testy, ve kterých se odráží především kvalita vymytí solí po vysrážení anorganické povrchové úpravy, jsou ph a vodivost vodného výluhu výsledného pigmentu. Polaritu povrchu charakterizují zkoušky založené na hledání minimálního množství různých médií, které způsobí slepení testovaného vzorku do jediného shluku, popř. změnu tohoto shluku na vláčnou pastu.tojsoubodtečení, bodsmočení (obojí založeno na smáčení vodou s dispergačním činidlem), spotřeba olejeaspotřeba vody. Mimo jiné se u pigmentu sleduje rovněž měrný povrch. Tato práce se pokouší nalézt lineární regresí vztah mezi spotřebou vody a ostatními parametry. 2.1.4.2 Zpracovávaná data Použitá data jsou uvedena v tabulce IV-1. 32

33

2.1.4.3. Zpracování dat Pomocí grafické diagnostiky v programu Adstat a QCExpert byly ze souboru vyloučeny řádky 1, 6 a 25. Obr. IV-1 Obr. IV-2 Obr. IV-3 Obr. IV-4 Obr. IV - 5 34

Při výpočtu byly zjištěny následující významné vztahy mezi použitými proměnnými: ph výluhu - ph výluhu - měrná vodivost - spotřeba oleje, bod tečení, bod smočení negativně korelováno (vyluhovatelné alkalické sloučeniny zřejmě usnadňují smočení povrch pigmentu více jako kyselé. Povrch se snáze smáčí jak nepolárním olejem tak polárním roztokem, proto jsou zjišťované hodnoty uvedených charkteristik nižší) měrný povrch pozitivně korelováno (úprava vedená do alkalické oblasti zřejmě zvyšuje pórovitost nebo je odolnější při mletí, které normálně póryničí). bod tečení pozitivně korelováno (nevymyté anorganické soli, které jsou po vymytí zdrojem vodivosti výluhu, zřejmě polarizují povrch, který se hůře smáčí nepolárním olejem, což vede k vyššímhodnotámbodutečení) spotřeba oleje - bod tečení,bodsmočení, obsahy Al2O 3, SiO2 pozitivně korelováno (souvisí jak s obecnou smáčivostí povrchu kapalinou různé polarity, tak se zhoršující se smáčivostí srostoucímmnožstvímanorganické povrchové úpravy. spotřeba oleje - obsah uhlíku negativně korelováno (organickáúprava usnadňuje smočení povrchu olejem). bod tečení - bodsmočení pozitivně korelováno (obě veličiny spolu souvisí, určují se přídavkem vody s dispergačním činidlem, kdy se nejprve dosáhne bodu tečení a po dalším přídavku bodu smočení. Již z tohoto nutně plyne, že vyššímu bodu tečení bude odpovídat vyšší bod smočení a opačně. bod smočení -obsah uhlíku negativně povrchu). korelováno (organická úprava usnadňuje smočení obsah Al O, - obsah SiO pozitivně korelováno (plyne z technologie přídavků). 2 3 2 Pro regresní model se ukázaly jako významné pouze absolutní člen, ph vodného výluhu, měrná vodivost vodného výluhu a obsah uhlíku. Ostatní sloupce hodnot tedy byly z dat vyřazeny a byl proveden nový výpočet. Vícenásobná lineární regrese Název úlohy : Spotřeba vody Hladina významnosti : 0,05 Kvantil t(1-alfa/2,n-m) : 2,08596344726555 Kvantil F(1-alfa,m,n-m) : 3,09839121136758 35

Absolutní člen : Ano Počet platných řádků : 24 Počet parametrů : 4 Metoda : Nejmenší čtverce Sloupce pro výpočet : D Abs A (ph vodného výluhu) B (měrná vodivost vodného výluhu) C (obsah uhlíku z organické povrchové úpravy) Transformace : Bez transformace Základní analýza Charakteristiky proměnných Proměnná Průměr Směr.Odch. Kor.vs.Y Významnost A 7,491666667 1,155672839-0,6885798214 0,0001991152421 B 90,41666667 38,5305262-0,01376086949 0,9491150053 C 0,1789916667 0,1152631051-0,775693638 8,454881572E-006 Párové korelace (Xi, Xj) Abs - A 0 1 Abs - B 0 1 Abs - C 0 1 A - B -0,3397093899 0,104353105 A - C 0,3265406603 0,1193846223 B - C -0,02349976624 0,913207443 Analýza rozptylu Průměr Y : 27,54583333 Zdroj Součet čtverců Průměrný čtverec Rozptyl Celková variabilita 105,8255833 4,409399306 4,601112319 Variabilita vysvětlená modelem 90,6551922 3,777299675 3,941530096 Reziduální variabilita 15,17039113 0,6320996305 0,6595822231 Hodnota kritéria F : 39,83865299 Kvantil F (1-alfa, m-1, n-m) : 3,098391211 Pravděpodobnost : 1,264586416E-008 Modeljevýznamný 36

Odhady parametrů Proměnná Odhad Směr.Odch. Závěr Pravděpodobnost Abs 38,55917099 1,492375926 Významný 0 Spodní mez Horní mez 35,44612935 41,67221262 Proměnná Odhad Směr.Odch. Závěr Pravděpodobnost A -1,056936903 0,1775768485 Významný 8,049641553E-006 Spodní mez Horní mez -1,427355718-0,6865180884 Proměnná Odhad Směr.Odch. Závěr Pravděpodobnost B -0,01231368915 0,0050356117 Významný 0,02385267484 Spodní mez Horní mez -0,02281779109-0,001809587212 Proměnná Odhad Směr.Odch. Závěr Pravděpodobnost C -11,07177778 1,675034464 Významný 1,944233469E-006 Spodní mez Horní mez -14,56583844-7,577717115 Statistické charakteristiky regrese Vícenásobný korelační koeficient R : 0,9255523886 Koeficient determinace R^2 : 0,8566472241 Predikovaný korelační koeficient Rp : 0,7868347225 Střední kvdratická chyba predikce MEP : 0,9399308264 Akaikeho informační kritérium : -3,008998098 Reziduální součet čtverců : 15,17039113 Průměr absolutních reziduí : 0,62160391 Reziduální směr. odchylka : 0,8709302823 Reziduální rozptyl : 0,7585195566 Šikmost reziduí : 0,178313 Špičatost reziduí : 2,67715062 37

Testování regresního tripletu Fisher-Snedecorův testvýznamnosti modelu Hodnota kritéria F : 39,83865299 Kvantil F (1-alfa, m-1, n-m) : 3,098391211 Pravděpodobnost : 1,264586416E-008 Modeljevýznamný Scottovo kritérium multikolinearity Hodnota kritéria SC : 250,8898697 Model je nekorektní! Cook-Weisbergův test heteroskedasticity Hodnota kritéria CW : 0,4554758972 Kvantil Chi^2(1-alfa,1) : 3,841458829 Pravděpodobnost : 0,4997459438 Rezidua vykazují homoskedasticitu. Jarque-Berrův test normality Hodnota kritéria JB : 0,8174837218 Kvantil Chi^2(1-alfa,2) : 5,991464547 Pravděpodobnost : 0,6644857399 Rezidua mají normální rozdělení. Waldův test autokorelace Hodnota kritéria WA : 0,761717303 Kvantil Chi^2(1-alfa,1) : 3,841458829 Pravděpodobnost : 0,4997459438 Autokorelace je nevýznamná Durbin-Watsonův test autokorelace Hodnota kritéria DW : 1,437161126 Rezidua jsou pozitivně autokorelována! Znaménkový test reziduí Hodnota kritéria Sg : 0,2087117775 Kvantil N(1-alfa/2) : 1,959963999 Pravděpodobnost : 0,8346732455 V reziduích není trend. 38

Některé vybrané grafické výstupy: Obr. IV-6 Obr.IV-7 Obr. IV-8 Obr. IV-9 Obr. IV-10 Obr. IV-11 39

Obr. IV-12 Obr.IV-13 Obr. IV-14 Obr. IV-15 Závěr: Pro vyjádření spotřeby vody pomocí ostatních kritérií se nejvíce hodí ph a vodivost vodného výluhu z pigmentu a obsah uhlíku z provedené organické povrchové úpravy. Výsledný vztah má velmi dobrou predikční schopnost a jeho tvar je následující: Spotřeba vody = 38,5592(±1,4924) -1,0569(±0,1776) x - 0,01231(±0,005036).x 1 2 kde -11,0718(±1,6750). x 3 spotřebavody x1 x2 x 3 jevyjádřena v gramech na 100 gramů pigmentu phvodného výluhu měrná vodivost vodného výluhu v mscm obsah uhlíku v procentech 40