0. Licenční studium Statistické zpracování dat 3.3 Tvorba nelineárních regresních modelů v analýze dat Vladimír Bajzík Liberec, únor, 007
Zadání Vypracujte písemně s využitím paketu ADSTAT a vyřešte 3 příklady. Příklady postavte z dat vašeho pracoviště nebo nalezněte v literatuře. Každý příklad bude mít strukturu dle příkladů v učebnici M.Meloun, J.Militký: Kompendium statistického zpracování eperimentálních dat, Academia Praha 00, t.zn. Nadpis příkladu, Zadání, Data, Program, Řešení, Output, Obrázky, Závěr. Příklad. Změna tepelného odporu koberců vlivem opotřebení. Základní užitnou vlastností koberců je její tepelná izolace, která může být např. charakterizována tepelným odporem R [Km W - ] tj, odporem vůči vedení tepla. Během používání dochází k opotřebení koberců a tím i ke změně tepelných vlastností. Cílem tohoto příkladu je modelovat změny tepelného odporu pomocí simulovaného opotřebení. Pro simulaci opotřebení bylo použito zařízení tetrapod. Tepelný odpor byl měřen po 0, 0, 30, 40, 50, 00 a 00 tisících otáčkách (cyklech). Použitý software Adstat.0 modul nelineární regrese Data Počet cyklů Tepelný odpor 0 4, 0000 0, 0000 95,6 30000 90, 40000 89,9 50000 88,8 00000 88, 00000 86,6 Řešení Navržené testované modely jsou Model A: 3 + e 3 Model B: Model C: + 3 Koeficienty i jsou odhadovány pomocí koeficientů p i. Počáteční odhady jsou pro všechny modely shodné p =00 p =30 p 3 =0,000
Model A ) Odhady parametrů Odhad p 88,04 0,667-0,096-0,0 ±,304 ±,687 p 35,85,346 0,06 0,073 ±5,465 ±5,496 p 3 8,99E-5 8,8E-6 4,575E-7 0,509 ±,449E-5 ±3,340E-5 u všech koeficientů je menší než %, koeficienty lze považovat za nevychýlené. Směrodatné odchylky jsou výrazně nižší než průměry, proto lze všechny koeficienty považovat za významné. ) Mapa citlivosti funkce změna Souhrnná citlivost změna p -,699E-9,537E-9 p,90 0,498 -,6775 p 3 5,77 5,37-5,95 Změna citlivosti u parametru p je malá, u zbývajících dvou je výrazně vyšších. y modelu nejsou příliš dobře podmíněny. Model B ) Odhady parametrů Odhad p 4,3,797 0,0005 0,00086 ±8,434 ±0,000864 p 8,36 3,47 0,6 7,633 ±3,34 ±3,98 p 3 0,304 0,03609 0,00093 0,745 ±0,45 ±0,454 u koeficientu p je větší než %, rovněž směrodatná je velká a konfidenční intervaly překrývají 0. Tudíž koeficient p je nevýznamný. ) Mapa citlivosti funkce změna Souhrnná citlivost změna p 7,37E-9 -,57E-8 p -3, 4,487 5,44 p 3 -,84,4E+0 7,37
Změna citlivosti u parametru p je malá, u zbývajících dvou je výrazně vyšších. y modelu nejsou příliš dobře podmíněny. Model C ) Odhady parametrů Odhad p 9,46,7,6E-,77E- ±7,867 ±8,567 p -3,7 6,05,6E-0-7,95E-0 ±4,0 ±4,3 p 3-74,49 5,66-7,36E-9 9,9-0 ±,67 ±,67 u všech koeficientů je menší než %, koeficienty lze považovat za nevychýlené. Směrodatné odchylky jsou výrazně nižší než průměry, proto lze všechny koeficienty považovat za významné. ) Mapa citlivosti funkce změna Souhrnná citlivost změna p -3,7E-09,96E-09 p 3.0E-08 0,5,36E-07 p 3 0,80 6,54E-8-9,6 Změna citlivosti u parametru p a p je malá, u zbývajícího je výrazně vyšší. y modelu nejsou příliš dobře podmíněny. 3) Porovnání kvality jednotlivých modelů. s(e) AIC MEP a) U žádného z modelů nebyly indikovány vlivné body. b) Analýza výsledků RSC Regresní rabat D Model A 7,874 99,8,55 5,873 8,43 Model B 39,4 96,43,798 8,7,06E+4 Model C 58,8 85,55 5,66 9,88,69E+3 Porovnání výsledků analýzy ukazuje, že nejlepším modelem je model A. Závěr Pokles tepelného odporu koberců vlivem sešlapání, lze modelovat pomocí eponenciální funkce (model A). Průběh funkce a graf reziduí vs. predikce jsou na náledujících grafech
Obr..: Funkce: model A Obr..: Graf reziduí
Příklad Měření průběhu pronikání iontu Ca ++ přes plasmovou membránu. Data byla adaptována z knihy: Rawlings, John 0.; Pantula, Sastry G.; Dickey, David A.: Applied Regression Analysis: A Research Tool, Second Edition. Springer. Data čas (min) vápník (nmol/mt) 0,45 0,3875,3,48,4,3999 4,7689 6,,954 8,05 3,4800,5 3,6488 3,5 4,6993 5 3,764 Programy Adstat.5 a.0 moduly nelineární regrese Řešení Jako modely byly porovnávány a 3 parametrické Weibullovy růstové modely. Model A: Model B ( e ( e ( ) ( ) 3 Koeficienty i jsou odhadovány pomocí koeficientů p i. Počáteční odhady jsou p =3 p =3 p 3 =,5 Model A ) Odhady parametrů odhad p -5,0E+,4E+5-3,60E+7 7,9E+6 ±5,3E+5 ±5,3E+5 p 4,7E+4,3E+7 7,89E+9.68E+7 ±8,43E+7 ±8,43E+7 p 3 5,85E- 4,58E-0-6,93 -,E+03 ±,68 ±,73 y jsou statisticky nevýznamné, směrodatné odchylky jsou výrazně větší než bodové odhady.
) Mapa citlivosti funkce parametr změna Souhrnná citlivost změna p 7,4096E+0 3,544E-05-4,639E+0 p 5,7474E+0,3759E-09-3,6868E+0 p 3 5,685E+0 6,4705E+0-3,6409E+0 Citlivost je velmi nízká. Model B ) Odhady parametrů odhad P 4,309 0,34 0,059,04 ±0,935 ±,04 P 4,8,0 0,44 3,003 ±3,43 ±3,46 u obou parametrů je minimálně 3 menší než bodové odhady, což ukazuje že oba parametry jsou statisticky významné. odhad je větší než %, takže odhady jsou méně přesné. ) Mapa citlivosti funkce změna Souhrnná citlivost změna p 3,87 0,480-3,65 p -,703 0,5383,573 Citlivost u obou parametrů je nízká. s(e) AIC MEP 3) Porovnání kvality jednotlivých výběrů a) U žádného z modelů nebyly indikovány vlivné body. b) Analýza výsledků RSC Regresní rabat D Model A 8,5-40,63 3,678 5,79 9,08 Model B 0,889 94,49 0,356-6,83 0,09 Porovnání výsledků analýzy ukazuje, že nejlepším modelem je model B. Analýza výsledků modelu A a především regresní rabat naznačuje, že došlo k selhání během výpočtu. Závěr Vhodnější je parametrické Weibullovo rozdělení.