EKONOMICKÁ APLIKACE KOMPOZIČNÍHO REGRESNÍHO MODELU

Podobné dokumenty
Eva Fišerová a Karel Hron. Katedra matematické analýzy a aplikací matematiky Přírodovědecká fakulta Univerzity Palackého v Olomouci.

Aplikace T -prostorů při modelování kompozičních časových řad

Klasická a robustní ortogonální regrese mezi složkami kompozice

Alternativní přístup k analýze vícefaktorových dat

Předzpracování kompozičních dat

kompoziční data s aplikací v metabolomice

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Regresní analýza. Eva Jarošová

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Statistick anal 0 5za kompozi 0 0n ͺch tabulek

Bodové a intervalové odhady parametrů v regresním modelu

Robust 2014, ledna 2014, Jetřichovice

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

Regresní analýza 1. Regresní analýza

PRAVDĚPODOBNOST A STATISTIKA

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Kalibrace a limity její přesnosti

LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica

PRAVDĚPODOBNOST A STATISTIKA

AVDAT Nelineární regresní model

Lineární regrese. Komentované řešení pomocí MS Excel

13.1. Úvod Cílem regresní analýzy je popsat závislost hodnot znaku Y na hodnotách

Tematický plán Obor: Informační technologie. Vyučující: Ing. Joanna Paździorová

AVDAT Klasický lineární model, metoda nejmenších

Statistická analýza jednorozměrných dat

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

Národníinformačnístředisko pro podporu jakosti

Inovace bakalářského studijního oboru Aplikovaná chemie

2.2 Kalibrace a limity její p esnosti

Základní statistické metody v rizikovém inženýrství

7 Regresní modely v analýze přežití

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

STATISTIKA I Metodický list č. 1 Název tématického celku:

odpovídá jedna a jen jedna hodnota jiných

8 Coxův model proporcionálních rizik I

Regresní a korelační analýza

Úvodem Dříve les než stromy 3 Operace s maticemi

Úloha 1: Lineární kalibrace

4EK211 Základy ekonometrie

Učební plán 4. letého studia předmětu matematiky. Učební plán 6. letého studia předmětu matematiky

Matematika 1 pro PEF PaE

Kalibrace a limity její přesnosti

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

Lineární a logistická regrese

10. Předpovídání - aplikace regresní úlohy

0.1 Úvod do matematické analýzy

Požadavky k písemné přijímací zkoušce z matematiky do navazujícího magisterského studia pro neučitelské obory

Testování předpokladů pro metodu chain-ladder. Seminář z aktuárských věd Petra Španihelová

AVDAT Geometrie metody nejmenších čtverců

Derivace funkce. Přednáška MATEMATIKA č Jiří Neubauer

Matematika PRŮŘEZOVÁ TÉMATA

Bodové a intervalové odhady parametrů v regresním modelu

MATURITNÍ TÉMATA Z MATEMATIKY

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

KVADRATICKÁ KALIBRACE

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

CHOVÁNÍ SILOFUNKCÍ TESTŮ V COXOVĚ MODELU PROPORCIONÁLNÍCH RIZIK

Matematika I (KMI/PMATE)

Mgr. Ladislav Zemánek Maturitní okruhy Matematika Obor reálných čísel

Popisná statistika. Jaroslav MAREK. Univerzita Palackého

Regrese. používáme tehdy, jestliže je vysvětlující proměnná kontinuální pokud je kategoriální, jde o ANOVA

KORELACE. Komentované řešení pomocí programu Statistica

Aplikovaná numerická matematika

Analytická geometrie lineárních útvarů

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Požadavky k opravným zkouškám z matematiky školní rok

5EN306 Aplikované kvantitativní metody I

z dat nasbíraných v letech Ke zpracování dat byl použit statistický software R. Základní model poptávkové funkce, ze kterého vycházíme,

UNIVERZITA PARDUBICE

Plánování experimentu

Maturitní otázky z předmětu MATEMATIKA

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Základy ekonometrie. XI. Vektorové autoregresní modely. Základy ekonometrie (ZAEK) XI. VAR modely Podzim / 28

Zákony hromadění chyb.

Korelační a regresní analýza

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Numerická stabilita algoritmů

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

Charakterizace rozdělení

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

UNIVERZITA PARDUBICE

PRAVDĚPODOBNOST A STATISTIKA

Teorie. Hinty. kunck6am

A0B01LAA Lineární algebra a aplikace (příklady na cvičení- řešení)

Ekonometrie. Jiří Neubauer

Matematika. ochrana životního prostředí analytická chemie chemická technologie Forma vzdělávání:

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Regresní a korelační analýza

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Kalibrace a limity její přesnosti

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie

MODELU A KOMPOZIČNÍHO MODELU PŘI ANALÝZE DAT

Úloha 1. Napište matici pro případ lineárního regresního spline vyjádřeného přes useknuté

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Metoda backward výběru proměnných v lineární regresi a její vlastnosti

(Cramerovo pravidlo, determinanty, inverzní matice)

Měření závislosti statistických dat

Pokročilé neparametrické metody. Klára Kubošová

Přijímací zkouška na navazující magisterské studium 2014

Transkript:

EKONOMICKÁ APLIKACE KOMPOZIČNÍHO REGRESNÍHO MODELU Klára Hrůzová 1,2, Karel Hron 1,2 1 Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, Univerzita Palackého v Olomouci 2 Katedra geoinformatiky, Přírodovědecká fakulta, Univerzita Palackého v Olomouci Robust 2014 19. 24. ledna 2014, Jetřichovice

Obsah 1 Kompoziční regresní model 2 Biologická aplikace 3 Ekonomická aplikace 4 Výhody kompozičního regresního modelu

Dvousložková kompozice x = (x, c x), kde c je konstanta součtu základní operace Aitchisonovy geometrie speciálně pro takto nadefinované kompozice: Perturbace: x y = C(xy, (c x)(c y)); Mocninná transformace: α x = C(x α, (c x) α ); Skalární součin: x A = 1 ln x 2 c x ; Vzdálenost: d A (x, y) = 1 ln x 2 c x ln y c y, kde x = (x, c x), y = (y, c y), α je reálná konstanta a C označuje operaci uzávěru.

Regresní model Pro kompoziční data můžeme zavést regresní model (resp. v nejjednodušším případě analogii regresní přímky) užitím Aitchisonovy geometrie: y i = β 0 β 1 x i ε i, i = 1,..., r, (1) s kompozičním regresním parametrem β 0, skalárním parametrem β 1 a kompoziční chybou ε i.

Izometrická logratio transformace Pro dvousložkovou kompozici definujeme ilr transformaci ve tvaru: x = ilr(x) = 1 x ln 2 c x. (2) transformace je proporcionální k logitové transformaci metodika logratio souřadnic umožňuje aplikovat standardní statistické metody a předpokládat normalitu souřadnic [Egozcue et al.2011]

Regresní přímka y i = β 0 + β 1 x i + ε i, i = 1,..., r, kde neznámé parametry β 0, β 1 odhadujeme metodou nejmenších čtverců.

Statistické inference Za předpokladu normality závisle proměnné y y (x ) je konfidenční interval pro střední hodnotu y v x definován jako [ 1 ŷ (x ) ± t 1 α/2,r 2 s 2 r + (x x ) 2 ] r i=1 (x i x ) 2 se spolehlivostí (1 α). Predikční interval pro y ŷ (x ) ± t 1 α/2,r 2 s 2 [ 1 + 1 r + (x x ) 2 r i=1 (x i x ) 2 ].

Fitované hodnoty Fitované hodnoty pro původní kompozici y i získáme aplikací inverzní ilr transformace c exp ( 2ŷi ) ŷ i = ilr 1 (ŷ i ) = 1 + exp ( 2ŷ i ). (3)

Concentration-response models odhad ekologického rizika z chemického znečištění na základě koncentrace toxické látky x i (v mg/l) měříme proporci odezvy p i, kde (0 < p i < 1) logaritmická transformace koncentrace (x i )

Modely používané nyní model v základním tvaru: y i = f (x i, β) + ε i, i = 1,..., r, (4) kde funkce f (x i, β) reprezentuje průměr reakcí nejužívanější regresní funkce f Model (RM) Regression function f (xi, β) Logit (L) exp(β 0 +β 1 xi ) 1+exp(β 0 +β 1 xi ) Probit (P) Φ (β 0 + β 1 xi ( ) ) β2 exp(β 0 +β 1 xi Generalized Logit (GL) ) 1+exp(β 0 +β 1 xi ) Weibull (W) exp ( exp (β 0 + β 1 xi ))

Užití kompozičního modelu x i = 1 2 ln p i = 1 2 ln x i ; 10 6 x i p i 1 p i ; aplikace regresní přímky užití inverzní ilr transformace pro zobrazení dat v původním prostoru

proportion of inhibited 0.0 0.2 0.4 0.6 0.8 1.0 simplicial regr.line conf.bounds pred.bounds 6 7 8 9 10 11 lnx

Odhad efektivní koncentrace EC P odhad míry koncentrace, při které bychom dosáhli P = 100 p%-ního efektu pro P = 5% spočítáme ilr souřadnice p 5 = 1 2 log 0.05 0.95 odpovídající odhad ilr koncentrace EC 5 získáme aplikací fitované regresní přímky ÊC 5 = 1 β 1 (p 5 β 0), (5) výsledná koncentrace EC 5 je získána užitím inverzní ilr transformace ( 2 ) ÊC 5 = ilr 1 (ÊC 1 exp ÊC 5 5 ) = ( 2 ) (6) 1 + exp ÊC 5

konfidenční interval můžeme získat užitím teorie kalibrace v lineárních regresních modelech: x + d 1 EC 5 x + d 2, kde d 1 a d 2 jsou kořeny kvadratické rovnice [ ] d 2 β 1 2 t2 1 α/2,r 2 s2 r i=1 (x i x 2d ) β 2 1 (p5 p )+ ( + [(p 5 p ) 2 t 21 α/2,r 2 s2 1 + 1 )] = 0. r

po nějakém počítání dostaneme konfidenční intervaly pro EC5 ve formě { EC5 x + (p5 p ) β 1 ± ±t 1 α/2,r 2 s [ (p 5 p ) 2 r i=1 (x i x ) 2 + kde H = β 2 1 t 1 α/2,r 2s 2 r i=1 (x i x ) 2. ( 1 + 1 ) ] 1/2 H r /H,

Ekonomická aplikace data různorodá a charakterizovaná odlišným způsobem jejich získání důležitý je trend ve vztahu mezi oběma proměnnými a signifikantnost parametru β 1

Ekonomický příklad závislost relativních výdajů na potraviny (v % na celkových rodinných výdajích) na výši nezaměstnanosti můžeme hovořit o existenci rostoucího trendu hypotézu o normalitě pro standardizovaná rezidua nebylo možné zamítnout na hladině 0,05 žádným z užitých testů (Shapiro-Wilk, Anderson-Darling, Kolmogorov-Smirnov) test nulovosti koeficientu u lineární složky regresní funkce aplikací standardní T 1 statistiky (pro ilr souřadnice) p-hodnota (0,0089) svědčí ve prospěch alternativy na standardní hladině 0,05 se zvyšující se nezaměstnaností roste relativní podíl výdajů na potraviny

5 10 15 20 25 10 15 20 25 30 35 40 45 % nezamestnanosti podíl výdaju na potraviny vzhledem k celkovým výdajum v % 2.0 1.8 1.6 1.4 1.2 1.0 0.8 1.5 1.0 0.5 ilr(% nezamestnanosti) ilr(podíl výdaju na potraviny vzhledem k celkovým výdajum v %) Obr.3: Obrázek znázorňuje závislost relativních podílů výdajů na potraviny na nezaměstnanosti pro původní data (vlevo) a ilr souřadnice (vpravo).

Výhody kompozičního regresního modelu zachovává kompoziční charakter závisle i nezávisle proměnných (vyjádřených v procentech, proporcích,atd.) jednoduchý model s dobrou interpretací výsledků z regresní přímky můžeme odvodit odpovídající statistické inference (konfidenční a predikční interval) dobré interpolační vlastnosti modelu logratio metoda umožňuje zavést předpoklad normality

Reference Egozcue, J. J., J. Daunis-i-Estadella, V. Pawlowsky-Glahn, K. Hron and P. Filzmoser (2011). Simplicial regression. The normal model. Journal of Applied Probability and Statistics 6 (1-2), pp. 87 108. Egozcue, J.J., V. Pawlowsky-Glahn, G. Mateu-Figueras and C. Barceló-Vidal (2003). Isometric logratio transformations for compositional data analysis. Mathematical Geology 35 (3), pp. 279 300. Monti, G.S., S. Migliorati, K. Hron, K. Hrůzová and E. Fišerová (2013). Log-ratio approach in curve fitting for concentration-response experiments. Environmental and Ecological Statistics (in approve).