Ústav matematiky a statistiky Masarykova univerzita Brno. workshopy Finanční matematika v praxi III Matematické modely a aplikace Podlesí

Ústav matematiky a statistiky Masarykova univerzita Brno workshopy Finanční matematika v praxi III Matematické modely a aplikace Podlesí 3. 6. září 2013

Obsah 1 2 3 4

y Motivace y 10 0 10 20 30 40 0 5 10 x 0.15 0.10 est 0.05 0.00 40 30 20 10 0 10 0 5 x 10

Konstrukce jádrových odhadů podmíněné hustoty 0.00 0.04 0.08 0.12 0.00 0.04 0.08 0.12 0 2 4 6 0 2 4 6

Jádro Definition Reálná funkce K splňující 1 K Lip[ 1, 1], tj. K(x) K(y) L x y, x, y [ 1, 1], L > 0, 2 supp(k) = [ 1, 1], 3 momentové podmínky: 1 1 j = 0, x j K(x) dx = 0 j = 1, 1 β 2 0 j = 2 se nazývá jádro řádu 2.

Jádro Epanechnikov kernel Gaussian kernel 0.0 0.2 0.4 0.6 0.8 0.0 0.2 0.4 0.6 0.8 2 1 0 1 2 3 2 1 0 1 2 3

Podmíněná hustota Nechť X R je náhodná veličina a h(x) její hustota, Y R náhodná veličina a f (x, y) sdružená hustota náhodného vektoru (X, Y ). Podmíněná hustota Y (X = x) je definována f (y x) = Jádrový odhad marginální hustoty: f (x, y) h(x). ĥ(x) = 1 nh x n ( ) x Xi K i=1 h x (1) Jádrový odhad sdružené hustoty: f (x, y) = 1 nh x h y n ( x Xi K i=1 h x ) K ( ) y Yi h y (2)

Nadaraya-Watsonův odhad podmíněné hustoty Jádrový odhad podmíněné hustoty náhodné veličiny Y (X = x) je definován ˆf NW (y x) = 1 n ( ) y Yi w i (x)k, (3) h y h y kde w i (x) = i=1 K( x X i ) h x n j=1 K ( x X j h x ) je váhová funkce. Odhad se nazývá Nadaraya-Watsonův odhad podmíněné hustoty. (4)

Míra kvality odhadu f (y x) vyhlazovací matice H = ( ) hx 0 0 h y vyhlazovací parametry h x, h y určují vyhlazení ve směru x a y

Míra kvality odhadu f (y x) y y y vyhlazovací matice H = ( ) hx 0 0 h y vyhlazovací parametry h x, h y určují vyhlazení ve směru x a y Oversmoothing Optimal Undesmoothing x x x

Míra kvality odhadu f (y x) MISE: Mean Integrated Square Error } } 2 MISE { f (y x) = E { f (y x) f (y x) h(x) dx dy AMISE: Asymptotic Mean Integrated Square Error AMISE {ˆfNW (y x) } = c 1 nh x h y c 2 nh x + c 3 h 4 x + c 4 h 4 y + c 5 h 2 xh 2 y optimální šířka vyhlazovacích parametrů: (h x, h y ) = arg min AMISE (h x,h y ) H

Metody volby vyhlazovacích parametrů metody kombinující metody pro odhad parametrů regrese a hustoty pro hustotu: cross-validace, metoda referenční hustoty pro regresi: cross-validace, metoda penalizačních funkcí metoda referenční hustoty předpoklad normálního rozložení podmíněné hustoty f (y x) = 1 2π(p + qx) e 1 2 ( y a bx p+qx předpoklad normální nebo rovnoměrně spojité marginální hustoty cross-validace n n CV (h x, h y ) = 1 ˆf i (y X n i ) 2 dy 2 ˆf n i (Y i X i ) i=1 metoda penalizačních funkcí bootstrap i=1 ) 2.

Iterační metoda vyhlazovací parametry dány minimalizací } } } AMISE { f (y x) = AIV { f (y x) + AISB { f (y x) namísto vztahu } } AIV { f (y x) = 2AISB { f (y x) (5) závisejícího na neznámé hustotě budeme uvažovat } } ÂIV { f (y x) = { f 2ÎSB (y x) (6)

Iterační metoda } } ÂIV { f (y x) = {ˆf 2ÎSB (y x), kde } ÂIV { f (y x) = c 1, c 1 = nh x h y } { 1 ÎSB {ˆf (y x) = h y 1 h y R 2 (K) dx a R(K) = K 2 (x) dx ( ) ( ) (K K) x Xi h x (K K) y Yi h y i ( (K K) x Xi ( ) K x Xi h x K i i ( ) K x Xi h x i ( ) y Yi h y h x ) } 2 h(x) dx dy

Iterační metoda systém dvou nelineárních rovnic: ÂIV(ĥ x, ĥ y ) = 2ÎSB(ĥ x, ĥ y ) ĥ y = ĉĥ x

Reálná data: gejzír Old Faithful 299 pozorování erupcí gejzíru Old Faithful, Yellowstonský národní park, Wyoming, USA, 1989 1990 2 proměnné: nezávislá proměnná: doba čekání do následující erupce [min] závislá proměnná: doba erupce [min] 50 60 70 80 90 100 110 1 2 3 4 5 waiting time duration time

Gejzír Old Faithful Iterative method Cross validation method eruption time 1 2 3 4 5 0.2 0.1 0.15 0.05 0.15 0.15 0.1 0.25 0.05 0.3 0.2 eruption time 1 2 3 4 5 0.02 0.03 0.04 0.04 0.03 0.02 0.02 50 60 70 80 90 100 110 duration time 50 60 70 80 90 100 110 duration time

Old Faithful geyser 50 60 70 80 90 100 110 1 2 3 4 5 Iterative method duration time eruption time 50 60 70 80 90 100 110 1 2 3 4 5 Cross validation method duration time eruption time

BASHTANNYK, D. M., HYNDMANN, R. J. Bandwidth Selection for Kernel Conditional Density Estimation. Computational Statistics & Data Analysis, 2001, Volume 36, Issue 3, Pages 279 298 DE GOOIJER, J. G., ZEROM, D. On Conditional Density Estimation. Statistica Neerlandica, Netherlands Society for Statistics and Operations Research, 2003, Volume 57, Issue 2, Pages 159 176 HANSEN, B. E. Nonparametric Conditional Density Estimation. 2004. [online][cit. leden 2012]. Dostupné z: http://www.ssc.wisc.edu/~bhansen/papers/ncde.pdf HYNDMAN, R. J., BASHTANNYK, D. M., GRUNWALD, G. K. Estimating and Visualising Conditional Densities. Journal of Computational and Graphical Statistics, 1996, Volume 5, Number 4, Pages 315 336

Děkuji za pozornost.