Ústav matematiky a statistiky Masarykova univerzita Brno. workshopy Finanční matematika v praxi III Matematické modely a aplikace Podlesí

Podobné dokumenty
Neparametrické odhady podmíněné rizikové funkce

PRAVDĚPODOBNOST A STATISTIKA

u Pacova Metoda pro validaci koncentrace přízemního ozónu kontinuálně měřené na Atmosférické 1 / 23sta

Pravděpodobnost a statistika I KMA/K413

KMA/P506 Pravděpodobnost a statistika KMA/P507 Statistika na PC

Téma 22. Ondřej Nývlt

n = 2 Sdružená distribuční funkce (joint d.f.) n. vektoru F (x, y) = P (X x, Y y)

Návrhy experimentů v neparametrické regresi

Statistika II. Jiří Neubauer

LWS při heteroskedasticitě

PRAVDĚPODOBNOST A STATISTIKA

Statistické metody v digitálním zpracování obrazu. Jindřich Soukup 3. února 2012

MATEMATICKÁ STATISTIKA - XP01MST

Prostorová variabilita

Četba: Texty o lineární algebře (odkazy na webových stránkách přednášejícího).

Odhady Parametrů Lineární Regrese

PRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady

AVDAT Klasický lineární model, metoda nejmenších

Regresní a korelační analýza

1 Rozptyl a kovariance

Inovace bakalářského studijního oboru Aplikovaná chemie

Pravděpodobnost a aplikovaná statistika

4EK201 Matematické modelování. 11. Ekonometrie

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

dat Robust ledna 2018

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

4EK211 Základy ekonometrie

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

AVDAT Náhodný vektor, mnohorozměrné rozdělení

Výběrové charakteristiky a jejich rozdělení

I. D i s k r é t n í r o z d ě l e n í

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

p(x) = P (X = x), x R,

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu.

Poznámky k předmětu Aplikovaná statistika, 4. téma

PRAVDĚPODOBNOST A STATISTIKA

Teorie náhodných matic aneb tak trochu jiná statistika

ACTA UNIVERSITATIS AGRICULTURAE ET SILVICULTURAE MENDELIANAE BRUNENSIS SBORNÍK MENDELOVY ZEMĚDĚLSKÉ A LESNICKÉ UNIVERZITY V BRNĚ

Poznámky k předmětu Aplikovaná statistika, 4. téma

Regresní analýza 1. Regresní analýza

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Stochastické diferenciální rovnice

Odhad stavu matematického modelu křižovatek

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

Kontingenční tabulky, korelační koeficienty

Apriorní rozdělení. Jan Kracík.

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

NEPARAMETRICKÁ DISKRIMINAČNÍ ANALÝZA

AVDAT Nelineární regresní model

Testování hypotéz o parametrech regresního modelu

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

Eva Fišerová a Karel Hron. Katedra matematické analýzy a aplikací matematiky Přírodovědecká fakulta Univerzity Palackého v Olomouci.

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

PRAVDĚPODOBNOST A STATISTIKA. Odhady parametrů Postačující statistiky

Testování hypotéz o parametrech regresního modelu

4. Aplikace matematiky v ekonomii

BAYESOVSKÉ ODHADY. Michal Friesl V NĚKTERÝCH MODELECH. Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni

Numerické metody optimalizace - úvod

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Bayesovské metody. Mnohorozměrná analýza dat

odpovídá jedna a jen jedna hodnota jiných

MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Fakt. Každou soustavu n lineárních ODR řádů n i lze eliminací převést ekvivalentně na jednu lineární ODR

Charakterizace rozdělení

PŘEDNÁŠKA 9 KŘIVKOVÝ A PLOŠNÝ INTEGRÁL 1. DRUHU

Základy teorie odhadu parametrů bodový odhad

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

6. Lineární regresní modely

Statistická analýza dat

MATEMATIKA III. Olga Majlingová. Učební text pro prezenční studium. Předběžná verze

LDF MENDELU. Simona Fišnarová (MENDELU) LDR druhého řádu VMAT, IMT 1 / 22

Úloha 1. Napište matici pro případ lineárního regresního spline vyjádřeného přes useknuté

Aplikovaná numerická matematika

Zadání Máme data hdp.wf1, která najdete zde: Bodová předpověď: Intervalová předpověď:

Vlastní (charakteristická) čísla a vlastní (charakteristické) Pro zadanou čtvercovou matici A budeme řešit maticovou

Pravděpodobnost a statistika (BI-PST) Cvičení č. 7

Kapitola 11: Lineární diferenciální rovnice 1/15

NÁHODNÝ VEKTOR. 4. cvičení

You created this PDF from an application that is not licensed to print to novapdf printer (

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

4EK211 Základy ekonometrie

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

Interpolační funkce. Lineární interpolace

Neparametrické odhady hustoty pravděpodobnosti

naopak více variant odpovědí, bude otázka hodnocena jako nesprávně zodpovězená.

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

Matematika 2 LS 2012/13. Prezentace vznikla na základě učebního textu, jehož autorem je doc. RNDr. Mirko Rokyta, CSc. J. Stebel Matematika 2

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

Matematika 1A. PetrSalačaJiříHozman Fakulta přírodovědně-humanitní a pedagogická Technická univerzita v Liberci

Příklady ke čtvrtému testu - Pravděpodobnost

Optimalizace provozních podmínek. Eva Jarošová

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Klasická a robustní ortogonální regrese mezi složkami kompozice

6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový.

Transkript:

Ústav matematiky a statistiky Masarykova univerzita Brno workshopy Finanční matematika v praxi III Matematické modely a aplikace Podlesí 3. 6. září 2013

Obsah 1 2 3 4

y Motivace y 10 0 10 20 30 40 0 5 10 x 0.15 0.10 est 0.05 0.00 40 30 20 10 0 10 0 5 x 10

Konstrukce jádrových odhadů podmíněné hustoty 0.00 0.04 0.08 0.12 0.00 0.04 0.08 0.12 0 2 4 6 0 2 4 6

Konstrukce jádrových odhadů podmíněné hustoty 0.00 0.04 0.08 0.12 0.00 0.04 0.08 0.12 0 2 4 6 0 2 4 6

Jádro Definition Reálná funkce K splňující 1 K Lip[ 1, 1], tj. K(x) K(y) L x y, x, y [ 1, 1], L > 0, 2 supp(k) = [ 1, 1], 3 momentové podmínky: 1 1 j = 0, x j K(x) dx = 0 j = 1, 1 β 2 0 j = 2 se nazývá jádro řádu 2.

Jádro Epanechnikov kernel Gaussian kernel 0.0 0.2 0.4 0.6 0.8 0.0 0.2 0.4 0.6 0.8 2 1 0 1 2 3 2 1 0 1 2 3

Podmíněná hustota Nechť X R je náhodná veličina a h(x) její hustota, Y R náhodná veličina a f (x, y) sdružená hustota náhodného vektoru (X, Y ). Podmíněná hustota Y (X = x) je definována f (y x) = Jádrový odhad marginální hustoty: f (x, y) h(x). ĥ(x) = 1 nh x n ( ) x Xi K i=1 h x (1) Jádrový odhad sdružené hustoty: f (x, y) = 1 nh x h y n ( x Xi K i=1 h x ) K ( ) y Yi h y (2)

Nadaraya-Watsonův odhad podmíněné hustoty Jádrový odhad podmíněné hustoty náhodné veličiny Y (X = x) je definován ˆf NW (y x) = 1 n ( ) y Yi w i (x)k, (3) h y h y kde w i (x) = i=1 K( x X i ) h x n j=1 K ( x X j h x ) je váhová funkce. Odhad se nazývá Nadaraya-Watsonův odhad podmíněné hustoty. (4)

Míra kvality odhadu f (y x) vyhlazovací matice H = ( ) hx 0 0 h y vyhlazovací parametry h x, h y určují vyhlazení ve směru x a y

Míra kvality odhadu f (y x) y y y vyhlazovací matice H = ( ) hx 0 0 h y vyhlazovací parametry h x, h y určují vyhlazení ve směru x a y Oversmoothing Optimal Undesmoothing x x x

Míra kvality odhadu f (y x) MISE: Mean Integrated Square Error } } 2 MISE { f (y x) = E { f (y x) f (y x) h(x) dx dy AMISE: Asymptotic Mean Integrated Square Error AMISE {ˆfNW (y x) } = c 1 nh x h y c 2 nh x + c 3 h 4 x + c 4 h 4 y + c 5 h 2 xh 2 y optimální šířka vyhlazovacích parametrů: (h x, h y ) = arg min AMISE (h x,h y ) H

Metody volby vyhlazovacích parametrů metody kombinující metody pro odhad parametrů regrese a hustoty pro hustotu: cross-validace, metoda referenční hustoty pro regresi: cross-validace, metoda penalizačních funkcí metoda referenční hustoty předpoklad normálního rozložení podmíněné hustoty f (y x) = 1 2π(p + qx) e 1 2 ( y a bx p+qx předpoklad normální nebo rovnoměrně spojité marginální hustoty cross-validace n n CV (h x, h y ) = 1 ˆf i (y X n i ) 2 dy 2 ˆf n i (Y i X i ) i=1 metoda penalizačních funkcí bootstrap i=1 ) 2.

Iterační metoda vyhlazovací parametry dány minimalizací } } } AMISE { f (y x) = AIV { f (y x) + AISB { f (y x) namísto vztahu } } AIV { f (y x) = 2AISB { f (y x) (5) závisejícího na neznámé hustotě budeme uvažovat } } ÂIV { f (y x) = { f 2ÎSB (y x) (6)

Iterační metoda } } ÂIV { f (y x) = {ˆf 2ÎSB (y x), kde } ÂIV { f (y x) = c 1, c 1 = nh x h y } { 1 ÎSB {ˆf (y x) = h y 1 h y R 2 (K) dx a R(K) = K 2 (x) dx ( ) ( ) (K K) x Xi h x (K K) y Yi h y i ( (K K) x Xi ( ) K x Xi h x K i i ( ) K x Xi h x i ( ) y Yi h y h x ) } 2 h(x) dx dy

Iterační metoda systém dvou nelineárních rovnic: ÂIV(ĥ x, ĥ y ) = 2ÎSB(ĥ x, ĥ y ) ĥ y = ĉĥ x

Reálná data: gejzír Old Faithful 299 pozorování erupcí gejzíru Old Faithful, Yellowstonský národní park, Wyoming, USA, 1989 1990 2 proměnné: nezávislá proměnná: doba čekání do následující erupce [min] závislá proměnná: doba erupce [min] 50 60 70 80 90 100 110 1 2 3 4 5 waiting time duration time

Gejzír Old Faithful Iterative method Cross validation method eruption time 1 2 3 4 5 0.2 0.1 0.15 0.05 0.15 0.15 0.1 0.25 0.05 0.3 0.2 eruption time 1 2 3 4 5 0.02 0.03 0.04 0.04 0.03 0.02 0.02 50 60 70 80 90 100 110 duration time 50 60 70 80 90 100 110 duration time

Old Faithful geyser 50 60 70 80 90 100 110 1 2 3 4 5 Iterative method duration time eruption time 50 60 70 80 90 100 110 1 2 3 4 5 Cross validation method duration time eruption time

BASHTANNYK, D. M., HYNDMANN, R. J. Bandwidth Selection for Kernel Conditional Density Estimation. Computational Statistics & Data Analysis, 2001, Volume 36, Issue 3, Pages 279 298 DE GOOIJER, J. G., ZEROM, D. On Conditional Density Estimation. Statistica Neerlandica, Netherlands Society for Statistics and Operations Research, 2003, Volume 57, Issue 2, Pages 159 176 HANSEN, B. E. Nonparametric Conditional Density Estimation. 2004. [online][cit. leden 2012]. Dostupné z: http://www.ssc.wisc.edu/~bhansen/papers/ncde.pdf HYNDMAN, R. J., BASHTANNYK, D. M., GRUNWALD, G. K. Estimating and Visualising Conditional Densities. Journal of Computational and Graphical Statistics, 1996, Volume 5, Number 4, Pages 315 336

Děkuji za pozornost.