VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FAKULTA STROJNÍHO INŽENÝRSTVÍ DISERTAČNÍ PRÁCE k získání akademického titulu Doktor (Ph. D.) ve studijním oboru MATEMATICKÉ INŽENÝRSTVÍ RNDr. Edita Kolářová Stochastické diferenciální rovnice v elektrotechnice Školitel: prof. RNDr. Jan Franců, CSc. Oponenti: Datum státní doktorské zkoušky: 1..5 Datum odevzdání práce:
Obsah 1 Úvod 3 1.1 Cíle, přínos a popis práce......................... 4 1. Základní symboly a značení....................... 6 Teorie stochastických diferenciálních rovnic 7.1 Úvod do teorie pravděpodobnosti.................... 7.1.1 Pravděpodobnostní prostor................... 7.1. Náhodná veličina, střední hodnota a nezávislost........ 9.1.3 Charakteristická funkce..................... 11.1.4 Stochastické procesy a podmíněná střední hodnota...... 1. Brownův pohyb a jeho vlastnosti.................... 13..1 Konstrukce Brownova pohybu.................. 14.. Vlastnosti Brownova pohybu.....................3 Martingaly a Markovovy procesy................ 3.3 Stochastický integrál........................... 4.3.1 Itôův integrál........................... 6.3. Itôova formule.......................... 8.4 Stochastické diferenciální rovnice.................... 31.4.1 Existence a jednoznačnost řešení................ 3.4. Některé typy rovnic a jejich metody řešení........... 36.5 Numerické řešení stochastických diferenciálních rovnic........ 38.5.1 Stochastická Eulerova metoda.................. 39.5. Stochastická Milsteinova metoda................ 4.5.3 Aproximace střední hodnoty stochastického řešení...... 4 3 Stochastické diferenciální rovnice v elektrotechnice 43 3.1 Deterministický model RL obvodu.................... 43 3. Stochastický model RL obvodu..................... 44 3..1 RL obvod se stochastickým zdrojem.............. 44 3.. RL obvod se stochastickým odporem.............. 46 3..3 RL obvod se stochastickým zdrojem i odporem........ 48 3.3 Dodatek Porovnání teoretických výsledků s experimentem..... 53 4 Závěr 55
Kapitola 1 Úvod Fyzikální jevy se obvykle modelují deterministicky, pomocí diferenciálních rovnic, které popisují průměrné chování systému. Pro úplnější informace o systému můžeme do modelu zahrnout náhodné vlivy. Tím vznikne nový matematický model, takzvaný stochastický. Takový model můžeme vytvořit buď přímo pro daný problém, nebo ho získat vhodnou úpravou klasického deterministického modelu. Během posledních 5 let se studium stochastických modelů vyvíjelo velmi intenzívně v řadě oborů. Vznikla potřeba uvažovat o náhodných vlivech také v inženýrských oborech. Jedna z technik stochastizace spočívá v tom, že v deterministickém matematickém modelu systému se jeden nebo více vstupních parametrů nahradí náhodnými procesy. Řešením výsledného modelu je opět náhodný proces. Uvažujme například obyčejnou diferenciální rovnici dx = a(t, x). dt Stochastickou verzi této rovnice můžeme získat přidáním dalšího členu b(t, X(t))ξ(t) do pravé strany rovnice d X(t) = a(t, X(t)) + b(t, X(t))ξ(t) dt kde symbol ξ(t) označuje stochastický proces nazývaný obvykle bílý šum. Řešením této rovnice bude náhodný proces X(t). Z matematického hlediska je tato rovnice problematická zejména proto, že bílý šum ξ(t) nemá spojité trajektorie. Je tedy potřeba tento model dále modifikovat. Vynásobme rovnici dt, dx(t) = a(t, X(t)) dt + b(t, X(t))ξ(t) dt a označme ξ(t) dt = dw (t). Tento člen budeme interpretovat jako přírůstek Wienerova procesu W (t). Tento proces, nazývaný také Brownův pohyb, hraje klíčovou roli ve stochastickém modelování. Dostali jsme se tak ke stochastické diferenciální rovnici dx(t) = a(t, X(t)) dt + b(t, X(t)) dw (t), 3
kterou ve skutečnosti chápeme jako integrální rovnici X(t) = X(t ) + t a(s, X(s)) ds + t b(s, X(s)) dw (s). V tomto tvaru stochastické diferenciální rovnice jsou na pravé straně dva různé druhy integrálů. Prvním je klasický Riemannův integrál, druhým je stochastický integrál podle dw (t). Wienerův proces je sice spojitý ale má nekonečnou variaci, proto v tomto případě nemůže jít o Riemann-Stieltjesův integrál. Stochastický integrál poprvé definoval Japonský matematik Itô ve 4-tých letech minulého století. Od něj pochází výše uvedený integrální tvar stochastické diferenciální rovnice, která se do té doby zkoumala jen heuristicky. Itô zavedl nový typ integrálu, Itôův stochastický integrál, a tím vybudoval matematický aparát pro studium stochastických diferenciálních rovnic. 1.1 Cíle, přínos a popis práce Tato práce má dva hlavní cíle. Prvním cílem je vytvořit ucelený přehled Itôova stochastického kalkulu. Druhým cílem je využít tuto teorii na řešení problémů z inženýrské praxe, na stochastické modely elektrických RL obvodů. Teorie stochastických diferenciálních rovnic je velice zajímavý, rychle se rozvíjející obor matematiky, který má širokou škálu aplikací také v inženýrské praxi. Studium matematické teorie stochastických diferenciálních rovnic předpokládá znalost mnoha oblastí matematiky, jako jsou pravděpodobnost, teorie míry, obyčejné diferenciální rovnice a funkcionální analýza. Jedním z našich cílů bylo shrnout teorii tak, aby byla čitelná a srozumitelná i pro studenty inženýrského studia. Základní studijní literaturou byla monografie Øksendal [1]. Tato monografie je sice úvodem do oboru, je ale hodně teoreticky orientována. Řada pojmů je přístupnější v učebním textu Evans [4]. Konkrétní metody pro řešení stochastických diferenciálních rovnic jsou rozpracovány v monografii Arnold [1]. Tato kniha je nejvhodnější pro inženýrskou praxi, ale neobsahuje teoretické základy. Numerické metody jsme čerpali z knih Kloeden [7] a Cyganowski [3]. V těžkých chvílích bylo osvěžením otevřít knihu Steele [9], která je zaměřená na aplikace ve finanční matematice a náročnou teorii vysvětluje přístupnou formou. Druhá kapitola poskytuje úvod do teorie stochastických diferenciálních rovnic. Začíná stručným shrnutím nezbytných znalostí z pravděpodobnosti. V této části důkazy tvrzení neuvádíme. Počínaje paragrafem. se už věnujeme nové teorii. Zde uvádíme většinu tvrzení i s důkazy, pouze velmi složité případně technicky náročné důkazy vynecháváme nebo uvádíme pouze myšlenku důkazu. Nejdříve zavedeme Brownův pohyb a ukážeme jeho konstrukci podle Ciesielskiho. Dále odvodíme jeho druhou variaci a další vlastnosti Brownova pohybu. Dalším krokem je zavedení stochastického integrálu. 4
Naši pozornost soustředíme na Itôův kalkulus, ale ukážeme i rozdíl mezi Itôovým a Stratonovičovým přístupem. Dokážeme také pravidlo pro derivování složené funkce, Itôovu formuli. Od paragrafu.4 se věnujeme stochastickým diferenciálním rovnicím. Uvedeme podmínky pro existenci a jednoznačnost řešení. Ukážeme některé typy rovnic a metody řešení, které později využijeme v aplikacích. Na konci této kapitoly se zabýváme numerickými metodami pro stochastické diferenciální rovnice, které jsou pro aplikace v inženýrské praxi nezbytné. Pomocí těchto metod můžeme simulovat analytické řešení anebo získat řešení stochastické diferenciální rovnice, kde analytické řešení neumíme najít. Uvádíme dvě konkrétní metody, Eulerovu a Milsteinovu. Eulerova metoda pro stochastické diferenciální rovnice je odvozená ze stejnojmenné metody pro obyčejné diferenciální rovnice. Milsteinova metoda byla vytvořená přímo pro stochastické diferenciální rovnice. Třetí kapitola se zabývá aplikacemi teorie na elektrické obvody. Matematickým modelem jednoduchého elektrického RL obvodu je obyčejná lineární diferenciální rovnice prvního řádu. V této části práce ukážeme stochastizaci rovnice sériového elektrického RL obvodu, kde se náhodný člen objeví buď na pravé straně rovnice nebo u některého z koeficientů. Uvažujeme také rovnici se dvěma náhodnými koeficienty. Ve všech případech odvodíme analytické řešení pomocí Itôovy formule a pomocí numerické simulace vygenerujeme několik trajektorií řešení. Najdeme intervaly, kde se s velkou pravděpodobnosti nacházejí trajektorie stochastického řešení. Numerické simulace jsou naprogramovány v jazyce C#. Jde o nový, objektově orientovaný jazyk systému MS.Network. Využíváme knihovnu LinAlg, která umožňuje vektorové programování a má širokou škálu možnosti pro práci s maticemi. Na konci kapitoly uvádíme popis pokusu ve kterém jsme na konkrétním RL obvodu se zašuměným zdrojem změřili hodnoty proudu. Potvrdilo se, že naměřené hodnoty se nachází v intervalu získaném na základě teoretických výsledků. Jedním z přínosů této práce je vytvoření co nejvíce vyváženého textu, který zpřístupňuje hlubokou matematickou teorii zájemcům o její aplikace, především inženýrům. Dalším přínosem je implementace numerických schémat pro řešení stochastických rovnic do jazyku C#. Hlavním přínosem práce je z matematického hlediska kompletní řešení RL obvodu pomocí stochastického kalkulu. Našli jsme jak analytické, tak i numerické řešeni stochastického modelu obvodu se dvěma náhodnými parametry. Vyšetřili jsme statistické vlastnosti řešení a našli oblasti, kde se řešení nachází se zadanou pravděpodobností. 5
1. Základní symboly a značení R množina reálných čísel B Borelovská σ-algebra na množině R (Ω, A, P ) pravděpodobnostní prostor E[X] střední hodnota náhodné veličiny X V [X] rozptyl náhodné veličiny X E[X H] podmíněná střední hodnota náhodné veličiny X vzhledem k σ-algebře H N(m, σ ) normální rozdělení se střední hodnotou m a s rozptylem σ W (t), W (t, ω) Wienerův proces na pravděpodobnostním prostoru (Ω, A, P ) F t σ-algebra generovaná W (s), s t na (Ω, A, P ) F M t σ-algebra generovaná procesem (W 1 (s),..., W M (s)), s t T T A dw (t) Itôův integrál z A(t, ω) na intervalu (, T ) B dw (t) Stratonovičův integrál z B(t, ω) na intervalu (, T ) L p (, T ), 1 p prostor reálných procesů G(t, ω) na prostoru (Ω, A, P ) dle definice.3.3 6
Kapitola Teorie stochastických diferenciálních rovnic.1 Úvod do teorie pravděpodobnosti.1.1 Pravděpodobnostní prostor Definice.1.1. Systém podmnožin A dané množiny Ω se nazývá σ-algebra, jestliže platí: (i) A, (ii) A A A C A, kde A C = Ω\A, (iii) A 1, A,... A A i A. i=1 Definice.1.. Je-li A σ-algebra na Ω, potom dvojice (Ω, A) se nazývá měřitelný prostor. Množinová funkce P definovaná na σ-algebře A se nazývá pravděpodobnostní míra, jestliže 1. P ( ) =, P (Ω) = 1. P (A) pro každé A A 3. Pro A i A, kde A i Aj = je - li i j, platí P ( A i ) = i=1 P (A i ). i=1 Trojice (Ω, A, P ) se nazývá pravděpodobnostní prostor. Definice.1.3. Nechť U je systém podmnožin množiny Ω. Potom nejmenší σ- algebru, která obsahuje U, nazýváme σ-algebrou generovanou U a značíme G U. G U = { G; G je σ algebra na Ω, U G}. 7
Je-li Ω = R n a U je systém všech otevřených podmnožin R n, potom σ-algebru generovanou U nazýváme Borelovskou σ-algebrou na Ω, a označujeme B. Množiny B B nazýváme borelovské množiny. Poznámka. Nechť je f nezáporná integrovatelná funkce na R n pro kterou je f dx = 1. Pro každou borelovskou množinu B B definujeme R n P (B) = f dx. Potom (R n, B, P ) je pravděpodobnostní prostor. Funkce f se nazývá hustota pravděpodobnostní míry P. Příklad.1.4. Nechť z R n je pevně daný bod. Definujeme pro každou borelovskou množinu B B { 1 pokud z B, P (B) := pokud z / B. Potom (R n, B, P ) je pravděpodobnostní prostor. Míra P se nazývá Diracova míra soustředěná do bodu z. Píšeme P = δ z. Příklad.1.5. Wienerova míra. Uvažujme množinu Ω := {ω :, ) R, ω() =, ω spojitá funkce. } Nechť jsou dané hodnoty = t < t 1 <... < t k a intervaly (a i, b i ) pro i = 1,..., k. Potom pro množinu definujeme pravděpodobnost P (A) := b1 a 1... bk a k B A := {ω Ω a i < ω(t i ) < b i, i = 1,..., k} (.1) p(t 1,, x 1 ) p(t t 1, x 1, x )... p(t k t k 1, x k 1, x k ) dx 1... dx k kde p(t, x, y) = 1 πt e x y t, x, y R, t >. Wiener dokázal, že zobrazení P lze rozšířit na pravděpodobnostní míru na σ-algebře generované všemi množinami typu (.1). Poznámka. Obvykle se pokládá p(, x, y) = δ x (y). Poznámka. množině Wienerovu míru můžeme definovat i ve vícerozměrném prostoru na Ω := {ω :, ) R n, ω() =, ω spojitá funkce }. 8
V tomto případě je p(t, x, y) = (πt) n e x y t, x, y R n, t >. Příslušnou σ-algebru generují množiny typu A := {ω Ω ω(t 1 ) F 1, ω(t ) F,..., ω(t k ) F k, i = 1,..., k} kde = t < t 1 <... < t k jsou reálná čísla a F 1,..., F k R n, otevřené množiny. P (A) = p(t 1,, x 1 ) p(t t 1, x 1, x )... p(t k t k 1, x k 1, x k ) dx 1... dx k. F 1... F k.1. Náhodná veličina, střední hodnota a nezávislost Definice.1.6. Nechť (Ω, A, P ) je pravděpodobnostní prostor. Zobrazení X : Ω R n, n 1 se nazývá náhodná veličina, jestliže pro každé B B je X 1 (B) A. Poznámka. Náhodná veličina X je P -měřitelná funkce z (Ω, A, P ) do (R n, B). Definice.1.7. Nechť X : Ω R n, n 1 je náhodná veličina. Potom systém množin G(X) := {X 1 (B) B B } tvoří σ-algebru na Ω, které říkáme σ-algebra generovaná X. Věta.1.8. Nechť X, Y : Ω R n jsou dvě funkce, potom Y je G(X)- měřitelná právě když existuje borelovsky měřitelná funkce g : R n R n taková, že Y = g(x). Definice.1.9. Každá náhodná veličina na X : Ω R n na pravděpodobnostním prostoru (Ω, A, P ) indukuje pravděpodobnostní míru µ X na R n definovanou předpisem µ X (B) = P (X 1 (B)). Míra µ X se nazývá rozdělení náhodné veličiny X. Definice.1.1. Jestliže X(ω) dp (ω) <, potom číslo Ω E[X] := X(ω) dp (ω) = x dµ X (x) Ω R n se nazývá střední hodnota X (vzhledem k P ). 9
Poznámka. Obecněji, je-li funkce f : R n R a f(x(ω)) dp (ω) <, potom Ω E[f(X)] := f(x(ω)) dp (ω) = f(x) dµ X (x). Ω R n Definice.1.11. V [X] := Ω X E[X] dp = E[ X ] E[X] se nazývá rozptyl náhodné veličiny X (vzhledem k P ). Věta.1.1. (Čebyševova nerovnost.) Nechť X : Ω R je náhodná veličina s konečnou střední hodnotou m a konečným rozptylem σ. Pak pro libovolné c > platí nerovnost P ( X m c σ) 1 c. Příklad.1.13. Náhodná veličina X : Ω R má normální rozdělení N(m, σ ), jestliže P [X B] = 1 σ e (x m) σ dx, π kde m a σ jsou konstanty, σ >, a B R je Borelovská množina. V tomto případě platí E[X] = m a V [X] = σ. Definice.1.14. Dvě množiny A, B A se nazývají nezávislé jestliže platí P (A B) = P (A) P (B). Soubor H = {H i ; i I} systémů měřitelných množin je nezávislý jestliže platí P (H i1... H ik ) = P (H i1 )... P (H ik ) pro libovolnou volbu H i1 H i1,..., H ik H ik s navzájem různými indexy i 1,..., i k. Systém náhodných veličin X i, i I je nezávislý, jestliže soubor σ-algeber G Xi generovaných X i tvoří nezávislý systém. Věta.1.15. Nechť X, Y : Ω R jsou dvě nezávislé náhodné veličiny, pro které E[ X ] < a E[ Y ] <. Potom E[XY ] = E[X]E[Y ] a V [X + Y ] = V [X] + V [Y ]. Věta.1.16. Nechť X, Y : Ω R jsou dvě náhodné veličiny s normálním rozdělením. Potom platí, že X, Y jsou nezávislé E[(X E[X])(Y E[Y ])] =. 1 B
Věta.1.17. ( Borel-Cantelliho lemma.) Nechť (Ω, A, P ) je pravděpodobnostní prostor a nechť A 1,..., A n,... A. Potom (i) P ( A m ) = jestliže P (A n ) < n=1 m=n (ii) P ( n=1 m=n A m ) = 1 jestliže n=1 P (A n ) = a A n jsou nezávislé. n=1 Definice.1.18. Nechť (Ω, A, P ) je pravděpodobnostní prostor. Říkáme, že posloupnost náhodných veličin {X k } k=1 konverguje v Lp k náhodné veličině X : Ω R, jestliže [ ] lim E X k X p =. k Pro p = 1 mluvíme o konvergeci ve smyslu středů a v případě p = o konvergeci ve smyslu kvadratických středů..1.3 Charakteristická funkce Definice.1.19. Nechť X je n-rozměrná náhodná veličina. Potom funkce φ X (λ) := E[e iλ X ] λ R n se nazývá charakteristická funkce X. Příklad.1.. Nechť je X náhodná veličina s rozdělením N(, 1). Potom φ X (λ) := e λ Je-li X náhodná veličina s rozdělením N(m, σ ), potom φ X (λ) := e imλ λ σ. Věta.1.1. Jestliže X 1,..., X n jsou nezávislé náhodné veličiny, potom φ X1 +...+X n (λ) := Π n j=1φ j X (λ) λ Rn. Věta.1.. Nechť X je jednorozměrná náhodná veličina. Potom E[X k ] = 1 i k φ(k) (). Věta.1.3. Charakteristická funkce jednoznačně určuje rozložení náhodné veličiny. 11
.1.4 Stochastické procesy a podmíněná střední hodnota Definice.1.4. Nechť (Ω, A, P ) je pravděpodobnostní prostor a T R je interval. Systém náhodných veličin {X(t) t T } se nazývá stochastický proces. Poznámka. Nejčastěji máme T =<, ) a díváme se na parametr t jako na čas. Pro pevné ω Ω dostaneme funkci t X(t, ω); t T kterou nazveme trajektorií X(t). Je možné ztotožnit ω s trajektorií t X(t, ω), tzn. s funkcí T R n. V tomto případě považujeme Ω za podmnožinu prostoru Ω = (R n ) T - prostoru všech funkcí z T do R n. Potom σ-algebra A bude obsahovat σ-algebru B generovanou množinami typu {ω ω(t 1 ) F 1,..., ω(t k ) F k }, F i R n borelovská. Můžeme se tedy dívat na stochastický proces jako na pravděpodobnostní míru P definovanou na prostoru ((R n ) T, B). Definice.1.5. Řikáme, že stochastický proces {Y (t) t < } na pravděpodobnostním prostoru (Ω, A, P ) je Gaussův proces, jestliže pro libovolnou posloupnost t 1 < t <... < t k má vektor (Y (t 1 ),... Y (t k )) multidimenzionální normální rozdělení. Definice.1.6. Nechť (Ω, A, P ) je pravděpodobnostní prostor a A, B A a P (B) >. Potom vzorec P (A B) P (A B) := P (B) definuje podmíněnou pravděpodobnost jevu A za předpokladu B. Poznámka. Podmíněná pravděpodobnost jevu A za předpokladu B je vlastně pravděpodobnost jevu A B v novém prostoru, kdy se díváme na množinu B jako na pravděpodobnostní prostor s mírou P = P. Označme tento prostor (B, Ã, P ), P (B) kde à je σ-algebra A zúžená na množinu B. Je-li X : Ω R n náhodná veličina na (Ω, A, P ) potom bude X B náhodná veličina na (B, Ã, P ) a můžeme mluvit o tzv. podmíněné střední hodnotě E[X B] = X d P = 1 X dp. P (B) B B 1
Mějme teď náhodné veličiny X(ω), Y (ω), E[X] <. Chtěli bychom znát podmíněnou střední hodnotu veličiny X za předpokladu Y. E[X Y ] už nemůže být číslo, ale náhodná veličina a její hodnoty závisí na G(Y ) σ-algebře generované Y, nezávisí přímo na funkčních hodnotách funkce Y. Tyto úvahy jsou východiskem k obecné definici podmíněné střední hodnoty. Definice.1.7. Nechť je X náhodná veličina na (Ω, A, P ), E[X] <, a nechť H je σ-algebra H A. Podmíněnou střední hodnotu veličiny X vzhledem k H rozumíme náhodnou veličinu E[X H] která je 1. měřitelná vzhledem k H. X dp = E[X H] dp pro H H. H H Věta.1.8. Nechť je (Ω, A, P ) pravděpodobnostní prostor, H A je σ-algebra na tomto prostoru a X, Y : Ω R n, E[X] <, E[Y ] < jsou dvě náhodné veličiny. Potom (i) E[aX + by H] = ae[x H] + be[y H] pro a, b R (ii) E[E[X H]] = E[X] (iii) E[X H] = X je-li X H- měřitelná (iv) E[X H] = E[X] je-li X nezávislá na H. (v) Je-li H = A potom E[X H] = X (vi)je-li X Y potom E[X H] E[Y H] (vii) E[XY H] = X E[Y H] je-li X H- měřitelná. Věta.1.9. Nechť F a H jsou σ-algebry, takové že F H. Potom E[X F] = E[E[X H] F]. Věta.1.3. (Jensenova nerovnost.) Nechť φ : R R je konvexní funkce a E[ φ(x) ] <, potom φ(e[x H]) E[φ(X) H]. Poznámka. (Důsledky Jensenovy nerovnosti) (i) E[X H] E[ X H] (ii) E[X H] E[ X H].. Brownův pohyb a jeho vlastnosti Brownův pohyb - matematický model pohybu částice v tekutině - je důležitým příkladem náhodného procesu, který hraje klíčovou roli v teorii stochastických diferenciálních rovnic. Matematická teorie Brownova pohybu byla započata Wienerem (r. 193), který rozložení pravděpodobnosti procesu Brownova pohybu chápal jako míru v prostoru spojitých funkcí. Proto se tento proces nazývá také Wienerův proces. 13
Definice..1. Reálný stochastický proces W (t) na pravděpodobnostním prostoru (Ω, A, P ) se nazývá Brownův pohyb nebo Wienerův proces, jestliže platí 1. W () = skoro všude. W (t) W (s) má N(, t s) rozdělení pro t s 3. pro libovolná < t 1 < t... < t n jsou přírůstky W (t 1 ), W (t ) W (t 1 ), W (t 3 ) W (t ),..., W (t n ) W (t n 1 ) vzájemně nezávislé náhodné veličiny. Poznámka. Platí, že (i) E[W (t)] = pro t >. (ii) E[W (t)] = t. Poznámka. Wienerův proces představuje integrál toho, co se v praktických aplikacích nazývá bílým šumem. Věta... Nechť W (t) je Wienerův proces. Potom Důkaz: Nechť t s. Potom E[W (t)w (s)] = min{t, s} pro t, s. E[W (t)w (s)] = E[(W (s) + W (t) W (s))w (s)] = = E[W (s) ] + E[(W (t) W (s))w (s)] = = s + E[W (t) W (s)] }{{} =..1 Konstrukce Brownova pohybu E[W (s)] = s = min{t, s}. }{{} = Konstrukci Brownova pohybu provedeme podle Z. Ciesielskiho. Nejprve se omezíme na t, 1. Definice..3. Pro t, 1 definujeme Haarovy funkce {h k ( )} k= takto: h (t) := 1 pro t, 1. { 1 pro t, 1 h 1 (t) := 1 pro t ( 1, 1 14
Pro n k < n+1, n = 1,,..., definujeme n/ k pro n t k n +1/ n n h k (t) := n/ k pro n +1/ < t k n +1 n n jinde. Věta..4. Haarovy funkce tvoří úplný ortonormální systém v prostoru L (, 1 ) - funkcí integrovatelných s kvadrátem na intervalu, 1. Důkaz: Platí 1 h (s) ds = Obecně 1 h k(s) ds = 1 k n +1/ n h 1(s) ds = 1 k n n n ds + Dále pro l > k máme buď h k h l = nebo 1 1 1 ds + k n +1 n 1 ds = 1 1 1 ( 1) ds = 1 k n +1/ n n ds = n 1 h k (s)h l (s) ds = ± n/ h l (s) ds =. ( 1 + 1 ) = 1. n+1 n+1 Nechť pro f L (, 1 ) je 1 f(s)h k(s) ds = pro každé k =, 1,.... Abychom dokázali úplnost, ukážeme, že potom f = s.v. Máme 1 f(s)h (s) ds = 1 f(s) ds =. a také 1 f(s)h 1 (s) ds =. Z těchto dvou vztahů dostaneme 1 f(s) ds = 1 1 f(s) ds =. Přidáme-li vztahy 1 f(s)h (s) ds = a 1 f(s)h 3(s) ds = dostaneme 1 4 f(s) ds = 1 1 4 f(s) ds = a 3 4 1 f(s) ds = 1 3 4 f(s) ds =. 15
Budeme-li v tomto postupu pokračovat, dostaneme pro každé k < n+1, že k+1 n+1 f(s) ds =. k n+1 Diadická racionální čísla tvoří hustou podmnožinu intervalu, 1 a tak můžeme psát, že p f(s) ds = pro libovolné r p 1. Ale r f(t) = d dt f(s) ds = pro s. v. t. Dokázali jsme tedy, že Haarovy funkce tvoří úplný ortonormální systém. Definice..5. Pro k = 1,,... definujeme k-tou Schauderovu funkci vztahem s k (t) := h k (s) ds pro t, 1. Poznámka. Grafy Schauderovy funkce mají tvar rovnoramenného trojúhelníku o výšce n 1, ležícího nad intervalem k n, k n +1. n n n 1 - - - - - - - - - - - - - - - - - - - - - - - k n k n +1 n n Věta..6. Nechť {a k } k=1 je posloupnost reálných čísel, δ < 1/ a nechť platí a k = O(k δ ) pro k. Potom řada a k s k (t) konverguje stejnoměrně pro t 1. k=1 Důkaz: Položme Zvolme si ε >. Pro n k < n+1 mají funkce s k ( ) disjunktní nosiče. b n := max a k C( n+1 ) δ. n k < n+1 16
Potom pro t 1 a pro m dostatečně velké platí C k= m a k s k (t) n=m b n max n k < n+1 t 1 s k (t) ( n+1 ) δ n/ 1 = C (δ 1) n(δ 1/) < ε. n=m Věta..7. Nechť jsou {A k } k=1 nezávislé náhodné veličiny s rozdělením N(, 1). Potom pro skoro všechna ω platí, že Důkaz: Pro x >, k =,..., máme n=m A k = O( log k) pro k. P ( A k > x) = 1 x e s 1 ds + e s ds = π π π e x 4 π e s 4 x x ds C e x 4 pro nějakou konstantu C. Položme x = 4 log k. Potom Protože řada k=1 1 k 4 P ( A k > 4 log k) C e 4 log k = C 1 k 4. x e s konverguje, z Borel-Cantelliho lemmatu dostaneme, že P ( A k > 4 log k pro nekonečně mnoho k) =. Poznámka. Z této věty speciálně vyplývá, že posloupnost {A k } k=1 nezávislých N(, 1) náhodných veličin splňuje předpoklady věty..6. Věta..8. Pro s, t 1 je součet k=1 s k(s)s k (t) = min(s, t). Důkaz: Definujme pro s 1 funkci { 1 pro τ s ϕ s (τ) := pro s < τ 1. Protože Haarovy funkce tvoří úplný ortonormální systém, můžeme psát pro s t kde a k = 1 ϕ t h k dτ = s = 1 ϕ t ϕ s dτ = h k dτ = s k (t), b k = 17 a k b k, k=1 1 ϕ s h k dτ = s ds h k dτ = s k (s).
Věta..9. Nechť {A k } k=1 je posloupnost nezávislých náhodných veličin s rozdělením N(, 1), definovaných na daném pravděpodobnostním prostoru. Potom součet W (t, ω) := A k (ω)s k (t), t 1 k=1 konverguje stejnoměrně v t pro s.v. ω. Navíc (i) W ( ) je Brownův pohyb a (ii) trajektorie procesu t W (t, ω) jsou spojité pro s. v. ω. Důkaz: Stejnoměrná konvergence řady vyplývá z vět..6 a..7 a ze stejnoměrné konvergence spojitých funkcí vyplývá, že trajektorie procesu t W (t, ω) jsou spojité pro s. v. ω. Musíme dokázat, že W ( ) je Brownův pohyb. Je zřejmé, že W () = s.v. Teď dokážeme, že pro s t 1 mají přírůstky W (t) W (s) rozdělení N(, t s). Platí E[e iλ(w (t) W (s)) ] = E[e iλ k=1 A k(ω)(s k (t) s k (s)) ] = Π k=1e[e iλa k(s k (t) s k (s)) ] (z nezávislosti) = Π k=1e λ (s k(t) s k (s)) (z N(, 1) rozdělení A k ) = e λ k=1 (s k(t) s k (s)) = e λ k=1 s k (t) s k(t)s k (s)+s k (s) = e λ (t s+s) (z věty..8) = e λ (t s). Z jednoznačnosti charakteristické funkce vyplývá, že proces W (t) W (s) má rozdělení N(, t s). Zbývá ještě dokázat, že pro libovolná < t 1 < t <... < t n jsou přírůstky W (t 1 ), W (t ) W (t 1 ),..., W (t n ) W (t n 1 ) vzájemně nezávislé náhodné veličiny. Protože mají normální rozložení, stačí dokázat, že E[ (W (t i+1 ) W (t i )) (W (t j+1 ) W (t j )) ] =. Nejdříve spočítáme E[W (t)w (s)]. [ E[W (t)w (s)] = E A k (ω)s k (t) k=1 ] A l (ω)s l (s) l=1 18
[ ] = E A k (ω)a l (ω)s k (t)s l (s) = k,l=1 = E[ A k(ω) ]s k (t)s k (s) + E[A k (ω)a l (ω)]s k (t)s l (s) = k=1 k,l=1,k l = s k (t)s k (s) = min(s, t), k=1 protože A k jsou navzájem nezávislé N(, 1) náhodné veličiny. Bez újmy na obecnosti můžeme předpokládat, že t i < t j a máme E[ (W (t i+1 ) W (t i )) (W (t j+1 ) W (t j )) ] = E[ W (t i+1 )W (t j+1 ) W (t i )W (t j+1 ) W (t i+1 )W (t j ) + W (t j )W (t i ) ] = t i+1 t i t i+1 + t i =. Věta..1. Existence Brownova pohybu. Nechť (Ω, U, P) je pravděpodobnostní prostor na kterém je definováno spočetně mnoho nezávislých N(, 1) náhodných veličin {A n } n=1. Potom existuje jednorozměrný Brownův pohyb W ( ) definovaný pro ω Ω, t. Trajektorie Brownova pohybu 19
Důkaz: Dle předcházející věty zkonstruujeme Brownův pohyb pro t 1. Přeznačováním indexů N(, 1) náhodných veličin dostaneme spočetně mnoho tříd spočetně mnoha náhodných veličin a tak můžeme sestrojit spočetně mnoho nezávislých Brownových pohybů W n (t) pro t 1. Pak definujeme Brownův pohyb pro t vztahem W (t) := W (n 1) + W n (t (n 1)) pro n 1 t n. Poznámka. Uvedeme příklad pravděpodobnostního prostoru na kterém je definováno spočetně mnoho nezávislých N(, 1) náhodných veličin. Nechť Ω = prostor posloupnosti reálných čísel (x 1, x...) }{{} ω Nechť U je σ-algebra generovaná množinami typu A := {ω Ω a k < x k < b k, k = 1,..., m; a k b k }. Pro takové množiny A definujeme pravděpodobnost předpisem P (A) := m k=1 1 π bk a k e x dx. Tuto pravděpodobnost rozšíříme na všechny množiny z U a definujeme A n (ω) = x n pro ω = (x 1, x,...). Potom {A n } n=1 jsou nezávislé N(, 1) náhodné veličiny... Vlastnosti Brownova pohybu Věta..11. Nechť je W (t) Brownův pohyb na prostoru (Ω, A, P ). Potom proces (i) W (t + t) W (t ) je Brownův pohyb pro t >. (ii) c W (t/c ) je Brownův pohyb pro c >. Důkaz: (i) Definujme W (t) := W (t + t) W (t ). Potom W () = a nezávislost přírůstků plyne z nezávislosti přírůstků Brownova pohybu. Pomocí charakteristické funkce dokážeme, že W (t) W (s) je N(, t s). E[e iλ( W (t) W (s)) ] = E[e iλ(w (t +t) W (t ) W (t +s)+w (t )) ] = = E[e iλ(w (t +t) W (t +s)) ] = e λ (t +t (t +s)) = e λ (t s). (ii) Definujme Ŵ (t) := c W (t/c ). Potom Ŵ () = a podobně jako v (i) máme nezávislost přírůstků a z charakteristické funkce, že Ŵ (t) Ŵ (s) je N(, t s) : E[e iλ(ŵ (t) Ŵ (s)) ] = E[e i λ c(w (t/c ) W (s/c )) ] = e λ c ( t s c ) = e λ (t s).
Poznámka. Pomocí této věty se dají dokázat některé další důležité vlastnosti Brownova pohybu. Věta..1. Pro každé t platí, že trajektorie Brownova pohybu nemá skoro jistě derivaci v bodě t. Důkaz: Dokážeme, že skoro jistě nemá trajektorie Brownova pohybu derivaci v bodě. Obecné tvrzení pro t plyne z toho, že proces W (t) := W (t +t) W (t ) je také Brownův pohyb. Důkaz provedeme sporem. Předpokládejme, že existuje derivace v bodě. Potom existuje číslo A < a ε >, že Vezmeme si takové číslo A pevné. Potom W (t) < At pro každé < t < ε. P ( At < W (t) < At) = 1 πt At Po substituci x = ty dostaneme, že dx = t dy a P ( At < W (t) < At) = = 1 A π 1/t A t A πt At A e x t dx. e y t t dy = e y 1/t dy pro t. Právě jsme dokázali, že pro A pevné je W (t) < At pro každé < t ε s pravděpodobnosti. Tímto způsobem můžeme odvodit pro každé A = n, že W (t) < nt pro každé < t ε s pravděpodobnosti. Ale sjednocení spočetně mnoho množin míry je množina míry. Tak W (t) nemá derivaci v bodě t = s pravděpodobnosti 1. Poznámka. Dá se dokázat i silnější tvrzení, že s pravděpodobností 1 nejsou trajektorie Brownova pohybu diferencovatelné v žádném bodě. Důkaz tohoto tvrzení pochází od Dvoretzky, Erdős a Kakutani, a je možné ho najít v [8]. Poznámka. Velice jednoduché je dokázat, že W (t) nemá derivaci v bodě t > ve smyslu kvadratických středů: [ (W ) ] (t + h) W (t) E = E [ (W (t + h) W (t)) ] = 1 h h h. 1
Věta..13. Nechť je W (t) Brownův pohyb. Potom (i) E[W (t)] = t. Důkaz: (i) W (t) je N(, t) a proto E[W (t)] = t. (ii) E[W 4 (t)] = 3t. (ii) E[W 4 (t)] vypočítáme přímo z definice. Při výpočtu použijeme dvakrát per partes a dostaneme E[W 4 (t)] = 1 x 4 e x t dx = 3t. πt Věta..14. (i) Nechť W (t) je Brownův pohyb na intervalu, t a nechť symbol δ n := { = t < t 1... < t n = t} značí dělení tohoto intervalu. Potom pro δ n := max k n 1 t k+1 t k platí R n 1 (W (t k+1 ) W (t k )) t k= ve smyslu kvadratických středů. Jinými slovy Brownův pohyb W (t) má kvadratickou variaci rovnu t. (ii) Trajektorie Brownova pohybu mají na každém intervalu nekonečnou variaci. Důkaz: (i) Chceme dokázat, že ( ) E ( W k ) t pro t k. t k <t Definujeme dělení intervalu = t < t 1 = t < t n = t <... < t n n = t a W k = W k+1 W k. Potom t k = t. n ( n 1 ) ( n 1 ( E ( W k ) t = E ( W k ) n) ) t = E [( n 1 k,j= + k= k= ( ( W k ) t ) ( ( W j ) t n n) )] n 1 = n 1 k, j = k j k= [ E ( W k ) t ] [ E ( W j ) t ] n n }{{} = E [(( W k ) 4 tn ( W k) + t (z nezávislosti ) = n )] + = n 1 k= E [ ( W k ) 4] n 1 k= t n E [ ( W k ) ] n 1 + k= t n =
n 1 = k= 3 t n t n n 1 k= t n + n t n = 3 t n t n + t n = t n pro n. (ii) Funkce s konečnou variací mají kvadratickou variaci rovnou nule. Toto tvrzení je tedy přímým důsledkem (i). Definice..15. n- rozměrným Brownovým pohybem se rozumí vektorový proces W(t) := (W 1 (t),..., W n (t)) t jehož složky tvoří n vzájemně nezávislých Brownových pohybů...3 Martingaly a Markovovy procesy Definice..16. Systém σ-algeber M = {M t, t T } na pravděpodobnostním prostoru (Ω, A, P ) se nazývá filtrace, pokud pro každé t T je M t A a M s M t pro s < t, s, t T. Definice..17. Náhodný proces M = {M(t), t T } se nazývá martingalem vzhledem k filtraci M = {M t, t T }, když E[M(t)] <, t T a E[M(t) M s ] = M(s), t s, t, s T. Poznámka. Pojem martingalu pochází z teorie hazardních her. Popisuje spravedlivou hru, při níž očekávaná hodnota výhry je rovná částce, kterou hráč musí za účast ve hře zaplatit. Důležitost martingalu v matematické teorii stochastických procesů vyplývá z následující věty: Věta..18. Nechť proces M = {M(t), t } je spojitým martingalem na (Ω, A, P ). Potom pro každé p 1, T a λ > platí tzv. Doobova martingalová nerovnost: ( ) P sup M(t) λ 1 t T λ E [ M(T p ) p ]. Definice..19. Nechť W (t) je Brownův pohyb na prostoru (Ω, A, P ). Filtrace F = {F t, t } se nazývá historie Brownova pohybu, jestliže pro t > je F t σ-algebra generovaná náhodnými veličinami W (s, ω), s t. Poznámka. Filtrace F = {F t, t } popisuje růst informace pozorovatele o trajektorii Brownova pohybu v závislosti na čase. Věta... Brownův pohyb W (t) je martingalem vzhledem k své filtraci F = {F t, t } 3
Důkaz: E[W (t) F s ] = E[W (t) W (s) + W (s) F s ] = = E[W (t) W (s) F s ] + E[W (s) F s ] = + W (s) = W (s), t s, t, s T. Využili jsme toho, že náhodná veličina W (t) W (s) je nezávislá na σ-algebře F s a proto E[W (t) W (s) F s ] = E[W (t) W (s)] =, a náhodná veličina W (s) je F s - měřitelná a proto E[W (s) F s ] = W (s) (viz větu 1.4.8). Věta..1. (Markovova vlastnost) Nechť je W (t) Brownův pohyb, a nechť F = {F t, t } je historie Brownova pohybu. Pro s > definujme proces W (t) := W (t + s) W (s) a nechť F označuje historii W (t). Potom pro každé t > jsou σ-algebry F s a F t nezávislé. Důkaz: Proces W (t) je Brownův pohyb a má nezávislé přírůstky stejně jako proces W (t). Definujme množiny a B := A := n {W (s j ) W (s j 1 ) x j } F s j=1 m {W (t j + s) W (t j 1 + s) y j } F t. j=1 Množiny A a B jsou nezávislé a množiny typu A generují F a množiny typu B generují F. Poznámka. Procesy mající Markovovu vlastnost se nazývají Markovovy procesy. Věta tedy říká, že Brownův pohyb je Markovovův proces..3 Stochastický integrál Nechť je W (t) Brownův pohyb na prostoru (Ω, A, P ). Chceme definovat stochastický integrál T f(s, ω) dw (s, ω) pro vhodnou náhodnou funkci f(s, ω). Předpokládejme zatím, že f je spojitá v s pro každé ω Ω. Riemann-Stieltjesův integrál použít nemůžeme, protože proces W (t) nemá konečnou variaci. 4
Příklad.3.1. Mějme interval, T, a mějme dělení tohoto intervalu δ n := { = t < t 1... < t n = T }, δ n := max k n 1 t k+1 t k. Pro pevné λ 1 a dělení δ n intervalu, T položme a definujme τ k := (1 λ)t k + λt k+1 (k =,..., n 1) n 1 R n = R n (δ n, λ, ω) := W (τ k, ω)(w (t k+1, ω) W (t k, ω)). k= To jsou odpovídající Riemannovy součty pro T W (s, ω) dw (s, ω). Pro jednoduchost zápisu vynecháme ω a spočítáme R = lim R n pro pevné λ a pro lim δ n =. n n Nejdřív upravíme součin (zkráceně budeme psát ±A namísto +A A ) Dále W (τ k )(W (t k+1 ) W (t k )) = W (τ k )W (t k+1 ) W (τ k )W (t k ) = = W (τ k )W (t k+1 ) ± 1 W (τ k ) ± 1 W (t k ) ± 1 W (t k+1 ) + W (τ k )W (t k ) = = 1 [W (t k+1) W (τ k )] + 1 [W (τ k) W (t k )] + 1 [W (t k+1 ) W (t k )] n 1 R n = W (τ k )(W (t k+1 ) W (t k )) = k= = 1 n 1 [W (t k+1 ) W (τ k )] + 1 n 1 [W (τ k ) W (t k )] + 1 n 1 [W (t k+1 ) W (t k )] = k= k= k= = 1 (1 λ)t + 1 λt + 1 (W (T ) W ()) = W (T ) + (λ 1 )T. Poznámka. Vidíme, že tento součet závisí na volbě λ. Zvolíme-li za λ =, dostaneme tzv. Itôův integrál T W dw = W (T ) pro λ = 1/ dostaneme tzv. Stratonovičův integrál T T, W dw = W (T ). 5
.3.1 Itôův integrál Definice.3.. Nechť je W (t, ω) Brownův pohyb na prostoru (Ω, A, P ) a nechť filtrace F značí historii Brownova pohybu. Říkáme, že proces {G(t, ω), t, )} je souhlasný s F, jestliže pro každé t je funkce ω G(t, ω) F t - měřitelná. Definice.3.3. Označme L p (, T ), T >, 1 p < prostor reálných procesů G(t, ω) na prostoru (Ω, A, P ) takových, že (i) {G(t, ω), t, T )} je souhlasný s F, (ii) (t, ω) G(t, ω) je B F- měřitelná, kde B je Borelovská σ-algebra na, T ), [ ] T (iii) E Gp (t, ω) dt <. Definice.3.4. Proces S L (, T ) se nazývá jednoduchá funkce, jestliže existuje dělení δ := { = t < t 1... < t m = T }, že S(t, ω) = S k (ω) pro t k t < t k+1 (k =,..., m 1). Poznámka. Každá funkce S k je F tk - měřitelná. Definice.3.5. Nechť S L (, T ) je jednoduchá funkce. Pak T S dw = m 1 k= se nazývá Itôův integrál funkce S na (, T ). S k (ω)(w (t k+1, ω) W (t k, ω)) Věta.3.6. (Itôova izometrie) Nechť S L (, T ) je jednoduchá, omezená funkce. Potom [ ( T ) ] [ T ] E S(t, ω) dw (t, ω) = E S (t, ω) dt. Důkaz: Označme W j = W (t j+1, ω) W (t j, ω). [ ( T ) ] ( m 1 ) E S dw = E S j W j = = E [ m 1 j= S j ( W j ) + m 1 i,j=,i<j j= S i S j W i W j ] = 6
= m 1 E [ Sj Wj m 1 = j= j= E[S j ] E[ W j ] = j m 1 ] + i,j=,i<j E[S i S j W i ]E[ W j ] = [ T E[Sj ] (t j+1 t j ) = E S dt ]. Věta.3.7. Nechť je G L (, T ). Potom existuje posloupnost jednoduchých funkcí S n L (, T ), taková, že [ T ] E (G(t, ω) S n (t, ω)) dt pro n. Definujeme Itôův integrál funkce G na (, T ) předpisem T T G(t, ω) dw (t, ω) = lim S n (t, ω) dw (t, ω). n Tato limita existuje a nezávisí na volbě posloupnosti S n. Navíc platí Itôova izometrie [ ( T ) ] [ T ] E G(t, ω) dw (t, ω) = E G (t, ω) dt. Důkaz: Prostor jednoduchých funkci tvoří hustou podmnožinu prostoru L (, T ) a proto můžeme pomocí Itôovy izometrie rozšířit definici Itôova integrálu na všechny funkce G L (, T ). Přesný důkaz neuvádíme, pouze popíšeme myšlenku důkazu. Nejdříve uvažujme případ, kdy funkce G(t) L (, T ) je spojitá funkce pro skoro všechna ω. Definujeme posloupnost jednoduchých funkci ( n ) n S k (t) := G pro k k t < n + 1, n =,..., celá část (kt ). k Obecně, pro G(t) L (, T ) definujeme G m (t) := me m(s t) G(s) ds pro s.v. ω. Funkce G m (t) L (, T ) a jsou spojitá pro s. v. ω a T G m(t) G(t) dt s.v. Teď můžeme aproximovat funkce G m (t) jednoduchými funkcemi dle popsaného návodu. Věta.3.8. Nechť F, G L (, T ). Potom 1. T (a G + b F ) dw = a T G dw + b T F dw pro a, b R [ ] T. E G dw = 3. T G dw je F T měřitelná. 7
Důkaz: Je zřejmé, že věta platí pro jednoduché funkce z L (, T ) a limitním přechodem dostaneme tvrzení. Věta.3.9. Pro G L (, T ) označme Potom (i.) I(t) je martingalem vzhledem k F t. I(t) := G(s, ω) dw (s, ω), t T. (ii.) Existuje t-spojitá verze I(t). Důkaz tohoto tvrzení neuvádíme. Je možné ho najít v [1] na stranách 31-33..3. Itôova formule Definice.3.1. Nechť je W (t) Brownův pohyb na prostoru (Ω, A, P ) a nechť X(t, ω) je stochastický proces na prostoru (Ω, A, P ), t >. Říkáme, že X(t, ω) je Itôův proces, jestliže X(t, ω) = X(, ω) + U(s, ω) ds + kde U L 1 (, t), V L (, t) a X(, ω) je F měřitelná. V (s, ω) dw (s, ω), Poznámka. Stručně říkáme, že X má stochastický diferenciál dx(t) = U dt + V dw (t). Věta.3.11. (Itôova formule) Nechť X(t) má stochastický diferenciál na intervalu, t dx(t) = U dt + V dw (t). Nechť g(t, x) : (, ) R R je dvakrát spojitě diferencovatelná funkce. Potom je také Itôův proces, a Y (t) = g(t, X(t)) dy (t) = g g (t, X(t)) dt + t x (t, X(t)) dx(t) + 1 kde ( dx(t)) = ( dx(t)) ( dx(t)) se počítá podle pravidel g x (t, X(t))( dx(t)), dt dt = dt dw (t) = dw (t) dt =, dw (t) dw (t) = dt. Důkaz: Nejdříve ukážeme, že Y (t) je Itôův proces. U každé funkce počítáme hodnotu v bodě (t, X(t)). Předpokládejme, že platí vzorec dy (t) = g t dt + g x dx(t) + 1 a dosaďme do tohoto vzorce dx(t) = U dt + V dw (t). 8 g x ( dx(t)),
dy (t) = g t dt+ g x (U dt+v dw (t))+1 ( g g x (U dt+v dw (t)) = t + g ) x U + g x V dw (t) + 1 g ( U ( dt) + UV dt dw (t) + V ( dw (t)) ) = x ( g = t + g x U + 1 ) g x V dt + g }{{ x V dw (t). }}{{} U V Ukázali jsme, že Y má stochastický diferenciál dy (t) = U dt + V dw (t). Pro důkaz tvrzení, že dy (t) = g g dt + dx(t) + 1 g ( dx(t)), použijeme Taylorův rozvoj funkce Y (t) = g(t, X(t)). Bez újmy na obecnosti můžeme předpokládat, t x x že funkce g, g a g jsou omezené. Obecnou, dvakrát spojitě diferencovatelnou t x x funkci g můžeme aproximovat posloupností funkcí g n, které jsou omezené a mají omezené i příslušné derivace. Budeme také předpokládat, že funkce U a V jsou jednoduché funkce. Mějme { = t < t 1... < t n = t} dělení intervalu, t. Tam, kde argument neuvádíme, počítáme hodnotu dané funkce v bodě (t j, X(t j )). Dle Taylorova vzorce + 1 g(t, X(t)) = g(, X()) + j j g t ( t j) + j g x t t j X j + 1 g = g(, X()) + j j g x ( X j) + j g t t j + j g x X j+ dt o ( ( dt) + ( X j ) ), kde t j = t j+1 t j, X j = X(t j+1 ) X(t j ), g = g(t j+1, X(t j+1 )) g(t j, X(t j )). Jestliže t j, potom máme podobně j g t t j = j j g t (t j, X(t j )) t j g t x X g j (s, X(s)) dx(s). x g (s, X(s)) ds t Předpokládáme, že funkce U a V jsou jednoduché funkce, tedy j g x ( X j) = j g x U j ( t j ) + j g x U jv j ( t j )( W j )+ j kde U j = U(t j ), V j = V (t j ) a W j = W (t j+1 ) W (t j ). 9 g x V j ( W j ),
První dva členy konverguji k nule při t j ve smyslu kvadratických středů: ( ) E g x U j ( t j ) = [ ( ) ] g E x U j ( t j ) 4 pro t j. j j ( ) E g x U jv j ( t j )( W j ) = j j Zbývá dokázat, že j E [ ( ) ] g x U jv j ( t j ) 3 pro t j. g t x V j ( W j ) g x V ds pro t j. Pro zjednodušení zápisu zavedeme nové označení a uvažujme ( E A j ( W j ) j j A(t) = g ( ) t, X(t) V (t), A x j = A(t j ), ) A j t j = i,j E [ A i A j (( W i ) t i )(( W j ) t j ) ]. Pro i < j jsou A i A j (( W i ) t i ) a ( W j ) t j nezávislé a proto v tomto případě střední hodnota tohoto součinu se rovná součinu středních hodnot a to se rovná nule. Podobně můžeme uvažovat i v případě kdy i > j. Tak nám zůstává E [ A j(( W j ) t j ) ] = E [ ] [ A j E (( Wj ) 4 ( W j ) t j + ( t j ) ) ] j j = j E [ ] A j (3( tj ) ( t j ) +( t j ) ) = j E [ A j] (( tj ) ) pro t j. Jinými slovy jsme právě dokázali, že A j ( W j ) j což je vlastně vztah, který zkráceně píšeme A(s) ds pro t j, ( dw (t)) = dt. Z toho vztahu také vyplývá, že j o (( t j) + ( X j ) ) pro t j. Tím je dokázaná Itôova formule. 3
Věta.3.1. (Multidimensionální Itôova formule) Nechť W(t, ω) = (W 1 (t, ω),..., W M (t, ω)) označuje M-dimensionální Wienerův proces a nechť stochastický proces X(t, ω) = (X 1 (t, ω),..., X N (t, ω)) je N-dimenzionální Itôův proces dx(t, ω) = X(, ω) + U(s, ω) ds + M j=1 V j (s, ω) dw j (s, ω) kde U, V jsou vektorové funkce, jejichž složky splňují podmínky z definice.3.1. Nechť g(t, x) : (, ) R N R P je dvakrát spojitě differencovatelná funkce. Potom Y(t) = g(t, X(t)) = (g 1 (t, X(t)),..., g P (t, X(t))) je stochastický proces, jehož k tá složka je dána rovnicí dy k = g k t (t, X) dt + i kde dx i dx j se počítá podle pravidel g k (t, X) dx i + 1 x i i,j g k x i x j (t, X)( dx i )( dx j ), dt dt = dt dw i = dw i dt =, dw i dw j = δ i,j dt..4 Stochastické diferenciální rovnice Uvažujme prostor (Ω, A, P ) s neklesající soustavou σ-algeber F = {F t, t }, na kterém je definován Wienerův proces W (t) vzhledem k F. Předpokládejme, že každé F t obsahuje všechny P nulové množiny z A. Budeme se zabývat stochastickými diferenciálními rovnicemi na intervalu, T, < T <. Itôovou stochastickou diferenciální rovnici (Itô SDR) rozumíme rovnici dx(t) = A(t, X(t)) dt + B(t, X(t)) dw (t), X(t ) = X kde funkce A :, T R R se nazývá koeficient driftu a funkce B :, T R R se nazývá difuzní koeficient. Itô SDR je ve skutečnosti integrální rovnice X(t) = X + t A(s, X(s)) ds + t B(s, X(s)) dw (s), kde první integrál je Lebesgueův a druhý integrál je Itôův. 31
Když v stochastické diferenciální rovnici uvažujeme na místo Itôova integrálu Stratonovičův, dostaneme Stratonovičovu stochastickou diferenciální rovnici (Stratonovič SDR), kterou můžeme symbolicky zapsat takto: dx(t) = A(t, X(t)) dt + B(t, X(t)) dw (t), X(t ) = X. Integrální interpretace této rovnice je X(t) = X + t A(s, X(s)) ds + t B(s, X(s)) dw (s), kde první integrál je Lebesgueův a druhý integrál je Stratonovičův. Itô SDR a Stratonovič SDR se stejnými koeficienty nedají obecně stejná řešení. Platí však, že řešení X(t) Itô SDR X(t) = X + t A(s, X(s)) ds + splňuje modifikovanou Stratonovič SDR X(t) = X + t A(s, X(s)) ds + kde koeficient A(t, X(t)) = A(t, X(t)) 1 t B(s, X(s)) dw (s), t B(s, X(s)) dw (s), B(t, X(t)) B (t, x). x.4.1 Existence a jednoznačnost řešení Definice.4.1. Nechť W(t) = (W 1 (t),..., W M (t)) značí M-dimensionalní Wienerův proces a funkce A :, T R N R N, B :, T R N R N M jsou měřitelné. Říkáme, že na intervalu, T je proces X(t) = (X 1 (t),..., X N (t)) silným řešením stochastické diferenciální rovnice dx(t) = A(t, X(t)) dt + B(t, X(t)) dw(t), X() = X jestliže proces X(t) je souhlasný s F M a pro všechna t, T X(t) = X + A(s, X(s)) ds + B(s, X(s)) dw(s) Poznámka. Symbolem F M jsme označujeme σ-algebru generovanou procesem W(t) = (W 1 (t),..., W M (t)). Věta.4.. Nechť je T >, proces W(t) je M-dimensionální Wienerův proces a funkce A :, T R N R N, B :, T R N R N M jsou měřitelné, pro které platí: 3 s.v.
(i) Existuje konstanta K > taková, že A(t, x) A(t, y) + B(t, x) B(t, y) K x y pro každé t, T a x,y R N. (ii) Existuje konstanta L > taková, že pro každé t, T a x R. A(t, x) + B(t, x) L(1 + x ) (iii) X je F M -měřitelná náhodná veličina a E [ X ] <. Potom stochastická diferenciální rovnice dx(t) = A(t, X(t)) dt + B(t, X(t)) dw(t), X() = X má jednoznačné t-spojité silné řešení X(t), pro které [ T ] E X(t) dt <. Poznámka. Ve (iii) můžeme nahradit podmínku F M že X je nezávislá na F M. -měřitelnosti X podmínkou, Důkaz: Nejdříve dokážeme jednoznačnost. Nechť procesy X(t) a X(t) jsou dvě silná řešení. X(t) X(t) = A(s, X(s)) A(s, X(s)) ds + Z nerovnosti (a + b) a + b dostaneme E[ X(t) X(t) ] E [ +E [ Dle Cauchy-Schwartzovy nerovnosti platí, že E [ A(s, X(s)) A(s, X(s)) ds B(s, X(s)) B(s, X(s)) dw(s) A(s, X(s)) A(s, X(s)) ] ds + B(s, X(s)) B(s, X(s)) ] dw(s). ( A(s, X(s)) A(s, X(s)) ] [ ds t E 33 ) ( ) ds A(s, X(s)) A(s, X(s)) ds, ] A(s, X(s)) A(s, X(s)) ds.
Na druhý sčítanec použijeme Itôovou izometrii. Přidáme-li podmínku (i.) dostaneme [ ] E[ X(t) X(t) ] t E A(s, X(s)) A(s, X(s)) ds + [ +E B(s, X(s)) B(s, X(s)) ] d(s) C E[ X(s) X(s) ] ds. Existuje tedy kladná konstanta C > taková, že funkce v(t) = E[ X(t) X(t) ] splňuje nerovnost v(t) C v(s) ds <. Z Gronwallova lematu dostaneme, že v(t) = E[ X(t) X(t) ] =. Uvážíme-li navíc, že řešení jsou spojitá, dostaneme X(t) = X(t) s.v. pro každé t, T. Ukázali jsme, že ( P X(t) X(t) ) = pro všechna t, T = 1. Teď dokážeme existenci řešení metodou Picardových aproximací podobně jako se dokazuje existence řešení obyčejných diferenciálních rovnic. Definujme pro n =, 1,... X n+1 (t) := X + pro t, T. Definujme také X (t) := X A(s, X n (s)) ds + d n (t) = E [ X n+1 (t) X n (t) ]. Tvrdíme, že pro každé n =, 1,... a t, T platí d n (t) (Mt)n+1 (n + 1)!, B(s, X n (s)) dw(s), kde konstanta M závisí na X a na konstantách z podmínek věty. Toto tvrzení dokážeme indukcí: Pro n = zřejmě platí = E [ E [ d (t) = E [ X 1 (t) X (t) ] = A(s, X (s)) ds + ] [ L(1 + X (s) ) ds + E B(s, X (s)) dw(s) ] ] B(s, X (s)) ds [ ] [ E L(1 + X ) t ] ds + E L (1 + X ) ds Mt, pro M > 4L (1 + X ). 34
Teď předpokládejme, že tvrzení platí pro n 1 a odhadneme d n (t), podobně jako v důkazu jednoznačnosti. E [ E [ d n (t) = E [ X n+1 (t) X n (t) ] = A(s, X n (s)) A(s, X n 1 (s)) ds + B(s, X n (s)) B(s, X n 1 (s)) dw(s) ] [ K(X n (s) X n 1 (s)) ds + K E X n (s) X n 1 (s) ] ds [ X T K E n (s) X n 1 (s) ] [ X ds + K E n (s) X n 1 (s) ] ds K (Ms) n (1 + T ) n! za předpokladu, že M K (1 + T ). Dále odhadneme ds (Mt)n+1 (n + 1)!, sup X n+1 (t) X n (t) T A(s, X n (s)) A(s, X n 1 (s)) ds t T + sup t T B(s, X n (s)) B(s, X n 1 (s)) dw(s). Použijeme již dokázanou nerovnost, Doobovu martingalovu nerovnost, Itôovou izometrii a podmínky věty P ( X n+1 (t) X n (t) ) ( ( T > n P A(s, X n (s)) A(s, X n 1 (s)) ) ) ds > n n+ K T ( +P sup t T n+ T T n+ K (T + 1) ) B(s, X n (s)) B(s, X n 1 (s)) dw(s) > n 1 T E [ A(s, X n (s)) A(s, X n 1 (s)) ] ds T [ B(s, + n+ E X n (s)) B(s, X n 1 (s)) ds] [ X E n (s) X n 1 (s) ] T [ X ds+ n+ K E n (s)) X n 1 (s) ds] T (Ms) n (n)! ds (4DT )n+1 (n + 1)! pro D K (T + 1). ] 35
Dále z Borel-Cantelliho lematu plyne, že P ( X n+1 (t) X n (t) > n pro nekonečně mnoho n ) =, a tak pro s.v. ω existuje n = n (ω) takové, že X n+1 (t) X n (t) n sup t T pro n n. Proto posloupnost n 1 ( X n (t) = X (t) + X k+1 (t) X k (t) ) k= konverguje stejnoměrně na, T, pro s.v. ω. Označme limitu této posloupnosti X(t). Tato funkce je spojitá v t pro s.v. ω a je také Ft M měřitelná, protože X n (t) jsou spojitá a Ft M měřitelné pro každé n. Pro m > n máme E [ ( X m (t) X n (t) ] m 1 ( = E X k+1 (t) X k (t) )) m 1 k=n E [ X k+1 (t) X k (t) ] m 1 k=n k=n ( ) (Mt) k+1 pro n. (k + 1)! Můžeme tedy vybrat podposloupnost z posloupnosti X n (t), která bude konvergovat bodově k X(t). Proces X(t) je souhlasný s F M a platí, že [ T E X(t) ] dt <. Díky stejnoměrné konvergenci můžeme přejít k limitě pro n v definici X n (t) a tím dokážeme, že X(t) splňuje rovnici X(t) = X + A(s, X(s)) ds + B(s, X(s)) dw(s) s.v..4. Některé typy rovnic a jejich metody řešení Definice.4.3. Stochastická diferenciální rovnice dx(t) = A(t, X(t)) dt + B(t, X(t)) dw(t) se nazývá lineární, jestliže pro koeficienty rovnice platí A(t, x) := C(t) + D(t) x, B(t, x) := E(t) + F(t) x 36
kde funkce C :, T R N R N, D :, T R N N, E :, T R N M a F :, T R N R N M. Poznámka. Předpoklady na koeficienty rovnice ve větě o existenci a jednoznačnosti jsou splněny, pokud platí ( ) C(t) + D(t) + E(t) + F(t) <, sup t T a tak pro X F M -měřitelnou náhodnu veličinu s E [ X ] < má lineární diferenciální rovnice ( ) ( ) dx(t) = C(t) + D(t)X(t) dt + E(t) + F(t)X(t) dw(t), X() = X jednoznačně určené silné rešení. Příklad.4.4. Lineární diferenciální rovnice typu ( ) dx(t) = C(t) + D(t)X(t) dt + E(t) dw(t), X() = X má řešení ( dx(t) = Φ(t) X + ) Φ 1 (s)(c(s) ds + E(s) dw(s)), kde Φ( ) je fundamentální matice řešení systému obyčejných diferenciálních rovnic dφ dt = D(t)Φ, Φ() = I. Formálně můžeme tento vzorec zdůvodnit tím, že rovnice z příkladu vznikla jako stochastizace obyčejné lineární, nehomogenní rovnice Ẋ(t) = D(t)X(t) + C(t) + E(t)ξ, X() = X kde ξ značí bílý šum. Řešením této rovnice s nehomogenním členem C(t) + E(t)ξ získáme vzorec. Poznámka. Řešení lineární rovnice s aditivním šumem, kdy F(t), je Gaussův proces, pokud náhodná veličina X má normální rozdělení. Příklad.4.5. Uvažujme stochastickou diferenciální rovnici typu dx(t) = A(t, X(t)) dt + B(t)X(t) dw (t), X() = X, kde A : R R R a B : R R jsou spojité funkce. 37
Při řešení této rovnice můžeme postupovat následovně: 1. krok Definujeme integrační faktor F (t) jako F (t) = e ( B(s) dw (s)+ 1 B (s) ds).. krok Pomocí Itôovy formule vypočítáme, že 3. krok Definujeme funkci a pak d (F (t) X(t)) = F (t) A(t, X(t)) dt. Y (t) = F (t) X(t), X(t) = F 1 (t) Y (t), kde funkci Y (t) získáme jako řešení obyčejné diferenciální rovnice dy (t) dt = F (t) A(t, F 1 (t) Y (t)), Y () = X..5 Numerické řešení stochastických diferenciálních rovnic Při odvozování numerických metod pro řešení stochastických diferenciálních rovnic musíme dbát nato, aby naše metoda byla v souladu s definicí stochastického integrálu. Při hledání konkrétní trajektorie řešení dané rovnice hledáme vždy řešení vzhledem k dané trajektorii Wienerova procesu, které generujeme pro každé řešení zvláště. V případě, kdy uvažujeme numerickou metodu s krokem n, přírůstky Wienerova procesu W n jsou N(, n ) Gaussovské náhodné veličiny, navzájem nezávislé. Numerická metoda nám určí aproximaci řešení v diskrétních časových hodnotách. Potřebujeme-li spojitou aproximaci řešení, použijeme interpolační metody. Nejjednodušší je lineární interpolace. Abychom mohli posoudit kvalitu metody, musíme definovat příslušné kritérium, které by mělo vycházet z praktických požadavků na stochastickou numerickou metodu. V některých případech testujeme statistické vlastnosti řešení a potřebujeme co nejpřesnější aproximaci jednotlivých trajektorií. Používáme tzv. silné metody s co nejlepším silným řádem konvergence. Definice.5.1. Říkáme, že metoda má silný řád konvergence γ, jestliže platí: E[ X(T ) X (N T ) ] K T γ, 38
kde X značí přesné řešení stochastické diferenciální rovnice, X (N T ) je příslušná aproximace v čase T, a = max n. n N T V mnoha praktických aplikacích dostaneme přesné řešení stochastické diferenciální rovnice které nelze vyjádřit pomocí analytických funkci, někdy dokonce ani neumíme přesné řešení najít. V takových případech potřebujeme co nejlépe aproximovat střední hodnotu a další momenty řešení. K tomuto účelu definujeme slabý řád konvergence a používáme tzv. slabé metody. Definice.5.. Říkáme, že metoda má slabý řád konvergence β, jestliže pro každý polynom g existuje konstanta K T taková, že platí: E[g(X(T ))] E[g(X (N T ))] K T β. Poznámka. Různou volbou polynomu dostaneme konvergenci různých momentů řešení. V případě g(x) = x dostaneme konvergenci středních hodnot, pro g(x) = x zase konvergenci rozptylů aproximací řešení. Platí, že E[X(T )] E[X (N T )] [ E X(T ) X (N T ) ], a proto ze silné konvergence plyne slabá konvergence středních hodnot. Poznámka. Některé metody pro SDR byli odvozeny ze schémat pro numerická řešení obyčejných diferenciálních rovnic. Jako příklad takové metody uvádíme Eulerovou metodu. Jiné využívají více informace o Wienerově procesu, například Milsteinova metoda..5.1 Stochastická Eulerova metoda Uvažujme Itôovu N-dimenzionální stochastickou diferenciální rovnici s M- dimenzionálním Wienerovým procesem na intervalu, T, T > dx(t) = A(t, X(t)) dt + B(t, X(t)) dw(t), X() = X, kde A a B jsou spojité vektorové funkce. Když tuto rovnici napíšeme po složkách, pak i-tá rovnice má tvar dx i (t) = A i (t, X(t)) dt + M B i,j (t, X(t)) dw j (t). Nechť = t < t 1 <... < t N = T, pak Eulerova metoda pro i-tou složku rovnice je definováná předpisem: j=1 X n+1 i = X n i + A i (t n, X n ) n + M B i,j (t n, X n ) Wj n, j=1 kde n = t n+1 t n = n+1 t n ds a W n j = W j (t n+1 ) W j (t n ) = n+1 t n dw j (s). 39