Univerzita Karlova v Praze Matematicko-fyzikální fakulta DIPLOMOVÁ PRÁCE Barbora Zavadilová Logaritmicko-konkávní rozd lení pravd podobnosti a jejich aplikace Katedra pravd podobnosti a matematické statistiky Vedoucí diplomové práce: Studijní program: Studijní obor: prof. RNDr. Jitka Dupa ová, DrSc. Matematika Pravd podobnost, matematická statistika a ekonometrie Praha 2014
Na tomto míst bych ráda pod kovala prof. RNDr. Jitce Dupa ové, DrSc. za laskavou pomoc, ochotu a as, který mi p i vypracování této diplomové práce v novala.
Prohla²uji, ºe jsem tuto diplomovou práci vypracovala samostatn a výhradn s pouºitím citovaných pramen, literatury a dal²ích odborných zdroj. Beru na v domí, ºe se na moji práci vztahují práva a povinnosti vyplývající ze zákona. 121/2000 Sb., autorského zákona v platném zn ní, zejména skute nost, ºe Univerzita Karlova v Praze má právo na uzav ení licen ní smlouvy o uºití této práce jako ²kolního díla podle Ÿ60 odst. 1 autorského zákona. V Praze dne 10. dubna 2014 Barbora Zavadilová
Název práce: Logaritmicko-konkávní rozd lení pravd podobnosti a jejich aplikace Autor: Barbora Zavadilová Katedra: Katedra pravd podobnosti a matematické statistiky Vedoucí diplomové práce: prof. RNDr. Jitka Dupa ová, DrSc., Katedra pravd podobnosti a matematické statistiky Abstrakt: V p edloºené práci studujeme vlastnosti log-konkávních pravd podobnostních rozd lení. Shrneme základní denice a v ty v jedno- i vícerozm rném p ípad a aplikujeme je na p íklady konkrétních rozd lení. Mezi log-konkávní rozd lení pat í ada známých a hojn pouºívaných rozd lení, nap íklad normální, exponenciální, pro ur ité hodnoty parametr také Gamma, Beta a spousta dal²ích. Log-konkávní rozd lení mají adu aplikací v ekonomii, teorii spolehlivosti, stochastickém programování i optimalizaci. Zam íme se na neparametrický odhad log-konkávní hustoty metodou maximální v rohodnosti s vyuºitím softwaru R. Klí ová slova: log-konkávní rozd lení, teorie spolehlivosti, maximáln v rohodný odhad log-konkávní hustoty Title: Logarithmic-concave probability distributions and their applications Author: Barbora Zavadilová Department: Department of Probability and Mathematical Statistics Supervisor: prof. RNDr. Jitka Dupa ová, DrSc., Department of Probability and Mathematical Statistics Abstract: In present work we study properties of log-concave probability distributions. We summarize basic denitions and theorems in one and also multidimensional space and apply them to the specic distributions. The class of log-concave densities includes most of well-known and frequently used probability distributions, examples include normal, exponential, for certain values of parameters also Gamma, Beta and many others. The assumption about the log-concavity of a probability distribution appears in various applications, e.g. in econometrics, reliability theory, stochastic programming or optimization. We are interested in the nonparametric maximum likelihood estimation of log-concave probability densities using the software R. Keywords: log-concave distributions, reliability theory, maximum likelihood estimation of log-concave density
Obsah Úvod 2 Seznam pouºitých symbol 3 1 Jednorozm rný p ípad 4 1.1 Log-konkávní hustota a distribu ní funkce............. 4 1.2 Teorie spolehlivosti.......................... 7 1.3 Transformace, krácení a zrcadlový obraz.............. 10 1.4 P íklady rozd lení........................... 12 1.4.1 Mocninné rozd lení...................... 12 1.4.2 Gamma rozd lení....................... 16 1.4.3 Paretovo rozd lení...................... 16 1.4.4 Zrcadlové Paretovo rozd lení................. 19 1.5 Diskrétní rozd lení.......................... 19 2 Vícerozm rný p ípad 21 2.1 Log-konkávní pravd podobnostní míra a hustota.......... 21 2.2 P íklady rozd lení........................... 24 2.2.1 Normální rozd lení...................... 26 2.2.2 Wishartovo rozd lení..................... 26 2.2.3 Beta rozd lení......................... 27 2.2.4 Dirichletovo rozd lení..................... 27 2.3 Nerovnosti............................... 28 3 Aplikace 30 3.1 Stochastické programování...................... 30 3.2 Maximáln v rohodný odhad log-konkávní hustoty a distribu ní funkce................................. 32 3.2.1 Unimodální funkce...................... 32 3.2.2 Existence a jednozna nost odhadu.............. 33 3.2.3 P íklad............................. 40 3.2.4 Vícerozm rný p ípad..................... 45 Záv r 47 Seznam pouºité literatury 48 Seznam tabulek 50 P ílohy 51 A Pouºití funkce logcondens...................... 51 1
Úvod Cílem práce je shrnout teorii log-konkávních pravd podobnostních rozd lení a seznámit se s jejich aplikacemi. Práce je rozd lena do t í kapitol. V první kapitole práce jsou vyloºeny základy teorie log-konkávních rozd lení v jednorozm rném p ípad. Za neme vztahem monotónnosti a log-konkávnosti. Podkapitola 1.2 je v nována teorii spolehlivosti. Zde se zam íme na spolehlivostní funkce, intenzitu poruch a o ekávanou dobu do poruchy stroje. Mezi log-konkávní rozd lení pat í ada známých a hojn pouºívaných rozd lení, nap íklad normální, exponenciální, pro ur ité hodnoty parametr také Gamma, Beta a spousta dal- ²ích. V sekci 1.4 na n kolika konkrétních p íkladech podrobn ilustrujeme teorii první kapitoly. Vlastnosti uvedených funkcí p iblíºíme obrázky. Jsou zde uvedeny tabulky, které p ehledn shrnují log-konkávní rozd lení (viz Tabulka 1.1), rozd lení, které nemají log-konkávní hustotu (viz Tabulka 1.2) a jejich vlastnosti (Tabulka 1.3). V ásti 1.5 uvedeme pár poznámek o diskrétních rozd leních, binomické, i Poissonovo rozd lení jsou také log-konkávní. Cílem kapitoly druhé je seznámení s log-konkávními funkcemi ve vícerozm rném prostoru. Zajímavou vlastností, která je odvozena v D sledku 2.1.5, je, ºe sou et dvou nezávislých náhodných vektor s log-konkávním rozd lením je náhodný vektor, který má op t log-konkávní rozd lení. ƒást 2.2 je v nována n kolika konkrétním p íklad m rozd lení. Dále v podkapitole 2.3 dokáºeme zajímavé nerovnosti, pomocí kterých dojdeme k záv ru, ºe v²echny log-konkávní funkce jsou nutn subexponenciální a unimodální. Log-konkávní rozd lení mají adu aplikací v ekonomii, teorii spolehlivosti a teorii her. My se ve t etí kapitole zam íme na aplikaci ve stochastickém programování (podkapitola 3.1), dále v ásti 3.2 budeme hledat neparametrický odhad log-konkávní hustoty metodou maximální v rohodnosti v jedno- i vícerozm rném p ípad. Log-konkávní funkce jsou podt ídou unimodálních funkcí. Pro unimodální hustoty s neznámým modem odhad metodou maximální v rohodnosti neexistuje, ale pro funkci log-konkávní odhad existuje a je ur en jednozna n. Toto tvrzení je pro jednorozm rné hustoty dokázáno ve V t 3.2.8, pro vícerozm rná rozd lení uvedeme tuto vlastnost bez d kazu ve V t 3.2.13. S pouºitím softwaru R odhady ilustrujeme n kolika obrázky a ukáºeme srovnání s jádrovým odhadem. Výklad v první kapitole je zaloºen p edev²ím na práci [1]. Mnohorozm rný p ípad v kapitole druhé vychází z knihy [12], ást týkající se nerovností je inspirována lánkem [13]. Aplikace log-konkávních rozd lení ve stochastickém programování je zpracována podle [4]. Maximáln v rohodný odhad jednorozm rné log-konkávní hustoty je odvozen z prací [11], [6] a [5], odhad vícerozm rné hustoty je inspirován [2]. K výpo t m a generování obrázk pouºíváme statistický software R. Zdrojový kód je sou ástí P ílohy A. 2
Seznam pouºitých symbol Dom( ) deni ní obor funkce f hustota rozd lení F distribu ní funkce F zrcadlová distribu ní funkce F spolehlivostní funkce r intenzita poruch (hazardní funkce) M RL st ední zbytkový as P pravd podobnostní míra na R n mnoºina v²ech rozd lení na R n, která mají log-konkávní hustotu empirická distribu ní funkce náhodného výb ru X 1,..., X n logaritmická v rohodnost modikovaná logaritmická v rohodnost ˆf n maximáln v rohodný odhad hustoty f P n F n L n Ψ n Euklidovská norma vektoru Lebesgueova míra mnoºiny conv( ) konvexní obal mnoºiny 3
1. Jednorozm rný p ípad V první kapitole se budeme v novat vlastnostem log-konkávních funkcí v jednorozm rném p ípad, budeme vycházet z práce [1]. V celém textu budeme p edpokládat existenci v²ech pot ebných derivací. Za n me denicí: Denice 1.0.1. Funkce f : R R je log-konkávní (nebo také logaritmickokonkávní), jestliºe f(x) 0 a pro v²echna x, y Dom(f), 0 < λ < 1 platí f(λx + (1 λ)y) f(x) λ f(y) (1 λ). (1.1) ekneme, ºe f je log-konvexní (logaritmicko-konvexní), jestliºe v (1.1) platí obrácená nerovnost. Jestliºe f(x) > 0 pro v²echna x Dom(f), pak f je log-konkávní, pokud log f je konkávní funkce a log-konvexní, pokud log f je konvexní. Tedy f je log-konkávní práv tehdy, kdyº 1 je log-konvexní. Jestliºe p ipustíme nulovou hodnotu funkce f f a v takovém p ípad poloºíme log f(x) =, m ºeme íkat, ºe f je log-konkávní, jestliºe roz²í ená funkce log f je konkávní. V²imn me si, ºe nerovnost (1.1) pro log-konkávní funkci íká, ºe hodnota funkce v bod, který je aritmetickým pr m rem dvou hodnot, je v t²í nebo rovna geometrickému pr m ru funk ních hodnot v t chto bodech. Kaºdou log-konvexní funkci f m ºeme zapsat ve tvaru f = e g, kde g = log f je konvexní. Pro kaºdou konvexní funkci g je e g také konvexní, proto kaºdá logkonvexní funkce je také konvexní. Podobn platí, ºe kaºdá nezáporná log-konkávní funkce je konkávní. Poznamenejme je²t, ºe spojitá náhodná veli ina má log-konkávní rozd lení jestliºe její hustota je log-konkávní. 1.1 Log-konkávní hustota a distribu ní funkce Budeme zkoumat log-konkávnost a log-konvexitu jednorozm rné hustoty, distribu ní funkce a jejich integrál. Nejprve uvedeme n kolik poznámek a lemmat, které dále vyuºijeme v d kazech d leºitých tvrzení. Poznámka 1.1.1. Spojit diferencovatelná funkce f je log-konkávní na (a, b) práv tehdy, kdyº pro v²echna x (a, b) je f (x) f(x) (1.2) nerostoucí funkce. Na intervalu (a, b) je f log-konvexní práv tehdy, kdyº (1.2) je neklesající pro v²echna x (a, b). D kaz. ln f(x) je konkávní práv tehdy, kdyº ( ) f (ln f(x)) (x) = 0. f(x) 4
Poznámka 1.1.2. F (x) = x f(t)dt je log-konkávní (log-konvexní) na (a, b) práv tehdy, kdyº pro v²echna x (a, b) je f (x)f (x) f(x) 2 nekladná (nezáporná) a funkce. D kaz. Funkce ln F (x) je konkávní práv tehdy, kdyº ( ) f(x) (ln F (x)) = = f (x)f (x) f(x) 2 0. F (x) F (x) 2 Lemma 1.1.3. Nech f je spojit diferencovatelná funkce na (a, b), poloºme F (x) = x f(t)dt pro v²echna x (a, b). Ozna me f(a) = lim a x a+ f(x), potom platí: (i) Jestliºe f(x) je log-konkávní na (a, b), potom F (x) je také log-konkávní na (a, b). (ii) Jestliºe F (x) je log-konvexní na (a, b) a f(a) = 0, potom F (x) je také logkonvexní na (a, b). D kaz. (i) Jestliºe f je log-konkávní, potom pro v²echna x (a, b) platí f (x) f(x) F (x) = f (x) f(x) x a f(t)dt nerovnost plyne z toho, ºe f (x) f(x) nezáporná, je f(a) 0, a tedy x a f (t) f(t) f(t)dt = x a f (t)dt = f(x) f(a), je nerostoucí podle Poznámky 1.1.1. Protoºe f je f (x) F (x) f(x) f(a) f(x). f(x) Z nerovnosti f (x)f (x) f(x) 2 0 plyne log-konkávnost funkce F podle Poznámky 1.1.2. (ii) Podobnou úvahou za p edpokladu, ºe f je log-konvexní a f(a) = 0, dostaneme f (x) F (x) f(x) f(a) = f(x), f(x) odkud plyne, ºe f (x)f (x) f(x) 2 0, podle Poznámky 1.1.2 je F log-konvexní. Ov it log-konkávnost funkce m ºeme i tehdy, kdyº nevíme jak vypadá její logaritmus. Mnoho b ºných rozd lení nemá uzav ený tvar pro distribu ní funkci, ale jejich hustota má jednoduchý p edpis. Jedním z trik, jak rozeznat logkonkávnost, je, ºe rozd lení s log-konkávní hustotu má log-konkávní i distribu ní funkci. Navíc log-konkávnost distribu ní funkce je posta ující podmínkou pro logkonkávnost jejího integrálu. Distribu ní funkci normálního rozd lení nelze vyjád it elementárními funkcemi a p ímé ov ení log-konkávnosti je obtíºné. Ale hustota normálního rozd lení je log-konkávní, protoºe její logaritmus je kvadratická funkce. Tvrzení, ºe integrál z log-konkávní funkce je log-konkávní uvedeme v ásti 2.1. Zatím si vysta íme s p ípadem jednorozm rné diferencovatelné hustoty. 5
V ta 1.1.4. Nech f je hustota na (a, b) a F je odpovídající distribu ní funkce. Potom platí: (i) Jestliºe f je spojit diferencovatelná a log-konkávní na (a, b), potom F je také log-konkávní na (a, b). (ii) Jestliºe F je log-konkávní na (a, b), potom G(x) = x F (t)dt je také logkonkávní funkce na (a, a b). D kaz. Tvrzení (i) je speciálním p ípadem Lemmatu 1.1.3 (i). Protoºe F je distribu ní funkce rozd lení s hustotou f, je absolutn spojitá (tedy i spojitá) a diferencovatelná (F = f). Tvrzení (ii) op t plyne z Lemmatu 1.1.3 (i). D sledek 1.1.5. Jestliºe hustota f je klesající, potom distribu ní funkce F i její integrál G je log-konkávní. D kaz. F je distribu ní funkce, je tedy rostoucí. Jestliºe f je klesající, potom f(x) je klesající. Protoºe F (x) ( ) f(x) = (ln F (x)) 0, F (x) je F log-konkávní. G je log-konkávní podle V ty 1.1.4. Distribu ní funkce m ºe být log-konvexní i log-konkávní, p estoºe hustota p íslu²ného rozd lení tuto vlastnost nemá. V Tabulce 1.3 jsou uvedeny p íklady rozd lení s log-konvexní hustotou a logkonkávní distribu ní funkcí. Mnoºinu v²ech rozd lení s log-konvexní hustotou, které mají log-konvexní i distribu ní funkci, rozeznáme snadno: V ta 1.1.6. Nech f je hustota na (a, b) a F je odpovídající distribu ní funkce. Potom platí: (i) Jestliºe f je spojit diferencovatelná a log-konvexní na (a, b) a f(a) = 0, potom F je také log-konvexní na (a, b). (ii) Jestliºe F je log-konvexní na (a, b), potom G(x) = x F (t)dt je také logkonvexní na (a, a b). D kaz. Tvrzení (i) plyne ihned z Lemmatu 1.1.3 (ii). Protoºe F je distribu ní funkce rozd lení s hustotou f, je tedy spojitá, diferencovatelná a platí lim F (x) = 0. x a+ Tvrzení (ii) spl uje p edpoklady Lemmatu 1.1.3 (ii), proto je funkce G logkonvexní. 6
1.2 Teorie spolehlivosti Log-konkávní funkce mají adu aplikací v teorii spolehlivosti, která se zabývá ºivotností a poruchovostí n jakého stroje i organismu. Nech a je as uvedení stroje do provozu a b je okamºik, o kterém bu víme, ºe se ho stroj nedoºije, anebo ve kterém stroj bude vy azen z provozu (nap íklad jiº bude zastaralý). P edpokládejme, ºe se stroj porouchá v n jakém asovém okamºiku b hem intervalu (a, b). Hustota poruch f(x) je denována jako pravd podobnost, ºe se stroj v ase x porouchá. Pravd podobnost, ºe porucha nastane d íve neº v ase x, je dána distribu ní funkcí F (x) = x a f(t)dt, x (a, b). Denice 1.2.1. Spolehlivostní funkce je denována jako F (x) = 1 F (x), x (a, b) a udává pravd podobnost, ºe v intervalu (a, x) nedojde k poru²e. Integrál ze spolehlivostní funkce budeme zna it jako H(x) = b x F (t)dt. Denice 1.2.2. Pom r hustoty poruch a p íslu²né spolehlivosti r(x) = f(x) F (x) se nazývá intenzita poruch nebo také hazardní funkce. Intenzita poruch udává pravd podobnost, ºe stroj, který p eºil do asu x, se porouchá práv v tomto okamºiku. Poznámka 1.2.3. Spolehlivostní funkce F (x) = b x f(t)dt je log-konkávní (log-konvexní) na intervalu (a, b) práv tehdy, kdyº pro v²echna x (a, b) je f (x) F (x) + f(x) 2 nezáporná (nekladná) funkce. D kaz. Protoºe F (x) = f(x), kde f je hustota, je tedy diferencovatelná. Podobn jako v Poznámce 1.1.2 je funkce ln F (x) je konkávní práv tehdy, kdyº ( ) (ln F f(x) (x)) = = f (x) F (x) + f(x) 2 0. F (x) F (x) 2 7
Lemma 1.2.4. Nech f je spojit diferencovatelná funkce na (a, b), poloºme F (x) = b x f(t)dt pro v²echna x (a, b). Ozna me f(b) = lim x b f(x), potom platí: (i) Jestliºe f(x) je log-konkávní na (a, b), potom F (x) je také log-konkávní na (a, b). (ii) Jestliºe F (x) je log-konvexní na (a, b) a f(b) = 0, potom F (x) je také logkonvexní na (a, b). D kaz. (i) Jestliºe f je log-konkávní, potom pro v²echna x (a, b) platí f (x) f(x) F (x) = f (x) f(x) b x f(t)dt nerovnost plyne z toho, ºe f (x) f(x) nezáporná, je f(b) 0, a tedy b x f (t) f(t) f(t)dt = b x f (t)dt = f(b) f(x), je nerostoucí podle Poznámky 1.1.1. Protoºe f je f (x) f(x) F (x) f(b) f(x) f(x). Z nerovnosti f (x)f (x)+f(x) 2 0 plyne log-konkávnost F podle Poznámky 1.1.2. (ii) Podobnou úvahou za p edpokladu, ºe f je log-konvexní a f(b) = 0, dostaneme f (x) f(x) F (x) f(b) f(x) = f(x), odkud plyne, ºe f (x) F (x) + f(x) 2 0, podle Poznámky 1.1.2 je F log-konvexní. V ta 1.2.5. Nech f je hustota na intervalu (a, b) a F je odpovídající spolehlivostní funkce. Potom platí: (i) Jestliºe f je spojit diferencovatelná a log-konkávní na (a, b), potom F je také log-konkávní na (a, b). (ii) Jestliºe F je log-konkávní na (a, b), potom H(x) = b F (t)dt je také logkonkávní na (a, x b). D kaz. Tvrzení (i) plyne ihned z Lemmatu 1.2.4 (i). Spolehlivostní funkce F je spojitá (nebo F je absolutn spojitá), je diferencovatelná ( F = f). Podle Lemma 1.2.4 (i) je funkce H v ásti (ii) log-konkávní. D sledek 1.2.6. Jestliºe hustota f je log-konkávní na (a, b), potom intenzita poruch r je rostoucí na (a, b). D kaz. Platí r(x) = f(x) F (x) = F (x) F (x). Z V ty 1.2.5 plyne, ºe pokud f je log-konkávní, potom také F je log-konkávní. Tudíº (ln F (x)) = F (x) F (x) = r(x) je klesající v x, proto r je rostoucí v x. 8
Poznámka 1.2.7. Obrácené tvrzení D sledku 1.2.6 neplatí. Existuje rozd lení s rostoucí intenzitou poruch, jehoº hustota není log-konkávní. Takovým rozd lením je nap íklad zrcadlové Paretovo, ke kterému se dostaneme v p íkladu 1.4.4. D sledek 1.2.8. Jestliºe hustota f je rostoucí, potom spolehlivostní funkce F je log-konkávní a intenzita poruch r rostoucí. D kaz. Protoºe F je spolehlivostní funkce, podle denice musí být klesající. Jestliºe f je rostoucí, intenzita poruch f F musí být také rostoucí. Ale rostoucí intenzita poruch je ekvivalentní s log-konkávností spolehlivostní funkce. V ta 1.2.9. Nech f je hustota na intervalu (a, b) a F odpovídající spolehlivostní funkce. Potom platí: (i) Jestliºe f je spojit diferencovatelná a log-konvexní na (a, b) a f(b) = 0, potom F je také log-konvexní na (a, b). (ii) Jestliºe F je log-konvexní na (a, b), potom H(x) = b F (t)dt je také logkonvexní na (a, x b). D kaz. Tvrzení (i) plyne ihned z Lemmatu 1.2.4 (ii). Protoºe F je spolehlivostní funkce rozd lení s hustotou f, je tedy spojitá, diferencovatelná a navíc platí lim x b F (x) = 1 lim F (x) = 0. x b Tvrzení (ii) spl uje p edpoklady Lemma 1.2.4 (ii), proto je funkce H log-konvexní. Denice 1.2.10. Nech f je hustota poruch denovaná na (a, b) a F je odpovídající spolehlivostní funkce, potom f(t) je hustota podmín né pravd podobnosti, F (x) ºe stroj v ase x p eºije do asu t > x. Funkce denovaná p edpisem MRL(x) = b x t f(t) F (x) dt x udává o ekávanou dobu do poruchy stroje, který je nyní ve v ku x, a nazývá se st ední zbytkový as. Jestliºe st ední zbytkový as M RL je klesající funkce, znamená to, ºe se o ekávaná zbývající ºivotnost stroje sniºuje, kdyº stroj stárne. Jedním z d vod, pro se zajímáme o log-konkávnost integrálu ze spolehlivostní funkce H(x), je ten, ºe tato vlastnost je ekvivalentní s monotónností M RL(x). Lemma 1.2.11. M RL je klesající práv tehdy, kdyº H je log-konkávní. D kaz. V²imn me si, ºe f(t) = F (t). Integrací per partes dostaneme MRL(x) = b F (t)dt x F (x) = H(x) H (x). Odtud vidíme, ºe MRL(x) je rostoucí práv tehdy, kdyº H (x) H(x) H(x) log-konkávní podle Poznámky 1.1.1. je klesající, tedy 9
V ta 1.2.12. Jestliºe hustota f(x) anebo spolehlivostní funkce F (x) je log-konkávní, potom M RL(x) je klesající. D kaz. Z V ty 1.2.5 (ii) plyne, ºe log-konkávnost F implikuje log-konkávnost H, potom je podle Lemmatu 1.2.11 funkce MRL rostoucí. Z V ty 1.2.5 (i) také plyne, ºe log-konkávnost hustoty f implikuje log-konkávnost spolehlivostní funkce F, tím je tvrzení dokázáno. Spolehlivostní funkce F je log-konkávní práv tehdy, kdyº intenzita poruch r je neklesající. Musí tedy platit: D sledek 1.2.13. Jestliºe je intenzita poruch r rostoucí, potom st ední zbytkový as MRL je klesající. 1.3 Transformace, krácení a zrcadlový obraz N která pravd podobnostní rozd lení vycházejí z jednodu²²ího rozd lení aplikací na transformovanou prom nnou. Nap íklad lognormální rozd lení je denováno na (0, + ) a distribu ní funkce je F (x) = Φ(ln x), kde Φ je distribu ní funkce normálního rozd lení. Normální rozd lení má log-konkávní distribu ní funkci a funkce ln(x) je konkávní rostoucí, proto distribu ní funkce lognormálního rozd lení je log-konkávní, av²ak hustota lognormálního rozd lení log-konkávní není. K lognormálnímu rozd lení se je²t vrátíme v ásti 3.1. V ta 1.3.1. Nech F je funkce denovaná na (a, b) a t je monotónní funkce z (a, b ) do (a, b) = (t(a ), t(b )). Denujme funkci ˆF p edpisem ˆF (x) = F (t(x)), x (a, b ). (i) Jestliºe F je rostoucí log-konkávní a t je konkávní funkce, potom ˆF je logkonkávní. (ii) Jestliºe F je klesající log-konvexní a t je konvexní funkce, potom ˆF je logkonvexní. D kaz. (i) Protoºe t je konkávní, platí pro v²echna x, y (a, b ), λ (0, 1) t(λx + (1 λ)y) λt(x) + (1 λ)t(y). F je rostoucí, proto pro v²echna x, y (a, b ), λ (0, 1) musí platit F (t(λx + (1 λ)y)) F (λt(x) + (1 λ)t(y)) F (t(x)) λ F (t(y)) (1 λ), druhá nerovnost plyne z toho, ºe F je log-konkávní. Podle Denice 1.0.1 je funkce ˆF = F (t(x)) log-konkávní. (ii) Podobn jako v (i) dostaneme pro v²echna x, y (a, b ), λ (0, 1) F (t(λx + (1 λ)y)) F (λt(x) + (1 λ)t(y)) F (t(x)) λ F (t(y)) (1 λ). První nerovnost plyne z toho, ºe t je konvexní a F rostoucí, druhá nerovnost plyne z log-konkávnosti F. Podle denice je ˆF = F (t(x)) log-konvexní funkce. 10
D sledek 1.3.2. Nech t je lineární transformace z R do R a F je funkce na (t(a), t(b)). Denujme funkci ˆF na (a, b) p edpisem ˆF (x) = F (t(x)). (i) Jestliºe F je log-konkávní, potom ˆF je log-konkávní. (ii) Jestliºe F je log-konvexní, potom ˆF je log-konvexní. D kaz. t je lineární transformace, m ºeme ji zapsat jako Potom pro v²echna x (a, b) platí t(x) = ax + b, kde a, b R. (ln ˆF (x)) = a 2 (ln F (ax + b)). Máme distribu ní funkci F libovolného rozd lení na intervalu (a, b). Tuto distribu ní funkci m ºeme pouºít ke konstrukci distribu ní funkce F jiného rozd lení na intervalu ( b, a). Poloºme F (x) = F ( x) = 1 F ( x). Funkci F nazveme zrcadlovým obrazem F, nebo grafy jejich hustot jsou symetrické kolem p ímky x = 0. V ta 1.3.3. Nech F a F jsou zrcadlové distribu ní funkce. P íslu²né hustoty ozna me f a f. (i) Jestliºe hustota f je log-konkávní (nebo log-konvexní), pak je log-konkávní (log-konvexní) i hustota f a naopak. (ii) Distribu ní funkce F je log-konkávní práv tehdy, kdyº je spolehlivostní funkce F log-konkávní, a naopak. D kaz. (i) Protoºe F (x) = 1 F ( x) = F ( x), (1.3) musí platit F (x) = F (x). Pro hustoty platí f (x) = f( x) pro v²echna x. Funkce f vznikne z f lineární transformací, proto záv r plyne z D sledku 1.3.2. (ii) Z (1.3) a D sledku 1.3.2 také plyne, ºe F je log-konkávní (log-konvexní) práv tehdy, kdyº F je log-konkávní (log-konvexní). Jestliºe rozd lení má hustotu symetrickou kolem nuly, je distribu ní funkce sama svým zrcadlovým obrazem. D sledek 1.3.4. Jestliºe rozd lení má hustotu symetrickou kolem bodu 0, pak distribu ní funkce je log-konkávní (log-konvexní) práv tehdy, kdyº spolehlivostní funkce je log-konkávní (log-konvexní). 11
Pomocí libovolné distribu ní funkce F na intervalu (a, b) lze také zkonstruovat novou distribu ní funkci zkrácením na podinterval (a, b ) intervalu (a, b) tak, ºe relativní vzdálenost dvou bod z stane nezm n na. Nech F je p vodní distribu ní funkce a F je zkrácená distribu ní funkce, potom F (x) = F (x) F (a ) F (b ) F (a ). Distribu ní funkce F je tedy lineární transformací funkce F. Odpovídající hustoty jsou také lineární transformací jedna druhé a z D sledku 1.3.2 dostaneme následující tvrzení: V ta 1.3.5. Jestliºe rozd lení má log-konkávní (log-konvexní) hustotu (p íp. distribu ní funkci), potom jakékoli zkrácení tohoto rozd lení má také log-konkávní (log-konvexní) hustotu (p íp. distribu ní funkci). 1.4 P íklady rozd lení Jestliºe hustota rozd lení f je log-konkávní, potom z V ty 1.1.4 víme, ºe distribu ní funkce F i její integrál G jsou také log-konkávní. Z V ty 1.2.5 a jejího d sledku plyne, ºe spolehlivostní funkce F i její integrál H jsou log-konkávní a intenzita poruch r je rostoucí. Z V ty 1.2.12 víme, ºe MRL je klesající. V Tabulce 1.1 jsou uvedeny p íklady spojitých jednorozm rných rozd lení s log-konkávní hustotou. Jestliºe hustota rozd lení f není log-konkávní, rozhodnout o vlastnostech funkcí F, F a MRL není v bec jednozna né, jak vidíme v Tabulce 1.3. P íklady rozd lení, jejichº hustota není log-konkávní, jsou uvedeny v Tabulce 1.2. Na n kolika rozd leních si ukáºeme aplikaci vý²e dokázaných tvrzení. 1.4.1 Mocninné rozd lení Mocninné rozd lení je denováno na intervalu (0, 1], hustota je rovna a distribu ní funkce F (x) = x c. Protoºe f(x) = cx c 1 (ln f(x)) = 1 c x 2, vidíme, ºe f je striktn log-konkávní pro c > 1, striktn log-konvexní pro 0 < c < 1 a log-lineární (tj. log-konkávní i log-konvexní) pro c = 1. Pro 0 < c < 1 je f(0) = a f(1) = c, proto k rozhodnutí, zda F a F je log-konvexní, nem ºeme pouºít V tu 1.1.6 ani V tu 1.2.9. V tomto p ípad logkonkávnost F m ºeme ov it p ímo (ln F (x)) = c x < 0. 12
Nosi Distribu ní Rozd lení Hustota f(x) (ln f(x)) rozd lení funkce F (x) Rovnom rné [0,1] 1 x 0 1 Normální (, ) 2π e x2 /2 * 1 Exponenciální (0, ) λe λx 1 e λx 0 e Logistické (, ) x 1 2f(x) (1+e x ) 2 (1+e x ) 2 Extrémních hodnot (, ) e x exp{ e x } exp{ e x } e x 1 Laplaceovo (, ) 2 e x 1 + 1 sgn(x)(1 2 2 e) x 0 pro x 0 Mocninné (c 1) (0, 1] cx c 1 x c 1 c x 2 Weibullovo (c 1) [0, ) cx c 1 e xc 1 e xc 1 c (1 + cx c ) x 2 x Gamma (c 1) [0, ) c 1 e x 1 c * Γ(c) x 2 χ 2 x (c 2) [0, ) (c 2)/2 e x/2 2 c * 2 c/2 Γ(c/2) 2x 2 χ (c 1) [0, ) x c 1 e x2 /2 1 c * 1 2 (c 2)/2 Γ(c/2) x 2 x ν 1 (1 x) ω 1 1 ν * + 1 ω B(ν,ω) x 2 (1 x) 2 Beta (ν 1 & ω 1) [0, 1] Maxwellovo Jedná se o χ rozd lení pro c=3. Rayleighovo Jedná se o χ rozd lení pro c=2. Tabulka 1.1: Rozd lení s log-konkávní hustotou, tabulka p evzata z [1] znamená, ºe distribu ní funkci nelze vyjád it pomocí elementárních funkcí 13
Rozd lení Nosi Distribu ní Hustota f(x) rozd lení funkce F (x) (ln f(x)) Mocninné (0 < c < 1) (0,1] cx c 1 x c 1 c x 2 Weibullovo (0 < c < 1) (0, ) cx c 1 e xc 1 e xc 1 c (1 + cx c ) x 2 x Gamma (0 < c < 1) (0, ) c 1 e x 1 c * Γ(c) x 2 Beta (ν < 1 ω < 1) [0, 1] x ν 1 (1 x) ω 1 Arcsin [0, 1] 1 π x(x 1) 1 ν * + 1 ω B(ν,ω) x 2 (1 x) 2 2 1 2x π 2x 2 (1 x 2 ) Paretovo [1, ) βx β 1 1 x β ( β+1 x )2 1 Logaritmicko normální (0, ) x 2π e (ln x)2 /2 ln x * x 2 Studentovo t (, ) 1 Cauchyho (, ) π(1+x 2 ) (1+ x2 n ) (n+1)/2 nb(1/2,n/2) * (1 n) n x2 (n+x 2 ) 2 1 + arctan(x) 2 x2 1 2 π (x 2 +1) 2 Zrcadlové Paretovo (, 1) βx β 1 ( x) β ( β+1 x )2 Tabulka 1.2: Rozd lení, která nemají log-konkávní hustotu, tabulka p evzata z [1] znamená, ºe distribu ní funkci nelze vyjád it pomocí elementárních funkcí 14
Rozd lení f(x) F(x) r(x) MRL(x) Mocninné (0 < c < 1) log-konvexní log-konkávní - nemonotónní Weibullovo (0 < c < 1) log-konvexní log-konkávní log-konvexní klesající Gamma (0 < c < 1) log-konvexní log-konkávní log-konvexní rostoucí Arcsin log-konvexní - - nemonotónní Paretovo log-konvexní log-konkávní log-konvexní rostoucí Logaritmicko normální - log-konkávní - nemonotónní Studentovo t - - - nemonotónní Cauchyho - - - nemonotónní Zrcadlové Paretovo log-konvexní log-konvexní log-konkávní klesající Tabulka 1.3: Vlastnosti rozd lení, která nemají log-konkávní hustotu, tabulka p evzata z [ 1] znamená, ºe funkce není ani log-konkávní ani log-konvexní 15
Platí F = 1 x c a spo teme, ºe (ln F (x)) = cxc 2 (1 c x c ) (1 x c ) 2. Výraz (ln F (x)) je záporný pro x blízko 1 a kladný pro x blízké 0, proto F není ani log-konkávní ani log-konvexní. Integrál ze spolehlivostní funkce H(x) = c + xc+1 1 + c také není ani log-konkávní ani log-konvexní. Proto také M RL není klesající ani rostoucí. 1.4.2 Gamma rozd lení x Gamma rozd lení je denováno na intervalu (0, ), hustota je rovna f(x) = xc 1 e x. Γ(c) Znaménko (ln f(x)) = 1 c x 2 je záporné, nula nebo kladné pro c > 1, c = 1 nebo pro c < 1. Proto Gamma rozd lení je log-konkávní pro c > 1, log-lineární pro c = 1 a log-konvexní pro c < 1. Pro c < 1 máme f(0) = a f( ) = 0. M ºeme pouºít V tu 1.2.9, podle které je F i její integrál H log-konvexní. Odtud plyne, ºe r(x) je klesající a MRL(x) rostoucí v x. Protoºe f(0) 0, nem ºeme podle V ty 1.1.6 rozhodnout, zda F je logkonvexní. Ale pro 0 < c < 1 je (ln f(x)) < 0 pro x > 0, takºe f je klesající na (0, ). Z D sledku 1.1.5 plyne, ºe F je log-konkávní a z V ty 1.1.4 plyne log-konkávnost G. Tyto vlastnosti jsou pro c = 0.5 zobrazeny na Obrázku 1.1. Vlastnosti t chto funkcí pro rozd lení Gamma(2) ilustruje Obrázek 1.2: f i F jsou log-konkávní, intenzita poruch r a st ední zbytkový as M RL klesající. 1.4.3 Paretovo rozd lení Hustota Paretova rozd lení je denována na [1, ), platí f(x) = βx β 1 (ln f(x)) = β + 1 x a (ln f(x)) = β + 1 > 0. x 2 Proto je hustota pro v²echna x [1, ) klesající a log-kovexní. Z D sledku 1.1.5 plyne, ºe F je log-konkávní. 16
hustota 0.0 0.5 1.0 1.5 log hustota 12 8 4 0 0 2 4 6 8 10 0 2 4 6 8 10 distribucni funkce 0.4 0.6 0.8 1.0 0 2 4 6 8 10 log distribucni funkce 1.0 0.6 0.2 0 2 4 6 8 10 spolehlivostni funkce 0.0 0.2 0.4 0.6 0 2 4 6 8 10 log spolehlivostni funkce 12 8 4 0 0 2 4 6 8 10 intenzita poruch 1.0 1.4 1.8 2.2 0 2 4 6 8 10 stredni zbytkovy cas 0.65 0.80 0.95 0 2 4 6 8 10 Obrázek 1.1: Vlastnosti funkcí f, F, F, r, MRL rozd lení Gamma(0.5) 17
hustota 0.0 0.1 0.2 0.3 log hustota 7 5 3 1 0 2 4 6 8 10 0 2 4 6 8 10 distribucni funkce 0.0 0.4 0.8 0 2 4 6 8 10 log distribucni funkce 5 3 1 0 2 4 6 8 10 spolehlivostni funkce 0.0 0.4 0.8 0 2 4 6 8 10 log spolehlivostni funkce 6 4 2 0 0 2 4 6 8 10 intenzita poruch 0.2 0.6 0 2 4 6 8 10 stredni zbytkovy cas 1.2 1.6 0 2 4 6 8 10 Obrázek 1.2: Vlastnosti funkcí f, F, F, r, MRL rozd lení Gamma(2) 18
Spolehlivostní funkce má tvar F (x) = x β. Protoºe (ln F (x)) = β x 2 > 0, je spolehlivostní funkce log-konvexní. Integrál ze spolehlivostní funkce konverguje jen pro β > 1 a je roven H(x) = x F (t)dt = 1 β 1 x1 β. Protoºe (ln H(x)) = β 1 > 0, x 2 je H(x) log-konvexní a MRL je klesající v x. 1.4.4 Zrcadlové Paretovo rozd lení Zrcadlové Paretovo rozd lení je denováno na intervalu (, 1) a pro distribu ní funkci platí F (x) = ( x) β, kde β > 0. Pro β > 1 integrál G konverguje a je roven G(x) = x F (t)dt = (β 1) 1 ( x) 1 β. Podle V ty 1.3.3 musí mít Paretovo rozd lení rostoucí M RL. 1.5 Diskrétní rozd lení Z Denice 1.0.1 plyne, ºe pro log-konkávní funkci f platí ( ) x + y f f(x)f(y), 2 log-konkávní posloupnost denujeme podle knihy [12] zcela analogicky. Denice 1.5.1. Posloupnost {p n, n Z} nezáporných reálných ísel je logkonkávní, jestliºe platí p 2 n p n 1 p n+1, n = 0, ±1,... Denice 1.5.2. Náhodná veli ina s diskrétním rozd lením {p n, n Z} je logkonkávní, jestliºe {p n } je log-konkávní posloupnost. 19
Rozd lení Parametry p ( k Binomické (n, p) n 1, p [0, 1] n ) k p k (1 p) n k 0 k n λ Poissonovo (λ) λ > 0 k ( k! e λ k 0 Negativn binomické (n, p) n 1, p [0, 1] n+k 1 ) n 1 (1 p) k p n k 0 Geometrické (p) p (0, 1] (1 p) k p k 0 p Logaritmická ada (p) p (0, 1) k k 1 log(1 p)k! 1 Trojúhelníkové (a, b) a, b N, a b a k b b a+1 Tabulka 1.4: Diskrétní log-konkávní rozd lení, tabulka p evzata z [3] Analogicky jako pro spojitá rozd lení platí, ºe sou et dvou nezávislých diskrétních náhodných veli in s log-konkávním rozd lením je náhodná veli ina, která má také log-konkávní rozd lení. Toto tvrzení bude dokázáno v ásti 2.1 jako Tvrzení 2.1.6. P íklady diskrétních log-konkávních rozd lení najdeme v Tabulce 1.4. Následující denicí se pomalu p esuneme k vícerozm rným rozd lením. Denice 1.5.3. Mnohorozm rné diskrétní rozd lení p(k) je log-konkávní, jestliºe existuje log-konkávní funkce f(x), x R n tak, ºe p(k) = f(k) pro kaºdý bod k R n. V Tvrzení 2.1.6 je²t dokáºeme, ºe konvoluce dvou log-konkávních posloupností je op t log-konkávní. 20
2. Vícerozm rný p ípad Nyní se budeme v novat vlastnostem log-konkávních funkcí ve vícerozm rném prostoru. Za n me jejich denicí podle knihy [12], která je zcela analogická Denici 1.0.1 pro jednorozm rný p ípad. Denice 2.0.4. Funkce f : R n R je log-konkávní (nebo také logaritmickokonkávní), jestliºe f(x) 0 a pro v²echna x, y Dom(f), 0 < λ < 1 platí f(λx + (1 λ)y) f(x) λ f(y) (1 λ). (2.1) ekneme, ºe f je log-konvexní (logaritmicko-konvexní), jestliºe v (2.1) platí obrácená nerovnost. Pro f > 0 denice íká, ºe log f je konkávní funkce v R n. 2.1 Log-konkávní pravd podobnostní míra a hustota Zadenujeme, kdy je pravd podobnostní míra log-konkávní, a uvedeme tvrzení, které ji dává do souvislosti s log-konkávní hustotou: Denice 2.1.1. Pravd podobností míra denovaná na Borelovských podmnoºinách R n je log-konkávní, jestliºe pro A, B libovolné konvexní Borelovské podmno- ºiny R n a 0 < λ < 1 platí P (λa + (1 λ)b) [P (A)] λ [P (B)] (1 λ), (2.2) kde λa + (1 λ)b = {λx + (1 λ)y x A, y B}. V ta 2.1.2. Nech P je pravd podobnostní míra na R n generovaná hustotou f, která je tvaru f(x) = exp( Q(x)), x R n, kde Q je konvexní funkce (f je log-konkávní). Potom P je log-konkávní pravd podobnostní míra. D kaz. D kaz je uveden v [9]. Uvedeme nerovnost, pomocí které dokáºeme, ºe je-li sdruºené rozd lení náhodného vektoru log-konkávní, pak v²echna jeho marginální rozd lení jsou také log-konkávní. 21
Tvrzení 2.1.3. Nech f 1,..., f k jsou nezáporné Borelovsky m itelné funkce v R n, denujme r(t) = sup {f 1 (x)... f k (x) : λ 1 x 1 + + λ k x k = t}, kde λ 1,..., λ k 0 dané konstanty spl ující k i=1 λ i = 1. Pak r(t) je Borelovsky m itelná a platí ( r(t)dt R n R n f D kaz. D kaz je uveden v [10]. 1 λ1 ( λ 1 1 (x 1 )dx) R n f 1 λ k k (x k)dx) λk. V ta 2.1.4. Nech f(x, y) je log-konkávní hustota rozd lení náhodného vektoru (ξ, η) na R n R m. Pak hustota marginálního rozd lení náhodného vektoru ξ g(x) = f(x, y)dy R m a hustota podmín ného rozd lení ξ za podmínky η = y jsou log-konkávní. D kaz. Podle p edpokladu pro libovolné (x 1, y 1 ), (x 2, y 2 ) R n R m a λ [0, 1] platí f(λx 1 + (1 λ)x 2, λy 1 + (1 λ)y 2 ) f(x 1, y 1 ) λ f(x 2, y 2 ) 1 λ. Hustota marginálního rozd lení g(λx 1 + (1 λ)x 2 ) = f(λx 1 + (1 λ)x 2, y)dy R m sup{f(x 1, y 1 ) λ f(x 2, y 2 ) 1 λ }dy R [ m ] λ [ f(x 1, y)dy R m f(x 2, y)dy R m = g(x 1 ) λ g(x 2 ) 1 λ ] 1 λ je podle Tvrzení 2.1.3 log-konkávní. Hustota podmín ného rozd lení ξ za podmínky η = y je dána vztahem f(x y) = f(x, y), pokud g(y) > 0, g(y) jinak f(x y) = 0. Protoºe f(x, y) je log-konkávní, pro libovolné x 1, x 2 R n a λ (0, 1) podle Denice 2.0.4 platí f(λx 1 + (1 λ)x 2 y) = f(λx 1 + (1 λ)x 2, y) g(y) f(x 1, y) λ f(x 2, y) 1 λ g(y) = f(x 1 y) λ f(x 2 y) 1 λ. Jestliºe g(y) = 0, poloºíme log f(x y) = a proto je f(x y) log-konkávní na R n. 22
D sledek 2.1.5. Sou et dvou nezávislých náhodných vektor s log-konkávním rozd lením je náhodný vektor, který má také log-konkávní rozd lení. D kaz. Nech g(x), h(x), x R n, jsou log-konkávní hustoty, potom jejich konvoluce g(x y)h(y)dy, x R n R m je také log-konkávní. V p edchozí V t 2.1.4 poloºíme potom je R m f(x, y)dy log-konkávní. f(x, y) = g(x y)h(y), Podobné tvrzení platí i pro diskrétní rozd lení. Tvrzení 2.1.6. Jestliºe {p n, n Z} a {q n, n Z} jsou dv log-konkávní posloupnosti, potom jejich konvoluce je také log-konkávní. r n = k= p n k q k, n = 0, ±1,... D kaz. D kaz plyne z D sledku 2.1.5, který íká, ºe konvoluce dvou log-konkávních funkcí je log-konkávní. Opravdu máme dv log-konkávní funkce p : Z R a q : Z R, místo Lebesgueovy míry pracujeme s aritmetickou mírou na Z. D sledek 2.1.7. Jestliºe {p n, n Z} je log-konkávní posloupnost, potom ob posloupnosti n F (n) = p k, 1 F (n) = jsou také log-konkávní. k= k=n+1 D kaz. Sta í v Tvrzení 2.1.6 za druhou posloupnost zvolit { 0 pro k =,..., 1, q k = 1 pro k = 0,..., +, p ípadn r k = { 1 pro k =,..., 1, 0 pro k = 0,..., +, potom je konvoluce {p n } {q n } a {p n } {r n } log-konkávní, nebo ob posloupnosti {q n } i {r n } jsou z ejm log-konkávní podle Denice 1.5.1. Konvexní kombinace log-konkávních hustot m ºe být log-konkávní, ale obecn toto tvrzení neplatí ani pro normální rozd lení. Hustota jednorozm rného normovaného normálního rozd lení je rovna ϕ(x) = 1 2π e x2 2, x R. p k 23
Zvolme λ = 1, potom pro µ = 1 je funkce 2 f(x) = 1 2 ϕ(x) + 1 ϕ(x 1) 2 log-konkávní, jak m ºeme vid t na Obrázku 2.2. Jestliºe µ = 4, funkce f(x) = 1 2 ϕ(x) + 1 ϕ(x 4) 2 log-konkávní není, jak se m ºeme p esv d it z Obrázku 2.4. f(x) 0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 4 2 0 2 4 x Obrázek 2.1: Funkce f(x) pro λ = 0.5, µ = 1 2.2 P íklady rozd lení Nyní uvedeme n kolik p íklad vícerozm rných log-konkávních rozd lení. K ov - ení log-konkávnosti se nám bude hodit následující tvrzení o pozitivn denitních maticích. Tvrzení 2.2.1. Pro libovolné X, Y pozitivn denitní matice typu (n n), 0 < λ < 1 platí λx + (1 λ)y X λ Y (1 λ). (2.3) D kaz. D kaz tohoho tvrzení je uveden v knize [7] jako Corollary 7.6.9. 24
log(f(x)) 14 12 10 8 6 4 2 4 2 0 2 4 x Obrázek 2.2: Funkce log(f(x)) pro λ = 0.5, µ = 1 f(x) 0.00 0.05 0.10 0.15 0.20 4 2 0 2 4 x Obrázek 2.3: Funkce f(x) pro λ = 0.5, µ = 4 25
log(f(x)) 14 12 10 8 6 4 2 4 2 0 2 4 x Obrázek 2.4: Funkce log(f(x)) pro λ = 0.5, µ = 4 2.2.1 Normální rozd lení Nejd leºit j²ím mnohorozm rným rozd lením je normální rozd lení. Jeho hustota je dána p edpisem f(x) = 1 n e 1 2 (X µ) C 1 (X µ), X R n, C (2π) 2 kde µ R n je st ední hodnota a C je pozitivn denitní rozptylová matice. Potom C 1 je také pozitivn denitní, a proto je kvadratická forma (x µ) C 1 (x µ) konvexní, hustota f(x) je z ejm log-konvexní. 2.2.2 Wishartovo rozd lení Hustota vypadá následovn f(x) = X N p 2 2 e 1 2 SpC 1 X 2 N 1 2 p π p(p 1) 4 C N 1 2 p N i i=1 Γ( ), 2 jestliºe X je pozitivn denitní matice (n n), v ostatních p ípadech je f(x) = 0. C (n n) je matice konstant. Protoºe X je symetrická, máme n = 1 p(p + 1) 2 nezávislých prom nných. P edpokládáme, ºe N p + 2. Protoºe X je pozitivn denitní matice, sta í aplikovat Tvrzení 2.2.1 a zjistíme, ºe rozd lení je log-konkávní. 26
2.2.3 Beta rozd lení Hustota je ve tvaru f(x) = c(n 1, p)c(n 2, p) c(n 1 + n 2, p) X 1 2 (n 1 p 1) I X 1 2 (n 2 p 1), jestliºe X, I X jsou pozitivn denitní (n n) matice, jinak je f(x) = 0, kde 1 c(k, p) = 2 pk p(p 1) 2 π 2 p ( ) k i + 1 Γ. 2 P edpokládáme, ºe n 1 p + 1, n 2 p + 1, nezávislých prom nných máme n = 1 p(p + 1). 2 Log-konkávnost hustoty plyne podobn jako v p edchozím p ípad ihned z Tvrzení 2.2.1, ov íme denici: f( λx +(1 λ)y ) = C λx + (1 λ)y 1 2 (n 1 p 1) I λx (1 λ)y 1 2 (n 2 p 1) = = C λx + (1 λ)y 1 2 (n 1 p 1) λ(i X) + (1 λ)(i Y ) 1 2 (n 2 p 1) (2.3) C X λ 1 2 (n 1 p 1) Y (1 λ) 1 2 (n 1 p 1) I X λ 1 2 (n 2 p 1) I Y (1 λ) 1 2 (n 2 p 1) = = f(x) λ f(y ) 1 λ. i=1 2.2.4 Dirichletovo rozd lení Ozna me X = (x 1,..., x n ) R n. Hustota Dirichletova rozd lení je f(x) = kx p 1 1 1... x p n 1 n (1 x 1 x n ) p n+1 1, pro x i > 0, i = 1,..., n a n i=1 x i < 1, jinak je f(x) = 0, kde k = Γ(p 1 + + p n+1 ) Γ(p 1 ) Γ(p n+1 ) a p 1,..., p n+1 jsou kladné konstanty. Pro X R n taková, ºe x i > 0, i = 1,..., n a n i=1 x i < 1 je log f(x) = log k + n (p i 1) log x i + (p n+1 1) log(1 x i x n ) i=1 konkávní funkce, pokud p i 1, i = 1,..., n + 1. Jestliºe f(x) = 0, poloºíme log f(x) =. Hustota f(x) je log-konkávní na celém R n pro p i 1, i = 1,..., n + 1. Pro p i < 1, i = 1,..., n je f(x) log-konvexní, pro X R n : x i > 0, i = 1,..., n a n i=1 x i < 1. 27
2.3 Nerovnosti Tato podkapitola je zaloºena na práci [13]. Ozna me P n mnoºinu v²ech rozd lení na R n, která mají log-konkávní hustotu, to znamená, ºe Lebesgueova hustota f je tvaru f(x) = exp(φ(x)), pro n jakou konkávní funkci φ : R n [, ). Nech S R n je neprázdná konvexní mnoºina, její konvexní obal zna íme conv(s), Lebesgueovu míru této mnoºiny budeme ozna ovat S, dále zna í Euklidovskou normu vektoru. V následujícím textu budeme pouºívat mnoºiny a 0, které denujeme následovn : = conv{x 0, x 1,..., x n }, { } 0 = u [0, 1] n n u i 1. i=1 V ta 2.3.1. Nech P P n s hustotou f. Nech x 0, x 1,..., x n jsou pevné body v R n takové, ºe = conv{x 0, x 1,..., x n } je neprázdná. (i) Platí n f(x j ) j=0 ( ) n+1 P ( ). (ii) Jestliºe f(x i ) > 0, i = 1,..., n a poloºíme-li ( n 1/n f(x 1,..., x n ) = f(x i )), i=1 potom ( ) n+1 f(x 0 ) f(x 1,..., x n )) P ( ). (2.4) f(x 1,..., x n ) (iii) Pokud je levá strana nerovnosti (2.4) men²í nebo rovna 1, potom ( f(x 0 ) f(x 1,..., x n )) exp n n f(x ) 1,..., x n ). P ( ) D kaz. D kaz je uveden v [13]. Z této v ty plynou d sledky týkající se mezí pro log-konkávní hustoty. Pomocí následujícího lemmatu najdeme horní odhad pro hustotu f na mnoºin. Dolní odhad získáme z poznatku, ºe konkávní funkce na simplexu nabývá minima v jednom z krajních bod. 28
Lemma 2.3.2. Nech x 0, x 1,..., x n R n a jsou jako ve V t 2.3.1. Potom pro kaºdé P P n s hustotou f takovou, ºe f(x i ) > 0, i = 1,..., n a pro libovolné y platí min f(x i) f(y) i=0,...,n ( ) n+1 ( P ( ) D kaz. D kaz lze nalézt v [13] jako Lemma 3.2. min f(x i) i=0,...,n ) n. Lemma 2.3.3. Nech x 0, x 1,..., x n R n jsou jako ve V t 2.3.1. Potom existuje konstanta C = C(x 0,..., x n ) > 0 s následující vlastností: Pro libovolné rozd lení P P n s hustotou f takovou, ºe f(x i ) > 0, i = 1,..., n a libovolné y R n platí f(y) max i=0,...,n f(x i)h ( ) C min f(x i)(1 + y 2 ) 1/2, i=1,...,n kde H(t) = { t (n+1) pro t [0, 1], exp(n nt) pro t 1. D kaz. D kaz je uveden v [13] jako Lemma 3.3. D sledek 2.3.4. Pro P P n s hustotou f existuje konstanta C 1 = C 1 (P ) > 0 a C 2 = C 2 (P ) > 0 taková, ºe platí f(x) C 1 exp( C 2 x ), pro v²echna x R n. Z tohoto d sledku plyne, ºe v²echny log-konkávní funkce jsou nutn subexponenciální a unimodální. Unimodálním funkcím se budeme podrobn ji v novat v ásti 3.2.1, kde dokáºeme, ºe kaºdá log-konkávní funkce je unimodální, ale opak neplatí. 29
3. Aplikace Log-konkávní rozd lení mají adu aplikací nap íklad v ekonomii, teorii spolehlivosti (viz odstavec 1.2), teorii her nebo ve stochastickém programování. 3.1 Stochastické programování Budeme se zabývat otázkou, kdy je mnoºina p ípustných e²ení úlohy stochastického programování konvexní. Tuto podkapitolu zpracujeme podle [4]. M jme obecnou úlohu stochastického programování s pravd podobnostními omezeními min f(x) za podmínek P (g 1 (x, ω) 0,..., g r (x, ω) 0) p, h 1 (x) 0,..., h s (x) 0, kde ω je náhodný vektor v R m, p (0, 1) je p edepsaná pravd podobnost, funkce g 1 (x, ω),..., g r (x, ω) jsou konvexní funkce v R n+m, h 1 (x),..., h s (x) a f(x) jsou konvexní v R n. V ta 3.1.1. Nech g 1 (x, y),..., g r (x, y) jsou konvexní funkce na R n R m. Nech ω je náhodný vektor, jehoº rozd lení je log-konkávní na R m. Potom funkce je log-konkávní na R n. D kaz. Ozna me h(x) = P (g 1 (x, ω) 0,..., g r (x, ω) 0) H(x) = {y g i (x, y) 0, i = 1,..., r}, kde x R n je parametr, dále L = {x R n : H(x) }. Nejprve ukáºeme, ºe L je konvexní mnoºina. Zvolíme x 1, x 2 L, λ [0, 1] libovoln. Potom existují y 1 H(x 1 ) a y 2 H(x 2 ) takové, ºe g i (x 1, y 1 ) 0, i = 1,..., r, g i (x 2, y 2 ) 0, i = 1,..., r. Podle p edpokladu jsou funkce g i, i = 1,..., r konvexní, proto g i (λx 1 +(1 λ)x 2, λy 1 + (1 λ)y 2 ) λg i (x 1, y 1 ) + (1 λ)g i (x 2, y 2 ) 0, i = 1,..., r, 30
tedy a tedy V²imn me si, ºe λy 1 + (1 λ)y 2 H(λx 1 + (1 λ)x 2 ), λx 1 + (1 λ)x 2 L. H(λx 1 + (1 λ)x 2 ) λh(x 1 ) + (1 λ)h(x 2 ). (3.1) Jestliºe L =, je h(x) 0 a tvrzení platí triviáln. Jestliºe L, existuje x L a m ºeme psát h(x) = P {g i (x, ω) 0, i = 1,..., r} = P (ω H(x)), x R n. Protoºe P je log-konkávní pravd podobnostní míra, pro libovolné x 1, x 2 L, λ [0, 1] platí h(λx 1 + (1 λ)x 2 ) = P (ω H(λx 1 + (1 λ)x 2 )) (3.1) P (ω λh(x 1 ) + (1 λ)h(x 2 )) (2.2) [P (ω H(x 1 ))] λ [P (ω H(x 2 ))] (1 λ) = h(x 1 ) λ h(x 2 ) 1 λ. Funkce h je podle (2.1) log-konkávní na konvexní mnoºin L. Protoºe pro x L je h(x) = 0, je funkce h log-konkávní na celém prostoru R n. Tato v ta má aplikace v teorii i v praktických p íkladech. Uvaºujme funkci h(x 1, x 2 ) = P (x 1 ξ x 2 ), x 1, x 2 R, (3.2) kde ξ je náhodná veli ina. Jestliºe ξ má log-konkávní rozd lení, funkce h denovaná p edpisem (3.2) je podle p edchozí v ty log-konkávní: Denujme funkce kde x = (x 1, x 2 ) R 2. Potom je podle V ty 3.1.1 log-konkávní. g 1 (x, y) = x 1 y, g 1 (x, y) = y x 2, P (x 1 ξ x 2 ) = P (g 1 (x, ξ) 0, g 2 (x, ξ) 0) Náhodná veli ina X má log-normální rozd lení, pokud log(x) je náhodná veli ina s normálním rozd lením. Hustota je dána f(x) = 1 ) ( x 2π exp (log x)2, x > 0. 2 31
Na rozdíl od normálního rozd lení, hustota log-normálního rozd lení není logkonkávní. Protoºe druhá derivace je rovna (log f(x)) = = = ( log ( log 1 ( x 2π exp )) (log x)2 2 1 + log 1 (log x)2 2π x 2 ( 1 x log x x ) = log(x) x 2, je hustota na intervalu (0, 1) log-konkávní, na (1, + ) log-konvexní. Náhodný vektor Z = (Z 1,..., Z n ) má n-rozm rné log-normální rozd lení, pokud vektor Y = (log(z 1 ),..., log(z n )) má mnohorozm rné normální rozd lení. Distribu ní funkci vektoru Z v bod z = (z 1,..., z n ) R n, z i > 0 m ºeme napsat jako F Z (z) = P (Z 1 z 1,..., Z n z n ) = P (e Y 1 z 1 0,..., e Yn z n 0), kde Y i = log(x i ), i = 1,..., n. Protoºe mnohorozm rné normální rozd lení je podle odstavce 2.2.1 log-konkávní a pro y R n, z R n jsou funkce ) g i (z, y) = e y i z i, i = 1,..., n konvexní, jsou spln ny p edpoklady V ty 3.1.1 a distribu ní funkce log-normálního rozd lení je log-konkávní. 3.2 Maximáln v rohodný odhad log-konkávní hustoty a distribu ní funkce V této kapitole budeme hledat neparametrický odhad log-konkávní hustoty f metodou maximální v rohodnosti. Omezíme se na jednorozm rný p ípad. 3.2.1 Unimodální funkce Platí, ºe kaºdá log-konkávní hustota je automaticky i unimodální. Maximáln v rohodný odhad spojité unimodální hustoty s neznámým modem obecn neexistuje (viz [6]), ale maximáln v rohodný odhad log-konkávní hustoty existuje. Denice 3.2.1. Hustota f : R R je unimodální na [a, b], jestliºe existuje íslo m [a, b] takové, ºe pro v²echna a x y m a m y x b platí ƒíslo m nazýváme modus. f(x) f(y). 32
Tvrzení 3.2.2. Log-konkávní funkce je unimodální. D kaz. Dokáºeme sporem. Nech funkce f je log-konkávní na [a, b], ale není unimodální. Protoºe není unimodální, existují body a x c y b takové, ºe f(x) > f(c) < f(y). Najdeme λ (0, 1), takové ºe λx + (1 λ)y = c. Potom platí coº je spor s tím, ºe f je log-konkávní. f(λx + (1 λ)y) < f(x) λ f(y) 1 λ, Poznámka 3.2.3. Obrácené tvrzení z ejm neplatí. Nap íklad hustota Paretova rozd lení (viz p íklad 1.4.3) je unimodální a log-konvexní. Log-konkávní hustotu m ºeme charakterizovat jako striktn unimodální: Denice 3.2.4. Hustota f : R R je striktn unimodální, pokud f je unimodální a pro libovolnou unimodální funkcí g jejich konvoluce f g je op t unimodální. V ta 3.2.5. Hustota f na R je log-konkávní práv tehdy, kdyº je striktn unimodální. D kaz. D kaz najdeme v [8]. Pomocí této v ty m ºeme alternativn dokázat, ºe sou et dvou nezávislých náhodných veli in s log-konkávním rozd lením je náhodná veli ina, která má také log-konkávní rozd lení. Toto tvrzení je uvedeno v D sledku 2.1.5. 3.2.2 Existence a jednozna nost odhadu M jme uspo ádaný náhodný výb r X 1,..., X n, n > 1 z rozd lení, které má distribu ní funkci F. P edpokládáme, ºe hustota f je log-konkávní, tedy ve tvaru f(x) = exp φ(x), x R, pro n jakou konkávní funkci φ : R [, ). Logaritmická v rohodnost je denována jako L n (f) = n log f(x)df n (x) = n log f(x i ), (3.3) kde F n zna í empirickou distribu ní funkci výb ru X 1,..., X n, která je rovna i=1 F n (x) = 1 n n 1 [Xi x], x R. i=1 Maximáln v rohodný odhad hustoty je minimum funkcionálu L n (f) p es v²echny log-konkávní hustoty. Následující v ta z [14] nám pom ºe zbavit se omezení, ºe f musí být hustota. 33
V ta 3.2.6. Nech g je reálná funkce, poloºme a A(g) = 1 n A 0 (g) = 1 n n g(x i ) i=1 n g(x i ) + i=1 e g(x) dx. Funkce ĝ minimalizuje A 0 (g) za podmínky, ºe e g(x) dx = 1 práv tehdy, kdyº ĝ minimalizuje A(g). D kaz. Denujme g (x) = g(x) log e g(x) dx, platí e g (x) dx = 1. A(g ) = 1 n n i=1 n = 1 n i=1 = A(g) A(g), ( g(x i ) log g(x i ) + log e g(x) dx + log ) e g(x) dx + e g(x) dx + e g(x) dx + 1 ( exp g(x) log ( exp g(x) log ) e g(x) dx dx ) e g(x) dx dx protoºe t log t 1 pro v²echna t > 0, rovnost A(g ) = A(g) nastává v p ípad, kdy e g(x) dx = 1. Poznámka 3.2.7. Tato v ta nezaru uje existenci funkce ĝ, která minimalizuje A 0 (g), p ípadn A(g). Podle V ty 3.2.6 m ºeme v rohodnost (3.3) modikovat Ψ n (φ) = n φ(x)df n (x) + n exp φ(x)dx. a p evést na úlohu bez omezení. Maximáln v rohodný odhad ˆφ n funkce φ získáme minimalizací funkcionálu Ψ n (φ) p es v²echny reálné funkce Odhad hustoty získáme jako ˆφ n = argmin Ψ n (φ). ˆf n (x) = { exp( ˆφn (x)) pro x [X 1, X n ], 0 jinak. 34 R
Podobn pro distribu ní funkci platí ˆF n (x) = x ˆf n (u)du. Pomocí hustoty a distribu ní funkce m ºeme odhadnout nap íklad intenzitu poruch (hazardní funkci) následovn ˆr n (x) = ˆf n (x) 1 ˆF n (x) pro x < X n. Následující v ta íká, ºe minimum funkcionálu Ψ n (φ) skute n existuje a udává jeho vlastnosti. Toto tvrzení je uvedeno v [11]. V ta 3.2.8. Existuje jednozna n ur ená konkávní funkce ˆφ n minimalizující Ψ n (φ). ˆφ n je po ástech lineární, body zlomu se nacházejí v pozorovaných hodnotách X 1,..., X n, je spojitá na intervalu [X 1, X n ] a ˆφ n =, x [X 1, X n ]. D kaz. Nech φ je libovolná konkávní funkce, pro niº Ψ n (φ) < +. Denujme funkci φ následovn : φ(x i ) = φ(x i ), i = 1,..., n, φ je lineární mezi jednotlivými pozorováními, φ(x) =, x [X 1, X n ]. Protoºe φ je konkávní, je φ φ a proto exp φ(x)dx exp φ(x)dx. Musí tedy platit R Ψ n ( φ) = n n i=1 R n φ(x i ) + n exp φ(x)dx R n φ(x i ) + n exp φ(x)dx i=1 = Ψ n (φ), rovnost nastává pouze v p ípad φ = φ. Minimum Ψ n je ve tvaru φ. Pro φ = φ 0 + t, t 0, kde exp(φ 0 ) je hustota a tedy exp(φ 0 (x))dx = 1, R 35
platí Ψ n (φ) = n = n = n (φ 0 (x) + t)df n (x) + n exp(φ 0 (x) + t)dx (φ 0 (x) + t)df n (x) + n exp(φ 0 (x) + t)dx ( ) + n exp(φ 0 (x))dx 1 φ 0 (x)df n (x) n tdf n (x) + n e t exp φ 0 (x)dx + n exp(φ 0 (x))dx n = Ψ n (φ 0 ) + n (exp(t) t 1) > Ψ n (φ 0 ). Protoºe hledáme minimum Ψ n, m ºeme se omezit na p ípad kdy exp(φ(x))dx = 1. Ozna íme vektor φ = (φ(x i )) n i=1 Rn. Protoºe funkcionál φ Ψ n (φ) je spojitý, k d kazu existence bodu minima zbývá ukázat, ºe Ψ n (φ), pro φ 2 = n φ(x i ) 2. Nech (φ (k) ) k=1 je posloupnost vektor spl ující i=1 φ (k) 2 k, ozna íme-li i-tou sloºku vektoru φ (k) jako φ (k) i φ (k) i = φ (k) (X i ), platí k γ i [, ], i = 1,..., n. Jestliºe γ i < pro v²echna i, potom existuje alespo jeden index i takový, ºe γ i =, a platí n Ψ n (φ (k) ) = + n k. i=1 φ (k) i Jestliºe existuje j > 1 takové, ºe γ j =, pak 1 = Xj exp ( φ (k) (x) ) dx X j 1 1 ( ) exp(φ (k) j ) exp(φ (k) j 1 ) φ (k) j φ (k) j 1 X j X j 1 = (X j X j 1 ) exp(φ (k) j ) 1 exp( δ k) δ k (X j X j 1 ) exp(φ (k) j )(1 + δ k ) 1, 36