ZÁklady teorie pravděpodobnosti Pro předmět MatematickÁ statistika 1 Michal Kulich Katedra pravděpodobnosti a matematické statistiky Matematicko-fysikální fakulta University Karlovy
Tyto poznámky poskytují souhrn základních poznatků z teorie pravděpodobnosti, jež jsou potřebné pro výuku předmětu Matematická statistika 1 v rámci bakalářského studia oboru Obecná matematika na MFF UK. Některé z nich se probírají v předmětech Pravděpodobnost a matematická statistika a Teorie pravděpodobnosti 1, některé budou probrány na cvičení k předmětu Matematická statistika 1. Autor bude povděčen za upozornění na případné překlepy a nejasnosti, které laskavý čtenář nalezne kdekoli v tomto dokumentu. Michal Kulich kulich@karlin.mff.cuni.cz DánovKarlínědne14.října2015
Obsah ZnaČenÍ 6 1 Úvod 8 1.1 Pravděpodobnost................................. 8 1.2 Náhodnáveličina................................. 9 1.3 Rozdělenínáhodnéveličiny,hustota....................... 9 2 ReÁlnÁ náhodná veličina a její rozdělení 11 2.1 Charakterizacerozděleníreálnénáhodnéveličiny............... 11 2.2 Momentyreálnénáhodnéveličiny........................ 12 3 NÁhodnÝ vektor a mnohorozměrné rozdělení 15 3.1 Rozdělenínáhodnéhovektoru.......................... 15 3.2 Momenty...................................... 17 3.3 Nezávislost..................................... 18 3.4 Korelace....................................... 19 4 PodmÍnĚnÉ rozdělení 21 4.1 Podmíněnáhustota................................ 21 4.2 Podmíněnástředníhodnota........................... 22 4.3 Podmíněnýrozptyl................................. 23 5 Transformace náhodných veličin a vektorů 24 5.1 Transformacenáhodnýchveličin......................... 24 5.2 Transformacenáhodnýchvektorů........................ 25 6 NormÁlnÍ rozdělení 28 6.1 Mnohorozměrnénormálnírozdělení...................... 28 6.2 Rozděleníχ 2,taF................................. 29 7 LimitnÍ věty 31 7.1 Konvergencenáhodnýchveličinavektorů................... 31 7.2 Zákonyvelkýchčísel................................ 33 7.3 Centrálnílimitnívěta............................... 33 8 PŘehled pravděpodobnostních rozdělení 35 8.1 Diskrétnírozdělení................................. 35 8.1.1 Alternativnírozdělení........................... 35 8.1.2 Binomickérozdělení........................... 35 8.1.3 Geometrickérozdělení.......................... 36 3
8.1.4 Poissonovorozdělení........................... 36 8.1.5 Negativněbinomickérozdělení..................... 36 8.2 Spojitározdělení.................................. 37 8.2.1 Rovnoměrnérozdělení.......................... 37 8.2.2 Normálnírozdělení............................ 37 8.2.3 Normovanénormálnírozdělení..................... 37 8.2.4 Cauchyovorozdělení........................... 38 8.2.5 Exponenciálnírozdělení......................... 38 8.2.6 Gamarozdělení.............................. 38 8.2.7 Betarozdělení............................... 39 8.2.8 χ 2 rozdělení................................ 39 8.2.9 Studentovot-rozdělení.......................... 40 8.2.10 (Fisherovo)F-rozdělení.......................... 40 8.3 Mnohorozměrnádiskrétnírozdělení....................... 42 8.3.1 Multinomickérozdělení.......................... 42 8.4 Mnohorozměrnáspojitározdělení........................ 42 8.4.1 Mnohorozměrnénormálnírozdělení.................. 42 4
5
ZnaČenÍ a T a 2 aa T transpozicevektoru a a eukleidovská norma vektoru a P konvergence v pravděpodobnosti sj konvergence skoro jistě D konvergence v distribuci X L X mápřesnérozděleníl X as. L X má přibližně(asymptoticky) rozdělení L (X, Y ) γ 3 šikmostnáhodnéveličiny γ 4 špičatostnáhodnéveličiny λ LebesgueovamíranaR µ S čítacímírananejvýšespočetnémnožině S µ k k-týcentrálnímomentnáhodnéveličiny µ k k-týmomentnáhodnéveličiny σ X σ 2 X korelační koeficient náhodných veličin X a Y směrodatnáodchylkanáhodnéveličiny X rozptylnáhodnéveličiny X ϕ hustota normovaného normálního rozdělení Φ distribuční funkce normovaného normálního rozdělení Ω prostor elementárních jevů 1 B indikátormnožiny B A σ-algebra náhodných jevů na Ω B 0 B n 0 cor (X, Y ) cor (X, Y ) borelovskáσ-algebrana R borelovskáσ-algebrana R n korelační koeficient náhodných veličin X a Y korelačnímaticenáhodnýchvektorů X a Y cov (X 1, X 2 ) kovariancenáhodnýchveličin X 1 a X 2 cov (X 1, X 2 ) kovariančnímaticenáhodnýchvektorů X 1 a X 2 E X E (U Z= z ) E (U Z ) střední hodnota náhodné veličiny(vektoru) X podmíněnástředníhodnotanáhodnéhovektoru U,je-lidánoZ= z podmíněnástředníhodnotanáhodnéhovektoru U,je-lidánoZ 6
f X f (y z) F X F 1 X L p L(X ) m X P P X hustotanáhodnéveličiny(vektoru) X podmíněnáhustotanáhodnéhovektoru Y,je-lidánoZ= z distribučnífunkcenáhodnéveličiny(vektoru) X kvantilová funkce náhodné veličiny X množinanáhodnýchveličinna (Ω,A, P) skonečným p-tým absolutním momentem rozdělení náhodné veličiny(vektoru) X mediánnáhodnéveličiny X pravděpodobnost rozdělenínáhodnéveličiny X,jejíindukovanámíranavýběrovémprostoru R množina reálných čísel S X u X (α) var X var (U Z= z ) var (U Z ) nosičrozdělenínáhodnéveličiny X α-kvantilnáhodnéveličiny X rozptyl náhodné veličiny X var X rozptylová matice náhodného vektoru X podmíněnýrozptylnáhodnéhovektoruu,je-lidánoz= z podmíněnýrozptylnáhodnéhovektoruu,je-lidánoz X výběrový prostor 7
1 Úvod 1.1 PravdĚpodobnost Nechť je dána libovolná množina Ω. Definice 1.1 Systém A podmnožin množiny Ω nazveme σ-algebrou pokud platí (i) A; (ii) A A A c A; (iii) A 1, A 2, A 3,... A i=1 A i A. Definice 1.2(Kolmogorovova definice pravděpodobnosti) Nechť Ω je nějaká množina a A σ-algebra jejích podmnožin. Funkci P : A 0, 1 nazveme pravděpodobností, právě když splňuje následující podmínky: (a) P(A) 0, P(Ω)=1; (b) A 1, A 2, A 3,... Aa A i A j = i j P( i=1 A i )= i=1 P(A i ). [Dupač& Hušková 1999, Df. 1.1] Definice 1.3 Množinu Ω nazýváme prostor elementárních jevů, její prvky ω Ω nazýváme elementární jevy. Prvky σ-algebry A nazýváme měřitelné množiny nebo také náhodné jevy. Trojici (Ω, A, P) nazýváme pravděpodobnostní prostor. Definice 1.4 (Podmíněná pravděpodobnost) Mějme náhodné jevy A, B, nechť P(B) > 0. Podmíněná pravděpodobnost jevu A za podmínky, že nastal jev B je dána vztahem P ( A B )= P(A B). P(B) [Dupač& Hušková 1999, Df. 1.2] Tvrzení1.1 Prolibovolných n+1jevů A 1,..., A n+1 takových,že P(A 1 A n )> 0platí [Dupač&Hušková1999,V.1.2] P(A 1 A n+1 )= P(A 1 ) P ( A 1 A 0 ) P ( A n+1 A 1 A n ). Tvrzení1.2 Nechť B 1, B 2,...jeposloupnostvzájemněneslučitelnýchjevůtakových,že P(B i )> 0 i a i P(B i )=1.Pakprolibolnýnáhodnýjev A platí P(A)= P ( A B i ) P(B i ). i=1 [Dupač&Hušková1999,V.1.3] 8
1 Úvod Definice 1.5(Nezávislost náhodných jevů) Náhodnéjevy A 1,..., A n nazveme(vzájemně)nezávislé právěkdyžplatí P(A 1 A n )= P(A 1 ) P(A n ). Náhodnéjevy A 1, A 2,...nazvemenezávislé právěkdyžplatí k> 1 n 1,..., n k N A n1,..., A nk jsounezávislé. [Dupač&Hušková1999,Df.1.3a1.4] Tvrzení1.3 Nechť A 1,..., A n jsounezávisléjevy.pakplatí (i) A 1,..., A n 1, A c n jsounezávisléjevy. (ii) P ( A 1 A j A j+1 A n ) = P(A1 A j ). [Dupač&Hušková1999,V.1.5a1.6] 1.2 NÁhodnÁ veličina Nechť je dán pravděpodobnostní prostor (Ω, A, P). Definice1.6 Měřitelnézobrazení X : (Ω,A) (X,B),kdeXjenějakámnožinaaBnějaká σ-algebra na X, nazveme náhodnou veličinou. Množinu X nazýváme výběrový prostor. Poznámka. Nechťjsoudányσ-algebryA namnožiněωab namnožiněx.zobrazení X : Ω Xjeměřitelnévzhledemkσ-algebrámAaB,právěkdyž B Bplatí{ω Ω:X (ω) B} A(tj.vzoryměřitelnýchmnožinjsouměřitelné). Poznámka. Zvolíme-liX=R a zab vezmeme borelovské množiny na R, dostaneme reálnounáhodnouveličinu(většinou zvanou pouze náhodnáveličina ).Zvolíme-liX= R k a zab vezmemeborelovské množinyna R k, dostaneme náhodnývektor. Jiné volbyx pak vygenerují náhodnou posloupnost či náhodný proces. 1.3 RozdĚlenÍ náhodné veličiny, hustota Definice 1.7 Rozdělením náhodné veličiny X : (Ω, A) (X, B) rozumíme indukovanou pravděpodobnostnímíru P X na (X,B)definovanouvztahem P X (B) df = P({ω Ω:X (ω) B}), B B. Pravděpodobnost P X (B)značímetaké P[X B]. [Dupač&Hušková1999,pozn.nastr.20] Poznámka. Pravděpodobnostní prostor (Ω, A, P) se pro danou náhodnou veličinu X transformujenapravděpodobnostníprostor (X,B, P X ). Tvrzení 1.4 (Věta o přenosu integrace) Nechť h jest měřitelná funkce z (X,B) do (R,B 0 ). Pak platí h(x (ω)) dp(ω)= h(x) dp X (x). Ω X [Anděl 2002, V. 1.1] 9
1 Úvod Poznámka. Míra µ na (X,B)jeσ-konečná,právěkdyžexistujímnožiny B 1, B 2, B 3,... Btakové, že µ(b i )< a i=1 B i=x. Míra P X jeabsolutněspojitávzhledemkmíře µ na (X,B) právěkdyž B Bµ(B)= 0 P X (B)=0. Tvrzení 1.5 (Radon-Nikodymova věta) Nechť X : (Ω, A) (X, B) je náhodná veličina, nechť µ jeσ-konečná míra nax a nechť P X je absolutně spojitá vzhledem k µ. Pak existuje reálná měřitelná nezáporná funkce f X (x) taková, že pro každou měřitelnou funkci h : (X,B) (R,B 0 ) platí h(x) dp X (x)= h(x)f X (x) dµ(x). X X Funkce f X (x)jeurčenajednoznačně µ-skorovšude. Definice1.8 Funkce f X zpředchozívětysenazýváhustotounáhodnéveličiny X vzhledemk míře µ. Definice1.9 Nechť B B.Funkci nazýváme indikátor množiny B. 1 B (x)= 1 pokud x B, 0 jinak Poznámka. Zvolmenějaké B Badosaďmezafunkci h indikátormnožiny B.Pakmámez věty o přenosu integrace 1 B (X (ω)) dp(ω)= 1 dp X (x)=p[x B] a z Radon-Nikodymovy věty P[X B]= 1 B (x) dp X (x)= Ω X X B 1 B (x)f X (x) dµ(x)= Hustota tedy jednoznačně určuje rozdělení náhodné veličiny X. B f X (x) dµ(x). 10
2 ReÁlnÁ náhodná veličina a její rozdělení Nechť je dán pravděpodobnostní prostor (Ω, A, P). V této kapitole se zabýváme reálnými náhodnýmiveličinami,tj. X : (Ω,A) (R,B 0 ). 2.1 Charakterizace rozdělení reálné náhodné veličiny Uveďme si několik způsobů, jak specifikovat rozdělení reálné náhodné veličiny. Výčet nebude úplný, existují i jiné způsoby(charakteristická funkce). Hustota Zvolmeσ-konečnoumíru µnartak,aby P X bylaabsolutněspojitávzhledemk µ.podletvrzení1.5apoznámkypoddefinicí1.8existujenezápornáměřitelná f X : R R(jednoznačně určená skoro všude) taková, že P[X B]= B f X (x) dµ(x) B B 0. Vezmeme-li B = R, máme f X (x) dµ(x)=1. Příklad. P X absolutně spojitá vzhledem k Lebesgueově mířeλ: X je spojitá náhodná veličina [náhodná veličina se spojitým rozdělením] P X absolutně spojitá vzhledemkčítací míře µ S (S nejvýše spočetná množinavr): X je diskrétní náhodná veličina[náhodná veličina s diskrétním rozdělením] P X absolutněspojitávzhledemkλ+ µ {0} :náhodnáveličinasdiskrétníispojitousložkou DistribuČnÍ funkce Definice2.1 Funkci F X : R Rdefinovanou vztahem F X (x)=p[x x]nazývámedistribučnífunkcí náhodnéveličiny X.[Dupač&Hušková1999,Df.2.4] Poznámka. Distribučnífunkce F X jednoznačněcharakterizujerozdělení X. (Jedním směrem zřejmé, druhým směrem plyne z toho, že množiny (, x generují borelovskouσ-algebrub 0 ). Poznámka. Uspojiténáhodnéveličinymáme F X (x)= x f X (t ) dt,zčehožplyne f X (x)= df X (x)/dx skoro všude. Udiskrétnínáhodnéveličinyshodnotamiv S máme F X (x)= t S, t x P[X= t],zčehožplyne P[X= x]= F X (x). 11
2 Reálná náhodná veličina a její rozdělení Tvrzení 2.1(Vlastnosti distribuční funkce) (i) F X jeneklesající,zpravaspojitá (ii) lim x F X (x)=0,lim x F X (x)=1 (iii) Prolibovolnouměřitelnou h : R Rplatí h(x)f X (x) dµ(x)= h(x) df X (x) [Dupač&Hušková1999,V.2.2] Poznámka. h(x) df X (x) je Lebesgueův-Stieltjesův integrál. Tvrzení 1.4, 1.5 a 2.1 dohromady dávají h(x (ω)) dp(ω)= h(x) dp X (x)= h(x)f X (x) dµ(x)= h(x) df X (x). Ω KvantilovÁ funkce Definice2.2 Nechť F X jedistribučnífunkcereálnénáhodnéveličiny X.Funkce F 1 X (u)=inf{x : F X (x) u}, u (0,1) se nazývá kvantilová funkce náhodné veličiny X. Poznámka. Kvantilová funkce je neklesající a zleva spojitá. Z kvantilové funkce lze jednoznačněurčitfunkcidistribuční.je-li F X rostoucíaspojitá,pak F 1 X jeinversnífunkcíkf X. Definice2.3 Nechťα (0,1).α-kvantil u X (α)rozdělení F X jekterékolireálnéčíslosplňující lim hց0 F X (u X (α) h) α a F X (u X (α)) α. Poznámka. Definicíkvantilujevíce,tatojejneurčujevždyjednoznačně. F 1 X (α) jevždyjeden z α-kvantilů. Definice 2.4 0.5-kvantilsezovemediánnáhodnéveličiny X;budemejejznačit m X 0.25- a 0.75-kvantily se zovou kvartily náhodné veličiny X 2.2 Momenty reálné náhodné veličiny Definice 2.5 Střední hodnotou E X (reálné) náhodné veličiny X rozumíme reálné číslo E X dané výrazem E X df = X (ω) dp(ω), Ω pokud integrál na pravé straně existuje. Poznámka. Tuto definici lze snadno použít i v obecnějších výběrových prostorech. 12
2 Reálná náhodná veličina a její rozdělení Poznámka. Nechť h je reálná měřitelná funkce. Poznámka pod tvrzením 2.1 říká, že E h(x )= h(x) dp X (x)= h(x)f X (x) dµ(x)= h(x) df X (x) Integrál uprostřed umíme v principu počítat pro µ Lebesgueovu nebo čítací míru. Integrál vpravo je Lebesgueův-Stieltjesův integrál. Výhodou tohoto zápisu je, že nemusíme specifikovat míru µ. Značení. ZnačkouL p budemeznačitmnožinuvšechreálnýchnáhodnýchveličinna (Ω,A, P) takových,že E X p <. Tvrzení2.2(Vlastnostistředníhodnoty) Nechť X, Y L 1.Pakplatí (i) E (a+ bx )= a+ be X a, b R (ii) E (X+ Y )= E X+ EY (iii) P[X Y]=1 E X EY (iv) Jestliže µ R x R f X (µ x)=f X (µ+ x)pak E X= µ Věta2.3 Nechť X L 1 jespojitá,mádistribučnífunkci F X aplatí X 0s.j.Pak [Anděl 2002, V. 1.2] E X= 0 [1 F X (x)] dx. Definice 2.6 µ df = E X k se nazývá k-tý moment náhodné veličiny X (typicky je k přirozené, ale k nemusítotaknutněbýt) df µ k = E (X E X ) k senazývá k-týcentrálnímoment náhodnéveličiny X E X k senazývá k-týabsolutnímoment náhodnéveličiny X Definice 2.7 Rozptyl var X náhodné veličiny X je její druhý centrální moment, tj. var X = E (X E X ) 2.Rozptylsemůžetakéznačitσ 2 X neboσ2. Směrodatná odchylkaσ X náhodné veličiny X je odmocnina z jejího rozptylu,σ X = var X. df Šikmostγ 3 náhodnéveličiny X jedefinovánajakoγ 3 = µ 3 /σ 3. df Špičatostγ 4 náhodnéveličiny X jedefinovánajakoγ 4 = µ 4 /σ 4. Tvrzení 2.4 (Vlastnosti rozptylu) Nechť X je náhodná veličina taková, že var X platí (i) var X 0;navíc var X=0 c R:P[X= c]=1 (ii) var X= E X 2 (E X ) 2 (iii) var (a+ bx )= b 2 var X pro a, b R <. Pak Věta2.5(Jensenovanerovnost) Nechť X jenáhodnáveličinashodnotamivintervalui R (můžebýtnekonečný),tj. P [ X I ] = 1.Nechť g je[neostře]konvexnífunkcenai taková, žeexistuje E g (X ).Pak E g (X ) g (E X ) arovnostnastáváprávěkdyž g (x)=a+ bx nebo X jekonstantaskorojistě. 13
2 Reálná náhodná veličina a její rozdělení Důsledky. 1. E X 2 (E X ) 2. 2. E log X log E X pro X L 1 takovou,že P[X> 0]=1. 3. Nechť p> q> 0.Pak ( E X p) 1/p ( E X q) 1/q. 4. Nechť p> q> 0aE X p <.Pak E X q <. Věta2.6(Markovovanerovnost) Nechť X L r,kde r> 0.Pakprolibovolnéε> 0 [Dupač& Hušková 1999, V. 2.10(ii)] P [ X ε ] E X r ε r. Důsledek(Čebyševovanerovnost). Pro X L 2 aprolibovolnéε> 0platí P [ X E X ε ] var X ε 2. Důsledek. Pro X L 2 srozptylem var X=σ 2 platí(například) P [ X E X 3σ ] 1 9. 14
3 NÁhodnÝ vektor a mnohorozměrné rozdělení Nechť je dán pravděpodobnostní prostor (Ω, A, P). V této kapitole se zabýváme náhodnými vektory,tj. X : (Ω,A) (R n,b n 0 ). 3.1 RozdĚlenÍ náhodného vektoru Poznámka. Náhodný vektor je(do sloupce) uspořádaná n-tice náhodných veličin, tj. X(ω)=(X 1 (ω),..., X n (ω)) T. Definice3.1 B n 0 jeborelovskáσ-algebravrn definovanájako B n 0 =σ{(a 1, b 1 ) (a 2, b 2 ) (a n, b n ); a 1 < b 1, a 2 < b 2,..., a n < b n R} Poznámka. Míruna (R n,b n 0 )stačídefinovatnaněkterémgenerátoruborelovskéσ-algebry, např. na otevřených nebo uzavřených n-rozměrných kvádrech. Hustota náhodného vektoru Poznámka. PodleRadon-Nikodymovyvěty(Tvrzení1.5)platí:Jestliže P X jeabsolutněspojitávzhledemkσ-konečné míře µ na (R n,b0 n ),tj. µ(b)=0 P[ X B ] = 0pro B B0 n, pak existuje jednoznačně (až na množiny s nulovou mírou µ) daná nezáporná měřitelná funkce f X (x) : R n R,zvanáhustota náhodnéhovektoru X taková,že h(x(ω)) dp(ω)= h(x) dp X (x)= h(x)f X (x) dµ(x) Ω R n R n prokaždouměřitelnoufunkci h : R n R. Značení. VdalšímvýkladupoužívámevargumentechfunkcídefinovanýchnaR n záměnně značeníxa (x 1,..., x n ). Poznámka. Jestližejerozdělení X absolutněspojitévzhledemklebesgueověmířeλ n na R n,pak rozdělenínáhodnéhovektoru X nazývámespojité a P [ X B ] počítámejako 1 B (x)f X (x) dx 1 dx 2... dx n. 15
3 Náhodný vektor a mnohorozměrné rozdělení Nechťjerozdělení X absolutněspojitévzhledemkčítacímíře µ S na R n,kde S jenejvýše spočetná množina bodů v R n tvaru S 1 S 2 S n a S k = {t k,1, t k,2,...}. Pak rozdělenínáhodnéhovektoru X nazývámediskrétní a P [ X B ] počítámejako 1 B (t 1,i1, t 2,i2,..., t n,in ) P [ X= (t 1,i1, t 2,i2,..., t n,in ) ]. i 1 =1 i 2 =1 i n =1 Jestliže náhodný vektor obsahuje diskrétní i spojité složky, pak jeho rozdělení není ani diskrétní, ani spojité. Přesto pro něj máme použitelnou hustotu, s jejíž pomocí můžemevyjádřit P [ X B ] Jestliže všechny složky náhodného vektoru jsou spojité, neznamená to nutně, že vektor jakocelekmáspojitérozdělení.příklad:rozdělenínajednotkovékružnicivr 2. DistribuČnÍ funkce náhodného vektoru Definice 3.2 Funkci F X (x)= P[X 1 x 1,..., X n x n ] nazýváme distribuční funkcí náhodného vektoru. [Dupač& Hušková 1999, Df. 3.1] Tvrzení3.1 Jestližejerozdělení X absolutněspojitévzhledemklebesgueověmířeλ n,pak anaopak, F X (x)= [Dupač& Hušková 1999, Df. 3.3] x1 xn f X (x)= n F X (x 1,..., x n ) x 1 x n f X (x 1,..., x n ) dx 1... dx n skorovšude. Poznámka. 1. Distribuční funkce jednoznačně určuje rozdělení náhodného vektoru X. 2. Kvůli jednoduššímu značení budeme psát h(x) df X (x) df = h(x)f X (x) dµ(x). R n R n SdruŽenÉ a marginální rozdělení Definice 3.3 Rozdělení celého náhodného vektoru X = (X 1,..., X n ) T se říká sdružené rozdělení. Jeho distribuční funkce a hustota se nazývají sdružená distribuční funkce a sdružená hustota. Rozdělením jednotlivých náhodných veličin X 1,..., X n se říká marginální rozdělení. Jejich distribuční funkce a hustoty se nazývají marginální distribuční funkce a marginální hustoty. 16
3 Náhodný vektor a mnohorozměrné rozdělení Tvrzení3.2 ZesdruženéhorozděleníXlzejednoznačněurčitmarginálnírozdělení X 1,..., X n. Platí F Xi (u)= lim F X (x 1,..., x i 1, u, x i+1,..., x n ) x 1,...,x i 1,x i+1,...,x n a pro spojitý náhodný vektor navíc f Xi (u)= 3.2 Momenty StŘednÍ hodnota f X (x 1,..., x i 1, u, x i+1,..., x n ) dx 1... dx i 1 dx i+1... dx n. (3.1) Poznámka. Podle definice 2.5 a poznámek na str. 15 a 16 máme pro libovolnou měřitelnou funkci h : R n R E h(x)= h(x(ω)) dp(ω)= h(x)f X (x) dµ(x)= h(x) df X (x). R n R n Ω Definice3.4 Proměřitelnou g : R n R m definujeme E g (X)=(E g 1 (X),..., E g m (X)) T. Poznámka. Střední hodnota náhodného vektoru je tedy vektorem středních hodnot jejích složek. Střední hodnota matice náhodných veličin je maticí středních hodnot jednotlivých prvků. Rozptyl Vtétočástinechť X i L 2, i=1,..., n. Značení. Nechť a je sloupcový vektor v R n. Pak definujeme a 2 df = aa T (matice součinů prvků a i a a j ). Definice 3.5 (a) Matice varx df = E (X EX) 2 = E (X EX)(X EX) T se nazývá rozptylová(varianční) matice náhodného vektoru X.[Dupač& Hušková 1999, Df. 3.5] (b) (i, j )-týprvekmatice varxjest E (X i E X i )(X j E X j )anazývásekovariancenáhodných veličin X i a X j.[dupač&hušková1999,df.3.4] 17
3 Náhodný vektor a mnohorozměrné rozdělení (c) Rozdělíme-li X na X= ( X 1 X 2 ),pakmatice cov (X 1, X 2 ) df = E (X 1 EX 1 )(X 2 EX 2 ) T senazývákovariančnímatice vektorů X 1 a X 2. Tvrzení 3.3 (i) i-týdiagonálníprvekmatice varx je var X i. (ii) varx jepositivněsemidefinitnímatice[značíme varx 0],tj. c R n c T (varx)c 0. (iii) Je-li var X singulární, pak existuje lineární kombinace složek X, jež je skoro jistě rovna konstantě. (iv) varx= EX 2 (EX) 2, cov (X 1, X 2 )= EX 1 X T 2 EX 1 EX T 2. (v) cov (X 1, X 2 )= cov (X 2, X 1 ) T, cov (X, X)= varx. (vi) Provektory a, camatice B, Dvhodnýchdimenzíplatí Speciálně: var (a+bx)= B (varx)b T. cov (a+bx 1, c+dx 2 )= Bcov (X 1, X 2 )D T. Důsledek. Dosadíme-livčásti(vi)předchozíhotvrzeníX 1 = X 2 = (X 1,..., X n ) T,a=c=0 ab=d= (1,...,1),dostanemevztahprorozptylsoučtu n náhodnýchveličin: var n X i = i=1 n n i 1 var X i +2 cov (X i, X j ) (3.2) i=1 i=2 j=1 Tvrzení 3.4 Nechť X a Y jsou náhodné vektory v R n, jejichž složky mají konečné druhé momenty. Pak platí var (X+Y )= varx+ cov (X, Y )+ cov (X, Y ) T + vary 3.3 NezÁvislost Definice3.6 [Dupač&Hušková1999,Df.3.6aV.3.6] Náhodnéveličiny X 1,..., X n nazveme(vzájemně)nezávislé právěkdyžprokaždýbod x= (x 1,..., x n ) R n platí F X (x)= F X1 (x 1 ) F Xn (x n ). Náhodnéveličiny X 1, X 2,...nazveme(vzájemně)nezávislé právěkdyž k> 1 n 1,..., n k N X n1,..., X nk jsounezávislé. Náhodnévektory X 1 s n 1 složkamiax 2 s n 2 složkaminazvemenezávislé právěkdyž prokaždýbod x= (x 1,..., x n ) R n platí F X (x)= F X1 (x 1 ) F X2 (x 2 ), kde n= n 1 + n 2, X=(X T 1, XT 2 )T ax= (x T 1, xt 2 )T. 18
3 Náhodný vektor a mnohorozměrné rozdělení Poznámka. Pro nezávislé náhodné veličiny platí, že vezmeme-li libovolné borelovské množiny B 1,..., B n B 0,pak P [ X B 1 B n ] = P[X1 B 1 ] P[X n B n ], nebolináhodnéjevy[x i B i ]jsouvzájemněnezávislé[dupač&hušková1999,v.3.8].dále máme např. P [ ] X 1 B 1 X 2 B 2,..., X n B n = P[X1 B 1 ]. Pronezávislénáhodnévektoryplatí,ževezmeme-lilibovolnéborelovskémnožiny B 1 B n 1 0 a B 2 B n 2 0,pak P [ X B 1 B 2 ] = P [ X1 B 1 ] P [ X2 B 2 ], nebolináhodnéjevy[x i B i ]jsounezávislé. Tvrzení3.5 Nechťnáhodnáveličina X i máhustotu f Xi vzhledemkσ-konečnémíře µ i, i= 1,..., n. Pak jsou náhodné veličiny X 1,..., X n vzájemně nezávislé právě když vektor X = (X 1,..., X n ) T máhustotu f X vzhledemksoučinovémíře µ= µ 1 µ n aplatí f X (x 1,..., x n )= n f Xi (x i ). i=1 [Dupač&Hušková1999,V.3.9] Tvrzení3.6 NechťX 1 ax 2 jsounezávislénáhodnévektorya g 1 : R n 1 R q a g 2 : R n 2 R s jsoulibovolnéměřitelnéfunkce.pak g 1 (X 1 )ag 2 (X 2 ) jsounezávislénáhodnévektory. Tvrzení3.7 Nechť X 1,..., X n jsounezávislé. (i) Jsou-li X i L 1,pak E (X 1 X n )= E X 1 E X n. (ii) Jsou-li X i L 2,pak cov (X i, X j )=0 i j. (iii) Jsou-li X i L 2 aσ 2 i = var X i,pak varx=diag (σ 2 1,...,σ2 n ). [Dupač& Hušková 1999, V. 3.17, 3.18, 3.19(4)] Poznámka. Z vlastností (i) (iii) předchozího tvrzení neplyne bez dalších podmínek nezávislost. 3.4 Korelace Definice 3.7 Nechť X, Y jsou náhodné veličiny s kladnými a konečnými rozptyly. Korelační koeficient veličin X a Y seznačí (X, Y )nebo cor (X, Y ) ajedefinovánvztahem [Dupač& Hušková 1999, Df. 3.5] (X, Y )= cov (X, Y ) var X var Y. Tvrzení 3.8(Cauchyova-Schwartzova nerovnost) Nechť X, Y L 2.Pak (E XY ) 2 E X 2 EY 2 arovnostplatí,právěkdyž X= by s.j.pronějaké b0. 19
3 Náhodný vektor a mnohorozměrné rozdělení Důsledek. Pro jakékoliveličiny X, Y L 2 máme cov (X, Y ) var X vary atudíž,pokud majínenulovýrozptyl,také (X, Y ) 1. Tvrzení3.9(Vlastnostikorelačníhokoeficientu) Nechť X, Y L 2, var X> 0, var Y > 0. (i) (X, Y )= (Y, X ); (ii) 1 (X, Y ) 1, (X, Y )=1právěkdyž X= a+ by s.j.,kde b> 0; (X, Y )= 1právěkdyž X= a+ by s.j.,kde b< 0; (iii) (a+ bx, c+ dy )=sgn (bd) (X, Y ). Poznámka. Je-li (X, Y )= 0(nebo cov (X, Y )= 0),náhodnýmveličinám X, Y seříkánekorelované veličiny. Nezávislé veličiny jsou i nekorelované, opak nutně neplatí. Korelační koeficient měří sílu lineárního vztahu mezi X a Y. Definice 3.8 Nechť X = (X 1,..., X n ) T a Y = (Y 1,..., Y m ) T jsou dva náhodné vektory se složkami, jež mají konečné a kladné rozptyly. Korelační maticí cor (X, Y ) vektorů X a Y rozumímematicitypu n m sesložkami (X i, Y j ) namístě (i, j ). Poznámka. Korelační matice cor (X, X) má tvar 1 12... 1n cor (X, X)= 12 1... 2n..., 1n 2n... 1 kde jk = (X i, X j ). Je-li V = varx,σ i = var X i a D = diag (σ 1,...,σ n ), pak máme cor (X, X)= D 1 VD 1. 20
4 PodmÍnĚnÉ rozdělení Nechť je dán pravděpodobnostní prostor (Ω, A, P). V této kapitole uvažujeme náhodné veličiny a náhodné vektory definované na tomto prostoru. 4.1 PodmÍnĚnÁ hustota Uvažujme náhodný vektor X = (X 1,..., X n ) T, který je rozdělen na dva podvektory Y = (X 1,..., X r ) T a Z = (X r+1,..., X n ) T, 1 r < n. Chceme zkoumat rozdělení náhodného vektoruy vsituaci,kdyvíme,ženáhodnývektor Z nabylkonkrétníhodnoty z R n r. Definice 4.1 Nechť náhodný vektor Y má hustotu f Y (y) vzhledem kσ-konečné míře µ 1 na (R r,b0 r ).Nechťnáhodnývektor Z máhustotu f Z (z) vzhledemkσ-konečnémíře µ 2 na (R n r,b0 n r ).Nechťnáhodnývektor X=(Y Ț Z T ) T máhustotu f X (y, z) vzhledemksoučinovémíře µ= µ 1 µ 2 na (R n,b0 n ). Podmíněnou hustotou náhodného vektoru Y, je-li dáno Z = z nazveme libovolnou nezápornouměřitelnoufunkci f (y z),kteráprovšechna B B0 r a C Bn r 0 splňuje rovnost P [ Y B, Z C ] [ ] = f (y z) dµ 1 (y) f Z (z) dµ 2 (z). (4.1) [Anděl 2002, Df. 3.18] C B Poznámka. Podmíněná hustota za daných předpokladů existuje a je jednoznačně určena µ 1 -skorovšude.předpokladexistencehustoty f X vzhledemksoučinovémíře µ= µ 1 µ 2 je závažný(někdy neplatí) a nutný(jinak nelze podmíněnou hustotu rovností(4.1) definovat). Poznámka(Výpočet podmíněné hustoty). Levá strana rovnosti(4.1) je vlastně f X (y, z) dµ(y, z). Pravá strana dává B C B C Rovnostprokaždé B a C nastaneprávěkdyž f (y z)f Z (z) dµ(y, z). f X (y, z)=f(y z)f Z (z) µ-skoro všude. Podmíněnou hustotu tudíž můžeme počítat vztahem pro z taková,že f Z (z)0. f (y z)= f X (y, z) f Z (z) 21
4 Podmíněné rozdělení Věta 4.1(Bayesova) Platí-li podmínky definice 4.1, pak podmíněná hustota p(z y) náhodnéhovektoruz,je-lidánoy = y jerovna f (y z)f Z (z) pokud jmenovatel není roven 0, p(z y)= f (y z)f Z (z) dµ 2 (z) R n r 0 jinak. [Anděl 2002, V. 3.21] 4.2 PodmÍnĚnÁ střední hodnota Stálesezabývámenáhodnýmvektorem X=(X 1,..., X n ) T rozděleným nadvapodvektory Y = (X 1,..., X r ) T a Z=(X r+1,..., X n ) T,1 r< n.mámetedy X=(Y T, Z T ) T. Definice4.2 Nechť h(y, z) jeměřitelnáfunkce R n R m.označme U= h(x)= h(y, Z). 1. Podmíněná střední hodnota E (U Z= z ) náhodného vektoru U h(y, Z), je-li dánoz= z jedefinovánavýrazem E (U Z= z )= h(y, z)f (y z) dµ 1 (y) R r (pokud existuje). 2. Označmeφ(z) = E (U Z= z ) (je to nějaká měřitelná funkce z R n r do R m ). Náhodnývektorφ(Z) značíme E (U Z ) anazývámejejpodmíněnoustředníhodnotou náhodnéhovektoruu= h(y, Z) přidaném(lečneurčeném) Z. Poznámka. Jak je řečeno výše, podmíněná střední hodnota E ( Z= z ) je funkce argumentu z zobrazujícízr n r do R m.propevné z jetokonstanta(v R m ).Podmíněnástřední hodnota E ( Z )jenáhodnývektorom složkách;jehorealizovanáhodnotazávisínarealizované hodnotě náhodného vektoru Z. Nynípřiberemedoúvahyještědalšíměřitelnéfunkce h 1, h 2 : R n R m aψ : R n r R. Označme U 1 = h 1 (Y, Z) a U 2 = h 2 (Y, Z).Nechťvšechnysložky U, U 1 a U 2 majíkonečné první momenty. Věta 4.2(Vlastnosti podmíněné střední hodnoty) (i) E (a Z )= aprojakékolia R m. (ii) E [ E (U Z ) ] = EU. (iii) E ( a 1 U 1 + a 2 U 2 Z )= a 1 E (U 1 Z )+ a 2 E (U 2 Z ) projakékoli a 1, a 2 R. (iv) E ( ψ(z)u Z ) =ψ(z)e (U Z ) [Anděl 2002, V. 3.22 3.25] 22
4 Podmíněné rozdělení Věta 4.3 Nechť všechny složky U = h(y, Z) mají konečný rozptyl a nechťτje jakákoli měřitelná funkce z R n r do R m taková, že všechny složkyτ(z) mají konečný rozptyl. Pak platí var[u τ(z)] var[u E (U Z )]. [Anděl 2002, V. 3.27] Poznámka. Pracujeme-li s rozptylovými maticemi(m > 1), rozumíme výše uvedené nerovnosti tak, že rozdíl levé a pravé strany je positivně semidefinitní matice. Poznámka. Věta 4.3 říká, že chceme-li aproximovat náhodný vektor U pomocí funkce náhodného vektoru Z, poskytuje podmíněná střední hodnota E ( U Z ) nejlepší aproximaci (co do rozptylu) mezi všemi možnými funkcemi Z. Podmíněná střední hodnota se dá(obrazně leč poněkud nepřesně) vysvětlit tímto způsobem: Podmíněná střední hodnota odstraňuje z U náhodnost související s náhodným vektorem Y, ale ponechává náhodnost způsobenou náhodným vektorem Z. Poznámka. V teorii pravděpodobnosti se zavádí obecná abstraktní definice podmíněné střední hodnoty, která nespoléhá na existenci podmíněné hustoty. O podmíněné střední hodnotě pak lze mluvit i tam, kde neexistuje podmíněná hustota. Například E ( Z Z) nelze podle definice 4.1 a 4.2 spočítat. 4.3 PodmÍnĚnÝ rozptyl Nechť EU T U<,čilivšech m složeknáhodnéhovektoru U h(y, Z) mákonečnérozptyly. Definice4.3 Podmíněnýrozptyl var (U Z ) náhodnéhovektoru U,je-lidáno Z,jestdefinován výrazem var (U Z )= E ( [ U E (U Z ) ] 2 Z ). Poznámka. Podmíněný rozptyl z definice 4.3 je náhodná matice(náhodná veličina, pokud m= 1).Podobnělzedefinovatpodmíněnýrozptyl var (U Z= z ) prokonkrétnírealizovanouhodnotu z vektoru Z. Věta 4.4(Rozklad nepodmíněného rozptylu) [Anděl 2002, V. 3.26] varu= Evar (U Z )+ var E (U Z ). 23
5 Transformace náhodných veličin a vektorů Napravděpodobnostnímprostoru (Ω,A, P) uvažujmenáhodnývektor X=(X 1,..., X n ) T, jehož rozdělení známe, a měřitelnou funkci g : R n R n. Naším cílem je zjistit rozdělení náhodnéhovektoru Y = g (X). Definice 5.1 (Nosič rozdělení) Nechť X je (obecná) náhodná veličina, která nabývá hodnot z výběrového prostoru X. Nechť rozdělení X je absolutně spojité vzhledem k nějaké σ- konečné míře µ. Množinu S X X nazveme nosičem rozdělení náhodné veličiny X právě když platí: 1. P[X S X ]=1; 2. A S X : µ(s X \ A)> 0 P[X A]<1. 5.1 Transformace náhodných veličin Nejprve uvažujme případ X = R, tj. transformujeme reálnou náhodnou veličinu. Tvrzení5.1(Větaomonotonnítransformaci) Nechť X mádistribučnífunkci F X anosič S X. Nechťfunkce g zobrazuje S X na S 0 R.Označme Y= g (X ). (i) Je-li g ryzerostoucí, pakdistribučnífunkcenáhodnéveličiny Y je F Y (y )= F X (g 1 (y )) pro y S 0. (ii) Je-li g ryzeklesající,pakdistribučnífunkcenáhodnéveličinyy je F Y (y )=1 F X (g 1 (y ) ) pro y S 0. Značení. Je-li g reálnáfunkceslimitamizlevavevšechbodech,pakvýraz g (x )značízleva spojitouverzifunkce g,tj. g (x ) df = lim g (x h). hց0 Důsledky. 1. Nechť X jespojitáreálnáveličinashustotou f X (x)anechť g jeryzemonotonníadiferencovatelná skoro všude. Hustota náhodné veličiny Y = g (X ) je pak rovna f Y (y )= f X (g 1 (y )) dg 1 (y ) dy pro y g (S X ); 0 pro y g (S X ). 2. Nechť X jediskrétníreálnáveličinasrozdělením P[X= x]=q x, x S X.Pak P [ Y= y ] = q g 1 (y ), y g (S X ). 24
5 Transformace náhodných veličin a vektorů Nyní prozkoumáme nemonotonní transformace. Budeme předpokládat, že existují intervaly G k R, k = 1,2,..., takové, že k=1 G k S X, G i G j = pro i j, a g je ostře monotonnínakaždém G k. Značení. OznačmeK + množinuvšechindexů k takových,že g rostena G k ak množinuvšech indexů k takových,že g klesána G k. Označme g k funkci g restriktovanou na G k, třeba g k (x) = g (x)1 Gk (x). Pak existuje g 1 k (y ) pro y g k (G k ). Označme X k = X 1 Gk (X ), Y k = g k (X k ).Máme X= k=1 X k a Y= k=1 Y k. Tvrzení 5.2 Za daných předpokladů platí [ F Y (y )= X k g 1 k (y ), X ] G k + k K + P k K P [ X k g 1 k (y ), X G k]. Tvrzení 5.3 Nechť má navíc X hustotu vzhledem k Lebesgueově míře a nechť je každá g k diferencovatelná(skorovšude)v G k.pak Y máhustotu f Y (y )= k=1 f X (g 1 k (y )) dg 1 k (y ) 1 gk (G dy k ) (y ). Poznámka. Chceme-li pouze spočítat střední hodnotu EY E g (X ), je obvykle snazší použítpřímývzorec E g (X )= g (x)f X (x) dµ(x)nežpočítatnejprvehustotu Y apakintegrovat E g (X )= y f Y (y ) dµ(y ). 5.2 Transformace náhodných vektorů Uvažujme náhodný vektor X = (X 1,..., X n ) T s nosičem rozdělení S X R n a spojitým rozdělením (má hustotu vzhledem k Lebesgueově míře). Nechť je dána transformace g : R n R n,vlastněvektor n funkcí g 1,..., g n,každáznichžzobrazuje R n dor. Zajímá nás rozdělení náhodného vektoru Y = g (X). Budeme předpokládat, že transformace g jediferencovatelnáskorovšudevs X,tj.existujematice g 1 (x) g 1 (x) x n g (x) x = x 1....... g n (x) x 1... g n (x) x n Determinanttétomatice(jakobiántransformace g)budemeznačitdet g (x) x. Tvrzení 5.4 Nechť X má hustotu f X (x) vzhledem k Lebesgueově míře. Nechť g je prosté g (x) zobrazeníadet x 0proskorovšechna x S X.Pak Y = g (X)máhustotu vzhledem k Lebesgueově míře. f Y (y)=f X (g 1 (y)) det g 1 (y) y 1 g (S X )(y) 25
5 Transformace náhodných veličin a vektorů Poznámka. Platí a g 1 (y) y = ( g (x) x x=g 1 (y) ) 1 det g 1 (y) y = det 1 g (x) x x=g 1 (y). Tvrzení5.5 NechťXmáhustotu f X (x)vzhledemklebesgueověmíře.nechťexistujímnožiny G k R n, k = 1,2,..., takové, že k=1 G k S X, G i G j = pro i j, g k (x) df = g (x)1 Gk (x) je prostá na každém G k, a det g k (x) 0 pro skoro všechna x G k. Pak x Y = g (X)máhustotu f Y (y)= vzhledem k Lebesgueově míře. k=1 f X (g 1 k (y)) det g 1 k y (y) 1 gk (G k )(y) Poznámka. NechťX=(X 1,,..., X n ) T jenáhodnývektora t nějakáhladkáměřitelnáfunkce R n R.Jakéjerozdělenínáhodnéveličiny T= t (X)? Zvolme vhodně transformaci g : R n R n tak, aby g 1 (x) = t (x). Platí-li předpoklady tvrzení 5.5, můžeme podle něj spočítat sdruženou hustotu náhodného vektoru Y = g (X). Marginálníhustotunáhodnéveličiny T Y 1 zjistímevyintegrovánímostatníchsložekpodle (3.1). Věta5.6(okonvoluci) Nechť X a Y jsounezávislé náhodnéveličiny,nechť X máhustotu f X vzhledem k míře µ 1 a Y má hustotu f Y vzhledem k míře µ 2. Pak Z = X+ Y má distribuční funkci F Z (z )= f Y (y )F X (z y ) dµ 2 (y )= f X (x)f Y (z x) dµ 1 (x). Jsou-li X a Y spojité, pak Z má hustotu f Z (z )= f Y (y )f X (z y ) dy= f X (x)f Y (z x) dx vzhledem k Lebesgueově míře. Jsou-li X a Y diskrétní, pak P[Z= z]= P [ Y= y ] P [ X= z y ] = P[X= x]p[y= z x]. y S Y x S X [Dupač&Hušková1999,V.3.13a3.14] Tvrzení5.7 Nechť X a Y jsounezávislé náhodnéveličiny,nechť X máhustotu f X vzhledem kmíře µ 1 a Y máhustotu f Y vzhledemkmíře µ 2.Pak Z= X/Y mádistribučnífunkci 0 F Z (z )= f Y (y )F X (z y ) dµ 2 (y )+ f Y (y )[1 F X (z y )] dµ 2 (y ). 0 26
5 Transformace náhodných veličin a vektorů Jsou-li X a Y spojité, pak Z má hustotu f Z (z )= y f Y (y )f X (z y ) dy. [Dupač& Hušková 1999, V. 3.15(2)] 27
6 NormÁlnÍ rozdělení Poznámka(Normální rozdělení). Náhodnáveličina Z shustotouϕ(z )= 1 2π e z2 /2 mánormovanénormálnírozdělení; značíme Z N(0, 1). Její distribuční funkci značíme Φ(z ) df = z ϕ(t ) dt. Jestliže Z N(0,1) a X=σZ+ µ,kdeσ> 0aµ R,pak X mánormálnírozdělení s parametry µ aσ 2,značíme X N(µ,σ 2 ).Jejíhustotaje f X (x)= 1 σ x µ ) 1 ϕ( = e (x µ)2 2σ σ 2. 2πσ Jejídistribučnífunkceje F X (x)=φ ( x µ ) σ. Jestliže X N(µ,σ 2 )pak E X= µ, var X=σ 2,γ 3 =0,γ 4 =3. 6.1 MnohorozmĚrnÉ normální rozdělení Definice6.1 NechťZ=(Z 1,..., Z r ) T,kde Z i N(0,1)jsounezávislé.NechťA n r jematice a µ R n je pevný vektor. Náhodný vektor X definovaný jako X = AZ+ µ pak má n- rozměrnénormálnírozdělení sparametry µaσ df = AA T.ZnačímeX N n (µ,σ). Poznámka. EX= µ, varx=σ. X má n-rozměrnénormálnírozdělení prolibovolné c R n platí c T X N(, ). LibovolnásymetrickápositivněsemidefinitnímaticeΣsedánapsatjakoAA T pronějakéa n r, r n.platí: r< n právěkdyžσjesingulární. Věta6.1 Nechť X N n (µ,σ) aσjeregulární.pakexistujehustota X vzhledemklebesgueověmířenar n ajejítvarje f X (x)= pro x R n.[anděl2002,v.4.10] 1 (2π) n/2 detσ e 1 2 (x µ)t Σ 1 (x µ) Poznámka. Je-liΣsingulární,pakhustotaXvzhledemkLebesgueověmířenaR n neexistuje, neboťnosičrozdělení X jemnožinamíry0. 28
6 Normální rozdělení Příklad(Dvourozměrnénormálnírozdělení). Nechť n=2,σjeregulární,σ 1 = var X 1,σ 2 = var X 2 a =cor (X 1, X 2 ).HustotunáhodnéhovektoruX=(X 1, X 2 ) T paklzevyjádřitvetvaru f (x 1, x 2 )= 1 2πσ 1 σ 2 1 2 e 1 2(1 2 ) [ (x 1 µ 1 )2 σ 2 1 ] 2 (x 1 µ 1 )(x 2 µ 2 ) σ 1 σ + (x 2 µ 2 )2 2 σ 2 2. Věta 6.2(Vlastnosti mnohorozměrného normálního rozdělení) NechťX N n (µ,σ),kdex= (X1 T, XT 2 )T,µ= (µ T 1, µt 2 )T,Σ= ( Σ 11 Σ 12 ) Σ 21 Σ 22 adimenzejednotlivýchsložekjsou k 1pro X 1 a µ 1 a k k proσ 11.Pakplatí: (i) X 1 N k (µ 1,Σ 11 ). (ii) JestližeΣ 12 = 0,pak X 1 a X 2 jsounezávislé. (iii) Je-liΣ 22 regulární, pak podmíněné rozdělení X 1, je-li dáno X 2 = x 2, je k-rozměrné normální se střední hodnotou µ 1.2 = µ 1 +Σ 12 Σ 1 22 (x 2 µ 2 ) arozptylem Σ 11.2 =Σ 11 Σ 12 Σ 1 22 Σ 21. [Anděl 2002, V. 4.5, 4.11, 4.12] Poznámka. Z předchozí věty plyne: Mají-li X 1 a X 2 sdruženénormálnírozdělení,pakmajímarginálnínormálnírozdělení. Mají-li X 1 a X 2 sdruženénormálnírozděleníajsou-linekorelované,pakjsounezávislé. Poznámka. Mají-li X 1 a X 2 marginálnínormálnírozdělení, pak X=(X 1, X 2 ) T nemusímít sdružené normální rozdělení(najděte si protipříklad). 6.2 RozdĚlenÍχ 2,taF Poznámka. Náhodná veličina X máχ 2 rozdělení o r stupních volnosti, značíme X χ 2 r, právě když její hustota vzhledem k Lebesgueově míře je f X (x)= 1 2 r/2 Γ ( r) x r/2 1 e x/2 1 (0, ) (x). 2 Rozděleníχ 2 r jespeciálnípřípadgamarozdělení:γ( 1 2, r 2 ). Věta6.3(oχ 2 -rozdělení) (i) Nechť X 1,..., X n jsou nezávislé náhodné veličiny s rozdělením N(0,1). Pak platí Y = χn.[dupač&hušková1999,v.3.16(ii)] 2 n i=1 X2 i (ii) Nechť X N n (µ,σ),kdeσjeregulární.pak Y= (X µ) T Σ 1 (X µ) χ 2 n. 29
6 Normální rozdělení (iii) Nechť X N n (0,Σ) anechť Ajetakovámaticetypu n n,že AΣjenenulováaidempotentní. Pak Y= X T AX χ 2 traσ. [Anděl2002,V.4.15a4.16] Poznámka(něco o maticích). Čtvercovou matici D nazveme idempotentní právě když DD = D. trdznačístopumatice D,tj.součetjejíchdiagonálníchprvků. Je-limatice Didempotentní,paktrD=r (D)(hodnostjerovnastopě). Věta 6.4 (o t-rozdělení) Nechť X N(0,1) a Z χ 2 jsou nezávislé.pak náhodná veličina k T df = X Z/k mározděleníshustotou f T,k (t )= Γ( k+1) ( 2 Γ ( k) 2 πk 1+ t2 k ) k+1 2 vzhledem k Lebesgueově míře. Rozdělení náhodné veličiny T se nazývá[studentovo] t rozdělení s k stupnivolnosti,značíme T t k.[dupač&hušková1999,v.3.16(iii)] Poznámka(Vlastnosti t rozdělení). Hustota t rozdělení je symetrická kolem 0. Pro k = 1 jest f T,1 hustotou Cauchyova rozdělení C(0,1). Rozdělení t 1 nemá střední hodnotu. Obecně má T konečné momenty do řádu k 1, ET = 0 pro k > 1, var T = k k 2 pro k> 2. Pro velké k se hustota t rozdělení blíží hustotě normovaného normálního rozdělení: lim k f T,k (t ) ϕ(t ) =0prokaždé t R.Tudížα-kvantilrozdělení t k konvergujek α-kvantilurozdělení N(0,1) pro k. Věta6.5(o F-rozdělení) Nechť X χ 2 m a Y χ 2 n jsounezávislé.paknáhodnáveličina má hustotu f F;m,n (z )= Γ( m+n) 2 Γ ( m) ( 2 Γ n 2 Z= X/m Y/n ) ( m n ) m 2 z m 2 1( 1+ m n z ) m+n 2 1 (0, ) (z ) vzhledem k Lebesgueově míře. Rozdělení náhodné veličiny Z se nazývá[fisherovo-snedecorovo] F rozdělení s m a n stupnivolnosti.[dupač&hušková1999,v.3.16(iv)] 30
7 LimitnÍ věty Na pravděpodobnostním prostoru (Ω, A, P) máme danou posloupnost náhodných vektorů X 1, X 2, X 3,...,kde X i : (Ω,A) (R k,b k 0 )ax i= (X i1,..., X ik ) T. 7.1 Konvergence náhodných veličin a vektorů Definice 7.1 (konvergence v pravděpodobnosti) Říkáme, že posloupnost náhodných vektorů{x n } n=1 konverguje v pravděpodobnosti k náhodnému vektoru X pro n právě když ε> 0: lim P [ X n X >ε ] =0. n Konvergencivpravděpodobnostiznačíme X n P X. Poznámka. a značíeukleidovskounormuvektoru a,tj. a = a T a. Definice7.2(konvergenceskorojistě) Říkáme,žeposloupnostnáhodnýchvektorů{X n } n=1 konvergujeskorojistě knáhodnémuvektorux pro n právěkdyž Konvergenciskorojistěznačíme X n P(lim n X n X =0)=1. sj X. Definice7.3 (konvergence v distribuci) Říkáme,že posloupnost{x n } n=1 konvergujevdistribuci knáhodnémuvektorux pro n právěkdyž lim F X n n (x)= F X (x) v každém bodě x, v němž je F X (x) spojitá. Konvergenci v distribuci značíme X n nebo F Xn F X nebol(x n ) L(X). D X Poznámka. SymbolemL(X n ) se rozumí rozdělení náhodného vektoru X n (z angl. Law). VýrazL(X n ) L(X)čteme rozděleníx n konvergujekrozděleníx.můžemetakéříkat, as. že X n máasymptotické(limitní)rozdělení F X apsátx n L(X). Tvrzení 7.1 (i) X n (ii) X n sj X X n P X Xn P X D X 31
7 Limitní věty Poznámka. Opačné implikace neplatí. Nicméně pokud náhodné vektory konvergují v distribucikekonstantě,tj. X n c,pakplatíxn D P c. Tvrzení 7.2(vlastnosti konvergence v distribuci) (i) (Cramér-Woldovavěta)X n (ii) (Helly-Brayovavěta) X n funkci g : R R. (iii) (Fatouovolemma) X n D X D X D X c R k : c T X n D c T X. E g (Xn ) E g (X ) prokaždouspojitou omezenou E X liminf n E X n. Tvrzení7.3(Větaospojitétransformaci) Nechť g : R k R m jefunkcespojitánamnožině S= i=1 S X n S X (sjednocenínosičůrozdělenívšechuvažovanýchvektorů). (i) X n (ii) X n (iii) X n Tvrzení 7.4 P P X g (Xn ) g (X). sj sj X g (X n ) g (X). D D X g (Xn ) g (X). (i) Nechťproposloupnost{X n } n=1 platí X nj X=(X 1,..., X k ) T. (ii) Nechťproposloupnost{X n } n=1 platí X nj X=(X 1,..., X k ) T. Poznámka. Pro konvergenci v distribuci tato vlastnost neplatí. P X j pro n a j=1,..., k.pakx n sj X j pro n a j=1,..., k.pakx n Tvrzení 7.5 Nechť X 1, X 2,... je posloupnost náhodných veličin takových, že E X n µ a P var X n 0.Pak X n µ. Tvrzení7.6(Cramérova-Sluckéhověta) Nechť X n X, An B n jsounáhodnéveličinyaa, b jsoukonstanty.pakplatí A n X n + B n D D ax+ b. P a a Bn P sj P b,kde Xn, X, A n, Poznámka. Cramérově-Sluckého větě se často říká Sluckého věta. Tato věta platí i pro vektory, tj. pokud X n X, An A a Bn b, kde Xn a X jsou k-rozměrné náhodné D P P vektory,a n jenáhodnámaticeodimenzích m k,ajematicekonstantodimenzích m k, B n jsou m-rozměrnénáhodnévektoryabje m-rozměrnývektorkonstant,pak A n X n +B n D D AX+b. Tvrzení 7.7 Nechť a n (X n µ) X, kde a n > 0 je posloupnost reálných čísel splňující P a n aµjevektorkonstant.pakx n µ. 32
7 Limitní věty 7.2 ZÁkony velkých ČÍsel Uvažujmenáhodnouposloupnost{X n } n=1.označmex n vektorů). df = 1 n n i=1 X i (průměrzprvních n Věta7.8(Čebyševůvslabýzákonvelkýchčísel) Nechť X 1, X 2,...jeposloupnostnezávislých náhodnýchveličinse střední hodnotou E X i = µ arozptylem var X i C pronějaké C R. Pak platí P µ. X n Tvrzení7.9(Chinčinůvslabýzákonvelkýchčísel) Nechť X 1, X 2,...jeposloupnostnezávislýchstejněrozdělenýchnáhodnýchveličinsestředníhodnotou E X i = µ<.pakplatí X n P µ. Tvrzení 7.10 (Kolmogorovovův silný zákon velkých čísel) Nechť X 1, X 2,... je posloupnost nezávislých stejně rozdělených náhodných veličin se střední hodnotou E X i = µ<. Pak platí sj µ. X n Poznámka. Zákony velkých čísel platí i pro náhodné vektory, pokud všechny jejich složky splňují stanovené předpoklady(viz tvrzení 7.4). Čebyševův slabý zákon velkých čísel nevyžaduje, aby byly všechny veličiny stejně rozdělené, ale vyžaduje, aby měly omezený(tj. nutně konečný) rozptyl. Chinčinův slabý zákon velkých čísel a Kolmogorovovův silný zákon velkých čísel vyžadují, aby byly všechny veličiny stejně rozdělené, ale nevyžadují, aby měly konečný rozptyl. Zákony velkých čísel lze zobecnit i na závislé veličiny, pokud nejsou závislé příliš. Např. u Čebyševova zákona velkých čísel stačí nahradit nezávislost podmínkou n 2 cov (X i, X j ) 0. Příklady. 1. Jestliže X i C(0,1),pak X n C(0,1) pro libovolné n.průměrnekonvergujeke konstantě. 2. Empirická četnost vs. pravděpodobnost jevu. 7.3 CentrÁlnÍ limitní věta Uvažujme posloupnost nezávislých stejně rozdělených k-rozměrných náhodných vektorů {X n } n=1. 33
7 Limitní věty Tvrzení 7.11(centrální limitní věta pro nezávislé stejně rozdělené náhodné vektory) Nechť {X n } n=1 jsounezávisléastejněrozdělenénáhodnévektorysestředníhodnotou µ EX i a konečnourozptylovoumaticíσ varx i.pakplatí 1 n n (X i µ)= D n(x n µ) N k (0,Σ). i=1 Poznámka. Neformálnízápistvrzenícentrálnílimitnívěty: X n as. N k (µ, n 1 Σ). Příklady. 1. Aproximace binomického rozdělení normálním 2. Aproximaceχ 2 rozdělenínormálním Věta7.12( -metoda) Nechť{T n } n=1 splňuje n(tn µ) D N k (0,Σ) pro nějaký vektor konstant µ R k a maticiσ. Nechť g je spojitě diferencovatelná funkce R k R p g (x).označme D(x)= x.pakplatí n(g (Tn ) g (µ)) D N p (0, D(µ)ΣD(µ) T ). Příklad. Asymptotickérozdělenílog X n. 34
8 PŘehled pravděpodobnostních rozdělení 8.1 DiskrÉtnÍ rozdělení 8.1.1 AlternativnÍ rozdělení Též se nazývá Bernoulliovo nebo nula-jedničkové rozdělení. Značení: X Alt(p) Parametry: p (0, 1) Nosič: X {0, 1} Hustota: P [ X= j ] = p j (1 p) 1 j, j {0,1} Střední hodnota: E X= p Rozptyl: var X= p(1 p) Poznámky: Rozdělení indikátoru náhodného jevu, úspěch vs. neúspěch. 8.1.2 BinomickÉ rozdělení Značení: X Bi(n, p) Parametry: p (0,1), n N Nosič: X {0,1,..., n} Hustota: P [ X= j ] ( ) n = p j (1 p) n j, j {0,1,..., n} j Střední hodnota: Rozptyl: Poznámky: E X= np var X= np(1 p) Rozdělení součtu nezávislých alternativních veličin(počtu úspěchůmezi n pokusy).přesněji,jsou-li X i Alt(p) nezávislé, i= 1,..., n,pak n i=1 X i Bi(n, p). Bi(1, p) jest Alt(p). Jestliže n anp λ<,pak Bi(n, p)konvergujekpo(λ). 35
8 Přehled pravděpodobnostních rozdělení 8.1.3 GeometrickÉ rozdělení Značení: X Geo(p) Parametry: p (0, 1) Nosič: Hustota: Střední hodnota: Rozptyl: Poznámky: X {0,1,2,...} P [ X= j ] = p(1 p) j, j=0,1,2,... E X= 1 p p var X= 1 p p 2 8.1.4 Poissonovo rozdělení Značení: Počet neúspěchů před prvním úspěchem v posloupnosti nezávislých pokusů. X Po(λ) Parametry: λ> 0 Nosič: Hustota: Střední hodnota: Rozptyl: Poznámky: X {0,1,2,...} P [ X= j ] = λ j E X= λ var X= λ 8.1.5 NegativnĚ binomické rozdělení Značení: X NB(n, p) Parametry: j! e λ, j=0,1,2,... Rozdělení počtu úspěchů při velkém počtu nezávislých experimetů s maloupravděpodobnostíúspěchu[n, np λ< Bi(n, p) konvergujekpo(λ)]. p (0,1), n N Nosič: X {0,1,2,...} Hustota: P [ X= j ] ( ) n+ j 1 = p n (1 p) j, j=0,1,2,... n 1 Střední hodnota: Rozptyl: Poznámky: E X= n 1 p p var X= n 1 p p 2 Rozdělení počtu neúspěchů předcházejících n-tému úspěchu v posloupnosti nezávislých pokusů. NB(1, p) jest Geo(p). 36
8 Přehled pravděpodobnostních rozdělení 8.2 SpojitÁ rozdělení 8.2.1 RovnomĚrnÉ rozdělení Značení: X R(a, b) Parametry: a, b R, a< b Nosič: X (a, b) Hustota: f (x)= 1 b a 1 (a,b)(x), x R Distribuční funkce: Střední hodnota: 0 x< a, F (x)= x a a< x< b, b a 1 x> b E X= a+ b 2 (b a)2 Rozptyl: var X= 12 Poznámky: Rozdělení s konstantní hustotou. 8.2.2 NormÁlnÍ rozdělení Značení: X N(µ,σ 2 ) Parametry: µ R,σ 2 > 0 Nosič: Hustota: Distribuční funkce: X R f (x)= Střední hodnota: E X= µ 1 2πσ e (x µ)2 /(2σ 2), x R ( x µ F (x) = Φ σ Rozptyl: var X=σ 2 ),kdeφ(x)= 1 2π x e u2 /2 du Vyšší momenty: µ k = 0 k liché {(k 1)(k 3) 3 1}σ k k sudé Špičatost:γ 4 =3 8.2.3 NormovanÉ normální rozdělení Distribuční funkce: Φ(x)= 1 2π x e u2 /2 du Vlastnosti: Φ( x)=1 Φ(x) 37
8 Přehled pravděpodobnostních rozdělení Hodnoty: Kvantily: x 0 0.5 1 1.5 2 3 Φ(x) 0.5 0.6915 0.8413 0.9332 0.9772 0.9987 α 0.5 0.8 0.9 0.95 0.975 0.99 0.995 Φ 1 (α) 0 0.8416 1.282 1.645 1.96 2.326 2.576 8.2.4 Cauchyovo rozdělení Značení: X C(a, b) Parametry: a R, b> 0 Nosič: X R Hustota: f (x)= 1 bπ Distribuční funkce: Střední hodnota: Rozptyl: Poznámky: [ 1+ ( x a ) 2 ] 1 F (x)= 1 2 + 1 x a arctg π b E X neexistuje var X neexistuje 8.2.5 ExponenciÁlnÍ rozdělení b Hustota je symetrická kolem a, momenty neexistují, E X = +. Značení: Parametry: λ> 0 X Exp(λ) Nosič: X (0, ) Hustota: f (x)=λe λx 1 (0, ) (x) Distribuční funkce: F (x)= 0 x< 0 1 e λx x> 0 Střední hodnota: E X= 1 λ Rozptyl: var X= 1 λ 2 8.2.6 Gama rozdělení Značení: X Γ(a, p) Parametry: a> 0, p> 0 Nosič: X (0, ) 38
8 Přehled pravděpodobnostních rozdělení Hustota: Střední hodnota: f (x)= a p Γ(p) x p 1 e ax 1 (0, ) (x), x R E X= p a Rozptyl: var X= p a 2 Poznámky: Γ(a, 1) jest Exp(a) Γ(a, k ), k N,jestsoučtem k nezávislýchveličinsrozdělením Exp(a); ( toto rozdělení se též nazývá Erlangovo. 1 Γ 2, r jestχ 2) 2 r -rozdělení. 8.2.7 Beta rozdělení Značení: X B(α, β) Parametry: α,β> 0 Nosič: X (0, 1) Hustota: 1 f (x)= B (α,β) xα 1 (1 x) β 1 1 (0,1) (x) Střední hodnota: E X= Rozptyl: var X= α α+β αβ (α+β) 2 (α+β+1) Poznámky: B(1, 1) jest R(0, 1). 8.2.8 χ 2 rozdělení Značení: Parametry: X χ 2 r r N, stupně volnosti Nosič: X (0, ) Hustota: 1 f (x)= 2 r/2 Γ(r/2) x (r 2)/2 e x/2 1 (0, ) (x) Střední hodnota: Rozptyl: E X= r var X= 2r Poznámky: SpeciálnípřípadΓ-rozdělenísparametry 1 2, r 2. Rozdělení součtu kvadrátů r nezávislých normovaných normálních veličin. 39
8 Přehled pravděpodobnostních rozdělení Kvantily: α r 0.9 0.95 0.99 0.999 1 2.706 3.841 6.635 10.828 2 4.605 5.991 9.210 13.816 3 6.251 7.815 11.345 16.266 4 7.779 9.488 13.277 18.467 5 9.236 11.070 15.086 20.515 6 10.645 12.592 16.812 22.458 7 12.017 14.067 18.475 24.322 8 13.362 15.507 20.090 26.124 9 14.684 16.919 21.666 27.877 10 15.987 18.307 23.209 29.588 15 22.307 24.996 30.578 37.697 20 28.412 31.410 37.566 45.315 30 40.256 43.773 50.892 59.703 40 51.805 55.758 63.691 73.402 50 63.167 67.505 76.154 86.661 8.2.9 Studentovo t-rozdělení Značení: Parametry: X t k k N, počet stupňů volnosti Nosič: X R Hustota: f (x)= Γ( ) k+1 ( 2 Γ ( ) k 2 kπ Střední hodnota: Rozptyl: Poznámky: ) (k+1)/2 1+ x2 k E X=0pro k 2,neexistujepro k=1. var X= k pro k 3, var X= pro k=1,2. k 2 t 1 jest C(0,1) Jsou-li X N(0,1) a Z χ 2 nezávislé,pak X k t k Z/k 8.2.10 (Fisherovo) F-rozdĚlenÍ Značení: Parametry: X F m,n m, n N, stupně volnosti Nosič: X (0, ) Hustota: 1 ( m f (x)= ( B m 2, 2) n n ) m/2 x m/2 1 ( 1+ m n x ) (m+n)/21(0, ) (x) 40
8 Přehled pravděpodobnostních rozdělení Střední hodnota: Rozptyl: E X= n pro n 3,neexistujepro n=1,2. n 2 var X= 2n2 (m+ n 2) m(n 2) 2 pro n 5, var X= pro n 4. (n 4) Poznámky: Jsou-li Z 1 χ 2 m a Z 2 χ 2 n nezávislé,pak Z 1/m Z 2 /n F m,n Je-li Y B(m/2, n/2),pak n Y m 1 Y F m,n 41
8 Přehled pravděpodobnostních rozdělení 8.3 MnohorozmĚrnÁ diskrétní rozdělení 8.3.1 MultinomickÉ rozdělení Značení: X Mult k (n;p) Parametry: k 2početpřihrádek, n Npočetpokusů, p {(0,1) k : k j=1 p j= 1} pravděpodobnosti přihrádek. Nosič: X {{0,1,..., n} k : k j=1 X i= n} n! Hustota: P[X 1 = r 1,..., X k = r k ]= r 1! r k! pr 1 pr 1 k 1 k A (r), kde A={r {0,..., n} k : k j=1 r j= n} Střední hodnota: EX= np Rozptyl: varx= n[diag (p) pp T ] Poznámky: Rozdělení počtu koulí padlých do každé z k přihrádek při n nezávislých pokusech. Marginálnírozdělení X j jest Bi(n, p j ), j=1,..., k 8.4 MnohorozmĚrnÁ spojitá rozdělení 8.4.1 MnohorozmĚrnÉ normální rozdělení Značení: X N k (µ,σ) Parametry: µ R k střední hodnota,σ 0 positivně semidefinitní rozptylová matice Nosič: X R k 1 { Hustota: f (x) = (2π) k/2 detσ exp 1 } 2 (x µ)t Σ 1 (x µ), x R k Pokud je Σ singulární, hustota vzhledem k Lebesgueově míře neexistuje. Střední hodnota: EX= µ Rozptyl: Poznámky: varx=σ ( Je-li k=2,můžemevyjádřitσ= Pak σ1 2 σ 1 σ 2 σ 1 σ 2 σ2 2 1 { f (x 1, x 2 )= 2π 1 [ (x1 µ 1 ) 2 exp 1 2σ 1 σ 2 2(1 2) ),kde =cor (X 1, X 2 ). σ 2 1 2 (x 1 µ 1 )(x 2 µ 2 ) σ 1 σ 2 + (x 2 µ 2 ) 2 σ 2 2 ]} 42
Literatura Anděl, J.(2002), Základy matematické statistiky, Matfyzpress, Praha. Dupač, V. & Hušková, M. (1999), Pravděpodobnost a matematická statistika, Karolinum, Praha. 43