PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA doc. RNDr. Tomáš Mrkvička, Ph.D. November 17, 2015
Bibliography [1] J. Anděl: Statistické metody, Matfyzpress, Praha 1998 [2] V. Dupač, M. Hušková: Pravděpodobnost a matematická statistika, Karolinum, Praha 1999 [3] T. Mrkvička, V. Petrášková: Úvod do teorie pravděpodobnosti,pf JU, České Budějovice 2008 [4] T. Mrkvička, V. Petrášková: Úvod do statistiky,pf JU, České Budějovice 2006 1
Chapter 1 Jev, náhodný jev, pravděpodobnosti náhodného jevu 1.1 Axiomatická definice pravděpodobnosti Každému náhodnému pokusu můžeme přiřadit množinu Ω, tj. množinu všech možných výsledků pokusu. Při hodu kostkou je Ω ={1,2,3,4,5,6}, při hodu mincí je Ω={rub,líc}, při hodu dvěma mincemi je Ω={{rub,rub},{líc,líc},{líc,rub},{rub,líc}}. 2
CHAPTER 1. JEV, NÁHODNÝ JEV, PRAVDĚPODOBNOSTI NÁHODNÉHO JEVU 3 Prvky ω Ω nazýváme elementárními jevy, podmnožiny množiny Ω jevy. Jevjistý-Ω-jetakovýjev,kterýnastanepřikaždérealizacipokusu. Jevnemožný- -jetakovýjev,kterýnenastanepřižádnérealizacipokusu. Definice1.1Nechť Ajeneprázdnýsystémpodmnožinmnožiny Ω takový, že a) A b)je-li A A,pak Ā A c)jsou-li A i A, i =1,2,...,pak i=1 A i A. Pak A nazýváme σ-algebrou.
CHAPTER 1. JEV, NÁHODNÝ JEV, PRAVDĚPODOBNOSTI NÁHODNÉHO JEVU 4 zápis pravděpodobnostní interpretace ω A jev Anastal,výsledek ωnáhodného pokusu je příznivý jevu A Ajepodjevjevu B(jev Anastane, A B kdykolivnastanejev B) rozdíljevu Ba A(jev,kterýnastane B A právětehdy,kdyžnastanejev Ba zároveň nenastane jev A) doplněk jevu A(jev, který nastane Ā = Ω A právětehdy,kdyžnenastanejev A) sjednoceníjevů A, B(jev,kterýna- A B stane právě tehdy, nastane-li aspoň jedenzjevů A, B) průnikjevů A, B(jev,kterýnastane A B právětehdy,nastanou-liobadvajevy současně) jevy A, B nazveme disjunktní(ne- A B = mohounastatsoučasně) A i A j = i j jevy A 1...A n tvořírozkladjevu C n i=1a i = C Table 1.1: Zápis základních pravděpodobnostních relací a operací.
CHAPTER 1. JEV, NÁHODNÝ JEV, PRAVDĚPODOBNOSTI NÁHODNÉHO JEVU 5 σ-algebra A je tedy množinový systém uzavřený vzhledem k doplňku a spočetnému sjednocení. Prvky σ-algebry nazýváme náhodné jevy. Příklad1.1Nechť Ω={1,...,n}.PakpotenčnímnožinaP(Ω)(tj.množina všech podmnožin Ω) je σ-algebra a neexistuje menší σ-algebra obsahující všechny elementárníjevy {ω}, ω Ω. Příklad1.2Nechť Ω = R.Pakpotenčnímnožinajetaké σ-algebra,aleexistuje i menší σ-algebra, které dáváme přednost. Např. Borelovská σ-algebra(tj. nejmenší σ-algebra obsahující všechny otevřené podmnožiny R). Borelovská σ-algebra obsahuje všechna spočetná sjednocení otevřených množin, ale také i všechny uzavřené podmnožiny R. Definice1.2Nechť Ω, Aje σ-algebradefinovanána Ω.Pakpravděpodobností libovolného náhodného jevu A nazveme libovolnou reálnou funkci P definovanou na A, která splňuje
CHAPTER 1. JEV, NÁHODNÝ JEV, PRAVDĚPODOBNOSTI NÁHODNÉHO JEVU 6 a) P(Ω) = 1, P( ) = 0, b) P(A) 0 A A, c)prokaždouposloupnostdisjunktníchjevů {A n } n=1platí P( i=1a i ) = P(A i ). i=1 Trojice (Ω, A, P) se nazývá pravděpodobnostní prostor. Některé vlastnosti pravděpodobnosti. 1) P( ) = 0, 2) P je konečně aditivní, tzn., jestliže A 1,...,A n A, A i A j = i j,i,j= 1,...,n P( n i=1 A i) = n i=1 (A i), 3)Pjemonotónní: A,B A,A B P(A) P(B),
CHAPTER 1. JEV, NÁHODNÝ JEV, PRAVDĚPODOBNOSTI NÁHODNÉHO JEVU 7 4) A,B A,A B P(B A) = P(B) P(A), 5) P(Ā) = 1 P(A), A A, 6) P(A B) = P(A)+P(B) P(A B)prolibovolné A,B A, Vlastnost 6) lze indukcí rozšířit na libovolný konečný počet jevů, a to následovně: P( n i=1a i ) = n P(A i ) i=1 n 2 + i=1 n 1 n 1 i=1 n j=i+1k=j+1 n j=i+1 P(A i A j )+ (1.1) P(A i A j A k )+...+( 1) n 1 P( n i=1a i ).
CHAPTER 1. JEV, NÁHODNÝ JEV, PRAVDĚPODOBNOSTI NÁHODNÉHO JEVU 8 1.2 Klasický pravděpodobnostní prostor Definice 1.3 Pravděpodobnostní prostor(ω, A, P) nazveme klasickým pravděpodobnostním prostorem, jestliže a)množina Ωjekonečnáomprvcíchavšechnymožnévýsledkyjsoustejně pravděpodobné,tzn. označíme-lipostupněp 1,...,p m pravděpodobobnosti jednotlivýchvýsledkůelementárníchjevů,pakp 1 =p 2 =...=p m = 1 m (je-li možných výsledků m), b) za σ-algebru A vezmeme systém všech podmnožin množiny Ω, c) pravděpodobnost P náhodného jevu A je rovna P(A) = m A m, kde m A je počet výsledků příznivých jevů A a m je počet všech možných
CHAPTER 1. JEV, NÁHODNÝ JEV, PRAVDĚPODOBNOSTI NÁHODNÉHO JEVU 9 výsledků náhodného pokusu. Pravděpodobnost takto definovaná se nazývá klasická pravděpodobnost. Příklad 1.3 Házíme dvěma kostkami. Stanovte pravděpodobnost jevu A na kostkách padne součet menší než 5. Jsou-li jevy disjunktní, jejich pravděpodobnosti se sčítají. Příklad1.4Vurněmáme32karet,ztoho4esa. Dvakrátzasebouvytáhnemenáhodnějednukartustím,žepoprvnímtahujia)vrátímezpětdourny, b) nevrátíme. Stanovte pravděpodobnost jevu A alespoň jedna z vytažených karet je eso. Dvě reprezentace: 1) rozlišujeme pořadí, 2) nerozlišujeme pořadí.
CHAPTER 1. JEV, NÁHODNÝ JEV, PRAVDĚPODOBNOSTI NÁHODNÉHO JEVU 10 1.3 Geometrická pravděpodobnost O geometrické pravděpodobnosti mluvíme v případě, že a) Ω R d. b) A = B(Ω) je Borelovská σ-algebra na Ω(tj. nejmenší σ-algebra obsahující všechny otevřené podmnožiny Ω). c) P(A) = µd (A) µ d (Ω),kdeµd jed-rozměrnálebesqueovamíra.pronašeúčelypostačí, pokudsipod µ 1 (A)představímedélkumnožiny A,pod µ 2 (A)obsah Aapod µ 3 (A)objem A. Geometrická pravděpodobnost je vhodným modelem tam, kde výsledkům pokusu lzejednoznačněpřiřaditbody ω Ω R d akdežádnýmvýsledkůmnelzedát přednost před ostatními. Příklad 1.5 Autobusy přijíždějí na zastávku pravidelně v 10 minutových in-
CHAPTER 1. JEV, NÁHODNÝ JEV, PRAVDĚPODOBNOSTI NÁHODNÉHO JEVU 11 tervalech. Student přijde na zastávku v náhodném čase. Jaká je pravděpodobnost,žebudečekatdélenež5minut? Příklad1.6Dvěosoby(I,II)přijdounamístoschůzkymezi12.a13.hodinou. Doby příchodu osob jsou náhodné a nezávislé. Ten, kdo přijde na místo schůzky, čeká 20 minut a nedočká-li se druhého, odchází. Jaká je pravděpodobnost, že se osoby setkají? 1.4 Další příklady pravděpodobnostních prostorů Diskrétní a) Ω = {ω 1,ω 2,...}. b) Ajemnožinavšechpodmnožin Ω. c)jsoudánypravděpodobnostielementárníchjevůp(ω i ),kterésplňují: i=1 P( 1. Pak pravděpodobnost libovolného jevu je dána jednoznačně vztahem P(A) = ω i A P(ω i).
CHAPTER 1. JEV, NÁHODNÝ JEV, PRAVDĚPODOBNOSTI NÁHODNÉHO JEVU 12 Spojitý a) Ω = R. b) A = B(R)jeBorelovská σ-algebranad R. c)jedánafunkcef: R [0, ]taková,že Rf(x)dx = 1.Pakpravděpodobnost libovolného jevu A A je dána jednoznačně vztahem P(A) = f(x)dx. A
Chapter 2 Podmíněná pravděpodobnost, nezávislost 2.1 Podmíněná pravděpodobnost Definice2.1Nechťjedánpravděpodobnostníprostor(Ω,A,P)anáhodné jevy A, B,kde P(B) > 0.Podmíněnoupravděpodobnostjevu Azapodmínky, 13
CHAPTER 2. PODMÍNĚNÁ PRAVDĚPODOBNOST, NEZÁVISLOST 14 že nastal jev B, definujeme vztahem P(A B) = P(A B). (2.1) P(B) Věta 2.1(o násobení pravděpodobnosti): ProlibovolnouposloupnostnáhodnýchjevůA 1,A 2,...,A n,takových,žep(a 1 A 2... A n 1 ) > 0,platí P( n i=1a i ) = P(A 1 )P(A 2 A 1 )P(A 3 A 1 A 2 )... (2.2)...P(A n A 1 A 2... A n 1 ). Příklad 2.1 Profesor zapomene deštník při každé návštěvě obchodu s pravděpodo ností 1 4. Jestliženavštívilčtyřiobchodyapřišeldomůbezdeštníku,jakáje pravděpodobnost, že jej zapomněl v posledním obchodě?
CHAPTER 2. PODMÍNĚNÁ PRAVDĚPODOBNOST, NEZÁVISLOST 15 2.2 Nezávislost Uvažujmenynídvanáhodnéjevy AaB.Jestližeproněplatí P(A B) = P(A) a P(B A) = P(B), (2.3) pak mluvíme o jejich vzájemné nezávislosti. Z(2.3) vidíme, že pravděpodobnost jevu Apodmíněnájevem Bnezávisínajevu Banaopak. Z(2.3)azdefinice podmíněné pravděpodobnosti pak dostáváme následující definici nezávislosti dvou náhodných jevů. Definice 2.2 Náhodné jevy A a B jsou nezávislé, jestliže platí P(A B) = P(A) P(B). (2.4) Pojem nazávislosti můžeme rozšířit i na skupinu náhodných jevů. Definice2.3Nechť A 1,A 2,...,A n jsounáhodnéjevy.řekneme,žejsouskupinově(totálně) nezávislé, jestliže pro libovolnou posloupnost indexů
CHAPTER 2. PODMÍNĚNÁ PRAVDĚPODOBNOST, NEZÁVISLOST 16 {k 1,k 2,...,k r } {1,...,n}, r = 2,...,nplatí P(A k1 A k2... A kr ) = P(A k1 ) P(A k2 )... P(A kn ). (2.5) Definice2.4Nechť A 1,...,A n jsounáhodnéjevy.řekneme,žejsoupodvou nezávislé,jestližejevy A i,a j jsounezávisléprovšechna i,j = 1,...,n, i j. Příklad 2.2 Při hodu dvěma mincemi uvažujeme tyto náhodné jevy: A 1...jevspočívajícívtom,žena1.mincipadnerub, A 2...jevspočívajícívtom,žena2.mincipadnelíc, A 3...jevspočívajícívtom,ženaoboumincíchpadnerub,nebolíc. Zjistěte, zda dané jevy jsou skupinově nezávislé. Pravděpodobnosti nezávislých jevů násobíme. Věta2.2Nechť A,Bjsounezávislénáhodnéjevy. Pakdvojicejevů (A, B), (Ā,B), (Ā, B)jsounezávislé.
CHAPTER 2. PODMÍNĚNÁ PRAVDĚPODOBNOST, NEZÁVISLOST 17 Věta2.3Nechť A 1,...,A n jsouskupinově(totálně)nezávisléjevy. Potom platí následující n P( n i=1a i ) = 1 [1 P(A i )]. (2.6) Příklad 2.3 Během dne se v porodnici narodilo 10 dětí. Pravděpodobnost narozeníchlapceje p = 0,514.Jakájepravděpodobnost,žeběhemtohotodne se narodil v porodnici alespoň jeden chlapec? i=1
Chapter 3 Celková pravděpodobnost, Bayesův vzorec Věta3.1(Ocelkovépravděpodobnosti)Nechť A 1, A 2,...jsounáhodné jevy tvořící rozklad jevu jistého, tzn. A i A j =, i ja i=1 A i = Ω. Nechťtytonáhodnéjevymajípostupněpravděpodobnosti P(A 1 ),P(A 2 ),..., přičemž P(A i ) > 0, i = 1,2,...Uvažujmelibovolnýnáhodnýjev B,u něhož 18
CHAPTER 3. CELKOVÁ PRAVDĚPODOBNOST, BAYESŮV VZOREC 19 známe podmíněné pravděpodobnosti P(B A i ), i = 1,2,... Potom P(B) = P(A i ) P(B A i ). (3.1) i=1 Příklad 3.1 Ve městě jsou tři obchodní společnosti. Pod první obchodní společnost spadá 20 obchodů, pod druhou 15 obchodů a pod třetí 10 obchodů. Při návštěvě obchodu první společnosti budete ošizen s pravděpodobností 0,15, v obchodě druhé společnosti 0,08 a u třetí společností s pravděpodobností 0,05. Jaká je pravděpodobnost, že při nákupu v tomto městě budete ošizen? Věta 3.2(Bayesova věta) Nechť jsou splněny předpoklady věty 3.1. Pak P(A i B) = P(B A i ) P(A i ) j=1 P(A, i = 1,2,... (3.2) j) P(B A j )
CHAPTER 3. CELKOVÁ PRAVDĚPODOBNOST, BAYESŮV VZOREC 20 Příklad 3.2 Při vyšetřování pacienta je podezření na 3 navzájem se vylučující nemoci. Pravděpodobnost výskytu první nemoci je 0,3, druhé 0,5 a třetí nemoci 0,2. Laboratorní zkouška dává pozitivní výsledek u 15% nemocných naprvnínemoc,u 30%nemocnýchnadruhounemocau30%natřetínemoc. Jaká je pravděpodobnost výskytu druhé nemoci, jestliže po vykonání laboratorní zkoušky je výsledek pozitivní? Poznámka3.1Pravděpodobnosti P(A 1 ),P(A 2 ),...v(4.4)senazývajíapriorníajevy A 1,A 2,... senazývajíhypotézami. Pravděpodobnosti P(A i B) nazýváme aposteriorní. Příklad 3.3(AIDS). Krevní test na pozitivní virus HIV nemusí vždy správně identifikovat chorobu. Mohou nastat dva druhy chyb. 1. Test špatně indikuje pozitivitu,
CHAPTER 3. CELKOVÁ PRAVDĚPODOBNOST, BAYESŮV VZOREC 21 2. test špatně indikuje negativitu. Statistickým pozorováním bylo zjištěno, že tento test je velmi spolehlivý, přesněji, je-li objekt infikován, bude test pozitivní s pravděpodobností 0,995. Neboli P(Poz Inf) = 0,995,odtuddostáváme,žepravděpodobnostchyby1. druhu je P(Neg Inf) = 0,005.Podobně P(Neg NeInf) = 0,995apravděpodobnost 2.chybyje P(Poz NeInf) = 0,005. Předpokládejme, že bude vydán zákon, který nařídí všem lidem provést tento přesný test, aby mohli být identifikováni všichni infikovaní lidé. Jestliže pak náhodně vybereme jednoho člověka s pozitivním výsledkem testu, ptáme se, jaká je pravděpodobnost, že skutečně má HIV. Neboli zajímá nás pravděpodobnost P(Inf P oz), kterou určíme podle Bayesova vzorce: P(Inf Poz) = P(Poz Inf) P(Inf) P(Poz Inf) P(Inf)+P(Poz NeInf) P(NeInf). Zbývánámurčitapriornípravděpodobnosti P(Inf),P(NeInf).Např.vUSA
CHAPTER 3. CELKOVÁ PRAVDĚPODOBNOST, BAYESŮV VZOREC 22 v roce 1996 bylo 293.433 infikovaných lidí, což vede k odhadům Po dosazení dostáváme P(Inf) = 0,001 a P(NeInf) = 0,999. P(Inf Poz) = 0,995 0,001 0,995 0,001+0,005 0,999 = 0,16. Můžeme tedy mluvit o štěstí, že takový zákon nebyl nikdy vytvořen, protože pouze 16% pozitivních lidí by bylo skutečně infikovaných HIV.
Chapter 4 Náhodná veličina 4.1 Definice náhodné veličiny Definice 4.1 Nechť(Ω, A, P) je pravděpodobnostní prostor. Reálnou funkci X definovanou na Ω nazýváme náhodnou veličinou, jestliže X je měřitelné zobrazení X : (Ω,A) (R,B),tj. {ω Ω : X(ω) B} A (4.1) 23
CHAPTER 4. NÁHODNÁ VELIČINA 24 pro libovolnou borelovskou množinu B B(B je σ-algebra borelovských podmnožin, tj. nejmenší σ-algebra obsahující systém všech otevřených podmnožin R). Poznámka 4.1 Náhodné veličiny budeme značit velkými písmeny: X, Y, Z... Hodnoty, kterých mohou náhodné veličiny nabývat, budeme značit malými písmeny x,y,z. Místo {ω Ω : X(ω) B} budeme zjednodušeně psát {X B} a místo {ω Ω : X(ω) < x}budemezjednodušeněpsát {X < x}. Poznámka 4.2 Součty, součiny a podíly náhodných veličin jsou náhodné veličin umocnění náhodné veličiny přirozeným číslem, násobení náhodné veličiny skaláre jsou opět náhodné veličiny. Příklad4.1Nechť Ω = {1,2,3,4,5,6}představujeprostorvšechvýsledkůnáhodného hodu kostkou. Za σ-algebru A vezmeme systém všech podmnožin Ω.
CHAPTER 4. NÁHODNÁ VELIČINA 25 Pravděpodobnost P(A) náhodného jevu A A je rovna poměru příznivých jevů ke všem jevům. Toto odpovídá klasickému pravděpodobnostnímu prostoru. Nyní na tomto prostoru (Ω, A, P) zkonstruujeme náhodnou veličinu X, která má hodnotu 1, padne-li 6, a hodnotu 0, padne-li něco jiného. Neboli X(6) = 1aX(i) = 0; i = 1,...,5. X : ({1,2,3,4,5,6},A,P) {0,1}, P(ω = 5) = P(5) = 1/6, P(ω Ω : X(ω) = 0) = P(X = 0) = 5/6, P(ω Ω : X(ω) = 1) = P(X = 1) = 1/6. P(X < 2) = P(X = 0)+P(X = 1) = 1.
CHAPTER 4. NÁHODNÁ VELIČINA 26 4.2 Distribuční funkce Definice 4.2 Nechť X je náhodná veličina. Její distribuční funkcí nazýváme reálnoufunkci F X reálnéproměnné xdefinovanou F X (x) = P(X x) = P({ω : X(ω) x}). (4.2) Distribuční funkce je definovaná pro všechna x R. Příklad 4.2 Distribuční funkce F náhodné veličiny definované v předchozím příkladu je pak definována takto: F(x) = 0,pokud x < 0, F(x) = 5/6,pokud 0 x < 1a F(x) = 1,pokud x 1. Distribuční funkce mají určité společné vlastnosti.
CHAPTER 4. NÁHODNÁ VELIČINA 27 Věta4.1(vlastnosti distribuční funkce)distribučnífunkce F X (x)náhodné veličiny X je a)neklesající,tj.prolibovolné a,b R,a b,platí F X (a) F X (b), b)zpravaspojitávlibovolnémbodě x R, c) lim x F X (x) = 0,lim x F X (x) = 1, d) má nejvýše spočetně bodů nespojitosti; Poznámka4.3Je-lidistribučnífunkce F X (x)spojitávbodě x 0,pakvelikost skokuvbodě x 0 jerovnanuletzn. P({ω : X(ω) = x} = 0. Tyto úvahy nás vedou k rozdělení náhodných veličin na dva základní typy, na diskrétní a absolutně spojité náhodné veličiny. Distribuční funkce diskrétní náhodné veličiny je konstantní až na spočetně mnoho bodů, ve kterých má skok. Distribuční funkce absolutně spojité náhodné veličiny je spojitá, a tudíž neobsahuje žádné skoky.
CHAPTER 4. NÁHODNÁ VELIČINA 28 4.3 Diskrétní náhodné veličiny Definice 4.3 Náhodná veličina X se nazývá diskrétní, jestliže existuje posloupnostreálnýchčísel {x n }aodpovídajícíposloupnostnezápornýchčísel {p n }taková,že p n = 1, kde p n = P(X = x n ). (4.3) n=1 Distribuční funkce diskrétní náhodné veličiny X má tvar F X (x) = P(X x) = P(X = x n ) = a {n:x n x} P(a < X b) = F X (b) F X (a) = prolibovolnáreálnáčísla a,b,kde a b. {n:a<x n b} {n:x n x} P(X = x n ) = p n (4.4) {n:a<x n b} p n
CHAPTER 4. NÁHODNÁ VELIČINA 29 Poznámka4.4Distribučnífunkcejeschodovitáfunkceseskokyvbodech x 1, x 2,...ajekonstantnínaintervalech [x n,x n+1 ). Velikostskokuvbodě x n je p n = P(X = x n ). Příklad 4.3 Uvažujme náhodnou veličinu X, jejíž hodnota udává počet telefonníchvýzevza1minutu. Distribučnífunkce F anipravděpodobnosti {p n } nejsou známy. Sledovali jsme 60 realizací této náhodné veličiny a zaznamenali 3, 2, 2, 3, 1, 1, 0, 4, 2, 1 1, 4, 0, 1, 2, 3, 1, 2, 5, 2 3, 0, 2, 4, 1, 2, 3, 0, 1, 2 výsledky. 1, 3, 1, 2, 0, 7, 3, 2, 1, 1 4, 0, 0, 1, 4, 2, 3, 2, 1, 3 2, 2, 3, 1, 4, 0, 2, 1, 1, 5. Jednotlivé realizace náhodné veličiny X jsou nezávislé, máme tedy k dispozici náhodnývýběr(tj. X 1,...,X 60 jsounezávisléstejněrozdělenénáhodnéveličinysdistribučnífunkcí F).
CHAPTER 4. NÁHODNÁ VELIČINA 30 Vytvořme si tabulku absolutních a relativních četností výskytů jednotlivých Počet telefonních výzev za 1 min Absolutní četnost Relativní četnost 0 8 0,133 1 17 0,283 výsledků. 2 16 0,266 3 10 0,166 4 6 0,1 5 2 0,033 7 1 0,016 Celkem 60 1 Relativní četnosti nám odhadují pravděpodobnosti p n. Vzhledem k zákonu velkýchčísel(vizvěta12.4)jetentoodhadvhodný. Vezměmetedytyto p n jakoskutečnépravděpodobnosti p n = P(X = n). Můžemepakzakreslitdistribuční funkci F. Někdy se místo zobrazení distribuční funkce používá zobrazení relativních čet-
CHAPTER 4. NÁHODNÁ VELIČINA 31 1.0 0.8 0.6 0.4 0.2 ností neboli histogram. 2 4 6 8 Figure4.1:Distribučnífunkce F X (x). 4.4 Absolutně spojité náhodné veličiny Definice 4.4 Náhodná veličina X se nazývá absolutně spojitá, jestliže existuje nezápornáintegrovatelnáfunkce f X taková,žeplatí F X (x) = P(X < x) = x f X (t)dt, x (, ). (4.5)
CHAPTER 4. NÁHODNÁ VELIČINA 32 0.25 0.2 0.15 0.1 0.05 2 4 6 8 Figure 4.2: Histogram X. Funkce f X senazýváhustotourozdělenípravděpodobnosti. Poznámka4.5Místo P[Xmávlastnost V] = 1 budemeříkat Xmávlastnost V skoro jistě. Často budeme užívat zkratku s.j. Věta4.2(Vlastnostihustoty)Nechť f X (x)jehustotarozdělenípravděpodobnosti náhodné veličiny X. Pak platí: a) f X (x) = d dx F X(x)s.j.
CHAPTER 4. NÁHODNÁ VELIČINA 33 b) f X(x)dx = 1 c) P(a X < b) = F X (b) F X (a) = b a f X(x)dxprolibovolnáreálnáčísla a,b,kde a b. Příklad 4.4 Uvažujeme hypotetickou populaci ryb. Je známo, že funkce umíránírybzávisínakvadrátudélkyživotaažežádnárybasenedožijevícenež 10let.Neboli F(x)jedánavztahem F(x) = { 0 x 0 (c x) 2 0 < x 10 1 x > 10 a) určeme konstantu c tak, aby F(x) byla distribuční funkce, b) spočtěme hustotu umírání v rybí populaci,
CHAPTER 4. NÁHODNÁ VELIČINA 34 c) spočtěme pravděpodobnost, že ryba zemře mezi 3. a 4. rokem života. Příklad 4.5 Určete koeficient c tak, aby funkce f(x) = { c x2 e x 0 x 1 0 jinde byla hustotou nějaké náhodné veličiny.
Chapter 5 Charakteristiky náhodných veličin Definice 5.1 a) Nechť X je diskrétní náhodná veličina nabývající reálných hodnot x 1, x 2, x 3,...,tzn. taková,že P(X = x i ) = p i. Pakstřední hodnota EX náhodné veličiny X je tvaru EX = x i p i, (5.1) pokud řada v(5.1) konverguje. 35 i=1
CHAPTER 5. CHARAKTERISTIKY NÁHODNÝCH VELIČIN 36 b)nechť Xjeabsolutněspojitánáhodnáveličinashustotou f X.Pakstřední hodnota náhodné veličiny X je EX = pokud integrál existuje. xf X (x)dx, (5.2) Vlastnostistředníhodnoty. Nechť X,Y,X n, n = 1,2,... jsounáhodné veličiny na pravděpodobnostním prostoru (Ω, A, P), a, b jsou reálné konstanty. 1) střední hodnota konstanty je konstanta Ea = a 2) linearita E(aX +by) = aex +bey Věta5.1Nechť Xjenáhodnáveličinaanechť φ : R R.Pakplatí:
CHAPTER 5. CHARAKTERISTIKY NÁHODNÝCH VELIČIN 37 Má-lináhodnáveličina Xdiskrétnírozdělení {x n,p n } n N0,pak Eφ(X) = n N 0 φ(x n )p n, (5.3) pokud jedna ze stran rovnosti existuje. Má-li náhodná veličina X absolutně spojité rozdělení s hustotou f, potom Eφ(X) = pokud jeden z integrálů existuje. φ(x)f(x)dx, (5.4) Definice 5.2 Nechť n je přirozené číslo, n-tý moment náhodné veličiny X jedefinovánjako E(X n ); n-týabsolutnímomentjako E( X n ); n-týcentrální momentjako E[(X EX) n ]. Poznámka 5.1
CHAPTER 5. CHARAKTERISTIKY NÁHODNÝCH VELIČIN 38 a) Z předešlé definice vidíme, že střední hodnota je první moment. b) První centrální moment je vždy roven nule, neboť E(X EX) = EX E(EX) = EX EX = 0. Definice 5.3 Druhý centrální moment náhodné veličiny X se nazývá rozptyl, označuje se obvykle var X(z anglického variance ) var X = E(X EX) 2. Rozptyl je druhou nejdůležitější charakteristikou náhodné veličiny. Z jeho definice vidíme, že existence střední hodnoty je nutnou podmínkou k existenci rozptylu. Číslovar Xjevždynezápornéarovnásenuleprávětehdy,když P(X = c) = 1, c je konstanta. Vzhledem k tomu, že rozptyl udává variabilitu náhodné veličiny ve čtvercích jejích jednotek, používá se také často druhé odmocniny z rozptylu, tzv. směrodatné odchylky σ = var X,
CHAPTER 5. CHARAKTERISTIKY NÁHODNÝCH VELIČIN 39 která měří variabilitu v původních jednotkách náhodné veličiny. Nejdůležitější vlastnosti rozptylu náhodné veličiny X. 1) Nechť X je náhodná veličina, pak var X počítáme nejčastěji pomocí vzorce: 2)Nechťcjekonstanta.Pakvar c = 0. var X = E(X 2 ) (EX) 2. 3)Nechť Xjenáhodnáveličina,aajereálnéčíslo.Pak var (ax) = a 2 var X. 4)Nechť Xjenáhodnáveličinaacjekonstanta.Pak var (X +c) =var X. 5) Nechť X je náhodná veličina, která má konečnou střední hodnotu a konečný nenulový rozptyl. Nechť Y = X EX. var X
CHAPTER 5. CHARAKTERISTIKY NÁHODNÝCH VELIČIN 40 Pak EY = 0avar Y = 1. V některých situacích, jako například v předchozím příkladu je vhodné používat k popisu rozdělení další charakteristiky, kterých je celá řada. Jednou z nich je tzv. medián x.jetočíslo,prokteréplatí P(X x) 1 2 a P(X x) 1 2. Je nutné poznamenat, že medián není těmito podmínkami určen jednoznačně. Další charakteristikou rozdělení může být modus, který se obvykle značí x. Je-li diskrétní rozdělenísoustředěnovbodech x 1, x 2,...,je xtahodnota,prokterouplatí P(X = x) P(X = x i ), i = 1,2,... Je-li rozdělení absolutně spojité, za modus bereme takovou hodnotu x, pro kterou platí f( x) f(x), x (, ). Také modus nemusí být určen jednoznačně(najděte příklad).
CHAPTER 5. CHARAKTERISTIKY NÁHODNÝCH VELIČIN 41 Je-li Fdistribučnífunkce,zaveďmefunkci F 1 předpisem F 1 (u) = inf{x : F(x) u}, 0 < u < 1. Pakse F 1 nazývákvantilováfunkceodpovídajícídistribučnífunkci F. HodnotámfunkceF 1 (u)seříkákvantily.tedyα-kvantilembudemenazývathodnotu F 1 (α). Pokud F jerostoucíaspojitá,pakkvantilováfunkcejeinverznífunkcí k F. Odtudpocházíioznačení F 1. Kvantil F 1 (0,25),resp. F 1 (0,75)bývá zvykem nazývat dolním, resp. horním kvartilem. Kvantilové charakteristiky se používají zřídka a jsou užitečné zejména tehdy, kdy nelze užít momentů. Příklad 5.1 Podle úmrtnostních tabulek USA(1978 až 1979) je pravděpodobnost úmrtí 32 leté ženy během jednoho roku rovna 0,001819. Pojišťovna nabízí ženám tohoto věku, že při ročním pojistném 100 USD vyplatí pozůstalým v případě úmrtí pojištěnce 25 000 USD. Jaký zisk může pojišťovna očekávat, jestliže takovou pojistku uzavře 5 000 žen uvedeného věku? Příklad 5.2 Označme dobu čekání rybáře na úlovek(v minutách) jako náhodnou veličinu X. Předpokládejme, že tato náhodná veličina má hustotu pravdě-
CHAPTER 5. CHARAKTERISTIKY NÁHODNÝCH VELIČIN 42 podobnosti { e x pro 0 < x < f(x) = 0 jinak. Určete střední hodnotu a rozptyl doby čekání rybáře na úlovek. Příklad 5.3 Určete modus x následujících náhodných veličin: 1. diskrétní veličiny X s rozložením pravděpodobnosti p n = { ( 1 2 )n pro n = 1,2,... 0 jinak 2. spojité náhodné veličiny s hustotou f(x) = x2 e x, x (0, ),f(x) = 0jinde. 2
Chapter 6 Příklady diskrétních náhodných veličin 1. Nula- jedničkové(alternativní) rozdělení. Tak budeme nazývat rozdělení náhodné veličiny X, která nabývá jen hodnot 0 a1spravděpodobnostmi 1 pap.číslo psenazýváparametralternativního rozdělení,0<p<1. 43
CHAPTER 6. PŘÍKLADY DISKRÉTNÍCH NÁHODNÝCH VELIČIN 44 Distribuční funkce alternativního rozdělení je dána výrazem { 0 pro x 0 F(x) = 1 p pro 0 < x 1 1 pro x > 1. Středníhodnota EX = p.rozptylvar X = p(1 p)(dokažte).alternativní rozdělení s parametrem p budeme zkráceně označovat A(p).
CHAPTER 6. PŘÍKLADY DISKRÉTNÍCH NÁHODNÝCH VELIČIN 45 2. Binomické rozdělení. JetorozdělenínáhodnéveličinyX,kteránabýváhodnotk = 0,1,2,...,n.Binomické rozdělení je jednoznačně určeno dvěma parametry: přirozeným číslem načíslem p (0,1).Probinomickérozdělenísparametry n, pbudemeužívat zkráceného značení Bi(n; p). Binomickým rozdělením se řídí např. náhodná veličina X, která je rovna počtu úspěchů v posloupnosti n nezávislých alternativních pokusů, kde pravděpodobnost úspěchu v každém pokusu je p, 0 < p < 1. Tedy kde X i = X = n X i, i=1 { 1 pokudvi-témpokusenastalúspěch, 0 pokud úspěch nenastal. Xjesoučtem nalternativníchnáhodnýchveličin.vzhledemknezávislosti X i
CHAPTER 6. PŘÍKLADY DISKRÉTNÍCH NÁHODNÝCH VELIČIN 46 jehledanápravděpodobnost p k tvaru p k = ( n k) p k (1 p) n k pro k = 0,1,...,n. 0.25 0.20 0.15 0.10 0.05 5 10 15 Figure6.1:Pravděpodobnosti p k binomickéhorozdělení. Bi(16;0,5)-kruhy, Bi(16;0,8)-čtverce. Pravděpodobnostip k splňujípodmínkypropravděpodobnostnírozdělení,neboť platí: a) p k 0, k, b) n k=0 p k = n k=0 (n k )pk (1 p) n k = [(1 p)+p] n = 1.
CHAPTER 6. PŘÍKLADY DISKRÉTNÍCH NÁHODNÝCH VELIČIN 47 Názevbinomickérozdělenívyplývázeskutečnosti,žepravděpodobnost p k je členem binomického rozvoje. Distribuční funkce F(x) je tvaru { 0 x 0 n F(x) = 0 k<x( k) p k (1 p) n k 0 < x n 1 x > n. Rozdělení Bi(n;p)mástředníhodnotu nparozptyl np(1 p).
CHAPTER 6. PŘÍKLADY DISKRÉTNÍCH NÁHODNÝCH VELIČIN 48 3. Poissonovo rozdělení jerozdělenínáhodnéveličinyx,kteránabýváhodnotk = 0,1,2,...spravděpodo nostmi p k = e λλk k!. Číslo λ > 0 je parametr Poissonova rozdělení. Vidíme, že pro takto definované pravděpodobnosti p k jsousplněnypodmínky a) p k 0, k = 0,1,2,..., b) k=0 p k = k=0 λk e λ k! = e λ k=0 λk k! = 1, atedy p k jerozdělenípravděpodobnosti. Distribuční funkce je tvaru { 0 pro x 0 F(x) = 0 j<x e λλj j! pro 0 < x <. EX = λ.
CHAPTER 6. PŘÍKLADY DISKRÉTNÍCH NÁHODNÝCH VELIČIN 49 0.15 0.10 0.05 5 10 15 Figure6.2:Pravděpodobnosti p k Poissonovarozdělení. Po(5)-kruhy, Po(10)-čtverce. var X = λ. Poissonovo rozdělení je limitním případem binomického rozdělení pro n,p 0,np λ(=konstanta).
CHAPTER 6. PŘÍKLADY DISKRÉTNÍCH NÁHODNÝCH VELIČIN 50 4. Geometrické rozdělení jerozdělenínáhodnéveličinyx,kteránabýváhodnotk = 0,1,2,...spravděpodo nostmi p k = p(1 p) k.parametr pjezintervalu(0,1).jezřejmé,ževšechna p k 0a k=0 p k = 1,neboť p k = p(1 p) k = p (1 p) k 1 = p 1 (1 p) = 1. k=0 k=0 k=0 0.8 0.6 0.4 0.2 2 4 6 8 Figure6.3:Pravděpodobnosti p k geometrickéhorozdělení. Geom(0,5)-kruhy, Geom(0,8)-čtverce.
CHAPTER 6. PŘÍKLADY DISKRÉTNÍCH NÁHODNÝCH VELIČIN 51 Distribuční funkce geometrického rozdělení je tvaru { 0 pro x 0 F(x) = 0 k<x p(1 p)k pro x > 0. EX = 1 p p. var X = 1 p p 2.
CHAPTER 6. PŘÍKLADY DISKRÉTNÍCH NÁHODNÝCH VELIČIN 52 Příklad 6.1 Jaká je pravděpodobnost, že mezi čtyřmi po sobě narozenými dětmi budou a) první dva chlapci, další dvě dívky b) právě dva chlapci, víme-li, že pravděpodobnost narození chlapce je 0,515? c) Zjistěte, kolik se musí narodit dětí, aby pravděpodobnost, že mezi nimi bude alespoň jeden chlapec, byla větší nebo rovna 0,99. Příklad 6.2 Víme, že pravděpodobnost vypěstování zdravé sazenice ze semena je 0,62. Za náhodnou veličinu X budeme považovat počet zdravých sazenic vypěstovaných z 27 semen. Určete a) jaký je nejpravděpodobnější počet zdravých rostlin a jaká je jeho pravděpodobnost, b) střední hodnotu a rozptyl náhodné veličiny X.
CHAPTER 6. PŘÍKLADY DISKRÉTNÍCH NÁHODNÝCH VELIČIN 53 Příklad 6.3 Předpokládejme, že mladá dravá ryba přežije, pokud uloví rybu alespoňjednouzadvadny. Běhemdvoudnůpodnikne8zápasůspravděpodobností ulovení p = 0, 25. Jaká je pravděpodobnost, že dravá ryba nezemře? Příklad 6.4 Na nádraží mají být instalovány automaty na prodej jízdenek, které po vhození příslušné mince vydají během 10 sekund žádanou jízdenku. Předpokládejme, že v době největší frekvence bude chtít použít automat v průměru 6 osob za minutu. Kolik automatů je nutné instalovat, aby s pravděpodobností větší než 0,95 byl v době největší frekvence obsloužen každý zájemce okamžitě?
Chapter 7 Příklady spojitých náhodných veličin 1. Rovnoměrné rozdělení na intervalu [a, b] je dáno hustotou { 1 f(x) = b a a x b, 0 x < a, x > b. 54
CHAPTER 7. PŘÍKLADY SPOJITÝCH NÁHODNÝCH VELIČIN 55 Distribuční funkce je F(x) = Střední hodnota a rozptyl jsou: { 0 x < a, x a b a a x b 1 x b. EX = a+b 2, var X = 1 12 (b a)2, dokažte. Toto rozdělení budeme označovat U(a, b)(z angl. uniform ).
CHAPTER 7. PŘÍKLADY SPOJITÝCH NÁHODNÝCH VELIČIN 56 2. Exponenciální rozdělení. Hustota pravděpodobnosti exponenciálního rozdělení je f(x) = { 1 λ e x λ x > 0 0 jinak. 2.0 1.5 1.0 0.5 0.5 1.0 1.5 2.0 2.5 3.0 Figure 7.1: Graf hustoty exponenciálního rozdělení- plná čára Exp(1), čárkovaná Exp(1/2), čerchovaná Exp(2).
CHAPTER 7. PŘÍKLADY SPOJITÝCH NÁHODNÝCH VELIČIN 57 Distribuční funkce je F(x) = { 0 pro x 0 1 e x λ x > 0, kde λ je parametrem rozdělení. Ověřme nejprve, zda f(x) je hustota. Vidíme, že f(x) 0, x R. 1 f(x)dx = λ e x λ dx = 1. Středníhodnota EX = λarozptylvar X = λ 2. Věta 7.1 Má-li náhodná veličina X exponenciální rozdělení, pak P(X > x+y X > y) = P(X > x), x > 0,y > 0. 0
CHAPTER 7. PŘÍKLADY SPOJITÝCH NÁHODNÝCH VELIČIN 58 2. Normované normální rozdělení je definováno hustotou f(x) = 1 2π e x2, < x <. Jeho distribuční funkce se tradičně značí písmenem Φ. Φ(x) = 1 2π x e t2 2dt, < x <. Střední hodnota EX = 0 je zároveň mediánem i modusem tohoto rozdělení. var X = 1. 3.(Obecné) normální rozdělení. Toto rozdělení je definováno hustotou f(x) = kde µreálnéaσ 2 kladnéjsouparametry. 1 2π σ 2 e (x µ)2 2σ 2, < x <,
CHAPTER 7. PŘÍKLADY SPOJITÝCH NÁHODNÝCH VELIČIN 59 0.8 0.6 0.4 0.2-3 -2-1 1 2 3 Figure7.2:Grafhustotynormálníhorozdělení-plnáčára N(0,1),čárkovaná N(0,2),tečkovaná N(0,1/2). Distribuční funkci F(x) = 1 x 2π σ lzevyjádřitpomocífunkce Φjako Φ( x µ σ ). e (t µ)2 2σ 2 dt, < x < (7.1)
CHAPTER 7. PŘÍKLADY SPOJITÝCH NÁHODNÝCH VELIČIN 60 Příklad7.1Prodejnaočekávádodávkuzbožívurčitýdenvdoběod12do16 hodin. Podle sdělení dodavatele je uskutečnění dodávky stejně možné kdykoliv během tohoto časového intervalu. Jaká je pravděpodobnost, že zboží bude dodánovdoběodjednéhodinydopůldruhé? Příklad 7.2 Autobusy městské dopravy odjíždějí ze stanice v sedmiminutových intervalech. Cestující může přijít na stanici v libovolném okamžiku. Jaká je střední hodnota a rozptyl doby jeho čekání na odjezd autobusu ze stanice? Příklad 7.3 Z dlouhodobých měření je známo, že radiomagnetofon Sony má poruchu v průměru jednou za 10 000 hodin. Předpokládejme, že doba čekání na poruchu je náhodná veličina X s exponenciálním rozdělením. Stanovme hodnotu t tak, aby pravděpodobnost, že radiomagnetofon bude pracovat delší dobunež t,byla0,99. Příklad 7.4 Do obchodu přijde průměrně 60 zákazníků za 1 hodinu. Jaká jepravděpodobnost, žedoobchodunepřijdežádnýzákazníkběhem 1 2 min.,
CHAPTER 7. PŘÍKLADY SPOJITÝCH NÁHODNÝCH VELIČIN 61 ve které je prodavač nepřítomen. Příklad 7.5 Víme, že populace určitého druhu květin dorůstá výšky X s normálním rozdělením N(20, 16). Spočtěte pravděpodobnost, že náhodně vybraná květina má výšku a)menšínež16, b)většínež20, c)vmezíchod12do28, d)menšínež12nebovětšínež28, e)rovnu22.
CHAPTER 7. PŘÍKLADY SPOJITÝCH NÁHODNÝCH VELIČIN 62 7.1 Normální rozdělení a rozdělení z něj odvozená Normálnírozdělenísestředníhodnotou µarozptylem σ 2 máhustotu [ ] 1 f(x) = exp (x µ)2, x R. 2πσ 2 2σ 2 0.8 0.6 0.4 0.2-3 -2-1 1 2 3 Figure 7.3: Graf hustoty normálního rozdělení- plná čára N(0,1), čárkovaná N(0,2), tečkovaná N(0,1/2). Nejčastěji budeme pracovat s normovaným normálním rozdělením N(0,1). Jeho
CHAPTER 7. PŘÍKLADY SPOJITÝCH NÁHODNÝCH VELIČIN 63 hustotu budeme označovat a distribuční funkci budeme označovat φ(x) = 1 2π e x2 /2, x R Φ(x) = x φ(u)du. Funkce φjesudá,ztohoplyne Φ( x) = 1 Φ(x). Věta7.2CentrálnílimitnívětaNechť X 1,...,X n jeposloupnostnezávislých, stejně rozdělených náhodných veličin se střední hodnotu µ a konečným rozptylem σ 2.Pak n i=1 X i nµ nσ 2 má při n asymptotycky rozdělení N(0,1). Pro vyjádření dalších rozdělení si zopakujme definice Gama a Beta funkce. Γ(a) = 0 x a 1 e x dx, a > 0
CHAPTER 7. PŘÍKLADY SPOJITÝCH NÁHODNÝCH VELIČIN 64 Vlastnosti: Γ(a+1) = a Γ(a), Γ( 1 2 ) = π B(a,b) = Γ(a) Γ(b) Γ(a+b) 7.1.1 Pearsonovo rozdělení NechťsdruženěnezávislénáhodnéveličinyU 1,U 2,...,U k představujínáhodnývýběr ze základního souboru s normovaným normálním rozdělením N(0,1). Pak k χ 2 k = mátzv.rozdělení χ 2 skstupnivolnostiashustotou(pro u > 0)tvaru 1 f k (u) = Γ(k/2) 2 k/2 u(k/2) 1 e u/2, u > 0. i=1 U 2 i Eχ 2 k = k, Var χ 2 k = 2k.
CHAPTER 7. PŘÍKLADY SPOJITÝCH NÁHODNÝCH VELIČIN 65 0.15 0.125 0.1 0.075 0.05 0.025 10 20 30 40 Figure7.4:GrafhustotyPearsonovarozdělení-plnáčára χ 2 10,čárkovaná χ 2 20,tečkovaná χ 2 5. 7.1.2 Studentovo rozdělení Mějme dvě nezávislé náhodné veličiny, a to náhodnou veličinu U s normovaným normálnímrozdělenímn(0,1)anáhodnouveličinuvsrozdělením χ 2 skstupni volnosti. Pak veličina T k = U k V
CHAPTER 7. PŘÍKLADY SPOJITÝCH NÁHODNÝCH VELIČIN 66 má Studentovo rozdělení t s hustotou tvaru s k stupni volnosti. f k (t) = ET k = 0, 1 t2 B( 1 2, (1+ k 2 ) k k ) (k+1)/2, t R Var T k = k k 2, t k k Φ. 0.4 0.3 0.2 0.1-3 -2-1 1 2 3 Figure7.5:GrafhustotyStudentovarozdělení-plnáčáraN(0,1),čárkovaná t 10,tečkovaná t 5.
CHAPTER 7. PŘÍKLADY SPOJITÝCH NÁHODNÝCH VELIČIN 67 7.1.3 Fisherovo-Snedecorovo rozdělení. Nechťdvěnezávislénáhodnéveličinymajírozdělení χ 2,atoUskstupnivolnosti, kdežto náhodná veličina V s n stupni volnosti. Pak náhodná veličina F k,n = U/k V/n má Fisherovo-Snedecorovo rozdělení s k a n stupni volnosti a hustotou ( ) k/2 1 k f k,n (z) = B( k 2, n 2 ) z (k 2)/2 n (1+z k z > 0. n )(k+n)/2, EF k,n = n n 2, Var F k,n = 2n2 (n+k 2) (n 2) 2 (n 4)k.
CHAPTER 7. PŘÍKLADY SPOJITÝCH NÁHODNÝCH VELIČIN 68 0.8 0.6 0.4 0.2 0.5 1 1.5 2 2.5 3 Figure7.6:GrafhustotyFisherova-Snedecorovarozdělení-plnáčára F 10,10,čárkovaná F 20,10,tečkovaná F 5,10. 7.2 Kritické hodnoty Kritické hodnoty obvykle vyjadřují hranici, kterou náhodná veličina překročí se zadanou pravděpodobností α. Kritické hodnoty se dají nalézt v tabulkách či ve specializovaných softwarech. V programu Excel jsou to funkce NORM.INV, CHI.INV, T.INV, F.INV. Kritické hodnoty normálního rozdělení u(α) X N(0,1), P[X u(α)] = α.
CHAPTER 7. PŘÍKLADY SPOJITÝCH NÁHODNÝCH VELIČIN 69 KritickéhodnotyPearsonovarozdělení χ 2 k (α) X χ 2 k, P[X χ 2 k(α)] = α. KritickéhodnotyStudentovarozdělení t k (α) X t k, P[X t k (α)] = α. KritickéhodnotyFisherova-Snedecorovarozdělení F k,n (α) X F k,n, P[X F k,n (α)] = α.