ZÁKLADY PRAVDĚPODOBNOSTI. 1. Co je to pravděpodobnost Začneme matematickým modelem pro popis náhodných jevů a jejich



Podobné dokumenty
6. T e s t o v á n í h y p o t é z

1. Alternativní rozdělení A(p) (Bernoulli) je diskrétní rozdělení, kdy. p(0) = P (X = 0) = 1 p, p(1) = P (X = 1) = p, 0 < p < 1.

1. Pravděpodobnost a statistika (MP leden 2010)

Tématické celky { kontrolní otázky.

Pravděpodobnost a statistika

(Auto)korelační funkce Statistické vyhodnocování exp. dat M. Čada ~ cada

Příklady: - počet členů dané domácnosti - počet zákazníků ve frontě - počet pokusů do padnutí čísla šest - životnost televizoru - věk člověka

z možností, jak tuto veličinu charakterizovat, je určit součet

STP022 PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA

FAKULTA STAVEBNÍ MATEMATIKA II MODUL 2 STUDIJNÍ OPORY PRO STUDIJNÍ PROGRAMY S KOMBINOVANOU FORMOU STUDIA

Poznámky k předmětu Aplikovaná statistika, 9.téma

Jazyk matematiky Matematická logika Množinové operace Zobrazení Rozšířená číslená osa

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Mendelova zemědělská a lesnická univerzita Provozně ekonomická fakulta. Výpočet charakteristik ze tříděných údajů Statistika I. protokol č.

Rozptyl. Pozn.: rozptyl je nezávislý na posunu hustoty pravděpodobnosti na ose x, protože Var(X) mi určuje jen šířku rozdělení.

Funkce zadané implicitně

Součin matice A a čísla α definujeme jako matici αa = (d ij ) typu m n, kde d ij = αa ij pro libovolné indexy i, j.

(iv) D - vybíráme 2 koule a ty mají různou barvu.

PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA I

Skalární součin je nástroj, jak měřit velikost vektorů a úhly mezi vektory v reálných a komplexních vektorových prostorech.

NMAI059 Pravděpodobnost a statistika

5. Maticová algebra, typy matic, inverzní matice, determinant.

prof. RNDr. Roman Kotecký DrSc., Dr. Rudolf Blažek, PhD Pravděpodobnost a statistika Katedra teoretické informatiky Fakulta informačních technologií

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

KMA/P506 Pravděpodobnost a statistika KMA/P507 Statistika na PC

Teoretická rozdělení

Alternativní rozdělení. Alternativní rozdělení. Binomické rozdělení. Binomické rozdělení

Metoda konjugovaných gradientů

kde je dostupný ve formě vhodné pro tisk i ve formě vhodné pro prohlížení na obrazovce a z adresy

KMA/P506 Pravděpodobnost a statistika KMA/P507 Statistika na PC

BAKALÁŘSKÁ PRÁCE. Numerické metody jednorozměrné minimalizace

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

Y36BEZ Bezpečnost přenosu a zpracování dat. Úvod. Róbert Lórencz. lorencz@fel.cvut.cz

Přehled pravděpodobnostních rozdělení

Drsná matematika IV 7. přednáška Jak na statistiku?

Náhodná procházka a její aplikace

UNIVERSITA PALACKÉHO V OLOMOUCI PŘÍRODOVĚDECKÁ FAKULTA. KATEDRA MATEMATICKÉ ANALÝZY A APLIKACÍ MATEMATIKY školní rok 2009/2010 BAKALÁŘSKÁ PRÁCE

Několik poznámek na téma lineární algebry pro studenty fyzikální chemie

2. Je dáno jevové pole (Ω;A) a na něm nezáporná normovaná funkce. Definujte distrubuční funkci náhodného vektoru.

9. Úvod do teorie PDR

3. Matice a determinanty

Pavel Burda Jarmila Doležalová

FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ. Matematika 3. RNDr. Břetislav Fajmon, PhD. Autoři textu:

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně

zejména Dijkstrův algoritmus pro hledání minimální cesty a hladový algoritmus pro hledání minimální kostry.

DISKRÉTNÍ NÁHODNÉ VELIČINY (II)

Modely diskrétní náhodné veličiny. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

A NUMERICKÉ METODY. Matice derivací: ( ) ( ) Volím x 0 = 0, y 0 = -2.

f (k) (x 0 ) (x x 0 ) k, x (x 0 r, x 0 + r). k! f(x) = k=1 Řada se nazývá Taylorovou řadou funkce f v bodě x 0. Přehled některých Taylorových řad.

NUMP403 (Pravděpodobnost a Matematická statistika I)

GRAFY A GRAFOVÉ ALGORITMY

MATEMATIKA IV - PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE - ZÁPISKY Z. Obsah. 1. Parciální diferenciální rovnice obecně. 2. Kvaazilineární rovnice prvního řádu

Geometrická zobrazení

6 5 = 0, = 0, = 0, = 0, 0032

Lineární algebra II. Adam Liška. 9. února Zápisky z přednášek Jiřího Fialy na MFF UK, letní semestr, ak. rok 2007/2008

KATEDRA INFORMATIKY UNIVERZITA PALACKÉHO LINEÁRNÍ ALGEBRA 1 OLGA KRUPKOVÁ VÝVOJ TOHOTO UČEBNÍHO TEXTU JE SPOLUFINANCOVÁN

METODICKÉ LISTY Z MATEMATIKY pro gymnázia a základní vzdělávání

Regresní a korelační analýza

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Některé zákony rozdělení pravděpodobnosti. 1. Binomické rozdělení

6. Měření Youngova modulu pružnosti v tahu a ve smyku

Pravděpodobnost a statistika (BI-PST) Cvičení č. 4

Poznámky k předmětu Aplikovaná statistika, 4. téma

0. Lineární rekurence Martin Mareš,

A0M15EZS Elektrické zdroje a soustavy ZS 2011/2012 cvičení 1. Jednotková matice na hlavní diagonále jsou jedničky, všude jinde nuly

Petr Chvosta. vlevo, bude pravděpodobnost toho, že se tyč na počátku intervalu τ B nachází nad vpravo

Prognóza poruchovosti vodovodních řadů pomocí aplikace Poissonova rozdělení náhodné veličiny

1. ročník, 2011/ 2012 Medzinárodný korešpondenčný seminár iks

V této sekci zobecníme vnější kalkulus z kapitoly 4 operaci vnějšího. se sice na zde zavedené operace budeme odvolávat, vždy ale jen jako

Návody k domácí části I. kola kategorie A

1 Rozptyl a kovariance

Základní radiometrické veličiny

1 Gaussova kvadratura

Učební texty k státní bakalářské zkoušce Matematika Matice. študenti MFF 15. augusta 2008

Pravděpodobnost a aplikovaná statistika

I. D i s k r é t n í r o z d ě l e n í

2.2. SČÍTÁNÍ A NÁSOBENÍ MATIC

Kapitola 11. Vzdálenost v grafech Matice sousednosti a počty sledů

Spojitost funkcí více proměnných

1 Klasická pravděpodobnost. Bayesův vzorec. Poslední změna (oprava): 11. května 2018 ( 6 4)( 43 2 ) ( 49 6 ) 3. = (a) 1 1 2! + 1 3!

3. Mocninné a Taylorovy řady

p(x) = P (X = x), x R,

Masarykova univerzita. Základy konvexní analýzy a optimalizace v R n.

Biostatistika a matematické metody epidemiologie- stručné studijní texty

Mendelova zemědělská a lesnická univerzita v Brně Institut celoživotního vzdělávání Fakulta regionálního rozvoje a mezinárodních studií

Poznámky k předmětu Aplikovaná statistika, 4. téma

1.5.7 Prvočísla a složená čísla

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace

Jaroslav Michálek A STATISTIKA

Gymnázium, Brno. Matice. Závěrečná maturitní práce. Jakub Juránek 4.A Školní rok 2010/11

2. RBF neuronové sítě

Pravděpodobnost a statistika (BI-PST) Cvičení č. 7

Základy sálavého vytápění Přednáška 8

+ ω y = 0 pohybová rovnice tlumených kmitů. r dr dt. B m. k m. Tlumené kmity

Elektrotechnická fakulta

Řešené úlohy ze statistické fyziky a termodynamiky

u, v, w nazýváme číslo u.( v w). Chyba! Chybné propojení.,

Diskrétní rozdělení Náhodná veličina má diskrétní rozdělení pravděpodobnosti, jestliže existuje seznam hodnot

alternativní rozdělení Statistika binomické rozdělení bi(n, π)(2)

Edita Kolářová ÚSTAV MATEMATIKY

Transkript:

MATEMATIKA PRO??? 2003/4, 1?? c MATFYZPRESS 2004 ZÁKLADY PRAVDĚPODOBNOSTI JOSEF ŠTĚPÁN 1 1. Co je to pravděpodobnost Začneme matematicým modelem pro popis náhodných jevů a jejich pravděpodobností. Uvědomme si, že aniž bychom onstruovali onzistentní matematicý model pro náhodu, intuitivně lademe na pravděpodobnost jisté rozumné požadavy. Napřílad aby pravděpodobnost toho, že na ostce padne pěta či šesta, byla součtem pravděpodobností pěty a šesty. Náš model taové představy zahrnuje a umožňuje nám provádět rigorózní analýzu fenoménu náhody. Definice 1. Pravděpodobnostní prostor je trojice (Ω, F, P), de Ω je neprázdná množina, F něterá algebra podmnožin Ω a P pravděpodobnostní množinová funce (PMF) definovaná na algebře F. Specifiujeme: Algebra F je systém podmnožin Ω s vlastnostmi (1), Ω F, F c = Ω \ F F, F G, F G F pro F, G F. PMF P je funce definovaná na algebře F s vlastnostmi (2) P( ) = 0, P(Ω) = 1, 0 P(F ) 1, P(F G) = P(F ) + P(G) pro F G =. V ontextu náhodného pousu interpretujeme trojici (Ω, F, P) tato: Ω je seznam všech možných výsledů ω náhodného pousu. Množinu Ω v onrétních situacích volíme ta, aby elementární jevy ω byly těmi nejjemnějšími výsledy náhodného pousu, teré je třeba rozlišovat. Klíčová slova. Pravděpodobnostní prostor, urnový model, charateristiy náhodné veličiny, limitní chování, podmíněná pravděpodobnost, nezávislost. Tato práce vznila za podpory grantu MSM 113200008. 1 MFF UK, KPMS, Soolovsá 83, 186 75 Praha Karlín.

2 JOSEF ŠTĚPÁN 1 Jednotlivé prvy ω Ω se nazývají elementární jevy, tedy záladní výsledy náhodného pousu (napřílad na ostce padne výslede 1, 2, 3, 4, 5, nebo 6 máme proto šest elementárních jevů). Množiny F F (náhodné jevy) jsou vlastnosti výsledu pousu, terým umíme připsat pravděpodobnost P(F ). F F s P(F ) = 1 se nazývá jev jistý, je-li P(F ) = 0, říáme, že F je jev nemožný. Povšimněme si, že vlastnosti F F, tj. taové vlastnosti, terým umíme přidělit pravděpodobnosti P(F ), vyazují stabilitu na standardní množinové operace. Dále si povšimněme, že PMF P měří pravděpodobnost náhodných jevů F F aditivně, ta jao měříme plochu nebo objem. Vlastnosti (2) mají elementární důsledy, blíže viz věty 1.3, 1.4 v [1]: (3) P(F c ) = 1 P(F ), (4) P(F ) P(G), P(G \ F ) = P(G) P(F ) pro F G, ( n ) P F = P(F ) P(F F j ) +... (5) Speciálně =1 1 n 1 <j n + ( 1) n+1 P( n =1F ). (6) P(F G) = P(F ) + P(G) P(F G). Velmi často je výslede pousu ω Ω značně omplexní entita, zatímco nás zajímají jen něteré jeho numericé vlastnosti, běžně označované X 1 (ω), X 2 (ω),... Obrazem je následující definice. Definice 2. (Ω, F, P) buď pravděpodobnostní prostor. Reálná funce X definovaná na Ω s vlastnostmi: (7) množina jejích hodnot X(Ω) je onečná, (8) množina [X = x] = {ω Ω : X(ω) = x} F pro aždé x R, se nazývá náhodná veličina (NV). Všimněme si zejména, že požadujeme [X = x] F, tedy [X = x] je náhodný jev a jsme schopni říci, jaou má pravděpodobnost. Zřejmě P[X = x] je pravděpodobnost toho, že NV X nabývá hodnoty x. Podobně P[X x] je pravděpodobnost toho, že NV X má hodnotu, terá je menší nebo rovna číslu x.

ZÁKLADY PRAVDĚPODOBNOSTI 3 Počet pravděpodobnosti znal ve svých počátcích ([1], dodate A4) pouze ombinatoricý pravděpodobnostní prostor, terý budeme nyní definovat. Definice 3. Ω buď onečná neprázdná množina, F algebra všech jejích podmnožin a PMF P buď definovaná jao P(F ) = F, de F F a je počet prvů množiny. Ω Trojice (Ω, F, P) se nazývá ombinatoricý pravděpodobnostní prostor (KPP) nad Ω. Které pousy jsou modelovány pomocí KPP nad Ω? Definice 3 říá, že P(ω) = P({ω}) = Ω 1 pro aždý výslede pousu ω Ω. Pravděpodobnosti všech výsledů jsou stejné, KPP nad Ω je vhodný model pro pousy, teré neposytují důvod preferovat něteré ω 1 Ω před jiným ω 2 Ω. Poznamenejme, že je-li (Ω, F, P) KPP nad Ω, pa aždá reálná funce X definovaná na Ω je náhodná veličina. Uvedeme něteré přílady náhodných pousů, pro teré je ombinatoricý pravděpodobnostní prostor vhodným modelem. Čtenář možná ocení příležitost zopaovat si zálady lasicé ombinatoriy v dodatu A1 z [1]. Přílad 1 (Výběr s vracením). V osudí je a oulí černých a b oulí bílých. Z osudí postupně vytáhneme dvě oule, prvou taženou ouli vrátíme do osudí před druhým tahem. Uvažte náhodné jevy B 1 = [v prvém tahu bílá oule], a vypočtěte P(B 1 ) a P(B 2 ). Ja dospět evidentním pravděpodobnostem B 2 = [v druhém tahu bílá oule] (9) P(B 1 ) = P(B 2 ) = b? a + b Jao Ω se lstivě nabízí množina všech dvoučlenných posloupností 0 a 1, de napřílad (1,1) označuje výslede, dy byla dvaráte tažena bílá oule, (0,1) výslede, dy v prvém tahu byla tažena oule černá a v druhém tahu bílá. Poud je vša a < b, máme oprávněný pocit, že pous preferuje posloupnosti více zaplněné jednotami a tudíž, že model KPP nad tímto Ω není adevátní (bylo by P(B 1 ) = P(B 2 ) = 1 2 ). Tuto obtíž odstraníme ta, že aždé z a + b oulí uměle přidělíme vlastní identitu tím, že černé oule očíslujeme čísly 1, 2,..., a a bílé čísly

4 JOSEF ŠTĚPÁN 1 a + 1, a + 2,..., a + b. KPP nad množinou Ω všech dvoučlenných posloupností čísel 1, 2,..., a + b je již jistě správný model pro náš pous, protože umělým očíslováním jsme výsledy pousu zrovnoprávnili. Jest tedy Ω = (a + b) 2, B 1 = b(a + b), B 2 = (a + b)b a výslede (9) je ověřen. Přílad 2 (Výběr bez vracení). Pous je stejný jao v Příladu 1 s tím rozdílem, že prvá tažená oule se do osudí nevrací. Jaé jsou pravděpodobnosti P(B 1 ) a P(B 2 ) nyní? Opaujeme onstruci z příladu 1 s tím, že (zřejmě) Ω je nyní množinou všech dvoučlenných posloupností různých prvů množiny 1, 2,..., a + b. Tedy Ω = (a + b)(a + b 1), B 1 = b(a + b 1) B 2 = ab + b(b 1) a (upodivu?) též dostáváme pravděpodobnosti P(B 1 ) a P(B 2 ) jao v (9). Oba přílady jsou velmi speciální v ontextu známých Pólyových urnových schémat (viz [1], 3.6). Přílad 3. Maxwellův-Boltzmannův model ve statisticé fyzice uvažuje n rozlišitelných částic a r disjuntních částí fázového prostoru (přihráde). Všechna rozmístění částic do přihráde jsou stejně možná. Uvažte náhodné veličiny K 1, K 2,..., K r, teré označují počty částic v přihrádách 1, 2,..., r. Určete P[K i = ] pro 0 n. Naším jediným problémem je matematizovat pojem rozmístění. Úplný popis fyziální situace spočívá v tom, že pořídíme adresář částic, tj. (a 1, a 2,..., a n ), de 1 a r je adresa (číslo přihrády) částice 1 n. Správný model je tedy KPP nad množinou Ω všech posloupností čísel 1, 2,..., r dély n. Jest ( ) n Ω = r n, [K i = ] = [K 1 = ] = (r 1) n Vzhledem symetricé povaze pousu je jedno, terou z přihráde uvažujeme, bez újmy na obecnosti tedy zvolíme pro výpočet tu první. Odtud plyne první rovnost. Pa vybereme částic do prvé přihrády, zbývajících n částic rozmístíme do zbývajících r 1 přihráde libovolně, zísáme ta druhou rovnost.jest tedy pro aždé {0, 1,..., n} (10) P[K i = ] = ( n ) (r 1) n r n = ( n ) ( 1 r ) ( 1 1 r ) n.

ZÁKLADY PRAVDĚPODOBNOSTI 5 Více o Maxwellově-Boltzmannově modelu a jiných modelech statisticé fyziy naleznete v [1], apitoly 3.3, 3.4 a 3.5. Něteré úlohy mohou být obtížné i z hledisa ombinatoricého. Přílad 4. Šestráte hodíme symetricou ostou. Uvážíme náhodné veličiny K 1, K 2,..., K 6, de K i označuje počet bodů dosažených v i-tém hodu. Vypočtěte pravděpodobnost p toho, že posloupnost K 1, K 2,..., K 6 je monotonní. Modelem pro tento pous je zřejmě množina Ω = {1, 2,..., 6} 6 všech posloupností čísel 1, 2,..., 6 dély 6 a KPP nad ní. Označíme M 1 = [K 1 K 2 K 6 ], M 2 = [K 1 K 2 K 6 ], M 3 = [K 1 = K 2 = = K 6 ]. Protože počet nelesajících posloupností čísel 1, 2,..., n dély r je toli co ombinací r-té třídy z n prvů s opaováním (viz dodate A1, [1]), dostáváme ( ) ( ) 6 1 + 6 11 Ω = 6 6, M 1 = =, M 3 = 6. 6 6 Použitím formuly (6) obdržíme výslede: p = P(M 1 M 2 ) = P(M 1 ) + P(M 2 ) P(M 1 M 2 ) ) 11 6 = 2P(M 1 ) P(M 3 ) = 2( 6 6 6 6. 6 = 0,0197. Použili jsme formuli (6), její obecnější verze (5) umožní řešit úlohy jao je následující (viz [1], přílad 1.3). Přílad 5. Počítač náhodně a rovnoměrně generuje permutace celých čísel 1, 2,..., n řádu n, ( 1, 2,..., n ). Určete pravděpodobnost p n toho, že bude generována permutace s alespoň jednou shodou, tj. taová permutace, že existuje 1 j n taové, že j = j. K dosažení výsledu n i=1 ( 1)i+1 (n!) 1 použijte vzorec (5). Povšimněte si, že lim n p n = 1 e 1. = 0,6321. Přílad 6. Uvažte znovu pous z příladu 4 a označme M maximum dosažených bodů, M = max{k 1, K 2,..., K 6 }. Určete pravděpodobnost P[M = ] pro 1 6.

6 JOSEF ŠTĚPÁN 1 Snadněji určíme pravděpodobnosti P[M ], neb je zřejmé, že jev [M ] zahrnuje právě 6 jevů elementárních. Odsud, podle (4), je pro 1 6 P[M = ] = P ( [M ] \ [M 1] ) (11) = P[M ] P[M 1] = 6 ( 1)6 66 6 6. Vypočteme-li pravděpodobnosti p = P[M = ], dostaneme tabulu 1 2 3 4 5 6 p 0,00002 0,00135 0,01425 0,07217 0,24711 0,66510 Vidíme, že nejpravděpodobnější hodnota (modus) maxima M je 6 a jeho pravděpodobnostmi vážený průměr (střední hodnota) je p = 5,5609. Naše přílady se dosud týaly pouze experimentů s onečnou množinou výsledů Ω, teré jsou považovány za stejně pravděpodobné a teré jsou modelovány pomocí KPP nad Ω. Následující přílad vyžaduje model s neonečnou množinou výsledů. Přílad 7. Počítač generuje náhodně a rovnoměrně čísla ω [0, 1]. Určete pravděpodobnost p n toho, že bude generováno číslo ω jehož dvojový rozvoj má na n-tém místě jednotu (uvažujme rozvoje s onečným počtem jedniče pro čísla typu 2 n ). Ja modelovat tento náhodný pous v rámci definice 1? Zřejmě musí být Ω = [0, 1]. Je-li X n (ω) n-tý člen dvojového rozvoje čísla ω, pa p n = P[X n = 1] a (Ω, F, P) musí tedy být taový prostor, že funce X 1, X 2,... jsou náhodné veličiny. Protože (12) [ 1 2, 1 ] [ 1 [X 1 = 1] =, [X 2 = 1] = 4, 1 ) [ ] 3 2 4, 1,..., [X n = 1] = [ 1 2 n, ) [ 2 n ] 1 2 n 2 n, 1,..., 1 <2 n sudé je tento požadave splněn, dyž algebra F zahrnuje všechna onečná sjednocení disjuntních intervalů. Naštěstí systém těchto sjednocení je sám již algebrou a problém dvojice (Ω, F) je vyřešen. Ja definovat pravděpodobnost P(F )? Generátor vybírá čísla ω [0, 1] rovnoměrně, je tedy třeba, aby pravděpodobnost intervalu I byla rovna jeho délce I.

ZÁKLADY PRAVDĚPODOBNOSTI 7 Abychom vyhověli požadavu na aditivitu pravděpodobnosti P, definujme pravděpodobnost sjednocení disjuntních intervalů jao součet jejich déle, tedy n n (13) P(F ) = I, de F = I, I I j = pro j. =1 =1 Není úplně snadné se přesvědčit, že definice (13) je oretní, tj. že hodnota P(F ) nezávisí na volbě rozladu I 1, I 2,..., I n, a že P je PMF ve smyslu definice 1. Umluvíme se, že tato onstruovaný pravděpodobnostní prostor bude nazýván generátor náhodných čísel v intervalu [0, 1]. Jeho onstruce je taová, že aždá funce X n, de X n (ω) je n-tý člen dvojového rozvoje ω, je náhodná veličina. V rámci tohoto modelu dostáváme pomocí (12) očeávaný výslede (14) p n = P[X n = 1] = 2 n 1 1 2 n = 1. 2 Pousíme se zobecnit pravděpodobnostní chování náhodných veličin, teré prozatím vstupovaly do našich příladů. Pro následující text se domluvme, že zna X R budeme číst náhodná veličina X má rozdělení R, nebo X se řídí rozdělením R. Definice 4. Řeneme, že NV má alternativní rozdělení s parametrem p [0, 1], píšeme X Alt(p), dyž X má pouze hodnoty 0 a 1 ta, že P[X = 1] = p, a P[X = 0] = q = 1 p. Vrátíme se příladům 1 a 2, označíme X 1 = I B1 a X 2 = I B2 (I B (ω) nabývá hodnot nula a jedna; I B (ω) je jedna právě tehdy, dyž ω B). X 1 a X 2 jsou tedy indiátory bílé barvy v prvém a druhém tahu. Zřejmě je ( ) b X i Alt pro i = 1, 2. a + b Taé dvojové souřadnice v příladu 7 jsou taové, že X n Alt ( 1 2 ). Definice 5. Řeneme, že NV X má binomicé rozdělení s parametry n N a p [0, 1], píšeme X Bi(n, p), dyž X má hodnoty v množině {0, 1, 2,..., n} a platí, že P[X = ] = ( n ) p q n, 0 n, q = 1 p.

8 JOSEF ŠTĚPÁN 1 Poznamenejme, že aditivita P si vynucuje, aby platilo ( n n ) P[X = ] = P [X = ] = P(Ω) = 1, =0 =0 což je podle binomicé věty správná rovnost. V příladu 3 vystupují NV K 1, K 2,..., K r, teré označují počet částic v přihrádách 1, 2,..., r. V (10) jsme odvodili, že ( (15) K j Bi n, 1 ) pro 1 j r, r je-li n celový počet částic. Uvedeme další přílady NV s binomicým rozdělením. Přílad 8. Mincí, jejíž rub je označen nulou a líc jednotou, hodíme n-ráte, S n buď počet dosažených jednote. Uažte, že pa platí S n Bi ( n, 1 2). Pous je modelován jao KPP nad množinou Ω všech nula-jednotových posloupností dély n. Zřejmě jest pro 0 n Ω = 2 n, [Sn = ] ( ) ( ) ( ) ( n n 1 =, P[S n = ] = 1 1 n, 2 2) taže S n má rozdělení Bi ( n, 1 2). Přílad 9. V osudí je a oulí černých a b oulí bílých. Z osudí postupně vybíráme n oulí, taženou ouli vždy vracíme. K n buď NV, ( terá ) označuje b počet tažených oulí bílé barvy. Doažte, že K n Bi n, a+b. Tento pous (viz přílad 1) modelujeme pomocí KPP nad množinou Ω všech posloupností čísel 1, 2,..., a + b dély n. Dostáváme Ω = (a + b) n a [K n = ] ( ) n = b a n, ( ) b taže K n Bi n, a+b. Tyto definice samozřejmě nevyčerpávají všechny možnosti pravděpodobnostního chování náhodných veličin, uázou je maximum M v příladu 6. Následujíci charateristiy toto chování částečně popisují. Definice 6. Je-li X náhodná veličina, pa čísla EX = x xp[x = x] a varx = x (x EX) 2 P[X = x]

ZÁKLADY PRAVDĚPODOBNOSTI 9 nazýváme střední hodnota a rozptyl náhodné veličiny X. Poznamenejme, že součty x v předchozích formulích jsou součty onečné, protože P[X = x] 0 pouze v onečně mnoha případech. Poznamenejme taé, že interpretujeme-li P[X = x] jao hmotu umístěnou do bodu x, pa EX je těžiště a varx moment setrvačnosti tato vznilé soustavy hmotných bodů. Jednoduché vlastnosti střední hodnoty jsou: Věta 1. Buďte X a Y NV, (16) (17) a, b, c reálná čísla. Pa E (ax + by + c) = aex + bey + c, dyž P[X a] P[Y a] pro všechna a, pa EX EY. Důaz je snadný, (16) napřílad dostaneme apliací následujícího vzoreču. Lemma 1. Jsou-li X a Y náhodné veličiny, f(x, y) reálná funce definovaná na R 2, pa Z = f(x, Y ) je taé náhodná veličina a (18) EZ = (x,y) (19) Je tedy f(x, y)p[x = x, Y = y]. E(X + Y ) = (x,y)(x + y)p[x = x, Y = y] = x x y P[X = x, Y = y] + y y x P[X = x, Y = y] = x xp[x = x] + y yp[y = y] = EX + EY a taé (20) EX 2 = x x 2 P[X = x]. Spočteme (18): jest [Z = z] = (x,y) A z [X = x, Y = y] F, Z je tedy náhodná veličina a aditivita P říá, že P[Z = z] = P[X = x, Y = y]. (x,y) A z A z = {(x, y) : f(x, y) = z}.

10 JOSEF ŠTĚPÁN 1 Jest tudíž EZ = zp[z = z] = z P[X = x, Y = y] z z (x,y) A z = f(x, y)p[x = x, Y = y]. (x,y) Věta 1 společně s právě doázaným lemmatem verifiují i následující vlastnosti rozptylu. Věta 2. Je-li X NV, a, b, c reálná čísla, pa (21) varx = E (X EX) 2 = EX 2 (EX) 2, (22) var (ax + b) = a 2 varx. Poznáma 1. Formule (21) nás navádí, abychom počítali rozptyl varx jao ( ) 2 x 2 P[X = x] xp[x = x]. Určete tato rozptyl maxima M v příladu 6 (spočítali jsme EM = 5,56029). Tato taé snadno ověříte, že (23) (24) pro X Alt(p) je EX = p a varx = pq pro X Bi(n, p) je EX = np a varx = npq. Uvažte ještě náhodnou veličinu X, terá má rovnoměrné rozdělení na množině {x 1, x 2,..., x n }, tj. P[X = x ] = 1/n pro 1 n. Střední hodnota je tedy v tomto případě aritmeticý průměr EX = x = 1 x n a rozptyl je aritmeticý průměr čtverců odchyle od x varx = s 2 = 1 (x x) 2. n Zvolte x =, určete x a s 2. Sutečný význam rozptylu uazuje následující nerovnost.

ZÁKLADY PRAVDĚPODOBNOSTI 11 Věta 3 (Čebyševova nerovnost I). Je-li X náhodná veličina a ε > 0, pa P [ X EX ε ] varx ε 2. Čebyševova nerovnost říá, že s lesajícím rozptylem se zvětšuje oncentrace pravděpodobnosti v libovolném oolí střední hodnoty. Důaz je snadný. Je-li Y funce přiřazující hodnotu 1 náhodnému jevu [ X EX ε] a hodnotu 0 opačnému jevu, pa Y Alt(p), de p = P[ X EX ε]. Podle (23) je P[ X EX ε] = EY E [ ε 2 (X EX) 2] = ε 2 varx, de prvá nerovnost plyne z (17), protože (!) Y ε 2 (X EX) 2 a druhá rovnost je důslede linearity (16). Pomocí EX = µ a varx = σ 2 můžeme onstruovat interval, terý porývá hodnoty X s velou pravděpodobností 1 α (třeba α = 0,05). V Čebyševově nerovnosti volte ε = σ α a dostanete [ P µ σ X µ + σ ] 1 σ2 α α ε 2 = 1 α. Pro α = 0,05 je 1 α. = 4,5 a dostáváme (25) P[µ 4,5σ X µ + 4,5σ] 0,95. Tento odhad, díy své univerzalitě, příliš užitečný není. Dodatečná informace o typu rozdělení NV X může interval [µ 4,5σ, µ + 4,5σ] při zachování nerovnosti (25) podstatně zrátit, ja uážeme v závěru tohoto odstavce. Vyšetříme limitní chování binomicých pravděpodobností Bi(n, p) ve dvou zcela odlišných situacích. A. Bi(n, p) pro velé hodnoty parametru n a malé hodnoty pravděpodobnosti p, je-li np = λ n. Přesněji, předpoládáme-li, že lim n np n = λ > 0, pa ( ) n p n (1 p n) n = 1 ( 1 np ) n n pn (n 1)p n (n + 1)p n! n (1 p n ) má při n limitu rovnu číslu e λ λ! pro aždé pevné = 0, 1, 2,....

12 JOSEF ŠTĚPÁN 1 Úmluva 1. Řeneme, že náhodná veličina X má Poissonovo rozdělení P o(λ), dyž nabývá hodnot = 0, 1, 2... s pravděpodobnostmi P[X = ] = e λ λ.! Povšimneme si, že celová pravděpodobnost je P[X = ] = e λ λ! = 1. =0 Definujme střední hodnotu i pro náhodnou veličinu X P o(λ) s neonečně mnoha hodnotami. Je přirozené zobecnit definici 6 na neonečné součty EX = P[X = ], varx = ( EX) 2 P[X = ]. =0 =0 =0 Přímým výpočtem zjistíme, že EX = varx = λ. Uvědomíme si, že na tomto místě sutečně jde o úmluvu, v našem ontextu jsou náhodné veličiny funce, teré nabývají pouze onečně mnoha hodnot. Obecné zavedení střední hodnoty (a rozptylu) vyžaduje jistou míru opatrnosti při zacházení s neonečným součtem či integrálem. Výše uvedený limitní výpočet má nyní tvar následujícího tvrzení. Věta 4 (Poissonova věta). Uvažujme náhodné veličiny X n Bi(n, p n ) taové, že lim n np n = λ > 0 a náhodnou veličinu Y, terá má Poissonovo rozdělení P o(λ). Pa lim P[X n = ] = P[Y = ] pro = 0, 1, 2,... n n a p 0, použijeme aproxi- Poučení 1. Je-li X n Bi(n, p), maci X n P o(np). Podle vzorce (15) mají počty částic K 1, K 2,..., K r z příladu 3 binomicé rozdělení Bi (n, 1/r). Při n = 500 a r = 365 můžeme bezpečně nahradit binomicé rodělení Bi (500, 1/365) Poissonovým rozdělením P o (500/365). Následující tabula uvádí přesnou hodnotu p = P[K 1 = ] v řádu druhém a její Poissonovu aproximaci a v řádu třetím. 0 1 2 3 4 5 6 p 0,2537 0,3484 0,2388 0,1089 0,0372 0,0101 0,0023 a 0,2541 0,3481 0,2385 0,1089 0,0373 0,0102 0,0023

ZÁKLADY PRAVDĚPODOBNOSTI 13 Pravděpodobnost p 0 lze interpretovat jao pravděpodobnost toho, že ve supině pěti set osob nemá nido narozeniny 1. ledna. Za jaých oolností a proč? B. Druhým limitním chováním binomicého rozdělení je situace Bi(n, p) pro velé hodnoty n a nioliv příliš malé či velé hodnoty p. Do této asymptotiy magicy vstupuje hustota ϕ( ) a distribuční funce Φ( ) normálního rozdělení pravděpodobností, terému taé říáme Gaussovo, tj. ϕ(t) = 1 2π e 1 2 t2 a Φ(x) = x ϕ(t) dt. Uvědomme si nyní o jaý typ náhodné veličiny jde. V předchozí tabulce si můžeme povšimnout, že hodnoty 0, 1, až 5 dávají dohromady pravděpodobnost přes 99%, tedy s téměř jistotou lze tvrdit, že výslede (počet lidí ze supiny 500 osob, teré mají narozeniny 1. ledna za předpoladu, že ro má 365 dní, lidé se rodí rovnoměrně a ve supině se nevysytují dvojčata) bude jedna ze šesti hodnot (se stále vysoou pravděpodobností se lze omezit jen na hodnoty 0, 1, 2, 3). Nyní je situace úplně jiná. Uvažujme velý počet náhodných pousů ve terých vystupuje náhodná veličina s alternativním rozdělením s dostatečně velým parametrem p. Napřílad při 600 hodech ostou je za předpoladu, že šesta padne s pravděpodobností 1/6, nejpravděpodobnější výslede 100 šeste. Tato hodnota má ale pravděpodobnost zcela zanedbatelnou, menší než 5 %! Jmenovitě jde o hodnotu P[X = 100] = ( 600 100 ) 5 5 00 6 6 00 sqrt6 10 10π, ja se lze přesvědčit použitím Stirlingova vzorce pro přibližný výpočet fatoriálu n! 2πn n e n. Pro pevnou hodnotu p a vzrůstající počet pousů roste i počet výsledů, teré lze očeávat. Výsledem je, že limitní rozdělení musí obsahovat neonečně mnoho hodnot. Jednotlivé hodnoty ale mají nulovou pravděpodobnost a smysl má hovořit pouze o pravděpodobnosti nějaého intervalu. Zaveďme si proto normální rozdělení.

14 JOSEF ŠTĚPÁN 1 Úmluva 2. Řeneme, že náhodná veličina Y má normální (Gaussovo) rozdělení N(0, 1), dyž P[a Y b] = 1 b e 1 2 t2 dt pro a b. 2π Povšimneme si, že celová pravděpodobnost je P[ < Y < ] = a ϕ(t) dt = 1 a P[Y = y] = 0. Definujme EY = t ϕ(t) dt a vary = (t EY )2 ϕ(t) dt. Lehce spočítáme, že EY = 0 a vary = 1 ( proto N(0, 1) ). Ani tato úmluva nemůže být považována za definici. V našem ontextu Y není náhodná veličina. Jaou souvislost má Gaussovo rozdělení s rozdělením binomicým? Pousíme se rozložit P[a Y b] do binomicých pravděpodobností při p = 1 2. Budeme potřebovat něoli poznatů z omplexní analýzy a záladního alulu. Výsledy následujících výpočtů jsou shrnuty ve větách 5 a 6; čtenář, terého nezajímá jejich odvození, proto může následující část vynechat. Položíme x n = np npq = 2 n n a nejprve nahradíme integrál b a ϕ(t) dt Riemannovou sumou: 2 e 1 1 2 x2 n = 2πn π e iux n e 1 2 u2 du, n de sčítáme přes všechna 0 n taová, že a x n b, a používáme formuli ϕ(t) = 1 cos(ux) e 1 2 u2 du = 1 e iux e 1 2 u2 du. 2π 2π n 2 Nahradíme-li integrálem π π n a použijeme-li standardní aproximaci exponenciely, je 2 ( ) n ( ) n e 1. 2 u2 = 1 u2 u ( ) 2n + o(n 1 ) = cos n = 2 n e i u n i + e u n n = 2 n ( e i u n ) n (e 2i u n + 1 ) n.

ZÁKLADY PRAVDĚPODOBNOSTI 15 Celem dostáváme P[a Y b]. = 2 n 1 π n π n 2 π n 2 ) e 2iu n (e 2iu n n + 1 du a onečně, po substituci t = 2u n, s využitím toho, že 1 π 2π π e it( j) dt je Kronecerovo δ j, vypočítáme P[a Y b]. = 2 n 1 2π de X n Bi ( n, 1 2). = = P :a x n b π ( n π e it ( e it + 1 ) n dt ) 2 n = P [ a X n np b npq ], [ a 2X ] n n b n Tuto heuristiu lze realizovat oretně pro aždé pevné p (0, 1) (viz [1], odstavec 4.5). Platí Věta 5 (Moivreova-Laplaceova věta loální). Pro p (0, 1) a stejnoměrně pro 0 n platí: ( ) n p q n = 1 ϕ(x n ) + o(n 1 2 ), xn = np. npq npq Výraz o(n 1 2 ) vyjadřuje malý zbyte, terý při vzrůstajícím n onverguje nule rychleji než n 1 2. Je tedy zanedbatelný vzhledem uvedenému členu. Jest tudíž [ S2n P 2n = 1 ] = 2 ( ) 2n 2 2n = 1 + o(n 1 2 ) n πn pro S 2n Bi ( n, 1 2) a tomuto odhadu lze opět použít Stirlingův vzorec. V ontextu příladu 8 tedy platí: Pravděpodobnost toho, že při n hodech mincí obdržíme výslede 1 (líc) přesně v polovině případů, je řádově malá jao n 1 2. Čebyševova nerovnost vša v tomto případě vypovídá, že ať je oolí 1 2 jaoliv malé, pa relativní četnost Sn n se nalézá v tomto oolí s pravděpodobností, terá je řádově velá jao 1 n 1. Tato dvě sdělení mohou přispět e správnému pochopení záona velých čísel.

16 JOSEF ŠTĚPÁN 1 Věta 6 (Moivreova-Laplaceova věta integrální). Je-li X n Bi(n, p) pro p (0, 1), pa [ lim P a X ] n np b = P [a Y b] n npq stejnoměrně pro a b, de Y N(0, 1). Moivreovy-Laplaceovy věty (1801) patří do historie matematiy. Z poloviny minulého století pochází následující vyniající zpřesnění věty integrální: Věta 7 (Nerovnost Berry-Essénova). Při oolnostech a značení integrální věty 6 platí [ P a X ] n np b P [a Y b] npq + q 2 1,6p2 npq pro libovolnou volbu < a b <. Řád chyby n 1 2 nelze zlepšit, aproximace binomicého rozdělení Gaussovým jsou tím přesnější, čím je pravděpodobnost p bližší 1 2 (funce má minimum rovno jedné pro p = 1 2 ). Pro intervaly typu p 2 +(1 p) 2 p(1 p) (, b) platí Berry-Essénova nerovnost s onstantou 0,8. Poučení 2. Je-li X n Bi(n, p) a n, aproximujeme Xn np npq N(0, 1) s přesností, terá je dána Berry-Essénovou nerovností. Tato poučeni můžeme zrátit univerzální interval oncentrace pravděpodobnosti (25). Je-li X Bi(n, p) pro n velé, pa [ ] X np P[µ 1,96σ X µ + 1,96σ] = P 1,96 npq. = 1 1,96 2π 1.96 e 1 2 t2 dt. = 0,95, de jsme použili obvylé značení µ = EX = np a σ 2 = varx = npq.

ZÁKLADY PRAVDĚPODOBNOSTI 17 2. Podmiňování a nezávislost Začneme opět matematicým modelem. Definice 7. (Ω, F, P) buď pravděpodobnostní prostor, F a G náhodné jevy v F a P(G) > 0. Číslo P(F G) = P(F G) P(G) se nazývá podmíněná pravděpodobnost náhodného jevu F při podmínce G (taé čteme pravděpodobnost F podmíněna G). Definice by měla vyjadřovat, jaý vliv může mít informace, že výslede pousu má vlastnost G (ω G), na nové posouzení pravděpodobnosti náhodného jevu F. V KPP nad Ω má podmíněná pravděpodobnost tvar F G (26) P(F G) =, G což je nepodmíněná pravděpodobnost jevu, že výslede pousu má vlastnost F G v modelu KPP nad Ω = G. Vyzoušejme, zda definice splňuje naše očeávání. Vraťme se příladům 1 a 2 z první části. Při výběru s vracením by informace o tom, že v prvém tahu byla tažena bílá oule (B 1 ), měla být zcela irelevantní pro posouzení pravděpodobnosti toho, že i v druhém tahu bude tažena bílá oule (B 2 ), tj. mělo by platit P(B 2 B 1 ) = P(B 2 ). Je tomu ta, neboť (27) P(B 2 B 1 ) = P(B 1 B 2 ) P(B 1 ) = P(B 1 ). = B 1 B 2 B 1 = b 2 b(a + b) = b a + b Při výběru bez vracení je informace B 1 podstatná. Tah bílé oule v prvém tahu připravil pro druhý tah osudí s novým barevným složením (a černých oulí, b 1 bílých. Mělo by tedy být P(B 2 B 1 ) = b 1 a+b 1. Je tomu ta: (28) P(B 2 B 1 ) = B 1 B 2 B 1 = b(b 1) b(a + b 1) = b 1 a + b 1. Vrátíme se ještě příladu 3 z předchozí části a určíme podmíněnou pravděpodobnost P[K 2 = 2 K 1 = 1 ]

18 JOSEF ŠTĚPÁN 1 jevu, že v druhé přihrádce bude 2 částic, bylo-li již zjištěno, že v prvé přihrádce je 1 částic: (29) P[K 2 = 2 K 1 = 1 ] = [K 1 = 1, K 2 = 2 ] [K 1 = 1 ] ( n )( n 1 ) = 1 2 (r 2) n ( 1+ 2) ( n ) 1 (r 1) n 1 = ( n 1 2 ) ((r 1) 1) (n 1) 2 (r 1) n 1, což je nepodmíněná pravděpodobnost toho, že v modelu s r 1 přihrádami a n 1 částicemi bude v druhé přihrádce 2 částic: Oznámí-li pozorovatel, že v prvé přihrádce zjistil 1 částic, bude podmíněná pravděpodobnost toho, že v druhé přihrádce je 2 částic počítána jao nepodmíněná pravděpodobnost ve smyslu vzorce (26). Podmíněné pravděpodobnosti umožňují modelování složitějších dvoustupňových experimentů pomocí následujícího jednoduchého vzorce pro úplnou pravděpodobnost. Buď Ω = n =0 F disjuntní rozlad prostoru Ω (tedy F i F j = pro i j) a P(F ) > 0 pro 0 n, pa (30) P(B) = n P(F )P(B F ) pro B F. =0 Přílad 10. Deseti bílými či černými oulemi je osudí naplněno ta, že bylo desetráte hozeno symetricou mincí; padl-li rub (líc), byla do osudí vložena oule bílá (černá). Z tato náhodně naplněného osudí postupně vybíráme n oulí, taženou ouli do osudí vracíme. Jaá je pravděpodobnost P(B n ) jevu, že všechny tažené oule jsou bílé? Jde sutečně o dvoustupňový náhodný experiment se složitou struturou ombinatoricého prostoru, terý by jej modeloval. Jednodušeji můžeme vstupní informace interpretovat následovně. O barevném složení osudí činíme hypotézy F 0, F 1,..., F 10, de F označuje osudí s bílými oulemi. Podle příladu 8 je P(F ) = ( ) 10 2 10. Abychom mohli použít vzorec (30), potřebujeme modelovat podmíněné pravděpodobnosti P(B n F ). Přirozeným modelem je nepodmíněná pravděpodobnost vytažení n bílých oulí s vracením z osudí, de se nachází bílých a 10

ZÁKLADY PRAVDĚPODOBNOSTI 19 oulí. Podle příladu 9 tedy je P(B n F ) = ( n. 10) Celově dostáváme 10 ( ) ( ) n 10 10 ( ) ( 10 P(B n ) = 2 10 = 2 10 1 ) n 10 10 =0 =0 (31) 10 ( ) 10 2 10 e n 10 = 2 10 ( 1 + e ) n 10 10. =0 Značný význam má následující zdánlivě primitivní inverze. Nechť P(B) > 0 a P(F ) > 0, pa (32) P(F B) = P(F )P(B F ) P(B) = P(F )P(B F ) n =0 P(F )P(B F ) terá se nazývá Bayesův vzorec a umožňuje řešit úlohy následujícího typu. Přílad 11. Uvažte situaci z příladu 10. Z osudí byly taženy výhradně bílé oule. Jaá je pravděpodobnost toho, že osudí neobsahovalo žádnou ouli černou? Máme počítat podmíněnou pravděpodobnost P(F 10 B n ). Podle (28) a (31) je P(F 10 B n ) = 2 10 1 2 10 10 =0 ( 10 ) ( 10 ) n 1 ( 1 + e n 10 ) 10 a zjišťujeme, ja jsme očeávali, že lim n P(F 10 B n ) = 1, speciálně P(F 10 B 50 ) = 0,9504 nebo P(F 10 B 100 ) = 0,9997. V něterých úlohách je třeba opatrně interpretovat vstupní údaje jao absolutní, respetive podmíněné pravděpodobnosti. Přílad 12. Tenista má prvé podání úspěšné s pravděpodobností 0,6, druhé s pravděpodobností 0,8. S jaou pravděpodobností p se hráč dopustí dvojchyby? (řešení: p = 0,08.) Podrobné řešení této úlohy je obsahem příladu 2.2 v [1], další přílady tohoto typu jsou 2.3, 2.4, 2.5. Kdybychom chtěli prohlásit dvě vlastnosti výsledu náhodného pousu F a G za nezávislé, jistě bychom ověřovali rovnosti P(F G) = P(F ) a P(G F ) = P(G), a tedy evivalentně, rovnost P(F G) = P(F )P(G) (poud P(F ) > 0 a P(G) > 0).

20 JOSEF ŠTĚPÁN 1 Definice 8. Náhodné jevy F a G jsou nezávislé, dyž platí P(F G) = P(F )P(G). Náhodné veličiny X a Y jsou nezávislé, dyž rovnost (33) P[X = x, Y = y] = P[X = x]p[y = y] platí pro (x, y) R 2, tj. dyž aždá dvojice [X = x], [Y = y] je dvojicí nezávislých náhodných jevů. Uvažme nezávislé jevy F a G a počítejme podle pravidel (3) a (4) z části 1. Dostáváme P(F c G) = P(G F G) = P(G) P(F )P(G) (34) = (1 P(F ))P(G) = P(F c )P(G). Podobně snadno nahlédneme, že jestliže (F, G) je dvojice nezávislých jevů, pa i všechny dvojice (F c, G), (F, G c ) a (F c, G c ) jsou dvojicemi nezávislých jevů, taže zjišťujeme, že nezávislost vyazuje určitou stabilitu. Odsud plyne, že dvě náhodné veličiny X Alt(p 1 ) a Y Alt(p 2 ) jsou nezávislé právě tehdy, dyž (35) P[X = 1, Y = 1] = P[X = 1]P[Y = 1]. Vyzoušejme, zda definice nezávislosti splňuje naše očeávání. Uvažme náhodné jevy B 1 a B 2 (tah bílé oule v prvém a druhém tahu) z příladů 1 a 2. Vrátí-li se tažená oule do osudí, je jeho barevné složení pro druhý tah stejné jao pro tah první. Jevy B 1 a B 2 by měly být nezávislé a je tomu ta, protože P(B 2 B 1 ) = P(B 2 ) podle (2). Nevrací-li se tažená oule, má osudí před druhým tahem jiné barevné složení určené výsledem tahu prvého. Jevy B 1 a B 2 by nezávislé intuitivně být neměly a opravdu se snadno přesvědčíme, že nejsou, protože P(B 2 B 1 ) = b 1 a + b 1 b a + b = P(B 1) podle (3). Uvažme ještě Maxwellův-Boltzmannův model z příladu 3 v první části, a to s n částicemi a r = 2 přihrádami. Náhodné veličiny K 1 a K 2, teré označují počty částic v prvé a druhé přihrádce, by neměly být nezávislé, protože K 1 + K 2 = n (lineární závislost). Je tomu ta, protože P[K 2 = 2 K 1 = 1 ] = 1, je-li 2 = n 1 ; pro jiná 2 je tato pravděpodobnost nulová. Velmi důležitou charateristiou vztahu mezi náhodnými veličinami X a Y je jejich ovariance.

ZÁKLADY PRAVDĚPODOBNOSTI 21 Definice 9. X a Y buďte náhodné veličiny. Číslo (36) cov(x, Y ) = E(X EX)(Y EY ) = (x EX)(y EY )P[X = x, Y = y] (x,y) se nazývá ovariance X a Y. = E(XY ) EXEY Poznamenejme, že prvá rovnost je definice, druhá je důsledem lemmatu pod větou 1 a třetí rovnost plyne roznásobením a výpočtem podle (16). Věta 8. Jsou-li X a Y nezávislé NV, pa (37) E(XY ) = EXEY, cov(x, Y ) = 0, a var(x + Y ) = varx + vary. Podle již zmíněného lemmatu je E(XY ) = (x,y) xy P[X = x, Y = y] (38) = (x,y) xp[x = x] yp[y = y] = x xp[x = x] y yp[y = y] = EXEY. Jeliož cov(x, Y ) = E(XY ) EXEY podle (36), plyne z nezávislosti taé, že cov(x, Y ) = 0. Snadno spočítáme, že var(x + Y ) = E ( X + Y E(X + Y ) ) 2 = varx + vary + 2 cov(x, Y ) a druhá rovnost impliuje třetí. Je-li cov(x, Y ) = 0 říáme, že X a Y jsou neorelované NV. Přílad 13. Přesvědčte se, že náhodné veličiny X a Y s alternativním rozdělením jsou nezávislé právě tehdy, dyž jsou neorelované. Sutečně, buď X Alt(p 1 ), Y Alt(p 2 ) a cov(x, Y ) = 0. Pa P[X = 1, Y = 1] = (x,y) xy P[X = x, Y = y] = E(XY ) = EXEY = p 1 p 2 = P[X = 1]P[Y = 1] a veličiny X a Y jsou nezávislé podle (35). Obecně je vša nezávislost silnější požadave než neorelovanost.

22 JOSEF ŠTĚPÁN 1 Přílad 14. Nechť X a Y jsou dvě náhodné veličiny taové, že P[X = 1, Y = 1] = P[X = 1, Y = 1] = P[X = 1, Y = 1] = P[X = 1, Y = 1] = P[X = 0, Y = 0] = 1 5. Uažte, že veličiny X a Y jsou neorelované, ale jsou závislé. Určíme rozdělení NV X a Y : P[X = 1] = P[X = 1, Y = 1] + P[X = 1, Y = 1] = 2 5, P[X = 1] = 2 5, P[X = 0] = 1 5. Symetricy P[Y = 1] = P[Y = 1] = 2 5 a P[Y = 0] = 1 5. Veličiny X a Y nejsou nezávislé, protože 1 1 = P[X = 0, Y = 0] P[X = 0]P[Y = 0] = 5 25. Veličiny X a Y jsou neorelované, protože ze symetrie jest EX = EY = 0 a cov(x, Y ) = E(XY ) je rovna 1 1 2 5 + 1( 1)2 5 + ( 1)( 1) 2 5 + ( 1)12 5 + 0 01 5 = 0. Přílad 15. K 1, K 2,..., K r buďte počty částic v přihrádách 1, 2,... r (přílad 3). Již víme, že K j Bi ( ) n, 1 r, de n je celový počet částic. Tedy jest EK j = n r a vark j = nr ( ) 1 1 r. Pouste se vypočítat, že cov(k i, K j ) = n r pro i j. 2 Obecnější výpočet naleznete v příladu 20. Poznáma 2. Důležitou mírou závislosti NV X a Y je jejich orelační oeficient ρ(x, Y ) = cov(x, Y ) varx vary. Jest ρ X,Y 1, víme, že ρ(x, Y ) = 0 pro nezávislé NV X a Y a lze doázat (viz [1], věta 7.5), že ρ(x, Y ) = 1 platí právě tehdy, dyž existují onstanty a, b, c taové, že P[aX + by = c] = 1. Užitečné je následující rozšíření pojmu nezávislosti.

ZÁKLADY PRAVDĚPODOBNOSTI 23 Definice 10. Náhodné jevy F 1, F 2,..., F n jsou nezávislé, dyž (39) P(F 1 F 2 F r ) = P(F 1 )P(F 2 ) P(F r ) platí pro aždou volbu 1 1 < 2 < < r n. Důležité je vědět, že požadavy (39) nelze reduovat. Přílad 16. Vraťme se příladu 7 a uvažme prostor, terý jsme nazvali generátor náhodných čísel v [0, 1]. Doažte, že náhodné jevy [ F 1 = 0, 1 ] [ 1, F 2 = 2 4, 3 ] [ a F 3 = 0, 1 ] [ 1 4 4 2, 3 ] 4 jsou nezávislé po dvou, ale nioliv nezávislé ve smyslu předchozí definice. Volíme-li F 1 = F 2 = [0, 1 2 ] a F 3 = [ 1 2, 1 2 ], vidíme, že (39) nelze reduovat na požadave P( n 1 F ) = P(F 1 )P(F 2 ) P(F n ). Inducí snadno rozšíříme platnost stability nezávislosti. Buďte F 1, F 2,..., F n nezávislé jevy, pa taé G 1, G 2,..., G n jsou nezávislé jevy při aždé volbě G = F nebo G = F c. Definice 11. Náhodné veličiny X 1, X 2,..., X n jsou nezávislé, dyž (40) P [X 1 = x 1,..., X r = x r ] = P[X 1 = x 1 ] P[X r = x r ] platí při aždé volbě 1 1 < 2 < < r n a (x 1, x 2,..., x r ) R r. S nezávislostí více než dvou náhodných veličin jsme se již setali. Přílad 17. Uvažte posloupnost NV X 1, X 2,... definovaných na prostoru, terý jsme nazvali generátor náhodných čísel v [0, 1] a X n (ω) je n-tý člen dvojového rozladu čísla ω [0, 1]. Rovnost (39) říá, že X n Alt( 1 2 ). Doažte, že pro aždé n N jsou náhodné veličiny X 1, X 2,..., X n nezávislé. Snadno napřílad ověříme, že platí ( [ n ]) P[X 1 = 1, X 2 = 1,..., X n = 1] = P ω =1 2, 1 n = 1 2 = 2 n = P[X 1 = 1]P[X 2 = 1] P[X n = 1]. =1 Přílad 18. Vraťme se příladu 8. Buď S n počet hodů s výsledem 1 (líc mince). Zřejmě je S n = n =1 X, de X je nula nebo jedna ta, že X = 1 právě tehdy, dyž -tý hod zaznamenal výslede 1. Nechť jsou

24 JOSEF ŠTĚPÁN 1 všechny výsledy náhodného pousu, zřejmě tvořené posloupnostmi nul a jedniče dély n, stejně pravděpodobné. Uažte, že pa platí X Alt( 1 2 ) a NV X 1, X 2,..., X n jsou nezávislé. Ověříme nezávislost pro dvě a tři NV, dále lze postupovat analogicy. Pro < l < j platí P[X = 1] = 2n 1 2 n = 1 2, P[X = 1, X l = 1] = 2n 2 2 n = 1 4 = P[X = 1]P[X l = 1], P[X = 1, X l = 1, X j = 1] = 2n 3 2 n = 1 8 = P[X = 1]P[X l = 1]P[X j = 1]. V první části jsme uázali, že S n = n =1 X je NV s binomicým rozdělením Bi ( n, 1 2). Toto je obecnější záonitost. Buďte X Bi(n, p) a Y Bi(m, p) dvě nezávislé NV. Pa P[X + Y = ] = = n P[X = l, Y = l] l=0 n P[X = l]p[y = l] l=0 n ( )( ) n m = p l (1 p) n l p l (1 p) m ( l) l l l=0 n ( )( ) n m = p (1 p) n+m l l l=0 ( ) n + m = p (1 p) n+m platí pro 0 n + m. Použili jsme onvenci ( n ) = 0 pro > n. Doázali jsme, že platí impliace (41) X Bi(n, p), Y Bi(m, p) nezávislé X + Y Bi(n + m, p) a doonce i tvrzení

ZÁKLADY PRAVDĚPODOBNOSTI 25 Věta 9. X 1, X 2,..., X n buďte nezávislé NV taové, že aždá z nich má alternativní rozdělení Alt(p). Jejich součet S n = X má pa binomicé rozdělení Bi(n, p). Důaz se provede inducí. Impliace (41) zajišťuje platnost tvrzení pro n = 2, neboť Alt(p) = Bi(1, p) a ta víme, že X 1 + X 2 Bi(2, p). Nechť tvrzení platí pro n 1, doážeme platnost pro n inducí. Pro n napíšeme X 1 + X 2 + + X n = (X 1 + + X n 1 ) + X n, de X 1 + + X n 1 Bi(n 1, p) podle indučního předpoladu a X n Bi(1, p); snadno ověříme, že tyto dvě náhodné veličiny jsou nezávislé a impliace (41) nás přivádí závěru, že X 1 + X 2 + + X n Bi(n, p). Poučení 3. Náhodná veličina X s alternativním rozdělením Alt(p) je nepochybně vhodným modelem dichotomicého pousu s výsledem úspěch (1), jehož pravděpodobnost je p, a neúspěch (0) s pravděpodobností q = 1 p. Uázali jsme, že počet úspěchů S n při n nezávislých opaováních taového pousu má binomicé rozdělení Bi(n, p). Podle Čebyševovy nerovnosti I (věta 3) je pro ε > 0 [ ] S n (42) P n p < ε 1 pq ε 2 n 1 1 4ε 2 n, protože E Sn n = np Sn n = p a var n = 1 n npq = pq 2 n, ja víme z minula. Správná, třeba neznámá, hodnota pravděpodobnosti úspěchu p je v ε- oolí relativní četnosti úspěchů Sn n s pravděpodobností, terá je nejméně 1 1 4ε 2 n. Poučení 1 a 2 tedy říají: při velém počtu n nezávislých opaování dichotomicého pousu aproximujeme rozdělení počtu úspěchů S n rozdělením Poissonovým P o(np), je-li pravděpodobnost p malá. V opačném případě aproximujeme rozdělení normovaného počtu úspěchů Sn np npq rozdělením normálním N(0, 1) s přesností, terou udává Berry-Essénova nerovnost. Ve větě 8 jsme uázali, že pro nezávislé NV X a Y je var(x + Y ) = varx + vary. Inducí, podobně jao ve větě 9, dostáváme Věta 10. X 1, X 2,..., X n buďte nezávislé NV. Pa ( n ) n (43) var X = varx. =1 =1

26 JOSEF ŠTĚPÁN 1 Poznamenejme, že jsme znovu doázali rovnosti (24). Jestliže platí X Bi(n, p), můžeme předpoládat, že X = n =1 X, de X jsou nezávislé NV. Dále platí n n EX = EX = np, varx = varx = npq. =1 Můžeme taé rozšířit působnost nerovnosti (42) následujícím způsobem. Věta 11 (Čebyševova nerovnost II). X 1, X 2,..., X n buďte nezávislé NV se stejným rozdělením pravděpodobností. Označíme EX = µ, varx = σ 2. Pa pro aždé ε > 0 platí nerovnost [ ] 1 n (44) P X µ n ε σ2 ε 2 n. =1 Poznamenejme, že předpolad o stejném rozdělení veličin X, tj. předpolad P[X 1 = x] = P[X 2 = x] = = P[X n = x] pro x R, triviálně impliuje, že EX 1 = EX 2 = = EX n = µ, varx 1 = varx 2 = = varx n = σ 2. Důaz věty 11 je snadný. Podle vět 1 a 2 a (43) spočteme ve větě 9 E X n = µ a var X n = nσ2 n = σ2 2 n a apliujeme prvou Čebyševovu nerovnost, abychom obdrželi (44). Poznamenejme, že máme-li disposici celou posloupnost X 1, X 2,... nezávislých NV se stejným rozdělením pravděpodobností a označíme-li EX = µ, pa [ ] (45) lim P 1 n X µ n n < ε = 1, ε > 0. =1 =1 Jaoliv chaoticé je chování náhodné posloupnosti X 1, X 2,..., její postupné aritmeticé průměry onvergují e společné střední hodnotě µ ve smyslu (45). Přílad 17 taovou posloupnost onstruuje. Je-li ω = X (ω) =1 2 dvojový rozvoj ω [0, 1], pa X Alt( 1 2 ) a X 1, X 2,... je posloupnost nezávislých NV. Zjistili jsme, že aritmeticé průměry 1 n n =1 X onvergují 1 2 ve smyslu (45). Do nerovnosti (44) vstupuje vetor náhodných veličin (X 1, X 2,..., X n ), teré jsou nezávislé a mají stejná rozdělení pravděpodobností. Obecněji definujeme pojem náhodného vetoru.

ZÁKLADY PRAVDĚPODOBNOSTI 27 Definice 12. (Ω, F, P) buď pravděpodobnostní prostor, X 1, X 2,..., X n zde definované NV. Zobrazení X = (X 1, X 2,..., X n ) definované na Ω s hodnotami v R n se nazývá n-rozměrný náhodný vetor. Funce p(x 1, x 2,..., x n ) = P[X 1 = x 1, X 2 = x 2,..., X n = x n ], pro argument (x 1, x 2,..., x n ) R n se nazývá rozdělení pravděpodobností náhodného vetoru X. Je zřejmé, že funce p(x 1, x 2,..., x n ) může být rozdělením něterého náhodného vetoru pouze tehdy, dyž (46) p(x 1, x 2,..., x n ) = 0 až na onečně mnoho (x 1, x 2,... x n ), p(x 1, x 2,..., x n ) [0, 1] (x 1,...,x n) R n p(x 1, x 2,..., x n ) = 1. Z pravděpodobnostního hledisa náhodný vetor není pouze souborem náhodných veličin. Toto uazuje přílad 14 a taé přílad následující. Přílad 19. X = (X 1, X 2 ) buď dvourozměrný náhodný vetor taový, že P[X = (1, 1)] = P[X = (0, 1)] = P[X = (1, 0)] = P[X = (0, 0)] = 1 4. Y = (Y 1, Y 2 ) buď dvourozměrný náhodný vetor taový, že P[Y = (1, 1)] = P[Y = (0, 0)] = 1 2. Přesvědčte se, že vetory X a Y nemají stejná rozdělení pravděpodobností, i dyž jejich souřadnice stejně rozdělené jsou. Souřadnice X 1 a X 2 jsou nezávislé, souřadnice Y 1 a Y 2 nezávislé nejsou. Poučení jest, že rozdělení náhodného vetoru není jednoznačně určeno tím, že zadáme rozdělení jednotlivých souřadnic. Poučení ale taé je, že rozdělení libovolného náhodného vetoru (X 1, X 2,..., X n ), řeněme p(x 1, x 2,..., x n ), je jednoznačně určeno tím, že zadáme rozdělení aždé z NV X 1, X 2,..., X n a přidáme požadave, aby tyto NV byly nezávislé. Je tomu ta proto, že v tomto případě je p(x 1, x 2,..., x n ) = P[X 1 = x 1, X 2 = x 2,..., X n = x n ] = P[X 1 = x 1 ]P[X 2 = x 2 ] P[X n = x n ].

28 JOSEF ŠTĚPÁN 1 Netriviální přílad náhodného vetoru je vetor s multinomicým rozdělením. Označme S nr = ( 1, 2,..., r ), 0 j n, r j = n, j=1 j Z. Definice 13. Náhodný vetor X = (X 1, X 2,..., X r ) s hodnotami v množině S nr má multinomicé rozdělení MN(n, r, p 1,..., p r ), de 0 p j 1 a r j=1 p j = 1, jestliže (47) P[X 1 = 1, X 2 = 2,..., X r = r ] = ( )( ) ( ) n n 1 n 1 n 1 = p 1 1 p2 2 pr r 1 2 r = n! 1! 2! r! p1 1 p2 2 pr r. Vrátíme-li se Maxwellovu-Boltzmannovu modelu a uvážíme náhodné veličiny K 1, K 2,..., K r, teré udávají počty částic 1, 2,... r v přihrádách 1, 2,..., r, vypočítáme, že pro ( 1, 2,..., r ) S nr je P[K 1 = 1, K 2 = 2,..., K r = r ] = ( n 1 )( n 1 2 )( n 1 2 3 ) 1 r n. Platí tedy (K 1, K 1,..., K r ) MN(n, r, 1 r,..., 1 r ) a zoumaný náhodný vetor má multinomicé rozdělení. Poznamenejme, že součet pravděpodobností (47) je jedna (ta ja má být), protože podle multinomicé věty platí (48) ( 1,..., r) S nr ( )( ) n n 1 1 2 ( r r ) p 1 1 p2 2 pr r = (p 1 +p 2 + +p r ) n pro libovolnou volbu n N, r N a p j R, j = +,,..., r. Přílad 20. Uvažte vetor (X 1, X 2,..., X r ) MN(n, r, p 1,..., p r ) a vypočtěte ovarianci cov(x i, X j ).

ZÁKLADY PRAVDĚPODOBNOSTI 29 Pro 0 1 n označme = ( 2,..., r) S n 1,r 1 a počítejme P[X 1 = 1 ] = P[X1 = 1, X 2 = 2,..., X r = r ] = ( )( ) ( r 1 n n 1 n j=1 ) j p 1 1 1 2 p2 2 pr r r ( ) n = p 1 1 (1 p 1) n 1 1 podle (48), de volíme n = n 1, r = r 1 a p 2, p 3,..., p r. Jest tedy X j Bi(n, p j ), EX j = np j a cov(x j, X j ) = varx j = np j (1 p j ). Obdobně, pro 0 1 + 2 n, vypočítáme: ( )( ) n n 1 P[X 1 = 1, X 2 = 2 ] = p 1 1 p2 2 (1 p 1 p 2 ) n 1 2 1 2 a jsme schopni určit cov(x 1, X 2 ). Nejprve vypočteme E(X 1 X 2 ) podle postupu uvedeného v definici 6. E(X 1 X 2 ) = 1 2 P[X 1 = x 1, X 2 = x 2 ] = 0 1+ 2 n 2 1+ 2 n = n(n 1)p 1 p 2 n!p 1 1 p2 2 (1 p 1 p 2 ) n 1 2 ( 1 1)!( 2 1)!(n 1 2 )! 0 l 1+l 2 n 2 (n 2)!p l1 1 pl2 2 (1 p 1 p 2 ) n 2 l1 l2 l 1!l 2!(n 2 l 1 l 2 )! = n(n 1)p 1 p 2 (p 1 + p 2 + 1 p 1 p 2 ) n 2 = n(n 1)p 1 p 2, opět podle (48), protože Odsud (n 2)! l 1!l 2!(n 2 l 1 l 2 )! = ( )( n 2 n 2 l1 cov(x 1, X 2 ) = E(X 1 X 2 ) EX 1 EX 2 = n(n 1)p 1 p 2 np 1 np 2 = np 1 p 2. Obecněji pro i j dostáváme cov(x i, X j ) = np i p j. Poud se vám nepodařilo vyřešit přílad 15, dostáváme řešení nyní. Pro složy K i a K j náhodného vetoru s multinomicým rozdělením platí, že pro i j je cov(k i, K j ) = n r 2. l 1 l 2 ).

30 JOSEF ŠTĚPÁN 1 Poznáma literatuře Zálady počtu pravděpodobnosti lze studovat z nepřeberného množství nih. V příspěvu jsme používali odaz na sripta Zvára, Štěpán (2003) určená pro studenty učitelsých oborů na MFF UK. Mezi další možné zdroje poučení lze zařadit sripta Dupač, Hušová (1999) určená pro studenty všech matematicých oborů na MFF UK, starší sripta Lieš, Mache (1981), ale i první části lasicých učebnic Fellera (1967), Gněděna (1969) či Rényiho (1972). Mnoho zajímavých příladů vhodných i pro studenty středních šol obsahuje niha Anděl (2000). Přehled nejstarší historie pravděpodobnosti inspirované hazardními hrami lze najít v Mačá (1997). Literatura [1] Zvára, K., Štěpán, J.: Pravděpodobnost a matematicá statistia, MATFYZ- PRESS, Praha 2003. [2] Dupač, V., Hušová, M.: Pravděpodobnost a matematicá statistia, Karolinum, Praha 1999. [3] Lieš, J., Mache, J.: Počet pravděpodobnosti, SNTL, Praha 1981. [4] Feller, W.: Introduction to Probability Theory and Its Applications I, Wiley, Chichester 1967. (Existuje dostupnější rusý přelad) [5] Gněděno, B.V.: Kurs těorii věrojatnostěj, Mir, Mosva 1969. (Anglicy vyšlo 1976) [6] Rényi, A.: Teorie pravděpodobnosti, Academia, Praha 1972 [7] Anděl, J.: Matematia náhody, MATFYZPRESS, Praha 2000 [8] Mačá, K.: Počáty počtu pravděpodobnosti, Prometheus, Praha 1997