10. N á h o d n ý v e k t o r 10.1. Definice: Náhodný vektor. Uspořádanou n tici (X 1, X 2,..., X n ) náhodných veličin X i, 1 i n, nazýváme náhodným vektorem. Poznámka: Pro jednoduchost budeme zavádět pojmy pro vektor o dvou souřadnicích, který budeme značit (X, Y ). Zobecnění pro více proměnných snadno provedeme. Příklad: Házíme dvěma mincemi a označíme 0, jestliže padne rub a 1 jestliže padne líc. Náhodná veličina X je výsledek z první mince a náhodná veličina Y je výsledek hodu na druhé minci. Náhodný pokus je popsán stavem náhodného vektoru (X, Y ). 10.2.Definice: Sdružená distribuční funkce. Je-li (X, Y ) náhodný vektor, pak funkci F = F (x, y), která je definovaná předpisem ( ) F (x, y) = P (X x, Y y), (x, y) R 2, nazýváme sdruženou distribuční funkcí náhodného vektoru (X, Y ). y (X, Y ) Obr. 10.1. (x, y) x Hodnota sdružené distribuční funkce F (x, y) je rovna pravděpodobnosti s jakou se hodnota náhodného vektoru (X, Y ) vyskytne ve vyšrafované části roviny z obrázku Obr.10.1. 10.3. Věta: Vlastnosti sdružené distribuční funkce. Pro sdruženou distribuční funkci F (x, y) náhodného vektoru platí: a) Pro všechny hodnoty (x, y) R 2 je 0 F (x, y) 1. b) Funkce F (x, y) je neklesající jako funkce proměnné x a proměnné y. c) Je d) Je e) Je lim F (x, y) = lim x F (x, y) = 0. y lim F (x, y) = 1. (x,y) (, ) lim F (x, y) = P (X x), x R a lim F (x, y) = P (Y y), y R. y x Důkaz: a) Vlastnost vyplývá z definice sdružené distribuční funkce jako pravděpodobnosti. b) Tato vlastnost plyne z vlastnosti distribuční funkce náhodné veličiny, jestliže považujeme jednu proměnnou za pevnou. c) Pokud uvažujeme jev (X x Y y) a alespoň jedna z proměnných x či y se blíží k, pak popsaný náhodný jev přechází v jev nemožný V. Je ale P (V ) = 0. d) Jestliže v náhodném jevu (X x Y y) se obě proměnné bliží k, pak tento jev přejde v jev jistý U a je P (U) = 1. 55
e) Znázorníme si obě situace pomocí obrázku. Uvědomíme si jak se změní obrázek Obr. 10.1. pokud y (obr.10.2a) nebo x (Obr. 10.2b.). Náhodný jev (X x Y y) pro y přejde v náhodný jev (X x) a pro x přejde v náhodný jev (Y y). (X x) (Y y) y X = x (X, Y ) x y Y = y (X, Y ) x Obr. 10.2a. Obr. 10.2b. Poznámka: Marginální rozdělení. Je-li (X, Y ) náhodný vektor, pak jsou jeho souřadnice X a Y náhodné veličiny. Jejich rozdělení je popsáno příslušnými distribučními funkcemi. Ty se dají snadno určit ze sdružené distribuční funkce pomocí vztahů z tvrzení e) věty 10.3. 10.4. Definice: Je-li (X, Y ) náhodný vektor, pak rozdělení náhodných veličin X a Y se nazývá marginální rozdělení. 10.5. Věta: Je-li F (x, y) sdružená distribuční funkce náhodného vektoru (X, Y ), pak jsou marginální distribuční funkce F 1 (x), resp. F 2 (y) náhodné veličiny X, resp Y určeny vztahy a F 1 (x) = P (X x) = lim F (x, y), x R y F 2 (y) = P (Y y) = lim F (x, y), y R. x Důkaz: Tvrzení vyplývá z definice distribuční funkce náhodné veličiny a ze vztahů e) věty 10.3. Příklad: 1. Náhodný vektor (X, Y ) má rozdělení určené sdruženou distribuční funkcí F (x, y), kde 0, x 0 nebo y 0, F (x, y) = 1 e 2x e 3y + e 2x 3y, x 0 a y 0. Určete marginální distribuční funkce náhodných veličin X a Y. Řešení: Marginální distribuční funkce F 1 (x) a F 2 (y) náhodných veličin X a Y určíme z jejich vyjádření odvozených ve větě 10.5. Je a F 1 (x) = P (X x) = lim F (x, y), x R y F 2 (y) = P (Y y) = lim F (x, y), y R. x Protože je lim x e 2x = 0 a lim y e 3y = 0 dostaneme: F 1 (x) = 0, x 0, 1 e 2x, x 0; a F 2 (y) = 0, y 0, 1 e 3y, y 0; 56
Typy rozdělení náhodného vektoru I. Diskrétní rozdělení. Poznámka: V souladu s pojmem diskrétního rozdělení u náhodné veličiny zavádíme stejným způsobem diskrétní rozdělení náhodného vektoru. 10.6. Definice: Diskrétní rozdělení. Říkáme, že náhodný vektor (X, Y ) má diskrétní rozdělení, jestliže nabývá konečně nebo spočetně mnoha diskrétních hodnot. 10.7. Definice: Sdružená pravděpodobnostní funkce. Jestliže má náhodný vektor (X, Y ) diskrétní rozdělení, pak funkci p = p(x, y), která je definována předpisem ( ) p(x, y) = P (X = x Y = y), (x, y) R 2 nazýváme sdruženou pravděpodobnostní funkcí náhodného vektoru (X, Y ). 10.8. Věta: Vlastnosti sdružené pravděpodobnostní funkce. Funkce p = p(x, y) je sdruženou pravděpodobnostní funkcí náhodného vektoru (X, Y ) právě když platí: a) Je 0 p(x, y) 1 pro všechny hodnoty (x, y) R 2. b) Je p(x, y) = 1. (x,y) R 2 c) Existuje pouze konečná nebo spočetná množina (posloupnost) hodnot (x i, y k ), pro které je P (x i, y k ) > 0. Poznámka: Má-li náhodný vektor diskrétní rozdělení, pak jeho rozdělení snadno popíšeme dvourozměrnou tabulkou, kde do řádků vyneseme hodnoty x i, kterých nabývá souřadnice X a do sloupců hodnoty y k druhé souřadnice. V tabulce na odpovídajícím místě uvedeme hodnotu pravděpodobnosti p(x i, y k ). Jeho marginální rozdělení jsou pak také diskrétní. Pravděpodobnostní funkce náhodných veličin X a Y se nazývají marginální a pro jejich vyjádření platí. 10.9. Věta: Marginální pravděpodobnostní funkce. Je-li p(x, y) sdružená pravděpodobnostní funkce náhodného vektoru (X, Y ), pak jsou marginální pravděpodobnostní funkce p 1 (x), resp. p 2 (y) náhodné veličiny X, resp Y dány vztahy: p 1 (x) = p(x, y), x R a p 2 (y) = p(x, y), y R. x R Důkaz: Tvrzení bezprostředně vyplývá z definice pravděpodobnostní funkce náhodné veličiny. Je p 1 (x) = P (X = x) = P (X = x Y = y) = p(x, y), neboť se jednotlivé náhodné jevy pro různé hodnoty souřadnice Y vylučují, jsou to tudíž jevy disjunktní. Obdobně získáme vyjádření marginální pravděpodobnostní funkce p 2, která odpovídá náhodné veličině Y. Poznámka: Všimneme, že pokud zadáme sdruženou pravděpodobnostní funkci tabulkou, pak tabulky marginálních pravděpodobnostních funkcí dostaneme jako řádek, který získáme sečtením tabulky po sloupcích a druhou jako sloupec, jestliže sečteme tabulku po řádcích. Tabulka pro sdruženou pravděpodobnostní funkci a marginální pravděpodobnostní funkce. 57
p(x, y) x 1 x 2... x i... p 2 (y) y 1 p(x 1, y 1 ) p(x 2, y 1 )... p(x i, y 1 )... p 2 (y 1 ) y 2 p(x 1, y 2 ) p(x 2, y 2 )... p(x i, y 2 )... p 2 (y 2 )..................... y k p(x 1, y k ) p(x 2, y k )... p(x i, y k )... p 2 (y k )..................... p 1 (x) p 1 (x 1 ) p 1 (x 2 )... p 1 (x i )... 1 Tab. 10.1. Poslední políčko je kontrolní, součet posledního řadku a posledního sloupce musí být jedna, stejně jako součet všech hodnot v původní tabulce. 10. 10. Definice: Nezávislost náhodných veličin. Jestliže má náhodný vektor (X, Y ) diskrétní rozdělení, pak říkáme, že jsou jeho souřadnice X a Y nezávislé náhodné veličiny, jestliže jsou náhodné jevy (X = x) a (Y = y) nezávislé pro všechny hodnoty (x, y) R 2. V opačném případě mluvíme o závislých náhodných veličinách. 10.11. Věta: Podmínka nezávislosti. Je-li p(x, y) sdružená pravděpodobnostní funkce náhodného vektoru (X, Y ), pak jsou náhodné veličiny X a Y nezávislé právě když pro sdruženou a marginální pravděpodobnostní funkce platí: ( ) p(x, y) = p 1 (x) p 2 (y), (x, y) R 2. Důkaz: Náhodné jevy (X = x) a (Y = y) jsou nezávislé, právě když platí P (X = x Y = y) = P (X = x) P (Y = y) p(x, y) = p 1 (x) p 2 (y), (x, y) R 2. Poznámka: Pro tabulku Tab. 10.1 to znamené, že políčko (x i, y k ) dostaneme jako součin políčka x i a políčka y k v marginálních pravděpodobnostních funkcích. Dá se tedy sdružená pravděpodobnostní funkce zpětně vytvořit ze svých marginálních pravděpodobnostních funkcí. Příklad: 1. Náhodný vektor (X, Y ) má diskrétní rozdělení určené sdruženou pravděpodobnostní funkcí p, která je zadána tabulkou Tab. 10.2. Určete marginální pravděpodobnostní funkce a rozhodněte, zda jsou náhodné veličiny X a Y závislé či nezávislé. y\x 0 1 3-1 0,1 0,2 0,1 1 0,3 0,2 0,1 y\x 0 1 3 p 2 (y) -1 0,1 0,2 0,1 0,4 1 0,3 0,2 0,1 0,6 p 1 (x) 0,4 0,4 0,2 Tab. 10.2. Tab. 10.3. Řešení: Marginální pravděpodobnostní funkce určíme pomocí vzorců z věty 10.9. Je pak X : p 1 (x) = p(x, y) a Y : p 2 (y) = p(x, y). x R Postupujeme podle poznámky k větě 10.9 a znázorníme výsledek do tabulky 10.3. Přidáme k tabulce řádek a sloupec a hodnoty vytvoříme tak, že sečteme tabulku jednak po řádcích a jednak po sloupcích. V přidaném sloupci jsou hodnoty marginální pravděpodobnostní funkce 58
p 2 (y) náhodné veličiny Y a v přidaném řádku pak hodnoty marginální pravděpodobnostní funkce p 1 (x) náhodné veličiny X. Závislost či nezávislost otestujeme z podmínky p(x, y) = p 1 (x)p 2 (y), kterou jsme pro nezávislost náhodných veličin odvodili ve větě 10. 11. Je například p(0, 1) = 0, 1 a p 1 (0)p 2 ( 1) = 0, 4.0, 4 = 0, 16. Protože jsou výsledky různé nemusíme rovnost pro další políčka z tabulky ověřovat. Náhodné veličiny X a Y jsou závislé. Příklad: 2. Náhodný vektor (X, Y ) má diskrétní rozdělení určené sdruženou pravděpodobnostní funkcí p, která je zadána tabulkou Tab. 10.4. Určete marginální pravděpodobnostní funkce a rozhodněte, zda jsou náhodné veličiny X a Y závislé či nezávislé. y\x 1 2 4 0 0,06 0,3 0,24 3 0,04 0,2 0,16 y\x 1 2 4 p 2 (y) 0 0,06 0,3 0,24 0,6 3 0,04 0,2 0,16 0,4 p 1 (x) 0,1 0,5 0,4 Tab. 10.4. Tab. 10.5. Řešení: Marginální pravděpodobnostní funkce určíme pomocí vzorců z věty 10.9. Je pak X : p 1 (x) = p(x, y) a Y : p 2 (y) = p(x, y). x R Postupujeme podle poznámky k větě 10.9 a znázorníme výsledek do tabulky 10.5. Přidáme k tabulce řádek a sloupec a hodnoty vytvoříme tak, že sečteme tabulku jednak po řádcích a jednak po sloupcích. V přidaném sloupci jsou hodnoty marginální pravděpodobnostní funkce p 2 (y) náhodné veličiny Y a v přidaném řádku pak hodnoty marginální pravděpodobnostní funkce p 1 (x) náhodné veličiny X. Závislost či nezávislost otestujeme z podmínky p(x, y) = p 1 (x)p 2 (y), kterou jsme pro nezávislost náhodných veličin odvodili ve větě 10. 11. Ověříme postupně zda platí rovnost pro jednotlivá políčka. Pro hodnoty v prvním řádku dostaneme: v druhém řádku dostaneme 0, 06 = 0, 6.0, 1; 0, 3 = 0, 6.0, 5; 0, 24 = 0, 6.0, 4; 0, 04 = 0, 4.0, 1; 0, 2 = 0, 4.0, 5; 0, 16 = 0, 4.0, 4. Protože podmínka pro nezávislost je splněna pro všechny dvojice hodnot náhodného vektoru (X, Y ) z tabulky, jsou náhodné veličiny X a Y nezávislé. II. Spojité rozdělení. Poznámka: V souladu s pojmem spojitého rozdělení u náhodné veličiny zavádíme stejným způsobem spojité rozdělení náhodného vektoru. 10. 12. Definice: Spojité rozdělení. Říkáme že náhodný vektor (X, Y ) má spojité rozdělení jestliže pro jeho sdruženou distribuční funkci F (x, y) platí: F (x, y) = x y f(u, v)dudv, (x, y) R 2. Funkci f(x, y) nazýváme sdruženou hustotou náhodného vektoru (X, Y ). 10.13. Věta: Vlastnosti sdružené hustoty. Funkce f(x, y) je sdruženou hustotu náhodného vektoru (X, Y ) právě když platí: 59
1. Je f(x, y) 0 pro (x, y) R 2. 2. Je f(x, y)dxdy = 1. Pro sdruženou hustotu f(x, y) dále platí: 3. f(x, y) = 2 F x y (x, y) pro skoro všechna (x, y) R2. 4. Pro A R 2 je P ((X, Y ) A) = f(x, y) dxdy. A 10. 14. Věta: Marginální rozdělení. Jestliže má náhodný vektor (X, Y ) spojité rozdělení určené sdruženou hustotu f(x, y), pak pro jeho marginální distribuční funkce platí: X; F 1 (x) = x ( f(u, y) du)dy, x R; Y ; F 2 (y) = y ( f(x, v) dv)dx, y R. Marginální náhodné veličiny X a Y mají spojité rozdělení a pro jejich hustoty platí: X : f 1 (x) = Y : f 2 (y) = f(x, y) dy, x R; f(x, y) dx, y R. Důkaz: Tvrzení vyplývá z definice pojmů a z věty 10.13. Je x y x F 1 (x) = lim F (x, y) = lim f(u, v)dudv = ( f(u, y) dy)du, x R. y y Ze vztahu f 1 (x) = F 1 (x) a ze vzorce pro derivaci funkce horní meze plyne vzorec pro funkci f 1 (x). 10.15. Definice: Marginální hustoty. Hustoty f 1 (x) a f 2 (y) z věty 10. 14 se nazývají marginální. 10.16. Definice: Nezávislost náhodných veličin. Říkáme, že jsou náhodné veličiny X a Y nezávislé, jestliže jsou náhodné jevy (X x) a (Y y) nezávislé pro všechny hodnoty x a y z R. V opačném případě nazýváme náhodné veličiny závislými. 10. 17. Věta: Podmínka pro nezávislost. Náhodné veličiny X a Y jsou nezávislé právě když platí: F (x, y) = F 1 (x) F 2 (y) pro (x, y) R 2, kde F (x, y) je sdružená distribuční funkce náhodného vektoru (X, Y ) a F 1 (x), resp. F 2 (y), jsou marginální distribuční funkce náhodné veličiny X, resp. Y. 60
Důkaz: Tvrzení vyplývá z definice nezávislosti náhodných jevů a z významů uvedených pojmů. Platí totiž pro nezávislost jevů (X x) a (Y ) následující ekvivalence: P ((X x) (Y y)) = P (X x) P (Y y) F (x, y) = F 1 (x) F 2 (y), (x, y) R 2. Poznámka: Pro náhodný vektor (X, Y ), který má spojité rozdělení plyne z podmínky z věty 10. 17 tato podmínka nezávislosti pro hustoty: f(x, y) = 2 F x y = ( x y (F 1(x) F 2 (y))) = F 1(x) F 2(y) = f 1 (x) f 2 (y), (x, y) R 2. Odtud tedy plyne tvrzení. 10. 18. Věta: Spojitě rozdělené náhodné veličiny X a Y jsou nezávislé právě když pro jejich marginální a sdruženou hustotu platí: f(x, y) = f 1 (x)f 2 (y), (x, y) R 2. 10. 19. Věta: Pro náhodné veličiny X a Y platí: 1. E(X + Y ) = E(X) + E(Y ). 2. Jsou-li náhodné veličiny X a Y nezávislé, pak platí: E(XY ) = E(X)E(Y ). Důkaz: Odvození provedeme například pro spojité rozdělení. Označíme-li po řadě f(x, y), f 1 (x) a f 2 (y) sdruženou hustotu náhodného vektoru (X, Y ), marginální hustotu náhodné veličiny X a marginální hustotu náhodné veličiny Y, pak je E(X + Y ) = (x + y)f(x, y) dxdy = xf(x, y) dxdy + yf(x, y) dxdy = R 2 R 2 R 2 = = ( x ) f(x, y) dy dx + x f 1 (x)dx + ( ) y f(x, y) dx dy = yf 2 (y) dy = E(X) + E(Y ). Jsou-li náhodné veličiny X a Y nezávislé je podle věty 10. 18 f(x, y) = f 1 (x)f 2 (y) a tedy E(XY ) = xyf(x, y) dxdy = (xf 1 (x))(yf 2 (y)) dxdy = R 2 R 2 = x f 1 (x)dx yf 2 (y) dy = E(X)E(Y ). Poznámka: Pro náhodné veličiny X a Y sledujeme často jejich závislost a podobně jako u vlastností jedné náhodné veličiny se ji snažíme popsat číselnou hodnotou. Činíme tak pomocí koeficientů kovariance a korelace. 10.20. Definice: Koeficient kovariance. Je-li (X, Y ) náhodný vektor, pak koeficientem kovariance náhodných veličin X a Y nazýváme číslo C(X, Y ) = E((X E(X))(Y E(Y ))). 61
10.21. Věta: Vlastnosti kovariance. Pro koeficient kovariance náhodných veličin X a Y platí: a) C(X, X) = D(X). b) C(X, Y ) = C(Y, X). c) C(X, Y ) = E(XY ) E(X)E(Y ). d) Jsou-li náhodné veličiny X a Y nezávislé, pak C(X, Y ) = 0. e) Je-li C(X, Y ) 0, pak jsou náhodné veličiny X a Y jsou závislé. f) C(X, ax + b) = ad(x). Důkaz: Tvrzení a) b) jsou zřejmá. c) Je C(X, Y ) = E(XY XE(Y ) Y E(X) + E(X)E(Y )) = = E(XY ) E(X)E(Y ) E(X)E(Y ) + E(X)E(Y ) = E(XY ) E(X)E(Y ). d) Z věty 10.9 plyne, že pro nezávislé náhodné veličiny X a Y je E(XY ) = E(X)E(Y ), tedy podle c) je C(X, Y ) = 0. e) Tvrzení je negací tvrzení d). Pokud by byly náhodné veličiny X a Y nezávislé, pak musí být C(X, Y ) = 0. f) Pro Y = ax + b z vlastností střední hodnoty vyplývá, že C(X, Y ) = E(X(aX + b)) E(X)E(aX + b) = ae(x 2 ) + be(x) a(e(x)) 2 be(x) = a(e(x 2 ) (E(X)) 2 ) = ad(x). Poznámka: K popisu závislosti náhodných veličin používáme normovaný koeficient, který je odvozen z koeficientu kovariance. 10.22. Definice: Koeficient korelace. Pro náhodné veličiny X a Y nazýváme koeficientem korelace číslo ρ(x, Y ) = C(X, Y ). D(X)D(Y ) 10.23. Věta: Vlastnosti koeficientu korelace. Pro koeficient korelace náhodných veličin X a Y platí: a) ρ(x, X) = 1; b) ρ(x, Y ) = ρ(y, X); c) Je-li ρ(x, Y ) 0, pak jsou náhodné veličiny X a Y závislé. d) Pro nezávislé náhodné veličiny X a Y je ρ(x, Y ) = 0. e) ρ(x, ax + b) = sgn a = a a ; f) ρ(x, Y ) 1; g) ρ(x, Y ) = ±1 Y = ax + b. Důkaz: Tvzení a) - e) plynou snadno z vlastností koeficientu kovariance z věty 10.21. Důkazy tvrzení e) a f) jsou pracnejší, nebudeme je zde uvádět. Poznámka: Z vlastností f) a g) plyne, že koeficient korelace je vlastně mírou lineární závislosti náhodných veličin. 62