5. NÁHODNÝ VEKTOR 5.1. Rozdělení náhodného vektoru Náhodný vektor X = (X 1, X 2,..., X n ) T n-rozměrný vektor, složky X i, i = 1,..., n náhodné veličiny. Vícerozměrná (n-rozměrná) náhodná veličina n = 2 Sdružená distribuční funkce (joint d.f.) n. vektoru (X, Y ) F (x, y) = P (X x, Y y) Vlastnosti: (a) 0 F (x, y) 1 (x, y) R 2 (b) lim x,y F (x, y) = 1 (c) lim x F (x, y) = 0, lim y F (x, y) = 0 (d) F je zprava spojitá v každé proměnné (e) F (x 1, y 1 ) F (x 1, y 2 ) F (x 2, y 1 ) + F (x 2, y 2 ) = P (x 1 < X x 2, y 1 < Y y 2 ) 0, x 1 x 2, y 1 y 2 1
Diskrétní sdružená distribuční funkce F (x, y) = i,j:x i x; y j y p ij, p ij = P (X = x i, Y = y j )-sdružené pravděpodobnosti F (x, y) absolutně spojitá, if f(x, y) 0 - sdružená hustota pravděpodobnosti: Platí: F (x, y) = x y f(u, v)dudv (i) f(x, y)dxdy = 1 (ii) δ2 F (x,y) δxδy = f(x, y) if δ2 F (x,y) δxδy P (x 1 < X x 2, y 1 < Y y 2 ) = x 2 x 1 y 2 y 1 f(x, y)dxdy Marginální distribuční funkce F X (x) = P (X x) = lim y F (x, y) F Y (y) = P (Y y) = lim x F (x, y) Marginální pravděpodobnosti (F diskrétní) P (X = x i ) = q i = j p ij, P (Y = y j ) = r j = i p ij Marginální hustota f X (x) = f(x, y)dy, f Y (y) = f(x, y)dx 2
Podmíněná distribuční fce Y za podmínky X = x F (y x) = P (Y y X = x) Podmíněné pravděpodobnosti: p j i = P (Y = y j X = x i ) = p ij q i Podmíněná hustota Y za podmínky X = x f(y x) = f(x, y) f X (x) 3
5.2. Korelace a) Vektor středních hodnot (EX, EY ) n. v. (X, Y ) EX = i,j x i p ij v diskrétním případě R2 xf(x, y)dxdy ve spojitém případě b) Smíšený moment: i,j x i y j p ij v diskrétním případě EXY = R2 xyf(x, y)dxdy ve spojitém případě c) Kovariance cov(x, Y ) n. veličin X a Y : =. cov(x, Y ) = E(X EX)(Y EY ) = EXY EXEY d XY D : d XY = E[XY (EX)Y (EY )X + (EX)(EY )] = EXY (EX)EY (EY )EX + (EX)(EY ) = EXY EX.EY cov(x, X) = DX, cov(x, Y ) = cov(y, X) d) Kovarianční matice D n. vektoru (X, Y ): DX d D = XY d XY DY e) Korelační koeficient ρ XY náhodných veličin X a Y : d XY ρ XY = DXDY If ρ XY = 0 X a Y nekorelované Platí: 1 ρ XY 1. ρ XY = 1 a, b R, b 0 : Y = a + bx s pstí 1, sign(ρ XY ) = sign(b). ρ XY - míra lineární závislosti mezi X a Y. 4
Vícerozměrné Bernoulliho rozdělení 0 < p i < 1 (1) P (X 1 = x 1,..., X k = x k ) = k i=1 px i i (1 p i ) 1 x i (2) pro x i {0, 1}; jinak - P (X 1 = x 1,..., X k = x k ) = 0 Interpretace: Necht X 1,..., X k je posloupnost nezávislých n.veličin, z nichž každá může nabývat pouze hodnot 0 a 1. Necht P (X i = x i ) = p x i i (1 p i ) 1 x i, i = 1,..., k pro x i {0, 1} a za platnosti (1). Označme X = (X 1,..., X k ) T náhodný vektor. Při jakékoliv realizaci náh. vektoru X musí tedy být každá jeho složka rovna bud nule nebo jedné. Uvažujme množinu vektorů x = (x 1,..., x k ) T, jejichž složky jsou tvořeny nulami a jedničkami. Rozdělení psti náh. vektoru X je dáno (2). 5
Multinomické rozdělení M(n, k, P i ) (X 1,..., X k ) M(n, k, P i ) Multinomické rozdělení o rozměru (n, k) s parametry (p 1,..., p k ) pro k 0 < p i < 1, p i = 1 (3) i n! P (X 1 = x 1,..., X k = x k ) = x 1!...x k! px 1 1...p x k k (4) x i = 0, 1,..., n (i = 1, 2,, k), k i x i = n jinak je P (X 1 = x 1,..., X k = x k ) = 0 EX i = np i, DX i = np i (1 p i ), 1 i k cov(x i, X j ) = np i p j, 1 i j k Pro k = 2 - binomické rozdělení B(n, p 1 ). Interpretace: Mějme urnu a v ní kuličky k různých barev. Necht pst vytažení kuličky i-té barvy je rovna p i, i = 1, 2,, k, přičemž platí (3). Za těchto podmínek n-krát nezávisle na sobě vybereme (s vracením) po jedné kuličce. Označme X i počet kuliček i-té barvy, které takto byli vybrány. Sdružené rozdělení psti náhodných veličin X 1,..., X k je dáno vzorcem (4). 6
Dvourozměrné normální rozdělení (X, Y ) N (µ, D), µ - vektor středních hodnot D - kovarianční matice hustota f(x, y) : µ = (µ 1, µ 2 ), D = σ1 2 σ 12 σ 12 σ2 2 f(x, y) = 1 2πσ 1 σ 2 1 ρ 2 e 1 2(1 ρ 2 ) (x µ 1 )2 σ 1 2 2ρ (x µ 1 )(y µ 2 ) σ 1 σ + (y µ 2 )2 2 σ 2 Pro ρ = 1 hustota není definovaná. (X a Y jsou lineárně závislé) If z = (x, y) T, µ = (µ 1, µ 2 ) T f(z) = 1 2π D exp{ 1 2 (Z µ)t D 1 (Z µ)} 7
5.3. Nezávislost náhodných veličin X a Y jsou nezávislé, if jevy [X x] [Y y] nezávislé (x, y) R 2. F (x, y) = F X (x)f Y (y) (x, y) R 2 Pro diskrétní rozdělení: p ij = q i r j (i, j) Pro spojité rozdělení: f(x, y) = f X (x)f Y (y) (x, y) R 2 Platí: (i) If X, Y nezávislé, g, h spojité reálné funkce = g(x), h(y ) nezávislé. (ii) If X, Y nezávislé = X, Y nekorelované (if X, Y nezávislé EXY = EXEY = d XY = EXY EXEY = 0 a ρ XY = 0) 8
5.4. Funkce náhodného vektoru a) Z = ax + by, a, b reálné konstanty Střední hodnota: E(aX + by ) = aex + bey Rozptyl: D(aX + by ) = E(aX + by aex bey ) 2 = a 2 DX + b 2 DY + 2abd XY If X, Y nekorelované (t.j. d XY = 0) = D(aX + by ) = a 2 DX + b 2 DY b) Z = h(x, Y ) Distribuční funkce F Z : F Z (z) = F Z (z) = P (h(x, Y ) z) h(xi,y j ) z p ij v diskrétním případě h(x,y) z f(x, y)dxdy ve spojitém případě Výpočet střední hodnoty Eh(X, Y ) E(h(X, Y )) = i j h(x i, y j )p ij v diskrétním př. 2 h(x, y)f(x, y)dxdy ve spojitém př. R 9
Příklad 5.2.1 V každé domácnosti jednoho města byly zjišt ovány roční příjmy pracujících manželských párů. (v desetitisících korunách, manžel X, manželka Y ). Tabulka 5.1 p(x, y) x \ y 10 20 30 40 p(x) (x EX) 2 p(x) 10 0.20 0.04 0.01 0.25 ( 10) 2 0.25 = 25 20 0.10 0.36 0.09 0.55 0 30 0.05 0.10 0.15 15 40 0.05 0.05 20 p(y) 0.30 0.45 0.20 0.05 1.00 (y EY ) 2 p(y) 1. Vypočítejte rozptyl X a rozptyl Y. EX = 20, DX = 60; EY = 20, DY = 70 2. Vypočítejte kovarianci a korelační koeficient X a Y. cov(xy ) = d XY = 49, ρ XY = 0.76 Tabulka 5.2 (x EX)(y EY )p(x, y) x \ y 10 20 30 40 10 (-10)(-10)0.20 (-10)(0)0.04 (-10)(10)0.01 = +20 = 0 = 1 20 (0)(-10)0.10 (0)(0)0.36 (0)(10)0.09 = 0 = 0 = 0 30 (10)(0)0.05 (10)(10)0.10 = 0 = +10 40 (20)(20)0.05 = +20 10