AVDAT Náhodný vektor, mnohorozměrné rozdělení Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita
Opakování, náhodná veličina, rozdělení Náhodná veličina zobrazuje elementární náhodný jev do R Distribuční funkce F(x) = P(X < x) diskrétní veličina pravděpodobnostní funkce [x i, P(X = x i )] spojitá veličina hustota F (a) = a f (x) dx, f (x) = df (x) dx
Opakování, náhodná veličina, střední hodnota, rozptyl Střední hodnota diskrétní veličina E X = x i P(X = x i ) Střední hodnota spojitá veličina E X = + x f (x)dx Rozptyl var X = E[X E X] 2
Opakování, kovariance, korelační koeficient Kovariance cov(x 1, X 2 ) = E [(X 1 E X 1 )(X 2 E X 2 )] Korelační koeficient ϱ(x 1, X 2 ) = cov(x 1, X 2 ) var X1 var X2 1 ϱ(x 1, X 2 ) 1
Náhodný vektor rozdělení Náhodný vektor X = [X 1, X 2,, X p ] T je vektor, jehož složky X 1, X 2,, X p jsou náhodné veličiny. U náhodného vektoru musíme rozlišovat rozdělení sdružené, marginální a podmíněné.
Sdružené rozdělení - p = 2 sdružená distribuční funkce F(x 1, x 2 ) = P(X 1 < x 1, X 2 < x 2 ) X 1, X 2 diskrétní veličiny, pak sdružená pravděpodobnostní funkce je P(x 1, x 2 ) = P(X 1 = x 1, X 2 = x 2 ) Existuje-li nezáporná funkce f (x 1, x 2 ) taková, že F(x 1, x 2 ) = x1 x2 f (u, v)dudv, pak náhodný vektor [X 1, X 2 ] T má rozdělení spojitého typu. Funkce f (, ) se nazývá sdružená hustota.
Sdružené rozdělení Pravděpodobnost, že náhodné veličiny X 1, X 2 nabývají hodnot z intervalů [a 1, b 1 ), [a 2, b 2 ) je určena vztahem P(a 1 X 1 < b 1, a 2 X 2 < b 2 ) = Sdružená hustota je b1 b2 a 1 f (x 1, x 2 ) = 2 F(x 1, x 2 ) x 1 x 2 a 2 f (x 1, x 2 )dx 1 dx 2 Pro p > 2 platí analogické vztahy, mimo jiné sdružená hustota je derivací distribuční funkce: f (x) = f (x 1, x 2,, x p ) = p F(x 1, x 2,, x p ) x 1 x 2 x p
Příklad sdružená pravděpodobnostní funkce Sdružená pravděpodobnostní funkce náhodného vektoru [X, Y ] T je zadána tabulkou X = x 1 X = x 2 X = x 3 Y = y 1 p 11 p 12 p 13 Y = y 2 p 21 p 22 p 23
Marginální rozdělení F (x 1, x 2 ) je sdružená distribuční funkce, pak marginální distribuční funkce veličin X 1 a X 2 jsou F 1 (x 1 ) = P(X 1 < x 1, X 2 < ) = F(x 1, ) F 2 (x 2 ) = P(X 1 <, X 2 < x 2 ) = F(, x 2 ) Pro diskrétní rozdělení marginální pravděpodobnostní funkce jsou definovány takto: P 1 (x 1 ) = M 2 P(x 1, x 2 ) P 2 (x 2 ) = M 1 P(x 1, x 2 ) kde M i je množina hodnot diskrétní náhodné veličiny X i.
Příklad marginální pravděpodobnostní funkce Sdružená pravděpodobnostní funkce a marginální pravděpodobnostní funkce vektoru [X, Y ] T : X = x 1 X = x 2 X = x 3 marg1 Y = y 1 p 11 p 12 p 13 p 1 Y = y 2 p 21 p 22 p 23 p 2 marg2 p 1 p 2 p 3 1 Kolik marginálních rozdělení má tento vektor?
Marginální hustoty Pro spojité rozdělení marginální hustoty jsou f 1 (x 1 ) = f (x 1, x 2 )dx 2 M 2 f 2 (x 2 ) = f (x 1, x 2 )dx 1 M 1 kde M i je obor hodnot spojité náhodné veličiny X i.
Podmíněné rozdělení - diskrétní veličiny podmíněná pravděpodobnostní funkce P(x 1 x 2 ) = P(x 1, x 2 ) P 2 (x 2 ) podmíněná distribuční funkce t<x F(x 1 x 2 ) = 1 P(t, x 2 ) P 2 (x 2 ) pro P 2 (x 2 ) 0 pro P 2 (x 2 ) 0
Příklad podmíněné rozdělení Pro Y = y 2 : X = x 1 X = x 2 X = x 3 marg1 Y = y 1 p 11 p 12 p 13 p 1 Y = y 2 p 21 p 22 p 23 p 2 marg2 p 1 p 2 p 3 1 Podmíněná pravděpodobnostní funkce P((X = x i ) y 2 ) = p 2i p 2 p 2 0 Kolik je podmíněných rozdělení tohoto vektoru?
Nezávislé náhodné veličiny Pro nezávislé veličiny platí: F(x 1, x 2 ) = F 1 (x 1 ) F 2 (x 2 ) P(x 1, x 2 ) = P 1 (x 1 ) P 2 (x 2 ) f (x 1, x 2 ) = f 1 (x 1 ) f 2 (x 2 ) Jsou-li veličiny nezávislé, pak podmíněná rozdělení jsou rovna marginálním.
Charakteristiky náhodného vektoru X = [X 1, X 2,, X p ] T Marginální charakteristiky: Střední hodnoty pro diskrétní: E(X j ) = M j x j P j (x j ), j = 1, 2,..., p Střední hodnoty pro spojité: E(X j ) = x j f j (x j )dx j, M j j = 1, 2,..., p Podmíněné charakteristiky podobně, jen místo marginálního rozdělení je podmíněné. Podmíněná střední hodnota E(X 1 x 2 ) se nazývá regresní funkce (závislost X1 na X2).
Vektor středních hodnot, kovarianční matice E(X) = a kovarianční (varianční) matice Σ = var(x) = cov(x) = E E(X 1 ) E(X 2 ). E(X p ) [ (X E(X))(X E(X)) T ] (1) což znamená, že Σ = σ1 2 σ 12 σ 1p σ 21 σ2 2 σ 2p......, σ p1 σ p2 σp 2
Vícerozměrné normální rozdělení f (x) = (2π) p/2 Σ 1/2 exp ( (x µ)t Σ 1 (x µ) 2 kde µ je vektor středních hodnot a Σ je kovarianční matice. Pro jednorozměrné normální rozdělení z rov. (2) dostaneme f (x) = ( ) 1 exp (x µ)2 2πσ 2 2σ 2 Vícerozměrné normální rozdělení má tyto vlastnosti: lineární kombinace prvků z X mají normální rozdělení všechny podmnožiny X mají normální rozdělení nekorelovanost veličin z X (složek vektoru X) znamená i jejich nezávislost všechna podmíněná rozdělení jsou normální ), (2)
Dvourozměrné normální rozdělení parametry EX 1 = µ 1, EX 2 = µ 2, varx 1 = σ1 2, varx 2 = σ2 2 a kovariancí σ 12 je kovarianční matice [ ] [ σ 2 Σ = 1 σ 12 σ σ 12 σ2 2 = 1 2 ] σ 1 σ 2 ρ σ 1 σ 2 ρ σ2 2 nebot korelační koeficient ρ = σ 12 /(σ 1 σ 2 ). Determinant kovarianční matice je pak Σ = σ 2 1 σ2 2 σ2 12 = σ2 1 σ2 2 (1 ρ2 ). Vidíme, že tento determinant je roven nule, když ρ 2 = 1.
µ 1 = µ 2 = 0, σ 1 = σ 2 = 1, ρ = 0
µ 1 = µ 2 = 0, σ 1 = 1, σ 2 = 2, ρ = 0
µ 1 = µ 2 = 0, σ 1 = σ 2 = 1, ρ = 0.6
µ 1 = µ 2 = 0, σ 1 = σ 2 = 1, ρ = 0.8
µ 1 = µ 2 = 0, σ 1 = 1, σ 2 = 2, ρ = 0.8
µ 1 = µ 2 = 0, σ 1 = 1, σ 2 = 2, ρ = 0.8