Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2017/2018 Tutoriál č. 2:, náhodný vektor Jan Kracík jan.kracik@vsb.cz

náhodná veličina rozdělení pravděpodobnosti náhodné veličiny číselné charakteristiky náhodné veličiny

- číselné vyjádření výsledku náhodného pokusu. je reálná funkce X : Ω R taková, že pro každé reálné číslo x je množina {ω Ω X(ω) < x} náhodný jev. Poznámky: Ω značí prostor elementárních jevů.

- číselné vyjádření výsledku náhodného pokusu. je reálná funkce X : Ω R taková, že pro každé reálné číslo x je množina {ω Ω X(ω) < x} náhodný jev. Poznámky: Ω značí prostor elementárních jevů. pro každý náhodný jev A umíme určit jeho pravděpodobnost P(A) umíme tedy určit i pravděpodobnosti jevů {ω Ω X(ω) < x} zjednodušené značení: P(X < x) P({ω Ω X(ω) < x})

Příklad: Hod dvěma kostkami Náhodný pokus: hod dvěma kostkami Prostor elementárních jevů: Ω = {(1, 1), (1, 2),..., (6, 6)} : součet čísel na obou kostkách X(ω) = ω 1 + ω 2, kde ω = (ω 1, ω 2 )

Příklad: Hod dvěma kostkami Náhodný pokus: hod dvěma kostkami Prostor elementárních jevů: Ω = {(1, 1), (1, 2),..., (6, 6)} : součet čísel na obou kostkách X(ω) = ω 1 + ω 2, kde ω = (ω 1, ω 2 ) {ω Ω X(ω) < 4} = {(1, 1), (1, 2), (2, 1)} je náhodný jev můžeme proto určit P(X < 4) jako P(X < 4) = P({(1, 1), (1, 2), (2, 1)})

Další příklady: doba do poruchy přístroje zítřejší celkový úhrn srážek...

Rozdělení pravděpodobnosti náhodné veličiny X - předpis, který každému náhodnému jevu spojenému s veličinou X přiřazuje jeho pravděpodobnost: kde M R P(X M) P({ω Ω X(ω) M}),

Rozdělení pravděpodobnosti náhodné veličiny X - předpis, který každému náhodnému jevu spojenému s veličinou X přiřazuje jeho pravděpodobnost: kde M R P(X M) P({ω Ω X(ω) M}), Rozdělení pravděpodobnosti lze zadat: určením P(X M) pro každou množinu M - nepraktické distribuční funkcí pravděpodobnostní funkcí nebo hustotou pravděpodobnosti

Distribuční funkce F X (x) Distribuční funkce F X (x) vyjadřuje pravděpodobnost, že veličina X bude mít hodnotu menší než x. F X (x) = P(X < x)

Distribuční funkce F X (x) Distribuční funkce F X (x) vyjadřuje pravděpodobnost, že veličina X bude mít hodnotu menší než x. Vlastnosti distribuční funkce: 0 F X (x) 1 je neklesající je zleva spojitá F X (x) 0 pro x F X (x) 1 pro x + F X (x) = P(X < x)

Diskrétní a spojité náhodné veličiny diskrétní - mohou nabývat nejvýše spočetně mnoha hodnot spojité (se spojitou distribuční funkcí) - mohou nabývat hodnoty z nějakého intervalu (nebo jejich sjednocení), P(X = x) = 0 pro každou hodnotu x Poznámka: Existují i spojité veličiny s nespojitou distr. funkcí. Těmi se nebudeme zabývat.

Rozdělení diskrétní náhodné veličiny s oborem hodnot {1, 2,...} lze charakterizovat pravděpodobnostní funkcí p X (x) = P(X = x) pro x {1, 2,...}.

Rozdělení diskrétní náhodné veličiny s oborem hodnot {1, 2,...} lze charakterizovat pravděpodobnostní funkcí p X (x) = P(X = x) pro x {1, 2,...}. Platí x 1 x 1 F X (x) = P(X < x) = P(X = t) = p X (t). t=1 t=1

Rozdělení diskrétní náhodné veličiny s oborem hodnot {1, 2,...} lze charakterizovat pravděpodobnostní funkcí p X (x) = P(X = x) pro x {1, 2,...}. Platí x 1 x 1 F X (x) = P(X < x) = P(X = t) = p X (t). t=1 t=1 p X (x) 0 x p X (x) = 1 P(X x) = 1 P(X < x) = 1 F X (x) P(a X < b) = P(X < b) P(X < a) = F X (b) F X (a) p X (x) = lim t x+ F X (t) F X (x)

Rozdělení spojité náhodné veličiny lze charakterizovat hustotou pravděpodobnosti f X (x), pro kterou platí F X (x) = x f X ( x)d x

Rozdělení spojité náhodné veličiny lze charakterizovat hustotou pravděpodobnosti f X (x), pro kterou platí Vlastnosti: F X (x) = x f X ( x)d x f X (x) 0 lim x f X (x) = lim x + f X (x) = 0 P(a X < b) = F X (b) F X (a) = b a f X (x)dx P(X = x) = lim t x+ F X (t) F X (x) = 0, protože F X (x) je spojitá

Číselné charakteristiky náhodných veličin Střední hodnota (značíme E(X), µ) pro diskrétní NV: E(X) = i x i p X (x i )

Číselné charakteristiky náhodných veličin Střední hodnota (značíme E(X), µ) pro diskrétní NV: E(X) = i x i p X (x i ) pro spojitou NV: E(X) = + x f X (x)dx

Střední hodnota funkce g(x) náhodné veličiny pro diskrétní NV: E(g(X)) = i g(x i ) p X (x i )

Střední hodnota funkce g(x) náhodné veličiny pro diskrétní NV: E(g(X)) = i g(x i ) p X (x i ) pro spojitou NV: E(g(X)) = + g(x) f X (x)dx

Vlastnosti střední hodnoty: a, b R : E(aX + b) = ae(x) + b E(X 1 + X 2 +... + X n ) = E(X 1 ) + E(X 2 ) +... + E(X n ) Význam střední hodnoty: vážený průměr hodnot s váhami odpovídajícími pravděpodobnostem, těžiště

Obecný moment r-tého řádu (µ r, r = 1, 2,...) µ r = E(X r ) = + x r f X (x) dx Centrální moment r-tého řádu (µ r, r = 1, 2,...) µ r = E((X EX) r ) = + (x EX) r f X (x) dx

Rozptyl náhodně veličiny (druhý centrální moment, DX, σ 2 ) DX = E((X EX) 2 ) = E(X 2 ) (EX) 2

Rozptyl náhodně veličiny (druhý centrální moment, DX, σ 2 ) DX = E((X EX) 2 ) = E(X 2 ) (EX) 2 Vlastnosti rozptylu: a, b R : D(aX + b) = a 2 D(X) X 1, X 2,..., X n nezávislé (viz později), pak D( n i=1 X i) = n i=1 D(X i)

Rozptyl náhodně veličiny (druhý centrální moment, DX, σ 2 ) DX = E((X EX) 2 ) = E(X 2 ) (EX) 2 Vlastnosti rozptylu: a, b R : D(aX + b) = a 2 D(X) X 1, X 2,..., X n nezávislé (viz později), pak D( n i=1 X i) = n i=1 D(X i) Význam rozptylu: Variabilita náhodné veličiny kolem její střední hodnoty (vyjádřeno kvadrátem X).

Rozptyl náhodně veličiny (druhý centrální moment, DX, σ 2 ) DX = E((X EX) 2 ) = E(X 2 ) (EX) 2 Vlastnosti rozptylu: a, b R : D(aX + b) = a 2 D(X) X 1, X 2,..., X n nezávislé (viz později), pak D( n i=1 X i) = n i=1 D(X i) Význam rozptylu: Variabilita náhodné veličiny kolem její střední hodnoty (vyjádřeno kvadrátem X). Příklad: Náhodné veličiny X 1, X 2. X 2 = X 1. DX 1 = σ 2. Pak DX 2 = ( 1) 2 DX 1 = σ 2, ale D(X 1 + X 2 ) = 0 DX 1 + DX 2. X 1, X 2 nejsou nezávislé!

Směrodatná odchylka (σ) σ = DX Význam: Variabilita náhodné veličiny kolem střední hodnoty (vyjádřeno ve stejných jednotkách jako X).

Směrodatná odchylka (σ) σ = DX Význam: Variabilita náhodné veličiny kolem střední hodnoty (vyjádřeno ve stejných jednotkách jako X). Využití: např. Čebyševova nerovnost k > 0 : P( X µ > kσ) 1 k 2

Další charakteristiky: Variační koeficient: γ = σ µ p-kvantil x p : P(X < x p ) = p Dolní kvartil x 0.25 Horní kvartil x 0.75 Medián x 0.5 Modus ˆx: argument maxima pravděpodobnostní funkce (nebo hustoty pravděpodobnosti) Šikmost: α 3 = µ 3 σ 3 (míra symetrie rozdělení) Špičatost: α 4 = µ 4 σ 4 3 (míra koncentrace kolem průměru)

náhodný vektor sdružené rozdělení marginální rozdělení podmíněné rozdělení číselné charakteristiky náhodného vektoru

Náhodným vektorem rozumíme vektor X = (X 1, X 2,..., X n ), jehož složky X 1, X 2,..., X n jsou náhodné veličiny na stejném základním prostoru Ω.

Náhodným vektorem rozumíme vektor X = (X 1, X 2,..., X n ), jehož složky X 1, X 2,..., X n jsou náhodné veličiny na stejném základním prostoru Ω. Příklady: maximální a minimální teplota, množství srážek a průměrná rychlost větru během dne výška a váha náhodně vybrané osoby digitální obraz Dále se omezíme na dvourozměrné vektory (X, Y ), jejich složky jsou bud diskrétní, nebo spojité náhodné veličiny.

Sdružená distribuční funkce náhodného vektoru F X,Y (x, y) = P(X < x Y < y)

Sdružená distribuční funkce náhodného vektoru F X,Y (x, y) = P(X < x Y < y) Vlastnosti: 0 F X,Y (x, y) 1 lim x F X,Y (x, y) = lim y F X,Y (x, y) = 0 lim (x,y) (+,+ ) F X,Y (x, y) = 1 F X,Y (x, y) je neklesající v každé proměnné F X,Y (x, y) je zleva spojitá v každé proměnné

Sdružená pravděpodobnostní funkce diskrétního náhodného vektoru p(x i, y j ) = P(X = X i Y = y j ) 0 p X,Y (x i, y j ) 1 n1 i=1 n2 j=1 p X,Y (x i, y j ) = 1 F X,Y (x, y) = x i <x y j <y p X,Y (x i, y j )

Sdružená hustota pravděpodobnosti spojitého náhodného vektoru je funkce f X,Y (x, y) splňující Vlastnosti: f (x, y) 0 + + F X,Y (x, y) = y x f X,Y (x, y) dx dy = 1 P(a x < b, c y < d) = b a f X,Y ( x, ỹ) d x dỹ d c f X,Y (x, y) dy dx.

Je-li (X, Y ) náhodný vektor, pak rozdělení náhodných veličin X a Y se nazývají marginální.

Je-li (X, Y ) náhodný vektor, pak rozdělení náhodných veličin X a Y se nazývají marginální. Marginální distribuční funkce veličiny X: F X (x) = P(X < x) = lim F X,Y (x, y) y + Marginální pravděpodobnostní funkce veličiny X: p X (x i ) = P(X = x i ) = y j p X,Y (x i, y j ) Marginální hustota pravděpodobnosti veličiny X: f X (x) = Obdobně pro Y. + f X,Y (x, y)dy

Řekneme, že náhodné veličiny X a Y jsou nezávislé, právě když pro každé x, y F X,Y (x, y) = F X (x) F Y (y).

Řekneme, že náhodné veličiny X a Y jsou nezávislé, právě když pro každé x, y F X,Y (x, y) = F X (x) F Y (y). Pro diskrétní náhodný vektor: X, Y jsou nezávislé, právě když p X,Y (x i, y j ) = P X (x i ) P Y (y j ). Pro spojitý náhodný vektor: X, Y jsou nezávislé, právě když f X,Y (x, y) = f X (x) f Y (y).

Podmíněné rozdělení náhodného vektoru

Podmíněné rozdělení X za podmínky Y = y udává rozdělení veličiny X za předpokladu, že veličina Y nabyla hodnoty y. obdobně pro podmíněné rozdělení Y za podmínky X = x...

Diskrétní náhodný vektor (X, Y ) Podmíněná pravděpodobnostní funkce: p X Y (x y) = p X,Y (x, y), pro p Y (y) 0 p Y (y)

Spojitý náhodný vektor (X, Y ) Podmíněná hustota: f X Y (x y) = f X,Y (x, y), pro f Y (y) 0 f Y (y)

Číselné charakteristiky náhodného vektoru

Marginální číselné charakteristiky náhodného vektoru shrnují informace o jednotlivých složkách náhodného vektoru střední hodnoty EX, EY, rozptyly DX, DY, šikmosti, špičatosti,... lze zapsat vektorově: EX = (EX, EY ), DX = (DX, DY ) vypovídají o všech složkách, ale ne o závislostech

Smíšené charakteristiky vypovídají o závislostech jednotlivých složek Kovariance cov(x, Y ) cov(x, Y ) = E((X EX) (Y EY )) Vlastnosti kovariance: cov(x, Y ) = E(X Y ) EX EY cov(x, X) = DX cov(a 1 X + b 1, a 2 Y + b 2 ) = a 1 a 2 cov(x, Y ) jsou-li X, Y nezávislé, pak cov(x, Y ) = 0 D(X + Y ) = D(X) + D(Y ) + 2 cov(x, Y )

Kovarianční matice var(x) var(x) = = ( cov(x, X) cov(x, Y ) cov(y, X) cov(y, Y ) ( D(X) cov(x, Y ) cov(x, Y ) D(Y ) ) ) Kovarianční matice je symetrická a pozitivně semidefinitní.

Korelační koeficient ρ(x, Y ) je mírou lineární závislosti veličin X a Y. cov(x,y ) pro DX, DY 0 DX DY ρ(x, Y ) = 0 jinak

Korelační koeficient ρ(x, Y ) je mírou lineární závislosti veličin X a Y. cov(x,y ) pro DX, DY 0 DX DY ρ(x, Y ) = 0 jinak Vlastnosti korelačního koeficientu 1 ρ(x, Y ) 1 ρ(x, Y ) = ρ(y, X) ρ(x, X) = 1 pro X, Y nezávislé je ρ(x, Y ) = 0

Vlastnosti korelačního koeficientu je-li ρ(x, Y ) = 0, říkáme, že X, Y jsou nekorelované je-li ρ(x, Y ) = 1, pak existují a, b R, a > 0 takové, že Y = ax + b s pravděpodobností 1 je-li ρ(x, Y ) = 1, pak existují a, b R, a < 0 takové, že Y = ax + b s pravděpodobností 1 je-li ρ(x, Y ) > 0, říkáme, že X, Y jsou pozitivně korelované je-li ρ(x, Y ) < 0, říkáme, že X, Y jsou negativně korelované

Podmíněné číselné charakteristiky - charakterizují rozdělení veličiny X za podmínky, že veličina Y nabyla určité hodnoty (nebo naopak...) Podmíněná střední hodnota E(X y) = x i x i p X Y (x i y) Podmíněný rozptyl E(X y) = + x f X Y (x y)dx D(X y) = x i (x i E(X y)) 2 p X Y (x i y) D(X y) = + (x E(X y)) 2 f X Y (x y)dx

A to je konec...