Náhodný vektor Náhodný vektor zatím jsme sledovali jednu náhodnou veličinu, její rozdělení a charakteristiky často potřebujeme vyšetřovat vzájemný vztah několika náhodných veličin musíme sledovat jejich chování společně příklady: vztah hmotnosti a výšky člověka, šířka a délka výrobku, teplota, tlak a vlhkost vzduchu, pohlaví a plat náhodně vybraného člověka... obecně můžeme sledovat n náhodných veličin, pro jednoduchost se ale omezíme na dvě veličiny a Náhodný vektor je dvojice náhodných veličin (, T = (. Rozdělení náhodného vektoru sdružená distribuční funkce F (x, y = P[ x, y], která je funkcí z R [, 1] spojité rozdělení popíšeme tzv. sdruženou hustotou je teď funkcí R [, hodnota f (x, y udává, jak často náhodný vektor padá kolem bodu (x, y má vlastnosti analogické hustotě náhodné veličiny diskrétní rozdělení popíšeme tzv. sdruženými pravděpodobnostmi p ij = P( = x i, = y j pro všechna možná x i a y j (tabulka pravděpodobností Matematická statistika Šárka Hudecová 1/ 8 Matematická statistika Šárka Hudecová / 8 Hustota náhodného vektoru Příklad hustoty spojitého rozdělení: Hustota náhodného vektoru Hustota z předchozího obrázku nakreslená pomocí vrstevnic. 3.6 1.1.1.18 f(x,y.16 y 1.8.1.. Platí f (x, y a f (x, ydxdy = 1. Matematická statistika Šárka Hudecová 3/ 8 x 3 3 1 1 3 Matematická statistika Šárka Hudecová / 8
Příklad diskrétního rozdělení Příklad: Na základě historických zkušeností lze předpokládat, že známky z matematiky a fyziky v prvním ročníku mají rozdělení uvedené v následující tabulce Platí i,j=1 p ij = 1 Fyzika Matematika 1 3 1.1.1..1.8.1.6.1 3.5.8.1..1..1.1 Rozdělení náhodného vektoru ( obsahuje něco navíc, než kdybychom znali jen rozdělení samotné náhodné veličiny a samotné náhodné veličiny. To, co je tam navíc, je informace o vzájemném vztahu obou veličin. Rozdělení náhodného vektoru ( nazýváme sdružené rozdělení náhodných veličin a. Rozdělení samotného a samotného nazýváme marginální rozdělení náhodných veličin a. Matematická statistika Šárka Hudecová 5/ 8 Matematická statistika Šárka Hudecová 6/ 8 Interpretace: sdružené rozdělení nám říká, jak se chová (, společně (jakožto dvojice marginální rozdělení popisuje chování jedné veličiny bez ohledu na hodnoty druhé Vztah sdruženého a marginálního rozdělení: ze sdruženého rozdělení lze vždy určit marginální opačně to obecně není možné, tj. z marginálního nelze jednoznačně určit rozdělení sdružené (k dané dvojici marginálních rozdělení dokonce existuje nekonečně mnoho odpovídajících sdružených rozdělení Fyzika ( Matematika ( 1 3 1.1.1..1.3.8.1.6.1.7 3.5.8.1..7.1..1.1.3..3.3.1 1 Z tabulky umíme spočítat rozdělení samotného a samotného (tj. marginální rozdělení. Např. P[ = 1] = P[ = 1, = 1] + + P[ = 1, = ] =.3 Matematická statistika Šárka Hudecová 7/ 8 Matematická statistika Šárka Hudecová 8/ 8
Nechť ( je diskrétní náhodný vektor s rozdělením určeným pravděpodobnostmi p ij = P[ = x i, = y j ]. Marginální rozdělení veličin a pak jsou P[ = x i ] = P[ = y j ] = j=1 i=1 ] P [ = x i, = y j = ] P [ = x i, = y j = p ij, j=1 p ij. i=1 Pro spojité rozdělení platí analogie předchozího tvrzení: Nechť = ( je náhodný vektor se spojitým rozdělením se sdruženou hustotou f (x, y. Marginální hustoty veličin a pak jsou f (x = f (y = f (x, y dy, f (x, y dx. Matematická statistika Šárka Hudecová 9/ 8 Matematická statistika Šárka Hudecová 1/ 8 Nezávislost náhodných veličin Příklad v praxi nás často zajímá, zda je mezi veličinami a nějaký vztah spec. se můžeme ptát, zda jsou nezávislé hodnoty jedné veličiny nezávisí na hodnotách druhé Nechť je známka z Matematické statistiky a je počet navštívených přednášek náhodně vybraného studenta. Jsou tyto dvě veličiny nezávislé? nezávislost známka nezávisí na počtu navštívených přednášek P( = i = j nezávisí na hodnotách j, tj. P( = i = j = P( = i už víme, že toto odpovídá podmínce P( = i, = j = P( = ip( = j pro všechna i, j Nezávislost náhodných veličin Definice Náhodné veličiny a nazveme nezávislé, pokud pro každé dvě množiny A, B R platí Nezávislé veličiny: P[ A, B] = P[ A] P[ B]. P[ A B] = P[ A] tj. hodnoty jedné náhodné veličiny nejsou ovlivněny hodnotami druhé. ze znalosti hodnoty jedné veličiny nic nevíme o druhé veličině Matematická statistika Šárka Hudecová 11/ 8 Matematická statistika Šárka Hudecová 1/ 8
Charakterizace nezávislosti 1 Diskrétní náhodné veličiny a jsou nezávislé právě tehdy, když platí P[ = x i, = y j ] = P[ = x i ] P[ = y j ] pro každé x i, y j, kterých a nabývají. Spojité náhodné veličiny a jsou nezávislé právě tehdy, když platí f (x, y = f (x f (y pro každé x, y R. Fyzika ( Matematika ( 1 3 1.1.1..1.3.8.1.6.1.7 3.5.8.1..7.1..1.1.3..3.3.1 1 Součinová podmínka neplatí veličiny jsou závislé. Např. P[ = 1, = 1] =.1.3.. Matematická statistika Šárka Hudecová 13/ 8 Matematická statistika Šárka Hudecová 1/ 8 Nezávislost poznámka Střední hodnota součtu a součinu definici nezávislosti lze snadno rozšířit na více než dvě náhodné veličiny platí obdobné charakterizace nezávislosti (sdružená hustota je součinem marginálních hustot apod. Nechť, jsou libovolné náhodné veličiny. 1 Platí E( + = E + E. Pokud jsou a nezávislé, pak platí E = (E (E. střední hodnota součtu dvou (nebo více náhodných veličin je rovna součtu jejich středních hodnot pro nezávislé náhodné veličiny je střední hodnota jejich součinu je rovna součinu jejich středních hodnot pro závislé veličiny tomu tak může, ale nemusí být Matematická statistika Šárka Hudecová 15/ 8 Matematická statistika Šárka Hudecová 16/ 8
Kovariance Jsou-li veličiny a závislé budeme chtít popsat jejich závislost Definice Uvažujme náhodný vektor (. Kovariancí náhodných veličin a rozumíme hodnotu cov (, = E[( E ( E ] kovariance vyjadřuje vzájemný vztah a evidentně platí cov (, = cov (, a cov (, = var. Vlastnosti kovariance 1 Kovariance může nabývat jakýchkoli reálných hodnot, ale pro dvě konkrétní veličiny musí platit Platí cov (, var var. cov (, = E E E. 3 Pokud jsou a nezávislé, pak cov (, =. pozor, tvrzení 3 neplatí opačně (tj. z nulové kovariance nelze obecně nic usuzovat o nezávislosti 3 plyne z, neboť pro nezávislé veličiny E = E E. Matematická statistika Šárka Hudecová 17/ 8 Matematická statistika Šárka Hudecová 18/ 8 Interpretace kovariance Výpočet kovariance cov (, > náhodné veličiny a jsou závislé v pozitivním smyslu vyšší hodnoty jsou svázány s vyššími hodnotami (a nižší hodnoty s nižšími hodnotami příklad: výška a váha člověka. cov (, < náhodné veličiny a jsou závislé v negativním smyslu vyšší hodnoty jsou svázány s nižšími hodnotami (a nižší hodnoty s vyššími hodnotami příklad: výše IQ a průměrná známka na ZŠ cov (, = neznamená, že by mezi a nebyl nutně žádný vztah (ještě se o tom zmíníme později K výpočtu se používá vzorec cov (, = E E E člen E počítáme ze sdruženého rozdělení i,j x iy j P[ = x i, = y j ], pro diskrétní rozdělení, E = xyf (x, ydxdy pro spojité rozdělení. členy E a E počítáme z marginálního rozdělení (střední hodnota náhodné veličiny Matematická statistika Šárka Hudecová 19/ 8 Matematická statistika Šárka Hudecová / 8
Korelace Fyzika ( Matematika ( 1 3 1.1.1..1.3.8.1.6.1.7 3.5.8.1..7.1..1.1.3..3.3.1 1 E = 1 1.1 + 1.1 + +.1 = 6.3, E = 1.3 +.7 + +.3 =.5, E = 1. + +.1 =.3, cov (, = 6.3.5.3 =.58. hodnoty kovariance se špatně interpretují z hodnoty cov (, poznáme, že a jsou závislé a jakým směrem, ale nepoznáme, jak silně jsou závislé Definice Uvažujme náhodný vektor (. Korelací náhodných veličin a rozumíme hodnotu cor (, = cov (, var var. korelace se někdy značí ρ někdy mluvíme o korelačním koeficientu. Matematická statistika Šárka Hudecová 1/ 8 Matematická statistika Šárka Hudecová / 8 Vlastnosti korelace Interpretace korelace 1 Korelace ρ vždy leží mezi 1 a 1 a ρ = cov (, =. Pokud jsou a nezávislé, pak cor (, =. 3 Platí ρ = 1 právě když = a + b pro nějaké a R a b >. ρ = 1 právě když = a + b pro nějaké a R a b <. korelace měří sílu lineární závislosti mezi a znaménko korelace udává směr závislosti jsou-li a silně lineárně závislé (tj. hodnoty této dvojice padají nejčastěji někde kolem přímky v R s nenulovou směrnicí, pak je korelace blízko 1 nebo 1. nezávislé veličiny mají vždy nulovou korelaci je-li korelace nulová, neznamená to, že a jsou nutně nezávislé (korelace je mírou pouze lineární závislosti Matematická statistika Šárka Hudecová 3/ 8 Matematická statistika Šárka Hudecová / 8
Interpretace korelace Hustota rozdělení s různými korelacemi 1 1 cor =. 1 1 3 cor =.5 cor(, = cor(, =.3 3 1 1 3 3 1 1 3 1 1 3 3 1 1 3 1 1 cor =.9 1 1 cor =.7 cor(, =.7 cor(, =.9 1 1 1 1 3 Matematická statistika Šárka Hudecová 5/ 8 3 1 1 3 3 1 1 3 Matematická statistika Šárka Hudecová 6/ 8 Vlastnosti střední hodnoty a rozptylu Fyzika ( Matematika ( 1 3 1.1.1..1.3.8.1.6.1.7 3.5.8.1..7.1..1.1.3..3.3.1 1 Už víme cov (, =.58. Z marginálních rozdělení spočítáme var = E (E = = 7..5 = 1.17 var = E (E = = 6.6.3 =.98.58 cor (, = =.5. 1.17.98 Nechť, jsou náhodné veličiny, a, b R. Pak 1 E(a + b = a + be, E( + = E + E, 3 var (a + b = b var, var ( + = var + var + cov (, 5 pro nezávislé veličiny var ( + = var + var Matematická statistika Šárka Hudecová 7/ 8 Matematická statistika Šárka Hudecová 8/ 8