Příklady ke čtvrtému testu - Pravděpodobnost 6. dubna 0 Instrukce: Projděte si všechny příklady. Každý příklad se snažte pochopit. Pak vymyslete a vyřešte příklad podobný. Tím se ujistíte, že příkladu rozumíte. Další příklady najdete na stránkách Ivana Nagye. Učivo: Práce s vícerozměrnými rozděleními. Sdružené, marginální, podmíněné rozdělení pravděpodobnosti. Vektorová střední hodnota. Kovariance, korelace, kovarianční matice. Práce s vícerozměrnými rozděleními, sdružené, marginální a podmíněné rozdělení pravděpodobnosti Zjistěte, zda funkce dvou proměnných f(x, y) x + y definovaná pro x 0, a y 0, může být hustotou pravděpodobnosti. Proč? ) Záporná není nikde - OK ) Integrál přes celý definiční obor? ˆ ˆ x0 y0 (x + y) dy dx ˆ x0 ˆ x0 [ x ] [xy + y y0dx [ x + ] dx + x ] + x0 Obě podmínky jsou splněny, funkce může být hustotou pravděpodobnosti.
Zjistěte, zda funkce dvou proměnných f(x, y) x y být hustotou pravděpodobnosti. Proč? ) Záporná není nikde - OK ) Integrál přes celý definiční obor? definovaná pro x, a y, může x y x dy dx y x x x x x x x y y ( [ x y x dx x dx [ x ] x [0 ( )] y dy dx y dy dx ] y ) dx Obě podmínky jsou splněny, funkce může být hustotou pravděpodobnosti. Máme dvourozměrnou hustotu pravděpodobnosti f(x, y) 4 sin x sin y definovanou pro x 0, π a y 0, π. Spočtěte marginální hustotu f(y) a podmíněnou hustotu f(x y). Zjistěte, zda jsou veličiny x a y závislé či nezávislé. Marginální hustota: f(y) ˆπ x0 sin x sin y dx 4 ˆπ 4 sin y sin x dx x0 4 sin y [ cos x]π x0 sin y [ ( ) ( )] 4 sin y Podmíněná hustota:
Závislost / nezávislost: f(x y) f(x, y) f(y) 4 sin x sin y sin y sin x Vidíme, že f(x y) nezávisí na y. Veličiny x a y jsou tedy nezávislé. Máme dvourozměrnou hustotu pravděpodobnosti f(x, y) π e x y x definovanou pro kladná x a y. Spočtěte marginální hustotu f(y) a podmíněnou hustotu f(x y). Zjistěte, zda jsou veličiny x a y závislé či nezávislé. Tento příklad si rozebereme podrobněji. V první řadě je otázkou, jestli je zadaná funkce opravdu hustotou pravděpodobnosti. To by jednak nesměla být nikde záporná, jednak by integrál z ní přes celý definiční obor musel vyjít jedna. První podmínka je splněna, neboť e na cokoli je kladné. A když věnujeme několik minut integrování, zjistíme, že konstanta na začátku funkce je zvolena dobře a že opravdu platí: y0 x0 π e x y x dx dy. To byla poznámka k hustotě pravděpodobnosti, my máme spočíst jen marginální a podmíněnou hustotu. Chceme marginální hustotu podle y, zintegrujeme tedy pravděpodobnostní funkci podle druhé proměnné, tedy podle x: f(y) x0 π e x y x dx π Provedeme substituci za celý exponent: x0 e (y +) x dx Tedy máme: z ( y + ) x ( y + ) dz dx dx y + dz x 0 z 0 x z
ˆ π π z0 e z y + ( ) y dz + ˆ0 z e z dz π y + [ez ] 0 z π y [ 0] + π y + Hurá! Marginální hustotu podle y máte hotovu! Podmíněnou pravděpodobnost f(x y) už spočteme snadno podle standardního vzorce: f(x y) f(x, y) f(y) π e x y x π y + ( y + ) e (y +) x Vidíme, že jsme dostali exponenciální rozdělení, ovšem s proměnlivým parametrem závislým na y: D y +. Jak je to se závislostí? Vidíme, že pravděpodobnostní rozdělení f(x y) opravdu závisí na tom, jaké zvolíme y. Tedy veličiny x a y jsou závislé. Nakonec ještě několik obrázků: Nejprve celá sdružená hustota ze dvou pohledů. V prvním jsou dobře vidět půlkopečky typu y +, v druhém exponenciály, které mají tím větší spád, čím jsou blíže k nám. 4
y Následuje marginální hustota podle y: A ještě podmíněné pravděpodobnosti pro několik zvolených y. Opravdu vidíme několik různě strmých exponenciál: Máme dvourozměrnou hustotu pravděpodobnosti f(x, y) (x + y ) definovanou pro x 0, a y 0,. Spočtěte marginální hustotu f(x) a podmíněnou hustotu f(y x). Zjistěte, zda jsou veličiny x a y závislé či nezávislé. 5
Marginální hustota: f(x) ˆ y0 (x + y ) dy [ x y + y ] y0 [ x + ] 0 0 x + Podmíněná hustota: Závislost / nezávislost: f(x, y) f(y x) f(x) (x + y ) (x ) + x + y x + Vidíme, že f(y x) opravdu závisí na x. Veličiny x a y jsou tedy závislé. Máme hustotu pravděpodobnosti dvou proměnných f(x, y) x + y definovanou pro x 0, a y 0,. Jaká je střední hodnota vektorové veličiny (x, y)? µ x ˆ ˆ x0 y0 x (x + y) dy dx ˆ x0 ˆ x0 [ x ] [x y + xy y0dx [ x + x ] dx + x 4 ] + 4 7 x0 Nyní naprosto stejným způsobem spočteme střední hodnotu y: ˆ ˆ µ y y (x + y) dy dx x0 y0 ˆ x0 [ xy + y ] y0dx 6
ˆ x0 [ x [ x + ] dx 4 + x ] x0 4 + 7 Střední hodnotou vektorové veličiny je bod [ 7, 7 ]. Máme hustotu pravděpodobnosti dvou proměnných f(x, y) x y y,. Jaká je střední hodnota vektorové veličiny (x, y)? definovanou pro x, a Spočteme nejprve střední hodnotu x. Integrujeme přes celý definiční obor: µ x x y x x dy dx y x x x x x x y y ( [ x y x dx [ln x] x [ 0] y dy dx y dy dx ] y ) dx Setkali jsme se se zvláštním jevem, totiž s tím, že střední hodnota může být i nekonečná. Nyní naprosto stejným způsobem spočteme střední hodnotu y: µ y x y y x y dy dx Střední hodnotou vektorové veličiny je nevlastní bod [, ]. Kovariance a korelace Naměřili jsme tyto dvojice hodnot: x 5 7 y 9 7 5 Spočtěte pro tyto vektory kovarianci, korelační koeficient, kovarianční a korelační matici. 7
Jde o několik měření, budeme tedy soubor chápat jako soubor výběrový, což nám ovlivní kovarianci a kovarianční matici. Pro korelaci to je jedno. Začněme s výpočtem: x 4 ȳ 6 x y x x y ȳ (x x) (y ȳ) (x x) (y ȳ) 9 - -9 9 9 7 - - 5 5 - - 7 - -9 9 9 Kovariance: cov(x, y) Rozptyly: s x s y (x x)(y ȳ) n (x x) n 0 (y ȳ) n 0 Směrodatné odchylky: s x s x, 58 s y s y, 58 6, 67 6, 67 Korelační koeficient: r xy cov(x,y) s x s y 6,67,58,58 Kovarianční matice: x y x 6,67-6,67 y -6,67 6,67 Korelační matice: x y x - -0 0 0 0 6, 67 y - Vidíme, že veličiny x a y jsou velmi silně negativně korelovány. V základním souboru máme tyto čtveřice hodnot: x 5 7 y 9 7 5 Spočtěte pro tyto vektory kovarianci, korelační koeficient, kovarianční a korelační matici. Máme soubor základní, což nám ovlivní kovarianci a kovarianční matici. Pro korelaci to je jedno. Začněme s výpočtem: µ x 4 µ y 6 8
x y x µ x y µ y (x µ x) (y µ y) (x µ x) (y µ y) 9 - -9 9 9 7 - - 5 5 - - 7 - -9 9 9 Kovariance: cov(x, y) Rozptyly: σ x (x µx)(y µ y) n (x µx) n 0 4 5 σy (y µy) n 0 4 5 Směrodatné odchylky: σ x s x, 4 σ y s y, 4 Korelační koeficient: r xy cov(x,y) σ x σ y 5,4,4 Kovarianční matice: x y x 5-5 y -5 5 Korelační matice: x y x - -0 0 0 0 4 5 y - Vidíme, že veličiny x a y jsou velmi silně negativně korelovány. Korelační matice vyšla stejně jako v případě výběrového souboru. Naměřili jsme tyto trojice hodnot: x 5 7 y 6 7 9 z 5 6 8 Spočtěte pro tyto vektory kovarianci, korelační koeficient, kovarianční a korelační matici. Jde o několik měření, budeme tedy soubor chápat jako soubor výběrový, což nám ovlivní kovarianci a kovarianční matici. Pro korelaci to je jedno. Začněme s výpočtem: x 4 ȳ 6 z 5 x y z x x y ȳ z z (x x) (y ȳ) (x x) (z z) (y ȳ) (z z) (x x) (y ȳ) (z z) 5 - -4 0 0 0 9 6 0 6 6-0 0-0 0 5 7-4 -4-4 6 7 9 8 9 9 9 9 9 9 4 5 0 6 6 9
Kovariance: cov(x, y) cov(x, z) cov(y, z) Rozptyly: s x s y s z (x x)(y ȳ) n (x x)(z z) n 4 (y ȳ)(z z) n 4 (x x) n 0 (y ȳ) n 6 (z z) n 6 Směrodatné odchylky: s x s x, 58 s y s y, 94 s z s z, 94 6, 67 8, 67 8, 67 Korelační koeficient: r xy cov(x,y) s x s y 7,,58,94 0, 96 r xz cov(x,z) s x s z,,58,94 0, 8 r yz cov(y,z) s y s z,,94,94 Kovarianční matice: x y z x 6,67 7,, y 7, 8,67,66 z,,66 8,67 Korelační matice: x y z x 0,96 0,8 y 0,96 0,9 0, 9 7,,, 66 z 0,8 0,9 Vidíme, že silně pozitivně jsou korelovány veličiny x a y. Ostatní dvojice mají korelaci velmi slabou. 0