9. T r a n s f o r m a c e n á h o d n é v e l i č i n y Při popisu procesů zpracováváme vstupní údaj, hodnotu x tak, že výstupní hodnota y závisí nějakým způsobem na vstupní, je její funkcí y = f(x). Pokud má vstupní hodnota náhodný charakter, je náhodnou veličinou, bude mít i výstupní hodnota náhodný charakter. Základní úlohou je tedy určit ze známého rozdělení vstupní veličiny rozdělení veličiny výstupní. Definujme nejprve co je transformovaná náhodná veličina. 9.1. Definice: Transformovaná náhodná veličina. Je-li X náhodná veličina a h je reálná funkce taková, že její definiční obor obsahuje obor hodnot náhodné veličiny X, pak náhodnou veličinu Y, která je definována vztahem ( ) X = x Y = h(x) nazýváme transformovanou náhodnou veličinou a označujeme ji symbolem ( ) Y = h(x). Poznámka: Při definici obecných a centrálních momentů jsme vlastně použili trasformovanou náhodnou veličinu např. X 2, X k, (X E(X)) 2, a pod. Obdobně jsme při odvozování vlastností normálního rozdělení vyšetřovali lineární závislost Y = αx + β, tedy trasformovanou náhodnou veličinu. Ukázali jsme si také vlastnost střední hodnoty při lineární trasformaci, totiž vzorec E(αX + β) = αe(x) + β. Budeme nyní hledat vztah mezi rozděleními při transformaci. Budeme uvažovat nejprve diskrétní rozdělení jako zvláštní případ. 9.2. Věta: Transformace diskrétního rozdělení. Nechť má náhodná veličina X diskrétní rozdělení s pravděpodobnostní funkcí p, p(x) = P (X = x), potom má transformovaná náhodná veličina Y = h(x) také diskrétní rozdělení a pro její distribuční funkci p platí: p (y) = p(x), y R. x h 1 (y) 71
Důkaz: První část tvrzení je zřejmá. Jestliže náhodná veličina X nabývá diskrétních hodnot z množiny {x i }, pak hodnoty náhodné veličiny Y jsou z množiny {h(x i )}. Pro pravděpodobnostní funkci p náhodné veličiny Y pak platí: p (y) = P (Y = y) = P (h(x) = y) = P (X h 1 (y)) = = x h 1 (y) p(x), y R. Vzor hodnoty y, tedy množina h 1 (y) je ovšem množina všech hodnot x, pro které je y = h(x), tedy hodnot náhodné veličiny X, které se při trasformaci pomocí funkce h trasformují do hodnoty Y = h(x). Ty tvoří množinu diskrétních hodnot, které se navzájem vylučují a tedy pravděpodobnost P (Y = y) dostaneme jako součet pravděpodobností z uvedeného vzorce. Poznámka: Výpočet pravděpodobnostní funkce provedeme tedy tak, že k tabulce pravděpodobnostní funkce přidáme řádek hodnot y = h(x), zjistíme, které hodnoty proměnné x přejdou při trasformaci do stejné hodnoty a odpovídající pravděpodobnosti p(x) sečteme. Tabulku pak přerovnáme podle velikostí proměnné y. Postup si ukážeme na jednoduchém příkladě. Příklad: Nechť je rozdělení náhodné veličiny X dáno tabulkou Tab. 9.1. Utvořme tabulku pro rozdělení náhodné veličiny Y = X 2 1. x -2-1 1 2 p(x),1,25,15,3,2 Tab. 9.1. y 3-1 3 x -2-1 1 2 p(x),1,25,15,3,2 Tab. 9.2. Přidáme k tabulce řádek funkčních hodnot proměnné x po transformaci y = x 2 1. Dostaneme rozšířenou tabulku Tab. 9.2. 72
Z tabulky vidíme, že náhodná veličina Y nabývá hodnot -1, a 3. Je pak: p ( 1) = P (Y = 1) = P (X 2 1 = 1) = P (X = ) = p() =, 15; p () = P (Y = ) = P (X = 1 X = 1) = p( 1) + p(1) =, 55; p (3) = P (Y = 3) = P (X = 2 X = 2) = p( 2) + p(2) =, 3. Pravděpodobnostní funkce p náhodné veličiny Y je uvedena v tabulce Tab. 9.3. y -1 3 p (y),15,55,3 Tab. 9.3. Poznámka: V případě spojitého či smíšeného rozdělení provedeme výpočet distribuční funkce podle uvedeného algoritmu. Pokud je transformovaná náhodná veličina spojitá, nalezneme z ní snadno hustotu derivováním. 9.3. Algoritmus pro transformovanou distribuční funkci. Nechť má náhodná veličina X distribuční funkci F, případně hustotu f, kde f(x) = F (x). Označme si G distribuční funkci, případně g, g(y) = G (y) hustotu transformované náhodnou veličiny Y = h(x). Potom podle definice distribuční funkce je: G(y) = P (Y y) = P (h(x) y) = P (X h 1 (, y ), y R, kde symbolem h 1 (, y ) označujeme vzor množiny (, y, tedy množinu všech x, pro které je h(x) y. Tato množina je intervalem, nebo sjednocením intervalů a odpovídající pravděpodobnost zjistíme pomocí původní distribuční funkce či hustoty. Budeme uvedený algoritmus ilustrovat na několika příkladech. 9.4. Příklad: Lineární transformaci Y = αx + β jsme uvedli v kapitole 8 pro normální rozdělení. Zopakujme si uvedený výpočet. V souladu s uvedeným označením je G(y) = P (Y y) = P (αx + β y) = P (αx y β) = 73
= P (X y β α P (X y β α ) = F ( y β α ) α > ) = 1 F ( y β α ), α <. Potom pro hustotu g rozdělení náhodné veličiny Y dostaneme: ( ) d g(y) = G dy F ( y β α (y) = ) = 1 α f(y β α ) ( ) d dy 1 F ( y β α ) = 1 α f(y β α ) = 1 ( ) y β α f. α 9.5. Příklad: Nechť má náhodná veličina X exponenciální rozdělení Exp(; 1) s hustotou, která je určena vztahy: f(x) =, x <, e x, x. Určete hustotu rozdělení pravděpodobnosti náhodné veličiny Y = X. Řešení: Znázorníme si na obrázku Obr. 9.1. průběh hustoty f a na obrázku Obr. 9.2. vyznačíme průběh trasformující funkce y = x, x, ). 1 y f(x) 1 2 3 Obr. 9.1. x y y, Y Y = X y = Y X = y 2 x, X Obr 9.2. 74
Z obrázku 9.1 vyplývá, že náhodná veličina X nabývá hodnot z intervalu, ), neboť zde je hustota f kladná. Z obrázku 9.2 vyplývá, že funkce y = x zobrazuje tento interval na interval, ). To znamená, že náhodná veličina nabývá pouze hodnot z tohoto intervalu a tudíž jsou její distribuční funkce G a hustota g rovny nule pro y <. Pro hodnoty y vypočteme hodnotu distribuční funkce G výše popsaným algoritmem. Je G(y) = P (Y y) = P ( X y) = P ( X y 2 ) = F (y 2 ) F () = = F (y 2 ), y, ). Odtud dostaneme, že pro hustotu g platí vyjádření: g(y) = G (y) = d dy ( ) F (y 2 ) = 2yf(y 2 ) = 2ye y2, y (, ). Snadno vypočteme i hodnotu distribuční funkce F náhodné veličiny X. Je, x, F (x) = 1 e x, x. Odtud plyne, že G(y) =, y, 1 e y2, y. Všimneme si, že k určení hustoty g nám postačilo znát hustotu f. Výpočet distribuční funkce G pomocí distribuční funkce F je prováděn pouze v symbolech a po provedení derivace vystačíme k vyjádření hustoty g pouze s hustotou f. 9.6. Příklad: Jestliže má náhodná veličina X normální rozdělení N(; 1), určete hustotu a distribuční funkci transformované náhodné veličiny Y = X 2. Řešení: V souladu se značením v kapitole 8 označíme Φ distribuční funkci a ϕ hustou náhodné veličiny X. Z průběhu funkce ϕ na obrázku Obr. 8.1 vyplývá, že náhodná veličina X nabývá všech reálných hodnot. Znázorníme si na obrázku 9.3 průběh trasformující funkce Y = X 2. 75
y, Y Y = X 2 y Y = y X = y X = y x, X Obr. 9.3. g(y) 1 2 3 y Obr 9.4. Protože funkce y = x 2 nabývá všech nezáporných hodnot, bude náhodná veličina Y nabývat také nezáporných hodnot. Jsou tedy její distribuční funkce G a hustota g rovny nule pro zápornou hodnotu argumentu. Pro y pak dostaneme: G(y) = P (Y y) = P (X 2 y) = P ( y X y) = = Φ( y) Φ( y) = 2Φ( y) 1, když použijeme vztahu Φ( x) = 1 Φ(x) z kapitoly 8. Potom pro hustotu g náhodné veličiny Y odtud dostaneme: g(y) = G (y) = d dy (2Φ( y) 1) = 1 y ϕ( y) = 1 2πy e y 2, y (, ), jestliže použijeme skutečnosti z kapitoly 8, ϕ(x) = 1 2π e x2 2, x R. Toto rozdělení nazýváme rozdělení χ 2 (1) o jednom stupni volnosti. Čteme chí-kvadrát a rozdělení tohoto typu patří k nejpoužívanějším v matematické statistice. Průběh hustoty je znázorněn na obrázku 9.4. 76
9.7. Příklad: Nechť má náhodná veličina X rovnoměrné rozdělení v intervalu (, 1). Určete rozdělení náhodné veličiny Y = lnx. Řešení: Náhodná veličina X nabývá hodnot z intervalu (, 1) a transformující funkce y = lnx nabývá v tomto intervalu všech kladných hodnot. Náhodná veličina Y nabývá tudíž kladných hodnot a jsou tedy její distribuční funkce G a hustota g rovny nule pro záporné hodnoty argumentu. Situaci si znázorníme na obrázku Obr. 9.5. Hodnoty distribuční funkce pro kladný argument vypočteme popsaným způsobem. Je pak G(y) = P (Y y) = P ( lnx y) = P (lnx y) = P (X e y ) = = 1 F (e y ) = 1 e y, když použijeme výsledků o rovnoměrném rozdělení z odstavce 5.9. Hustotu g získáme přímo derivováním nebo ze vztahu g(y) = G (y) = d dy ( 1 F (e y ) ) = f(e y ) = e y, y >. Opět použijeme vyjádření pro hustotu rovnoměrného rozdělení z odstavce 5.9. Průběh hustoty g je znázorněn na obrázku Obr. 9.6. y y, Y Y = y Y = lnx 1 g(y) X = e y 1 x, X 1 2 3 Obr. 9.5. Obr 9.6. y 9.8. Příklad: Náhodná veličina X má exponenciální rozdělení Exp(; 1) a náhodná veličina Y = min{x, 2}. a) Určete rozdělení náhodné veličiny Y (její distribuční funkci). b) Vypočtěte střední hodnotu E(Y ), rozptyl D(Y ) a směrodatnou odchylku σ(y ). 77
Řešení: Náhodná veličina nabývá kladných hodnot. Její hustota rozdělení pravděpodobnosti f je rovna, x (, ), f(x) = e x, x, ). Distribuční funkci F určíme ze vzorce F (x) = Je pak pro x : F (x) = ; pro x > : F (x) = F () + F (x) = x x f(t) dt, x R. e t dt = + [ e t] x = 1 e x. Tedy, x (, ), 1 e x, x, ). Náhodná veličina Y nabývá hodnot z intervalu (, 2. Pro její distribuční funkci G platí: y (, : G(y) = P (Y y) = P (min{x; 2} y) = P (X y) = ; y (, 2) : G(y) = P (Y y) = P (min{x; 2} y) = P (X y) = = F (y) = 1 e y ; y 2, ) : P (Y y) = P (min{x; 2} y) = 1. Náhodná veličina Y má smíšené rozdělení a P (Y = 2) = P (X 2) = 1 F (2) = 1 (1 e 2 ) = e 2 =, 13533. Střední hodnotu Y vypočteme takto: E(Y ) = min{x; 2}f(x) dx = 2 xe x dx + 2. 2 e x dx = = [e x ( x 1)] 2 + 2.(1 F (2)) = 3e 2 + 1 + 2e 2 =, 86466. K výpočtu rozptylu použijeme vzorce D(X) = E(X 2 ) (E(X)) 2. Je 2 E(Y 2 ) = (min{x; 2}) 2 f(x)dx = x 2 e x dx + 4.P (X 2) = = [ e x ( x 2 2x 2) ] 2 + 4.(1 F (2)) = 1e 2 + 2 + 4e 2 = 1, 188. Potom je D(Y ) = E(Y 2 ) E(Y ) 2 = 2 6e 2 (1 e 2 ) 2 =, 47697. Pro směrodatnou odchylku dostaneme σ(y ) = D(Y ) =, 6963. 78
9.9. Definice: Charakteristická funkce Je-li X náhodná veličina, pak funkci ψ X reálné proměnné t, která je definována vztahem ψ X (t) = E(e jtx ), t R, nazýváme charakteristickou funkcí náhodné veličiny X. 9.1. Věta: Výpočet charakteristické funkce. Charakteristickou funkci náhodné veličiny vypočteme pomocí vzorce, který závisí na typu rozdělení. 1. Náhodná veličina X má diskrétní rozdělení s pravděpodobnostní funkcí p(x), pak je její charakteristická funkce rovna ψ X (t) = x R e jtx p(x), t R. 2. Náhodná veličina X má spojité rozdělení s hustotu f(x), pak je její charakteristická funkce rovna ψ X (t) = f(x)e jtx dx, t R. 3. Náhodná veličina X má smíšené rozdělení s distribuční funkcí F (x), pak je její charakteristická funkce rovna ψ X (t) = x R[F (x) F (x )]e jtx + F (x)e jtx dx, t R. 9.11. Příklad: Náhodná veličina X má diskrétní rozdělení (alternativní), kdy p() = P (X = ) = 1 p, p(1) = P (X = 1) = p, < p < 1. Řešení: Podle vzorce v 1 z odstavce 9.1. je ψ X (t) = p()e jt. + p(1)e jt.1 = 1 p + pe jt, t R. 79
9.12. Příklad: Náhodná veličina X má spojité rovnoměrné rozdělení v intervalu (, 1). Řešení: Hustota f náhodné veličiny X je rovna jedné v intervalu (, 1) a jinde je nulová. Potom podle vzorce v 2 z odstavce 9.1 je ψ X (t) = 1 e jtx dx = [ ] e jtx 1 jt = j(1 ejt ), t R, t. t 9.13. Příklad: Náhodná veličina X má rozdělení Exp(; δ). Řešení: Náhodná veličina má kladnou hustotu f(x) = 1 δ e x δ pro x >. Podle vzorce 2 z věty 9.1 je charakteristická funkce rovna ψ X (t) = 1 δ = e jtx e x δ dx = 1 δ 1 [ δ(jt 1 δ ) e x(jt 1 )] δ = 1 1 jδt. e x(jt 1 δ ) dx = 9.14. Věta: Vlastnosti charakteristické funkce. Pro charakteristickou funkci náhodné veličiny X platí: 1. Je ψ X () = 1, ψ X (t) 1, t R. 2. Funkce ψ X je spojitá v R. 3. Funkce ψ X má tolik derivací v nule, kolik má náhodná veličina momentů a je 4. Pro čísla α, β je ψ (k) X () = jk E(X k ), k =, 1, 2,.... ψ αx+β (t) = e jtβ ψ X (αt), t R. 5. Jsou-li náhodné veličiny X a Y nezávislé, pak je ψ X+Y (t) = ψ X (t).ψ Y (t), t R. Důkaz: Tvrzení 1 snadno vyplývá ze vzorců 1-3 z odstavce 9.1. Tvrzení 2 nebudeme odvozovat, jeho důkaz není obtížný, je pouze pracný. 8
Ke tvrzení 3 uvedeme jako příklad formální odvození vztahu pro spojité rozdělení. Je ψ X(t) = d dt a odtud po dosazení dostaneme ψ X() = j f(x)e jtx dx = xf(x) dx = je(x). f(x)jxe jtx dx Vzorec pro další momenty dostaneme opětovným derivováním. Poměrně snadno ověříme možnost záměny derivování a integrace. Tvrzení 4 snadno odvodíme z vlastností střední hodnoty. Je totiž ψ αx+β (t) = E(e jt(αx+β) ) = E(e jtβ e j(αt)x ) = e jtβ ψ X (αt). Tvrzení 5 vyplývá z vlastnosti pro střední hodnotu součinu nezávislých veličin. Je ψ X+Y (t) = E(e jt(x+y ) ) = E(e jtx e jty ) = E(e jtx )E(e jty ) = ψ X (t)ψ Y (t). 9.15. Příklad: Náhodné veličiny X i, 1 i n, jsou nezávislé a mají exponenciální rozdělení Exp(; δ). Určete charakteristickou funkci náhodné veličiny T = 2nX δ. Řešení: Podle příkladu 9.13. má každá z náhodných veličin X i charakteristickou funkci ψ(t) = 1 1 jδt. Potom podle tvrzení 5 z věty 9.14 má jejich součet X = n X i charakteristickou funkci i=1 ψ X = 1 (1 jδt) n. Potom podle tvrzení 4 z věty 9.14, kde volíme α = 2 δ, β = je ψ T (t) = ψ X( 2 δ t) = 1 (1 2jt) n. Poznámka: Charakteristická funkce ψ T je charakteristickou funkcí náhodné veličiny, která má rozdělení χ 2 (2n). Této skutečnosti se využívá při odhadech parametrů exponenciálního rozdělení. 81