2. Některá důležitá rozdělení Diskrétní rozdělení. Alternativní rozdělení Ap) Bernoulli) je diskrétní rozdělení, kdy náhodná veličina X nabývá pouze dvou hodnot a a pro její pravděpodobnostní funkci platí: p) = P X = ) = p, p) = P X = ) = p, < p <. EX) = p, αx) = DX) = p p), X) = p p), 2p p p, εx) = 6p p) p p) Rozptyl je maximální pro p =, 5, pak EX) =, 25 a X) =, 5. Rozdělení se používá v situacích, kdy má náhodný proces pouze dva možné výsledky ANO a NE. 2. Binomické rozdělení Bin,p) Binomial) je diskrétní rozdělení, kdy náhodná veličina X nabývá hodnot k =,, 2,..., n, s pravděpodobnostmi pk) = P X = k) = n p k p) n k, k =,, 2,..., n, < p <. k Je pak EX) = np, DX) = np p) a X) = np p). Pro šikmost a špičatost dostaneme αx) = 2p a εx) = 6p p) np p) np p). V případě symetrického rozdělení pro p = /2 je EX) = n/2, DX) = n/4, αx) = a εx) = 2/n. Pro n 3 a p, je možné binomické rozdělení Bin, p) nahradit Poissonovým rozdělením s parametrem λ = np. Jestliže mají náhodné veličiny X i, i n rozdělení Ap) a jsou nezávislé, má pak výběrový úhrn X = n X i binomické rozdělení Bin, p). i= 3. Poissonovo rozdělení Poλ) Poisson) je diskrétní rozdělení, kdy náhodná veličina X nabývá hodnot k =,, 2,... s pravděpodobnostmi pk) = P X = k) = λk k! e λ, k =,, 2,..., λ >. Jestliže mají náhodné veličiny X i, i n Poissonovo rozdělení P oλ) a jsou nezávislé, má pak výběrový úhrn X = n i= X i Poissonovo
rozdělení P onλ). Pro tuto vlastnost se Poissonovo rozdělení vyskytuje v problémech z hromadné obsluhy, kde doby mezi příchody zákazníků mají Poissonovo rozdělení Spojitá rozdělení 4. Rovnoměrné rozdělení v intervalu a, b) uniform) je rozdělení určené hustotou f s distribuční funkci F, kde fx) = b a, a < x < b,, jinde. F x) =, x < a, x a b a, a x b,, x > b. Toto rozdělení má náhodná veličina X, která nabývá hodnot z intervalu a, b) a všechny hodnoty mají stejnou pravděpodobnost výskytu. Bývá také charakterizováno svou střední hodnotou EX) = µ = 2 a + b) a hodnotou h = 2 b a). Je pak a = µ h, b = µ + h, h >. Rozptyl této náhodné veličiny je roven DX) = 3 h2. Pro kvantily x p tohoto rozdělení dostaneme F x p ) = 2h x µ + h) = p x p = µ + 2p )h. Je tedy x = x,5 = EX) = µ a x p + x p = 2µ. Na obrázku Obr. 4a je znázorněn průběh distribuční funkce F spojitého rovnoměrného rozdělení v intervalu, ) a na obrázku Obr. 4b je průběh hustoty f tohoto rozdělení. y F x) y fx) x x Obr. 4a Obr 4b 5. Normální Gaussovo) rozdělení. 5.. Definice: Normální Gaussovo) rozdělení Nµ, 2 ) normal) s parametry µ a > je rozdělení určené hustotou ) fx) = x µ) 2 e 2 2, x, ). 2
Rozdělení N; ) s parametry µ = a = se nazývá normované normální rozdělení. V dalším textu budeme náhodnou veličinu, která má rozdělení N; ) obvykle označovat písmenem U. Její hustota je pak ) ϕx) = e x2 2, x, ). Distribuční funkci rozdělení N; ), která je definovaná vztahem ) Φx) = x e t 2 budeme vždy označovat symbolem Φ. Graf hustoty ϕ normovaného normálního rozdělení N; ) znázorníme na obrázku Obr. 5. a graf distribuční funkce Φ je znázorněn na obrázku Obr. 5.2. ϕx) 2 dt Φx) 3 2 2 3 x 3 2 2 3 x Obr. 5.. Obr. 5.2. Poznámka: Normované normální rozdělení N; ) je symetrické, ϕx) = ϕ x). Je tedy EX) = a dále je DX) =. Odtud plyne, že pro distribuční funkci Φ platí: Φx) + Φ x) = Φ x) = Φx) a Φ) =, 5. Obecné normální rozdělení Nµ; 2 ) je posunuté o hodnotu µ, je tedy symetrické vzhledem k této hodnotě. Je tedy EX) = µ a dále je DX) = 2. Směrodatná odchylka X) =. Rozdělení je koncentrováno ke střední hodnotě. I když nabývá náhodná veličina s tímto rozdělením teoreticky všech reálných hodnot je P X µ < 3) =, 999 a P X µ < 3, 5) =, 9999. Poznámka: Normální rozdělení si zachovává svůj charakter při lineární transformaci. Platí totiž následující tvrzení. 3
5.2. Věta: Jestliže má náhodná veličina X rozdělení Nµ, 2 ), má pak náhodná veličina Y = αx + β rozdělení Nαµ + β, α 2 2 ). Speciálně platí, že náhodná veličina U = X µ má normované normální rozdělení N, ). Důkaz: Je-li X náhodná veličina, která má rozdělení Nµ, 2 ) a je-li f její hustota a F je její distribuční funkce, pak pro hustotu g a distribuční funkci G náhodné veličiny Y platí: Gy) = P Y y) = P αx + β y) = P αx y β) = = P X y β α ) = F y β α ) α > ), α <. P X y β α ) = F y β α Potom pro hustotu g rozdělení náhodné veličiny Y dostaneme: gy) = G y) = = d dy d dy F y β α e α )) = α fy β α ) F y β α )) = α fy β y β α µ)2 2 2 = α ) α y αµ+β)) 2 e 2α) 2. To je ovšem hustota normálního rozdělení Nαµ + β; α) 2 ). = α fy β α ) = Jestliže zvolíme α = a β = µ dostaneme αµ + β = a α =. Náhodná veličina U má tudíž normované normální rozdělení N; ). Poznámka: Transformace na normované rozdělení. Jestliže má náhodná veličina X normální rozdělení Nµ; 2 ), pak má náhodná veličina U = X µ X = U + µ normované normální rozdělení N; ). Pro její distribuční funkci F a hustotu f platí: a x µ F x) = Φ ) F u + µ) = Φu) fx) = ) x µ ϕ fu + µ) = ϕu). 4
Je tedy b µ P a < X < b) = F b) F a) = Φ ) a µ Φ kde hodnoty funkce Φ odečteme z tabulek hodnot distribuční funkce Φ. 5.3. Kvantily normálního rozdělení. Pro kvantily u p normovaného normálního rozdělení N; ) platí, že: Φu p ) = p, < p < u p = Φ p) a jejich hodnoty nalezneme v tabulkách kvantilů. Všimneme si, že platí: Pro kvantily x p u,5 = a u p = u p. obecného normálního rozdělení Nµ; 2 ) platí: xp µ F x p ) = p Φ Odtud plyne, že ) = p x p µ x = x,5 = ˆx = EX) = µ. ), = u p x p = u p + µ. Význam kvantilů si znázorníme na obrázku hustoty ϕ a distribuční funkce Φ normovaného normálního rozdělení. Obsah obrazce vyznačeného šrafováním je roven p. ϕx) p Φx), 5 3 2 u p 2 3 x 3 2 u p 2 3 x Obr. 5.3. Obr. 5.4. Výpočet distribuční a kvantilové funkce normálního rozdělení. I. Přímý výpočet hustota normovaného rozdělení N; ): ϕx) = e x2 2, x R; 5
pro rozdělení Nµ; 2 ) s parametry µ, je : fx) = ) x µ ϕ, x R; distribuční funkce normovaného rozdělení N; ): Φx) = x e t 2 2 dt, x R; pro rozdělení Nµ; 2 ) s parametry µ, je : ) x µ F x) = Φ, x R; kvantilovou funkci Q dostaneme jako řešení rovnice: kde Φu p ) = p, u p = Qp) x p = µ + u p, < p <. II. Pomocí aproximací distribuční funkce normovaného rozdělení: a) Φx) = + erf x ) ), x R, 2 2 kde erfx) = 2 x e t2 dt, x R. π b) pro x je: Φx). = ϕx) 5 k= a k w k, w = + a x, a =, 23 64 9, a =, 39 38 5, a 2 =, 356 563 8, a 3 =, 78 478, a 4 =, 82 256, a 5 =, 33 274 Pro x je Φx) = Φ x). Pro x 6 je Φx) = a pro x < 6 je Φx) =. Maximální chyba aproximace je menší než 6. kvantilová funkce Q: pro < p 2 je Qp) = Φ p) = u p. = w + 6 2 k= 3 k= a k w k b k w k,
kde w = 2 ln p, a = 2, 55 57, a =, 82 853, a 2 =, 328 b =, b =, 432 788, b 2 =, 89 269, b 3 =, 38 Pro 2 < p < je u p = u p. Přesnost aproximace je, 45 pro, 999 < p <, 999. Odvození: Φx) = Φ) + x = 2 + x/ 2 e t2 2 dt = t = z 2, dt = 2dz, x x/ 2 e z2 2dz = 2 + x/ 2 π V programu MAPLE withstats) : ϕx) = statevalf[pdf, normald]x); fx) = statevalf[pdf, normald[µ, ]]x); Φx) = statevalf[cdf, normald]x); F x) = statevalf[cdf, normald[µ, ]]x); u p = Φ p) = statevalf[icdf, normald]p); x p = F p) = statevalf[icdf, normald[µ, ]]p). = e z2 dz = 2 + 2 erfx/ 2). 5.4. Intervaly spolehlivosti. Ve statistice se setkáváme s úlohou, kdy potřebujeme k dané pravděpodobnosti určit interval, ve kterém se hodnota náhodné veličiny vyskytuje. Vyřešíme tuto úlohu pro normované normální rozdělení. Pro jiná rozdělení se princip řešení zachová, jenom hraniční hodnoty hledaného intervalu se určí z kvantilů odpovídajícího rozdělení. 5.5. Příklad: K danému číslu α, < α <, určete interval tak, aby pro náhodnou veličinu U, která má normované normální rozdělení N; ) platilo: a) ) P U < a) = α; b) ) P U < a) = α; c) ) P U > a) = α. Řešení: a) Z podmínky vyplývá α = P a < U < a) = Φa) Φ a) = Φa) Φa)) = 2Φa) Φa) = α 2. Odtud plyne, že a = u α kvantil. Je tedy 2 7
a < U < a u α < U < u 2 α. Viz obr. 5.5. 2 b) Obdobně jako v a) dostaneme α = P U < a) = Φa) a = u α. Je tedy U < a U < u α. Viz obr. 5.6. c) Z podmínky pro interval plyne α = P U > a) = Φa) Φa) = α a = u α. Je tedy U > a U > u α. Viz obr. 5.7. Poznámka: Číslo α volíme malé, obvykle < α, a číslo α se nazývá koeficient spolehlivosti konfidenční koeficient). Získaný interval nazýváme α) procentním intervalem spolehlivosti. Interval ) je oboustranný interval, intervaly ) a ) jsou jednostranné.první je pravostranný a druhý levostranný. Jsou to intervaly, ve kterých se hodnota náhodné veličiny bude vyskytovat s pravděpodobností α), tedy ve α)% případech. ϕx) ϕx) 3 2 u α 2 u α 2 3 x 3 2 2 Obr. 5.5. Obr. 5.6. ϕx) u α 2 3 x 3 2 u α 2 3 x Obr. 5.7. 5.6. Sčítání náhodných veličin. Důležitou vlastnost má normální rozdělení při sčítaní náhodných veličin. Pro nezávislé náhodné veličiny platí, že i po sčítaní mají normální rozdělení. Tvrzení se odvodí pomocí charakteristické funkce. Uvedeme tuto vlastnost ve formě věty. 8
5.7. Věta: Jsou-li X, resp. Y nezávislé náhodné veličiny s normálními rozděleními Nµ, 2 ), resp. Nµ 2, 2 2), pak má náhodná veličina X + Y normální rozdělení s parametry Nµ + µ 2, 2 + 2 2). 5.8. Náhodný výběr. Ve statistice zpracováváme data, která jsou souborem výsledků náhodného pokusu. Jeho náhodnost se projeví v tom, že při jeho opakování se objeví různé výsledky. Je-li charakter náhody popsán tím, že výsledky náhodného pokusu odpovídají hodnotám náhodné veličiny s daným rozdělením, pak soubor dat je realizací uspořádané n tice náhodných veličin {X, X 2,..., X n }. Všechny náhodné veličiny mají shodné rozdělení a jsou na sobě nezávislé. Takovou uspořádanou n tici náhodných veličin nazýváme prostým náhodným výběrem z daného rozdělení. Z vět 8.6 a 8.2 vyplývá toto tvrzení. 5.9. Věta: Jestliže mají nezávislé náhodné veličiny X i, i n normální rozdělení Nµ, 2 ) náhodný výběr z normálního rozdělení), má pak výběrový úhrn X = n X i normální rozdělení Nnµ, n 2 ) i= a výběrový průměr X = n n X i normální rozdělení Nµ, 2 i= n ). Poznámka: O náhodné veličině, která je funkcí náhodného výběru mluvíme jako o statistice. Častou úlohou je nalezení vhodné statistiky, z jejíchž hodnot můžeme odvodit vlastnosti sledovaného rozdělení. Z vlastností normálního rozdělení vidíme, že statistika X, výběrový průměr je dobrým odhadem střední hodnoty µ, neboť při dostatečně rozsáhlém výběru, velké hodnotě n, se bude hodnota X jen velmi málo lišit od střední hodnoty µ. 6. Exponenciální rozdělení ExpA, δ) exponential) je rozdělení náhodné veličiny s hustotou f a distribuční funkcí F, kde, x < A, fx) = x A δ e δ, x A;, x A, F x) = e x A δ, x A, kde A R a δ >. Je pak EX) = A + δ a DX) = δ 2. Pro kvantily dostaneme vyjádření x p = A δ ln p). Je-li A =, pak rozdělení označujeme symbolem Expδ) a je to rozdělení, které se objevuje v úlohách kde sledujeme spolehlivost práce zařízení v čase. Je to tzv. rozdělení bez paměti. Je totiž P X a + b X a) = P X b), a, b >. 9
Poznamenejme, že má-li náhodná veličina X exponenciální rozdělení ExpA; δ), pak má náhodná veličina X A rozdělení Exp; δ) a náhodná veličina Y = X A δ má rozdělení Exp; ), kterému se někdy říká normované exponenciální rozdělení. Podobně jako pro normální rozdělení se linearní transformací zachovává charakter exponenciálního rozdělení. Jestliže má náhodná veličina X rozdělení ExpA; δ), pak má náhodná veličina V = X A)/δ normované exponenciální rozdělení Exp; ). 7. Rozdělení chí kvadrát χ 2 n) o n stupních volnosti chi square) je rozdělení, které má náhodná veličina X = n i= U 2 i, kde U i, i n jsou nezávislé náhodné veličiny s normovaným normálním rozdělením N, ). Pro toto rozdělení je EX) = n a DX) = 2n. Hustota f tohoto rozdělení je dána předpisem, x, fx) = x n 2n Γ n 2 ) 2 e x 2, x >. Rozdělení je výrazně asymetrické, kvantily jsou kladné a jsou tabelovány. Až pro výrazně veliké hodnoty parametru n je možné toto rozdělení nahradit rozdělením normálním Nn, 2n). Pro velké hodnoty n má náhodná veličina U = X n 2n přibližně normované normální rozdělení N, ). Pro kvantily pak platí přibližný vzorec x. p = n + up 2n. Průběh hustoty rozdělení pravděpodobnosti je pro hodnoty parametru n = 3 a n = 5 znázorněn na obrázku Obr. 7.. n > 3 y n = 3 n < 5 n = 5 3 2 2 3 x x Obr.8.. Obr. 7.. 2
8. Studentovo rozdělení t- rozdělení) tn) o n stupních volnosti students) má náhodná veličina T = U n Z, kde náhodná veličina U má normované normální rozdělení N, ) a náhodná veličina Z má rozdělení χ 2 n). Rozdělení je symetrické vzhledem k počátku, je ET ) =, DT ) = n n 2, n > 2 a pro hodnoty n > 3 jej nahrazujeme normovanýn normálním rozdělením N, ). Pro kvantily platí t p = t p. Hustota f Studentova rozdělení je dána vzorcem fx) = Γn+ 2 ) Γ n 2 ) πn + x2 n n+ 2, x R. Průběh hustoty pro některé hodnoty stupňů volnosti je znázorněn na obrázku 8.. 9. Fischerovo-Snedecorovo rozdělení F rozdělení) F m,n o m a n stupních volnosti ratio) má náhodná veličina F = Xn Y m, kde náhodná veličina X má rozdělení χ 2 m) a náhodná veličina Y má rozdělení χ 2 n). Náhodná veličina F nabývá pouze kladných hodnot a je EF ) = n n 2, n > 2 a DF ) = 2n2 n + m 2), n > 4. Hustota f mn 2) 2 n 4) náhodné veličiny F je dána vzorcem fx) = ) m m 2 B m 2, n 2 ) n x m 2 + m ) m+n n x 2, x >. Poznamenejme, že pokud má náhodná veličina F rozdělení F m, n), pak má náhodná veličina F rozdělení F n, m). Tato skutečnost plyne bezprostředně, z definice F rozdělení a jejím důsledkem je následující vlastnost kvantilů: Pro kvantily F p m, n) rozdělení F m, n) platí, že F p m, n) = F p n, m), < p <. 2
p kvantil F p podmínkou Odtud plyne, že náhodné veličiny s rozdělením F m, n) je totiž určen P F m, n) F p ) = p P P Y m = P F p Xn ) Xn Y m F p = p. Y m Xn = p F p P Y m Xn = P F n, m) = p, F p F p což je podmínka pro pkvantil náhodné veličiny s rozdělením F n, m). Je tedy F p n, m) = F p m,n). Pro modus ˆx náhodné veličiny s rozdělením F m, n) platí vyjádření nm 2) ˆx = mn + 2), m > 2.. Beta rozdělení Bp, q), p, q > beta) je spojité rozdělení určené hustotou fx) = Bp, q) xp x) q, x, ). Náhodná veličina X s tímto rozdělením má střední hodnotu EX) = p p+q pq a rozptyl DX) =. Pro p, q > je rozdělení jednomodální a p+q) 2 p p+q+) p+q 2 pro jeho modus je ˆx =. Pro tuto vlastnost se používá v ekonomických modelech. Takové rozdělení mají souřadnice a rozpětí uspořádaného výběru z rovnoměrného rozdělení. Lineární transformací Y = a + b a)x = µ h + 2hX dostaneme zobecněné rozdělení beta, které má hodnoty z intervalu a; b) = µ h; µ + h). Střední hodnotu a ostatní charakteristiky snadno odvodíme z předchozích. Poznámka. Funkce Γ a B jsou tzv. Eulerovy funkce a je: Γz) = x z e x dx pro z >, Bp, q) = xp x) q dx, p >, q >. Je Γ) = Γ2) =, Γn + ) = n! a Γz + ) = zγz), z > a Bp, q) = Γp)Γq) Γp + q). 22
Dále platí: Bp, q) = Bq, p), B, n) = Bn, ) = n Bp +, q) = p Bp, q + ). q m )!n )!, Bm, n) =. m + n )! Poznámka: Generování náhodné veličiny s danným rozdělením Nechť je funkce F : a, b) R, a < b, distribuční funkcí spojitého rozdělení. Platí tedy a) F je spojitá a rostoucí v intervalu a, b); b) F a+) =, F b ) =. Potom má funkce F funkci inverzní F, která zobrazuje interval, ) na interval a, b). Věta: Jestliže má náhodná veličina X rovnoměrné rozdělení v intervalu, ), pak má náhodná veličina Y = F X) rozdělení určené distribuční funkcí F. Je-li X, ), pak je Y = F X) a, b). Pro distribuční funkci G náhodné veličiny Y dostaneme: a < y < b : Gy) = P Y y) = P F X) y) = P X F y)) = HF y)), kde H je distribuční funkce rovnoměrného rozdělení v intervalu, ). ta je ovšem identitou, t.j. Hz) = z, < z <. Je tedy Gy) = F y), y a, b). Označme si nyní hodnotu náhodné veličiny X = p, < p <. Pak je Y = F X) = F p) Y = y, F y) = p Y = y p, kde y p je p kvantil rozdělení náhodné veličiny, které má rozdělení určené distribuční funkcí F. To znamená, že generujeme-li posloupnost náhodných čísel {p k } z intervalu, ), pak posloupnost kvantilů {x pk } je náhodná posloupnost z rozdělení s distribuční funkcí F. 23