12. N á h o d ý v ý b ě r Při sledováí a studiu vlastostí áhodých výsledků pozáme charakter rozděleí z toho, že opakovaý áhodý pokus ám dává za stejých podmíek růzé výsledky. Ty odpovídají hodotám jedotlivých realizací áhodé veličiy, která popisuje příslušý áhodý proces. Základím pojmem statistiky se tak stává pojem áhodého výběru, který je modelem popsaé situace. 12.1. Defiice: Náhodý výběr je uspořádaá -tice áhodý vektor) X 1, X 2,..., X ) áhodých veliči X i, 1 i, které jsou ezávislé a mají stejé rozděleí. Pozámka: Je-li F distribučí fukce popisující rozděleí áhodých veliči X i, pak sdružeá distribučí fukce áhodého výběru je rova F x 1 ).F x 2 )... F x ). Obdobě pro sdružeou hustotu či pravděpodobostí fukci dostaeme vyjádřeí ve tvaru fx 1 ).fx 2 )... fx ), resp. px 1 ).px 2 )... px ) je-li f hustota resp. p pravděpodobostí fukce áhodé veličiy X i. Studium vlastostí rozděleí obvykle provádíme pomocí vhodě zvoleé fukce áhodého výběru statistiky). Uvedeme ty, které ejčastěji používáme. 12.2. Defiice: Výběrový průměr, výběrový rozptyl. Je-li X 1, X 2,..., X ) áhodý výběr, pak ozačujeme a azýváme statistiku: X výběrovým úhrem; X 1 X i X i S 2 1 1 výběrovým průměrem; X i X) 2 výběrovým rozptylem; s 2 1 X i X) 2. Je-li Y 1, Y 2,..., Y ) áhodý výběr, pak azýváme statistiku S XY X i X)Y i Y ) výběrovým koeficietem korelace. Dále azýváme statistiku rx, Y ) S XY S X S Y výběrovým koeficietem korelace. Pozámka: Pro vyčísleí výběrových charakteristik používáme ěkdy jiého vyjádřeí. Je totiž 1)S 2 Xi X ) [ 2 Xi 2 2X i X + X ) 2 ] Je tedy Je také X 2 i 2X X i + X ) 2 X 2 i 2 X ) 2 + X ) 2 S 2 1 [ Xi 2 X ) ] 2 1 Xi 2 1 1 1 X 2 i X ) 2 ) 2 X i. 69
1)S XY X i X)Y i Y ) X i Y i XY X i Y + XY ) X i Y i ) XY. Pro uvedeé statistiky platí ěkolik tvrzeí, která si postupě uvedeme. 12.3.Věta: Vlastosti výběrového průměru. Nechť je X 1, X 2,..., X ) áhodý výběr s rozděleí, kde EX i ) µ a DX i ) 2, pak platí: EX) µ, E X) µ a DX) 2, D X) 2. Důkaz: Je totiž E X) E X i ) EX i ) µ µ. Odtud plye, že EX) E 1 X) 1 E X) µ. Jestliže využijeme ezávislosti áhodých veliči v áhodém výběru, pak dostaeme D X) D X i ) DX i ) 2. Odtud plye, že DX) D 1 X) 1 D X) 2. 2 12.4. Věta: Vlastosti výběrového rozptylu. Nechť je X 1, X 2,..., X ) áhodý výběr s rozděleí, kde EX i ) µ a DX i ) 2, pak platí: ES 2 ) 2, Es 2 ) 1 2 a DS 2 ) 1 EX4 i ) 3 1) 4, 3. Důkaz: Úpravou postupě dostaeme Xi X ) 2 [ Xi µ) X µ )] 2 [ X i µ) 2 2 X i µ) X µ ) + X µ ) 2 ] X i µ) 2 2 X µ ) X i µ) + X µ ) 2 X i µ) 2 2 X µ ) X µ ) + X µ ) 2 X i µ) 2 X µ ) 2 Odtud dostaeme, že E Xi X ) 2 ) E X i µ) 2) X ) ) 2 E µ 1) 2, když jsme použili postupě skutečosti EX i ) EX) µ, E X i µ) 2 ) DX i ) 2 a E X µ) 2) DX) 1 2. Je tedy ES 2 ) 2. Sado ahlédeme, že Es 2 ) E 1 S2) 1 2. 12.5. Pozámka: Další vlastosti základích statistik áhodého výběru vyplývají z cetrálí limití věty. Za uvedeých předpokladů vět 12.3 a 12.4 platí, že výběrový úhr X má v limitě ormálí rozděleí Nµ, 2 ) a výběrový průměr X má v limitě ormálí rozděleí Nµ, 2 ). Tyto skutečosti můžeme zapsat vztahy pro distribučí fukce. Je X lim P µ x 70 ) Φx), x R
a ) X µ lim P x Φx), x R, kde Φ je distribučí fukce ormovaého rozděleí N0, 1). Připomeňme, že v případě, že se jedá o áhodý výběr z ormálího rozděleí Nµ, 2 ), pak mají uvedeé statistiky ormálí rozděleí z uvedeými parametry. 12.6.Defiice: Uspořádaý áhodý výběr dostaeme jestliže seřadíme hodoty áhodého výběru X 1, X 2,..., X ) vzestupě podle velikosti. Dostaeme áhodý vektor X 1), X 2),..., X ) ), kde X i) X ki a {1, 2,..., } {k 1, k 1,..., k }. Je pak X 1) X 2)... X ). Speciálě je X 1) mi{x i ; 1 i } a X ) max{x i ; 1 i }. Náhodou veličiu ω X ) X 1) azývame variačí rozpětí áhodého výběru. Pro rozděleí jedotlivých souřadic uspořádaého áhodého výběru dostaeme ásledující vztahy. 12.7.Věta: Je-li F distribučí fukce rozděleí, ze kterého je provede áhodý výběr, pak má r tá souřadice X r) uspořádaého áhodého výběru X 1), X 2),..., X ) ) rozděleí s distribučí fukcí G r x) P X r) x) ir ) F i x) [1 F x)] i, x R. i Jestliže je X r) x, pak mezi hodotami X 1, X 2,..., X ) alezeme alespoň r meších ež je hodota x. Meších ež x jich bude právě i s pravděpodobostí ) F i x) [1 F x)] i. i Součet těchto pravděpodobostí pro r i určuje hodotu distribučí fukce áhodé veličiy X r). Speciálě pro prví a posledí souřadici dostaeme. 12.8. Věta: Náhodá veličia X 1) mi{x i ; 1 i } má rozděleí určeé distribučí fukcí G 1 x) 1 1 F x)), x R. Pro spojité rozděleí dostaeme její hustotu g 1 x) fx)1 F x)) 1, x R, kde f F je hustota původího rozděleí. Náhodá veličia X ) max{x i ; 1 i } má rozděleí určeé distribučí fukcí G x) F x), x R. V případě spojitého rozděleí je její hustota rova g x) fx)f 1 x), x R. 71
12.9. Příklad: Rovoměré rozděleí v itervalu µ h, µ + h). Pak je hustota f, resp. distribučí fukce F, v itervalu µ h, µ + h) dáa vzorci fx) 1 1, resp. F x) x µ + h). 2h 2h Dosazeím do uvedeých vzorců dostaeme: tedy g 1 x) 2h [ 1 1 2h x µ + h) ] 1 g 1 x) 2h) µ + h x) 1, µ h < x < µ + h; g x) 2h) x µ + h) 1, µ h < x < µ + h. Pro středí hodoty těchto áhodých veliči výpočtem dotaeme: EX 1) ) µ+h xµ + h x) 1 dx 2h) µ h x µ h t dx dt 0 2h) 1) 2h) 2h 1) 1 t + µ + h)t 1 dt 1) t + µ + h)t 1 ) dt 2h 2h) 0 [ ] 2h) +1 + µ + h) 2h) 2h + 1 + 1 + µ + h µ 1 + 1 h; EX ) ) µ+h xx µ + h) 1 x µ + h t dx 2h) µ h dx dt 2h 1) t + µ h)t 1 dt 2h t + µ h)t 1 ) dt 2h) 0 2h) 0 [ ] 2h) +1 + µ 2h) h)2h) 2h + 1 + 1 + µ h µ + 1 + 1 h. Pro výpočet rozptylu těchto áhodých veliči musíme ejdříve vyčíslit druhé obecé momety. Je EX 1) ) 2 ) µ+h x 2 µ + h x) 1 dx 2h) µ h 0 µ + h t) 2 t 1 dt) 2h) 2h 2h) [ t +2 2h) + 2 2h 0 µ + h x t dx dt t +1 2µ + h)t + µ + h) 2 t 1 ) dt ] 2h t+1 2µ + h) + 1 + µ + t h)2 4h2 2h 2µ + h) + 2 + 1 + µ + h)2. 0 72
Rozptyl áhodé veličiy vypočteme pomocí vzorce DX 1) ) EX 1) ) 2 ) EX 1) ) 2 4h2 2h 2µ+h) + 2 + 1 +µ+h)2 µ 1 )2 + 1 h µ 2 + 2µh + h 2 4µh + 1 4h2 + 1 + 4h2 + 2 µ2 + 2muh 1 + 1 2µh 1 2 + 1 + 1 ) + h 2 1 4 + 1 + 1 + 4 ) 1)2 + 2 + 1) 2 h2 1)2 + 2) 2 4h 2 + 1) 2 + 2). Obdobě dostaeme EX ) ) 2 ) µ+h x 2 x µ + h) 1 dx 2h) µ h x µ + h t dx dt 0 t + µ h) 2 t 1 dt 2h 2h) 2h 2h) 0 [ t +2 t+1 + 2µ h) 2h) + 2 + 1 + µ t h)2 t +1 + 2µ h)t + µ h) 2 t 1 ) dt ] 2h Rozptyl áhodé veličiy vypočteme pomocí vzorce 0 4h2 2h + 2µ h) + 2 + 1 + µ h)2. DX ) ) EX ) ) 2 ) EX ) ) 2 4h2 2h +2µ h) + 2 + 1 +µ h)2 µ + 1 )2 + 1 h µ 2 2µh + h 2 + 4µh + 1 4h2 + 1 + 4h2 + 2 µ2 2muh 1 1)2 h2 + 1 + 2) 2 2µh 1 + 2 + 1 1 ) + h 2 1 4 + 1 + 1 + 4 ) 1)2 + 2 + 1) 2 4h 2 + 1) 2 + 2). Jak jsme mohli očekávat rozptyly obou áhodých veliči jsou stejé a středí hodoty jsou symetrické vzhledem ke středí hodotě µ původího rozděleí. S rostoucím počtem prvků výběru dostáváme a lim EX 1)) lim µ h 1 + 1 µ h, lim EX )) lim µ + h 1 + 1 µ + h, lim DX 1)) lim DX ) ) lim h 2 4 + 1) 2 + 2 0. 73
12.10. Příklad: Expoeciálí rozděleí ExpA; ). Potom jsou hustota f, resp. distribučí fukce F, dáy vzorci fx) 1 Pro hustotu áhodé veličiy X 1) g 1 x) e x A, resp. F x) 1 e x A, x > A. x A e dostaeme Pro středí hodotu miima dostaeme EX 1) ) xe x A) dx [ A [ ] e x A 1 x A) e, x > A. x e x A) 2 2 e ] x A) K výpočtu rozptylu musíme ejdříve určit druhý obecý momet. Je [ x2 e x A) EX 1) ) 2 ) 2x2 2 A e x A) 23 3 e x 2 e x A) dx Rozptyl áhodé veličiy vypočteme pomocí vzorce DX 1) ) EX 1) ) 2 ) EX 1) ) 2 A 2 + 2A S rostoucím počtem prvků výběru dostáváme ] x A) A + 22 2 A A 2 + 2A A + A +. + 22 2. ) 2 2 2. a lim EX 1)) lim A + A lim DX 2 1)) lim 0. 2 Některá další rozděleí fukcí áhodého výběru. 12.11. Normálí Gaussovo) rozděleí Nµ, 2 ) s parametry µ a > 0 je rozděleí určeé hustotou fx) 1 x µ) 2 2π e 2 2, x, ). Rozděleí je symetrické vzhledem k hodotě µ. Je dále EX) µ, DX) 2 a tedy směrodatá odchylka X). Rozděleí je kocetrováo ke středí hodotě. I když abývá áhodá veličia s tímto rozděleím teoreticky všech reálých hodot je P X µ < 3) 0, 999 a P X µ < 3, 5) 0, 9999. 74
Průběh hustoty ϕ ormovaého ormálího rozděleí je zázorě a obrázku Obr. 12.1 a průběh hustoty f obecého ormálího rozděleí Nµ; 2 ) je zázorě a obrázku Obr. 12.2. 1 2π ϕx) 1 2π fx) 3 2 1 0 1 2 3 x µ 3 µ µ + 3 x Obr. 12.1. Obr. 12.2. Normálí rozděleí se zachovává při lieárí trasformaci. Jestliže má áhodá veličia X rozděleí Nµ, 2 ), má pak áhodá veličia αx + β ormálí rozděleí Nαµ + β, α 2 2 ). Speciálě platí, že áhodá veličia U X µ má rozděleí N0, 1), které se azývá ormovaé ormálí rozděleí. Náhodé veličiy, které mají ormovaé ormálí rozděleí budeme ozačovat písmeem U. Dále budeme ozačovat ϕ hustotu tohoto rozděleí a Φ distribučí fukci tohoto rozděleí. Je-li X áhodá veličia, která má rozděleí Nµ, 2 ) a je-li f její hustota a F je její distribučí fukce, pak Dále je ) x µ ϕx) f a ) x µ F x) Φ. ) ) b µ a µ P a < X < b) F b) F a) Φ Φ. Hodoty fukce Φ jsou tabelováy. Ze symetrie hustoty ϕ vzhledem k počátku plye, že Φx) + Φ x) 1, Φ0) 1 2. Pro kvatily u p ormovaého ormálího rozděleí platí, že u 0,5 0 a u 1 p u p. Tyto kvatily alezeme také v tabulkách a pro kvatily x p obecého ormálího rozděleí platí x p u p + µ a x x 0,5 µ ˆx EX). Důležitou vlastost má ormálí rozděleí při sčítaí áhodých veliči. Jsou-li X, resp. Y ezávislé áhodé veličiy s rozděleím Nµ 1, 2 1), resp. Nµ 2, 2 2), pak má áhodá veličia X + Y rozděleí ormálí Nµ 1 + µ 2, 2 1 + 2 2). Speciálě platí: Jestliže mají ezávislé áhodé veličiy X i, 1 i ormálí rozděleí Nµ, 2 ) áhodý výběr z ormálího rozděleí), má pak 75
výběrový úhr X X i rozděleí Nµ, 2 ) a výběrový průměr X 1 X i rozděleí Nµ, 2 ). 12.12. Expoeciálí rozděleí ExA, ) je rozděleí áhodé veličiy s hustotou f a distribučí fukcí F, kde 0, x < A, 0, x A, fx) x A 1 F x) e, x A; 1 e x A, x A, kde A R a > 0. Je pak EX) A + a DX) 2. Pro kvatily dostaeme vyjádřeí x p A l1 p). Je-li A 0, pak rozděleí ozačujeme symbolem Ex) a je to rozděleí, které se objevuje v úlohách kde sledujeme spolehlivost práce zařízeí v čase. Je to tzv. rozděleí bez paměti. Je totiž P X a + b X a) P X b), a, b > 0. 12.13. Rozděleí chí kvadrát χ 2 ) o stupích volosti je rozděleí, které má áhodá veličia X Ui 2, kde U i, 1 i jsou ezávislé áhodé veličiy s ormovaým ormálím rozděleím N0, 1). Pro toto rozděleí je EX) a DX) 2. Hustota f tohoto rozděleí je dáa předpisem 0, x 0, fx) 1 x 2 Γ 2 ) 2 1 e x 2, x > 0. Rozděleí je výrazě asymetrické, kvatily jsou kladé a jsou tabelováy. Až pro výrazě veliké hodoty parametru je možé toto rozděleí ahradit rozděleím ormálím N, 2). Pro velké hodoty má áhodá veličia U X 2 přibližě ormovaé ormálí rozděleí N0, 1). Pro kvatily pak platí přibližý vzorec x p. + up 2. Průběh hustoty rozděleí χ 2 ), pro dva stupě volosti je zázorě a obrázku Obr. 12.4. < 5 > 30 y 3 5 3 2 1 0 1 2 3 x x 76
Obr.12.3. Obr. 12.4. 12.14.Studetovo rozděleí t- rozděleí) t) o stupích volosti má áhodá veličia T U Z, kde áhodá veličia U má ormovaé ormálí rozděleí N0, 1) a áhodá veličia Z má rozděleí χ 2 ). Rozděleí je symetrické vzhledem k počátku, je ET ) 0, DT ), > 2 a pro hodoty > 30 jej ahrazujeme ormovaý ormálím 2 rozděleím N0, 1). Pro kvatily platí t p t 1 p. Hustota f Studetova rozděleí je dáa vzorcem fx) Γ +1 ) Γ 2 ) π 1 + x2 ) +1 2, x R. Průběh hustoty t rozděleí pro dvě hodoty stupňů volosti je zázorě a obrázku Obr. 12.3. 12.15. Fischerovo-Sedecorovo rozděleí F rozděleí) F m, o m a stupích volosti má áhodá veličia F X Y m, kde áhodá veličia X má rozděleí χ 2 m) a áhodá veličia y má rozděleí χ 2 ). Náhodá veličia F abývá pouze kladých hodot a je EF ), > 2 2 a DF ) 22 +m 2), > 4. Hustota f áhodé veličiy F je dáa vzorcem m 2) 2 4) fx) ) m 1 m 2 B m, ) 2 2 Pro kvatily F p m, ) rozděleí platí Je totiž kvatil F p Odtud plye, že F p m, ) x 2 1 1 + m ) m+ x 2, x > 0. 1 F 1 p, m), 0 < p < 1. áhodé veličiy F m, ) urče podmíkou P F m, ) F p ) p P ) X Y m F p p. 1 P Y m ) Y m 1 P F p X X 1 ) p F p Y m P X 1 ) ) P F, m) 1Fp 1 p, F p což je podmíka pro kvatil áhodé veličiy F, m). Je tedy F 1 p, m) 1 F pm,). 77