Číselé charakteristiky áhodých veliči Motivace Doposud jsme pozali fukcioálí charakteristiky áhodých veliči (apř. distribučí fukce, pravděpodobostí fukce, hustota pravděpodobosti), které plě popisují pravděpodobostí chováí áhodé veličiy. Číselé charakteristiky vystihují pouze ěkteré rysy tohoto chováí, apř. popisují polohu realizací áhodé veličiy a číselé ose či jejich promělivost (variabilitu). Jsou jedodušší ež číselé charakteristiky, ale esou je částečou iformaci. Podobě jako v popisé statistice volíme vhodou číselou charakteristiku podle toho, jakého typu je daá áhodá veličia - zda je ordiálí ebo itervalová či poměrová. Číselé charakteristiky zaků mají své teoretické protějšky v číselých charakteristikách áhodých veliči. Číselé charakteristiky spojité áhodé veličiy aspoň ordiálího typu Charakteristika polohy : α-kvatil Nechť je spojitá áhodá veličia aspoň ordiálího typu s distribučí fukcí Φ() a hustotou pravděpodobosti φ(). Nechť α (0, ). Číslo K α (), které splňuje podmíku α = Φ(K α ()) = K () ( )d, se azývá α-kvatil áhodé veličiy. K 0,50 () - mediá, K 0,5 () - dolí kvartil, K 0,75 () - horí kvartil, K 0,0 (),..., K 0,90 () -. až 9. decil, K 0,0 (),..., K 0,99 () -. až 99. percetil. Kterýkoliv α-kvatil je charakteristikou polohy číselých realizací áhodé veličiy a číselé ose. Charakteristika variability: kvartilová odchylka q = K 0,75 () - K 0,5 ().
Ilustrace Ozačeí pro kvatily speciálích rozložeí ~ N(0, ) K α () = u α, ~ χ () K α () = χ α(), ~ t() K α () = t α (), ~ F(, ) K α () = F α (, ). Tyto kvatily ajdeme ve statistických tabulkách. Používáme vztahy: u α = - u -α, t α () = - t -α (), F α (, ) = F (, ).
Výzam kvatilu u 0,5 = -0,6745 Výzam kvatilu χ 0,95(8) = 5,5073
Výzam kvatilu t 0,90 (5) =,4759 7,3 8,8867 Výzam kvatilu F 0,05 (3,7) = 0, 5 F 0,95
Příklad: Nechť U ~ N(0, ). Pomocí systému STATISTICA ajděte mediá a horí a dolí kvartil. Prví možost: Použijeme Pravděpodobostí kalkulátor. Do okéka průměr apíšeme 0, do okéka Sm. Odch. apíšeme, do okéka p apíšeme pro mediá 0,5, pro dolí kvartil 0,5 a pro horí kvartil 0,75. V okéku se objeví 0 pro mediá, -0,67449 pro dolí kvartil a 0,67449 pro horí kvartil. Ilustrace pro horí kvartil: Šedá plocha pod grafem hustoty má velikost 0,75 a hodota distribučí fukce v bodě 0,67449 je 0,75 (začeo šrafovaě). Druhá možost: Otevřeme ový datový soubor o třech proměé a jedom případu. Do dlouhého jméa prví proměé apíšeme =VNormal(0,5;0;). Dostaeme 0. Do dlouhého jméa druhé proměé apíšeme =VNormal(0,5;0;). Dostaeme -0,67449. Do dlouhého jméa třetí proměé apíšeme =VNormal(0,75;0;). Dostaeme 0,67449.
Příklad: Nechť ~ N(3, 5). Pomocí systému STATISTICA ajděte dolí kvartil. Prví možost: Spustíme Pravděpodobostí kalkulátor, vybereme Rozděleí Normálí. Do okéka průměr apíšeme 3, do okéka Sm. Odch. apíšeme,36, do okéka p apíšeme 0,5 a v okéku se objeví,498. Druhá možost: Otevřeme ový datový soubor o jedé proměé a jedom případu. Do dlouhého jméa této proměé apíšeme =VNormal(0,5;3;sqrt(5)). Dostaeme,49795. Příklad: Pomocí systému STATISTICA určete χ 0,05(5). Prví možost: Spustíme Pravděpodobostí kalkulátor, vybereme Rozděleí Chi. Do okéka sv. apíšeme 5 a do okéka p apíšeme 0,05. V okéku Chi se objeví 3,97. Druhá možost: Otevřeme ový datový soubor o jedé proměé a jedom případu. Do dlouhého jméa této proměé apíšeme =VChi(0,05;5). Dostaeme 3,97.
Příklad: Pomocí systému STATISTICA určete t 0,99 (30) a t 0,05 (4). Prví možost: Spustíme Pravděpodobostí kalkulátor, vybereme Rozděleí t (Studetovo). Do okéka sv. apíšeme 5 (resp. 4) a do okéka p apíšeme 0,99 (resp. 0,05). V okéku t se objeví,4576 (resp. -,7630). Druhá možost: Otevřeme ový datový soubor o jedé proměé a jedom případu. Do dlouhého jméa této proměé apíšeme =VStudet(0,99;30) (resp. VStudet(0,05;4)). Dostaeme 3,97 (resp. -,763). Příklad: Pomocí systému STATISTICA určete F 0,975 (5, 0) a F 0,05 (, 0). Prví možost: Spustíme Pravděpodobostí kalkulátor, vybereme Rozděleí F (Fisherovo). Do okéka sv apíšeme 5 (resp. ), do okéka sv apíšeme 0 (resp. 0) a do okéka p apíšeme 0,975 (resp. 0,05). V okéku F se objeví 3,89056 (resp. 0,0556). Druhá možost: Otevřeme ový datový soubor o jedé proměé a dvou případech Do dlouhého jméa prví proměé apíšeme =VF(0,975;5;0), do dlouhého jméa druhé proměé apíšeme =VF(0,05;;0).Dostaeme 3,89 (resp. 0,0556).
Číselé charakteristiky diskrétích a spojitých áhodých veliči aspoň itervalového typu Charakteristika polohy: středí hodota E() číslo, které charakterizuje polohu realizací áhodé veličiy a číselé ose s přihlédutím k jejich pravděpodobostem. Diskrétí případ: áhodá veličia má pravděpodobostí fukci π(). Středí hodota E, pokud je suma vpravo koečá. Fyzikálí výzam: středí hodota je těžiště soustavy hmotých bodů, jejichž celková hmotost je a bod o souřadici má hmotost π(). Spojitý případ: áhodá veličia má hustotu pravděpodobosti φ(). Středí hodota E d, pokud je itegrál vpravo koečý. Fyzikálí výzam: středí hodota je těžiště hmoté přímky, jejíž celková hmotost je a hmota je a přímce rozprostřea podle předpisu φ (). Cetrovaá áhodá veličia: Y = - E(). (Pro áhodou veličiu Y platí: E(Y) = 0.)
Středí hodota trasformovaé áhodé veličiy Y = g() E Y g g d - Středí hodota trasformovaé áhodé veličiy Y = g(, ) E Y g g,,,, d d
Charakteristika variability: rozptyl D() - číslo, které charakterizuje promělivost realizací áhodé veličiy kolem její středí hodoty s přihlédutím k jejich pravděpodobostem. Defiičí vzorec: D E E (rozptyl je středí hodota kvadrátu cetrovaé áhodé veličiy). Výpočetí vzorec: D - D Směrodatá odchylka - d - E d E (rozptyl je středí hodota kvadrátu míus kvadrát středích hodot). D - vyjadřuje průměrou variabilitu realizací áhodé veličiy kolem její středí hodoty. E Stadardizovaá áhodá veličia: Z D (Pro áhodou veličiu Z platí: E(Z) = 0, D(Z) =.)
Příklad a výpočet středí hodoty a rozptylu diskrétí áhodé veličiy: Postupě se zkouší spolehlivost čtyř přístrojů. Další se zkouší je tehdy, když předchozí je spolehlivý. Každý z přístrojů vydrží zkoušku s pravděpodobostí 0,8. Náhodá veličia udává počet zkoušeých přístrojů. Vypočtěte středí hodotu a rozptyl áhodé veličiy. Řešeí: abývá hodot,, 3, 4 a její pravděpodobostí fukce je π() = P(=) = 0,, π() = P(=) = 0,8*0, = 0,6, π(3) = P(=3) = 0,64*0, = 0,8, π(4) = P(=4) = 0,5*0, + 0,64 = 0,5, π(0) = 0 jiak E() = *0, + *0,6 + 3*0,8 + 4*0,5 =,95 D() = *0, + *0,6 + 3 *0,8 + 4 *0,5,95 =,4697
Postup ve STATISTICE: Otevřeme ový datový soubor o dvou proměých a cetost a čtyřech případech. Do proměé apíšeme,, 3, 4, do proměé cetost apíšeme 00, 60, 8, 5. Statistiky Základí statistiky/tabulky Popisé statistiky OK zavedeme proměou vah cetost OK - Proměé OK Detailí výsledky - zaškrteme Průměr, Rozptyl Výpočet. Popisé statistiky (Tabulka) Proměá N platých Průměr Rozptyl 000,95000,4767 Rozptyl však musíme upravit, musíme ho přeásobit číslem 999/000. Do výstupí tabulky tedy přidáme za proměou Rozptyl ovou proměou a do jejího Dlouhého jméa apíšeme =v3*999/000 Popisé statistiky (Tabulka) Proměá N platých Průměr Rozptyl NProm 000,95000,4767,469696
Středí hodoty a rozptyly vybraých diskrétích a spojitých rozložeí ~ Dg(μ) E() = μ, D() = 0 ~ A( ) E() =, D() = (- ) ~ Bi(, ) E() =, D() = (- ) ~ Ge E, D M ~ Hg N,M, E, N ~ Po E, D ~ Rd G E, D a b E, D ~ Rs(a, b) E() = ~ E D, D() = M N b a M N N N ~ N(μ, σ ) E() = μ, D() = σ ~ E, D ~ t E 0 pro (pro středí hodota eeistuje), ~ F, E,,3,4 rozptyl eeistuje). pro 3 (pro, středí hodota eeistuje), D D pro 3 (pro, rozptyl eeistuje). 4 pro 5 (pro
Čebyševova erovost: Jestliže áhodá veličia má středí hodotu E() a rozptyl D(), pak t 0 : P E t D. t (Výzam: pokud ezáme rozložeí áhodé veličiy, ale záme její středí hodotu a rozptyl, pak můžeme odhadout pravděpodobost, s jakou se od své středí hodoty odchýlí o více ež t-ásobek své směrodaté odchylky.) Ilustrace:
Příklad: Nechť E() = μ, D() = σ. a) Odhaděte P 3. b) Jestliže ~ N(μ, σ ), vypočtěte P 3 Řešeí: ad a) P 3 0, 3 9.. (Teto výsledek je zám jako pravidlo 3σ a říká, že ejvýše,% realizací áhodé veličiy leží vě itervalu (μ - 3σ, μ + 3σ).) ad b) P 3 = P(-3σ μ 3σ) = P(-3 3) = Φ(3) + Φ(-3) = [ - Φ(3)] = = ( 0,99865) = 0,007. (Má-li áhodá veličia ormálí rozložeí, pak pouze 0,7% realizací leží vě itervalu (μ - 3σ, μ + 3σ).)
Charakteristika společé variability: kovariace C(, ) číslo, které charakterizuje variabilitu realizací dvou áhodých veliči, kolem jejich středích hodot s přihlédutím k pravděpodobostem těchto realizací. Defiičí vzorec: C, E E E (kovariace je středí hodota součiu cetrovaých áhodých veliči). C, E E E Výpočetí vzorec: středích hodot). (kovariace je středí hodota součiu míus souči C,,, - d d d d Výzam kovariace: Je-li kovariace kladá (záporá), pak to svědčí o eisteci jistého stupě přímé (epřímé) lieárí závislosti mezi realizacemi áhodých veliči,. Je-li kovariace ulová, pak říkáme, že áhodé veličiy, jsou ekorelovaé a zameá to, že mezi jejich realizacemi eí žádý lieárí vztah. Pozor z ekorelovaosti evyplývá stochastická ezávislost, zatímco ze stochastické ezávislosti plye ekorelovaost.
Charakteristika těsosti lieárího vztahu: koeficiet korelace R(, ) - číslo, které charakterizuje těsost lieárí závislosti realizací áhodých veliči,. Čím bližší je, tím těsější je přímá lieárí závislost, čím bližší je -, tím těsější je epřímá lieárí závislost. Defiičí vzorec: R, E E D E D pro kladé směrodaté odchylky, jiak klademe R(, ) = 0 (koeficiet korelace je středí hodota součiu stadardizovaých áhodých veliči). Výpočetí vzorec: odchylek). R, C, D D (koeficiet korelace je podíl kovariace a součiu směrodatých
Příklad a výpočet koeficietu korelace diskrétího áhodého vektoru: Náhodá veličia udává příjem mažela (v tisících dolarů) a áhodá veličia Y příjem maželky (v tisících dolarů. Je záma simultáí pravděpodobostí fukce π(,y) diskrétího áhodého vektoru (,Y): π(0,0) = 0,, π(0,0) = 0,04, π(0,30) = 0,0, π(0,40) = 0, π(0,0) = 0,, π(0,0) = 0,36, π(0,30) = 0,09, π(0,40) = 0, π(30,0) = 0, π(30,0) = 0,05, π(30,30) = 0,, π(30,40) = 0, π(40,0) = 0, π(40,0) = 0, π(40,30) = 0, π(40,40) = 0,05, π(,y) = 0 jiak. Vypočtěte koeficiet korelace příjmů mažela a maželky. Řešeí: Náhodá veličia i áhodá veličia Y abývají hodot 0, 0, 30, 40. Sestavíme kotigečí tabulku: Y 0 0 30 40. 0 0,0 0,04 0,0 0,00 0,5 0 0,0 0,36 0,09 0,00 0,55 30 0,00 0,05 0,0 0,00 0,5 40 0,00 0,00 0,00 0,05 0,05 y 0,30 0,45 0,0 0,05,00 Spočteme E() = 0.0,5+0.0,55+30.0,5+40.0,05 = 0, E(Y) = 0.0,30+0.0,45+30.0,0+40.0,05 = 0, D() = 0.0,5+0.0,55+30.0,5+40.0,05 0 = 60, D(Y) = 0.0,30+0.0,45+30.0,0+40.0,05 0 = 70, C(,Y) = 0.0.0,0 + 0.0.0,04 + 40.40.0,05 0.0 = 49, R(,Y) = 49/ 60 70 = 0,76.
Postup ve STATISTICE: Vytvoříme ový datový soubor o třech proměých, Y, cetost a 6 případech. Do proměé apíšeme 0, 0, 0, 0, 0, 0, 0, 0, 30, 30, 30, 30, 40,40 40, 40, do proměé Y 4 pod sebe 0, 0, 30, 40 a do proměé cetost 0, 4,, 0, 0, 36, 9, 0, 0, 5, 0, 0, 0, 0, 0, 5. Statistiky - Základí statistiky/tabulky zavedeme proměou vah cetost OK - Korelačí matice OK sezam proměých, Y OK. Korelace (Tabulka6) Oz ač. korelace jsou výzamé a hlad. p <,05000 N=00 (Celé případy v yecháy u ChD) Proměá Průměry Sm.odc h. Y Y 0,00000 7,784989,000000 0,756086 0,00000 8,408750 0,756086,000000
Vlastosti středí hodoty a) E(a) = a b) E(a + b) = a + be() c) E( E()) = 0 d) E i i = i E ( i ) e) Jsou-li áhodé veličiy,..., stochasticky ezávislé, pak E i Vlastosti kovariace a) C(a, ) = C(, a ) = C(a, a ) = 0 b) C(a + b, a + b ) = b b C(, ) c) C(, ) = D() d) C(, ) = C(, ) e) C(, ) = E( ) E( )E( ) f) C i m i, Y j = m j i j C ( i,yj) i = i E ( i )
Vlastosti rozptylu a) D(a) = 0 b) D(a + b) = b D() c) D() = E( ) - E () d) D i i i = D ( i ) ) i i ) C(i, j) i j i D ( (jsou-li áhodé veličiy,..., ekorelovaé, pak D i Vlastosti koeficietu korelace a) R(a, ) = R(, a ) = R(a, a ) = 0 b) R(a + b, a + b ) = sg(b b ) R(, ) c) R(, ) = pro D() 0, R(, ) = 0 jiak d) R(, ) = R(, ) e) R(, ) = C( D( 0 jiak ), ] D( pro ) D( ) D( ) 0 i = f) R(,) a rovost astae tehdy a je tehdy, když mezi veličiami, eistuje s pravděpodobostí úplá lieárí závislost, tj. eistují kostaty a, a tak, že P( = a + a ) =. (Uvedeá erovost se azývá Cauchyova Schwarzova Buňakovského erovost.)
Příklad a využití vlastostí číselých charakteristik: Náhodé veličiy, Y jsou áhodé chyby, které vzikají a vstupím zařízeí. Mají středí hodoty E() = -, E(Y) = 4 a rozptyly D() = 4, D(Y) = 9. Koeficiet korelace těchto chyb je R(,Y) = -0,5. Chyba a výstupu zařízeí souvisí s chybami a vstupu fukčí závislostí Z = 3 Y + Y - 3. Najděte středí hodotu chyby a výstupu. Řešeí: E(Z) = E(3 Y + Y 3) = 3E( ) E(Y) + E(Y ) E(3) = = 3{D() + [E()] } [C(,Y) + E()E(Y)] + D(Y) + [E(Y)] 3 = = 3[D() + [E()] ] [R(,Y) D () D(Y) + E()E(Y)] + D(Y) + [E(Y)] - 3 = 3(4 + 4) -[-0,5 3 + (-) 4] + 9 + 6 3 = 4 + + 5 3 = 68
Cetrálí limití věta: Jsou-li áhodé veličiy,, stochasticky ezávislé a všechy mají stejé rozložeí se středí hodotou μ a rozptylem σ, pak pro velká ( 30) lze rozložeí součtu i N,. i i i aproimovat ormálím rozložeím N(μ, σ ). Zkráceě píšeme i i Pokud součet i stadardizujeme, tj. vytvoříme áhodou veličiu U, pak rozložeí této áhodé veličiy lze aproimovat stadardizovaým ormálím rozložeím. Zkráceě píšeme U i N(0,) Normálí rozložeí je tedy rozložeím limitím, k ěmuž se blíží všecha rozložeí, proto hraje velmi důležitou roli v počtu pravděpodobosti a matematické statistice.
Ilustrace cetrálí limití věty: Uvažme stochasticky ezávislých áhodých veliči,,, přičemž každá z ich má rovoměré spojité rozložeí a itervalu (0,), tj. i ~ Rs(0,), i =,,. Protože E i a D i, podle cetrálí limití věty áhodá veličia U i i i i N 0,. Položíme-li =, pak U i 6 N 0,. i Při ilustraci působeí cetrálí limití věty a počítači postupujeme tak, že pro každou z veliči i ~ Rs(0,), i =,, vygeerujeme dostatečě velký počet realizací, apř. 000 a uložíme je do proměých v až v. Do proměé v 3 uložíme součet proměých v až v zmešeý o 6. Histogram kterékoliv proměé v až v se svým tvarem bude blížit obdélíku, zatímco histogram proměé v 3 se svým tvarem bude blížit Gaussově křivce.
Důsledkem cetrálí limití věty je Moivreova Laplaceova věta: Nechť,, jsou stochasticky ezávislé áhodé veličiy, všechy se řídí alterativím rozložeím A( součet i i ). Pak jejich Y má biomické rozložeí Bi(, ). Středí hodota veličiy Y je E(Y ) =, rozptyl je D(Y ) = (- ). Podle cetrálí limití věty se stadardizovaá áhodá veličia rozložeím N(0,). Y asymptoticky řídí stadardizovaým ormálím Aproimace se považuje za vyhovující, když jsou splěy podmíky: a (- ) 9. Na základě Moivreovy Laplaceovy věty se používá aproimativí vzorec, který složitý výpočet distribučí fukce biomického rozložeí ahrazuje jedoduchým hledáím v tabulkách hodot distribučí fukce stadardizovaého ormálího rozložeí. Máme áhodou veličiu Y ~ Bi(, ). Pak y y pravděpodobostí fukce P Y y pro y = 0,,,, y distribučí fukce Aproimativí vzorec: t 0 y y t t P Y y P Y t - složitý výpočet t 0 y P(Y y). ( ) t
Příklad a aplikaci Moivreovy Laplaceovy věty: 00 ezávisle a sobě hodíme hrací kostkou. Jaká je pravděpodobost, že šestka pade aspoň 0? Řešeí: Y 00 počet šestek ve 00 hodech, Y 00 ~ Bi(00, 6 ). Ověřeí podmíek dobré aproimace: a (- ) 9 0 6 00 0 a 00 6 Aproimativí výpočet: 0,66-6 0,73565 3,8 00 00 Y00 9 P Y 6 6 00 0 P Y00 9 P P U00 5 5 00 00 6 6 6 6 0,6435 9. 0,66 Přesý výpočet: P Y 00 0 P Y 00 9 t 9 0 00 t 6 t 5 6 00 t 0,975
Příklad a aplikaci Moivreovy Laplaceovy věty: Osobě prohlašující, že má proutkařské schoposti, předložíme 00 dvojic zakrytých ádob. V každé dvojici je jeda ádoba prázdá a druhá aplěá vodou. Výsledky proutkaře srováme s výsledky hypotetické osoby, která pracuje zcela áhodě. Nechť áhodá veličia Y 00 udává počet úspěšě idetifikovaých dvojic ádob. Jaká je pravděpodobost, že Y 00 překročí přirozeé číslo y, y = 0,,, 00? Řešeí: Je zřejmé, že Y 00 ~ P Y 00 y P Y 00 y Bi 00,. P Y 00 00 0,5 00 0,5 0,5 y = 50: P Y 00 50 0 0,5 0, 5 y = 55: P Y 00 55 0,8434 0, 5866 y = 60: P Y 00 60 0,9775 0, 075 y = 65: Y 65 3 0,99865 0, 0035 P 00 y 00 00 0,5 0,5 0,5 P Y 00 5 50 y 50 5 y 50 5 Ilustrace: závislost, P Y 00 y a y,0 0,8 0,6 p 0,4 0, 0,0-0, -0 0 0 40 60 80 00 0 y