Pravděpodobost a matematická statistika Mirko Navara Cetrum strojového vímáí katedra kyberetiky FEL ČVUT Karlovo áměstí, budova G, místost 104a http://cmp.felk.cvut.cz/ avara/stat 5. říja 018 Obsah 1 O čem to je? 3 1.1 Teorie pravděpodobosti....................................... 3 1. Statistika................................................. 3 Základí pojmy teorie pravděpodobosti 4.1 Náhodý pokus.............................................. 4. Laplaceova klasická defiice pravděpodobosti............................ 4..1 Základí pojmy.......................................... 4.. Náhodá veličia....................................... 5.3 Vlastosti pravděpodobosti...................................... 5.3.1 Úplý systém jevů........................................ 5.4 Problémy Laplaceovy defiice pravděpodobosti........................... 6.4.1 Rozšířeí Laplaceova modelu pravděpodobosti........................ 6.5 Kombiatorické pojmy a vzorce..................................... 6.6 Kolmogorovova defiice pravděpodobosti............................... 7.6.1 Borelova σ-algebra...................................... 8.6. Pravděpodobost =pravděpodobostí míra....................... 8 3 Nezávislost a podmíěá pravděpodobost 9 3.1 Nezávislé jevy............................................. 9 3. Podmíěá pravděpodobost...................................... 9 3..1 Podmíěá ezávislost...................................... 1 4 Náhodé veličiy 1 4.1 Náhodá veličia........................................... 1 4. Nezávislost áhodých veliči...................................... 14 4.3 Směs áhodých veliči......................................... 14 4.4 Druhy áhodých veliči......................................... 15 4.4.1 Diskrétí áhodé veličiy.................................... 15 4.4. Spojité áhodé veličiy..................................... 15 4.4.3 Smíšeé áhodé veličiy.................................... 16 4.4.4 Směsi áhodých veliči stejého typu............................. 18 4.5 Kvatilová fukce áhodé veličiy................................... 18 4.6 Jak reprezetovat áhodou veličiu v počítači............................ 19 4.7 Operace s áhodými veličiami.................................... 0 4.8 Jak realizovat áhodou veličiu a počítači.............................. 3 1
5 Charakteristiky áhodých veliči 3 5.1 Středí hodota.............................................. 3 5.1.1 Vlastosti středí hodoty................................... 4 5. Rozptyl disperze............................................ 4 5.3 Směrodatá odchylka........................................... 5 5.4 Obecé a cetrálí momety...................................... 5 5.5 Normovaá áhodá veličia..................................... 6 5.6 Základí typy diskrétích rozděleí................................... 6 5.6.1 Diracovo.............................................. 6 5.6. Rovoměré........................................... 6 5.6.3 Alterativí Beroulliovo................................... 6 5.6.4 Biomické Bim, q........................................ 7 5.6.5 Poissoovo Poλ......................................... 7 5.6.6 Geometrické........................................... 7 5.6.7 Hypergeometrické........................................ 7 5.7 Základí typy spojitých rozděleí.................................... 8 5.7.1 Rovoměré Ra, b....................................... 8 5.7. Normálí Gaussovo Nµ, σ................................. 8 5.7.3 Logaritmickoormálí LNµ, σ................................ 8 5.7.4 Expoeciálí Exτ....................................... 9 5.8 Čebyševova erovost.......................................... 9 6 Náhodé vektory 30 6.1 Diskrétí áhodý vektor....................................... 31 6. Spojitý áhodý vektor......................................... 3 6.3 Obecější áhodé veličiy....................................... 3 6.4 Číselé charakteristiky áhodého vektoru............................... 3 6.4.1 Vícerozměré ormálí rozděleí Nµ, Σ........................... 34 6.5 Reprezetace áhodých vektorů v počítači.............................. 34 7 Lieárí prostor áhodých veliči 34 7.1 Lieárí podprostor N áhodých veliči s ulovými středími hodotami.......... 35 7. Lieárí regrese.............................................. 35 8 Základí pojmy statistiky 36 8.1 K čemu potřebujeme statistiku..................................... 36 8. Náhodý výběr, odhad, empirické rozděleí.............................. 36 8.3 Odhad středí hodoty......................................... 37 8.4 Odhad k-tého obecého mometu.................................... 38 8.5 Odhad rozptylu.............................................. 38 8.5.1 Odhad rozptylu při zámé středí hodotě.......................... 38 8.5. Rozděleí χ s stupi volosti, χ............................ 39 8.5.3 Odhad rozptylu při ezámé středí hodotě........................ 40 8.5.4 Eficiece odhadů rozptylu pro ormálí rozděleí...................... 4 8.6 Odhad směrodaté odchylky...................................... 43 8.7 Histogram a popis empirického rozděleí................................ 43 8.8 Odhad mediáu.............................................. 44 8.9 Itervalové odhady............................................ 44 8.10 Itervalové odhady parametrů ormálího rozděleí Nµ, σ................... 44 8.10.1 Odhad středí hodoty při zámém rozptylu σ....................... 44 8.10. Odhad středí hodoty při ezámém rozptylu....................... 45 8.10.3 Studetovo t-rozděleí...................................... 45 8.10.4 Odhad středí hodoty při ezámém rozptylu...................... 46 8.10.5 Odhad rozptylu.......................................... 46 8.10.6 Itervalové odhady spojitých rozděleí, která ejsou ormálí................ 47 8.11 Obecé odhady parametrů........................................ 47 8.11.1 Metoda mometů......................................... 47 8.11. Metoda maximálí věrohodosti................................ 48
8.11.3 Příklady a odhady parametrů................................. 49 9 Testováí hypotéz 54 9.1 Základí pojmy a pricipy testováí hypotéz............................. 54 9. Testy středí hodoty ormálího rozděleí.............................. 57 9..1 Při zámém rozptylu σ.................................... 57 9.. Při ezámém rozptylu.................................... 57 9.3 Testy rozptylu ormálího rozděleí.................................. 57 9.4 Porováí dvou ormálích rozděleí.................................. 58 9.4.1 Testy rozptylu dvou ormálích rozděleí [Fisher]...................... 58 9.4. Testy středích hodot dvou ormálích rozděleí se stejým zámým rozptylem σ.. 59 9.4.3 Testy středích hodot dvou ormálích rozděleí s růzými zámými rozptyly σx, σ Y. 59 9.4.4 Testy středích hodot dvou ormálích rozděleí se stejým ezámým rozptylem σ. 60 9.5 Testy středích hodot dvou ormálích rozděleí - párový test.................. 60 9.6 Korelace, její odhad a testováí..................................... 61 9.6.1 Test ekorelovaosti dvou ormálích rozděleí....................... 6 9.7 χ -test dobré shody........................................... 6 9.7.1 Modifikace............................................ 63 9.7. χ -test ezávislosti dvou rozděleí............................... 63 9.7.3 χ -test dobré shody dvou rozděleí............................... 64 9.8 Neparametrické testy........................................... 64 9.8.1 Zamékový test......................................... 65 9.8. Wilcoxoův test jedovýběrový................................ 65 1 O čem to je? Motivačí příklad pojistka auta bez marže: 1A. Proti krádeži: je-li cea 1 000 000 Kč a riziko ukradeí během pojistého období 0.001 1 000 000 0.001 = 1 000 Kč 1B. Pro případ havárie: Pojem áhodé veličiy a TEORIE PRAVDĚPODOBNOSTI. Pravděpodobost krádeže auta, středí škoda při havárii, přesost odhadů? STATISTIKA 1.1 Teorie pravděpodobosti je ástroj pro účelé rozhodováí v systémech, kde budoucí pravdivost jevů závisí a okolostech, které zcela ezáme. Poskytuje model takových systémů a kvatifikaci výsledků. Pravděpodobostí popis chováí systému 1. Statistika je ástroj pro hledáí a ověřováí pravděpodobostího popisu reálých systémů a základě jejich pozorováí. Chováí systému pravděpodobostí popis Statistika poskytuje daleko víc: ástroj pro zkoumáí světa, pro hledáí a ověřováí závislostí, které ejsou zjevé. 3
Základí pojmy teorie pravděpodobosti.1 Náhodý pokus Takový, a který si můžeme vsadit. Tedy ikoli: Jak je pravděpodobé, že ve skriptech a str. 4 je chyba? Jak je pravděpodobé, že král... je živ? Jak je pravděpodobé, že zítra bude v meze dobrý oběd? Vhodá losovací zařízeí: Kostka, čtyřstě, dvaáctistě... Tužka, dlouhý hraol... Kolo štěstí. Ura s losy, které elze před vylosováím rozlišit.. Laplaceova klasická defiice pravděpodobosti Předpoklad: Náhodý pokus s m N růzými, po dvou eslučitelými výsledky, které jsou stejě možé. Jev, který astává právě při k z těchto výsledků, má pravděpodobost k/m. Ura s m losy, z ichž k vyhrává. 1. problém: Co to je stejě možé? Stejě pravděpodobé? defiice kruhem! Elemetárí jevy jsou všechy stejě možé výsledky losy. Možia všech elemetárích jevů: Ω ura Jev: A Ω možia vyhrávajících losů Úmluva. Jevy budeme ztotožňovat s příslušými možiami elemetárích jevů a používat pro ě možiové operace místo výrokových...1 Základí pojmy Jev jistý: Ω, 1 všechy losy vyhrávají Jev emožý:, 0 žádý los evyhrává Kojukce jevů ad : A B losy, které vyhrávají v obou tazích Disjukce jevů or : A B losy, které vyhrávají v aspoň jedom tahu Jev opačý k A: A = Ω \ A A B: A B Jevy eslučitelé: A 1,..., A : A i = i Jevy po dvou eslučitelé: A 1,..., A : i, j {1,..., }, i j : A i A j = 4
Jevové pole: všechy jevy pozorovatelé v áhodém pokusu, zde exp Ω =možia všech podmoži možiy Ω Pravděpodobost jevu A: kde. začí počet prvků možiy P A = A Ω,.. Náhodá veličia je libovolá fukce X : Ω R Středí hodota: EX = 1 Ω X ω ω Ω Příklad: Elemetárí jevy jsou možé výsledky hry, áhodá veličia je výše výhry. Středí hodota je spravedlivá cea za účast ve hře..3 Vlastosti pravděpodobosti P A 0, 1 P 0 = 0, P 1 = 1 P A = 1 P A A B P A P B A B P B \ A = P B P A A B = P A B = P A + P B aditivita P A B = P A + P B P A B.3.1 Úplý systém jevů tvoří jevy B i, i I, jestliže jsou po dvou eslučitelé a B i = 1. Speciálí případ pro jevy: {C, C} Je-li {B 1,..., B } úplý systém jevů, pak a pro libovolý jev A Speciálě: i I P B i = 1 i=1 P A = P A B i. i=1 P A = P A C + P A C. Motivačí příklad kolik je ekuřáků: Mužů je v populaci 48 %, kuřáků a kuřaček dohromady 30 %. Jakých hodot může abývat pravděpodobost, že áhodě vybraý člověk je muž a ekuřák? M... muž, P M = 0.48 K... kuřák, P K = 0.3, P K = 0.7 5
Hledaá pravděpodobost P M K jevu opačého k M K, max{p M, P K} = 0.5 P M K P M + P K = 0.5 + 0.3 = 0.8 1 0.8 = 0.18 P M K 1 0.5 = 0.48 Možé jsou všechy hodoty z itervalu 0.18, 0.48..4 Problémy Laplaceovy defiice pravděpodobosti. problém: Nedovoluje ekoečé možiy jevů, geometrickou pravděpodobost... Nelze mít ekoečě moho stejě pravděpodobých výsledků. Příklad: Podíl plochy peviy k povrchu Země je pravděpodobost, že áhodě vybraý bod a Zemi leží a peviě je-li výběr bodů provádě rovoměrě. Příklad: Kolo štěstí s estejými oblouky odpovídajícími růzým výsledkům. Příklad Buffoova úloha: Na likovaý papír hodíme jehlu, jejíž délka je rova vzdáleosti mezi likami. Jaká je pravděpodobost, že jehla prote ějakou liku? 3. problém: Nedovoluje iracioálí hodoty pravděpodobosti..4.1 Rozšířeí Laplaceova modelu pravděpodobosti Příklad: Místo hrací kostky házíme krabičkou od zápalek, jejíž stray jsou estejě dlouhé. Jaká je pravděpodobost možých výsledků? Připustíme, že elemetárí jevy emusí být stejě pravděpodobé. Ztrácíme ávod, jak vybrat správou pravděpodobost. Je to fukce, která jevům přiřazuje čísla z itervalu 0, 1 a splňuje jisté podmíky. Nemáme ávod, jak z ich vybrat tu pravou. To je role statistiky, která k daému opakovatelému pokusu hledá pravděpodobostí model..5 Kombiatorické pojmy a vzorce Dle [Zvára, Štěpá]. V urě je losů, postupě vytáheme k z ich. Permutace pořadí bez opakováí: Vytáheme všech losů bez vraceí, záleží a pořadí. Počet permutací je! = 1... 1, každá má pravděpodobost 1!. výběr s vraceím opakováím bez vraceí opakováí uspořádaý variace euspořádaý kombiace k 1 s pravděpodobostmi +k 1 k k! k! s pravděpodobostmi k!!! k! k! = k s pravděpodobostmi s růzými pravděpodobostmi k! k!! Z této tabulky pouze kombiace s opakováím ejsou všechy stejě pravděpodobé odpovídají růzému počtu variací s opakováím a edovolují proto použití Laplaceova modelu pravděpodobosti. Permutace pořadí bez opakováí jsou speciálí případ variací bez opakováí pro = k. Permutace s opakováím: Tvoříme posloupost délky k z hodot, přičemž j-tá hodota se opakuje k j -krát, k j = k. Počet růzých posloupostí je Speciálě pro = dostáváme k! k 1!... k!. k! k 1! k! = k! k 1! k k 1! = k, což je počet kombiací bez opakováí ovšem k 1 -prvkových z k prvků. k 1 6
4 10 100 1 000 10 000 počet 4-prvkových variací z prvků bez opakováí,! 4! 4 5 040 94 109 400 0.994 10 1 0.9994 10 16 počet 4-prvkových variací z prvků 56 10 000 10 8 10 1 10 16 s opakováím, 4 počet 4-prvkových kombiací z prvků 1 10 3 91 5 41 417 14 750 4. 164 10 14 bez opakováí, 4 počet 4-prvkových kombiací z prvků s opakováím, +3 4 35 715 4 41 75 41 917 15 50 4. 169 10 14 Věta. Pro daé k N a pro se poměr počtů variací resp. kombiací bez opakováí a s opakováím blíží jedé, tj.! lim k! k = 1, lim k +k 1 = 1. k Důkaz. počet čiitelů k je kostatí.! 1 k 1 = k! k k = = 1 1 1 1 k 1 1, k 1 k 1 +k 1 = + k 1 + 1 = k = 1 1 1 1 k 1 1 1 + k 1 1 + 1 1 Důsledek. Pro k je počet variací resp. kombiací s opakováím přibližě!. = k.= k, k! k k!. Jedodušší bývá uspořádaý výběr s vraceím ebo euspořádaý výběr bez vraceí..6 Kolmogorovova defiice pravděpodobosti Elemetárích jevy = všechy možé výsledky pokusu = prvky možiy Ω. Může jich být ekoečě moho, emusí být stejě pravděpodobé. Jevy jsou podmožiy možiy Ω, ale e utě všechy; tvoří podmožiu A exp Ω, která splňuje ásledující podmíky: A1 A. A A A A A. A3 N : A A N A A. Systém A podmoži ějaké možiy Ω, který splňuje podmíky A1-3, se azývá σ-algebra. Důsledky: Ω = A, N : A A N A = N A A. 7
Miisterský úředík: Volme A = exp Ω. Vede k ežádoucím problémům, apř. Baachův-Tarského paradox. A3 je uzavřeost a spočetá sjedoceí. Miisterský úředík: Volme uzavřeost a jakákoli sjedoceí. Ukazuje se jako příliš silý požadavek. Ižeýr: Volme uzavřeost a koečá sjedoceí. Nedovoluje apř. vyjádřit kruh jako sjedoceí obdélíků. A emusí ai obsahovat všechy jedobodové možiy, v tom případě elemetárí jevy emusí být jevy!.6.1 Borelova σ-algebra BR je ejmeší σ-algebra podmoži R, která obsahuje všechy itervaly. Obsahuje všechy itervaly otevřeé, uzavřeé i polouzavřeé, i jejich spočetá sjedoceí, a ěkteré další možiy, ale je meší ež exp R. Její prvky azýváme borelovské možiy..6. Pravděpodobost =pravděpodobostí míra je fukce P : A 0, 1, splňující podmíky P1 P 1 = 1, P P A = P A, pokud jsou možiy =jevy A, N, po dvou eslučitelé. spočetá N N aditivita Pravděpodobostí prostor je trojice Ω, A, P, kde Ω je eprázdá možia, A je σ-algebra podmoži možiy Ω a P : A 0, 1 je pravděpodobost. Dříve uvedeé vlastosti pravděpodobosti jsou důsledkem P1, P. Ižeýr: Spokojme se s koečou aditivitou. Problémem je apř. přechod od obsahu obdélíka k obsahu kruhu. Příklad ekoečá ruleta : Výsledkem může být libovolé přirozeé číslo, každé má pravděpodobost 0. Miisterský úředík: Požadujme úplou aditivitu pro jakékoli soubory po dvou eslučitelých jevů. Pak bychom epřipouštěli ai rovoměré rozděleí a itervalu. Pravděpodobost zachovává limity mootóích posloupostí jevů moži: Necht A N je posloupost jevů. A 1 A... P N A 1 A... P N A = lim P A, A = lim P A. Laplaceův model koečě moho jevů p-sti je racioálí P A = 0 A = 0 p-sti určey strukturou jevů Kolmogorovův model i ekoečě moho jevů p-sti i iracioálí možé jevy s ulovou p-stí p-sti eurčey strukturou jevů 8
Příklad Buffoova úloha řešeí: Na likovaý papír hodíme jehlu, jejíž délka je rova vzdáleosti mezi likami. Jaká je pravděpodobost, že jehla prote ějakou liku? π. = 0.6366197736758134307553505349005744. 3 Nezávislost a podmíěá pravděpodobost 3.1 Nezávislé jevy Motivace: Dva jevy spolu esouvisí. Defiice: P A B = P A P B. To je ovšem je áhražka, která říká mohem méě, ež jsme chtěli! Podobě P A B = 0 ezameá, že jevy A, B jsou eslučitelé. Pro ezávislé jevy A, B Důkaz: P A B = P A + P B P A P B. P A B = P A + P B P A P B = P A + P B P A P B. Jsou-li jevy A, B ezávislé, pak jsou ezávislé také jevy A, B a též dvojice jevů A, B a A, B. Důkaz: P A B = P A P A B = P A P A P B = = P A 1 P B = P A P B. Jevy A 1,..., A se azývají po dvou ezávislé, jestliže každé dva z ich jsou ezávislé. To je málo: Možia jevů M se azývá ezávislá, jestliže P pro všechy koečé podmožiy K M. 3. Podmíěá pravděpodobost A K A = P A A K Motivačí příklad alkohol za volatem: 90 % všech ehod způsobili střízliví řidiči. Alkoholik: Když se apiju, budu mít 9 meší riziko havárie. Statistik: To by byla pravda, kdyby opilých bylo stejě jako střízlivých. Ve skutečosti 99 % řidičů bylo střízlivých. Kolikrát se požitím alkoholu zvyšuje riziko ehody? Příklad: Pravděpodobosti výsledků teisového zápasu se podstatě změí po odehráí prvího setu. Máme pravděpodobostí popis systému. Dostaeme-li dodatečou iformaci, že astal jev B, můžeme aktualizovat aši zalost o pravděpodobosti libovolého jevu A. Te lze vyjádřit jako disjuktí sjedoceí A B A B, takže P A = P A B + P A B. Je-li P B 0 P B, můžeme rozásobit: P A = P B P A B P B }{{} P A B +P B P A B P B }{{} P A B. 9
Fukce P. B, P. B: A 0, 1, P A B = jsou pravděpodobosti a A, ebot splňují P1 P 1 B = P 1 B P B = P B P B = 1 a pro A, N, po dvou eslučitelé P A B B N P P A = = N P B = N P A B. P A B P B, P A B = P A B N = P B P A B P B P A B = P B N, Obdobě pro P. B. Nazývají se podmíěé pravděpodobosti. Je-li P A B defiováa, jsou jevy A, B ezávislé, právě když P A B = P A. Podmíěé pravděpodobosti avíc splňují B A P A B = 1, P A B = 0 P A B = 0, speciálě P B B = 1, P B B = 0. Obdobě pro P. B. Původí pravděpodobost P. jsme vyjádřili jako kovexí kombiaci pravděpodobostí P. B, P. B, odpovídajících situacím, kdy jev B astal, resp. eastal: P A = P B P A B + P B P A B. Tato podmíka spolu s P B B = 1 = P B B určuje pravděpodobosti P. B, P. B jedozačě. Pokud eí jeda z pravděpodobostí P B, P B ulová. Obecěji: Věta o úplé pravděpodobosti: Necht B i, i I, je spočetý úplý systém jevů a i I : P B i 0. Pak pro každý jev A platí P A = P B i P A B i. i I Důkaz: P A = P = i I j I B j A = P P B i A = i I j I B j A = P B i P A B i. Bayesova věta: Necht B i, i I, je spočetý úplý systém jevů a i I : P B i 0. Pak pro každý jev A splňující P A 0 platí P B i A = P B i P A B i P B j P A B j. j I Důkaz s využitím věty o úplé pravděpodobosti: P B i A = P B i A P A = P B i P A B i P B j P A B j. j I 10
Motivačí příklad test emoci řešeí: N... emocý, P... pozitiví test P N = 0.001, P N = 0.999 P P N = 0.9, P P N = 0.01 P P = P P N P N + P P N P N = 0.9 0.001 + 0.01 0.999 = 0.0009 + 0.00999 = 0.01089 P N P = = P P N P N P P N P N + P P N P N P P N P N = 0.0009. = 0.0864 P P 0.01089 Výzam: Pravděpodobosti P A B i odhademe z pokusů ebo z modelu, pomocí ich určíme pravděpodobosti P B i A, které slouží k optimálímu odhadu, který z jevů B i astal. Problém: Ke staoveí aposteriorí pravděpodobosti P B i A potřebujeme zát i apriorí pravděpodobost P B i. Příklad: Iformačí kaál B j... vyslá j-tý vstupí zak, j {1,..., m} A i... přijat i-tý výstupí zak, i {1,..., k} může být k m Lze odhadout podmíěé pravděpoděpodobosti P A i B j, že zak j bude přijat jako i. Z apriorích pravděpodobostí vysláí zaku j P B j můžeme maticovým ásobeím určit pravděpodobosti přijatých zaků: [ P A1 P A P A k ] = P A 1 B 1 P A B 1 P A k B 1 = [ P B 1 P B P B m ] P A 1 B P A B P A k B....... P A 1 B m P A B m P A k B m Všechy matice v tomto vzorci mají jedotkové součty řádků takové matice azýváme stochastické. Pokud byl přijat zak i, je podmíěé rozděleí pravděpodobosti vstupích zaků P B j A i = P A i B j P B j P A i Rozděleí pravděpodobostí vyslaých zaků je [ P B1 P B P B m ] = P A 1 B 1 P A B 1 P A k B 1 = [ P A 1 P A P A k ] P A 1 B P A B P A k B...... P A 1 B m P A B m P A k B m pokud k = m a příslušá iverzí matice existuje. Motivačí příklad alkohol za volatem řešeí: 90 % všech ehod způsobili střízliví řidiči. 99 % řidičů bylo střízlivých. Ozačme jevy A... požil alkohol, P A = 0.01, H... způsobil ehodu, P A H = 0.1. P H A P A 0.1 = P A H = P H A P A + P H A P A = P H A 0.01 = P H A 0.01 + P H A 0.99 = 1. 1 + P H A P H A 99. 1, 11
Požitím alkoholu se zvyšuje riziko ehody P H A P H A = 11. Kdyby bylo 50 % řidičů opilých, P A = 0.5, jejich podíl a haváriích by byl P A H = = P H A P A P H A P A + P H A P A = P H A 0.5 P H A 0.5 + P H A 0.5 = 1 1 + P H A P H A = 1 1 + 1 11 = 11 1. Neuvažovali jsme, že účastíků ehody bývá víc a přitomost alkoholu u jejích účastíků emusí být ezávislá. 3..1 Podmíěá ezávislost Náhodé jevy A, B jsou podmíěě ezávislé za podmíky C, jestliže Podobě defiujeme podmíěou ezávislost více jevů. 4 Náhodé veličiy P A B C = P A C P B C. Příklad: Auto v ceě 10 000 $ bude do roka ukradeo s pravděpodobostí 1 : 1 000. Adekvátí cea ročího pojistého bez zisku pojišt ovy je 10 000/1 000 = 10 $. Někdy teto jedoduchý postup selhává: Příklad: Pro staoveí havarijího pojištěí potřebujeme zát eje pravděpodobost havárie resp. počtu havárií za pojisté období, ale i průměrou škodu při jedé havárii, lépe pravděpodobostí rozděleí výše škody. Musíme studovat i áhodé pokusy, jejichž výsledky ejsou je dva jev astal/eastal, ale více hodot, vyjádřeých reálými čísly. 4.1 Náhodá veličia a pravděpodobostím prostoru Ω, A, P je měřitelá fukce X : Ω R, tj. taková, že pro každý iterval I platí X 1 I = {ω Ω Xω I} A. Je popsaá pravděpodobostmi P X I = P X I = P {ω Ω X ω I}, defiovaými pro libovolý iterval I a tedy i pro libovolé sjedoceí spočetě moha itervalů a pro libovolou borelovskou možiu. P X je pravděpodobostí míra a Borelově σ-algebře určující rozděleí áhodé veličiy X. K tomu, aby stačila zalost P X a itervalech, se potřebujeme omezit a tzv. perfektí míry; s jiými se v praxi esetkáme. Pravděpodobostí míra P X splňuje podmíky: P X R = 1, P X I = P X I, pokud jsou možiy I, N, po dvou disjuktí, N N P X = 0, P X R \ I = 1 P X I, I J P X I P X J, P X J \ I = P X J P X I. 1
Popisy áhodé veličiy prostor elemetárích jevů Ω R σ-algebra jevů A BR pravděpodobostí míra P P X pravděpodobostí prostor Ω, A, P R, BR, P X áhodá proměá X : Ω R, ω Xω id: R R, x x P X I P {ω Ω Xω I} P X I Příklad: Počet figurek Člověče ezlob se!, které vstupují do hry po jedom hodu kostkou. prostor elemetárích jevů Ω = {1,, 3, 4, 5, 6} R σ-algebra jevů A = exp Ω BR 1, 0, 1 I pravděpodobostí míra P A = A 5/6, 0 I, 1 / I P X I = 6 1/6, 0 / I, 1 I { 0, 0, 1 / I 1, ω = 6 áhodá proměá Xω = X : x x 0, jiak Úsporější reprezetace: omezíme se a itervaly tvaru I =, t, t R, P X, t = P X t = P X, t = F X t. F X : R 0, 1 je distribučí fukce áhodé veličiy X. Ta stačí, ebot Vlastosti distribučí fukce: eklesající, zprava spojitá, a, b =, b \, a, P X a, b = P a < X b = F X b F X a, a, = R \, a, P X b, = 1 F X b, {b} = b 1, b P X{a} = P X = a = lim FX b F X b 1 = lim b 1, b = F Xb lim F Xa, a b...... lim t F Xt = 0, lim F X t = 1. t Věta: Tyto podmíky jsou eje uté, ale i postačující. Příklad: Reálému číslu r odpovídá áhodá veličia začeá též r s Diracovým rozděleím v r: P r I = { 0 pro r / I, 1 pro r I, F r t = { 0 pro t < r, 1 pro t r. F r je posuutá Heavisideova fukce. Tvrzeí: X Y F X F Y. 13
4. Nezávislost áhodých veliči Náhodé veličiy X 1, X jsou ezávislé, pokud pro všechy itervaly I 1, I jsou jevy X 1 I 1, X I ezávislé, tj. P X 1 I 1, X I = P X 1 I 1 P X I. Stačí se omezit a itervaly tvaru, t, tj. P X 1 t 1, X t = P X 1 t 1 P X t pro všecha t 1, t R. Náhodé veličiy X 1,..., X jsou ezávislé, pokud pro libovolé itevaly I 1,..., I platí Ekvivaletě stačí požadovat P X 1 I 1,..., X I = P X 1 I 1... P X I = P X 1 t 1,..., X t = P X i t i i=1 P X i I i. pro všecha t 1,..., t R. Na rozdíl od defiice ezávislosti více ež jevů, zde eí třeba požadovat ezávislost pro libovolou podmožiu áhodých veliči X 1,..., X. Ta vyplývá z toho, že libovolou áhodou veličiu X i lze vyechat tak, že zvolíme příslušý iterval I i = R, resp. t i =. Pak P X i I i = 1 a v součiu se teto čiitel eprojeví. Spočetá ekoečá možia áhodých veliči je ezávislá, je-li každá její koečá podmožia ezávislá. Náhodé veličiy X 1,..., X jsou po dvou ezávislé, pokud každé dvě růzé z ich jsou ezávislé. To je slabší podmíka ež ezávislost veliči X 1,..., X. 4.3 Směs áhodých veliči Příklad: Náhodé veličiy V, U jsou výsledky studeta při odpovědích a dvě zkouškové otázky. Učitel áhodě vybere s pravděpodobostí c prví otázku, s pravděpodobostí 1 c druhou; podle odpovědi a vybraou otázku udělí zámku. Jaké rozděleí má výsledá zámka X? Matematický model vyžaduje vytvořeí odpovídajícího pravděpodobostího prostoru pro teto pokus. Necht V, resp. U je áhodá veličia a pravděpodobostím prostoru Ω 1, A 1, P 1, resp. Ω, A, P, přičemž Ω 1 Ω =. Necht c 0, 1. Defiujeme ový pravděpodobostí prostor Ω, A, P, kde Ω = Ω 1 Ω, A = {A 1 A A 1 A 1, A A }, P A 1 A = c P 1 A 1 + 1 c P A pro A 1 A 1, A A. Defiujeme fukci X : Ω R: { V ω pro ω Ω1, X ω = U ω pro ω Ω. X je áhodá veličia a Ω, A, P. X azýváme směs áhodých veliči V, U s koeficietem c agl. mixture, začíme Mix c V, U. Má pravděpodobostí míru P X = c P V + 1 c P U a distribučí fukci F X = c F V + 1 c F U. Podobě defiujeme obecěji směs áhodých veliči V 1,..., V s koeficiety c 1,..., c 0, 1, i=1 c i = 1, začíme Mix c1,..., c V 1,..., V = Mix c V 1,..., V, kde c = c 1,..., c. Má pravděpodobostí míru c i P Vi a distribučí fukci c i F Vi. Lze zobecit i a spočetě moho áhodých veliči. i=1 i=1 i=1 14
Podíl jedotlivých složek je urče vektorem koeficietů c = c 1,..., c. Jejich počet je stejý jako počet áhodých veliči ve směsi. Jelikož c = 1 1 c i, posledí koeficiet ěkdy vyecháváme. i=1 Speciálě pro dvě áhodé veličiy Mix c,1 c V, U = Mix c V, U kde c je číslo, ikoli vektor. Příklad: Směsí reálých čísel r 1,..., r s koeficiety c 1,..., c je áhodá veličia X = Mix c1,..., c r 1,..., r, P X I = P X I = i:r i I Lze ji popsat též pravděpodobostí fukcí p X : R 0, 1, c i, F X t = i:r i t { ci pro t = r i, p X t = P X {t} = P X = t = 0 jiak pokud jsou r 1,..., r avzájem růzá. Možo zobecit i a spočetě moho reálých čísel. 4.4 Druhy áhodých veliči 4.4.1 Diskrétí áhodé veličiy z předchozího příkladu Existuje spočetá možia O X, pro kterou P X R \ O X = P X / O X = 0. Nejmeší taková možia pokud existuje je Ω X = {t R : P X {t} 0} = {t R : P X = t 0}. c i. Diskrétí áhodou veličiu popisuje pravděpodobostí fukce p X t = P X {t} = P X = t. Splňuje p X t = 1. 4.4. Spojité áhodé veličiy Mají spojitou distribučí fukci. t R Náhodá veličia X je absolutě spojitá, jestliže existuje ezáporá fukce f X : R 0, hustota áhodé veličiy X taková, že F X t = t f X u du. 15
Hustota splňuje f X u du = 1. Neí určea jedozačě, ale dvě hustoty f X, g X téže áhodé veličiy splňují I f Xx g X x dx = 0 pro všechy itervaly I. Lze volit f X t = df X t dt, pokud derivace existuje. P X {t} = 0 pro všecha t. Některé spojité áhodé veličiy ejsou absolutě spojité; mají spojitou distribučí fukci, kterou elze vyjádřit jako itegrál. Tyto případy dále euvažujeme. 4.4.3 Smíšeé áhodé veličiy Motivačí příklad dešt ové srážky: Srážkový úhr v mm za 4 hodi má rozděleí s distribučí fukcí 1 1 t F X t = 3 exp, t 0, 100 0 jiak. Po /3 dí eprší. Směs předchozích dvou případů; Ω X, P X R \ Ω X = P X / Ω X 0. Nelze je popsat ai pravděpodobostí fukcí existuje, ale eurčuje celé rozděleí ai hustotou eexistuje, evychází koečá. 16
Každou áhodou veličiu se smíšeým rozděleím lze jedozačě vyjádřit ve tvaru X = Mix c V, U, kde V je spojitá, U je diskrétí a c 0, 1: Nespojitostí je spočetě moho, lze je očíslovat; -tá je v bodě r a má velikost c := F X r lim F Xt. t r Odpovídá jí složka směsi r s Diracovým rozděleím a váhou c. F X t = c F r t + Gt, G := F X c F r je spojitá eklesající fukce, lim Gt = 0, t lim t Gt = 1 c =: c, je distribučí fukce spojité áhodé veličiy V, F V := G c je diskrétí složka áhodé veličiy X, X = Mix c,c1,c,...v, r 1, r,..., U = 1 Mix c1,c,...r 1, r,..., c }{{} 1 c X = Mix c,1 c V, U. Motivačí příklad dešt ové srážky pokračováí: Srážkový úhr v mm za 4 hodi má rozděleí s distribučí fukcí 1 1 F X t = 3 exp t, t 0, 100 0 jiak. 17
Po /3 dí eprší, diskrétí složka je U = 0 s váhou c 1 := /3. Spojitá složka V má váhu c := 1/3, distribučí fukci 1 exp t, t 0, F V t = 100 0 jiak a hustotu expoeciálí rozděleí. 1 100 f V t = exp t, t 0, 100 0 jiak 4.4.4 Směsi áhodých veliči stejého typu X = Mix c,1 c V, U. Jsou-li V, U diskrétí, má X pravděpodobostí fukci p X = c p V + 1 c p U. Jsou-li V, U absolutě spojité, má X hustotu f X = c f V + 1 c f U. Obdobě pro směsi více áhodých veliči. 4.5 Kvatilová fukce áhodé veličiy Příklad. Pokud absolvet školy říká, že patří mezi 5 % ejlepších, pak tvrdí, že distribučí fukce prospěchu áhodě vybraého absolveta má u jeho prospěchu hodotu ejvýše 0.05.Předpokládáme, že lepšímu prospěchu odpovídá ižší průměr zámek. Neostrá erovost v defiici zameá, že hodota distribučí fukce udává podíl těch absolvetů, kteří měli lepší ebo stejý prospěch. Obráceě se lze ptát, jaký prospěch je potřeba k tomu, aby se absolvet dostal mezi 5 % ejlepších. 18
Pro α 0, 1 hledáme t R takové, že F X t = α. To emusí existovat, ale vždy existuje t, pro které tj. P X < t α P X t, lim F Xu α F X t, u t Všecha taková t tvoří omezeý iterval, z ěhož bereme obvykle střed, q X α = 1 sup {t R P X < t α} + if {t R α P X t}. Číslo q X α se azývá α-kvatil áhodé veličiy X a fukce q X : 0, 1 R je kvatilová fukce áhodé veličiy X. Speciálě q X 1 je mediá, další kvatily mají také svá jméa tercil, kvartil dolí q X 1 4, horí q X 3 4... decil... cetil eboli percetil... Vlastosti kvatilové fukce: eklesající, q X α = 1 lim q Xβ + lim q Xβ. β α β α+ Věta: Tyto podmíky jsou uté i postačující. Obráceý převod: F X t = if{α 0, 1 q X α > t} = sup{α 0, 1 q X α t}. Fukce F X, q X jsou avzájem iverzí tam, kde jsou spojité a rostoucí tyto podmíky stačí ověřit pro jedu z ich. 4.6 Jak reprezetovat áhodou veličiu v počítači 1. Diskrétí: Nabývá-li pouze koečého počtu hodot t k, k = 1,...,, stačí k reprezetaci tyto hodoty a jejich pravděpodobosti p X t k = P X {t k } = P X = t k, čímž je plě popsáa pravděpodobostí fukce čísly až a epřesost zobrazeí reálých čísel v počítači. Pokud diskrétí áhodá veličia abývá spočetě ekoečě moha hodot, musíme ěkteré vyechat, zejméa ty, které jsou málo pravděpodobé. Pro každé ε > 0 lze vybrat koečě moho hodot t k, k = 1,...,, tak, že P X R {t 1,..., t } = P X / {t 1,..., t } ε. Zbývá však problém, jakou hodotu přiřadit zbývajícím byt málo pravděpodobým případům.. Absolutě spojitá: Hustotu můžeme přibližě popsat hodotami ft k v dostatečě moha bodech t k, k = 1,...,, ale je za předpokladu, že je dostatečě hladká. Zajímají ás z í spíše itegrály typu F X t k+1 F X t k = tk+1 t k f X u du, z ichž lze přibližě zkostruovat distribučí fukci. Můžeme pro reprezetaci použít přímo hodoty distribučí fukce F X t k. Tam, kde je hustota velká, potřebujeme volit body hustě. 19
Můžeme volit body t k, k = 1,...,, tak, aby přírůstky F X t k+1 F X t k měly zvoleou velikost. Zvolíme tedy α k 0, 1, k = 1,...,, a k im ajdeme čísla t k = q X α k. Pamět ová áročost je velká, závisí a jemosti škály hodot áhodé veličiy, resp. její distribučí fukce. Často je rozděleí zámého typu a stačí doplit ěkolik parametrů, aby bylo plě určeo. Mohé obecější případy se sažíme vyjádřit alespoň jako směsi áhodých veliči s rozděleími zámého typu, abychom vystačili s koečě moha parametry. 3. Smíšeá: Jako u spojité áhodé veličiy. Teto popis je však pro diskrétí část zbytečě epřesý. Můžeme použít rozklad a diskrétí a spojitou část. 4.7 Operace s áhodými veličiami Zde I, J R jsou itervaly ebo spočetá sjedoceí itervalů. Přičteí kostaty r odpovídá posuutí ve směru vodorové osy: P X+r I + r = P X I, P X+r J = P X J r, F X+r t + r = F X t, F X+r u = F X u r, q X+r α = q X α + r. 0
Vyásobeí eulovou kostatou r odpovídá podobost ve směru vodorové osy: P rx ri = P X I, P rx J = P J X r. Pro distribučí fukci musíme rozlišit případy: r > 0: F rx rt = F X t, F rx u = F u X r, qrx α = r q X α, 1
r = 1: F X t = P X, t = P X t, = 1 P X, t, v bodech spojitosti distribučí fukce F X t = 1 P X, t = 1 P X < t = 1 P X t = 1 P X, t = 1 F X t, F X u = 1 F X u, v bodech espojitosti limita zprava středová symetrie grafu podle bodu 0, 1 s opravou a spojitost zprava, q X α = q X 1 α,
r < 0: kombiace předchozích případů. Zobrazeí spojitou rostoucí fukcí h: P hx hi = P X I, F hx ht = F X t, F hx u = F X h 1 u, q hx α = hq X α v bodech spojitosti kvatilové fukce. Zobrazeí eklesající fukcí h: F hx u = sup{f X t ht u}. Zobrazeí erostoucí fukcí h lze řešit jako zobrazeí áhodé veličiy X eklesající fukcí gt = h t. Součet áhodých veliči eí jedozačě urče, jediě za předpokladu ezávislosti. Ai pak eí vztah jedoduchý. Směs áhodých veliči viz výše. Na rozdíl od součtu je plě určea margiálími rozděleími vstupích áhodých veliči a koeficiety směsi. hmix c U, V = Mix c hu, hv je jedo, jestli jakoukoli fukci h aplikujeme před, ebo po vytvořeí směsi 4.8 Jak realizovat áhodou veličiu a počítači 1. Vytvoříme áhodý ebo pseudoáhodý geerátor áhodé veličiy X s rovoměrým rozděleím a 0, 1.. Náhodá veličia q Y X má stejé rozděleí jako Y. Stačí tedy a každou realizaci áhodé veličiy X aplikovat fukci q Y. Všecha rozděleí spojitých áhodých veliči jsou stejá až a elieárí změu měřítka. 5 Charakteristiky áhodých veliči 5.1 Středí hodota Motivačí příklad omezeí kouřeí: Chceme vyhodotit, zda zákaz kouřeí v restauracích vedl k celkovému omezeí kouřeí. Začeí: E. ebo µ. Může být defiováa zvlášt pro diskrétí áhodou veličiu U: EU = t p U t = t p U t, t R t Ω U spojitou áhodou veličiu V : EV = t f V t dt, směs áhodých veliči X = Mix c V, U: EX = c EV + 1 c EU. může být V diskrétí, U spojitá; toto eí liearita středí hodoty! Lze vyjít z defiice pro diskrétí áhodou veličiu a ostatí případy dostat jako limitu pro aproximaci jiých rozděleí diskrétím ebo aopak. Všechy tři případy pokrývá uiverzálí vzorec s použitím kvatilové fukce EX = 1 0 q X α dα. 3
Te lze avíc jedoduše zobecit a středí hodotu jakékoli fukce h áhodé veličiy: Speciálě pro diskrétí áhodou veličiu pro spojitou áhodou veličiu E hx = 1 0 E hu = E hv = h q X α dα. t Ω U h t p U t, ht f V t dt. Ale fukce spojité áhodé veličiy emusí být spojitá áhodá veličia. Středí hodota je vodorovou souřadicí těžiště grafu distribučí fukce, jsou-li jeho elemety vážey přírůstkem distribučí fukce: Pokud pracujeme se středí hodotou, automaticky předpokládáme, že existuje a je koečá což eí vždy splěo. 5.1.1 Vlastosti středí hodoty Er = r, speciálě EEX = EX, E X + Y = EX + EY, speciálě E X + r = EX + r, E X Y = EX EY, E r X = r EX, obecěji E r X + s Y = r EX + s EY. To je liearita středí hodoty. E Mix c V, U = c EV + 1 c EU. To eí liearita středí hodoty. Pouze pro ezávislé áhodé veličiy E X Y = EX EY. 5. Rozptyl disperze Motivačí příklad stejé podebí: Chceme ajít místo s podobým podebím. Průměrá teplota estačí. Důležité je i kolísáí teplot. Začeí: σ., D., var. DX = E X EX = E X EX, Vlastosti: E X = EX + DX. 1 1 DX = q X α EX dα. 0 4
DX 0, Dr = 0, D X + r = DX, D r X = r DX. Pouze pro ezávislé áhodé veličiy 5.3 Směrodatá odchylka D Mix c V, U = E Mix c V, U E Mix c V, U = c E V + 1 c E U c EV + 1 c EU = c DV + EV + 1 c DU + EU c EV + c 1 c EV EU + 1 c EU = c DV + 1 c DU + c 1 c EV c 1 c EV EU + c 1 c EU = c DV + 1 c DU + c 1 c EV EU. D X + Y = DX + DY, D X Y = DX + DY. Začeí: σ. Má stejý fyzikálí rozměr jako původí áhodá veličia rozptyl ikoli. σ X = DX = E X EX Vlastosti: σ X = 1 0 q X α EX dα. Pouze pro ezávislé áhodé veličiy 5.4 Obecé a cetrálí momety σ X 0, σ r = 0, σ X+r = σ X, σ r X = r σ X. σ X+Y = σ X Y = DX + DY = σ X + σ Y. k N k-tý obecý momet začeí ezavádíme: E X k, speciálě: pro k = 1: EX, pro k = : E X = EX + DX. Alterativí začeí: m k, µ k. k-tý cetrálí momet začeí ezavádíme: E X EX k, speciálě: pro k = 1: 0, pro k = : DX. Alterativí začeí: µ k. 5
Pomocí kvatilové fukce: E X k = E X EX k = 5.5 Normovaá áhodá veličia 1 0 1 0 q X α k dα. q X α EX k dα. je taková, která má ulovou středí hodotu a jedotkový rozptyl: pokud má vzorec smysl. Zpětá trasformace je orm X = X EX σ X X = EX + σ X orm X. Motivačí příklad biochemická vyšetřeí: Laboratorí výsledky vydají moho čísel; abychom pozali, která jsou obvyklá a která zepokojivá, museli bychom zát alespoň jejich středí hodoty a směrodaté odchylky. Po zormováí hed vidíme, které údaje zasluhují pozorost, aiž bychom museli studovat jejich typické hodoty. 5.6 Základí typy diskrétích rozděleí 5.6.1 Diracovo Jediý možý výsledek r R. p X r = 1, EX = r, DX = 0. Všecha diskrétí rozděleí jsou směsi Diracových rozděleí. 5.6. Rovoměré Je m možých výsledků stejě pravděpodobých. Speciálě pro obor hodot {1,,..., m} dostáváme 5.6.3 Alterativí Beroulliovo p X k = 1, m k {1,,..., m}, EX = m + 1, DX = 1 m + 1 m 1. 1 Jsou možé výsledky. Směs dvou Diracových rozděleí. Pokud výsledky jsou 0, 1, kde 1 má pravděpodobost q 0, 1, dostáváme p X 1 = q, p X 0 = 1 q, EX = q, DX = q 1 q. 6
5.6.4 Biomické Bim, q Počet úspěchů z m ezávislých pokusů, je-li v každém stejá pravděpodobost úspěchu q 0, 1. Součet m ezávislých alterativích rozděleí. p X k = m q k 1 q m k, k {0, 1,,..., m}, k EX = m q, DX = m q 1 q. Výpočetí složitost výpočtu p X k je Ok, celého rozděleí Om. 5.6.5 Poissoovo Poλ Limití případ biomického rozděleí pro m při kostatím m q = λ > 0 tedy q 0. p X k = λk k! e λ, k {0, 1,,...}. hodota 0 1 3 4 5 6 7 Bi30, 0.1 0.04 0.141 0.8 0.36 0.177 0.10 0.047 0.018 Bi100, 0.03 0.047 0.147 0.5 0.7 0.171 0.101 0.050 0.01 Po3 0.050 0.149 0.4 0.4 0.168 0.101 0.050 0.0 Pravděpodobostí fukce Poissoova rozděleí a biomických rozděleí se stejou středí hodotou 3 Jedotlivé pravděpodobosti se počítají sáze ež u biomického rozděleí ovšem všechy evypočítáme, protože jich je ekoečě moho. EX = λ, DX = λ. Středí hodota se rová rozptylu; jedá se vždy o bezrozměré celočíselé áhodé veličiy počet výskytů. Poissoovo rozděleí jako limití případ biomického q m = λ m : 5.6.6 Geometrické pxk = m k q k m 1 q m m k = m m 1... m k 1 λ = k! m = λk 1 1 1 1 k 1 1 λ k! m m m λk k! e λ. } {{ } 1 Pro m při kostatím m q m = λ, tj. k 1 λ m m k = k } {{ } 1 1 λ m m }{{} e λ Počet úspěchů do prvího eúspěchu, je-li v každém pokusu stejá pravděpodobost úspěchu q 0, 1. 5.6.7 Hypergeometrické p X k = q k 1 q, k {0, 1,,...}, EX = q 1 q, DX = q 1 q. Počet výskytů v m vzorcích, vybraých z M losů, v ichž je K výskytů 1 m K M. K M K k m k p X k = M, k {0, 1,,..., m}, m EX = m K M, DX = m K M K M m M M 1. 7
Výpočetí složitost výpočtu p X k je Om, celého rozděleí Om. Biomické rozděleí jako limití případ hypergeometrického Hypergeometrické rozděleí pro M při kostatím K M M KMk M KM m k p X k = M m = K k M k! M K M m k m k! M m m! m! k! m k! Kk M M k M K M m k M m k 5.7 Základí typy spojitých rozděleí 5.7.1 Rovoměré Ra, b f X t = F X u = 5.7. Normálí Gaussovo Nµ, σ A. Normovaé N0, 1: { 1 b a pro t a, b, 0 jiak, u a b a pro u a, b, 0 pro u < a, 1 pro u > b, q X α = a + b a α, EX = a + b Pro M m je M. M m m = m! = q, tj. M K M M = 1 q: =, DX = 1 1 b a. ϕt = f N0,1 t = 1 t exp π = m k q k 1 q m k. Distribučí fukce je trascedetí Gaussův itegrál Φ, u 1 t Φu = F N0,1 u = exp dt, π kvatilová fukce Φ 1 je iverzí k Φ. B. Obecé Nµ, σ : f Nµ,σ t = 1 t µ σ π exp σ, EX = µ, DX = σ. Věta.5. Součet dvou ezávislých veliči s ormálím rozděleím Nµ 1, σ 1, Nµ, σ má ormálí rozděleí Nµ 1 + µ, σ 1 + σ. 5.7.3 Logaritmickoormálí LNµ, σ je rozděleí áhodé veličiy X = expy, kde Y má Nµ, σ { 1 f X u = u σ exp l u µ π σ = f Nµ,σ l u u pro u > 0, 0 jiak, { FNµ,σ F X u = l u pro u > 0, 0 jiak, EX = exp µ + σ, DX = exp µ + σ exp σ 1. 8
5.7.4 Expoeciálí Exτ Např. rozděleí času do prví poruchy, jestliže podmíěá pravděpodobost poruchy za časový iterval t, t+δ závisí je a δ, ikoli a t: { 1 f X t = τ exp t τ pro t > 0, 0 jiak, { 1 exp u F X u = τ pro u > 0, 0 jiak, 5.8 Čebyševova erovost q X α = τ l 1 α, EX = τ, DX = τ, σ X = τ. Motivačí příklad 10 000 hodů micí: Při 10 000 hodech micí má počet líců X biomické rozděleí Bi10 000, 0.5 se středí hodotou EX = 5 000, směrodatou odchylkou σ X = 10 000 0.5 = 50. Jak malá je pravděpodobost, že se výsledek bude lišit od středí hodoty o ejméě 4σ X? Věta: 4 800 k=0 p Bi10 000,0.5 k + 10 000 k=5 00 p Bi10 000,0.5 k = 1 = 5 199 k=4 801 5 199 k=4 801 δ > 0 : P orm X δ 1 δ, 10 000 p Bi10 000,0.5 k k 0.5 10 000 k =... kde orm X = X EX σ X pokud má výraz smysl. Důkaz pomocí kvatilové fukce: 1 = D orm X = E orm X E orm X = }{{} 0 q orm X α dα, I 1 0 q orm X α dα kde I = {α 0, 1 : q orm X α δ} jsou itervaly o celkové délce P orm X δ, 1 q orm X α dα δ dα = δ P orm X δ. I I 9
Ekvivaletí tvary ε = δ σ X : δ > 0 : P orm X < δ 1 1 δ, X EX δ > 0 : P δ 1 δ, σ X ε > 0 : P X EX ε σ X ε ε > 0 : P X EX < ε 1 σ X ε = DX ε, = 1 DX ε. Motivačí příklad 10 000 hodů micí pokračováí: Jak malá je pravděpodobost odchylky od středí hodoty o více ež 4σ X? 1 4 = 1 16. Distribučí fukce absolutí hodoty ormovaého ormálího rozděleí N0, 1 červeě ve srováí s mezí dle Čebyševovy erovosti modře Distribučí fukce absolutí hodoty ormovaého spojitého rovoměrého rozděleí R 1 1 3, 3 červeě ve srováí s mezí dle Čebyševovy erovosti modře Distribučí fukce absolutí hodoty ormovaého biomického rozděleí orm Bi, 0.5 červeě ve srováí s mezí dle Čebyševovy erovosti modře 6 Náhodé vektory Náhodý vektor -rozměrá áhodá veličia a pravděpodobostím prostoru Ω, A, P je měřitelá fukce X : Ω R, tj. taková, že pro každý -rozměrý iterval I platí X 1 I = {ω Ω Xω I} A. 30
Lze psát X ω = X 1 ω,..., X ω, kde zobrazeí X k : Ω R, k = 1,...,, jsou áhodé veličiy. Náhodý vektor lze považovat za vektor áhodých veliči X = X 1,..., X. Je popsaý pravděpodobostmi kde I 1,..., I jsou itervaly v R. Z těch vyplývají pravděpodobosti P X I 1... I = P X 1 I 1,..., X I = = P {ω Ω X 1 ω I 1,..., X ω I }, P X I = P X I = P {ω Ω X ω I}, defiovaé pro libovolou borelovskou možiu I v R speciálě pro libovolé sjedoceí spočetě moha -rozměrých itervalů a určující rozděleí áhodého vektoru X. Úsporější reprezetace: Stačí itervaly tvaru I k =, t k, t k R, P X 1, t 1,..., X, t = P X 1 t 1,..., X t = = P X, t 1..., t = = F X t 1,..., t. F X : R 0, 1 je distribučí fukce áhodého vektoru X. Je eklesající ve všech proměých, zprava spojitá ve všech proměých, lim t 1,...,t F Xt 1,..., t = 1, k {1,..., } t 1,..., t k 1, t k+1,..., t : Věta: Tyto podmíky jsou uté, ikoli postačující. lim F Xt 1,..., t = 0. t k Nestačí zát margiálí rozděleí áhodých veliči X 1,..., X, ebot ta eobsahují iformace o závislosti. Podmíky ezávislosti pro složky áhodého vektoru jsou F X1,X t 1, t = F X1 t 1 F X t, obecěji F X t 1,..., t = F Xk t k. k=1 6.1 Diskrétí áhodý vektor má všechy složky diskrétí. Lze jej popsat též sdružeou pravděpodobostí fukcí p X : R 0, 1 p X t 1,..., t = P X 1 = t 1,..., X = t, která je eulová je ve spočetě moha bodech. Diskrétí áhodé veličiy X 1,..., X jsou ezávislé, právě když P X 1 = t 1,..., X = t = pro všecha t 1,..., t R. Ekvivaletí formulace: p X t 1,..., t = 31 P X i = t i i=1 p Xi t i. i=1
6. Spojitý áhodý vektor má všechy složky spojité. Lze jej popsat též sdružeou hustotou pravděpodobosti což je každá ezáporá fukce f X : R 0, taková, že F X t 1,..., t = t1 pro všecha t 1,..., t R. Pokud to jde, volíme f X t 1,..., t = t 1 t... Speciálě pro itervaly a i, b i dostáváme t... f X u 1,..., u du 1... du, t F X t 1,..., t = D 1 D... D F X t 1,..., t. P X 1 a 1, b 1,..., X a, b = P X a 1, b 1... a, b = b1 a 1... Spojité áhodé veličiy X 1,..., X jsou ezávislé, právě když pro skoro všecha t 1,..., t R. 6.3 Obecější áhodé veličiy f X t 1,..., t = b a f Xi t i. i=1 f X u 1,..., u du 1... du Komplexí áhodá veličia je áhodý vektor se dvěma složkami iterpretovaými jako reálá a imagiárí část. Někdy připouštíme i áhodé veličiy, jejichž hodoty jsou jié ež umerické. Mohou to být apř. áhodé možiy. Jidy abývají koečě moha hodot, kterým poecháme jejich přirozeé ozačeí, apř. rub, líc, káme, ůžky, papír apod. Na těchto hodotách emusí být defiovaá žádá aritmetika ai uspořádáí. Mohli bychom všechy hodoty očíslovat, ale eí žádý důvod, proč bychom to měli udělat právě určitým způsobem který by ovlivil ásledé umerické výpočty. Příklad: Číslováí politických stra ve volbách. 6.4 Číselé charakteristiky áhodého vektoru Středí hodota áhodého vektoru X = X 1,..., X : EX := EX 1,..., EX komplexí áhodé veličiy: X = RX + i IX: EX := ERX + i EIX eumerické áhodé veličiy: emá smysl Rozptyl áhodého vektoru X = X 1,..., X : DX := DX 1,..., DX Je-li U áhodá veličia, a, b R, pak a U + b má charakteristiky E a U + b = a EU + b, D a U + b = a DU. 3
Na rozdíl od jedorozměré áhodé veličiy, středí hodota a rozptyl áhodého vektoru edávají dostatečou iformaci pro výpočet rozptylu jeho lieárích fukcí. Proto zavádíme další charakteristiky. Např. E X + Y = EX + EY, D X + Y = E X + Y E X + Y = E X + Y + X Y EX + EY = E X + E Y + E X Y EX + EY + EX EY = E X EX + E Y EY + E X Y EX EY }{{}}{{}}{{} DX DY covx,y = DX + DY + covx, Y, kde covx, Y := E X Y EX EY je kovariace áhodých veliči X, Y, též ebot covx, Y = E X EX Y EY, E X EX Y EY = E X Y X EY Y EX + EX EY Pro existeci kovariace je postačující existece rozptylů DX, DY. Vlastosti kovariace: covx, X = DX, covy, X = covx, Y, cova X + b, c Y + d = a c covx, Y a, b, c, d R srovejte s vlastostmi rozptylu jako speciálího případu, speciálě covx, X = DX. Pro ezávislé áhodé veličiy X, Y je covx, Y = 0. = E X Y EX EY EX EY + EX EY. }{{} 0 Použitím kovariace pro ormovaé áhodé veličiy vyjde korelace: ϱx, Y = covorm X, orm Y = covx, Y σ X σ Y = E orm X orm Y předpokládáme, že směrodaté odchylky ve jmeovateli jsou eulové. Speciálě ϱx, X = 1. Vlastosti korelace: ϱx, X = 1, ϱx, X = 1, ϱx, Y 1, 1, ϱy, X = ϱx, Y, ϱax + b, cy + d = sig ac ϱx, Y a, b, c, d R, a 0 c až a zaméko ezáleží a prosté lieárí trasformaci. Důsledek: ϱax + b, X = sig a. Jsou-li áhodé veličiy X, Y ezávislé, je ϱx, Y = 0. Obráceá implikace však eplatíeí to postačující podmíka pro ezávislost. Náhodé veličiy X, Y splňující ϱx, Y = 0 azýváme ekorelovaé. Pro áhodý vektor X = X 1,..., X je defiováa kovariačí matice covx 1, X 1 covx 1, X covx 1, X covx, X 1 covx, X covx, X Σ X =...... covx, X 1 covx, X covx, X DX 1 covx 1, X covx 1, X covx 1, X DX covx, X =....... covx 1, X covx, X DX 33
Je symetrická pozitivě semidefiití, a diagoále má rozptyly. Podobě je defiováa korelačí matice 1 ϱx 1, X ϱx 1, X ϱx 1, X 1 ϱx, X ϱ X =....... ϱx 1, X ϱx, X 1 Je symetrická pozitivě semidefiití. 6.4.1 Vícerozměré ormálí rozděleí Nµ, Σ popisuje speciálí případ áhodého vektoru, jehož složky mají ormálí rozděleí a mohou být korelovaé. Má hustotu 1 f Nµ,Σ t := exp 1 t µ T t π µt, det T 1 kde t = t 1,..., t R, µ = µ 1,..., µ R, T R je matice, BÚNO symetrická. Parametry rozděleí: µ = µ 1,..., µ R je středí hodota áhodého vektoru, Σ := T 1 je kovariačí matice, speciálě její hlaví diagoála Σ 11, Σ,..., Σ R je rozptyl áhodého vektoru, margiálí rozděleí i-té složky je Nµ i, Σ ii ; pomocí těchto parametrů píšeme f Nµ,Σ t := 1 π det Σ exp 1 t µ Σ 1 t µ T. 6.5 Reprezetace áhodých vektorů v počítači Obdobá jako u áhodých veliči, avšak s rostoucí dimezí rychle roste pamět ová áročost. To by se estalo, kdyby áhodé veličiy byly ezávislé; pak by stačilo zát margiálí rozděleí. Proto velkou úsporu může přiést i podmíěá ezávislost. Pokud ajdeme úplý systém jevů, které zajišt ují podmíěou ezávislost dvou áhodých veliči, pak můžeme jejich rozděleí popsat jako směs rozděleí ezávislých áhodých veliči a tedy úsporěji. 7 Lieárí prostor áhodých veliči Ω, A, P pravděpodobostí prostor, L lieárí prostor všech áhodých veliči a Ω, A, P, tj. A-měřitelých fukcí Ω R, sčítáí áhodých veliči a jejich ásobeí reálým číslem = operace s fukcemi bod po bodu, L lieárí podprostor všech áhodých veliči z L, které mají rozptyl, : L L R, X Y := E X Y, je bilieárí =lieárí v obou argumetech a komutativí operace, skalárí souči pokud ztotožíme áhodé veličiy X, Y, pro které P X Y = 0; za prvky prostoru pak považujeme třídy ekvivalece místo jedotlivých áhodých veliči, X := X X = E X je orma, dx, Y := X Y = E X Y je metrika vzdáleost bez předchozího ztotožěí pouze pseudometrika, mohla by být ulová i pro X Y. 34
L lze rozložit a ortogoálí podprostory: R = jedodimezioálí prostor všech kostatích áhodých veliči tj. s Diracovým rozděleím, N = prostor všech áhodých veliči s ulovou středí hodotou. EX je kolmý průmět X do Rpokud ztotožňujeme toto reálé číslo s příslušou kostatí áhodou veličiou, jiak souřadice ve směru R, X EX je kolmý průmět X do N, orm X = X EX σ X je jedotkový vektor ve směru kolmého průmětu X do N, σ X = X EX je vzdáleost X od R. Z kolmosti vektorů X EX N, EX R a Pythagorovy věty plye 1 X X = X = X EX + EX, E X = DX + EX. 7.1 Lieárí podprostor N áhodých veliči s ulovými středími hodotami Speciálě pro áhodé veličiy z N : σ X = X X, σ X = X, covx, Y = X Y, ϱx, Y = covx, Y = X Y = cos X, Y. σ X σ Y X Y Důsledek: Náhodé veličiy X, Y s ulovými středími hodotami jsou ortogoálí, právě když jsou ekorelovaé. Obecě v L ϱx, Y je kosius úhlu průmětů X, Y do N, covx, Y = X Y EX EY je skalárí souči průmětů X, Y do N. POZOR! Neplet te ezávislost áhodých veliči s lieárí ezávislostí v lieárím prostoru, který tvoří! 7. Lieárí regrese Úloha: Je dá áhodý vektor X = X 1,..., X a áhodá veličia Y. Předpokládáme, že všechy áhodé veličiy jsou z L. Máme ajít takové koeficiety c 1,..., c, aby lieárí kombiace c i X i byla co ejlepší aproximací áhodé veličiy Y ve smyslu kritéria i k c k X k Y. Řešeí: K vektoru Y hledáme ejbližší bod v lieárím podprostoru, který je lieárím obalem vektorů X 1,..., X ; řešeím je kolmý průmět. Te je charakterizová tím, že vektor c i X i Y je kolmý a X j, i j = 1,...,, k c k X k Y X j = 0, c i X i X j = Y X j. i To je soustava lieárích rovic pro ezámé koeficiety c 1,..., c soustava ormálích rovic. Speciálě pro áhodé veličiy s ulovými středími hodotami: c i cov X i, X j = cov Y, X j, takže matice soustavy je kovariačí matice Σ X. i 35
8 Základí pojmy statistiky 8.1 K čemu potřebujeme statistiku Zkoumáí společých vlastostí velkého počtu obdobých jevů. Přitom ezkoumáme všechy, ale je vybraý vzorek kvůli ceě testů, jejich destruktivosti apod.. Odhady parametrů pravděpodobostího modelu Testováí hypotéz Potíže statistického výzkumu viz [Rogalewicz]. 8. Náhodý výběr, odhad, empirické rozděleí Soubor základí =populace výběrový Náhodý výběr jedoho prvku základího souboru s rovoměrým rozděleím a změřeí zkoumaé veličiy a tomto prvku určuje rozděleí áhodé veličiy. Opakovaým výběrem dostaeme áhodý vektor, jehož složky mají stejé rozděleí a jsou ezávislé. Takto vytvoříme výběrový soubor rozsahu, obvykle však vyloučíme víceásobý výběr stejého prvku výběr bez vraceí. Jeho rozděleí se může poěkud lišit od původího. Teto rozdíl se obvykle zaedbává, ebot 1. pro velký rozsah základího souboru to eí podstaté,. rozsah základího souboru ěkdy eí zám, 3. výpočty se začě zjedoduší. Přesost odhadu je dáa velikostí výběrového souboru, ikoli populace. Náhodý výběr X := X 1,..., X je vektor áhodých veliči, které jsou ezávislé a mají stejé rozděleí. Vyecháváme idexy, apř. F X místo F Xk. Provedeím pokusu dostaeme realizaci áhodého výběru, x := x 1,..., x R, kde je rozsah výběru. fukce fukčí hodota f : D R fx R, x R áhodá veličia realizace áhodé veličiy X : Ω R x := Xω R, ω Ω áhodý vektor/výběr realizace áhodého vektoru/výběru X = X 1,..., X : Ω R x = x 1,..., x := Xω R, ω Ω Realizace áhodého výběru může mít výzam tréovací možiy; ezámé parametry odhadujeme tak, aby a tréovací možiě byly optimálí. Popisuje ji empirické rozděleí: Vybereme j {1,..., } s rovoměrým rozděleím, výsledkem je x j. Je to diskrétí rozděleí, směs Diracových: Mix 1/,...,1/ x 1,..., x. Statistika je každá měřitelá fukce G, defiovaá a áhodém výběru libovolého dostatečého rozsahu. Počítá se z áhodých veliči výběru, ikoli z parametrů rozděleí. Měřitelá zameá, že pro každé t R je defiováa pravděpodobost P GX 1,..., X t = F GX1,...,X t. Statistika jako fukce áhodých veliči je rověž áhodá veličia. Obvykle se používá jako odhad parametrů rozděleí které ám zůstávají skryté. Začeí: ϑ... jakákoli hodota parametru reálé číslo, 36