Alternativní rozdělení Alternativní rozdělení Alternativní rozdělení Alternativní rozdělení Náhodná veličina X má alternativní rozdělení s parametrem p, jestliže nabývá hodnot 0 a 1 s pravděpodobnostmi P[X = 1] = p a P[X = 0] = 1 p pro nějaé p (0, 1). Značíme X Alt(p). dva možné výsledy: 1 (úspěch) a 0 (neúspěch) alternativním rozdělením modelujeme indiátor náhodného jevu (úspěch/neúspěch) apod. parametr p často nazýváme pravděpodobnost úspěchu Platí: EX = p, var X = p(1 p). distribuční funce má soy v bodech 0 a 1 o veliostech 1 p a p, jina je onstantní Matematicá statistia Šára Hudecová 1/ 50 Matematicá statistia Šára Hudecová 2/ 50 Motivace: n nezávislých pousů, v aždém z nich nastane úspěch s pravděpodobností p zajímáme se o počet úspěchů (náhodná veličina) přílad: n hodů ostou, zajímá nás počet šeste, teré padly odvození rozdělení: počet úspěchů je celé číslo mezi 0 a n, pravděpodobnost, že zaznamenáme právě úspěchů je rovna ( ) n P[X = ] = p = p (1 p) n. Náhodná veličina X má binomicé rozdělení s parametry n 1 a p (0, 1), jestliže nabývá hodnot 0,..., n s pravděpodobnostmi ( ) n P[X = ] = p (1 p) n, = 0,..., n. Značíme X Bi(n, p). Poznáma: Platí n =0 P[X = ] = 1 (z binomicé věty). Matematicá statistia Šára Hudecová 3/ 50 Matematicá statistia Šára Hudecová 4/ 50
y Pravděpodobnosti binomicého rozdělení Platí Hustota EX = np var X = np(1 p) distribuční funce je po částech onstatní a má soy v bodech 0, 1,..., n, v bodě je so o veliosti ( ) n p (1 p) n f() 0 F(b)=P[X<b] b F() 0.6 0.8 1.0 Matematicá statistia Šára Hudecová 5/ 50 0 2 4 6 8 10 Matematicá statistia Šára Hudecová 6/ 50 Přílad Přílad řešení Přílad: Test obsahuje 10 otáze, e aždé z nich jsou uvedeny 4 možnosti: a, b, c, d. U aždé otázy je právě jedna odpověď správná. Předpoládejme, že student zašrtává odpovědi zcela náhodně. Označme X počet správně zodpovězených otáze. 1 Jaé rozdělení veličiny X? 2 Jaý je očeávaný počet správně zodpovězených otáze? 3 Na úspešné napsání testu je nutné správně zodpovědět alespoň 8 otáze. S jaou pravděpodobností se to studentovi povede? 4 Jaá je pravděpodobnost, že student zodpoví alespoň jednu otázu správně? 1. Pro {0, 1,..., n} máme P(X = ) = ( 10 ) ( 1 4 Tj. X má binomicé rozělení Bi(10, 1/4). 0 5 0.10 0.15 0 5 Bi(10,1/4) ) ( 1 1 4) n. 0 2 4 6 8 10 Matematicá statistia Šára Hudecová 7/ 50 Matematicá statistia Šára Hudecová 8/ 50
Přílad porač. 2. EX = 10 4 = 2.5. Očeáváme, že student zodpoví čtvrtinu všech otáze správně, tj. v průměru dvě a půl otázy. 3. P(X 8) = P(X = 8) + P(X = 9) + P(X = 10) = (po dosazení) = 004 4. P(X 1) = P(X = 1) + + P(X = 10) =... Lepší postup: P(X 1) = 1 P(X = 0) = 1 ( ) 3 10 = 0.9437 4 Matematicá statistia Šára Hudecová 9/ 50 Náhodná veličina X má s parametrem λ, jestliže nabývá hodnot 0, 1, 2,... s pravděpodobnostmi P[X = ] = λ! e λ, = 0, 1, 2,..., pro nějaé λ > 0. Značíme X Po(λ). Jeliož =0 musí platit =0 P[X = ] = 1. λ! = eλ, Matematicá statistia Šára Hudecová 10/ 50 Pravděpodobnosti Poissonova rozdělení Platí Použití: EX = λ, var X = λ. Poissonovým rozdělením modelujeme počty událostí olirát nastal určitý jev během jednotového časového intervalu, na jednotové ploše apod. parametr λ představuje intenzitu výsytu událostí přílady: počet autonehod na dálnici D1 za jeden den, počet srážových dnů v měsíci, počet vadných pielů na obrazovce, apod. počet částic emitovaných radioativní látou určité hmotnosti za jednotu času P[X=] P[X=] 0.3 0.1 0.3 0.1 Po(0.8) 0 5 10 15 20 Po(5) P[X=] P[X=] 0.3 0.1 0.3 0.1 Po(3) 0 5 10 15 20 Po(10) 0 5 10 15 20 0 5 10 15 20 Matematicá statistia Šára Hudecová 11/ 50 Matematicá statistia Šára Hudecová 12/ 50
Souvislost s binomicým rozdělením Vztah Bi(n, λ/n) a Po(λ) Porovnání pravděpodobností pro n = 50 a λ = 5 Bi(50,0.1) pro n velé lze Bi(n, λ n ) aproimovat pomocí Po(λ) neboli pro velé n a malé p lze Bi(n, p) aproimovat Po(np) přílad: počet nehod,... výhoda: numericý výpočet je snazší pro y1 0 5 0.10 0.15 0 5 10 15 20 Po(5) y2 0 5 0.10 0.15 Matematicá statistia Šára Hudecová 13/ 50 Matematicá statistia 0 5 10 15 20 Šára Hudecová 14/ 50 Rovnoměrné rozdělen Rovnoměrné rozdělení Rovnoměrné rozdělen Hustota rovnoměrného rozdělení Náhodná veličina X má rovnoměrné rozdělení na intervalu (a, b), jestliže její hustota je Značíme X R(a, b). f () = { 1 b a 0 jina. pro (a, b), f() 0.6 0.8 1.0 Hustota R(0,2) hodnoty pouze z intervalu (a, b) hustota je na tomto intervalu onstantní X nabývá všech hodnot rovnoměrně, resp. stejně pravděpodobně Matematicá statistia Šára Hudecová 15/ 50 0.5 0.5 1.0 1.5 2.0 2.5 platí f () d = 1 pravděpodobnost P[c < X < d] závisí pouze na délce intervalu (c, d) Matematicá statistia Šára Hudecová 16/ 50
Rovnoměrné rozdělen Rovnoměrné rozdělení Distribuční funce rovnoměrného rozdělení je F () = a pro (a, b), b a F () = 0 pro a a F () = 1 pro b. F() 0.6 0.8 1.0 Distr. funce R(0,2) 1 0 1 2 3 Matematicá statistia Šára Hudecová 17/ 50 Rovnoměrné rozdělen Charateristiy rovnoměrného rozdělení Střední hodnota Rozptyl EX = a + b 2 var X = (b a)2 12 Medián je stejný jao střední hodnota, tj. a+b 2 (plyne ze symetrie rozdělení) Kvantil na hladině α F (q α ) = q α a b a = α q α = α(b a) + a Matematicá statistia Šára Hudecová 18/ 50 Rovnoměrné rozdělen Přílady Příady využití modelování doby čeání na událost, terá nastává v pravidelných intervalech dély d např. čeání na příjezd autobusu (přicházíme-li v náhodný oamži) Matematicá statistia Šára Hudecová 19/ 50 Náhodná veličina X má normální rozdělení s parametry µ R a σ 2 > 0, jestliže má hustotu Značíme X N(µ, σ 2 ). f X () = 1 µ)2 ( e 2σ 2 pro R. 2πσ nejdůležitější rozdělení ve statistice může nabývat jaýcholiv reálných hodnot hustota je tzv. Gaussova řiva, je symetricá olem µ a má v tomto bodě maimum parametr σ ovlivňuje zploštělost hustoty Matematicá statistia Šára Hudecová 20/ 50
0.3 0.1 4 2 0 2 4 Hustota normálního rozdělení Hustota normálního rozdělení Hustoty N(0,1) a N(0,1/4) 0.8 0.6 N(0,1) N(0,1/4) f() f() 3 2 1 0 1 2 3 σ 2 Hustoty N( 1,1) a N(1,2) 0.3 N( 1,1) N(1,2) f() µ 0.1 4 2 0 2 4 Matematicá statistia Šára Hudecová 21/ 50 Matematicá statistia Šára Hudecová 22/ 50 Charateristiy Využití Střední hodnota EX = µ Rozptyl var X = σ 2 Distribuční funci je nutné počítat numericy. Medián je stejný jao střední hodnota, tj. µ (ze symetrie). výsledy eperimentálního měření, chyby měření rozdělení vantitativních znaů v populaci (výša, hmotnost, IQ) apod. má hezé teoreticé vlastnosti má výsadní postavení ve statistice, neboť průměry většího počtu veličin mají rozdělení blízé normálnímu (přesněji viz Centrální limitní věta, terá bude později). normální rozdělení je předpoladem řady statisticých metod Matematicá statistia Šára Hudecová 23/ 50 Matematicá statistia Šára Hudecová 24/ 50
Normované normální rozdělení Distribuční funce normálního rozdělení N(0, 1) (s nulovou střední hodnotou a jednotovým rozptylem) nazýváme normované. Jeho hustotu značíme ϕ, tj. ϕ() = 1 e 2 /2. 2π Distribuční funce N(0, 1) se značí Φ() a počítá se jao Φ() = ϕ(t) dt = 1 2π e t2 /2 dt. Nelze ji vyjádřit eplicitně, její hodnoty lze najít v tabulách. Matematicá statistia Šára Hudecová 25/ 50 Tabula: Hodnoty distribuční funce N(0, 1) 0 0.5 1 1.5 2 2.5 3 Φ() 0.5 0.691 0.841 0.933 0.977 0.994 0.999 Přičemž platí Φ( ) = 1 Φ(). Φ() 0.8 4 2 0 2 4 Matematicá statistia Šára Hudecová 26/ 50 Distribuční funce normálního rozdělení Distribuční funce normálního rozdělení Důležité vztahy: Distr. funce N(0,1) a N(0,1/4) Poud X N(0, 1), pa σx + µ N(µ, σ 2 ). Poud X N(µ, σ 2 ), pa X µ N(0, 1). σ Distribuční funci N(µ, σ 2 ) lze proto vyjádřit jao ( ) µ F () = Φ σ a proto platí ( ) ( ) b µ a µ P(a < X < b) = Φ Φ. σ σ F() F() 1.0 0.8 0.6 1.0 0.8 0.6 N(0,1) N(0,1/4) 3 2 1 0 1 2 3 N( 1,1) N(1,2) Distr. funce N( 1,1) a N(1,2) 4 2 0 2 4 Matematicá statistia Šára Hudecová 27/ 50 Matematicá statistia Šára Hudecová 28/ 50
Přílad Přílad: Obsah vápníu v revním séru (v mmol/l) se řídí normálním rozdělením N(2.30, 0.18 2 ) u zdravých lidí a rozdělením N(2.10, 0.18 2 ) u nemocných lidí. Diagnosticý test zjistí obsah revního séra v rvi a na záladě něj je člově diagnostiován jao nemocný nebo jao zdravý (nízé hodnoty signalizují nemoc), přičemž za hraniční hodnotu je bráno 2.15 mmol/l. (Pacienti označení jao nemocní jsou následně podrobeni detailnějším diagnosticým testům.) 1 Koli procent zdravých osob bude falešně označeno za nemocné? 2 Koli procent nemocných nebude odhaleno? z z 0.5 1.0 1.5 2.0 0.5 1.0 1.5 2.0 1.5 2.0 2.5 3.0 nemocni zdravi nemocni zdravi 1.5 2.0 2.5 3.0 Matematicá statistia Šára Hudecová 29/ 50 Matematicá statistia Šára Hudecová 30/ 50 Koli procent zdravých osob bude falešně označeno za nemocné? Vezmeme X N(2.30, 0.18 2 ). Zajímá nás 2.15 2.30 P(X < 2.15) = F (2.15) = Φ( ) = Φ( 0.833) 0.18 = 1 Φ(0.833) = (tabuly) = 02. Tedy asi 20% zdravých bude zbytečně podrobněji testováno. Koli procent nemocných nebude odhaleno? Vezmeme Y N(2.10, 0.18 2 ). Zajímá nás P(Y > 2.10) = 1 F (2.10) = 1 Φ( = (tabuly) = 0.391. 2.15 2.10 ) = 1 Φ(78) 0.18 Pravidlo dvou (tří) sigma Z tabelovaných hodnot Φ() plyne, že pro náhodnou veličinu X N(µ, σ 2 ) platí P[µ σ X µ + σ] 0.68 P[µ 2σ X µ + 2σ] 0.95 P[µ 3σ X µ + 3σ] 0.997 Náhodná veličina X tedy zřída padá dále než 2σ 3σ od středu µ její hustoty. Tedy téměř 40% nemocných nebude odhaleno. Matematicá statistia Šára Hudecová 31/ 50 Matematicá statistia Šára Hudecová 32/ 50
Ilustrace Přílad Přílad revní sérum: Obsah vápníu v rvi zdravých lidí je s pravděpodobností přibližně 95 % v intervalu (2.30 2 0.18, 2.30 + 2 0.18) = (1.94, 2.66) 95 % 2.5 % 2.5 % (v mmol/l) a pouze 0.3% zdravých osob má obsah vápníu mimo interval (2.30 3 0.18, 2.30 + 3 0.18) = (1.76, 2.84) (v mmol/l). µ 3σ µ 2σ µ µ + 2σ µ + 3σ Matematicá statistia Šára Hudecová 33/ 50 Matematicá statistia Šára Hudecová 34/ 50 Kvantily normovaného normálního rozdělení Kvantily normálního rozdělení důležité ve statistice α-vantily N(0, 1) budeme značit jao u α platí P(X < u α ) = Φ(u α ) = α hodnoty jsou uvedeny v tabulách a implementovány ve statisticých (matematicých) programech hodnoty z α = u 1 α splňují P(X > z α ) = α a nazývají se riticé hodnoty N(0, 1) f() 0.1 0.3 80 % 15 % 5 % 3 2 1 0 u 0.8 u 0.95 3 Matematicá statistia Šára Hudecová 35/ 50 Matematicá statistia Šára Hudecová 36/ 50
Přílad Tabula: Vybrané vantily rozdělení N(0, 1) α 0.5 0.8 0.9 0.95 0.975 0.99 0.995 u α 0 0.842 1.282 1.645 1.960 2.326 2.576 Jeliož platí Φ( ) = 1 Φ(), máme u 1 α = u α. Přílad: Obsah vápníu v revním séru (v mmol/l) se řídí normálním rozdělením N(2.30, 0.18 2 ) u zdravých lidí a rozdělením N(2.10, 0.18 2 ) u nemocných lidí. 1 Jaou je třeba zvolit hranici, aby pouze 5% nemocných nebylo testem odhaleno? 2 Jaou je třeba zvolit hranici, aby se maimálně 10% zdravých lidí muselo zbytečně podrobovat dalším testům? Matematicá statistia Šára Hudecová 37/ 50 Matematicá statistia Šára Hudecová 38/ 50 Jaou je třeba zvolit hranici, aby pouze 5 % nemocných nebylo testem odhaleno? Hledáme vantil rozdělení N(2.10, 0.18 2 ) na hladině 95 %. Vezměme X N(2.10, 0.18 2 ), pa ( X 2.1 0.95 = P(X < q) = P < q 2.1 ) ( ) q 2.1 = Φ 0.18 0.18 0.18 a odtud 1.645 = u 0.95 = q 2.1 0.18 a tedy q = 2.1 + 0.18 1.645 = 2.396. Je tedy potřeba vzít za hraniční hodnotu 2.396 mmol/l. Jaou je třeba zvolit hranici, aby se maimálně 10% zdravých lidí muselo zbytečně podrobovat dalším testům? Hledáme vantil rozdělení N(2.30, 0.18 2 ) na hladině 10 %. Vezměme Y N(2.30, 0.18 2 ), pa ( Y 2.3 0.10 = P(Y < q) = P < q 2.3 ) ( ) q 2.3 = Φ 0.18 0.18 0.18 a odtud 1.282 = u 0.10 = q 2.3 0.18 a tedy q = 2.3 0.18 1.282 = 2.069. Je tedy potřeba vzít za hraniční hodnotu 2.069 mmol/l. Matematicá statistia Šára Hudecová 39/ 50 Matematicá statistia Šára Hudecová 40/ 50
Eponenciální rozdělení Eponenciální rozdělení Eponenciální rozdělení Charateristiy Náhodná veličina X má eponenciální rozdělení s parametrem λ > 0, jestliže má hustotu { λe λ pro > 0, f () = 0 jina. Značíme X Ep(λ). nabývá pouze ladných hodnot, její hustota eponenciálně lesá nejpravděpodobnější jsou malé hodnoty Matematicá statistia Šára Hudecová 41/ 50 Střední hodnota EX = 1 λ Čím vyšší je parametr λ, tím nižší je střední hodnota a naopa. Distribuční funce F () = a F X () = 0 pro 0. Odtud pa vypočteme medián a platí medx < EX. f (t) dt = [ e λt] 0 = 1 e λ pro > 0 medx = log 2 λ Matematicá statistia Šára Hudecová 42/ 50 Eponenciální rozdělení Hustota eponenciálního rozdělení Eponenciální rozdělení Medián a střední hodnota Ep(1) f() 0.6 0.8 1.0 λ P = 0.5 0 2 4 6 8 f() Ep(5) f() 0 1 2 3 4 5 0 m XEX 0 2 4 6 8 Matematicá statistia Šára Hudecová 43/ 50 Matematicá statistia Šára Hudecová 44/ 50
Eponenciální rozdělení Přílady Mawellovo rozdělení Mawellovo rozdělení Přílady využití modelování doby čeání na událost déla telefonního hovoru, doba obsluhy u poladny, apod. rozdělení ineticé energie moleuly ideálního plynu ve dvourozměrném prostoru je eponenciální Náhodná veličina X má Mawellovo rozdělení s parametrem a > 0, jestliže má hustotu 2 f () = a 3 2π 2 e 2 2a 2 pro > 0, 0 jina. Mawellova veličina X nabývá pouze ladných hodnot její hustota je mírně asymetricá a nabývá maimální hodnoty v bodě = 2a Matematicá statistia Šára Hudecová 45/ 50 Matematicá statistia Šára Hudecová 46/ 50 Mawellovo rozdělení Přílady Mawellovo rozdělení Charateristiy Využití Mawellovo rozdělení se používá pro modelování rychlosti moleul ideálního plynu. V tom případě je jeho parametr roven T a = m, de je Boltzmannova onstanta, T je teplota [K] a m je hmotnost částice [g]. Distribuční funci nelze vyjádřit eplicitně, je nutné ji počítat numericy jao F () = 1 2π 2 /a 2 0 z e z/2 dz pro > 0. (Tj. i medián a vantily lze spočíst jen numericy.) Střední hodnota EX = 8 8 π a = T π m Matematicá statistia Šára Hudecová 47/ 50 Matematicá statistia Šára Hudecová 48/ 50
Mawellovo rozdělení Hustota Mawellova rozdělení Hustota Mawellova rozdělení pro různé plyny při 25 Mawellovo rozdělení Hustota Mawellova rozdělení pro různé teploty Hustoty rychlostí moleul yslíu při teplotách 100, 300 a 500 K. 000 010 020 030 H 2 He O 2 Cl 2 0 1000 2000 3000 4000 00 01 02 03 100 K 300 K 500 K 0 200 400 600 800 1000 1200 1400 Matematicá statistia Šára Hudecová 49/ 50 rychlost [m/s] Matematicá statistia rychlost [m/s] Šára Hudecová 50/ 50