Některé zákony rozdělení pravděpodobnosti. 1. Binomické rozdělení

Přednáška 5/1 Některé zákony rozdělení pravděpodobnosti 1. Binomické rozdělení Předpoklady: (a) pst výskytu jevu A v jediném pokuse P (A) = π, (b) je uskutečněno n pokusů, (c) pokusy jsou nezávislé, tj. pst výskytu jevu A ve dvou pokusech je 3 π π = π, ve třech pokusech π π π = π, atd. Při tom: počet pokusů n není příliš velký a pst π není blízká nule ani jedné. Typickým příkladem nezávislých opakovaných pokusů je tzv. výběr s opakováním, kdy vybraná jednotka je před dalším tahem vrácena a zamíchána mezi ostatní. Příklady diskrétních náhodných veličin s binomickým rozdělením: počet úspěšných (neúspěšných) zásahů při n výstřelech do terče, počet vyrobených dobrých (vadných) výrobků při výrobě n kusů, počet chlapců (dívek) v rodině s n dětmi, počet ziskových (ztrátových) investic mezi n investicemi, aj. Ve všech uvedených případech diskrétní náhodná veličina X nabývá hodnot =,1,,..., n. Vyvození: Pst, že jev A v n nezávislých opakovaných pokusech nastal právě -krát (a nenastal právě ( n ) -krát) je dána jako součin: n π ( 1 π ) počet způsobů, kterými lze promíchat úspěšné a neúspěšné n n! pokusy. Poslední veličinu lze vyjádřit jako kombinační číslo ( ) = ( n )!! Vzorec pravděpodobnostní funkce (Bernoulliův vzorec): P( ) = n n ( ) π (1 π ) =,1,,..., n jinak Vzorec distribuční funkce: n F( ) = ( ) π (1 π ) 1 n < > n n

Přednáška 5/ Parametry Nepochybně eistuje nekonečně mnoho náhodných veličin s binomickým rozdělením, které se vzájemně liší hodnotami n a π parametry binomického rozdělení. Vliv parametrů můžeme nejlépe demonstrovat na grafu pstní funkce. Pro π =, 5 n hodnoty pstní funkce klesají na obě strany kolem hodnoty = symetricky, čím více se hodnota π vzdaluje od hodnoty,5 zvětšuje se asymetrie pstní funkce. S rostoucím n roste počet možných hodnot náhodné veličiny a jednotlivé pravděpodobnosti (jejichž součet je vždy roven jedné) klesají. Čísla n, π jsou parametry binomického rozdělení. Zavedeme označení Bi [ n;π ]. Charakteristiky Tak jako u jiných náhodných veličin charakterizujeme úroveň a variabilitu binomické náhodné veličiny pomocí střední hodnoty a rozptylu. Střední hodnota binomického rozdělení [ n;π ] Rozptyl binomického rozdělení [ n;π ] D ( X ) Bi E ( X ) = nπ Bi = nπ (1 π ) Vidíme, že eistuje jednoznačný vztah mezi charakteristikami úrovně a variability binomického rozdělení a jeho parametry.. Další rozdělení diskrétních náhodných veličin Vedle binomického rozdělení eistují další rozdělení diskrétních náhodných veličin se stejným nebo i větším významem. Vyjdeme-li z předpokladů v odstavci 1, můžeme jejich modifikací vyvodit např. Alternativní rozdělení Bi. Je triviálním případem binomického rozdělení [ 1;π ] Poissonovo rozdělení Roste-li počet nezávislých opakovaných pokusů nade všechny meze ( n ) a je-li při tom pst nastoupení jevu A blízká nule ( π ) jde o tzv. vzácný jev a je-li při tom součin n π = λ (kde λ > je konstanta), lze pravděpodobnost, že jev A za těchto podmínek nastane právě -krát, vyjádřit jako pstní funkci Poissonova rozdělení λ e λ =,1,,...! P( X ) = jinak Tato situace vypadá sice na první pohled velmi abstraktně, při tom však eistuje řada náhodných veličin, která se tímto zákonem řídí (počet vad na jednom výrobku, počet

Přednáška 5/3 překlepů na stránce tetu, počet uskutečněných telefonních hovorů za jednotku času aj.). Číslo λ se opět nazývá parametr a Poissonovo rozdělení se symbolicky uvádí jako [ λ] Po. V tomto případě platí E ( X ) = D ( X ) = λ. Hypergeometrické rozdělení Jsou-li pokusy závislé (např. jde o výběr bez opakování, kdy vybraná jednotka je ihned po vytažení ze souboru odstraněna), není pst nastoupení jevu A konstantní a M nezávislá na výsledcích předcházejících pokusů, ale je rovna, kde 1 M < N je N počet příznivých a N je počet všech možných případů (obě čísla jsou v každém, má náhodná veličina X kterou je pokuse jiná). Provedeme-li n pokusů ( 1 n < N) počet nastoupení jevu A v n pokusech, hypergeometrické rozdělení se třemi parametry n, M, N. Eistuje opět vztah mezi parametry a charakteristikami, M M M N n konkrétně střední hodnota E ( X ) = n a rozptyl D ( X ) = n (1 ). N N N N 1 Hypergeometrické rozdělení se příliš neliší od binomického, je-li počet pokusů n řádově menší než N. V tomto případě M N je přibližně rovno p a zatímco střední hodnoty se v tomto případě rovnají, rozptyl hypergeometrického rozdělení je N n krát menší než u binomického rozdělení. Toto číslo se nazývá konečnostní N 1 násobitel a je pro n > 1 vždy menší než jedna. Počet nastoupení jevu A v n pokusech má větší variabilitu (je méně stabilní) při výběru s opakováním než při výběru bez opakování. Geometrické rozdělení Bude-li náhodnou veličinou X počet neúspěšných pokusů, které je třeba vykonat do prvního nastoupení jevu A za podmínek uvedených v úvodu odst. 1, má tato náhodná veličina tzv. geometrické rozdělení. Vzhledem k předpokládané nezávislosti opakovaných pokusů je pst vykonání n neúspěšných pokusů do prvního nastoupení jevu A rovna π ( 1 π ).

Přednáška 5/4 3. Rovnoměrné rozdělení Předpoklady: (a) náhodná veličina X může nabýt libovolné reálné hodnoty z intervalu <α, β>, (b) její výskyt na celém intervalu <α, β> je stejně možný. Příklady spojitých náhodných veličin s rovnoměrným rozdělením: Vyvození d.f. doba, která uplyne od náhodně zvoleného okamžiku do nastoupení jevu, který se pravidelně opakuje časovém intervalu β, dráha, kterou je třeba urazit z náhodně zvoleného bodu do cíle, je-li celková dráha rovna β, libovolná spojitá veličina z intervalu <α, β>, o jejímž chování na tomto intervalu není nic bližšího známo (nouzové řešení v případě neznalosti skutečného rozdělení). P ( X ) = P( X < ) = pro každé α, P( X ) = P( X < ) = 1pro každé β, pro α < < β je distribuční funkce úsečka procházející body α [α, ], [β,1], její rovnici můžeme napsat např. jako. Vzorec distribuční funkce: β α α F( ) = β α 1 α α < < β β Graf distribuční funkce: F() 1 α β

Přednáška 5/5 Vyvození hustoty: Hustotu psti rovnoměrného rozdělení lze vyvodit dvěma způsoby Lze ji určit jako výšku f () obdélníka jehož vodorovná strana má délku β α a jehož plocha je rovna jedné, tj. f ( ) ( β α) = 1, z čehož 1 f () =, β α 1 Lze ji určit jako směrnici (derivaci) funkce F (), F ( ) = f ( ) =. β α Graf hustoty pravděpodobnosti: f() 1 β α α β Parametry Nepochybně eistuje nekonečně mnoho náhodných veličin s rovnoměrným rozdělením, které se vzájemně liší hodnotami α a β parametry rovnoměrného rozdělení. Čísla α, β jsou parametry rovnoměrného rozdělení. Označíme [ α; β ] R. Charakteristiky Tak jako u jiných náhodných veličin charakterizujeme úroveň a variabilitu rovnoměrně rozdělené náhodné veličiny pomocí střední hodnoty a rozptylu. Střední hodnotu E (X ) jakékoli spojité náhodné veličiny lze určit pomocí určitého integrálu funkce f () Střední hodnotu rovnoměrného rozdělení lze však snadněji určit pomocí parametrů α, β. Střední hodnota rovnoměrného rozdělení R [ α;β ] α + β ( X ) = E.

Přednáška 5/6 Rozptyl D ( X ) jakékoli spojité náhodné veličiny lze určit pomocí určitého integrálu funkce [ E( X )] f ( ). Rozptyl rovnoměrného rozdělení lze však snadněji určit pomocí parametrů α, β. Rozptyl rovnoměrného rozdělení R [ α;β ] ( β α) D ( X ) =. 1 Grafické znázornění kvantilu: f() p 1 - p α p β

Přednáška 5/7 Normální rozdělení 4. Vznik náhodné veličiny s normálním rozdělením Předpoklady: (a) spojitá náhodná veličina se utváří pod vlivem mnoha činitelů, (b) jednotlivé činitele jsou vzájemně nezávislé, (c) žádný z činitelů nemá na výsledek rozhodující vliv. Při tom: Na hodnoty náhodné veličiny neklademe žádná omezení, tj. < < +. Příklady spojitých náhodných veličin s normálním rozdělením: náhodné chyby fyzikálních (obecně jakýchkoli) měření, veličiny utvářející se pod vlivem balistických zákonů (výsledky střelby), znaky v biologických populacích podléhající zákonům genetiky, obecně náhodné veličiny vznikající jako součty či průměry jiných náhodných veličin (spojitých ale i diskrétních) s libovolným rozdělením. Normální rozdělení se univerzálně používá k aproimaci (k přibližnému vyjádření) rozdělení psti velkého množství náhodných veličin v biologii, technice, ekonomii atd. Ukázka vzniku normálního rozdělení eperimentální cestou: 1 1 9 9 6 6 3 3 1 3 4 5 6 7 8 9 1 1 3 4 5 6 7 8 9 1 1 1 9 9 6 6 3 3 1 3 4 5 6 7 8 9 1 1 3 4 5 6 7 8 9 1, které byly tříděny do tříd. Stejným způsobem byly vytvořeny grafy pro průměry ze dvou, tří a pěti takových náhodných veličin a proloženy v prvním případě tzv. trojúhelníkovým rozdělením (obrázek vpravo nahoře) a ve zbývajících dvou případech normálním Na počítači bylo generováno 5 hodnot náhodné veličiny R [ ;1]

Přednáška 5/8 rozdělením. Shoda s normálním rozdělením se zlepšuje s rostoucím počtem sčítanců n.. Hustota psti a distribuční funkce normálního rozdělení Hustota psti normálního rozdělení je symetrická zvonovitá Gaussova křivka. Distribuční funkce normálního rozdělení je pravidelná rostoucí křivka esovitého tvaru, která se nazývá Galtonova ogiva. Rovnici hustoty psti, stejně jako rovnici distribuční funkce normálního rozdělení, nebudeme uvádět. 3. Parametry normálního rozdělení Na obrázku jsou znázorněny tři vzájemně odlišné Gaussovy křivky:.6 f().4. σ -5-4 -3 - -1 1 3 4 5 µ Z obrázku vyplývá, že křivky se mohou lišit v souřadnicí vrcholu křivky tento parametr se označuje symbolem µ a určuje posunutí křivky vůči počátku vodorovné osy, v měřítku na vodorovné ose, které je dáno vzdáleností infleních bodů křivky od jejího vrcholu parametr měřítka se označuje symbolem σ. Bez ohledu na tyto odlišnosti je plocha pod každou z křivek rovna jedné. Konstantu µ a čtverec σ nazýváme parametry normálního rozdělení. N µ; σ. Zavedeme označení normálního rozdělení jako [ ]

Přednáška 5/9 4. Charakteristiky normálního rozdělení E (X ) = Střední hodnota vyjadřující polohu normálního rozdělení je µ. Rozptyl vyjadřující variabilitu normálního rozdělení je Konstanta σ = σ D ( X ) = σ. je směrodatnou odchylkou normálního rozdělení. 5. Normované normální rozdělení Normováním náhodné veličiny (jakékoli) rozumíme odečtení střední hodnoty od každé její hodnoty a vydělení tohoto rozdílu směrodatnou odchylkou U = X E( X ) D( X ) Normovaná náhodná veličina U má střední hodnotu X E( X ) X E( X ) E ( U ) = E = a rozptyl D ( U ) = D = 1. D( X ) D( X ) Normováním náhodné veličiny X s obecným normálním rozdělením N [ µ; σ ] vznikne náhodná veličina U s normovaným normálním rozdělením U = X E( X ) D( X ) = X µ. σ Pro normované normální rozdělení zavedeme označení N [ ; 1]. Hustotu pravděpodobnosti a distribuční funkci normovaného normálního rozdělení je zvykem značit φ ( u), Φ( u) (místo obvyklého f ( ), F( ) ).

Přednáška 5/1 N : Hustota pravděpodobnosti rozdělení [ ; 1] φ(u ).4. -5-4 -3 - -1 1 3 4 5 Tabulkové vyjádření vybraných hodnot hustoty pravděpodobnosti: u u,,5 1, 1,5,,5 3, 3,5 φ(u),399,35,4,13,54,18,4,1 φ(-u)=φ(u) Tabulkové vyjádření vybraných hodnot distribuční funkce: u,,5 1, 1,5,,5 3, 3,5 Φ(u),5,691,841,933,977,994,999,999 Φ(-u)=1-Φ(u) Tabulkové vyjádření vybraných kvantilů: p,5,9,95,975,99,995,999 u p, 1,8 1,645 1,96,36,576 3,9 u 1-p = -u p Tyto tabulky budeme využívat při řešení úloh s normálním rozdělením. Přestože platí < u < +, můžeme výskyt veličiny U mimo interval <-,+> prohlásit za jev prakticky nemožný. Tímto rozumíme jev, který sice není absolutně nemožný, ale jeho pravděpodobnost je natolik malá, že v jednom nebo několika málo pokusech nemusíme s jeho výskytem počítat. Tato myšlenka má pro statistiku neobyčejný význam.

Přednáška 5/11 Úloha prvního typu: 6. Úlohy s normálním rozdělením Inteligenční kvocient (IQ) je veličina X s rozdělením N [1;15 ]. Najděte pst, že náhodně vybraná osoba bude mít IQ nejméně na hranicí superiority (tj. alespoň 13). Hledáme pst P ( X 13). Přejdeme na normované normální rozdělení, pro které 1 u = = +. Hledáme tedy pst P ( U +). S použitím tabulky distribuční funkce 15 Φ(u) najdeme Φ( + ) = P ( U + ) =, 977, tedy pravděpodobnost opačného jevu. Ze vztahu mezi opačnými jevy plyne P( U + ) = 1 P( U + ) = 1,977 =, 3 a tedy pravděpodobnost nalezení osoby nad hranicí superiority je rovna,3 (jinak řečeno 3 osob z 1 je svým IQ nad hranicí superiority). Nyní jsme k zadané hodnotě náhodné veličiny hledali pravděpodobnost. Úloha druhého typu: Za stejných podmínek jako ve druhé úloze najděte hranici IQ, pod kterou se nachází 5 % populace. Hledáme 5% kvantil normované normální náhodné veličiny. Použijeme tabulku kvantilů, z níž určíme u,5 1,5 = u,95 = 1, 645. Platí u,5 = 1,645 = 15 Z čehož,5 = 1 1,645 15 = 75, 3. Pět procent populace má tedy IQ roven nejvýše přibližně 75. Nyní jsme k zadané pravděpodobnosti hledali hodnotu náhodné veličiny. Další úlohy (které budou probrány ve cvičení) jsou modifikací jednoho z obou právě uvedených typů. Princip řešení spočívá v nahrazení obecného normálního rozdělení N [ µ;σ ] normovaným normálním rozdělením N [ ;1 ], pro které jsou všechny potřebné hodnoty tabelovány.