Náhodá veličia Tyto materiály byly vytvořey za pomoci gratu FRVŠ číslo 45/004.
Náhodá veličia Většia áhodých pokusů má jako výsledky reálá čísla. Budeme tedy dále áhodou veličiou rozumět proměou, která může abývat růzých reálých čísel v závislosti a áhodě. Na tomto místě si připomeňme, že lze rozlišovat áhodou veličiu diskrétí a spojitou. Je-li áhodá veličia X spojitá, pak může abývat všech hodot z koečého ebo ekoečého itervalu. Naopak, áhodou veličiu X považujeme za diskrétí, abývá-li koečého ebo spočetého počtu hodot. Náhodou veličiu X lze tedy chápat jako reálou fukci prvků prostoru elemetárích jevů. Pravděpodobost toho, že áhodá veličia X dosáhla hodoty x i začíme takto P (X = x i. ( Umíme-li pro každé reálé x určit pravděpodobost, že áhodá veličia X abyde hodoty meší ebo rové x, pak záme tzv. rozděleí pravděpodobosti áhodé veličiy X. Způsob popisu áhodých veliči Prvím způsobem je zápis prostředictvím tabulky rozděleí pravděpodobostí viz tabulka. Tabulka : Tabulka rozděleí pravděpodobostí hod ideálí kostkou x i 3 4 5 P (X = x i Druhou možostí je pomocí polygou rozděleí pravděpodobostí. Další možostí popisu rozděleí pravděpodobosti je prostředictvím distribučí fukce. Ta je defiováa vztahem: F (x = P (X x i. ( Distribučí fukce je defiováa a předem daém itervalu. Její základí vlastosti jsou: 0 F (x F (x i F (x j pro každou dvojici čísel x i < x j lim x F (x = F ( = 0 (3 lim x + F (x = F (+ = P (a < X b = F (b F (a
Distribučí fukce F (x je zprava spojitá a má ejvýš spočetě bodů espojitosti. Grafu distribučí fukce odpovídá v popisé statistice graf kumulativích relativích četostí. Distribučí fukce diskrétí áhodé veličiy je espojitá. Pro diskrétí áhodou veličiu platí: F (x i = P (X x i = j i p j (4 Pro spojitou áhodou veličiu, abývající všech hodot z itervalu x [a; b] F (x = P (X x i = x a f(tdt (5 Dalším důležitým pojmem je hustota pravděpodobosti (ěkdy také frekvečí fukce. Jde o fukci která je defiováa vztahem f(x = df (x dx Základí vlastosti hustoty pravděpodobosti jsou: b a f(x 0 lim x f(xdx = 0 lim x + f(xdx = 0 f(xdx = pro x [a; b] P (a < X b = = F (x ( b a f(xdx Velmi důležitým pojmem ve spojitosti s popisem áhodých veliči je pojem kvatilu. α-kvatilem ebo α 00%-ím kvatilem áhodé veličiy X, která má jisté spojité rozděleí áhodé veličiy s distribučí fukcí F (x a hustotu pravděpodobosti f(x, je číslo x α pro které platí F (x α = P (X x α = x α (7 f(xdx = α (8 Některé kvatily mají speciálí ázvy apř.: mediá, dolí kvartil, horí kvartil, prví decil, osmý percetil, atd... Některá rozděleí diskrétích a spojitých áhodých veliči Beroulliho rozděleí Někdy také Alterativí rozděleí. Pomocí tohoto rozděleí lze popsat ty situace, ve kterých může áhodá proměá abývat pouze dvou možých hodot.
Příkladem může být hod ideálí micí. Dalším možým příkladem může být hlasováí jedé ze dvou stra bez možosti zdržet se hlasováí. Bez ztráty obecosti lze uvažovat o dvou možých výsledcích 0 ezdar a zdar. Beroulliho rozděleí je defiováo pomocí parametru p. Teto parametr lze iterpretovat jako pravděpodobost zdaru. Pravděpodobostí fukce Beroulliho rozděleí je defiováa takto f(x; p = { ( p pokud x = 0 p pokud x =. (9 Pravděpodobostí fukci pro Beroulliho rozděleí lze zapsat ekvivaletě jako: P (X = x = p x ( p ( x. (0 Distribučí fukci tohoto rozděleí pak zapíšeme jako { ( p pokud x = 0 F (x; p = pokud x =. ( Středí hodota Beroulliho rozděleí je dáa hodotou p, rozptyl pak hodotou p( p. Symbolickým zápisem X Ber(p ebo A(p. Biomické rozděleí Pokud budeme opakovat -krát určitý pokus při dodržeí stejých podmíek, přičemž v každém pokusu bude moci astat áhodý jev A, se stejou pravděpodobostí p a aopak eastat s pravděpodobostí p, pak takové schéma pokusů azýváme Beroulliho schéma. Počet realizací jevu A v ezávislých pokusech Beroulliho schématu je zřejmě diskrétí áhodou veličiou s defiičím oborem {0,,..., }. Vzhledem k tomu, že jsou tyto pokusy avzájem ezávislé lze psát: ( P (X = x = p x ( p x. ( x Náhodou veličiu X mající biomické rozděleí lze vyjádřit jako součet ezávislých áhodých veliči, které mají alterativí rozděleí se stejým parametrem p : X = X + X +... + X. (3 Středí hodotu lze pak určit jako: Pro rozptyl pak E(X = E(X + E(X +... + E(X = p. D(X = D(X + D(X +... + D(X = p( p. 3
Například předpokládejme, že počet x vadých výrobků mezi ezávisle vyrobeými výrobky má biomické rozděleí Bi(, p, kde p udává pravděpodobost, že při výrobím procesu bude vyrobe zmetek. Pro = 40 a p = 0, 05 získáme ásledující graf pravděpodobostí fukce viz graf. Obrázek : Pravděpodobostí fukce pro X Bi(40; 0.05 Probability 0.00 0.05 0.0 0.5 Bi(40, 0.5 0 0 0 30 40 x Poissoovo rozděleí V ěkterých případech eí počet dat výsledkem předem staoveého počtu zkoušek. Například pokud y představuje počet úmrtí při automobilových ehodách v ČR během ásledujícího týde, pak teoreticky eí staovea horí hraice pro y. Vhodý pravděpodobostí model pak představuje Poissoovo rozděleí. Poissoovo rozděleí má pouze jede jediý parametr. Tím je λ. Teto parametr udává jak středí hodotu tak rozptyl. Skutečost, že se středí hodota Poissoova rozděleí musí být shodá s rozptylem je velice důležitá, zvláště při modelováí ěkterých typů dat. Poissoova pravděpodobostí fukce je defiováa takto f(x; λ = e λ λ x. (4 x! 4
Distribučí fukce pak jako x e λ λ z F (x; λ = z! z=0. (5 Pokud áhodá veličia X sleduje Poissoovo rozděleí s parametrem λ pak píšeme X P o(λ. Jedou z cest jak defiovat Poissoovo rozděleí je pomocí aproximace biomickým rozděleím, a to za předpokladu, že je extrémě vysoké a π je blízko ule. Přesěji pokud, π 0, a π λ, pak biomické rozděleí s parametry a π aproximuje Poissoovo rozděleí s parametrem λ. Nebot lze biomickou pravděpodobostí fukci zapsat jako ( x π x ( π x! = ( x! πx ( π x A platí Dále platí a tedy = ( ( x+ x! π x ( π x ( = ( ( x+ x! x ( π = ( ( x + x! π ( x x ( π π ( ( x ( = ( ( x + x! (πx π = ( ( x+ x ( ( π x (π x x! π. π ( x π ( lim ( ( x + x = (7 lim π 0 ( π x =. (8 ( limπ π = e λ, (9 π λ (π x lim π λ = λx. (0 x! x! Čímž je dokázáo to, že pokud, π 0 a π λ, pak je pravděpodobostí fukce biomického rozděleí rova e λ λ x což je právě pravděpodobostí fukce Poissoova rozděleí. x!, x 5
Hypergeometrické rozděleí Náhodá veličia X má hypergeometrické rozděleí s parametry N, M,, jestliže má defiovaou pravděpodobostí fukci ásledujícím způsobem: P (X = x = { ( M x ( N M x ( N pokud x max(0, M N + ; mi(m, 0 jiak. ( Přičemž N, M, a x jsou přirozeá čísla, pro která platí M N a N. Uvědomte si, že faktoriál je defiová pouze pro ulu a přirozeá čísla. Výzam jedotlivých symbolů lze vysvětlit takto: Mějme N objektů, z ichž M má jistou sledovaou vlastost. Z takového souboru vybereme áhodě objektů, přičemž každá -tice vytvořeá z těchto N objektů má stejou pravděpodobost že bude vybráa. Pro malá /N přibližě pro /N 0, lze hypergeometrické rozděleí aproximovat biomickým rozděleím s parametrem p = M/N. V případě, že je /N a M/N malé a velké, řekěme /N 0,, M/N 0, a > 30, lze hypergeometrické rozděleí aproximovat tzv. Poissoovým rozděleím s parametrem λ = M/N. Uved me si jede příklad. Jaká je pravděpodobost, že správě zaškrteme a lístku SAZKY 3 čísla ze šesti, tj. výhry pátého místa ve sportce? Postupujme selským rozumem. Jev uhodutí 3 ze vyhrávajících astae tehdy, pokud ( se budou shodovat 3 čísla z vyhrávajících. Takových možých trojic je 3. Ostatí čísla, pak musí být čísla které evyhrávají, těch je 49 = 43. Takovýchto evýtězých trojic je tedy ( 43 3. Nebot každá výtězá trojice může být ( zkombiováa s evyhrávající, pak počet všech vyhovujících výsledků je ( 3 43 3. Celkový počet šestic které lze vytvořit z 49 čísel která jsou v osudí je. Pravděpodobost hledaé výhry je tedy: ( 49 ( ( P (X = 3 = 3 43 3 ( 49. Připomíá Vám ěco teto výsledek? Měl by, ebot : ( M ( N M ( ( x x P (X = 3 = ( N = 3 43 3. Normálí rozděleí V souvislosti s tímto rozděleím se lze setkat i s ázvem Laplace Gaussovo rozděleí. Patří mezi ejdůležitější spojitá rozděleí áhodých veliči a má zásadí výzam jak v statistické teorii, tak i v aplikacích. Lze říci, že tímto rozděleím lze popsat jevy, a jejichž kolísáí má vliv velký počet epatrých a vzájemě ezávislých vlivů. ( 49
Normálí rozděleí, jak bylo již výše zmíěo patří mezi ejužívaější pravděpodobostí modely. Tvar distribučí fukce odvodil a základě velkého počtu pokusů hodu micí fracouzský matematik Moivre již v roce 733. Zovu byla tato křivka objevea a základě chyb měřeí v astroomii a začátku 9. století, a byla pojmeováa po zámém ěmeckém matematikovi Carlu Friedrichovi Gaussovi (777-855. Pojmeováí Normálí rozděleí, pak poprvé zavedl fracouzský matematik Quételet. Hustota pravděpodobosti tohoto rozděleí je dáa fukcí f(x = σ (x i µ π e σ pro x i (,. ( Jak je z výrazu patré, má toto rozděleí dva parametry µ a σ Normálí rozděleí s těmito parametry se zpravidla začí N(µ, σ, kde prví parametr je středí hodotou a druhý je rozptylem áhodé veličiy. Normálí rozděleí je symetrické kolem své středí hodoty, která je současě mediáem i modem. Pokud bychom hodoty áhodé veličiy X s ormálím rozděleím vhodě trasformovali resp. zormovali, pak bychom získali áhodou veličiu jejíž rozděleí bylo opět ormálí s jedotkovým rozptylem a ulovou středí hodotu. Tomuto rozděleí se říká ormovaé ormálí rozděleí a začíme jej N(0,. Distribučí fukce je stejě jako hustota pravděpodobosti tabelováa právě pro ormovaé ormálí rozděleí, ebot každé ormálí rozděleí lze trasformovat a ormálí ormovaé rozděleí. Tabulky hustoty pravděpodobosti spolu s distribučí fukcí jsou sestavey většiou pro ezáporé hodoty ormovaé veličiy U. Kde hodotu u i ormovaé veličiy U získáme trasformací u i = x i µ σ. (3 Hustotu ormovaého ormálího rozděleí důsledě ozačujeme symbolem ϕ(x. Distribučí fukci rozděleí N(0, důsledě ozačujeme prostředictvím symbolu φ(x. Hodoty pro x 0 plyou ze vztahů Dalším velmi důležitým vztahem je předpis Chi kvadrát rozděleí ϕ( x = ϕ(x, (4 φ( x = φ(x. (5 u α = u α. ( Uvažujme avzájem ezávislých áhodých veliči U, U,, U, z ichž každá má ormovaé ormálí rozděleí. Potom rozděleí součtu čtverců těchto áhodých veliči má χ rozděleí. Tedy χ = Ui. (7 i= 7
Součet čtverců vzájemě ezávislých ormovaých ormálích áhodých veliči má hustotu pravděpodobosti daou předpisem { χ f(x = Γ( e (χ, χ > 0 (8 0, χ 0 Kde fukce Γ( se azývá gama fukce, která je defiováa jako Γ( = Γ( = (! pro =, 4,, Γ( = 4 3 π pro = 3, 5, 7, (9 Parametr azýváme počtem stupňů volosti. V ašem případě mluvíme o χ rozděleí s stupi volosti, které začíme χ (. Distribučí fukce tohoto rozděleí je defiováa rovicí { χ e t F (x = Γ( t dt, χ > 0 0 (30 0, χ 0. Charakteristiky tohoto rozděleí jsou E(χ =, D(χ =. Frekvečí fukce χ rozděleí je asymetrická. Její průběh závisí a počtu stupňů volosti. S rostoucím se χ rozděleí blíží ormálímu rozděleí N(,. Pokud > 30 lze toto rozděleí aproximovat ormovaým ormálím rozděleím. Studetovo ebo také t-rozděleí Jedím z ejčastěji využívaým rozděleím je tzv. t-studetovo rozděleí. Lze jej defiovat pomocí dvou ezávislých áhodých veliči U a χ, které mají po řadě N(0, a χ ( rozděleí. Náhodá veličia t kde ta je defiováa jako má hustotu pravděpodobosti f(x; = Γ( + π Γ( t = U χ, (3 x + + ( x ( ;. (3 Rozděleí s touto hustotou pravděpodobosti se azývá t rozděleí, též Studetovo rozděleí o stupích volosti. Počet stupňů volosti veličiy χ ve jmeovateli veličiy t určuje počet stupňů volosti Studetova rozděleí. Rozděleí t při rostoucím počtu stupňů volosti rychle koverguje k ormálímu rozděleí. Pro > 30 lze ahradit Studetovo rozděleí ormálím ormovaým rozděleím. Studetovo rozděleí je symetrické jedovrcholové. Vzhledem k symetrii platí: t α ( = t α (. (33 8
Fisherovo Sedecorovo rozděleí Dalším hojě využívaým rozděleím je Fisherovo Sedecorovo rozděleí, zámé rověž jako F -rozděleí. Lze jej defiovat prostředictvím dvou ezávislých áhodých veliči které pocházejí z Chi-kvadrát rozděleí s m resp. stupi volosti. Náhodá veličia F je defiováa takto: F = χ m χ. (34 Rozděleí s touto hustotou pravděpodobosti se symbolicky zapisuje jako F (m,. Uvědomte si, že zde záleží a pořadí stupňů volosti m,. Nicméě platí vztah F α (m, = F α (, m. (35 Rozděleí F se při velkých počtech stupňů volosti blíží k rozděleí ormálímu, ale dosti pomalu. Toto rozděleí je asymetrické. 9