V R je jako defaultní generátor použit Mersenne twister, algoritmus navržený dvojicí Matsumoto a Nishimura v roce 1998 [5].



Podobné dokumenty
Příklady k třetímu testu - Matlab

Řešení: a) Označme f hustotu a F distribuční funkci náhodné veličiny X. Obdobně označme g hustotu a G distribuční funkci náhodné veličiny Y.

SPOLEHLIVOST KONSTRUKCÍ & TEORIE SPOLEHLIVOSTI část 2: Statistika a pravděpodobnost

1. Alternativní rozdělení A(p) (Bernoulli) je diskrétní rozdělení, kdy. p(0) = P (X = 0) = 1 p, p(1) = P (X = 1) = p, 0 < p < 1.

Pravděpodobnost a statistika

Domácí úkol DU01_2p MAT 4AE, 4AC, 4AI

PRAVDĚPODOBNOST A STATISTIKA OPAKOVÁNÍ, pro rozpoznávání

6. T e s t o v á n í h y p o t é z

STEREOMETRIE. Vzdálenost bodu od přímky. Mgr. Jakub Němec. VY_32_INOVACE_M3r0113

1. Pravděpodobnost a statistika (MP leden 2010)

Cvičení ze statistiky - 6. Filip Děchtěrenko

9.2.5 Sčítání pravděpodobností I

Pomůcka pro cvičení: 3. semestr Bc studia

Teoretická rozdělení

3.2.4 Podobnost trojúhelníků II

Kvantové počítače algoritmy (RSA a faktorizace čísla)

Tématické celky { kontrolní otázky.

( ) Kreslení grafů funkcí metodou dělení definičního oboru I. Předpoklady: 2401, 2208

Pravděpodobnost a statistika: řešené příklady 2014 Tomáš Kroupa

Nerovnice s absolutní hodnotou

2.7.2 Mocninné funkce se záporným celým mocnitelem

Drsná matematika IV 7. přednáška Jak na statistiku?

STP022 PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA

Modely diskrétní náhodné veličiny. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Významná diskrétní rozdělení pravděpodobnosti

Všechny možné dvojice ze čtyř možností, nezáleží na uspořádání m (všechny výsledky jsou rovnocenné), 6 prvků. m - 5 prvků

Pingpongový míček. Petr Školník, Michal Menkina. TECHNICKÁ UNIVERZITA V LIBERCI Fakulta mechatroniky, informatiky a mezioborových studií

(a) = (a) = 0. x (a) > 0 a 2 ( pak funkce má v bodě a ostré lokální maximum, resp. ostré lokální minimum. Pokud je. x 2 (a) 2 y (a) f.

M-10. AU = astronomická jednotka = vzdálenost Země-Slunce = přibližně 150 mil. km. V následující tabulce je závislost doby

Náhodný pokus každá opakovatelná činnost, prováděná za stejných nebo přibližně stejných podmínek, jejíž výsledek je nejistý a závisí na náhodě.

Řešení: ( x = (1 + 2t, 2 5t, 2 + 3t, t); X = [1, 2, 2, 0] + t(2, 5, 3, 1), přímka v E 4 ; (1, 2, 2, 0), 0, 9 )

{ } Kombinace II. Předpoklady: =. Vypiš všechny dvoučlenné kombinace sestavené z těchto pěti prvků. Urči počet kombinací pomocí vzorce.

Diferenciální počet funkcí jedné proměnné

Náhodná veličina a rozdělení pravděpodobnosti

Distribuční funkce je funkcí neklesající, tj. pro všechna

15 s. Analytická geometrie lineárních útvarů

Dualita v úlohách LP Ekonomická interpretace duální úlohy. Jiří Neubauer. Katedra ekonometrie FEM UO Brno

Některé zákony rozdělení pravděpodobnosti. 1. Binomické rozdělení

Mendelova zemědělská a lesnická univerzita v Brně Institut celoživotního vzdělávání Fakulta regionálního rozvoje a mezinárodních studií

Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008

Škola: Střední škola obchodní, České Budějovice, Husova 9 Projekt MŠMT ČR: EU PENÍZE ŠKOLÁM

Náhodná veličina X má Poissonovo rozdělení se střední hodnotou lambda. Poissonovo rozdělení je definováno jako. P(X=k) = 0,036

Modelování pohotovosti systému metodou Monte Carlo Availability modeling by Monte Carlo method

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

(Auto)korelační funkce Statistické vyhodnocování exp. dat M. Čada ~ cada

MS WORD 2007 Styly a automatické vytvoření obsahu

a) Základní informace o souboru Statistika: Základní statistika a tabulky: Popisné statistiky: Detaily

2.8.9 Parametrické rovnice a nerovnice s absolutní hodnotou

V týmové spolupráci jsou komentáře nezbytností. V komentářích se může např. kolega vyjadřovat k textu, který jsme napsali atd.

UŽITÍ DERIVACÍ, PRŮBĚH FUNKCE

4.6.6 Složený sériový RLC obvod střídavého proudu

Biostatistika a matematické metody epidemiologie- stručné studijní texty

Dopravní úloha. Jiří Neubauer. Katedra ekonometrie FEM UO Brno

M - Rovnice - lineární a s absolutní hodnotou

Kvadratické rovnice pro učební obory

Úvod. Analýza závislostí. Přednáška STATISTIKA II - EKONOMETRIE. Jiří Neubauer

KOMBINATORIKA, PRAVDĚPODOBNOST, STATISTIKA. Charakteristiky variability. Mgr. Jakub Němec. VY_32_INOVACE_M4r0120

PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA I

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

Př. 3: Dláždíme čtverec 12 x 12. a) dlaždice 2 x 3 12 je dělitelné 2 i 3 čtverec 12 x 12 můžeme vydláždit dlaždicemi 2 x 3.

Funkce více proměnných

Simulace systému hromadné obsluhy Nejčastější chyby v semestrálních pracích

Tomáš Karel LS 2012/2013

EXPONENCIÁLNÍ A LOGARITMICKÁ FUNKCE

Tvorba trendové funkce a extrapolace pro roční časové řady

1.1.1 Kvadratické rovnice (dosazení do vzorce) I

Herní plán. Magic Stars

Regresní a korelační analýza

( ) ( ) ( ) 2 ( ) Rovnice s neznámou pod odmocninou II. Předpoklady: 2715

Pravděpodobnost a aplikovaná statistika

Rozhodování v podmínkách rizika. Marie Kalhousová

Učební dokument FUNKCE. Vyšetřování průběhu funkce. Mgr. Petra MIHULOVÁ. 4.roč.

Metodologie pro ISK II

5. Náhodná veličina. 2. Házíme hrací kostkou dokud nepadne šestka. Náhodná veličina nabývá hodnot z posloupnosti {1, 2, 3,...}.

PROGRAMY PRO VÝPOČET NEJISTOTY MĚŘENÍ METODOU MONTE CARLO

Reference 10. Předpokládejme stavový popis spojitého, respektive diskrétního systému

Pravděpodobnost a statistika

2. Je dáno jevové pole (Ω;A) a na něm nezáporná normovaná funkce. Definujte distrubuční funkci náhodného vektoru.

= musíme dát pozor na: jmenovatel 2a, zda je a = 0 výraz pod odmocninou, zda je > 0, < 0, = 0 (pak je jediný kořen)

Zadání projektů z BPC2 pro letní semestr 2007/2008

Kvadratické rovnice pro studijní obory

Poznámky k předmětu Aplikovaná statistika, 9.téma

Analytická geometrie ( lekce)

2.1. Pojem funkce a její vlastnosti. Reálná funkce f jedné reálné proměnné x je taková

1.3.1 Kruhový pohyb. Předpoklady: 1105

Určete zákon rozložení náhodné veličiny, která značí součet ok při hodu a) jednou kostkou, b) dvěma kostkami, c) třemi kostkami.

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

Využití EduBase ve výuce 2

Kapitola 7: Integrál. 1/14

Matice a maticová algebra, soustavy lineárních rovnic, kořeny polynomu a soustava nelin.rovnic

Přednáška. Diskrétní náhodná proměnná. Charakteristiky DNP. Základní rozdělení DNP

1.1 Pravidlo součinu a permutace

Zvyšování kvality výuky technických oborů

Jakub Juránek Určete počet kvádru, jejichž velikosti hran jsou přirozená čísla nejvýše rovná deseti. Kolik je v tomto počtu krychlí?

PREPRINT PRAVDĚPODOBNOST A NÁHODNÁ VELIČINA

Semestrální práce NÁVRH ÚZKOPÁSMOVÉHO ZESILOVAČE. Daniel Tureček zadání číslo 18 cvičení: sudý týden 14:30

Prognóza poruchovosti vodovodních řadů pomocí aplikace Poissonova rozdělení náhodné veličiny

PŘÍRUČKA K POUŽÍVÁNÍ APLIKACE HELPDESK

Výsledky testování školy. Druhá celoplošná generální zkouška ověřování výsledků žáků na úrovni 5. a 9. ročníků základní školy. Školní rok 2012/2013

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Transkript:

KMI/PRAS: Cvičení 6 (2011) 1 6.1 Generování (pseudo)náhodných čísel Jedna z důležitých součástí statistického zpracování dat je možnost generování (pseudo)náhodných čísel ze zvolené distribuce. Pokud chceme vybírat čísla z konečné populace (ať už s opakováním nebo bez), můžeme použít funkce sample(x, size, replace = FALSE, prob = NULL). Použití je jasné z následujících příkladů: > sample(1:5,size=10,replace=true) [1] 5 4 1 2 3 1 2 5 3 2 > sample(5,size=10,replace=true) [1] 1 3 3 5 5 1 3 3 1 3 > sample(10,size=5,replace=false) [1] 8 5 2 1 10 > sample(10,size=5,replace=true) [1] 7 8 4 5 5 > x<-sample(1:3,size=100,replace=true,prob=c(0.2,0.7,0.1)) > table(x) x 1 2 3 15 76 9 Jednín z nejznámějších algoritmů pro generování (pseudo)náhodných čísel na intervalu [0, M] je Lineární kongruentní generátor (LCG): 1. Zvolte a, b, M N 2. Zvolte x 0 {0, 1,..., M 1 3. Iterujte x i := (ax i 1 + b) modm, kde mod značí zbytek po celočíselném dělení. Uvědomte si, že algoritmus je deterministický (stejné počáteční hodnoty vytvoří stejnou sekvenci) a periodický. Kvalita algoritmu je hodně ovlivněna volbou počátečních hodnot. Příklad 6.1. Implementujte LCG v R, zvolte sami a, b, M. Simulujte 10 000 čísel na intervalu [0, 1] a vykreslete histogram. Srovnejte Vámi vytvořený generátor s tím, který je implementovaný v R (pomocí runif(n, min=0, max=1) vygenerujete n náhodných čísel z intervalu [min,max]). V R je jako defaultní generátor použit Mersenne twister, algoritmus navržený dvojicí Matsumoto a Nishimura v roce 1998 [5]. 6.2 Diskrétní rozdělení Pro generování (pseudo)náhodných čísel z často používaných distribucí jsou v R k dispozici funkce, např. pro binomické rozdělení rbinom. Stejně tak můžeme využít distribuční funkci pbinom, pravděpodobnostní funkci dbinom a kvantilovou funkci qbinom. Stejný způsob tvoření příkazů pro uvedené funkce platí i pro ostatní rozdělení. Jména rozdělení a jejich parametry (společné všem čtyřem funkcím) shrnuje tabulka 6.2. V tabulce nejsou uvedena pouze diskrétní rozdělení, ale i význačná spojitá. Příklad 6.1. Jak vypadá rozdělení pavděpodobností, tj. pravděpodobnostní funkce, pro náhodnou veličinu, která má binomické rozdělení X Bi(n, p) měníme-li p, tj. pravděpodobnost úspěchu?

KMI/PRAS: Cvičení 6 (2011) 2 Rozdělení Jméno v R Parametry Beta beta shape1,shape2 Binomické binom size,prob χ 2 chisq df Exponenciální exp rate F f df1,df2 Bamma gamma shape, rate Beometrické geom prob Negativní binomické pnbinom size, prob Normální normal mean, sd Poissonovo pois lambda Studentovo t df Uniformní unif min, max Tabulka 1: Některá rozdělení a jejich reprezentace v R binom<-function(p){ plot(0:10, dbinom(0:10, 10,p),ylim=c(0,1)) Sys.sleep(1) #Zajistí pauzu mezi kreslenými grafy sapply((0:20)/20,binom) #Opakované volání funkce binom s různými parametry Zkuste vykreslit distrubuční funkci s měnící se pravděpodobností úspěchu. Jak vypadá distribuční funkce pro p = 0 a pro p = 1? Vysvětlete. Zkuste vykreslit pravděpodobnostní i distribuční funkci při měnícím se n a konstantním p. n volte v rozmezí od 1 do 100, vhodně upravte rozsah os. Příklad 6.2. Házíme kostkou a zajímá nás po kolika hodech padne první šestka. Úkolem je simulovat tuto náhodnou veličinu a porovnat výsledky pro N opakování s teoretickým rozdělením, které by tato náhodná veličina měla mít. Označme X náhodnou veličinu počet hodů než uvidíme šestku. Celý pokus je posloupností nezávislých Bernoulliho pokusů, kde pravděpodobnost úspěchu (padne šestka) je p = 1/6 a pravděpodobnost neúspěchu je pak 1 p = 5/6. Potřebujeme tedy generovat čísla 0 a 1 (neúspěch, úspěch) s pravděpodobností 5/6 a 1/6. Toho můžeme docílit pomocí již zmíněné funkce sample, nebo můžeme použít generátor náhodných čísel z binomického rozdělení rbinom(n, size, prob). V posloupnosti vygenerovaných čísel nás zajímá pozice, kdy padla první 1. Náhodná veličina X může obecně nabývat hodnot {1, 2,.... My ale potřebujeme konečný počet pozic k. k zvolíme tak, aby pravděpodobnost, že první úspěch nastane až po k hodech byl blízko 0. P {X > k = 1 P {X k. Náhodná veličina X má geometrické rozdělení a k určení P {X k použijeme funkci pgeom(x, prob). Pozor: geometrické rozdělení je v R definováno jako počet neúspěšných pokusů před prvním úspěchem, nikoliv jako počet opakování než nastane první úspěch. > pgeom(49,1/6) [1] 0.9998901 > pgeom(99,1/6) [1] 1 Vidíme, že P {X 50 = 0.9998901 a že počet opakování hodu kostkou do padnutí první 6 nepřekročí číslo 100. Zvolíme tedy k = 100. rm(list = ls()) graphics.off() x<-seq(1,100,1) f=function(){

KMI/PRAS: Cvičení 6 (2011) 3 gen<-rbinom(100,1,1/6) #generováno 100 hodnot z binomického rozdělení x[gen==1][1] #nalezení pozice, kde padla první jednička #pokus opakujeme N-krát a výsledky uložíme do vektoru X N=10000 X=numeric(N) for(i in 1:N){ X[i] = f() #Hodnoty náhodné veličiny X můžeme zobrazit jednoduše v tabulce val<-tabulate(x,nbins=max(x)) #a zakreslit do grafu plot(1:max(x),val) Opakované volání funkce lze řešit i jinak než for-cyklem, například pomocí funkce replicate(). Vyzkoušejte. Nyní vytvoříme histogram hodnot náhodné veličiny X a porovnáme s pravděpodobnostní funkcí pro geometrické rozdělení, kterou pro názornost zakreslíme jako spojitou funkci, nikoliv jako diskrétní (parametr type= l ). y<-0:(max(x)-1) bins=seq(0.5,(max(x)+0.5),1) hist(x,freq=false,breaks=bins,xlab="x") points(y,dgeom(y,prob=1/6),type="l",col="red") Příklad 6.2. Pro náhodnou veličinu X z předchozího příkladu určete střední hodnotu, rozptyl a směrodatnou odchylku. Porovnejte s výběrovým průměrem, výběrovým rozptylem a výběrovou směrodatnou odchylkou. Výběrový průměr je tzv. dobrý odhad střední hodnoty. Co přesně znamená dobrý se dozvíte později. Příklad 6.3. Uvažujte následující hru. Vyhrajete 9 $ pokud při hodu 2 kostkami padne součet 2,3,11 nebo 12. Prohrajete 10 $ pokud padne součet 7. Jinak nevyhrajete nic. Určete P X ((0, )) a P X ((, 0)). [1/6, 1/6] Příklad 6.4. Za den přijde k jednomu určitému lékaři v průměru 10 lidí. Lékař je schopný ošetřit maximálně 15 pacientů za den. Jaká je pravděpodobnost, že v daný den bude muset lékař pacienty odmítnout? Jaká je pravděpodobnost, že v daný den přijde k lékaři právě 8 pacientů? [0.0487,0.1126] Příklad 6.5. Házíme kostkou a zajímá nás po kolika hodech padne k-tá šestka. Označme tuto náhodnou veličinu W k. Pak náhodný jev (W k = n) značí v n-tém hodu padla šestka a v předchozích n 1 hodech padla šestka právě k 1-krát. Náhodná veličina W k má tzv. negativní binomické rozdělení. Najděte pravděpodobnostní funkci pro náhodnou veličinu W 3, tj. obecný předpis pro P (W 3 = n). V R simulujte tuto náhodnou veličinu N-krát pro N = 100, N = 1000, N = 10000. Srovnejte relativní četnosti hodnot náhodné veličiny s teoretickými pravděpodobnostmi. Vykreslete pravděpodobnostní funkci a distribuční funkci pro negativní binomické rozdělení s různými parametry a funkce porovnejte. Příklad 6.6. Nicolas Bernoulli navrhl hazardní hru, při které se hází mincí dokud nepadne hlava. Pokud padne hlava v n-tém hodu, dostane hráč od kasína 2 n 1 Kč. Původně šlo samozřejmě o jinou měnu. Pokud padne hlava v prvním hodu, hráč vyhrává 1 Kč, pokud např. padne hlava ve 4.hodu, hráč vyhraje 2 4 1 = 8 Kč. Jaká cena bude pro hráče za tuto hru férová, tj. jaká je očekávaná hodnota výhry? [+ ]. Právě kvůli výsledku očekávané hodnoty + se této úloze říká Petrohradský paradox. V reálném životě by ale nikdo za tuto hru nezaplatil všechno co má, neprodal dům či auto. V reálném životě

KMI/PRAS: Cvičení 6 (2011) 4 Comparison of relative frequencies and theoretical probabilities 0.00 0.05 0.10 0.15 0 10 20 30 40 50 X bychom museli uvažovat, že hra je konečná, omezená např. množstvím peněz, které je kasino schopné vyplatit, nebo omezená dobou života hráče. Uvažujte tedy, že zdroje kasina určené pro vyplácení výher z této hry jsou omezené, ozn. Z. Hráč při vstupu zaplatí částku E. Pro různá Z a E simulujte tuto hru (tj. náhodnou veličinu X-výhra hráče) v R, pro dostatečný počet opakování určete výběrový průměr, srovnejte relativní četnosti hodnot náhodné veličiny X s jejím teoretickým rozdělením. Příklad 6.7. Předpokládejte, že je náhodně a nezávisle na sobě vybráno 2000 bodů z jednotkového čtverce { x, y 0 x 1, 0 y 1. Nechť W je počet bodů, které padnou do oblasti A = { x, y x 2 + y 2 < 1. Určete pravděpodobnostní funkci náhodné veličiny W, její střední hodnotu a rozptyl. [W Bi(2000, π/4), 1570.8, 337.1] Příklad 6.8. Nechť náhodná veličina X má Poissonovo rozdělení s parametrem λ. Dokažte, že P X ({k + 1) = λ k + 1 P X({k)

KMI/PRAS: Cvičení 6 (2011) 5 Reference [1] Capinski M., Zastawniak T. J.: Probability Through Problems Springer 2001, ISBN 978-0-387-95063-1. [2] Kerns G. J.: Elementary Probability on Finite Sample Spaces, 2009, reference manual package prob, available from: http://cran.r-project.org/package=prob [3] Kerns G. J: Introduction to Probability and Statistics Using R, First Edition http://cran.r-project.org/web/packages/ipsur/vignettes/ipsur.pdf [4] Kenneth Baclawski: Introduction to Probability with R Chapman and Hall/CRC, ISBN 978-1420065213. [5] Matsumoto, Makoto and Nishimura, Takuji: Mersenne twister: a 623-dimensionally equidistributed uniform pseudo-random number generator. ACM Trans. Model. Comput. Simul. 8(1):3-30, 1998. [6] Maria L. Rizzo: Statistical Computing with R Chapman and Hall/CRC, ISBN: 978-1584885450