Poznámky k předmětu Aplikovaná statistika, 5.téma

Podobné dokumenty
Definice spojité náhodné veličiny zjednodušená verze

KGG/STG Statistika pro geografy

Téma 22. Ondřej Nývlt

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

Vybraná rozdělení náhodné veličiny

Pravděpodobnost a statistika (BI-PST) Cvičení č. 4

Mgr. Rudolf Blažek, Ph.D. prof. RNDr. Roman Kotecký Dr.Sc.

Přednáška. Další rozdělení SNP. Limitní věty. Speciální typy rozdělení. Další rozdělení SNP Limitní věty Speciální typy rozdělení

Pravděpodobnost a aplikovaná statistika

Základy teorie pravděpodobnosti

MATEMATICKÁ STATISTIKA

VYBRANÁ ROZDĚLENÍ. SPOJITÉ NÁH. VELIČINY Martina Litschmannová

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

Normální rozložení a odvozená rozložení

Náhodná veličina. Michal Fusek. 10. přednáška z ESMAT. Ústav matematiky FEKT VUT, Michal Fusek

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

SPOJITÉ ROZDĚLENÍ PRAVDĚPODOBNOSTI. 7. cvičení

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

Výběrové charakteristiky a jejich rozdělení

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení

NMAI059 Pravděpodobnost a statistika

NÁHODNÉ VELIČINY JAK SE NÁHODNÁ ČÍSLA PŘEVEDOU NA HODNOTY NÁHODNÝCH VELIČIN?

KMA/P506 Pravděpodobnost a statistika KMA/P507 Statistika na PC

Základy teorie pravděpodobnosti

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Diskrétní náhodná veličina

Pravděpodobnost a statistika (BI-PST) Cvičení č. 7

Charakterizace rozdělení

Pravděpodobnost a statistika I KMA/K413

5. Náhodná veličina. 2. Házíme hrací kostkou dokud nepadne šestka. Náhodná veličina nabývá hodnot z posloupnosti {1, 2, 3,...}.

Poznámky k předmětu Aplikovaná statistika, 4. téma

I. D i s k r é t n í r o z d ě l e n í

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

ÚVOD. Rozdělení slouží: K přesnému popisu pravděpodobnostního chování NV Střední hodnota, rozptyl, korelace atd.

Základní typy pravděpodobnostních rozdělení

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

p(x) = P (X = x), x R,

Náhodná veličina a rozdělení pravděpodobnosti

Poznámky k předmětu Aplikovaná statistika, 4. téma

VYBRANÁ ROZDĚLENÍ. DISKRÉTNÍ NÁH. VELIČINY Martina Litschmannová

Tomáš Karel LS 2012/2013

správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B.

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013

MATEMATIKA III V PŘÍKLADECH

Přednáška. Diskrétní náhodná proměnná. Charakteristiky DNP. Základní rozdělení DNP

12. cvičení z PST. 20. prosince 2017

Design Experimentu a Statistika - AGA46E

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace

prof. RNDr. Roman Kotecký DrSc., Dr. Rudolf Blažek, PhD Pravděpodobnost a statistika Katedra teoretické informatiky Fakulta informačních technologií

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

Poznámky k předmětu Aplikovaná statistika, 11. téma

Statistika II. Jiří Neubauer

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

8. Normální rozdělení

1 Rozptyl a kovariance

Příklady: - počet členů dané domácnosti - počet zákazníků ve frontě - počet pokusů do padnutí čísla šest - životnost televizoru - věk člověka

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Statistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

Fyzikální korespondenční seminář MFF UK

Pravdepodobnosť. Rozdelenia pravdepodobnosti

1 Klasická pravděpodobnost. Bayesův vzorec. Poslední změna (oprava): 11. května 2018 ( 6 4)( 43 2 ) ( 49 6 ) 3. = (a) 1 1 2! + 1 3!

Cvičení ze statistiky - 5. Filip Děchtěrenko

Pravděpodobnostní rozdělení

6.1 Normální (Gaussovo) rozdělení

ROZDĚLENÍ NÁHODNÝCH VELIČIN

pravděpodobnosti, popisné statistiky

Řešení. Označme po řadě F (z) Odtud plyne, že

MATEMATICKÁ STATISTIKA - XP01MST

y = 0, ,19716x.

Semestrální písemka BMA3 - termín varianta A13 vzorové řešení

Bayesovské metody. Mnohorozměrná analýza dat

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

Testy. Pavel Provinský. 19. listopadu 2013

Normální (Gaussovo) rozdělení

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

Inovace bakalářského studijního oboru Aplikovaná chemie

NÁHODNÁ VELIČINA. 3. cvičení

1. Klasická pravděpodobnost

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z

Příklady na procvičení z NMFM202

Pravděpodobnost a matematická statistika

Limitní věty teorie pravděpodobnosti. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Příklady na testy hypotéz o parametrech normálního rozdělení

4EK211 Základy ekonometrie

Příklad 1. Řešení 1a. Řešení 1b. Řešení 1c ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 7

Pravděpodobnost, náhodná proměnná. Statistické metody a zpracování dat. III. Pravděpodobnost, teoretická rozdělení. Pravděpodobnost, náhodná proměnná

JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová

1. Alternativní rozdělení A(p) (Bernoulli) je diskrétní rozdělení, kdy. p(0) = P (X = 0) = 1 p, p(1) = P (X = 1) = p, 0 < p < 1.

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

AVDAT Náhodný vektor, mnohorozměrné rozdělení

PRAVDĚPODOBNOST A STATISTIKA

Někdy lze výsledek pokusu popsat jediným číslem, které označíme X (nebo jiným velkým písmenem). Hodíme dvěma kostkami jaký padl součet?

Cvičení 5. Přednášející: Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc.

Transkript:

Poznámky k předmětu Aplikovaná statistika, 5.téma 5. Některá významná rozdělení A. Diskrétní rozdělení (i) Diskrétní rovnoměrné rozdělení na množině {,..., n} Náhodná veličina X, která má diskrétní rovnoměrné rozdělení (značíme X R({,..., n})) nabývá pouze hodnot z množiny {,..., n} a to s pravděpodobností n, tj. P (X = i) = n, i {,..., n}. Střední hodnota: EX = n+ Rozptyl: varx = n2. 2 2. (ii) Alternativní rozdělení X Alt(p), p (0, ) Náhodná veličina X mající alternativní rozdělení nabývá pouze hodnot 0 a a to s následujícími pravděpodobnostmi: Střední hodnota: EX = p. Rozptyl: varx = p( p). P (X = ) = p, P (X = 0) = p. Příklad. Házíme na basketbalový koš ze šestky. V 80% případů se trefíme. Náhodná veličina X, která nabývá hodnoty, trefíme-li koš a hodnoty 0, jestliže koš netrefíme, má rozdělení Alt(0, 8). (iii) Binomické rozdělení X Bi(n, p), n N, p (0, ) Náhodná veličina X nabývá hodnot k = 0,..., n s pravděpodobnostmi P (X = k) = ( n k) p k ( p) n k, k = 0,,..., n. Náhodnou veličinou X Bi(n, p) se modeluje počet úspěchů v n nezávislých pokusech, je-li pravděpodobnost úspěchu v jednotlivých pokusech rovna p. Zevrubně řečeno, označme náhodné veličiny Y i... výsledek i-tého pokusu, i =,..., n. Pak P (Y i = ) = p, P (Y i = 0) = p. a veličiny Y i jsou nezávislé a mají alternativní rozdělení s parametrem p. Veličina X se potom dá zapsat jako X = Y i.

Tedy veličina X Bi(n, p) se dá interpretovat jako součet n nezávislých veličin s rozdělením Alt(p). Bez této interpretace by pro nás počítání střední hodnoty a rozptylu bylo pro obecné n, p dosti obtížné (vyžaduje znalosti sčítání řad), ovšem takto je výpočet velmi přímočarý: EX = E Y i = EY i = Rozptyl se díky nezávislosti veličin Y i vypočítá analogicky, varx = np( p). p = np. Příklad 2. Házíme desetkrát na koš. Pravděpodobnost, že se v jednotlivých hodech trefíme je opět 0, 8. Potom náhodná veličina Y popisující počet trefených košů při těchto deseti hodech má binomické rozdělení Bi(0; 0, 8). (iv) Geometrické rozdělení X Ge(p), p (0, ) Náhodná veličina X nabývá hodnot k = 0,,... s pravděpodobnostmi P (X = k) = p( p) k, k = 0,,... Geometrickým rozdělením se modeluje počet neúspěšných pokusů před prvním úspěchem, jsou-li jednotlivé pokusy nezávislé a pravděpodonost úspěchu je p. Střední hodnota: EX = p p. Rozptyl: varx = p p 2. Příklad 3. Házíme opět na koš. Počítáme si, jak dlouho, respektive kolik hodů, nám trvá, než se poprvé trefíme. Náhodná veličina Z udávající počet neúspěšných hodů před prvním úspěšným má geometrické rozdělení Ge(0, 8). (v) Poissonovo rozdělení X P o(λ), λ > 0 Rozdělení veličiny X je dáno pravděpodobnostní funkcí P (X = k) = e λ λk, pro k = 0,,... k! Poissonovým rozdělením modelujeme náhodnou veličinu, která vyjadřuje počet výskytů události v určitém intervalu (času, délky, objemu,... ), jestliže události nastávají náhodně a nezávisle na sobě. Střední hodnota: EX = λ. Rozptyl: varx = λ. Spojitost s binomickým rozdělením: Uvažujme náhodnou veličinu X Bi(n, p), kde n, p 0, a np = λ. Potom P (X = k) = ( n(n )... (n k + ) p k λ n k k! n) n,p 0 tedy veličina X má asymptoticky Poissonovo rozdělení. 2 λ k k! e λ,

Cvičení k tomuto tématu (i) Ve velké várce vajec je /3 zkažených. Jaká je pravděpodobnost, že ze šesti náhodně vybraných vajec budou nejvýše dvě zkažená? Nadto nakreslete graf pravděpodobnostní funkce příslušné náhodné veličiny. (ii) Na telefonní ústřednu přichází průměrně 00 hovorů za jednu hodinu, přičemž příchody hovorů jsou náhodné. Jaká je pravděpodobnost, že (a) když telefonistka odejde na deset minut do kuchyňky, nezmešká žádný hovor? (b) ve třech minutách přijdou více než dva hovory? (iiia) Ve výrobní hale je 8 stejných žárovek. Pravděpodobnost, že během směny praskne jedna žárovka, je 0, 4. Žárovky praskají nezávisle a nelze je během směny vyměnit. Když jich praskne více než 5, musí pracovníci za tuto směnu dostat příplatek. Jaká je pravděpodobnost, že za příští směnu dostanou příplatek? (iiib) Ve výrobní hale je velké množství žárovek. Ví se, že za směnu praskne průměrně 3, 2 žárovky. Jaká je pravděpodobnost, že během příští směny praskne víc než 5 žárovek (a pracovníci dostanou příplatek)? Nakreslete graf pravděpodobnostní funkce příslušné náhodné veličiny. B. Spojitá rozdělení (i) Rovnoměrné rozdělení na intervalu [a, b] X R([a, b]), a < b R Má hustotu pravděpodobnosti f(x) = { b a a x b, 0 x < a, x > b. Tato hustota je konstantní na [a, b], což skutečně odpovídá tomu, že pravděpodobnost, že X padne do podintervalu intervalu [a, b], je úměrná velikosti tohoto podintervalu vůči [a, b]. (Srovnejte s geometrickou pravděpodobností.) Distribuční funkce je pak { 0 x < a, x a F (x) = a x b, b a x b. Prostým integrováním obdržíme vzorce pro střední hodnotu a rozptyl. Povšimněme si, že střední hodnota je přesně uprostřed intervalu [a, b]. Střední hodnota: EX = a+b Rozptyl: varx = (b 2 a)2. 2. (ii) Exponenciální rozdělení X Exp(λ), λ > 0 Veličina X nabývá hodnot z intervalu (0, ). Hustota závisí na parametru λ a je dána vztahem f(x) = { λe λx, x > 0 0 jinak. 3

Distribuční funkce F : F (x) = { 0 pro x 0, e λx x > 0. Střední hodnota: EX = λ. Rozptyl: varx = λ 2. Exponenciální rozdělení je rozdělení bez paměti : Pro náhodnou veličinu X s exponenciálním rozdělením platí: P (X > x + y X > y) = P (X > x), x > 0, y > 0, nebot užitím definice podmíněné pravděpodobnosti můžeme pravděpodobnost P (X > x + y X > y) přepsat ve tvaru P (X > x + y) P (X > y) = e λ(x+y) e λy = e λx. Exponenciálním rozdělením se modeluje doba čekání na událost a má velký význam v teorii přežití a v kombinaci s Poissonovým rozdělením i v systémech hromadné obsluhy (viz níže). Souvislost s Poissonovým rozdělením: Jestliže náhodá veličina X, která popisuje dobu čekání na výskyt události, má rozdělení Exp(λ), potom n.v. Y popisující počet těchto událostí, jež nastaly v časovém intervalu délky T, má Poissonovo rozdělení P o(λt ). (iii) Normální rozdělení X N (µ, σ 2 ), µ R, σ 2 > 0 Říká se mu také Gaussovo rozdělení. Veličina X nabývá hodnot z celého R. Hustota normálního rozdělení je f(x) = a říká se jí Gaussovka křivka. Distribuční funkce je 2π σ 2 e (x µ)2 2σ 2, < x <, F (x) = 2π σ 2 x e (t µ)2 2σ 2 dt, < x <, a nelze ji explicitně vyjádřit vzorcem. Normální rozdělení má v teorii pravděpodobnosti a matematické statistice zásadní roli, jak se dozvíme v další kapitole. Velmi hrubě řečeno se dá normálním rozdělením modelovat součet velmi mnoha drobných náhodných faktorů. Střední hodnota: EX = µ. Rozptyl: varx = σ 2. (iiib) Normované normální rozdělení X N (0, ) Je znormovaná náhodná veličina s normálním rozdělením, tj. µ = EX = 0 a σ 2 = varx =. 4

Normal density 0.00 0.0 0.02 0.03 0.04 0.05 30 20 0 0 0 20 30 Obrázek : Hustota N (0, 49). Hustota normovaného normálního rozdělení je Distribuční funkce Φ je ϕ(x) = 2π e x2 2, < x <. Φ(x) = 2π x e t2 2 dt, < x <, a její hodnoty jsou tabelizovány (lze je nalézti ve statistických tabulkách). Díky symetrii distibuční funkce Φ platí: Φ(x) = Φ( x), x R, a tudíž je dostatečné tabelizovat hodnoty Φ(x) pro nezáporné hodnoty x. Transformace normálně rozdělených veličin. Jestliže Y má normální rozdělení s parametry µ a σ 2, potom má normované normální rozdělení N (0, ). X = Y µ σ 2. Jestliže X má normální rozdělení s parametry µ a σ 2 a Y = a + bx, potom Y má opět normální rozdělení s parametry a + bµ a b 2 σ 2. 3. Uvažujme náhodné veličiny X a Y, X N (µ, σ 2 ), Y N (µ 2, σ 2 2), jsou nezávislé. Potom n.v. Z = ax + by + c má rozdělení N (aµ + bµ 2 + c, a 2 σ 2 + b 2 σ 2 2). Díky vztahu. není třeba tabelizovat hodnoty distribuční funkce F pro všechna rozdělení N (µ, σ 2 ) (to by ani nebylo možné!), ale stačí nám tabulka pro Φ, nebot pro všechny distribuční funkce F platí vztah ( ) x µ F (x) = Φ. σ U následujících rozdělení si uvedeme pouze jejich definice bez dalších vlastností. Tato rozdělení budou hrát důležitou roli při pozdějším testování hypotéz. 5

Normal distribution function 0.0 0.2 0.4 0.6 0.8.0 0 5 0 5 0 Obrázek 2: Distribuční funkce N (0, ). (iv) χ 2 - rozdělení o n stupních volnosti X χ 2 (n) Necht X,..., X n jsou nezávislé náhodné veličiny s normovaným normálním rozdělením N (0, ). Potom náhodná veličina Y n = má tzv. χ 2 - rozdělení o n stupních volnosti. Symbolem χ 2 α(n) budeme značit α kvantily tohoto rozdělení. (v) Studentovo rozdělení o n stupních volnosti X t(n) Necht U a V jsou nezávislé náhodné veličiny, U N (0, ) a V χ 2 (n). Potom náhodná veličina W = U V n má tzv. Studentovo rozdělení (nebo též t-rozdělení) o n stupních volnosti. Symbolem t α (n) budeme značit α kvantily tohoto rozdělení. (vi) Fisherovo Snedecorovo rozdělení X F (m, n) Uvažujme nezávislé náhodné veličiny U n χ 2 (n ) a U n2 χ 2 (n 2 ). Potom náhodná veličina X 2 i Z = U n n U n2 n 2 má tzv. Fisherovo Snedecorovo rozdělení o n, n 2 stupních volnosti. Symbolem F α (n, n 2 ) budeme značit α kvantily tohoto rozdělení. Platí: Cvičení k tomuto tématu F α (n, n 2 ) = F α (n 2, n ). 6

(iv) Babička chodí k vnoučkovi na návštěvu náhodně mezi první a šestou hodinou odpolední. Dnes však odchází vnouček ve čtyři hodiny na fotbal. Jaká je pravděpodobnost, že babička vnoučka doma nezastihne? Dále spočtěte střední hodnotu, rozptyl a distribuční funkci příslušné náhodné veličiny. (v) Necht X N (2, 6). Pomocí tabulky distribuční funkce Φ(x) určete (a) P ( 4 X < 5), (b) P (X > 8, 5), (c) P (X = 3), (d) P (X < 8). (vi) Náhodná veličina X udává odchylku obsahu cukru v jednotlivých bonbónech od normy (udaná v gramech). Ví se, že X N (0, ). Výrobce potřebuje znát takovou hodnotu h (v gramech), že bonbónů, v nichž obsah cukru převýší normu o více než h, bude právě (a) %, (b) 2%. Dále výrobce potřebuje znát takové h, že bonbónů, v nichž se obsah cukru bude lišit od normy o více než h, bude právě %. (vii) Necht X N (3, 0) a Y N (, 9) jsou nezávislé. Definujme náhodné veličiny Hledejme (a) P (U < 5), (b) P (V > 2), (c) P ( V 6), (d) ρ(x, Y ) a ρ(u, X), (e) ρ(v, X) a ρ(u, V ). U := 3X, V := 2X 3Y + 2. (viii) Na toalety ve čtvrtém patře budovy C přichází uživatel v průměru jednou za tři minuty. Na těchto toaletách se nachází také sprchy a právě ted tu nikdo není. Jaká je pravděpodobnost, že během následujících deseti minut nikdo nepřijde a Vy se tak stihnete v klidu vysprchovat? Jaká je pravěpodobnost, že budete vyrušeni už za pět minut? (dcv) Na trávníku o rozloze 50 00 m 2 se během sezóny udělá přibližně 20 krtinců na zcela náhodných místech. Majitel na něm chce udělat green o ploše 00 m 2. Jaká je pravděpodobnost, že na greenu (a) nebude za sezónu žádný krtinec? (b) budou za sezónu více než tři krtince? Nakrestele pravděpodobnostní funkci příslušné náhodné veličiny. 7