8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

Podobné dokumenty
8. Normální rozdělení

MATEMATICKÁ STATISTIKA

1. Alternativní rozdělení A(p) (Bernoulli) je diskrétní rozdělení, kdy. p(0) = P (X = 0) = 1 p, p(1) = P (X = 1) = p, 0 < p < 1.

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

Téma 22. Ondřej Nývlt

I. D i s k r é t n í r o z d ě l e n í

p(x) = P (X = x), x R,

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN

Charakterizace rozdělení

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Výběrové charakteristiky a jejich rozdělení

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

Limitní věty teorie pravděpodobnosti. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Vybraná rozdělení náhodné veličiny

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

5. Náhodná veličina. 2. Házíme hrací kostkou dokud nepadne šestka. Náhodná veličina nabývá hodnot z posloupnosti {1, 2, 3,...}.

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

15. T e s t o v á n í h y p o t é z

Pravděpodobnost a statistika I KMA/K413

MATEMATICKÁ STATISTIKA - XP01MST

15. T e s t o v á n í h y p o t é z

Normální rozložení a odvozená rozložení

Pravděpodobnost a aplikovaná statistika

Aproximace binomického rozdělení normálním

správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B.

10. N á h o d n ý v e k t o r

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně

Přednáška. Další rozdělení SNP. Limitní věty. Speciální typy rozdělení. Další rozdělení SNP Limitní věty Speciální typy rozdělení

Pravděpodobnost a statistika

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která

Mgr. Rudolf Blažek, Ph.D. prof. RNDr. Roman Kotecký Dr.Sc.

KMA/P506 Pravděpodobnost a statistika KMA/P507 Statistika na PC

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

Poznámky k předmětu Aplikovaná statistika, 5.téma

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

Interpolace, ortogonální polynomy, Gaussova kvadratura

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

5. B o d o v é o d h a d y p a r a m e t r ů

Pravděpodobnost a matematická statistika

Příklady: - počet členů dané domácnosti - počet zákazníků ve frontě - počet pokusů do padnutí čísla šest - životnost televizoru - věk člověka

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Praktická statistika. Petr Ponížil Eva Kutálková

5. T e s t o v á n í h y p o t é z

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 )

i=1 Přímka a úsečka. Body, které leží na přímce procházející body a a b můžeme zapsat pomocí parametrické rovnice

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Náhodná veličina. Michal Fusek. 10. přednáška z ESMAT. Ústav matematiky FEKT VUT, Michal Fusek

Cvičení ze statistiky - 7. Filip Děchtěrenko

PRAVDĚPODOBNOST A STATISTIKA aneb Krátký průvodce skripty [1] a [2]

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

7. Rozdělení pravděpodobnosti ve statistice

a způsoby jejího popisu Ing. Michael Rost, Ph.D.

Základy teorie pravděpodobnosti

Pravděpodobnost a aplikovaná statistika

Definice spojité náhodné veličiny zjednodušená verze

6.1 Normální (Gaussovo) rozdělení

Přednáška. Diskrétní náhodná proměnná. Charakteristiky DNP. Základní rozdělení DNP

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

KMA/P506 Pravděpodobnost a statistika KMA/P507 Statistika na PC

Náhodné chyby přímých měření

VYBRANÁ ROZDĚLENÍ. SPOJITÉ NÁH. VELIČINY Martina Litschmannová

PRIMITIVNÍ FUNKCE. Primitivní funkce primitivní funkce. geometrický popis integrály 1 integrály 2 spojité funkce konstrukce prim.

f (k) (x 0 ) (x x 0 ) k, x (x 0 r, x 0 + r). k! f(x) = k=1 Řada se nazývá Taylorovou řadou funkce f v bodě x 0. Přehled některých Taylorových řad.

Statistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Základy teorie odhadu parametrů bodový odhad

NÁHODNÁ VELIČINA. 3. cvičení

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

PRIMITIVNÍ FUNKCE DEFINICE A MOTIVACE

KGG/STG Statistika pro geografy

populace soubor jednotek, o jejichž vlastnostech bychom chtěli vypovídat letní semestr Definice subjektech.

Statistika II. Jiří Neubauer

Náhodná veličina a rozdělení pravděpodobnosti

ROZDĚLENÍ NÁHODNÝCH VELIČIN

Testování statistických hypotéz

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace

6. T e s t o v á n í h y p o t é z

Základy teorie pravděpodobnosti

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení

1 Rozptyl a kovariance

Příklad 1. Řešení 1a. Řešení 1b. Řešení 1c ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 7

Vlastnosti odhadů ukazatelů způsobilosti

Regresní analýza 1. Regresní analýza

JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová

10 Funkce více proměnných

NMAI059 Pravděpodobnost a statistika

22 Základní vlastnosti distribucí

Základy počtu pravděpodobnosti a metod matematické statistiky

Matematika I A ukázkový test 1 pro 2014/2015

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

f( x) x x 4.3. Asymptoty funkce Definice lim f( x) =, lim f( x) =, Jestliže nastane alespoň jeden z případů

Transkript:

8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) e, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá normované normální rozdělení. V dalším textu budeme náhodnou veličinu, která má rozdělení N(0; ) obvykle označovat písmenem U. Její hustota je pak ( ) = e x, x (, ). Distribuční funkci rozdělení N(0; ), která je definovaná vztahem ( ) Φ(x) = x e t dt, x (, ), budeme vždy označovat symbolem Φ. Graf hustoty ϕ normovaného normálního rozdělení N(0; ) znázorníme na obrázku Obr. 8. a graf distribuční funkce Φ je znázorněn na obrázku Obr. 8.. Φ(x) 3 0 3 x 3 0 3 x Obr. 8. Obr. 8. Poznámka: Normované normální rozdělení N(0; ) je symetrické kolem nuly a tedy = ϕ( x). Je tudíž E(X) = 0 a dále je D(X) =. Odtud plyne, že pro distribuční funkci Φ platí: Φ(x) + Φ( x) = Φ( x) = Φ(x) a Φ(0) = 0, 5. Obecné normální rozdělení N(µ; ) je posunuté o hodnotu µ, je tedy symetrické vzhledem k této hodnotě. Je E(X) = µ a D(X) =. Směrodatná odchylka (X) =. Rozdělení je koncentrováno ke střední hodnotě. I když nabývá náhodná veličina s tímto rozdělením teoreticky všech reálných hodnot je P ( X µ < 3) = 0, 999 a P ( X µ < 3, 5) = 0, 9999. Poznámka: Normální rozdělení si zachovává svůj charakter při lineární transformaci. Platí totiž následující tvrzení. 33

8.. Věta: Jestliže má náhodná veličina X rozdělení N(µ, ), má pak náhodná veličina Y = X +β rozdělení N(µ+β, ). Speciálně platí, že náhodná veličina U = X µ má normované normální rozdělení N(0, ). Důkaz: Je-li X náhodná veličina, která má rozdělení N(µ, ) a je-li f její hustota a F je její distribuční funkce, pak pro hustotu g a distribuční funkci G náhodné veličiny Y platí: G(y) = P (Y y) = P (X + β y) = P (X y β) = P (X y β = ) = F ( y β ) > 0 P (X y β ) = F ( y β ), < 0. Potom pro hustotu g rozdělení náhodné veličiny Y dostaneme: g(y) = G (y) = = d dy d dy e ( F ( y β )) = ( f(y β F ( y β ( y β µ) = ) )) = f(y β ) (y (µ+β)) e (). To je ovšem hustota normálního rozdělení N(µ + β; () ). = f(y β ) = Jestliže zvolíme = a β = µ dostaneme µ+β = 0 a =. Náhodná veličina U má tudíž normované normální rozdělení N(0; ). Poznámka: Transformace na normované rozdělení. Jestliže má náhodná veličina X normální rozdělení N(µ; ), pak má náhodná veličina U = X µ X = U + µ normované normální rozdělení N(0; ). Pro její distribuční funkci F a hustotu f platí: a Je tedy ( ) x µ F (x) = Φ F (u + µ) = Φ(u) f(x) = ( ) x µ ϕ f(u + µ) = ϕ(u). ( ) ( ) b µ a µ P (a < X < b) = F (b) F (a) = Φ Φ, kde hodnoty funkce Φ odečteme z tabulek hodnot distribuční funkce Φ. 8.3. Kvantily normálního rozdělení. Pro kvantily u p normovaného normálního rozdělení N(0; ) platí, že: Φ(u p ) = p, 0 < p < u p = Φ (p) 34

a jejich hodnoty nalezneme v tabulkách kvantilů. Všimneme si, že platí: Pro kvantily x p u 0,5 = 0 a u p = u p. obecného normálního rozdělení N(µ; ) platí: ( ) xp µ F (x p ) = p Φ = p x p µ = u p x p = u p + µ. Odtud plyne, že medián x = x 0,5 = ˆx = E(X) = µ je zároveň modus. Význam kvantilů si znázorníme na obrázku hustoty ϕ a distribuční funkce Φ normovaného normálního rozdělení. Obsah obrazce vyznačeného šrafováním je roven p. p Φ(x) 0, 5 3 0 u p 3 x 3 0 u p 3 x Obr. 8.3 Obr. 8.4 8.4. Výpočet distribuční a kvantilové funkce normálního rozdělení. I. Přímý výpočet hustota: = e x, x R; pro rozdělení s parametry µ, je : distribuční funkce: f(x) = ( ) x µ f, x R; Φ(x) = x pro rozdělení s parametry µ, je : e t dt, x R; ( ) x µ F (x) = Φ, x R; kvantilovou funkci dostaneme jako řešení rovnice: Φ(u p ) = p, x p = µ + u p, 0 < p <. 35

kde II. Pomocí aproximace distribuční funkce: ( ) a) Φ(x) = + erf ( x ), x R, kde erf (x) = x e t dt, x R. π b) pro x 0 je: 0 Φ(x). = 5 k= a k w k, w = + a 0 x, a 0 = 0, 3 64 9, a = 0, 39 38 5, a = 0, 356 563 8, a 3 =, 78 478, a 4 =, 8 56, a 5 =, 330 74 Pro x 0 je Φ(x) = Φ( x). Pro x 6 je Φ(x) =. Maximální chyba aproximace je menší než 0 6. kvantilová funkce: pro 0 < p je a k w k kde Φ (p) = u p. = w + k=0 3 k=0 b k w k, w = lnp, a 0 =, 55 57, a = 0, 80 853, a = 0, 00 38 b 0 =, b =, 43 788, b = 0, 89 69, b 3 = 0, 00 308 Pro < p < je u p = u p. Přesnost aproximace je 0, 000 45 pro 0, 999 < P < 0, 999. III. V programu MAPLE with(stats) : = statevalf[pdf, normald](x); f(x) = statevalf[pdf, normald[µ, ]](x); Φ(x) = statevalf[cdf, normald](x); F (x) = statevalf[cdf, normald[µ, ]](x); u p = Φ (p) = statevalf[icdf, normald](p); x p = F (p) = statevalf[icdf, normald[µ, ]](p). 8.5. Intervaly spolehlivosti. Ve statistice se setkáváme s úlohou, kdy potřebujeme k dané pravděpodobnosti určit interval, ve kterém se hodnota náhodné veličiny vyskytuje. Vyřešíme tuto úlohu pro normované normální rozdělení. Pro jiná rozdělení se princip řešení zachová, jenom hraniční hodnoty hledaného intervalu se určí z kvantilů odpovídajícího rozdělení. 8.6. Příklad: K danému číslu, 0 < <, určete interval tak, aby pro náhodnou veličinu U, která má normované normální rozdělení N(0; ) platilo: 36

a) ( ) P ( U < a) = ; b) ( ) P (U < a) = ; c) ( ) P (U > a) =. Řešení: a) Z podmínky vyplývá = P ( a < U < a) = = Φ(a) Φ( a) = Φ(a) ( Φ(a)) = Φ(a) Φ(a) =. Odtud plyne, že a = u kvantil. Je tedy a < U < a u < U < u. b) Obdobně jako v a) dostaneme = P (U < a) = Φ(a) a = u. Je tedy U < a U < u. c) Z podmínky pro interval plyne = P (U > a) = Φ(a) Φ(a) = a = u. Je tedy U > a U > u. Poznámka: Číslo volíme malé, obvykle 0 < 0, a číslo se nazývá koeficient spolehlivosti (konfidenční koeficient). Získaný interval nazýváme 00( ) procentním intervalem spolehlivosti. Interval ( ) je oboustranný interval, intervaly ( ) a ( ) jsou jednostranné.první je pravostranný a druhý levostranný. Jsou to intervaly, ve kterých se hodnota náhodné veličiny bude vyskytovat s pravděpodobností ( ), tedy ve 00( )% případech. 3 0 3 x 3 0 3 x u u u Obr. 8.5 Obr. 8.6 3 0 3 x u Obr. 8.7. 8.7. Sčítání náhodných veličin. Náhodnou veličinu Z, která je definována pomocí náhodných veličin X a Y tak, že X = x, Y = y Z = x + y nazýváme součtem náhodných veličin X a Y a značíme ji Z = X + Y. Obdobně definujeme i jiné funkce náhodných veličin. Později ukážeme, že platí: E(X + Y ) = E(X) + E(Y ) 37

a pro nezávislé náhodné veličiny i D(X + Y ) = D(X) + D(Y ). V případě nezávislých náhodných veličin, které mají normální rozdělení ještě platí: 8.8. Věta: Jsou-li X, resp. Y nezávislé náhodné veličiny s normálními rozděleními N(µ, ), resp. N(µ, ), pak má náhodná veličina X + Y normální rozdělení s parametry N(µ + µ, + ). 8.9. Náhodný výběr. Ve statistice zpracováváme data, která jsou souborem výsledků náhodného pokusu. Soubor dat je tedy realizací uspořádané n tice náhodných veličin {X, X,..., X n }. Všechny náhodné veličiny mají shodné rozdělení a jsou na sobě nezávislé. Takovou uspořádanou n tici náhodných veličin nazýváme prostým náhodným výběrem z daného rozdělení. Z vět 8.8 a 8. vyplývá toto tvrzení. 8.0. Věta: Jestliže mají nezávislé náhodné veličiny X i, i n normální rozdělení N(µ, ) (náhodný výběr z normálního rozdělení), má pak výběrový úhrn X = n X i normální rozdělení N(nµ, n ) i= n X i i= a výběrový průměr X = normální rozdělení N(µ, ). n n Poznámka: K terminologii: O náhodné veličině, která je funkcí náhodného výběru mluvíme jako o statistice. Častou úlohou je nalezení vhodné statistiky, z jejíchž hodnot můžeme odvodit vlastnosti sledovaného rozdělení. Z vlastností normálního rozdělení vidíme, že statistika X, výběrový průměr je dobrým odhadem střední hodnoty µ, neboť při dostatečně rozsáhlém výběru, velké hodnotě n, se bude hodnota X jen velmi málo lišit od střední hodnoty µ. Centrální limitní věty Uvedeme dvě formulace tzv. centrálních limitních vět, které mají obdobný charakter jako věta 8.8. 8.. Věta: Čebyševův zákon velkých čísel. Je-li {X, X,...} posloupnost nezávislých náhodných veličin, pro které je E(X i ) = µ a D(X i ) C, pak pro Y n = n X n i a každé číslo ε > 0 je i= lim P ( Y n µ > ε) = 0, lim n n P ( Y n µ < ε) =. 8.. Věta: Lindeberg, Lévy Je-li {X, X,...} posloupnost nezávislých náhodných veličin, pro které je E(X i ) = µ a D(X i ) =, pak pro náhodnou veličinu je ξ n = n n i= ( ) Xi µ lim P (ξ n x) = Φ(x), n kde Φ je distribuční funkce normovaného normálního rozdělení N(0, ). Důsledky: Je-li {X, X,..., X n } prostý náhodný výběr z rozdělení, pro které je E(X i ) = µ a D(X i ) =, pak má v limitě výběrový úhrn X normální rozdělení 38

N(nµ; n) a výběrový průměr X normální rozdělení N(µ, ). Je tedy n ( X lim P nµ n n x ) = Φ(x), x R, ( ) X µ lim P n x = Φ(x), x R. n Binomické rozdělení Bi(n; p) je úhrnem alternativního rozdělení, pro které je E(X i ) = p a D(X i ) = p( p). Centrální limitní věta je Moivre-Laplaceova věta, která byla první z vět tohoto charakteru. 8.3. Věta: Moivre - Laplace Jestliže má náhodná veličina X binomické rozdělení Bi(n; p), pak tedy lim P n np( X np p) x = Φ(x), x R, P (a < X < b) = = Φ b np Φ a np. np( p) np( p) Poznámka: Aproximace je jako dobré náhrady možné použít jsou-li splněny podmínky np 5 a n( p) 5. Poissonovo rozdělení Jestliže má náhodná veličina X Poissonovo rozdělení P o(λ), pak Je tedy lim P λ ( X λ λ P (a < X < b) = Φ x ) = Φ(x), x R. ( ) ( ) b λ a λ Φ. λ λ 39