1 Náhodný výběr a normální rozdělení 1.1 Teoretická a statistická pravděpodobnost



Podobné dokumenty
Náhodná veličina a rozdělení pravděpodobnosti

Vybraná rozdělení náhodné veličiny

7. Rozdělení pravděpodobnosti ve statistice

Náhodné (statistické) chyby přímých měření

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Náhodné chyby přímých měření

Inovace bakalářského studijního oboru Aplikovaná chemie

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

NÁHODNÁ VELIČINA. 3. cvičení

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Základy teorie pravděpodobnosti

8 Střední hodnota a rozptyl

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

ROZDĚLENÍ NÁHODNÝCH VELIČIN

Praktická statistika. Petr Ponížil Eva Kutálková

Výběrové charakteristiky a jejich rozdělení

Rozdělení náhodné veličiny. Distribuční funkce. Vlastnosti distribuční funkce

Pravděpodobnost a aplikovaná statistika

Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která

Někdy lze výsledek pokusu popsat jediným číslem, které označíme X (nebo jiným velkým písmenem). Hodíme dvěma kostkami jaký padl součet?

Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů

Určete zákon rozložení náhodné veličiny, která značí součet ok při hodu a) jednou kostkou, b) dvěma kostkami, c) třemi kostkami.

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN

Definice spojité náhodné veličiny zjednodušená verze

Induktivní statistika. z-skóry pravděpodobnost

PRAVDĚPODOBNOST A STATISTIKA

JAK MODELOVAT VÝSLEDKY NÁH. POKUSŮ? Martina Litschmannová

PRAVDĚPODOBNOST A STATISTIKA

I. D i s k r é t n í r o z d ě l e n í

5. Náhodná veličina. 2. Házíme hrací kostkou dokud nepadne šestka. Náhodná veličina nabývá hodnot z posloupnosti {1, 2, 3,...}.

KGG/STG Statistika pro geografy

2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat

Diskrétní náhodná veličina

p(x) = P (X = x), x R,

Rovnoměrné rozdělení

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

pravděpodobnosti Pravděpodobnost je teorií statistiky a statistika je praxí teorie pravděpodobnosti.

8. Normální rozdělení

Diskrétní náhodná veličina. November 12, 2008

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

Náhodná veličina. Michal Fusek. 10. přednáška z ESMAT. Ústav matematiky FEKT VUT, Michal Fusek

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

Číselné charakteristiky

Téma 22. Ondřej Nývlt

TEORIE PRAVDĚPODOBNOSTI. 2. cvičení

Generování pseudonáhodných. Ing. Michal Dorda, Ph.D.

Pravděpodobnost a statistika

Číselné charakteristiky a jejich výpočet

a způsoby jejího popisu Ing. Michael Rost, Ph.D.

Chyby měření 210DPSM

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

1. Statistická analýza dat Jak vznikají informace Rozložení dat

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

Tomáš Karel LS 2012/2013

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Analýza dat na PC I.

Přednáška 3: Limita a spojitost

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

Vzorová písemka č. 1 (rok 2015/2016) - řešení

Cvičení ze statistiky - 5. Filip Děchtěrenko

Jevy a náhodná veličina

JAK MODELOVAT VÝSLEDKY

Náhodný pokus Náhodným pokusem (stručněji pokusem) rozumíme každé uskutečnění určitého systému podmínek resp. pravidel.

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

Normální rozložení a odvozená rozložení

Statistika I (KMI/PSTAT)

Zápočtová práce STATISTIKA I

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

STATISTICKÉ ODHADY Odhady populačních charakteristik

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

Pravděpodobnostní rozdělení

Limitní věty teorie pravděpodobnosti. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Náhodný vektor a jeho charakteristiky

Charakterizace rozdělení

NÁHODNÉ VELIČINY JAK SE NÁHODNÁ ČÍSLA PŘEVEDOU NA HODNOTY NÁHODNÝCH VELIČIN?

KGG/STG Statistika pro geografy

Inženýrská statistika pak představuje soubor postupů a aplikací teoretických principů v oblasti inženýrské činnosti.

STATISTICKÉ ZJIŠŤOVÁNÍ

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

Základy popisné statistiky

Pravděpodobnost a statistika

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Základy teorie pravděpodobnosti

4. cvičení 4ST201. Pravděpodobnost. Obsah: Pravděpodobnost Náhodná veličina. Co je třeba znát z přednášek

Pravděpodobnost je. Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava

Odhad parametrů N(µ, σ 2 )

= = 2368

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Teorie pravěpodobnosti 1

2. přednáška - PRAVDĚPODOBNOST

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Transkript:

1 Náhodný výběr a normální rozdělení 1.1 Teoretická a statistická pravděpodobnost Ve světě kolem nás eistují děje, jejichž výsledek nelze předem jednoznačně určit. Například nemůžete předem určit, kolik ok padne při hodu kostkou, jaké bude zítra ráno počasí nebo jaký kurs koruny vůči euru bude mít příští pondělí Komerční banka. Takové děje nazýváme náhodné neboli stochastické. S náhodnými ději souvisí i další pojmy náhodný pokus a náhodný jev. Náhodný pokus je každá realizace (provedení) náhodného děje. Náhodný jev je pak každá událost, která při pokusu může nebo nemusí nastat. Náhodným pokusem je tedy každý hod kostkou, zjištění ranního počasí (například po probuzení) nebo každodenní ověření kursu koruny vůči Euru v Komerční bance. Náhodným jevem pak může být skutečnost, že na kostce padne šestka, že zítra ráno bude svítit sluníčko nebo že kurs koruny vůči euru bude nižší než 26 Kč/1. Náhodné jevy označujeme obvykle velkými písmeny: A, B, C atd. Každému náhodnému jevu A lze přiřadit nezáporné reálné číslo P(A) z intervalu od 0 do 1, které se nazývá pravděpodobnost jevu. Pravděpodobnost je číselné (kvantitativní) vyjádření šance, že daný jev nastane. Čím vyšší bude mít jev pravděpodobnost, tím větší je šance, že nastane. Pravděpodobnost rovnu nule bude mít jev, který při žádném pokusu nemůže nastat. Takový jev nazýváme nemožný. Naopak jev, který nastane v každém případě, při každém pokusu, je ohodnocen pravděpodobností rovnou jedné a nazývá se jev jistý. Příkladem nemožného jevu například je, že při hodu kostkou padne sedmička. Naopak jistý jev je, že padne číslo menší než sedm. Eistuje více způsobů, jak určit pravděpodobnost daného jevu. Nejjednodušší je tzv. klasická (teoretická) definice pravděpodobnosti, která vychází z předpokladu, že náhodný pokus může mít n různých výsledků, které jsou navzájem rovnocenné, tedy mají stejnou šanci, stejnou pravděpodobnost výskytu. Dejme tomu, že jev A nastane při m různých výsledcích (z n možných). Pak klasická pravděpodobnost jevu A je vyjádřena poměrem počtu výsledků příznivých danému jevu (m) ku počtu všech možných výsledků (n): PA ( ) m n 2

Například pravděpodobnost, že na kostce padne sudé číslo, je podle klasické definice pravděpodobnosti rovna P = 3 / 6 = 0,5. Pravděpodobnost se často vyjadřuje v procentech (%). Například uvedená pravděpodobnost P = 0,5 může být také zapsána jako P = 50%. Předpoklad, že všechny výsledky pokusu mají stejnou pravděpodobnost výskytu, je z hlediska teorie sice pochopitelný, ale v prai málo obvyklý, ne-li nereálný. Žádná hrací kostka není totiž natolik ideální, aby na ní čísla padala se stejnou pravděpodobností. Jak v takových případech určit pravděpodobnost? Pokud je možné pokus vedoucí k realizaci (nebo nerealizaci) daného jevu X opakovat, pak lze jeho pravděpodobnost odhadnout na základě počtu úspěšných pokusů při opakování. Dejme tomu, že bylo provedeno n pokusů, přičemž zkoumaný jev A nastal v m případech. Potom je možné pravděpodobnost jevu A odhadnout pomocí relativní četnosti pokusů, při kterých nastal jev A: PA ( ) m n Je zřejmé, že s rostoucím počtem pokusů n se bude uvedená relativní četnost stále více blížit k hledané pravděpodobnosti. Takto zjištěnou pravděpodobnost nazýváme statistickou neboli empirickou pravděpodobností. Teoretická definice pravděpodobnosti (klasická nebo aiomatická) na jedné straně a statistická (empirická) definice pravděpodobnosti na straně druhé jsou dva různé pohledy na jeden problém: je potřeba určit pravděpodobnost daného jevu. Teoretická definice vychází z obecných vlastností dané situace. V případě kostky abstrahuje od její nedokonalosti a bude ji považovat za ideální, na které všechny hodnoty padají se stejnou pravděpodobností. Potom lze k výpočtu pravděpodobnosti využít klasické definice a výsledkem je známá hodnota 1 / 6. Statistická definice vychází z eperimentu. Kostka bude podrobena sérii pokusů a výstupem eperimentu bude tabulka četností jednotlivých hodnot výsledků. Výsledky empirického pozorování jsou zpracovány a relativní četnost výskytu daného jevu (padnutí šestky) bude považována za jeho pravděpodobnost, resp. za její nejlepší odhad. Všimněte si, že oba pohledy jsou pouze přibližné. Ani jeden z nich neurčí pravděpodobnost přesně, ale pouze se k ní přiblíží jsou to tedy pouhé modely skutečnosti, skutečného chování zkoumané kostky. U teoretického přístupu přesnost výsledku závisí na zvolené abstrakci (idealizaci, zjednodušení) celého problému. Čím větší abstrakce, tím jednodušší výpočet, ale tím méně přesný výsledek. U empirického přístupu přesnost závisí na počtu prováděných pokusů (eperimentů). Čím více pokusů, tím přesnější výsledek. 3

Který přístup tedy zvolit? To závisí na konkrétní situaci: na informacích, které jsou k dispozici (znáte všechny elementární jevy? jsou skutečně rovnocenné?), na možnostech provedení eperimentu (dá se pokus opakovat? je náročný na prostředky, na čas?) a na dalších souvisejících faktorech. Výsledky teoretického (pravděpodobnostního) a empirického (statistického) přístupu mohou a obvykle jsou různé, ale na druhé straně se od sebe příliš neliší. 1.2 Rozdělení a charakteristiky náhodné veličiny Nyní naše pravděpodobnostní úvahy rozšíříme o další pojem náhodnou veličinu. Náhodná veličina je taková číselná proměnná, jejíž hodnotu nelze určit přesně, ale lze ji s předem danou pravděpodobností předvídat. Náhodné veličiny se ve statistice používají pro vyjádření různých dějů, které mají náhodný charakter. Náhodnou veličinou bude například teplota zítra ráno v 6 hodin naměřená na stanovišti v Praze-Komořanech nebo počet obyvatel České republiky ke dni 1.1.2015. Toto jsou číselné veličiny, jejichž hodnoty (obvykle reálná nebo celá čísla) nelze přesně stanovit, ale přesto s nimi lze pracovat. Náhodné veličiny budeme značit X, Y, Z apod., jejich hodnoty pak, y, z. Skutečnost, že náhodná veličina X nabývá hodnoty, vyjádříme vztahem: X = Množina všech hodnot, kterých náhodná veličina může nabývat, se nazývá obor hodnot náhodné veličiny. Některé náhodné veličiny nabývají hodnot pouze z konečné množiny izolovaných hodnot například výsledek hodu kostkou. Takovou náhodnou veličinu nazýváme diskrétní. Jindy tvoří obor hodnot náhodné veličiny nějaký číselný interval například kurs koruny vůči euru. V takovém případě hovoříme o spojité náhodné veličině. Chcete-li popsat chování náhodné veličiny, nestačí pouze uvést obor hodnot, kterých může nabývat. Některé hodnoty z oboru se totiž mohou vyskytovat s větší, jiné s menší pravděpodobností. Pravidlo, kterým se tato pravděpodobnost řídí, se nazývá zákon rozdělení (rozložení) náhodné veličiny. Zákon rozdělení diskrétní náhodné veličiny X lze nejjednodušeji vyjádřit pomocí pravděpodobnostní funkce p(), která přiřazuje každé reálné hodnotě z oboru hodnot veličiny X pravděpodobnost jejího výskytu. Je tedy definována jako: p( ) P( X ) Například pravděpodobnost, že na kostce padne číslo 6, můžeme napsat jako p(6). Pravděpodobnostní funkce p() diskrétní náhodné veličiny X musí splňovat tyto vlastnosti: 4

1. 0 < p( i ) < 1 pravděpodobnost je vždy z intervalu 0 až 1 2. p ( ) 1 součet všech pravděpodobností je 1 i i pro všechna i z oboru hodnot veličiny X. Pro všechny ostatní reálná čísla mimo obor hodnot veličiny X je hodnota pravděpodobnostní funkce rovna nule. Druhou možností, jak vyjádřit rozložení pravděpodobnosti diskrétní náhodné veličiny X, je distribuční funkce F(), která je definována jako: F( ) P( X ) Distribuční funkce má kumulativní charakter, pro každou reálnou hodnotu je rovna součtu pravděpodobností všech hodnot z oboru veličiny X, které jsou menší nebo rovny. Distribuční funkce F() má některé vlastnosti, které vyplývají přímo z její definice: 1. 0 F() 1 je to pravděpodobnost 2. jestliže 1 < 2, pak F( 1 ) F( 2 ) funkce je neklesající 3. lim F( ) F ( ) 0 funkce začíná v nule 4. lim F( ) F ( ) 1 funkce končí v jedničce Tyto vlastnosti platí pro všechna reálná, resp. 1 a 2. Graf distribuční funkce diskrétní náhodné proměnné má typický schodovitý průběh. Obr. 4.1 Distribuční funkce diskrétní náhodné veličiny hod kostkou Spojitá náhodná veličina je definována na intervalu, a tak je možné i u ní definovat distribuční funkci F(), a to analogickým způsobem jako pro diskrétní proměnnou tedy pomocí definičního vztahu: F( ) P( X ) 5

F() Pro distribuční funkci spojité veličiny X platí rovněž tytéž vlastnosti jako pro distribuční funkci diskrétní veličiny. Graf distribuční funkce spojité náhodné veličiny však již nebude mít schodovitý charakter, ale půjde o spojitou neklesající křivku. Distribuční funkce 1,2 1 0,8 0,6 0,4 0,2 0 0 5 10 15 20 25 30 Obr. 4.2 Distribuční funkce spojité náhodné veličiny V prai se často využívá také inverzní funkce k distribuční funkci, nazývaná kvantilová funkce nebo zkráceně pouze kvantil. Kvantil (přesněji p-kvantil) p je taková hodnota z oboru proměnné X, která dělí obor hodnot veličiny X na dva intervaly, z nichž ten levý představuje pravděpodobnost p, pravý 1 p. Kvantily tedy rozdělují obor náhodné veličiny X v určitém pravděpodobnostním poměru. Nejvýznamnější kvantily jsou: medián 0,5 neboli 50% kvantil kvartily 0,25, 0,5 a 0,75 decily 0,1, 0,2,, 0,9 Všimněte si, že např. kvartily dělí pravděpodobnostní prostor na 4 části (intervaly) se stejnou pravděpodobností. Prostřední kvartil je shodný s mediánem. Ve statistické prai sehrávají důležitou roli také dva kvantily 0,025 a 0,975, které vymezují 95% interval hodnot náhodné proměnné X kolem střední hodnoty. S těmito kvantily (a také s důvodem, proč jsou důležité) se podrobněji seznámíte zejména v další kapitole. Pro spojitou náhodnou veličinu nemá teoretický ani praktický smysl určovat pravděpodobnost, že nabývá nějaký konkrétní hodnoty, tj. počítat P(X = ). Z tohoto důvodu není pro spojité náhodné veličiny definována pravděpodobnostní funkce p(). Představte si, že máte zkoumat rozložení příjmů obyvatel České republiky. Nemá asi praktický význam zjišťovat, s jakou pravděpodobností bude mít náhodně vybraný občan 6

f() průměrný měsíční příjem přesně 20 000 Kč. Stačí, aby se jeden jeho měsíční příjem změnil o jediný haléř (například zaokrouhlením) a vznikla by nová situace s novým rozložením pravděpodobnosti. Naopak užitečné může být zjištění, s jakou pravděpodobností bude příjem náhodně vybraného občana ležet v nějakém konkrétním intervalu, například mezi 18 000 a 22 000 Kč. U spojitých náhodných veličin se proto určuje pouze pravděpodobnost na intervalu, například P(a < X < b). Platí přitom: P( a X b) F( b) F( a ) Tento vztah se dokonce nezmění, ani když některou z ostrých nerovností nahradíte neostrou. U spojité náhodné proměnné tedy nezáleží na tom, zda krajní hodnoty do zkoumaného intervalu patří nebo ne. Místo pravděpodobnostní funkce se k popisu rozdělení pravděpodobnosti spojité náhodné veličiny používá funkce, která ji plnohodnotně zastupuje. Je to tzv. frekvenční funkce neboli funkce hustoty pravděpodobnosti f(), která je v oboru hodnot náhodné veličiny X definovaná jako derivace její distribuční funkce: f( ) df( ) d Hustota pravděpodobnosti může nabývat i hodnot vyšších než 1. Pochopitelně však nemůže být záporná. Pro všechny reálné hodnoty mimo obor náhodné proměnné X je hustota pravděpodobnosti rovna nule. Graf hustoty pravděpodobnosti je spojitá křivka, která začíná i končí v nule. Nad osou vymezuje plochu, která představuje pravděpodobnostní prostor je rovna 1. 0,16 Frekvenční funkce a pravděpodobnost 0,14 0,12 0,1 P(a<X<b) 0,08 0,06 0,04 0,02 0 a b Obr. 4.3 Hustota pravděpodobnosti spojité náhodné veličiny 7

Geometrická interpretace funkce hustoty pravděpodobnosti je jako obalová křivka pravděpodobnostního prostoru. Pravděpodobnost příslušnosti hodnoty do intervalu (a, b) můžeme vyjádřit jako plochu vymezenou křivkou frekvenční funkce, krajními hodnotami = a, = b a osou. Analyticky můžeme tento vztah zapsat jako určitý integrál: b P( a X b) f ( ) d a Náhodnou veličinu lze charakterizovat pomocí číselných charakteristik, které jsou významově obdobné charakteristikám, jaké se používají pro vyjádření statistických znaků. Mezi nejpoužívanější charakteristiky patří střední hodnota a směrodatná odchylka, resp. rozptyl. Střední hodnota E(X) náhodné veličiny X představuje pomyslný střed oboru této veličiny, kolem kterého kolísají jednotlivé hodnoty. Symbol E pochází z anglického termínu epected value, tedy očekávaná hodnota. Střední hodnota diskrétní náhodné veličiny X se spočítá podle vzorce: E( X ) p( ) i i i Rozptyl D(X) náhodné veličiny X vyjadřuje míru kolísání hodnot této veličiny kolem její střední hodnoty. Čím větší je rozptyl, tím horší vypovídací schopnost o vlastnostech náhodné veličiny má samotná střední hodnota. Rozptyl diskrétní náhodné veličiny se spočítá podle vzorce: D( X) p( ) E( X ) i 2 2 i i Střední hodnota a rozptyl spojité náhodné veličiny X se spočítají analogicky, pouze sumu přes celý obor náhodné veličiny X nahradí určitý integrál a pravděpodobnostní funkci funkce hustoty pravděpodobnosti. V tomto tetu nebudeme uvedené vzorce (naštěstí) potřebovat. Směrodatná odchylka SD(X) náhodné veličiny X se spočítá stejně jako u statistického znaku: SD( X ) D( X ) 1.3 Normální rozdělení pravděpodobnosti Nejdůležitějším rozdělením spojité náhodné proměnné, které statistika zná, je tzv. normální rozdělení. Normální rozdělení slouží jako pravděpodobnostní model chování velkého množství jevů v technice, přírodních vědách i ekonomii, například: rozložení hodnot IQ v populaci; rozložení hmotnosti výrobků v sériové (pásové) výrobě; 8

rozložení týdenního počtu zákazníků v restauraci. Pokud má náhodná veličina X normální rozdělení se střední hodnotou μ a směrodatnou odchylkou σ (nebo rozptylem σ 2 ), stručně rozdělení N(μ; σ 2 ), říkáme takové veličině normální náhodná veličina. Normální náhodná veličina je definovaná pro všechna reálná čísla, což znamená, že může nabývat libovolné reálné hodnoty z intervalu (- ; + ). Graf hustoty pravděpodobnosti normálního rozdělení má typický zvonovitý tvar, pro který se ujalo označení Gaussova křivka. Tato funkce má maimum v bodě = μ, kolem kterého je rovněž symetrická, a pro ± se asymptoticky blíží k ose. Stejný průběh a vlastnosti má každé normální rozdělení bez ohledu na jeho parametry. 0,05 NORMÁLNÍ ROZDĚLENÍ Hustota pravděpodobnosti f() N(100;100) 1,0 NORMÁLNÍ ROZDĚLENÍ Distribuční funkce F() N(100;100) 0,04 0,8 0,03 0,6 0,02 0,4 0,01 0,2 0,00 50 60 70 80 90 100 110 120 130 140 150 0,0 50 60 70 80 90 100 110 120 130 140 150 Obr. 4.4 Hustota pravděpodobnosti a distribuční funkce normální náhodné veličiny Mimořádné postavení normálního rozdělení mezi ostatními rozděleními náhodné veličiny formuluje tzv. centrální limitní věta. Zjednodušeně ji lze vyjádřit jako: Součet (nebo aritmetický průměr) náhodně vytvořených nezávislých hodnot veličiny s libovolným rozdělením se s rostoucím počtem sčítanců blíží k náhodné veličině s normálním rozdělením. Znamená to, že budeme-li mít v prai veličinu, jejíž chování je způsobeno vlivem většího množství malých nezávislých vlivů, bude se tato veličina svým chováním blížit veličině s rozdělením normálním. Chceme-li počítat pravděpodobnosti pro normální náhodnou veličinu, potřebovali bychom rovnici její distribuční funkce. Distribuční funkci normálního rozdělení však nelze vyjádřit pomocí funkcí známých ze střední školy, proto ji také nespočítáme na kalkulačce. Dříve se k určení pravděpodobnosti normální náhodné veličiny používaly statistické tabulky, dnes stačí mít k dispozici počítač a program Microsoft Ecel. 9

V Ecelu najdete funkce pro hustotu pravděpodobnosti, distribuční funkci i kvantily normálního rozdělení N(μ; σ 2 ) se střední hodnotou μ a rozptylem σ 2. NORM.DIST(; μ; σ; 0) NORM.DIST(; μ; σ; 1) NORM.INV(p; μ; σ) hustota pravděpodobnosti f() distribuční funkce F() kvantil normální proměnné p Všimněte si, že ecelovské funkce NORM.DIST a NORM.INV používají místo rozptylu σ 2 jako parametr směrodatnou odchylku σ. V souvislosti s normální náhodnou proměnnou X můžeme řešit 4 základní typy úloh: a) výpočet levostranné pravděpodobnosti P(X < ); b) výpočet pravostranné pravděpodobnosti P(X > ); c) výpočet pravděpodobnosti na intervalu P(a < X < b); d) nalezení hodnoty p-kvantilu p. ad a) Mějme tedy úlohu, kdy potřebujeme určit pravděpodobnost P(X < ) pro normální náhodnou veličinu X. Z definice distribuční funkce víme, že tato pravděpodobnost je rovna přímo hodnotě distribuční funkce veličiny X, čili P(X < ) = F(). V Ecelu můžeme tuto pravděpodobnost určit přímo pomocí funkce NORM.DIST. P(X < ) = F() NORM.DIST(; μ; σ; 1) Obr. 4.5 Levostranná pravděpodobnost v normálním rozdělení ad b) Pokud chceme určit pravostrannou pravděpodobnost, že náhodná veličina X dosahuje hodnoty větší než, čili P(X > ), můžeme využít vztahu: P( X ) 1 P( X ) 1 F( ) Úlohu tak opět převedeme na známé hledání hodnoty distribuční funkce. P(X > ) = 1 - F() 1 - NORM.DIST(; μ; σ; 1) 10

Obr. 4.6 Pravostranná pravděpodobnost v normálním rozdělení ad c) Nyní si ještě ukážeme, jak určit pravděpodobnost, že hodnota náhodné proměnné X leží v daném intervalu (a; b), čili: a < X < b. Využijeme-li vlastností distribuční funkce, můžeme psát: P( a X b) F( b) F( a ) V prai to znamená, že stačí určit hodnotu distribuční funkce obou krajních mezí intervalu a ty pak od sebe odečíst. P(a < X < b) = F(b) - F(a) NORM.DIST(b; μ; σ; 1) - NORM.DIST(a; μ; σ; 1) Obr. 4.7 Pravděpodobnost na intervalu v normálním rozdělení ad d) Poslední základní úlohou, kterou si uvedeme, je nalezení kvantilu pravděpodobnosti p = P(X < p k dané p ). Tato úloha je vlastně zpětným postupem k hledání distribuční funkce, v Ecelu k nalezení kvantilu použijeme funkci NORM.INV. V prai velmi často potřebujeme najít symetrický interval, který vymezuje pravděpodobnost rovnu p symetricky kolem střední hodnoty. Tento interval je ve skutečnosti vymezen kvantily 1 p 2 a 1 p 2. Například 90% symetrický interval je vymezen kvantily na hladině 5 % a 95 %, tedy hodnotami 5% a 95%. Mezi všemi normálními rozděleními má specifické postavení tzv. normované normální rozdělení Z se střední hodnotou 0 a rozptylem 1. Platí tedy: EZ ( ) 0 D (Z) 1 Pro distribuční funkci rozdělení Z eistuje v Ecelu speciální funkce NORM.S.DIST, pro kvantil tohoto rozdělení funkce NORM.S.INV. Pokud X bude normální náhodná veličina s rozdělením N(μ; σ 2 ) a Z normovaná normální náhodná veličina, bude mezi jejich hodnotami a z platit vztah: 11

z a naopak: z Normovaná náhodná veličina z tedy udává vzdálenost hodnoty od střední hodnoty normálního rozdělení μ v násobcích směrodatné odchylky σ. Normované normální rozdělení Z se využívalo zejména v dobách statistických tabulek. Aby nebylo třeba vytvářet tabulky pro velké množství různých rozdělení, eistovaly pouze tabulky distribuční funkce a kvantilů rozdělení Z. Všechny úlohy na normální rozdělení se nejprve převedly podle výše uvedených vztahů na normované rozdělení Z, jehož hodnoty se již daly dohledat v tabulkách. V současné době se toto rozdělení využívá především v odhadech a testech, jak uvidíte v následující kapitole. 12

Vyzkoušejte si sami 1. Ve finále televizní soutěže je v osudí 10 míčků, z toho 3 červené. Při losování si soutěžící náhodně vytáhne z osudí 2 míčky. Pokud jsou oba červené, vyhrál hlavní cenu. V loňském roce v 52 losováních vyhrálo hlavní cenu pouze 5 soutěžících. a) Určete teoretickou pravděpodobnost, že soutěžící ve finále vyhraje hlavní cenu. b) Určete statistickou pravděpodobnost, že soutěžící ve finále vyhraje hlavní cenu. c) Porovnejte oba výsledky. 2. Diskrétní náhodná veličina X nabývá celočíselných hodnot 0 až 4 s těmito pravděpodobnostmi: X 0 1 2 3 4 p() 0,11 0,25 0,28 0,22 a) Doplňte tabulku pravděpodobnostní funkce o chybějící číslo. b) Určete pravděpodobnosti P(2 < X 4) a P(2 X < 4). c) Spočítejte střední hodnotu a směrodatnou odchylku náhodné veličiny X. 3. Testy nových baterií SCALA ukazují, že průměrná životnost baterie je 230 hodin se směrodatnou odchylkou 20 hodin. Předpokládejme, že životnost baterie má přibližně normální rozdělení pravděpodobnosti. a) Jaká je pravděpodobnost, že náhodně vybraná baterie vydrží déle než 250 hodin? b) Jakou životnost má výrobce uvést do specifikace, aby této hodnotě vyhovovalo minimálně 95% všech vyrobených baterií? 13