PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA

Podobné dokumenty

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

8. Normální rozdělení

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

Náhodné chyby přímých měření

ÚSTAV MATEMATIKY A DESKRIPTIVNÍ GEOMETRIE. Matematika 0A4. Cvičení, letní semestr DOMÁCÍ ÚLOHY. Jan Šafařík

Diskrétní náhodná veličina

KGG/STG Statistika pro geografy

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Normální (Gaussovo) rozdělení

8 Střední hodnota a rozptyl

3 Bodové odhady a jejich vlastnosti

Základy teorie odhadu parametrů bodový odhad

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Výběrové charakteristiky a jejich rozdělení

Diskrétní náhodná veličina. November 12, 2008

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

7. Rozdělení pravděpodobnosti ve statistice

Pravděpodobnost a matematická statistika

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Náhodné (statistické) chyby přímých měření

STATISTICKÉ ZJIŠŤOVÁNÍ

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

Základy teorie pravděpodobnosti

Regresní analýza 1. Regresní analýza

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Odhad parametrů N(µ, σ 2 )

PRAVDĚPODOBNOST A STATISTIKA

Příklad 1. Řešení 1a. Řešení 1b. Řešení 1c ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 7

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která

ROZDĚLENÍ NÁHODNÝCH VELIČIN

15. T e s t o v á n í h y p o t é z

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně

KGG/STG Statistika pro geografy

Číselné charakteristiky a jejich výpočet

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

Testování statistických hypotéz

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

PRAVDĚPODOBNOST A STATISTIKA

Pravděpodobnost a aplikovaná statistika

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový.

12. cvičení z PST. 20. prosince 2017

Téma 22. Ondřej Nývlt

Pojem a úkoly statistiky

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ

Odhad parametrů N(µ, σ 2 )

PRAVDĚPODOBNOST A STATISTIKA aneb Krátký průvodce skripty [1] a [2]

Náhodná veličina a rozdělení pravděpodobnosti

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

MATEMATICKÁ STATISTIKA

Charakterizace rozdělení

PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA

15. T e s t o v á n í h y p o t é z

Náhodný vektor a jeho charakteristiky

4. ZÁKLADNÍ TYPY ROZDĚLENÍ PRAVDĚPODOBNOSTI DISKRÉTNÍ NÁHODNÉ VELIČINY

Chyby měření 210DPSM

Jednofaktorová analýza rozptylu

Normální rozložení a odvozená rozložení

Statistika pro geografy

Rozdělení náhodné veličiny. Distribuční funkce. Vlastnosti distribuční funkce

Aplikovaná numerická matematika

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

Praktická statistika. Petr Ponížil Eva Kutálková

Normální (Gaussovo) rozdělení

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu.

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Testování hypotéz o parametrech regresního modelu

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Cvičení ze statistiky - 8. Filip Děchtěrenko

2. Bodové a intervalové rozložení četností

Tomáš Karel LS 2012/2013

10. N á h o d n ý v e k t o r

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

4ST201 STATISTIKA CVIČENÍ Č. 7

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

STATISTICKÉ ODHADY Odhady populačních charakteristik

Nestranný odhad Statistické vyhodnocování exp. dat M. Čada

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

I. D i s k r é t n í r o z d ě l e n í

Regresní a korelační analýza

NÁHODNÉ VELIČINY JAK SE NÁHODNÁ ČÍSLA PŘEVEDOU NA HODNOTY NÁHODNÝCH VELIČIN?

Testování hypotéz o parametrech regresního modelu

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

Transkript:

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FAKULTA STAVEBNÍ HELENA KOUTKOVÁ PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA MODUL GA03 M3 ZÁKLADY TEORIE ODHADU STUDIJNÍ OPORY PRO STUDIJNÍ PROGRAMY S KOMBINOVANOU FORMOU STUDIA

c Helena Koutková, Brno 2004

Obsah Úvod.................................... 4 Označení.................................. 5 1 Náhodný výběr a statistiky 6 1.1 Náhodný výběr........................... 6 1.1.1 Rozdělení četností a jejich znázornění........... 9 1.2 Statistiky.............................. 13 1.3 Kontrolní otázky.......................... 15 1.4 Cvičení................................ 16 1.5 Klíč a výsledky cvičení....................... 17 2 Bodový odhad 18 2.1 Vlastnosti odhadů.......................... 20 2.1.1 Nestranný odhad...................... 20 2.1.2 Nejlepší nestranný odhad.................. 21 2.1.3 Střední kvadratická chyba................. 22 2.1.4 Konzistentní odhad..................... 23 2.2 Kontrolní otázky.......................... 26 2.3 Cvičení................................ 26 2.4 Klíč a výsledky cvičení....................... 27 3 Intervalový odhad 28 3.1 Intervalové odhady parametrů normálního rozdělení....... 30 3.1.1 Intervalový odhad střední hodnoty............ 33 3.1.2 Intervalový odhad rozptylu................. 40 3.2 Kontrolní otázky.......................... 43 3.3 Cvičení................................ 44 3.4 Klíč a výsledky cvičení....................... 45 A Tabulky 46 Literatura 51

Úvod V tomto modulu se seznámíte se základy teorie odhadu, která je částí matematické statistiky. V teorii pravděpodobnosti jste předpokládali, že máte o náhodné veličině z pravděpodobnostního hlediska úplnou informaci, tj. předpokládali jste, že znáte rozdělení pravděpodobnosti náhodné veličiny a zabývali jste se studiem jeho vlastností. Úlohou teorie odhadu je určit (odhadnout) rozdělení sledované náhodné veličiny, a to na základě jejích napozorovaných hodnot. Známe-li typ rozdělení náhodné veličiny, omezuje se úloha teorie odhadu na určení (odhad) parametrů nebo určitých funkcí parametrů tohoto typu rozdělení. Modul je rozdělen na tři kapitoly. V kapitole 2 a 3 předpokládáme, že je znám typ rozdělení náhodné veličiny. Kapitola 1 je určena k zavední základních pojmů, ze kterých vychází nejen teorie odhadu, ale celá matematická statistika. Dozvíte se, jaké napozorované hodnoty sledované veličiny máme na mysli a jakým způsobem lze tyto hodnoty popsat. Kapitola 2 je věnována bodovému odhadu a jeho vlastnostem. Ze zjištěných hodnot náhodné veličiny budeme chtít vypočítat jediné číslo, které budeme považovat za odhad parametru nebo funkce parametrů rozdělení této náhodné veličiny. Samozřejmě budeme požadovat, aby tento odhad měl nějaké rozumné vlastnosti. Kapitola 3 je věnována kvalitativně vyššímu typu odhadu. Zde budeme hledat interval, který bude s předem danou vysokou pravděpodobností obsahovat skutečnou hodnotu parametru nebo funkce parametrů rozdělení. V tomto případě budeme hovořit o intervalovém odhadu. V jednotlivých kapitolách jsou řešené příklady bezprostředně navazující na probírané učivo. Na konci každé kapitoly jsou uvedeny podkapitoly Kontrolní otázky, Cvičení a Klíč a výsledky cvičení. Pro další procvičení látky probírané v tomto a následujícím modulu autorka doporučuje literaturu [9]. Požadované znalosti Pro studium a pochopení tohoto modulu potřebujete znát základy teorie pravděpodobnosti a to především pojmy: náhodná veličina a vektor, obor hodnot náhodné veličiny a vektoru, pravděpodobnost, rozdělení pravděpodobnosti, rozdělovací funkce - hustota a pravděpodobnostní funkce, distribuční funkce, střední hodnota, rozptyl, směrodatná odchylka a kvantil rozdělení, nezávislost náhodných veličin. Dále byste měli znát základní informace o následujících typech rozdělení: normálním rozdělení s parametry µ a σ 2, t-rozdělení s n stupni volnosti a χ 2 - rozdělení s n stupni volnosti (včetně tvarů jejich grafů), alternativním rozdělení s parametrem p, Poissonově rozdělení s parametrem λ. Autorka děkuje RNDr. Marii Budíkové, Dr. z PřF MU v Brně a svému kolegovi RNDr. Oldřichu Dlouhému za přečtení textu a cenné připomínky.

Označení R množina reálných čísel A 1 A 2 A n kartézský součin množin A 1, A 2,..., A n A n } A A {{ A } n krát exp(x) e x E(X) střední hodnota náhodné veličiny X D(X) rozptyl náhodné veličiny X x(α) 100 α procentní kvantil náhodné veličiny X N(µ, σ 2 ) normální rozdělení s parametry µ, σ 2 Φ distribuční funkce N(0, 1) ϕ hustota N(0, 1) u(α) 100 α procentní kvantil N(0, 1) χ 2 (n) χ 2 - rozdělení [Pearsonovo rozdělení] s n stupni volnosti χ 2 (n; α) 100 α procentní kvantil χ 2 (n) t(n) t - rozdělení [Studentovo rozdělení] s n stupni volnosti t(n; α) 100 α procentní kvantil t(n) Kartézský součin množin Jsou-li A 1, A 2,..., A n libovolné neprázdné množiny, potom A 1 A 2 A n je množina, jejíž prvky jsou všechny možné n-tice vytvořené tak, že první člen n-tice je prvek množiny A 1, druhý člen n-tice je prvek množiny A 2,..., n-tý člen n-tice je prvek množiny A n. Zapsáno formálně A 1 A 2 A n = { (a 1, a 2,..., a n ); a 1 A 1, a 2 A 2,... a n A n }. Např. 0, 1 0, 2 = { (x, y); x 0, 1, y 0, 2 }. Disjunktní množiny Množiny A 1, A 2,..., A n se nazývají disjunktní, jestliže každé dvě různé množiny nemají společné prvky, tj. jestliže Např. množiny A i A j = pro každé i j; i, j = 1, 2,... n. jsou disjunktní a množiny nejsou disjunktní. (, 1, (1, 2, (2, 3 (, 1, 1, 2, (2, 3

Kapitola 1 Náhodný výběr a statistiky Cíle Po přečtení a nastudování této kapitoly budete: znát, co je náhodný výběr z rozdělení X a jeho realizace; umět realizaci náhodného výběru z X roztřídit do tříd tak, aby byla přehlednější. Dále pak stanovit četnosti těchto tříd a znázornit je graficky; vědět, co to je statistika a naučíte se počítat nejjednodušší výběrové charakteristiky - výběrový průměr, rozptyl a směrodatnou odchylku. Doba potřebná ke studiu K nastudování a pochopení této kapitoly byste měli potřebovat asi 3 hodiny. Klíčová slova Náhodný výběr a jeho realizace, rozsah výběru, rozdělení četností, úsečkový diagram, histogram, statistika, výběrový průměr, výběrový rozptyl, výběrová směrodatná odchylka. 1.1 Náhodný výběr V praxi nebývá rozdělení náhodné veličiny jako je např. hmotnost dávky, pevnost materiálu, životnost výrobku, počet vozidel čekajících na zelenou apod. známé. Abychom o něm získali další informace, budeme opakovat pokus (měření, pozorování), jehož neznámým výsledkem je sledovaná náhodná veličina. Tak např. pro zjištění hmotnosti dávky z konkrétního dávkovače, který pracuje za ustálených provozních podmínek, náhodně vybereme n dávek (tj. tak, aby každá dávka měla stejnou pravděpodobnost, že bude zahrnuta do výběru) a zvážíme je. Při zjišťování krychelné pevnosti betonu vyrobeného na určité betonárce za daných podmínek budeme měřit pevnost na n zkušebních kostkách z téhož betonu. Budeme tedy obecně n-krát opakovat pokus, ve kterém pozorujeme sledovanou náhodnou veličinu. Uvědomme si, že před tím, než pokus provedeme

1.1 Náhodný výběr 7 a zapíšeme výsledek, je výsledek pokusu náhodná veličina s určitým typem rozdělení. Když pokus zrealizujeme a zapíšeme výsledek, dostaneme konkrétní číselnou hodnotu (tj. realizaci) této náhodné veličiny. Pokusme se nyní naše úvahy o opakování pokusu upřesnit. Uvažujme náhodný pokus, jehož neznámým výsledkem je náhodná veličina X s určitým typem rozdělení pravděpodobnosti a uvažujme n (n 1) nezávislých opakování tohoto pokusu. Označme pro i = 1, 2..., n jako X i neznámý výsledek i-tého opakování pokusu. Dostaneme náhodný vektor X = (X 1, X 2,..., X n ), jehož složky X 1, X 2,..., X n jsou nezávislé náhodné veličiny. Jestliže během celého experimentu, tj. během n opakování pokusu, nedojde ke změně podmínek, které pokus definují, budou mít složky X 1, X 2,..., X n náhodného vektoru X stejné rozdělení jako veličina X. Náhodný vektor s těmito dvěmi vlastnostmi nazýváme náhodný výběr z rozdělení X o rozsahu n, někdy pak stručněji náhodný výběr z daného rozdělení nebo náhodný výběr z X. Provedeme-li celý experiment a zapíšeme výsledek, dostaneme n-tici reálných čísel (x 1, x 2,..., x n ) - tzv. realizaci náhodného výběru. Tedy x i je známý výsledek i-tého opakování pokusu (i = 1,..., n). Množinu všech možných realizací náhodného výběru, tj. množinu všech možných hodnot náhodného vektoru X, nazýváme výběrový prostor a značíme V. Je-li Ω obor hodnot náhodné veličiny X a je-li (X 1, X 2,..., X n ) náhodný výběr z X, potom výběrový prostor je množina Ω n. Příklad 1.1: Označme X neznámý výsledek měření vzálenosti d konkrétním měřicím přístrojem, který nevykazuje systematickou chybu (tj. náhodné chyby měření kolísají okolo nuly). Změříme-li n-krát tuto vzdálenost za stejných podmínek (tj. nestane-li se nic, co by ovlivnilo kvalitu měřicího přístroje) a zapíšeme výsledek, dostaneme realizaci (x 1, x 2,..., x n ) náhodného výběru (X 1, X 2,..., X n ) z X. Příklad 1.2: Označme V počet vozidel, které projedou konkrétním místem dálnice mezi sedmou a osmou hodinou ranní pracovního dne zimního období. Jestliže během n dní, které vyhovují výše uvedeným podmínkám, budeme na daném místě dálnice pozorovat počet projíždějících vozidel a zapisovat výsledky, dostaneme realizaci náhodného výběru z V o rozsahu n. Všimněte si všech vyjmenovaných podmínek! Spojit např. pozorování v zimním a letním období za jinak stejných výše uvedených podmínek, by znamenalo porušení stálosti podmínek. Pozorování by byla sice nezávislá, ale neměla by stejné rozdělení, protože charakter provozu je v zimě jiný než v létě. Jednalo by se o dva náhodné výběry z téhož typu rozdělení ale s různými hodnotymi parametrů. Z realizace náhodného výběru můžeme vypočítat průměrnou hodnotu, zjistit minimální a maximální hodnotu a různým jiným způsobem realizaci popsat. Takto pracuje popisná statistika. Budeme-li chtít např. v příkladě 1.1 odhadnout skutečnou vzdálenost d, měl by asi každý tendenci za odhad vzít právě průměrnou hodnotu měření, tj. číslo x = 1 n n i=1 x i. Provedeme-li ale celý

8 Náhodný výběr a statistiky experiment znovu, tj. znovu n-krát změříme vzdálenost d, dostaneme jinou realizaci náhodného výběru a tedy i jinou hodnotu průměru. Vidíme tedy, že i sám průměr je náhodná veličina, jejíž realizace kolísají od jednoho výběru k druhému. Před provedením experimentu pak můžeme odhad d psát ve tvaru X = 1 n n i=1 X i, tj. jako funkci náhodného výběru - takovou funkci budeme nazývat statistikou. Při našem odhadování se můžeme dopustit chyby, jejíž velikost lze vyjádřit jako vzdálenost průměru od měřené vzdálenosti d. Chceme-li např. zjistit, zda je námi zvolený odhad nejlepším možným odhadem (viz kapitola 2), nebo ohodnotit přesnost a spolehlivost odhadu (viz kapitola 3), tj. stanovit hranice, které chyba odhadu nepřekročí s vysokou pravděpodobností, musíme využít teorii pravděpodobnosti. K tomu potřebujeme obecně znát typ rozdělení, z něchož výběr pochází. V našem případě je známo, že se jedná o náhodný výběr z rozdělení N(µ, σ 2 ), kde µ = d je skutečná vzdálenost a rozptyl σ 2 charakterizuje přesnost měřícího přístroje. Chtěli jsme tedy ve skutečnosti odhadnout parametr µ, tj. střední hodnotu normálního rozdělení. Věnujme se ještě rozdělení náhodného výběru. Vzhledem k tomu, že jsou složky X 1, X 2,..., X n náhodného výběru (X 1, X 2,..., X n ) z rozdělení X nezávislé a mají stejné rozdělení jako veličina X, dostáváme: Tvrzení 1.1: Rozdělení náhodného výběru Má-li náhodná veličina X distribuční funkci G, potom má náhodný výběr (X 1, X 2,..., X n ) z X distribuční funkci H(x 1, x 2,..., x n ) = G(x 1 ) G(x 2 )... G(x n ). Má-li náhodná veličina X rozdělovací funkci g, potom má náhodný výběr (X 1, X 2,..., X n ) z X rozdělovací funkci h(x 1, x 2,..., x n ) = g(x 1 ) g(x 2 )... g(x n ). Odtud plyne: Známe-li typ rozdělení náhodné veličiny X, pak známe i typ rozdělení náhodného výběru z X. Jestliže rozdělení náhodné veličiny X závisí na nějakých neznámých konstantách (parametrech), pak na těchto parametrech závisí i rozdělení náhodného výběru z X. Příklad 1.3: Určete rozdělovací funkci náhodného výběru (X 1, X 2,..., X n ) z normálního rozdělení. Řešení : Hustota f náhodné veličiny X N(µ, σ 2 ) je pro x R f = f(x; µ, σ 2 ) = 1 [ exp 1 ] 2πσ 2σ (x 2 µ)2, kde (µ, σ 2 ) (, ) (0, ).

1.1 Náhodný výběr 9 Obor hodnot Ω náhodné veličiny X je R. Je-li (X 1, X 2,..., X n ) náhodný výběr z rozdělení X, potom je výběrový prostor množina R n. Hustota s náhodného výběru (X 1, X 2,..., X n ) z X je pro (x 1, x 2,..., x n ) R n s = s(x 1, x 2,..., x n ; µ, σ 2 ) = f(x 1 ; µ, σ 2 ) f(x 2 ; µ, σ 2 )... f(x n ; µ, σ 2 ) 1 [ = ( 2πσ) exp 1 [ (x1 µ) 2 + (x n 2σ 2 2 µ) 2 + + (x n µ) 2]], kde (µ, σ 2 ) (, ) (0, ). 1.1.1 Rozdělení četností a jejich znázornění Je-li rozsah n realizace (x 1, x 2,..., x n ) náhodného výběru z X velký, potom pro větší přehlednost a další analýzu hodnoty x 1, x 2,..., x n roztřídíme do k disjunktních tříd Ω j, j = 1, 2,..., k, a to zpravidla následovně: 1. Je-li mezi zjištěnými hodnotami jen malý počet navzájem různých hodnot, volíme každou hodnotu za třídu Ω j. Mluvíme o tzv. prostém třídění. 2. Je-li mezi zjištěnými hodnotami značně velký počet různých hodnot, volíme za třídy Ω j intervaly. Mluvíme o tzv. skupinovém třídění. Toto třídění je subjektivní, i když existují určitá objektivní pravidla. Např. se doporučuje, aby počet k tříd byl 5 20 podle rozsahu výběru n nebo k. = n nebo k. = 1 + 3.3 log 10 n. Při skupinovém třídění se pak často doporučuje, aby: 1. délka intervalů byla stejná; 2. hranice a středy intervalů byly pokud možno zaokrouhlená čísla. Postup při třídění si ukážeme na příkladech, ale před tím zavedeme ještě další pojmy. Označme n j f j = n j n tzv. absolutní četnost j-té třídy Ω j, tj. počet výsledků, které padly do j-té třídy Ω j, pro j = 1, 2..., k; tzv. relativní četnost j-té třídy Ω j, tj. podíl absolutní četnosti n j a rozsahu výběru n, pro j = 1, 2..., k. Relativní četnost f j aproximuje pravděpodobnost, že náhodná veličina X nabude hodnoty z třídy Ω j pro j = 1, 2..., k. Pro četnosti zřejmě platí n 1 + n 2 + + n k = n, f 1 + f 2 + + f k = 1. Výsledky třídění shrnujeme do tzv. tabulky rozdělení četností, ve které jsou uvedeny třídy s příslušnými absolutními, resp. relativními četnostmi a v případě skupinového třídění středy intervalů.

10 Náhodný výběr a statistiky Příklad 1.4: Při kontrole vytíženosti vjezdu do určité křižovatky byly zjištěny následující počty vozidel, čekajících ve frontě u semaforu: 5, 1, 2, 5, 2, 5, 9, 5, 2, 5, 2, 3, 4, 7, 4, 5, 1, 3, 8, 5, 2, 6, 5, 8, 6, 7, 4, 1, 1, 4, 2, 3, 3, 3, 5, 6, 2, 4, 1, 3, 4, 5, 6, 4, 9, 6, 5, 2, 1, 6, 6, 2, 6, 2, 7, 6, 7, 6, 3, 7, 3, 6, 1, 2, 4, 4, 3, 3, 5, 3, 5, 4, 6, 3, 3, 4, 3, 5, 3, 1, 1, 1, 4. Setavte tabulku rozdělení četností počtu čekajících vozidel. Řešení: Označme X počet vozidel čekajících na zelenou. Máme k dispozici realizaci (x 1, x 2,..., x n ) náhodného výběru z diskrétního rozdělení o rozsahu n = 83. Mezi zjištěnými hodnotami se vyskytují pouze celá čísla 1 až 9. Zvolme tato čísla za třídy Ω j (j = 1, 2,..., 9). Pro určení absolutních četností tříd Ω j musíme zjistit, kolikrát se v realizaci vyskytlo číslo j. Bez využití výpočetní techniky postupujeme pomocí čárkovací metody tak, že postupně čteme hodnoty z realizace a každou z nich zařadíme do příslušné třídy napsáním čárky. Přitom píšeme vždy čtyři čárky svisle, každou pátou čárkou čtveřici přeškrtneme (u nás podtrhneme). Výsledky jsou uvedeny v tabulce 1.1. Tento postup je pracný a asi by jej dnes již nikdo nepoužíval a pro třídění by použil např. EXCEL nebo nějaký statistický software. Seřadíme-li např. v Excelu hodnoty realizace vzestupně, není již problém zjistit absolutní četnosti jednotlivých tříd. Navíc můžeme využít nabídku Nástroje Analýza dat Histogram. Pomocí této nabídky získáme tabulku rozdělení absolutních četností a tzv. histogram absolutních četností, o kterém budeme hovořit později. Musíme ale zadat horní hranice tříd (u nás čísla 1 až 9). Tabulka 1.1: Rozdělení četností počtu vozidel čekajících na zelenou Počet Absolutní Relativní vozidel četnost četnost j n j f j 1 10 0.1205 2 11 0.1325 3 15 0.1807 4 12 0.1446 5 14 0.1687 6 12 0.1446 7 5 0.0602 8 2 0.0241 9 2 0.0241 Součet 83 1.0000 V případě skupinového třídění, tj. především v případě realizace náhodného výběru ze spojitého rozdělení, kdy za třídy Ω j volíme intervaly, můžeme postupovat např. následovně.

1.1 Náhodný výběr 11 Z realizace (x 1, x 2,..., x n ) náhodného výběru z X o rozsahu n zjistíme nejmenší hodnotu x min a největší hodnotu x max. Zřejmě x i x min, x max pro každé i = 1, 2,..., n. Interval x min, x max nazýváme variační obor realizace. Vhodně zvolíme interval a, b x min, x max. Interval a, b rozdělíme stejně vzdálenými body t 0, t 1,..., t k takovými, že a = t 0 < t 1 < < t k = b na k podintervalů Ω j = (t j 1, t j stejné délky d = t j t j 1 (j = 1, 2,..., k). Číslo t j se nazývá horní hranice třídy Ω j, číslo t j 1 se nazývá dolní hranice třídy Ω j. Střed třídy Ω j značíme x j. Zřejmě x j = (t j 1 + t j )/2 pro j = 1, 2,..., k. Příklad 1.5: o Při stavbě betonové konstrukce bylo odebráno 40 vzorků betonové směsi. Po 28 dnech vykázaly kostky tuto krychelnou pevnost v MPa: 23.5, 28.0, 25.1, 30.8, 27.1, 29.3, 32.5, 33.8, 30.4, 26.2, 30.8, 29.2, 30.9, 28.6, 27.5, 28.0, 31.2, 28.2, 30.7, 28.8, 32.7, 29.0, 31.9, 25.4, 32.6, 27.4, 33.1, 29.6, 29.7, 30.3, 26.8, 30.4, 25.6, 34.0, 34.8, 27.2, 31.5, 32.3, 29.7, 32.4. Sestavte tabulku rozdělení četností pevnosti betonu. Řešení: Náhodnou veličinou X je zde pevnost betonu. Máme k dispozici realizaci (x 1, x 2,..., x n ) náhodného výběru z X o rozsahu n = 40. Vzhledem k tomu, že se jedná o náhodný výběr ze spojitého rozdělení, roztřídíme realizaci náhodného výběru do k intervalů Ω j = (t j 1, t j (j = 1,..., k) stejné délky d. Počet k intervalů zvolíme k =. n = 40 =. 6. Nejprve zjistíme nejmenší hodnotu x min a největší hodnotu x max. Dostaneme x min = 23.5 a x max = 34.8. Zřejmě 23, 35 23.5, 34.8. Rozdělme interval 23, 35 do šesti tříd. Potom pro délku d intervalů dostaneme d = 35 23 = 2. Výsledek 6 třídění pak ukazuje tabulka 1.2. Tabulka 1.2: Rozdělení četností pevnosti betonu Pevnost Absolutní Relativní Střed Třída betonu četnost četnost třídy j (t j 1, t j n j f j x j Ω 1 23 25 1 0.025 24 Ω 2 25 27 5 0.125 26 Ω 3 27 29 10 0.250 28 Ω 4 29 31 12 0.300 30 Ω 5 31 33 8 0.200 32 Ω 6 33 35 4 0.100 34 Součet 40 1.000 Názornější než tabulka rozdělení četností je grafické zobrazení četností, které samozřejmě z této tabulky vychází. Zmíníme se zde pouze o úsečkovém diagramu rozdělení četností a histogramu rozdělení četností.

12 Náhodný výběr a statistiky Připomeňme, že jsme v případě skupinového třídění označili střed j-té třídy Ω j jako x j. V případě prostého třídění je x j přímo roven j-té nejmenší zjištěné hodnotě. Úsečkový diagram rozdělení absolutních, popř. relativních četností dostaneme tak, že na osu x zobrazíme středy jednotlivých tříd x j a v každém z nich sestrojíme úsečku v kladném směru osy y o délce rovné příslušné absolutní, resp. relativní četnosti, tj. n j, resp. f j. V případě skupinového třídění používáme častěji histogram rozdělení absolutních, resp. relativních četností. Dostaneme jej tak, že na osu x vynášíme opět středy jednotlivých tříd x j a nad každou úsečkou zobrazující třídu Ω j sestrojíme obdélník o výšce rovné příslušné absolutní, resp. realitvní četnosti, tj. n j, resp. f j. Horní obrys obdélníků pak nazýváme histogram relativních, resp. absolutních četností. Příklad 1.6: Sestrojte úsečkový diagram rozdělení absolutních četností v příkladu 1.4 a histogram rozdělení relativních četností v příkladu 1.5. Řešení: Výsledné grafy jsou na obrázku 1.1 a na obrázku 1.2. Obrázek 1.1: Úsečkový diagram rozdělení absolutních četností počtu vozidel čekajících na zelenou Obrázek 1.2: Histogram rozdělení relativních četností pevnosti betonu

1.2 Statistiky 13 Histogram (resp. úsečkový diagram) relativních a absolutních četností mají stejný tvar a aproximují tvar rozdělovací funkce náhodné veličiny X. 1.2 Statistiky V předchozích příkladech jsme naznačili, že kromě náhodného výběru budou hrát v teorii odhadu důležitou roli tzv. statistiky, tj. funkce náhodného výběru. Pomocí nich se snažíme z náhodného výběru získat nějaké další informace. Upřesněme nyní tento pojem z matematického hlediska. Definice 1.1: Statistika Je-li (X 1, X 2,..., X n ) náhodný výběr z rozdělení X, V výběrový prostor a T (x 1, x 2,..., x n ) reálná funkce n reálných proměnných definovaná na výběrovém prostoru V, potom se náhodná veličina T = T (X 1, X 2,..., X n ) nazývá statistika. Dosadíme-li do statistiky T realizaci (x 1, x 2,..., x n ) náhodného výběru z X, dostaneme číslo tzv. realizaci statistiky. t = T (x 1, x 2,..., x n ), S příklady realizací statistik jste se již setkali při třídění. Najděte alespoň čtyři! K nejčastěji používaným statistikám patří tzv. výběrové charakteristiky, které - jak poznáme později - používáme pro odhad číselných charakteristik náhodných veličin. Nejpoužívanějšími výběrovými charakteristikami jsou X = 1 n n X i tzv. výběrový průměr; (1.1) i=1 S 2 = 1 n 1 n (X i X) 2 tzv. výběrový rozptyl. (1.2) i=1 Statistika S = S 2 se nazývá výběrová směrodatná odchylka. Výhodou výběrové směrodatné odchylky je, že má stejné jednotky jako měřená veličina. Je-li (x 1, x 2,..., x n ) realizace náhodného výběru z X, pak ze vztahů (1.1) a (1.2) lze usuzovat, že x je mírou polohy (těžištěm) hodnot x 1, x 2,..., x n, s 2 a s jsou mírami rozptýlenosti těchto hodnot okolo x. Čím jsou realizace s 2 a tedy i s větší, tím jsou hodnoty x 1, x 2,..., x n rozptýlenější. Uvědomme si, že střední hodnota E(X), resp. rozptyl D(X) a směrodatná odchylka D(X) náhodné veličiny X, které patří k charakteristikám polohy,

14 Náhodný výběr a statistiky resp. rozptýlenosti náhodné veličiny X, jsou konstantami. Na rozdíl od nich jsou výběrové charakteristiky X, S 2 a S náhodné veličiny. Pro konkrétní realizaci (x 1, x 2,..., x n ) náhodného výběru z X dostaneme konkrétní realizace (hodnoty) x a s 2 statistik X a S 2. Pro jinou realizaci náhodného výběru z téhož rozdělení dostaneme jiné hodnoty statistik X a S 2. Výpočet realizací x a s 2 statistik X a S 2 Při výpočtu realizací x a s 2 statistik X a S 2 můžeme postupovat následovně: 1. Dosadíme realizaci (x 1, x 2,..., x n ) náhodného výběru z X do vztahů (1.1) a (1.2). 2. Pro výpočet realizací x a s 2 lze použít jakýkoliv statistický software nebo EXCEL bez dosazování do vzorců. Na nižší úrovni pak kalkulačky, které umožňují statistické výpočty. Realizaci x spočítáme pomocí programu na výpočet x. Na některých kalkulačkách se vyskytuje dvojice s a σ, na některých σ n 1 a σ n. Platí pro ně následující vztahy s = σ n 1 = 1 n 1 n (x i x) 2, i=1 σ = σ n = 1 n n (x i x) 2 (= + m). i=1 O statistice M = 1 n n i=1 (X i X) 2 budeme mluvit v následující kapitole. 3. Při výpočtu realizací výběrového průměru a výběrového rozptylu v případě realizace (x 1, x 2,..., x n ) náhodného výběru z X roztříděného do k tříd Ω j (j = 1, 2,..., k) postupujeme tak, že hodnoty, které padly do j-té třídy nahradíme středem x j této třídy. Potom x = 1 n n i=1 x i. = 1 n k n j x j, (1.3) j=1 s 2 = 1 n 1 n (x i x) 2. 1 = n 1 i=1 k n j (x j x) 2, (1.4) j=1 Příklad 1.7: Při měření veličiny konstantní délky byly zjištěny následující chyby měření v mm: 1, 2, 1, 0, 1, 2, 1, 1, 1, 1. Určete realizace x a s 2. Řešení: Náhodnou veličinou X je zde náhodná chyba měření. K dispozici máme realizaci náhodného výběru z X o rozsahu n = 10. Podle vztahů (1.1)

1.3 Kontrolní otázky 15 a (1.2) dostaneme x = 1 10 s 2 = 1 9 10 i=1 10 i=1 x i = 1 10 (x 1 + x 2 + + x 10 ) = 0.10 [mm], (x i + 0.1) 2 = 1 9 [(x 1 + 0.1) 2 + + (x 10 + 0.1) 2 ]. = 1.66 [mm 2 ]. Přímo (tj. bez dosazování) s využitím kalkulačky x = 0.10 [mm],. s = σ n 1 = 1.29 [mm] s 2. = 1.66 [mm 2 ]. Příklad 1.8: Vypočtěte realizaci výběrového průměru a výběrové směrodatné odchylky v příkladě 1.5. Řešení: V příkladě 1.5 jsmě měli realizaci (x 1, x 2,..., x n ) o rozsahu n = 40. Tuto realizaci jsme roztřídíli do k = 6 tříd. Podle vztahů (1.3) a (1.4) dostaneme x. = 1 40 6 j=1 n j x j = 1 (1 24 + 5 26 + + 4 34) = 29.650 [MP a], 40 s 2. 1 6 = n j (x j 29.65) 2 = 1 39 39 [1(24 29.65)2 + + 4(34 29.65) 2 )] j=1. = 6.336 [MP a 2 ] σ = s =. 2.517 [MP a]. Stejně jako v předchozím příkladě můžeme využít statistické výpočty na kalkulačce. Hodnotu x j uložíme n j -krát na většině kalkulaček tak, že x j n j uložíme pomocí nabídky DATA. 1.3 Kontrolní otázky 1. Jaké vlastnosti musí mít složky náhodného výběru z rozdělení X? 2. Uveďte příklad náhodného výběru ze spojitého a diskrétního rozdělení. 3. Jak postupujeme při třídění realizace náhodného výběru z X? 4. Co jsou relativní a absolutní četnosti a jaké vlastnosti pro ně platí? 5. Co to je statistika? 6. Jak je definován a co udává výběrový průměr, rozptyl a směrodatná odchylka?

16 Náhodný výběr a statistiky 1.4 Cvičení 1. Mezi deseti výrobky je jeden vadný. Z těchto výrobků náhodně vybereme dva. Označme X i počet vadných výrobků v i-tém tahu (i = 1, 2). a) Výběr provádíme tak, že výrobek po vytažení a zjištění, zda je vadný, vrátíme zpět, takže může být opět vybrán. b) Výběr provádíme tak, že výrobky nevracíme zpět. Jaké rozdělení budou mít veličiny X 1 a X 2? Je (X 1, X 2 ) náhodný výběr? 2. (Pro zájemce.) Uvažujme velkou dodávku N výrobků, z nichž je M vadných. Předpokládejme, že z těchto N výrobků budeme náhodně vybírat n výrobků, kde n je relativně malé číslo vzhledem k N. Označme opět X i počet vadných výrobků v i-tém tahu (i = 1,..., n). Dejme tomu, že N = 500 a n = 10. Lze v tomto případě při výběru bez vracení považovat náhodný vektor (X 1,..., X 10 ) za náhodný výběr z rozdělení A(M/N)? 3. Průměr z pěti měření je 10. Jak se změní, když a) jsme se spletli a místo výsledku 3 jsme zapsali výsledek 2; b) získáme jako další výsledek číslo 1. 4. Předpokládejme, že (x 1,..., x n ) je realizace náhodného výběru z X. a) Proč nemůže být h = 1 n n 1 i=1 (x i x) mírou variability hodnot x 1,..., x n? n b) Ukažte, že platí (x i x) 2 = n xi 2 nx 2 i=1 ( n a tedy s 2 = 1 n 1 i=1 x 2 i nx 2 ). 5. Předpokládejme, že (X 1,..., X n ) je náhodný výběr z X a náhodná veličina Y vznikla lineární transformací náhodné veličiny X, tj. Y = ax + b, kde a, b R, a 0. Ukažte, že a) (Y 1,..., Y n ) = (ax 1 + b,..., ax n + b) je náhodný výběr z Y ; i=1 b) Y = ax + b, kde Y, resp. X je výběrový průměr příslušný veličině Y, resp. veličině X; c) SY 2 = a2 SX 2, kde S2 Y, resp. S2 X je výběrový rozptyl příslušný veličině Y, resp. veličině X. 6. Bylo odzkoušeno 10 náhodně vybraných ocelových tyčí k určení meze průtažnosti s těmito výsledky v MPa: 277, 280, 291, 263, 277, 286, 281, 305, 290, 291. Vypočtěte realizaci výběrového průměru a výběrového rozptylu meze průtažnosti oceli.

1.5 Klíč a výsledky cvičení 17 7. Určete realizaci výběrového průměru, rozptylu a směrodatné odchylky množství ročních srážek v mm v Brně v období 1981-2000: 718.5, 492.3, 431.5, 540.5, 514.7, 548.0, 385.0, 532.0, 531.0, 578.3, 551.9, 613.6, 476.0, 661.3, 518.0, 508.5, 488.7, 494.9, 544.6, 673.5. 8. Při zkouškách vlhkosti stavebního materiálu Hobrex byla změřena procenta vlhkosti u 100 vzorků. Výsledky jsou uvedeny v tabulce: Třída Vlhkost v % n j Třída Vlhkost v % n i 1. 19.75-20.75 5 4. 22.75-23.75 20 2. 20.75-21.75 27 5. 23.75-24.75 2 3. 21.75-22.75 46 Určete realizaci výběrového průměru a směrodatné odchylky vlhkosti. Nakreslete histogram rozdělení relativních četností. 9. Zvážením 50 součástek vyrobených za ustálených výrobních podmínek jsme dostali tyto výsledky (při měřicí jednotce gram) 83, 85, 81, 82, 84, 82, 79, 84, 80, 81, 82, 82, 80, 82, 80, 82, 83, 84, 79, 79, 83, 82, 83, 85, 82, 82, 81, 80, 82, 82, 83, 80, 82, 85, 81, 83, 81, 81, 83, 82, 81, 85, 83, 79, 81, 85, 81, 84, 81, 82. Sestavte tabulku rozdělení četností. Nakreslete úsečkový diagram a histogram relativních a absolutních četností. Vypočítejte realizaci výběrového průměru a výběrové směrodatné odchylky hmotnosti součástek. 1.5 Klíč a výsledky cvičení Cvičení: 1. V případě a) i b) budou mít obě náhodné veličiny alternativní rozdělení s parametrem 1/10. V případě a) jsou veličiny nezávislé a jedná se o náhodný výběr z rozdělení A(1/10). V případě b) jsou závislé a nejedná se o náhodný výběr. 2. Ano - Veličiny X 1,..., X n mají rozdělení A(M/N). Navíc vybíráme-li z velkého počtu N relativně malý počet n, změní se podmínky zcela nepatrně a veličiny X 1, X 2,..., X n můžeme považovat za nezávislé. 3. a) x = 51/5; b) x = 51/6. 4. a) Protože h = 0. 6. x = 284.100 MPa, s 2. = 126.989 MPa 2. 7. x = 540.140 mm, s 2. = 6347.592 mm 2, s. = 79.672 mm. 8. x = 22.12%, s. = 0.86%. 9. Volíme-li 9 tříd o délce d = 1 se středy 79 až 85, dostaneme x = 81.98 g, s. = 1.66 g.

Kapitola 2 Bodový odhad Cíle Po přečtení a nastudování této kapitoly budete: vědět, co to je bodový odhad parametrické funkce; znát některé důležité vlastnosti bodových odhadů a umět je posoudit. Doba potřebná ke studiu Pro zvládnutí této kapitoly budete potřebovat asi 3 hodiny studia. Klíčová slova Bodový odhad, realizace bodového odhadu, nestranný odhad, nejlepší nestranný odhad, střední čtvercová chyba, konzistentní odhad. V této a následující kapitole budeme předpokládat, že známe typ rozdělení (tzv. statistický model), ze kterého náhodný výběr pochází. Pokud neznáme typ rozdělení, z něhož výběr pochází (v minulosti nebyly prováděny experimenty daného druhu a rozdělení nelze odvodit ani na základě teoretické úvahy), vybíráme vhodný typ rozdělení např. na základě posouzení tvaru histogramu rozdělení četností a další analýzy realizace náhodného výběru (viz poslední kapitola následujícího modulu). Je-li např. jako vhodný model rozdělení zvolen model normálního rozdělení, známe typ rozdělení obecně až na dva parametry µ a σ 2. Je-li jako vhodný model zvolen model Poissonova rozdělení, známe typ rozdělení až na jediný parametr λ. Budeme tedy předpokládat, že známe typ rozdělení sledované náhodné veličiny X až na m parametrů (neznámých konstant), m 1. Tyto parametry budeme značit ϑ 1, ϑ 2,..., ϑ m. Označme pro ϑ = (ϑ 1, ϑ 2,..., ϑ m ) jako Θ množinu všech přípustných hodnot vektorového parametru ϑ, kterou nazýváme parametrický prostor. Ke stanovení rozdělení pak stačí odhadnout parametry tohoto rozdělení. Někdy ale nemáme tak velké požadavky a zajímá nás pouze odhad určité funkce parametrů rozdělení - např. střední hodnoty. Označme τ(ϑ) = τ(ϑ 1, ϑ 2,..., ϑ m ) určitou reálnou funkci vektorového parametru ϑ definovanou na parametrickém prostoru Θ. Funkci τ(ϑ) nazýváme parametrická funkce.

19 Protože parametr ϑ i, tj. i-tá složka vektorového parametru ϑ, je speciálním případem funkce τ(ϑ), budeme se zabývat odhadem funkce τ(ϑ). Příklad 2.1: Při měření vzdálenosti konkrétním přístrojem, který nevykazuje systematickou chybu (tj. náhodné chyby kolísají okolo nuly), je výsledek pokusu X normální náhodná veličina s neznámou střední hodnotou µ - skutečnou vzdáleností a (většinou) známým rozptylem σ 2 (vyjadřujícím přesnost přístroje). Potom pro hustotu f náhodné veličiny X platí f = f(x; µ) = 1 2πσ exp [ 1 2σ 2 (x µ)2 ] pro x R, kde µ (0, ). Známe tedy typ rozdělení až na jeden parametr µ, tj ϑ = ϑ 1 = ϑ = µ, Θ = (0, ). Při měření neodzkoušeným přístrojem bude neznámý i rozptyl, potom f = f(x; µ, σ 2 ) = 1 2πσ exp [ 1 2σ 2 (x µ)2 ] pro x R, kde (µ, σ 2 ) (0, ) (0, ). Známe typ rozdělení až na dva parametry µ a σ 2, tedy ϑ = (ϑ 1, ϑ 2 ) = (µ, σ 2 ) a Θ = (0, ) (0, ). Příklady parametrických funkcí τ(ϑ) = τ(µ, σ 2 ) jsou v případě N(µ, σ 2 ) při obou neznámých parametrech funkce: τ(µ, σ 2 ) = µ střední hodnota rozdělení, τ(µ, σ 2 ) = σ 2 rozptyl rozdělení, τ(µ, σ 2 ) = σ směrodatná odchylka rozdělení, τ(µ, σ 2 ) = µ + u(α)σ 100α procentní kvantil rozdělení, τ(µ, σ 2 ) = Φ((x µ)/σ) hodnota distribuční funkce v bodě x. Vraťme se zpět k našemu odhadování. Na základě realizace náhodného výběru (X 1, X 2,..., X n ) z X budeme chtít odhadnout skutečnou hodnotu parametrické funkce τ(ϑ) pomocí jediného reálného čísla. Je tedy zřejmé, že tímto číslem bude funkce realizace náhodného výběru z X, tj. realizace statistiky. Definice 2.1: Bodový oddhad Statistiku, kterou používáme pro odhad parametrické funkce τ(ϑ), budeme nazývat (bodovým) odhadem funkce τ(ϑ) a její realizaci realizací (bodového) odhadu τ(ϑ). Prakticky se snažíme za odhad τ(ϑ) volit takový odhad, tj. takovou statistiku, jejíž hodnoty v nějaké smyslu co nejlépe aproximují skutečnou hodnotu τ(ϑ). Chceme-li tedy, aby byl odhad kvalitní, měl by mít určité vlastnosti. My se zde budeme zabývat pouze tzv. nestrannými, nejlepšími nestrannými a konzistentními odhady. Ideální by bylo, kdyby odhadová statistika měla všechny výše uvedené vlastnosti. Toho ale nelze běžně dosáhnout. Pro hledání bodových odhadů existují různé metody, které zajišťují dobré vlastnosti odhadů (např. metoda maximální věrohodnosti), těmi se zde ale zabývat nebudeme.

20 Bodový odhad 2.1 Vlastnosti odhadů 2.1.1 Nestranný odhad Uvědomme si, že odhad T parametrické funkce τ(ϑ) je náhodná veličina. V technické praxi nás samozřejmě zajímá číselná hodnota odhadu, tj. realizace odhadu. Z každé realizace náhodného výběru můžeme obecně dostat jinou realizaci odhadu, tj. jinou číselnou hodnotu. Nejčastěji se vyskytuje požadavek, aby realizace t odhadu T parametrické funkce τ(ϑ) kolísaly okolo skutečné hodnoty této funkce, tj. aby byl odhad T funkce τ(ϑ) nestranný (nevychýlený). Uvědomíme-li si nyní, že realizace náhodné veličiny T kolísají okolo její střední hodnoty (pokud existuje), budeme požadovat, aby střední hodnota odhadu T byla rovna skutečné hodnotě parametrické funkce τ(ϑ). Protože neznáme skutečnou hodnotu vektorového parametru ϑ Θ, budeme chtít, aby požadovaná rovnost platila, ať je skutečná hodnota ϑ kdekoliv v Θ, tj. pro každé ϑ Θ. Definice 2.2: Nestranný odhad Řekneme, že statistika T je nestranným nebo nevychýleným odhadem parametrické funkce τ(ϑ), když pro každé ϑ Θ platí E(T ) = τ(ϑ). Neplatí-li tato rovnost, pak odhad nazýváme vychýleným a rozdíl B(ϑ) = E(T ) τ(ϑ) je vychýlení odhadu T. Příklad 2.2: Předpokládejme, že je (X 1, X 2,..., X n ) náhodný výběr z rozdělení s konečnou střední hodnotou µ a konečným rozptylem σ 2. Zjistěte, zda je výběrový průměr X nestranným odhadem µ a určete jeho rozptyl. Řešení: V tomto případě je τ(ϑ) = µ. Výběrový průměr X je nevychýleným odhadem střední hodnoty µ, když pro každé ϑ Θ platí E(X) = µ. Protože náhodné veličiny X 1, X 2,..., X n mají stejné rozdělení jako náhodná veličina X, platí E(X i ) = µ, D(X i ) = σ 2 pro i = 1, 2,..., n. Potom ( 1 E(X) = E n n ) X i = 1 n i=1 n E(X i ) = 1 n i=1 n µ = µ. (2.1) i=1 Výběrový průměr X je nestranným odhadem střední hodnoty µ rozdělení, z něhož výběr pochází (ať známe nebo neznáme σ 2 ).

2.1 Vlastnosti odhadů 21 je Vzhledem k tomu, že jsou veličiny X 1, X 2,..., X n stochasticky nezávislé, ( 1 D(X) = D n n ) X i = 1 n D(X n 2 i ) = 1 n 2 i=1 i=1 n i=1 σ 2 = σ2 n. (2.2) Rozptyl výběrového průměru klesá s rostoucím rozsahem n výběru. Zabývejme se nyní další důležitou číselnou charakteristikou rozdělení X, z něhož výběr pochází. Podobně (jenom složitěji) jako v příkladu 2.2 lze ukázat, že pro výběrový rozptyl S 2 platí E(S 2 ) = σ 2. Tedy statistika S 2 je nestranným odhadem rozptylu σ 2. Výběrová směrodatná odchylka S ale není nestranným odhadem směrodatné odchylky σ. Kdyby byla, muselo by platit D(S 2 ) = E(S 2 ) [E(S)] 2 = σ 2 σ 2 = 0, což by znamenalo, že výběrový rozptyl S 2 je konstantní. V případě, že známe střední hodnotu µ rozdělení X, ze kterého výběr pochází, nebudeme ji samozřejmě odhadovat a je škoda tuto informaci nevyužít i při odhadu rozptylu σ 2. Označme S 2 0 = 1 n n (X i µ) 2. i=1 Potom lze ukázat, že E(S 2 0) = σ 2. Tedy S 2 0 je nestranným odhadem rozptylu σ 2 v případě známé střední hodnoty µ. Vraťme se ještě ke statistice M = 1 n n i=1 (X i X) 2, o které jsme mluvili v minulé kapitole. Zřejmě M = n 1 n S2 = E(M) = n 1 n E(S2 ) = n 1 n σ2 = σ 2 1 n σ2. Statististika M je tedy vychýlený odhad rozptylu σ 2. 2.1.2 Nejlepší nestranný odhad V některých případech lze najít více statistik, které jsou nestrannými odhady funkce τ(ϑ). Tak např. výběrový průměr X = 1 n n i=1 X i a náhodná veličina X 1 jsou nestranné odhady střední hodnoty µ rozdělení, z něhož výběr pochází. Přitom nejsou stejně vhodné. Nestrannost těchto odhadů sice zaručuje, že jejich realizace kolísají okolo skutečné střední hodnoty µ, ale samozřejmě vhodnost nestranného odhadu µ závisí na tom, jaká je rozptýlenost jeho realizací okolo skutečné hodnoty µ. V našem případě máme D(X) = σ2 a D(X n 1) = σ 2. Výběrový průměr je tedy vhodnější odhad střední hodnoty µ (pro n > 1). Existují-li nestranné odhady parametrické funkce τ(ϑ), pak samozřejmě budeme chtít použít ten nestranný odhad, který má ze všech nestranných odhadů parametrické funkce τ(ϑ) nejmenší rozptyl. Takový odhad (pokud existuje) budeme nazývat nejlepší nestranný odhad funkce τ(ϑ).

22 Bodový odhad Definice 2.3: Nejlepší nestranný odhad Je-li T = T (X 1, X 2,..., X n ) nestranný odhad parametrické funkce τ(ϑ) a jestliže pro každý jiný nestranný odhad T = T (X 1,..., X n ) funkce τ(ϑ) platí D(T ) D(T ) pro každé ϑ Θ, nazývá se statistika T nejlepší nestranný odhad funkce τ(ϑ). 2.1.3 Střední kvadratická chyba Uvažujme nyní tři odhady T, U a V parametrické funkce τ(ϑ), jejichž hustoty h(t), g(u) a s(v) mají tvar jako na obrázku 2.1. V tomto případě vidíme, že odhad T je sice nevychýlený, ale má příliš velký rozptyl. Odhad U má sice nejmenší rozptyl, ale je příliš vychýlený. Jako nejvhodnější se jeví odhad V, který má nejlepší kombinaci malého vychýlení a malého rozptylu. Vidíme tedy, že dalším měřítkem kvality odhadu, by měl být ukazatel, který měří právě tuto kombinaci. Tímto ukazatelem je, jak ukážeme, střední hodnota čtverce odchylky odhadu od skutečné hodnoty odhadované parametrické funkce. Obrázek 2.1: Odhad V s nejlepší kombinací malého rozptýlení a malého vychýlení Definice 2.4: Střední kvadratická chyba Střední kvadratická chyba K(ϑ) odhadu T parametrické funkce τ(ϑ) je definována jako K(ϑ) = E{[T τ(ϑ)] 2 }.

2.1 Vlastnosti odhadů 23 Protože platí dostáváme D(T ) = D[(T τ(ϑ)] = E{[T τ(ϑ)] 2 } {E[T τ(ϑ)]} 2 = K(ϑ) [E(T ) τ(ϑ)] 2 = K(ϑ) B 2 (ϑ), K(ϑ) = D(T ) + B 2 (ϑ). Kvadratická chyba odhadu je tedy rovna součtu rozptylu odhadu a čtverci vychýlení odhadu. Budeme-li dva odhady funkce τ(ϑ) posuzovat z hlediska K(ϑ) a vybereme ten, který má K(ϑ) menší, dostaneme ten, který má lepší kombinaci rozptylu a vychýlení. Konkrétně ze dvou nevychýlených odhadů vybereme ten, který má menší rozptyl a ze dvou odhadů se stejným rozptylem vybereme ten, který má menší vychýlení. Je-li statistika T nestranným odhadem funkce τ(ϑ), je střední kvadratická chyba K(ϑ) = D(T ). Lze ukázat, že pro střední kvadratickou chybu odhadů S 2 a M rozptylu σ 2 v případě výběru z normálního rozdělení platí: E[(S 2 σ 2 ) 2 ] = 2 n 1 σ4, E[(M σ 2 ) 2 ] = 2n 1 σ 4. n 2 Protože platí 2n 1 < 2, má statistika M menší střední kvadratickou chybu n 2 n 1 než statistika S 2. Tedy každý z těchto odhadů je lepší v jiném smyslu. 2.1.4 Konzistentní odhad K další často požadované vlastnosti odhadu patří tzv. konzistence odhadu, ta zhruba řečeno znamená, že čím větší bude rozsah výběru n, tím bude realizace odhadu blíž ke skutečné hodnotě odhadované parametrické funkce. Abychom zdůraznili, že zpracováváme náhodný výběr o rozsahu n, budeme odhad značit T n místo T. Definice 2.5: Konzistentní odhad Odhad T n parametrické funkce τ(ϑ) nazýváme konzistentní odhad funkce τ(ϑ), jestliže pro každé ɛ > 0 a pro každé ϑ Θ platí lim P ( T n τ(ϑ) < ɛ ) = 1. n Zřejmě platí P ( T n τ(ϑ) < ɛ ) = P ( τ(ϑ) ɛ < T n < τ(ϑ) + ɛ ) Je-li tedy T n konzistentní odhad funkce τ(ϑ), potom s rostoucím rozsahem výběru n roste pravděpodobnost, že tento odhad nabude hodnoty libovolně blízké skutečné hodnotě odhadované funkce τ(ϑ). Ověření konzistence odhadu nám usnadní následující tvrzení.

24 Bodový odhad Tvrzení 2.1: Nutná podmínka konzistence Odhad T n parametrické funkce τ(ϑ) je konzistentní odhad funkce τ(ϑ), jestliže pro každé ϑ Θ platí lim E(T n) = τ(ϑ), (2.3) n lim D(T n) = 0. (2.4) n Vztah (2.3) je triviálně splněn pro nestranné odhady. Vztah (2.4) říká, že se s rostoucím n zužuje rozdělení odhadu T n kolem skutečné hodnoty funkce τ(ϑ). Příklad 2.3: Při stejných podmínkách jako v příkladu 2.2 zjistěte, zda je výběrový průměr X konzistentním odhadem střední hodnoty µ. Řešení: Označme Protože platí T n = X = 1 n E(T n ) = E(X) = µ, dostáváme n X i pro n = 1, 2,.... i=1 D(T n ) = D(X) = σ2 n lim n E(T n) = lim n E(X) = lim n µ = µ, lim D(T σ 2 n) = lim D(X) = lim n n n n = 0. Tedy X je konzistentní odhad střední hodnoty µ. pro n = 1, 2,..., Tuto kapitolu uzavřeme tvrzením, které shrnuje některé ukázané poznatky a některé další o odhadu střední hodnoty a rozptylu náhodné veličiny X. Tvrzení 2.2: Odhady střední hodnoty a rozptylu Pro náhodný výběr z rozdělení N(µ, σ 2 ) platí: 1. Nejlepším nestranným a konzistentním odhadem střední hodnoty µ je výběrový průměr X. 2. Nejlepším nestranným a konzistentním odhadem rozptylu σ 2 je: výběrový rozptyl S 2 v případě, že neznáme střední hodnotu µ; statistika S 2 0 v případě, že známe střední hodnotu µ. Pro náhodný výběr z jiného rozdělení s konečnou střední hodnotou µ a konečným rozptylem σ 2 jsou uvedené odhady nestranné a konzistentní.

2.1 Vlastnosti odhadů 25 Pro odhad směrodatné odchylky běžně používáme statistiku S, resp. S 0 v případě, že neznáme, resp. známe střední hodnotu µ, i když se nejedná o nestranné odhady. Příklad 2.4: Vraťte se k příkladu 1.7 a odhadněte: 1. horní hranici náhodné chyby měření, které se můžeme dopustit s pravděpodobností 0.95. Předpokládejte, že náhodná chyba měření má normální rozdělení. 2. směrodatnou odchylku náhodné chyby měření, když víte, že měřicí přístoj nevykazuje systematickou chybu. Řešení: Náhodná veličina X v příkladě 1.7 je náhodná chyba měření. Předpokládáme, že X N(µ, σ 2 ). 1. Máme odhadnout konstantu k, pro kterou platí P (X k) = 0.95. Požadovanou pravděpodobnost vyjádříme pomocí normované náhodné veličiny X, tj. pomocí náhodné veličiny U = X µ, která má rozdělení N(0, 1) σ Dostaneme ( X µ 0.95 = P k µ ) ( = P U k µ ). σ σ σ Číslo k µ σ je tedy 95 procentní kvantil veličiny U, tj. u(0.95). V tab A.3 najdeme u(0.95) = 1.645. Odtud k µ σ = 1.645 k = µ + 1.645σ. Odhad k horní hranice k pak dostaneme tak, že najdeme odhad µ střední hodnoty µ a odhad σ směrodatné odchylky σ. V příkladě 1.7 máme µ = x = 0.10[mm], σ = s. = 1.29[mm]. Potom k = µ + 1.645 σ. = 2.02[mm] Realizace odhadu horní hranice chyby měření, které se můžeme dopustit s pravděpodobností 0.95, je 2.02 mm. 2. Realizace σ 2 odhadu rozptylu σ 2 v případě známé střední hodnoty µ je σ 2 = s 2 0 = 1 n n (x i µ) 2. i=1 Protože přístroj nevykazuje systematické chyby, je µ = 0 a dostáváme tedy σ 2 = s 2 0 = 1 10 10 i=1 x 2 i = 1.50 σ = s 0. = 1.22[mm] Realizace odhadu směrodatné odchylky chyby měření je 1.22 mm.

26 Bodový odhad 2.2 Kontrolní otázky 1. Vysvětlete, co si představujete pod pojmy: nestranný odhad, nejlepší nestranný odhad, konzistentní odhad. 2. Jak je definována statistika S 2 0? Můžete ji použít pro odhad rozptylu, když neznáte střední hodnotu? 3. Rozhodněte, která z následujích tvrzení jsou pravdivá? a) Je-li T nestranný odhad µ, potom E(µ) = T. b) Máme-li dva nestranné odhady parametrické funkce τ(ϑ), lepší je ten, který má větší rozptyl. c) Realizace výběrové směrodatné odchylky kolísají okolo skutečné hodnoty směrodatné odchylky rozdělení, ze kterého výběr pochází. d) Střední hodnota rozdělení, ze kterého výběr pochází, je X. e) Je-li odhad nestranný, pak je konzistentní. 2.3 Cvičení 1. Předpokládejme, že (X 1, X 2, X 3 ) je náhodný výběr z alternativního rozdělení s parametrem p, tj. A(p). Zjistěte, zda jsou statistiky T 1 = X 1 + X 2 X 3, T 2 = 2X 1 + X 2 X 3 a T 3 = 1 3 n i=1 X i = X nestranné odhady parametru p, určete jejich rozptyl a střední kvadratickou chybu. 2. Předpokládejme, že (X 1,..., X n ) náhodný výběr z rovnoměrného rozdělení s parametry 0, b, b > 0, tj. X R(0, b). Ověřte, zda je statistika T = 2X a) nestranným odhadem b; b) konzistentním odhadem b. 3. Dva studenti měřili stejným přístrojem, který nevykazuje systematickou chybu, vzdálenost dvou bodů. Jeden z nich změřil tuto vzdálenost 5 krát a za odhad vzal průměr svých měření. Druhý z nich měřil 10 krát a za odhad vzal také průměr svých měření. Nemohli se ale domluvit, zda za společný odhad vzdálenosti mají vzít a) průměr svých odhadů; b) průměr všech měření. Který postup je lepší? 4. Při sledování doby do poruchy v hodinách určitého zařízení byly získány následující údaje: 23, 49, 69, 98, 75, 15. Předpokládejme, že se jedná o realizaci náhodného výběru z exponenciálního rozdělení X s parametrem λ, tj. z rozdělení s distribuční funkcí F (x; λ) = 1 exp ( x/λ) pro x 0, pro jiná x je F (x; λ) = 0. Odhadněte střední dobu životnosti zařízení a pravděpodobnost, že zařízení bude fungovat ještě po 70 hodinách.

2.4 Klíč a výsledky cvičení 27 5. Při měření určité vzdálenosti jsme získali následující výsledky (v km): 19.01, 19.02, 18.99, 19.00, 19.05, 19.05, 19.00, 18.98, 18.99, 19.00. Odhadněte přesnost dálkoměru, jestliže víte, že je skutečná vzdálenost 20 km a chyba měření je zatížena systematickou chybou -1 km. Jak se změní výsledek, když neznáte střední hodnotu náhodné chyby měření? 6. Byly zjištěny odchylky od jmenovité hmotnosti 50 kg. Odhadněte směrodatnou odchylku odchylky, když víte, že střední hodnota odchylky je 0 kg. Třída Odchylky v kg n j 1. -0.5-0.3 3 2. -0.3-0.1 10 3. -0.1 0.1 20 4. 0.1 0.3 11 5. 0.3 0.5 5 2.4 Klíč a výsledky cvičení Otázky: 3. a) Ne - E(T ) = µ. b) Ne. c) Ano - jedná se o nestranný odhad. d) Ne - není to nestranný odhad. e) Ne - X je odhad střední hodnoty. f) Ne - nemusí být. Cvičení: 1. E(T 1 ) = E(T 3 ) = p, E(T 2 ) = 2p; T 1 a T 3 jsou nestranné odhady. T 2 není nestranný odhad parametru p. D(T 1 ) = 3p(1 p), D(T 2 ) = 6p(1 p), D(T 3 ) = 1p(1 p), K 3 T 1 (p) = 3p(1 p), K T2 (p) = p(6 5p), K T3 (p) = 1 3 p(1 p). 2. E(T ) = b, D(T ) = b2. a) Ano. b) Ano. 3n 3. Oba odhady jsou nestranné. Rozptyl odhadu v a) je 3 40 σ2 a rozptyl odhadu v b) je 1 15 σ2. Postup b) je lepší. 4. x. = 54.833 h, P (X > 70). = 0.279. 5. σ2 = s 2 0 = 0.00061 km 2, σ 2 = s 2. = 0.00059 km 2. 6. σ = s 0. = 0.208 kg.

Kapitola 3 Intervalový odhad Cíle Po přečtení a nastudování této kapitoly budete: vědět, co to je intervalový odhad parametrické funkce τ(ϑ) a proč jej hledáme; umět určit realizaci intervalového odhadu střední hodnoty, rozptylu a směrodatné odchylky normálního rozdělení; vědět, co je přesnost a spolehlivost odhadu a umět určit rozsah výběru n z normálního rozdělení tak, aby odhad střední hodnoty normálního rozdělení měl předepsanou přesnost a spolehlivost. Doba potřebná ke studiu Pro zvládnutí této kapitoly budete potřebovat asi 4 hodiny bez řešení příkladů ze cvičení. Klíčová slova Intervalový odhad, koeficeient spolehlivosti odhadu, spolehlivost odhadu, riziko odhadu, přesnost odhadu, přípustná chyba odhadu. V této kapitole (stejně jako v předchozí) budeme předpokládat, že máme náhodný výběr (X 1, X 2,..., X n ) z rozdělení X, které závisí na vektorovém parametru ϑ = (ϑ 1, ϑ 2,..., ϑ m ). O parametru ϑ víme pouze, že patří do parametrického prostoru Θ. V předchozí kapitole jsme se zabývali bodovým odhadem T = T (X 1, X 2,..., X n ) parametrické funkce τ(ϑ) a studiem jeho vlastností. Zdůrazňovali jsme, že bodový odhad T je náhodná veličina, jejíž hodnoty kolísají od jedné realizace náhodného výběru k druhé. V technických aplikacích nás samozřejmě zajímá číselná hodnota bodového odhadu, a ta se prakticky více či méně liší od skutečné hodnoty odhadované funkce τ(ϑ). Při odhadování pomocí bodového odhadu (ať má sebelepší vlastnosti) nejsme schopni určit přesnost odhadu, tj. jaké chyby se dopustíme, když skutečnou hodnotu τ(ϑ)

29 nahradíme hodnotou bodového odhadu vypočítanou na základě realizace náhodného výběru z X. Informaci o přesnosti odhadu můžeme získat pomocí tzv. intervalového odhadu. Při konstrukci intervalového odhadu se snažíme najít ne jednu, ale dvě statistiky, dejme tomu T D = T D (X 1, X 2,..., X n ) a T H = T H (X 1, X 2,..., X n ), T D < T H, tak, aby interval T D, T H překryl skutečnou hodnotu parametrické funkce τ(ϑ) s dostatečně velkou pravděpodobností. Definice 3.1: Intervalový odhad, koeficient spolehlivosti, riziko Jsou-li T D a T H takové statistiky, že pro dané α (0, 1) a každé ϑ Θ platí P (T D τ(ϑ) T H ) = 1 α, (3.1) potom se interval T D, T H nazývá 100(1 α) procentní intervalový odhad parametrické funkce τ(ϑ). Číslo 1 α se nazývá koeficient spolehlivosti odhadu, číslo α riziko odhadu. Nahradíme-li statistiky T D a T H jejich realizacemi t D a t H, vypočítanými z jedné realizace náhodného výběru, dostaneme interval t D, t H, který se nazývá realizace intervalového odhadu T D, T H. Intervalový odhad τ(ϑ) se také někdy nazývá interval spolehlivosti nebo konfidenční interval pro τ(ϑ). Někdy nás zajímá pouze největší hodnota τ(ϑ), se kterou lze při daných výsledcích experimentu počítat, nebo naopak pouze nejmenší možná hodnota τ(ϑ). V prvním případě hledáme statistiku T H tak, aby platilo P (T H τ(ϑ)) = 1 α pro každé ϑ Θ. (3.2) V druhém případě hledáme statistiku T D tak, aby P (T D τ(ϑ)) = 1 α pro každé ϑ Θ. (3.3) Dostaneme tzv. 100(1 α) procentní jednostranné intervalové odhady parametrické funkce τ(ϑ). V případě (3.2) budeme mluvit o horním nebo pravostranném intervalovém odhadu, v případě (3.3) budeme mluvit o dolním nebo levostranném intervalovém odhadu. V těchto případech je pouze jeden kraj intervalového odhadu náhodná veličina. Tak např., vímeli jistě, že τ(ϑ) musí být větší než číslo a, bude horní intervalový odhad (a, T H. Jestliže není hodnota τ(ϑ) omezena zdola, bude horní intervalový odhad (, T H. Jsou-li oba kraje intervalového odhadu náhodné veličiny, nazýváme jej oboustranný a slovo oboustranný se často vynechává. Ukážeme, že všechny tyto druhy intervalových odhadů lze získat z intervalu (3.1) vhodným rozdělením rizika α. Interpretace intervalového odhadu Je zapotřebí si uvědomit správný výklad intervalového odhadu. Z každé realizace náhodného výběru dostaneme obecně jinou realizaci intervalového odhadu. Každá z těchto realizací buď τ(ϑ) překrývá nebo nepřekrývá. Zvolíme-li

30 Intervalový odhad např. koeficient spolehlivosti 1 α = 0.99 a vypočteme velký počet realizací 99 procentního intervalového odhadu parametrické funkce τ(ϑ), pak průměrně 99 procent těchto realizací překrývá skutečnou hodnotu τ(ϑ). Volíme-li tedy koeficeint spolehlivosti 1 α blízký jedné, je skoro jisté, že realizace intervalového odhadu vypočtená z jedné realizace náhodného výběru překryje skutečnou hodnotu τ(ϑ). Dosavadní technické normy vyžadují většinou počítat 99 procentní nebo 95 procentní intervaly spolehlivosti (tj. volbu α = 0.01 nebo α = 0.05). Koeficient spolehlivosti a délka intervalového odhadu Koeficient spolehlivosti intervalového odhadu udává spolehlivost odhadu, tj. vyjadřuje, s jakou pravděpodobností se můžeme spolehnout na to, že interval překryje skutečnou hodnotu funkce τ(ϑ). Délka oboustranného intervalového odhadu udává přesnost intervalového odhadu. Čím je tato délka menší, tím je odhad přesnější. Při pevně zvoleném rozsahu náhodného výběru platí, že čím větší koeficient spolehlivosti odhadu zvolíme, tím menší bude přesnost odhadu. Čím více si totiž chceme být jisti, že intervalový odhad překryje skutečnou hodnotu τ(ϑ), tím musí být tento interval širší. Nepřiměřeným zvětšováním koeficientu spolehlivosti můžeme dosáhnout tak malou přesnost, tj. tak široký interval, že nebude mít prakticky žádnou vypovídací schopnost. Proto se v technických aplikacích doporučuje volit koeficient spolehlivosti odhadu právě 0.99 nebo 0.95, v některých případech pak 0.90. Konstrukce intervalového odhadu funkce τ(ϑ) Postup, který se zpravidla používá při konstrukci 100(1 α) procentního intervalového odhadu funkce τ(ϑ), bude uveden na straně 35 až po vyřešení konkrétního příkladu. 3.1 Intervalové odhady parametrů normálního rozdělení Dále se budem zabývat intervalovými odhady parametrů µ a σ 2 rozdělení N(µ, σ 2 ). Tj. u nás bude τ(ϑ) = µ v případě našeho zájmu o odhad µ a τ(ϑ) = σ 2 v případě odhadu σ 2. Přitom budeme rozlišovat situace, kdy jsou neznámé oba parametry nebo pouze jeden z nich. Předpokládejme tedy, že (X 1, X 2,..., X n ) je náhodný výběr z rozdělení N(µ, σ 2 ). Rozdělení některých výběrových charakteristik Při konstrukci intervalových odhadů µ a σ 2 vycházíme z bodových odhadů X, S 2 a S 2 0 těchto parametrů, proto potřebujeme znát jejich rozdělení nebo rozdělení funkcí těchto odhadů, tzv. výběrová rozdělení.

3.1 Intervalové odhady parametrů normálního rozdělení 31 Tak např. pro výběrový průměr X platí (viz vztahy (2.1) a (2.2)), že E(X) = µ, D(X) = σ2 n. Protože předpokládáme, že výběr pochází z normálního rozdělení, bude mít normální rozdělení i výběrový průměr X, protože je lineární kombinací nezávislých normálních náhodných veličin. Tedy X N(µ, σ2 n ). Normováním statistiky X dostaneme veličinu X E(X) D(X) = X µ σ 2 n = X µ n, σ která má normované normální rozdělení. Máme-li tedy náhodný výběr z rozdělení N(µ, σ 2 ), má normovaný výběrový průměr rozdělení N(0, 1). Další výběrová rozdělení, která se používají ke konstrukci intervalových odhadů parametrů normálního rozdělení a testech hypotéz o parametrech normálního rozdělení (viz následující modul), zde nebudeme odvozovat, ale shrneme je všechny v následujícím tvrzení. Tvrzení 3.1: Výběrová rozdělení Je-li (X 1,..., X n ) náhodný výběr z rozdělení X N(µ, σ 2 ). Potom X µ n N(0, 1), σ X µ n t(n 1), S (n 1)S 2 ns 2 0 σ 2 χ 2 (n), σ 2 χ 2 (n 1). Při konstrukci i výpočtu intervalových odhadů parametrů µ a σ 2 v jednotlivých situacích budeme potřebovat pracovat s kvantily výše uvedených rozdělení. Úkol 3.1: Zopakujte si z teorie pravděpodobnosti, jak je definován 100γ procentní kvantil rozdělení náhodné veličiny X a co udává. Nakreslete si obrázky.

32 Intervalový odhad Poznámka 3.1: Kvantily výběrových rozdělení Kvantily výběrových rozdělení jsou jednak tabelovány (viz [11] a u nás v příloze A), jednak je počítá každý statistický software a můžeme využít i Excel. 100γ procentní kvantily rozdělení N(0, 1), t(n) a χ 2 (n) budeme postupně značit u(γ), t(n; γ) a χ 2 (n; γ). Kvantily u(γ) a t(n; γ) jsou tabelovány pro γ 0.5, pro γ < 0.5 je u(γ) = u(1 γ) a t(n; γ) = t(n; 1 γ). Nakreslete si obrázky a přesvědčte se o těchto rovnostech. Pro n > 30 je. t(n; γ) = u(γ). Pro kvantily χ 2 (n; γ) v tomto případě platí χ 2. (n; γ) = 1 [ 2n 1 + u(γ)] 2, takže v některých statistických tabulkách jsou tyto 2 kvantily tabelovány pro n 30. Úkol 3.2: 1. Jak vypadají tvary hustoty rozdělení N(µ, σ 2 ), t(n) a χ 2 (n)? 2. Určete následující kvantily: u(0.95), u(0.05), t(10; 0.9), t(15; 0.05), t(31; 0.99), χ 2 (5; 0.05), χ 2 (19; 0.99), χ 2 (100; 0.99), χ 2 (100; 0.01). 3. K jaké hodnotě se blíží 100γ procentní kvantily rozdělení N(0, 1), t(n) a χ 2 (n), když se γ blíží k jedné, resp. k nule? Nakreslete si obrázky! Výsledek: 2. 1.645, 1.645, 1.372, 1.753, 2.326, 1.146, 36.19, 135.02, 69.39. 3. Když se γ blíží k jedné, blíží se všechny kvantily k. Když se γ blíží k nule, blíží se kvantily N(0, 1) a t(n) k a kvantil χ 2 (n) k nule. Místo limit budeme psát např. u(1) =, u(0) =. Než přejdeme k intervalovým odhadům parametrů normálního rozdělení, ukážeme využití tvrzení 3.1 při výpočtu pravděpodobnosti. Příklad 3.1: Při kontrole stejnorodosti dodávky mandarinek balených po 1 kg se odběratel rozhodl zvážit 20 náhodně vybraných balíčků. Dodávku přijme, jestliže bude výběrová směrodatná odchylka nanejvýš 20 g. Jaká je pravděpodobnost přijetí dodávky, jestliže je známo, že hmotnost balíčků má přibližně rozdělení N(1kg, 0.026 2 kg 2 )? Řešení: Odběratel má k dispozici náhodný výběr (X 1,..., X n ) o rozsahu n = 20 z rozdělení N(1kg, 0.026 2 kg 2 ). Počítáme pravděpodobnost P (S 0.02). Vyjádříme ji pomocí náhodné veličiny (n 1)S2, která má rozdělení χ 2 (n 1). σ 2 ( (n 1)S 2 (n ) 1)0.022 P (S 0.02) = P σ 2 σ 2 ( (n 1)S 2 19 ) ( 0.022 (n 1)S 2 ) = P = P 11.24. σ 2 0.026 2 σ 2 Tedy číslo 11.24 je 100α procentní kvantil rozdělení χ 2 (19). Z tabulky A.4 dostaneme, že α. = 0.1. Přijetí dodávky lze očekávat s pravděpodobností 0.1.

3.1 Intervalové odhady parametrů normálního rozdělení 33 3.1.1 Intervalový odhad střední hodnoty Příklad 3.2: Určete 100(1 α) procentní intervalový odhad střední hodnoty µ normálního rozdělení N(µ, σ 2 ) se známým rozptylem σ 2. Řešení: Podle definice 3.1 potřebujeme určit statistiky T D a T H tak, aby pro každé µ platilo P (T D µ T H ) = 1 α. (3.4) 1. Vyjdeme z nejlepšího nestranného odhadu parametru µ, tj. výběrového průměru X. Hodilo by se nám najít takovou náhodnou veličinu K, která je funkcí parametru µ a jeho odhadu X, tj. K = K(µ, X), jejíž rozdělení známe a nezávisí na µ, tj. je určeno jednoznačně. Takovou veličinou je veličina K = X µ n, σ která má podle tvrzení 3.1 rozdělení N(0, 1), jehož 100γ procentní kvantily u(γ) jsou tabelovány. Všimněte si, že veličina K je skutečně funkcí pouze µ a X, protože σ známe a n je daný rozsah výběru. 2. Znalost a jednoznačnost rozdělení K nám umožňuje určit konstanty k D a k H, k D < k H, takové, že pro každé µ platí P (k D K k H ) = 1 α. (3.5) Když pak za K do vztahu (3.5) dosadíme X µ σ n a z nerovnosti uvnitř kulatých závorek vyjádříme µ, dostaneme hledaný 100(1 α) procentní intervalový odhad µ. Věnujme se tedy určení konstant k D a k H (viz obr. 3.1). Vztah 3.5 patí právě tehdy, když α = P ( K k D, k H ) = P [ (K < k D ) (K > k H ) ] = P (K < k D ) + P (K > k H ). Obrázek 3.1: Určení k D a k H

34 Intervalový odhad Konstanty k D a k H tedy stačí vybrat tak, aby P (K > k H ) = α 1 a P (K < k D ) = α 2, kde α 1 a α 2 jsou dvě nezáporná čísla s vlastností α 1 + α 2 = α. Zřejmě k H = u(1 α 1 ) a k D = u(α 2 ). Vzhledem k tomu, že α (a tedy i α 2 ) volíme prakticky malé číslo (určitě menší než 0.5), pro práci s tabulkami potřebujeme převodní vztah u(α 2 ) = u(1 α 2 ). Potom k D = u(1 α 2 ). Tedy P ( u(1 α 2 ) K u(1 α 1 ) ) = α. 3. Z nerovnosti u(1 α 2 ) X µ n u(1 α1 ) σ (která platí z pravděpodobností 1 α) vyjádříme µ. Dostaneme X u(1 α 1 ) σ n µ X + u(1 α 2 ) σ n. Tedy interval X u(1 α 1 ) σ n, X + u(1 α 2 ) σ n (3.6) je hledaný 100(1 α) procentní intervalový odhad střední hodnoty µ. Vraťme se zpět k rozdělení rizika α. Jestliže zvolíme α 1 = α 2, potom α 1 = α 2 = α a 2 u(1 α 1 ) = u(1 α 2 ) = u(1 α). 2 Dosazením do vztahu (3.6) dostaneme X u(1 α 2 ) σ, X + u(1 α n 2 ) σ, n což je 100(1 α) procentní oboustranný intervalový odhad µ. Jestliže zvolíme α 1 = 0, potom α 2 = α a u(1 α 1 ) = u(1) =, u(1 α 2 ) = u(1 α). Dostaneme interval (, X + u(1 α) σ n, což je 100(1 α) procentní horní intervalový odhad µ. Podobně při volbě α 1 = α, α 2 = 0 dostaneme interval X u(1 α) σ ),, n který je 100(1 α) procentním dolním intervalovým odhadem µ. Postup, který jsme použili v příkladu 3.2 ke konstrukci intervalového odhadu parametru µ normálního rozdělení se známým rozptylem σ 2, lze zobecnit na konstrukci intervalového odhadu parametrické funkce τ(ϑ).

3.1 Intervalové odhady parametrů normálního rozdělení 35 Konstrukce intervalového odhadu funkce τ(ϑ) Při konstrukci 100(1 α) procentního intervalového odhadu funkce τ(ϑ) se zpravidla postupuje následovně: 1. Vyjdeme z nejlepšího nestranného odhadu T parametrické funkce τ(ϑ). Najdeme náhodnou veličinu K takovou, že K = K(τ(ϑ), T ), tj. K je funkcí τ(ϑ) a jejího odhadu T, jejíž rozdělení známe a nezávisí na ϑ. 2. Pomocí tohoto rozdělení určíme konstanty k D a k H, k D < k H, takové, že P (k D K k H ) = 1 α (3.7) K tomu stačí konstanty k D a k H vybrat tak, aby P (K > k H ) = α 1 a P (K < k D ) = α 2, (3.8) kde α 1 a α 2 jsou dvě nezáporná čísla s vlastností α 1 + α 2 = α. 3. Nerovnost k D K k H pak převedeme na ekvivalentní nerovnost T D τ(ϑ) T H (v případech, které zde budeme uvažovat, to bude vždy možné), takže platí P (k D K k H ) = P (T D τ(ϑ) T H ) = 1 α pro každé ϑ, protože rozdělení náhodné veličiny K nezávisí na ϑ. Tj. interval T D, T H je 100(1 α) procentní intervalový odhad parametrické funkce τ(ϑ). Poznámka 3.2: Rozdělení rizika α Riziko α lze rozdělit na nezáporná čísla α 1 a α 2 nekonečně mnoha způsoby. Běžně se používají (stejně jako v příkladu 3.2) pouze tři: 1. α 1 = α 2 = α 2, 2. α 1 = 0, α 2 = α, 3. α 1 = α, α 2 = 0. Je-li α 1 > 0 a α 2 > 0 dostaneme oboustranný intervalový odhad. Při prvním způsobu rozdělení rizika tedy dostaneme oboustranný intervalový odhad. Dále budeme pod oboustranným intervalovým odhadem rozumět právě tento interval. Jestliže volíme druhý nebo třetí způsob, pak dostaneme jednostranné intervalové odhady. Vraťme se zpět k normálnímu rozdělení. Jestliže potřebujeme najít intervalový odhad střední hodnoty µ normálního rozdělení s neznámým rozptylem σ 2 (což je jistě častější situace), nemůžeme použít intervalový odhad (3.6). Nejlepším nestranným odhadem µ zůstavá X, ale pro konstrukci intervalového odhadu µ zde nemůžeme použít veličinu X µ σ n, protože neznáme σ. V tomto případě pracujeme s veličinou K = X µ S n z tvrzení 3.1, kdy neznámé σ nahradíme odhadem S. Náhodná veličina K má rozdělení t(n 1), jehož tvar hustoty je podobný tvaru hustoty rozdělení N(0, 1) v tom smyslu, že je symetrický podle osy y. Hledaný intervalový odhad bychom dostali analogicky

36 Intervalový odhad jako v příkladu 3.2. Od intervalového odhadu (3.6) se bude lišit tím, že místo s kvantily rozdělení N(0, 1) musíme pracovat s kvantily rozdělení t(n 1) a neznámou směrodatnou odchylku σ nahradit jejím odhadem S. Výsledky shrnuje následující tvrzení. Tvrzení 3.2: Intervalový odhad parametru µ Máme-li náhodný výběr o rozsahu n z rozdělení N(µ, σ 2 ), potom 100(1 α), tj. 100[1 (α 1 + α 2 )], procentní intervalový odhad střední hodnoty µ je: 1. v případě známého rozptylu σ 2 interval X u(1 α 1 ) σ n, X + u(1 α 2 ) σ n ; 2. v případě neznámého rozptylu σ 2 interval X t(n 1; 1 α 1 ) S n, X + t(n 1; 1 α 2 ) S n. Rozdělení rizika α na α 1 a α 2 je dáno v poznámce 3.2. Při druhém, resp. třetím způsobu rozdělení rizika dostaneme horní, resp. dolní intervalový odhad. Poznámka 3.3: Intervalový odhad střední hodnoty Intervalové odhady z tvzení 3.1 můžeme použít i pro intervalový odhad střední hodnoty E(X) náhodné veličiny X, která nemá normální rozdělení. Rozsah náhodného výběru z rozdělení X má být v tomto případě větší než 30. Spolehlivost odhadu je pak přibližně 1 α. Příklad 3.3: Z produkce konkrétní cihelny bylo náhodně vybráno osm cihel pálených plných a byla změřena jejich délka v mm. Výsledky meření byly: 290, 287, 289, 292, 293, 291, 286, 291. Předpokládáme, že délka cihly je normální náhodná veličina. Určete realizaci 95 procentního a) oboustranného intervalového odhadu střední hodnoty délky cihly; b) dolního intervalového odhadu střední hodnoty délky cihly. Řešení: Máme realizaci náhodného výběru z rozdělení X N(µ, σ 2 ) o rozsahu n = 8, kde neznáme ani jeden z parametrů µ a σ 2. 1. 100(1 α) procentní intervalový odhad střední hodnoty µ délky cihly je podle tvzení 3.2 interval X t(n 1; 1 α 1 ) S n, X + t(n 1; 1 α 2 ) S n. 2. Hledáme 95 procentní intervalový odhad µ, tj.

3.1 Intervalové odhady parametrů normálního rozdělení 37 100(1 α) = 95 1 α = 0.95 α = 0.05. Rozdělme riziko α (viz poznámka 3.2): a) α 1 = α 2 = α = 0.025. 2 Odtud t(n 1; 1 α 1 ) = t(7; 0.975) = 2.365, t(n 1; 1 α 2 ) = t(7; 0.975) = 2.365. b) α 1 = α = 0.05, α 2 = 0. Odtud t(n 1; 1 α 1 ) = t(n 1; 1 α) = t(7; 0.95) = 1.895, t(n 1; 1 α 2 ) = t(n 1; 1) =. 3. Vypočteme realizaci µ odhadu střední hodnoty µ a realizaci σ odhadu směrodatné odchylky σ, dosteneme µ = x = 289.875, σ = s =. 2.416. 4. Výsledky dosadíme do krajů intervalového odhadu v bodě 1, dostaneme a) 289.875 2.365 2.416 8, 289.875 + 2.365 2.416.= 8 287.855, 291.895 ; b) 289.875 1.895 2.416.= 8, ) 288.256, ). Realizace 95 procentního oboustranného intervalového odhadu střední hodnoty délky cihly je 287.855 mm, 291.895 mm, realizace 95 procentního dolního intervalového odhadu střední hodnoty délky cihly je 288.256 mm, ). Můžeme se tedy na 95 procent spolehnout, že střední hodnota délky cihly je v rozmezí 287.855 mm až 291.895 mm a že střední hodnota délky cihly je se stejnou spolehlivostí větší než 288.256 mm. Úkol 3.3: Řešte příklad 3.3 při koeficientu spolehlivosti 0.99 a výsledky porovnejte. Výsledek: a) 286.885 mm, 292.865 mm, b) 287.314 mm, ). Oboustranný intervalový odhad má v tomto případě větší délku a dolní hranice dolního intervalového odhadu je menší, protože jsme požadovali větší spolehlivost. Úkol 3.4: Jak by se změnil postup v příkladu 3.3, kdyby z předchozích měření bylo známo, že směrodatná odchylka délky cihly je 2 mm? Výsledek: a) 288.489 mm, 291.261 mm, b) 288.712 mm, ). Rozsah výběru pro odhad střední hodnoty µ Konstrukci intervalového odhadu střední hodnoty µ jsme již vysvětlili. Vraťme se ještě k přesnosti odhadu µ. Často se požaduje, aby měl odhad µ při dané spolehlivosti danou přesnost. Oboustranný intervalový odhad střední hodnoty µ je symetrický podle X (viz tvrzení 3.2 a poznámka (3.2)), tj. můžeme jej zapsat ve tvaru X, X +. Potom je délka intervalového odhadu odhadu µ rovna 2. Lze tedy přesnost odhadu µ vyjádřit pomocí, tzv. přípustné chyby odhadu.

38 Intervalový odhad Definice 3.2: Přípustná chyba odhadu µ Přípustná chyba odhadu X parametru µ je polovina délky oboustranného intervalového odhadu µ. V případě, že náhodný výběr pochází z rozdělení N(µ, σ 2 ) se známým rozptylem σ 2, platí: P (X u(1 α 2 ) σ µ X + u(1 α n 2 ) σ ) = 1 α. n Odtud plyne, že přípustná chyba odhadu µ je = u(1 α 2 ) σ n (3.9) a P ( X µ ) = 1 α. (3.10) Potom: 1. Ze vztahu (3.9) dostáváme, že přípustná chyba odhadu X parametru µ se při daném koeficientu spolehlivosti 1 α bude zmenšovat s rostoucím rozsahem výběru n. 2. Ze vztahu (3.10) plyne, že přípustná chyba odhadu µ je horní hranice absolutní hodnoty chyby odhadu µ, tj. X µ, které se dopustíme s pravděpodobností 1 α. 3. Je-li zadán nejen koeficient spolehlivosti odhadu, ale i přípustná chyba odhadu, pak můžeme určit minimální rozsah n min výběru tak, aby byly dodrženy oba požadavky současně. Stačí z nerovnice u(1 α 2 ) σ n vyjádřit n. Dostaneme [ u(1 α 2 n )σ ] 2. (3.11) Za n min pak vezmeme dolní hranici řešení (3.11) zaokrouhlenou nahoru na nejbližší celé číslo. Potom rozsah n min výběru zaručuje, že bude dodržena předepsaná spolehlivost 1 α i přesnost odhadu, vyjádřená přípustnou chybou odhadu. Přípustná chyba odhadu bude maximálně rovna požadované.

3.1 Intervalové odhady parametrů normálního rozdělení 39 V případě neznámého rozptylu pro přípustnou chybu odhadu µ platí = t(n 1; 1 α 2 ) S n. (3.12) Tedy na rozdíl od přípustné chyby střední hodnoty µ při známém rozptylu σ 2 je náhodná veličina. V tomto případě lze postupovat pomocí tzv. předvýběru, kdy nejprve provedeme náhodný výběr o rozsahu n 1. Z realizace výběru vypočteme realizaci výběrového rozptylu s 2 1 = 1 n 1 1 n 1 i=1 (x i x) 2 a z nerovnice t(n 1 1; 1 α 2 ) s 1 n vyjádříme n. Dostaneme [ t(n1 1; 1 α 2 n )s ] 2 1. (3.13) Za n min pak opět stačí vzít dolní hranici řešení (3.13) zaokrouhlenou nahoru na nejbližší celé číslo. Náhodný výběr o rozsahu n min už pak dává dostatečně přesný a spolehlivý odhad. Vysvětlení tohoto postupu přesahuje rámec našeho textu (viz např. [4]). Je-li n 1 n min je už v předvýběru splněna požadovaná spolehlivost a přesnost. Je-li n 1 < n min, doplní se výběr o dalších n min n 1 pozorování. Příklad 3.4: Za odhad vzdálenosti se bere průměr měření této vzdálenosti. Náhodné chyby měření mají normální rozdělení se střední hodnotou nula. Kolik měření je třeba provést, aby přípustná chyba při určování vzdálenosti nepřekročila 0.05 cm s pravděpodobností 0.95, jestliže směrodatná odchylka náhodné chyby měření: 1. je 0.1 cm; 2. není známá a z pěti meření byla vypočtena hodnota výběrové směrodatné odchylky 0.1 cm. Řešení: Označme µ neznámou vzdálenost a Y náhodnou chybu měření, potom pro neznámý výsledek měření X platí X = µ+y a tedy X N(µ, σ 2 ). Požadujeme, aby přípustná chyba odhadu byla maximálně 0.05 cm při koeficientu spolehlivosti 1 α = 0.95.

40 Intervalový odhad 1. Ze vztahu (3.11) dostáváme [ u(1 α 2 n )σ ] 2 [ ] 2 u(0.975) 0.1.= = 15.4 = n 16. 0.05 2. Naše měření budeme považovat za předvýběr, máme n 1 = 5, s 1 = 0.1. Potom podle vztahu (3.13) dostaneme n [ t(n1 1; 1 α 2 )s 1 ] 2 = [ ] 2 t(4; 0.975) 0.1.= 30.8 = n 31. 0.05 Při známém rozptylu stačí provést 16 měření, při neznámém rozptylu musíme předvýběr doplnit o dalších 26 měření. Potom se můžeme na 95% spolehnout, že skutečná vzdálenost µ je v intervalu x 0.05, x + 0.05. Tedy průměrně v 95% případů bude pro průměrnou vzdálenost vypočítanou z 16, resp. z 31 doplněných měření platit x µ 0.05. 3.1.2 Intervalový odhad rozptylu Příklad 3.5: Určete 100(1 α) procentní intervalový odhad rozptylu σ 2 normálního rozdělení N(µ, σ 2 ) se známou střední hodnotou µ. Řešení: 1. Vyjdeme z nejlepšího nestranného odhadu parametru σ 2 v případě známé střední hodnoty µ, tj. statistiky S 2 0. Potřebujeme najít náhodnou veličinu K tak, že K je funkcí rozptylu σ 2 a jeho odhadu S 2 0, jejíž rozdělení známe a nezávisí na σ 2. Podle tvrzení 3.1 lze za K zvolit náhodnou veličinu K = ns2 0 σ 2, která má rozdělení χ 2 (n), jehož 100γ procentní kvantily χ 2 (n; γ) jsou tabelovány. 2. Určíme konstanty k D a k H, k D < k H, tak, aby P (k D K k h ) = 1 α. K tomu stačí vybrat konstanty k D a k H tak, aby platilo (viz obr. 3.2) P (K > k H ) = α 1 a P (K < k D ) = α 2, kde α 1 a α 2 jsou dvě nezáporná čísla s vlastností α 1 + α 2 = α. Zřejmě k H = χ 2 (n; 1 α 1 ) a k D = χ 2 (n; α 2 ). Potom ( ) P χ 2 (n; α 2 ) K χ 2 (n; 1 α 1 ) = 1 α.

3.1 Intervalové odhady parametrů normálního rozdělení 41 Obrázek 3.2: Určení k D a k H 3. Z nerovnosti χ 2 (n; α 2 ) ns2 0 σ 2 χ 2 (n; 1 α 1 ) vyjádříme σ 2, dostaneme Tedy ns 2 0 χ 2 (n; 1 α 1 ) σ2 ns2 0 χ 2 (n; α 2 ). ns0 2 χ 2 (n; 1 α 1 ), ns0 2. (3.14) χ 2 (n; α 2 ) je hledaný 100(1 α) procentní intervalový odhad rozptylu σ 2. Při 1. způsobu dělení rizika α z poznámky 3.2 dostaneme χ 2 (n; 1 α 1 ) = χ 2 (n; 1 α), 2 χ2 (n; α 2 ) = χ 2 (n; α) 2 a tedy interval ns0 2 ns 2 0 χ 2 (n; 1 α), χ 2 2 (n; α) 2 je 100(1 α) procentní oboustranný intervalový odhad σ 2. Při 2. způsobu dělení dostaneme χ 2 (n; 1 α 1 ) = χ 2 (n; 1) =, χ 2 (n; α 2 ) = χ 2 (α) a intervalový odhad ( 0, ns0 2 χ 2 (n; α) je horní intervalový odhad σ 2. Ve třetím případě, pak zcela analogicky dostáváme dolní intervalový odhad σ 2 ns0 2 ) χ 2 (n; 1 α),. Jestliže potřebujeme najít intervalový odhad rozptylu σ 2 normálního rozdělení s neznámou střední hodnotou µ, nemůžeme použít intervalový odhad (3.14). Nestranným odhadem σ 2 je v tomto případě výběrový rozptyl S 2 a pro konstrukci intervalového odhadu σ 2 použijeme veličinu K = (n 1)S2, která σ 2 má podle tvrzení 3.1 rozdělení χ 2 (n 1). Hledaný intervalový odhad bychom dostali analogicky jako v příkladu 3.5. Výsledky shrnuje následující tvrzení.

42 Intervalový odhad Tvrzení 3.3: Intervalový odhad parametru σ 2 Máme-li náhodný výběr o rozsahu n z rozdělení N(µ, σ 2 ), potom 100(1 α), tj. 100[1 (α 1 + α 2 )], procentní intervalový odhad rozptylu σ 2 je: 1. v případě známé střední hodnoty µ interval ns0 2 χ 2 (n; 1 α 1 ), ns0 2 ; χ 2 (n; α 2 ) 2. v případě neznámé střední hodnoty µ interval (n 1)S 2 χ 2 (n 1; 1 α 1 ), (n 1)S 2. χ 2 (n 1; α 2 ) Rozdělení rizika α na α 1 a α 2 je dáno v poznámce 3.2. Horní, resp. dolní intervalový odhad dostaneme při druhém, resp. třetím způsobu rozdělení rizika. Poznámka 3.4: Intervalový odhad σ 100(1 α) procentní intervalový odhad směrodatné odchylky σ rozdělení N(µ, σ 2 ) dostaneme z intervalových odhadů v tvrzení 3.3 tak, že kraje příslušných intervalových odhadů odmocníme. Poznámka 3.5: Intervalový odhad rozptylu Intervalové odhady rozptylu z tvrzení 3.3 můžeme na rozdíl od intervalových odhadů střední hodnoty použít pouze v případě, že máme náhodný výběr z rozdělení N(µ, σ 2 ). Příklad 3.6: Vraťte se k příkladu 3.3 a určete realizaci 99 procentního oboustranného intervalového odhadu směrodatné odchylky délky cihly. Řešení: Máme realizaci náhodného výběru z rozdělení X N(µ, σ 2 ) o rozsahu n = 8, kde ani jeden z parametrů neznáme. Nejprve určíme intervalový odhad rozptylu. 1. 100(1 α) procentní intervalový odhad rozptylu σ 2 délky cihly je podle tvzení 3.3 interval (n 1)S 2 χ 2 (n 1; 1 α 1 ), (n 1)S 2 χ 2 (n 1; α 2 ) 2. Hledáme 99 procentní intervalový odhad σ 2, tj. 100(1 α) = 99 1 α = 0.99 α = 0.01 Rozdělme riziko α (viz poznámka 3.2): α 1 = α 2 = α 2 = 0.005. Odtud.

3.2 Kontrolní otázky 43 χ 2 (n 1; 1 α 1 ) = χ 2 (7; 0.995) = 20.28, χ 2 (n 1; α 2 ) = χ 2 (7; 0.005)) = 0.989. 3. Z příkladu 3.3 máme σ = s = 2.416. 4. Výsledky dosadíme do krajů intervalového odhadu v bodě 1, dostaneme 7 2.416 2 20.28, 7 2.4162.= 2.015, 41.314. 0.989 Realizace 99 procentního oboustranného intervalového odhadu rozptylu délky cihly je 2.015 mm 2, 41.314 mm 2 a tedy realizace 99 procentního oboustranného intervalového odhadu směrodatné odchylky délky cihly je (1.420 mm, 6.428 mm). V technických aplikacích se většinou 100(1 α) procentní intervalové odhady neznámých parametrů nebo funkcí těchto parametrů neodvozují, ale stačí je najít v příslušné statistické nebo technické literatuře. Pro výpočet realizace intervalového odhadu pak stačí zvolit koeficient spolehlivost odhadu 1 α, vypočítat realizace příslušných statistik v intervalových odhadech se vyskytujících a potřebné kvantily najít ve statistických tabulkách. Realizace intervalových odhadů střední hodnoty a rozptylu normální náhodné veličiny při obou neznámých parametrech počítá STATGRAPHICS v nabídce Describe Numeric Data One-Sample Analysis. EXCEL počítá realizaci intervalového odhadu střední hodnoty normálního rozdělení se známým rozptylem v nabídce průvodce funkcí f x funkce statistické CONFIDENCE. 3.2 Kontrolní otázky 1. Vlastními slovy řekněte, co si představujete pod 100(1 α) procentním intervalovým odhadem funkce τ(ϑ). 2. Musí realizace 90 procentního intervalového odhadu parametrické funkce τ(ϑ) obsahovat skutečnou hodnotu této funkce? 3. Ze 100 realizací náhodného výběru sestrojíme 100 realizací 80 procentního intervalového odhadu funkce τ(ϑ), musí každá z těchto realizací obsahovat skutečnou hodnotu této funkce? 4. Jaké druhy intervalových odhadů rozlišujeme? 5. Z realiazce náhodného výběru z normálního rozdělení o rozsahu n = 5 určíme realizaci výběrového rozptylu s 2 a průměru x a vypočteme realizaci intervalového odhadu střední hodnoty µ tak, že a) s 2 považujeme za odhad σ 2 ; b) s 2 považujeme za skutečnou hodnotu σ 2. Čím se tyto intervaly liší a který postup je správný? 6. Rozhodněte, které tvrzení platí: Přesnost odhadu střední hodnoty µ normálního rozdělení se při známém σ 2 zvětší, když:

44 Intervalový odhad a) zvětšíme rozsah výběru; b) zvětšíme koeficient spolehlivosti; c) když se zmenší rozptyl. 3.3 Cvičení 1. Hmotnost jedné porce kávy má přibližně normální rozdělení se střední hodnotou 7 g a směrodatnou odchylkou 0.4 g. Jaká je pravděpodobnost, že k přípravě 14 porcí bude stačit jeden 100 g balíček? 2. Teplota, při které se mění kvalita povrchu dřevotřískových desek, je normální náhodná veličina se střední hodnotou 104 C a směrodatnou odchylkou 8 C. Náhodně bylo vybráno 25 desek. V jakém intervalu lze očekávat X, S 2 a S s pravděpodobností 0.99, mají-li se hodnoty veličin X, S 2 a S vyskytovat se stejnou pravděpodobností nad horní a pod dolní mezí? 3. Najděte realizace 90 procentních horních intervalových odhadů neznámých parametrů v příkladě 6 ze cvičení 1.4. Předpokládejte, že má mez průtažnosti oceli přibližně normální rozdělení. 4. Sledovaný rozměr součástky má normální rozdělení se směrodatnou odchylkou 0.15 mm. Určete realizace 99 procentního oboustranného, horního a dolního intervalového odhadu střední hodnoty sledovaného rozměru, jestliže byl na základě měření osmi náhodně vybraných součástek vypočten průměr 110.2 mm. V případě, že není přípustná chyba odhadu menší než 0.1 mm, určete rozsah n výběru tak, aby byla dodržena předepsaná přesnost. 5. Opakovaným meřením rychlosti vody v potrubí jsme získali následující výsledky v m/s: 4.20, 4.28, 4.27, 4.18. Předpokládejme, že naměřené hodnoty lze považovat za realizaci náhodného výběru z normálního rozdělení. a) Najděte realizaci 95 procentního intervalového odhadu střední hodnoty a směrodatné odchylky rychlosti. b) V případě, že není přípustná chyba odhadu střední hodnoty menší než 0.05, určete rozsah výběru tak, aby byla zaručena předepsaná přesnost. 6. Průměrná hodnota vzdálenosti k orientačnímu bodu, získaná ze 4 nezávislých měření, je 2 250 m. Chyba měřicího přístroje je normální náhodná veličina s parametry 10 m a 50 m 2. Určete realizaci 99 a 95 procentního intervalového odhadu měřené veličiny. 7. Má se určit střední hodnota doby, která je potřebná k vykonání určité činnosti. Byl měřen čas u 40 dělníků a vypočtena průměrná hodnota 42.5 minut a odhad směrodatné odchylky 3.8 minut. Jaké maximální chyby se dopustíme s pravděpodobností 0.99, když za odhad střední hodnoty vezmeme 42.5 minut?

3.4 Klíč a výsledky cvičení 45 8. Vypočtěte realizace 95 procentních oboustranných intervalových odhadů neznámých parametrů v příkladě 6 ze cvičení 2.3 Předpokládejte, že sledovaná náhodná veličina má normální rozdělení. 9. Během 21 dnů byly v určitém regionu registrovány počty nehod za den. Výsledky jsou v následující tabulce: Určete: Počet nehod 0 1 2 3 4 5 n j 4 8 5 1 2 1 a) realizaci bodového odhadu střední hodnoty a směrodatné odchylky počtu nehod za den; b) realizaci 99 procentního horního odhadu střední hodnoty poču nehod za den, je-li známo, že počet nehod za den má přibližně Poissonovo rozdělení. 3.4 Klíč a výsledky cvičení Cvičení: 1. S pravděpodobností 0.9099. 2. 99.8784 X 108.1216, 26.3653 S 2 121.4933, 5.1347 S 11.0224. 3. µ 289.028 MP a, σ 2 274.208 MP a 2. 4. 110.063 mm µ 110.337 mm, µ 110.323 mm, µ 110.077 mm. Je třeba provést 15 měření. 5. a) µ = 4.2325 m/s, σ. = 0.0499 m/s, 4.1531 m/s µ 4.3119 m/s, 0.0283 m/s σ 0.1860 m/s. b) Výběr je nutné doplnit o alespoň 7 měření. 6. 2230.892 m µ 2249.108 m, 2233.070 m µ 2246.930 m. 7. Maximální chyba je 1.548 minut. 8. 0.030 kg 2 σ 2 0.068 kg 2. 9. a) Ê(X) = x =. 1.619,. D(X) = s = 1.396. b) Náhodná veličina X nemá normální rozdělení a rozsah výběru není vetší než 30, nemůžeme tedy použít intervalový odhad střední hodnoty normálního rozdělení. Pro Poissonovo rozdělení s parametrem λ platí, že E(X) = λ a 100(1 α) procentní intervalový odhad parametru λ je (viz např. [12]) interval χ 2 (2nX;α 1 ), χ2 (2nX+2;1 α 2 ), kde rozdělení rizika α na α 2n 2n 1 a α 2 je dáno v poznámce 3.2. Realizace hledaného intervalového odhadu je (0, 2.372 (χ 2 (70; 0.99) =. 99.628). Tedy střední hodnota počtu nehod za den je téměř jistě nejvýše 2.372 nehod.

Příloha A Tabulky

47 Tabulka A.1: Hodnoty distribuční funkce Φ(x) normované normální náhodné veličiny x Φ(x) 0.00 0.5000 0.01 0.5040 0.02 0.5080 0.03 0.5120 0.04 0.5160 0.05 0.5199 0.06 0.5239 0.07 0.5279 0.08 0.5319 0.09 0.5359 0.10 0.5398 0.11 0.5438 0.12 0.5478 0.13 0.5517 0.14 0.5557 0.15 0.5596 0.16 0.5636 0.17 0.5675 0.18 0.5714 0.19 0.5753 0.20 0.5793 0.21 0.5832 0.22 0.5871 0.23 0.5910 0.24 0.5948 0.25 0.5987 0.26 0.6026 0.27 0.6064 0.28 0.6103 0.29 0.6141 0.30 0.6179 0.31 0.6217 0.32 0.6255 0.33 0.6293 0.34 0.6331 0.35 0.6368 0.36 0.6406 0.37 0.6443 0.38 0.6480 0.39 0.6517 x Φ(x) 0.40 0.6554 0.41 0.6591 0.42 0.6628 0.43 0.6664 0.44 0.6700 0.45 0.6736 0.46 0.6772 0.47 0.6808 0.48 0.6844 0.49 0.6879 0.50 0.6915 0.51 0.6950 0.52 0.6985 0.53 0.7019 0.54 0.7054 0.55 0.7088 0.56 0.7123 0.57 0.7157 0.58 0.7190 0.59 0.7224 0.60 0.7257 0.61 0.7291 0.62 0.7324 0.63 0.7357 0.64 0.7389 0.65 0.7422 0.66 0.7454 0.67 0.7486 0.68 0.7517 0.69 0.7549 0.70 0.7580 0.71 0.7611 0.72 0.7642 0.73 0.7673 0.74 0.7704 0.75 0.7734 0.76 0.7764 0.77 0.7794 0.78 0.7823 0.79 0.7852 x Φ(x) 0.80 0.7881 0.81 0.7910 0.82 0.7939 0.83 0.7967 0.84 0.7995 0.85 0.8023 0.86 0.8051 0.87 0.8079 0.88 0.8106 0.89 0.8133 0.90 0.8159 0.91 0.8186 0.92 0.8212 0.93 0.8238 0.94 0.8264 0.95 0.8289 0.96 0.8315 0.97 0.8340 0.98 0.8365 0.99 0.8389 1.00 0.8413 1.01 0.8438 1.02 0.8461 1.03 0.8485 1.04 0.8508 1.05 0.8531 1.06 0.8554 1.07 0.8577 1.08 0.8599 1.09 0.8621 1.10 0.8643 1.11 0.8665 1.12 0.8686 1.13 0.8708 1.14 0.8729 1.15 0.8749 1.16 0.8770 1.17 0.8790 1.18 0.8810 1.19 0.8830 x Φ(x) 1.20 0.8849 1.21 0.8869 1.22 0.8888 1.23 0.8907 1.24 0.8925 1.25 0.8944 1.26 0.8962 1.27 0.8980 1.28 0.8997 1.29 0.9015 1.30 0.9032 1.31 0.9049 1.32 0.9066 1.33 0.9082 1.34 0.9099 1.35 0.9115 1.36 0.9131 1.37 0.9147 1.38 0.9162 1.39 0.9177 1.40 0.9192 1.41 0.9207 1.42 0.9222 1.43 0.9236 1.44 0.9251 1.45 0.9265 1.46 0.9279 1.47 0.9292 1.48 0.9306 1.49 0.9319 1.50 0.9332 1.51 0.9345 1.52 0.9357 1.53 0.9370 1.54 0.9382 1.55 0.9394 1.56 0.9406 1.57 0.9418 1.58 0.9429 1.59 0.9441 x Φ(x) 1.60 0.9452 1.61 0.9463 1.62 0.9474 1.63 0.9484 1.64 0.9495 1.65 0.9505 1.66 0.9515 1.67 0.9525 1.68 0.9535 1.69 0.9545 1.70 0.9554 1.71 0.9564 1.72 0.9573 1.73 0.9582 1.74 0.9591 1.75 0.9599 1.76 0.9608 1.77 0.9616 1.78 0.9625 1.79 0.9633 1.80 0.9641 1.81 0.9649 1.82 0.9656 1.83 0.9664 1.84 0.9671 1.85 0.9678 1.86 0.9686 1.87 0.9693 1.88 0.9699 1.89 0.9706 1.90 0.9712 1.91 0.9719 1.92 0.9726 1.93 0.9732 1.94 0.9738 1.95 0.9744 1.96 0.9750 1.97 0.9756 1.98 0.9761 1.99 0.9767

48 Tabulky Tabulka A.2: Hodnoty distribuční funkce Φ(x) normované normální náhodné veličiny x Φ(x) 2.00 0.9773 2.01 0.9778 2.02 0.9783 2.03 0.9788 2.04 0.9793 2.05 0.9798 2.06 0.9803 2.07 0.9808 2.08 0.9812 2.09 0.9817 2.10 0.9821 2.11 0.9826 2.12 0.9830 2.13 0.9834 2.14 0.9838 2.15 0.9842 2.16 0.9846 2.17 0.9850 2.18 0.9854 2.19 0.9857 2.20 0.9861 2.21 0.9864 2.22 0.9868 2.23 0.9871 2.24 0.9875 2.25 0.9878 2.26 0.9881 2.27 0.9884 2.28 0.9887 2.29 0.9890 2.30 0.9893 2.31 0.9896 2.32 0.9898 2.33 0.9901 2.34 0.9904 2.35 0.9906 2.36 0.9909 2.37 0.9911 2.38 0.9913 2.39 0.9916 x Φ(x) 2.40 0.9918 2.41 0.9920 2.42 0.9922 2.43 0.9925 2.44 0.9927 2.45 0.9929 2.46 0.9931 2.47 0.9932 2.48 0.9934 2.49 0.9936 2.50 0.9938 2.51 0.9940 2.52 0.9941 2.53 0.9943 2.54 0.9945 2.55 0.9946 2.56 0.9948 2.57 0.9949 2.58 0.9951 2.59 0.9952 2.60 0.9953 2.61 0.9955 2.62 0.9956 2.63 0.9957 2.64 0.9959 2.65 0.9960 2.66 0.9961 2.67 0.9962 2.68 0.9963 2.69 0.9964 2.70 0.9965 2.71 0.9966 2.72 0.9967 2.73 0.9968 2.74 0.9969 2.75 0.9970 2.76 0.9971 2.77 0.9972 2.78 0.9973 2.79 0.9974 x Φ(x) 2.80 0.9974 2.81 0.9975 2.82 0.9976 2.83 0.9977 2.84 0.9977 2.85 0.9978 2.86 0.9979 2.87 0.9979 2.88 0.9980 2.89 0.9981 2.90 0.9981 2.91 0.9982 2.92 0.9983 2.93 0.9983 2.94 0.9984 2.95 0.9984 2.96 0.9985 2.97 0.9985 2.98 0.9986 2.99 0.9986 3.00 0.9987 3.01 0.9987 3.02 0.9987 3.03 0.9988 3.04 0.9988 3.05 0.9989 3.06 0.9989 3.07 0.9989 3.08 0.9990 3.09 0.9990 3.10 0.9990 3.11 0.9991 3.12 0.9991 3.13 0.9991 3.14 0.9992 3.15 0.9992 3.16 0.9992 3.17 0.9992 3.18 0.9993 3.19 0.9993 x Φ(x) 3.20 0.9993 3.21 0.9993 3.22 0.9994 3.23 0.9994 3.24 0.9994 3.25 0.9994 3.26 0.9994 3.27 0.9995 3.28 0.9995 3.29 0.9995 3.30 0.9995 3.31 0.9995 3.32 0.9996 3.33 0.9996 3.34 0.9996 3.35 0.9996 3.36 0.9996 3.37 0.9996 3.38 0.9996 3.39 0.9997 3.40 0.9997 3.41 0.9997 3.42 0.9997 3.43 0.9997 3.44 0.9997 3.45 0.9997 3.46 0.9997 3.47 0.9997 3.48 0.9997 3.49 0.9998 3.50 0.9998 3.51 0.9998 3.52 0.9998 3.53 0.9998 3.54 0.9998 3.55 0.9998 3.56 0.9998 3.57 0.9998 3.58 0.9998 3.59 0.9998 x Φ(x) 3.60 0.9998 3.61 0.9998 3.62 0.9999 3.63 0.9999 3.64 0.9999 3.65 0.9999 3.66 0.9999 3.67 0.9999 3.68 0.9999 3.69 0.9999 3.70 0.9999 3.71 0.9999 3.72 0.9999 3.73 0.9999 3.74 0.9999 3.75 0.9999 3.76 0.9999 3.77 0.9999 3.78 0.9999 3.79 0.9999 3.80 0.9999 3.81 0.9999 3.82 0.9999 3.83 0.9999 3.84 0.9999 3.85 0.9999 3.86 0.9999 3.87 0.9999 3.88 0.9999 3.89 1.0000 3.90 1.0000 3.91 1.0000 3.92 1.0000 3.93 1.0000 3.94 1.0000 3.95 1.0000 3.96 1.0000 3.97 1.0000 3.98 1.0000 3.99 1.0000 Tabulka A.3: Kvantily u(α) normované normální náhodné veličiny α 0.900 0.950 0.975 0.990 0.995 u(α) 1.282 1.645 1.960 2.326 2.576

49 Tabulka A.4: Kvantily χ 2 (n; α) rozdělení χ 2 (n) n\α 0.005 0.010 0.025 0.050 0.100 0.900 0.950 0.975 0.990 0.995 1 0.000 0.000 0.001 0.004 0.016 2.706 3.842 5.024 6.635 7.879 2 0.010 0.020 0.051 0.103 0.211 4.605 5.992 7.378 9.210 10.60 3 0.072 0.115 0.216 0.352 0.584 6.251 7.815 9.348 11.35 12.84 4 0.207 0.292 0.484 0.711 1.064 7.779 9.488 11.14 13.28 14.86 5 0.412 0.554 0.831 1.146 1.610 9.236 11.07 12.83 15.09 16.75 6 0.676 0.872 1.237 1.635 2.204 10.65 12.59 14.45 16.81 18.55 7 0.989 1.239 1.690 2.167 2.833 12.02 14.07 16.01 18.48 20.28 8 1.344 1.647 2.180 2.733 3.490 13.36 15.51 17.54 20.09 21.96 9 1.735 2.088 2.700 3.325 4.168 14.68 16.92 19.02 21.67 23.59 10 2.156 2.558 3.249 3.940 4.865 15.99 18.31 20.48 23.21 25.19 11 2.603 3.054 3.816 4.575 5.578 17.28 19.68 21.92 24.73 26.76 12 3.074 3.571 4.404 5.226 6.304 18.55 21.03 23.34 26.22 28.30 13 3.565 4.107 5.009 5.892 7.042 19.81 22.36 24.74 27.69 29.82 14 4.075 4.660 5.629 6.571 7.790 21.06 23.69 26.12 29.14 31.32 15 4.601 5.229 6.262 7.261 8.547 22.31 25.00 27.49 30.58 32.80 16 5.142 5.812 6.608 7.962 9.312 23.54 26.30 28.85 32.00 34.27 17 5.697 6.408 7.564 8.672 10.09 24.77 27.59 30.19 33.41 35.72 18 6.265 7.015 8.231 9.391 10.87 25.99 28.87 31.53 34.81 37.16 19 6.844 7.633 8.907 10.12 11.65 27.20 30.14 32.85 36.19 38.58 20 7.434 8.260 9.591 10.85 12.44 28.41 31.41 34.17 37.57 40.00 21 8.034 8.897 10.28 11.59 13.34 29.62 32.67 35.48 38.93 41.40 22 8.643 9.543 10.98 12.34 14.04 30.81 33.92 36.78 40.29 42.80 23 9.260 10.20 11.69 13.09 14.85 32.01 35.17 38.08 41.64 44.18 24 9.887 10.86 12.40 13.85 15.66 33.20 36.42 39.36 42.98 45.56 25 10.52 11.52 13.12 14.61 16.47 34.38 37.65 40.65 44.31 46.93 26 11.16 12.20 13.84 15.38 17.29 35.56 38.89 41.92 45.64 48.29 27 11.81 12.88 14.57 16.15 18.11 36.74 40.11 43.20 46.96 49.65 28 12.46 13.57 15.31 16.93 18.94 37.92 41.34 44.46 48.28 50.99 29 13.12 14.26 16.05 17.71 19.77 39.09 42.56 45.72 49.59 52.34 30 13.79 14.95 16.79 18.49 20.60 40.26 43.77 46.98 50.89 53.67

50 Tabulky Tabulka A.5: Kvantily t(n; α) rozdělení t(n) n\α 0.900 0.950 0.975 0.990 0.995 1 3.078 6.314 12.71 31.82 63.66 2 1.886 2.920 4.303 6.964 9.925 3 1.638 2.353 3.182 4.541 5.841 4 1.533 2.132 2.776 3.747 4.604 5 1.476 2.015 2.571 3.365 4.032 6 1.440 1.943 2.447 3.143 3.707 7 1.415 1.895 2.365 2.998 3.500 8 1.397 1.860 2.306 2.897 3.355 9 1.383 1.833 2.262 2.821 3.250 10 1.372 1.813 2.228 2.764 3.169 11 1.363 1.796 2.201 2.718 3.106 12 1.356 1.782 2.179 2.681 3.055 13 1.350 1.771 2.160 2.650 3.012 14 1.345 1.761 2.145 2.625 2.977 15 1.341 1.753 2.131 2.603 2.947 16 1.337 1.746 2.120 2.584 2.921 17 1.333 1.740 2.110 2.567 2.898 18 1.330 1.734 2.101 2.552 2.878 19 1.328 1.729 2.093 2.540 2.861 20 1.325 1.725 2.086 2.520 2.845 21 1.323 1.721 2.080 2.518 2.831 22 1.321 1.717 2.074 2.508 2.819 23 1.320 1.714 2.069 2.500 2.807 24 1.318 1.711 2.064 2.492 2.797 25 1.316 1.708 2.060 2.485 2.787 26 1.315 1.705 2.056 2.479 2.779 27 1.314 1.703 2.052 2.473 2.771 28 1.313 1.701 2.048 2.467 2.763 29 1.311 1.699 2.045 2.462 2.756 30 1.310 1.697 2.042 2.457 2.750 1.282 1.645 1.960 2.326 2.576

Literatura [1] Anděl, J.: Statistické metody. MATFYZPRESS Praha 1993. [2] Cyhelský, L., Hustopecký, J., Závodský, P.: Příklady k teorii statistiky. SNTL/ALFA Praha 1978. [3] Friedrich, V.: Statistika 1 - vysokoškolská učebnice pro DS. EF ZU Plzeň 2002. [4] Hátle, J., Likeš, J.: Základy počtu pravděpodobnosti a matematické statistiky. SNTL/ALFA Praha 1972. [5] Hebák, P., Kahounová, J.: Počet pravděpodobnosti v příkladech. SNTL Praha 1988. [6] Jarušková, D., Hála, M.: Pravděpodobnost a matematická statistika 12. ČVUT Praha 2000. [7] Jarušková, D.: Matematická statistika 12. ČVUT Praha 1995. [8] Koutková, H., Moll, I.: Úvod do pravděpodobnosti a matematické statistiky. VUT Brno 2001. [9] Koutková, H., Dlouhý, O.: Sbírka příkladů z pravděpodobnosti a matematické statistiky. VUT Brno 2002. [10] Křivý, J.: Základy matematické statistiky. Ostrava 1983. [11] Likeš, J., Laga, J.: Základní statistické tabulky. SNTL Praha 1978. [12] Likeš, J., Machek, J.: Matematická statistika. Matematika pro vysoké školy technické. Sešit XI. SNTL Praha 1981. [13] Novovičová, J.: Pravděpodobnost a matematická statistika 12. ČVUT Praha. 1999. [14] Škrášek, J., Tichý, Z.: Základy aplikované matematiky III. SNTL Praha 1990. [15] Vorlíček, M., Holický M., Špačková, M.: Pravděpodobnost a matematická statistika pro inženýry. VUT Praha 1979. [16] Walpole, R. E., Myers, R. H.: Probability and Statistics for Engineers and Scientists. MACMILLAN PUBLISHING COMPANY New York 1990.