PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA

Rozměr: px
Začít zobrazení ze stránky:

Download "PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA"

Transkript

1 VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FAKULTA STAVEBNÍ HELENA KOUTKOVÁ PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA MODUL GA03 M3 ZÁKLADY TEORIE ODHADU STUDIJNÍ OPORY PRO STUDIJNÍ PROGRAMY S KOMBINOVANOU FORMOU STUDIA

2 c Helena Koutková, Brno 2004

3 Obsah Úvod Označení Náhodný výběr a statistiky Náhodný výběr Rozdělení četností a jejich znázornění Statistiky Kontrolní otázky Cvičení Klíč a výsledky cvičení Bodový odhad Vlastnosti odhadů Nestranný odhad Nejlepší nestranný odhad Střední kvadratická chyba Konzistentní odhad Kontrolní otázky Cvičení Klíč a výsledky cvičení Intervalový odhad Intervalové odhady parametrů normálního rozdělení Intervalový odhad střední hodnoty Intervalový odhad rozptylu Kontrolní otázky Cvičení Klíč a výsledky cvičení A Tabulky 46 Literatura 51

4 Úvod V tomto modulu se seznámíte se základy teorie odhadu, která je částí matematické statistiky. V teorii pravděpodobnosti jste předpokládali, že máte o náhodné veličině z pravděpodobnostního hlediska úplnou informaci, tj. předpokládali jste, že znáte rozdělení pravděpodobnosti náhodné veličiny a zabývali jste se studiem jeho vlastností. Úlohou teorie odhadu je určit (odhadnout) rozdělení sledované náhodné veličiny, a to na základě jejích napozorovaných hodnot. Známe-li typ rozdělení náhodné veličiny, omezuje se úloha teorie odhadu na určení (odhad) parametrů nebo určitých funkcí parametrů tohoto typu rozdělení. Modul je rozdělen na tři kapitoly. V kapitole 2 a 3 předpokládáme, že je znám typ rozdělení náhodné veličiny. Kapitola 1 je určena k zavední základních pojmů, ze kterých vychází nejen teorie odhadu, ale celá matematická statistika. Dozvíte se, jaké napozorované hodnoty sledované veličiny máme na mysli a jakým způsobem lze tyto hodnoty popsat. Kapitola 2 je věnována bodovému odhadu a jeho vlastnostem. Ze zjištěných hodnot náhodné veličiny budeme chtít vypočítat jediné číslo, které budeme považovat za odhad parametru nebo funkce parametrů rozdělení této náhodné veličiny. Samozřejmě budeme požadovat, aby tento odhad měl nějaké rozumné vlastnosti. Kapitola 3 je věnována kvalitativně vyššímu typu odhadu. Zde budeme hledat interval, který bude s předem danou vysokou pravděpodobností obsahovat skutečnou hodnotu parametru nebo funkce parametrů rozdělení. V tomto případě budeme hovořit o intervalovém odhadu. V jednotlivých kapitolách jsou řešené příklady bezprostředně navazující na probírané učivo. Na konci každé kapitoly jsou uvedeny podkapitoly Kontrolní otázky, Cvičení a Klíč a výsledky cvičení. Pro další procvičení látky probírané v tomto a následujícím modulu autorka doporučuje literaturu [9]. Požadované znalosti Pro studium a pochopení tohoto modulu potřebujete znát základy teorie pravděpodobnosti a to především pojmy: náhodná veličina a vektor, obor hodnot náhodné veličiny a vektoru, pravděpodobnost, rozdělení pravděpodobnosti, rozdělovací funkce - hustota a pravděpodobnostní funkce, distribuční funkce, střední hodnota, rozptyl, směrodatná odchylka a kvantil rozdělení, nezávislost náhodných veličin. Dále byste měli znát základní informace o následujících typech rozdělení: normálním rozdělení s parametry µ a σ 2, t-rozdělení s n stupni volnosti a χ 2 - rozdělení s n stupni volnosti (včetně tvarů jejich grafů), alternativním rozdělení s parametrem p, Poissonově rozdělení s parametrem λ. Autorka děkuje RNDr. Marii Budíkové, Dr. z PřF MU v Brně a svému kolegovi RNDr. Oldřichu Dlouhému za přečtení textu a cenné připomínky.

5 Označení R množina reálných čísel A 1 A 2 A n kartézský součin množin A 1, A 2,..., A n A n } A A {{ A } n krát exp(x) e x E(X) střední hodnota náhodné veličiny X D(X) rozptyl náhodné veličiny X x(α) 100 α procentní kvantil náhodné veličiny X N(µ, σ 2 ) normální rozdělení s parametry µ, σ 2 Φ distribuční funkce N(0, 1) ϕ hustota N(0, 1) u(α) 100 α procentní kvantil N(0, 1) χ 2 (n) χ 2 - rozdělení [Pearsonovo rozdělení] s n stupni volnosti χ 2 (n; α) 100 α procentní kvantil χ 2 (n) t(n) t - rozdělení [Studentovo rozdělení] s n stupni volnosti t(n; α) 100 α procentní kvantil t(n) Kartézský součin množin Jsou-li A 1, A 2,..., A n libovolné neprázdné množiny, potom A 1 A 2 A n je množina, jejíž prvky jsou všechny možné n-tice vytvořené tak, že první člen n-tice je prvek množiny A 1, druhý člen n-tice je prvek množiny A 2,..., n-tý člen n-tice je prvek množiny A n. Zapsáno formálně A 1 A 2 A n = { (a 1, a 2,..., a n ); a 1 A 1, a 2 A 2,... a n A n }. Např. 0, 1 0, 2 = { (x, y); x 0, 1, y 0, 2 }. Disjunktní množiny Množiny A 1, A 2,..., A n se nazývají disjunktní, jestliže každé dvě různé množiny nemají společné prvky, tj. jestliže Např. množiny A i A j = pro každé i j; i, j = 1, 2,... n. jsou disjunktní a množiny nejsou disjunktní. (, 1, (1, 2, (2, 3 (, 1, 1, 2, (2, 3

6 Kapitola 1 Náhodný výběr a statistiky Cíle Po přečtení a nastudování této kapitoly budete: znát, co je náhodný výběr z rozdělení X a jeho realizace; umět realizaci náhodného výběru z X roztřídit do tříd tak, aby byla přehlednější. Dále pak stanovit četnosti těchto tříd a znázornit je graficky; vědět, co to je statistika a naučíte se počítat nejjednodušší výběrové charakteristiky - výběrový průměr, rozptyl a směrodatnou odchylku. Doba potřebná ke studiu K nastudování a pochopení této kapitoly byste měli potřebovat asi 3 hodiny. Klíčová slova Náhodný výběr a jeho realizace, rozsah výběru, rozdělení četností, úsečkový diagram, histogram, statistika, výběrový průměr, výběrový rozptyl, výběrová směrodatná odchylka. 1.1 Náhodný výběr V praxi nebývá rozdělení náhodné veličiny jako je např. hmotnost dávky, pevnost materiálu, životnost výrobku, počet vozidel čekajících na zelenou apod. známé. Abychom o něm získali další informace, budeme opakovat pokus (měření, pozorování), jehož neznámým výsledkem je sledovaná náhodná veličina. Tak např. pro zjištění hmotnosti dávky z konkrétního dávkovače, který pracuje za ustálených provozních podmínek, náhodně vybereme n dávek (tj. tak, aby každá dávka měla stejnou pravděpodobnost, že bude zahrnuta do výběru) a zvážíme je. Při zjišťování krychelné pevnosti betonu vyrobeného na určité betonárce za daných podmínek budeme měřit pevnost na n zkušebních kostkách z téhož betonu. Budeme tedy obecně n-krát opakovat pokus, ve kterém pozorujeme sledovanou náhodnou veličinu. Uvědomme si, že před tím, než pokus provedeme

7 1.1 Náhodný výběr 7 a zapíšeme výsledek, je výsledek pokusu náhodná veličina s určitým typem rozdělení. Když pokus zrealizujeme a zapíšeme výsledek, dostaneme konkrétní číselnou hodnotu (tj. realizaci) této náhodné veličiny. Pokusme se nyní naše úvahy o opakování pokusu upřesnit. Uvažujme náhodný pokus, jehož neznámým výsledkem je náhodná veličina X s určitým typem rozdělení pravděpodobnosti a uvažujme n (n 1) nezávislých opakování tohoto pokusu. Označme pro i = 1, 2..., n jako X i neznámý výsledek i-tého opakování pokusu. Dostaneme náhodný vektor X = (X 1, X 2,..., X n ), jehož složky X 1, X 2,..., X n jsou nezávislé náhodné veličiny. Jestliže během celého experimentu, tj. během n opakování pokusu, nedojde ke změně podmínek, které pokus definují, budou mít složky X 1, X 2,..., X n náhodného vektoru X stejné rozdělení jako veličina X. Náhodný vektor s těmito dvěmi vlastnostmi nazýváme náhodný výběr z rozdělení X o rozsahu n, někdy pak stručněji náhodný výběr z daného rozdělení nebo náhodný výběr z X. Provedeme-li celý experiment a zapíšeme výsledek, dostaneme n-tici reálných čísel (x 1, x 2,..., x n ) - tzv. realizaci náhodného výběru. Tedy x i je známý výsledek i-tého opakování pokusu (i = 1,..., n). Množinu všech možných realizací náhodného výběru, tj. množinu všech možných hodnot náhodného vektoru X, nazýváme výběrový prostor a značíme V. Je-li Ω obor hodnot náhodné veličiny X a je-li (X 1, X 2,..., X n ) náhodný výběr z X, potom výběrový prostor je množina Ω n. Příklad 1.1: Označme X neznámý výsledek měření vzálenosti d konkrétním měřicím přístrojem, který nevykazuje systematickou chybu (tj. náhodné chyby měření kolísají okolo nuly). Změříme-li n-krát tuto vzdálenost za stejných podmínek (tj. nestane-li se nic, co by ovlivnilo kvalitu měřicího přístroje) a zapíšeme výsledek, dostaneme realizaci (x 1, x 2,..., x n ) náhodného výběru (X 1, X 2,..., X n ) z X. Příklad 1.2: Označme V počet vozidel, které projedou konkrétním místem dálnice mezi sedmou a osmou hodinou ranní pracovního dne zimního období. Jestliže během n dní, které vyhovují výše uvedeným podmínkám, budeme na daném místě dálnice pozorovat počet projíždějících vozidel a zapisovat výsledky, dostaneme realizaci náhodného výběru z V o rozsahu n. Všimněte si všech vyjmenovaných podmínek! Spojit např. pozorování v zimním a letním období za jinak stejných výše uvedených podmínek, by znamenalo porušení stálosti podmínek. Pozorování by byla sice nezávislá, ale neměla by stejné rozdělení, protože charakter provozu je v zimě jiný než v létě. Jednalo by se o dva náhodné výběry z téhož typu rozdělení ale s různými hodnotymi parametrů. Z realizace náhodného výběru můžeme vypočítat průměrnou hodnotu, zjistit minimální a maximální hodnotu a různým jiným způsobem realizaci popsat. Takto pracuje popisná statistika. Budeme-li chtít např. v příkladě 1.1 odhadnout skutečnou vzdálenost d, měl by asi každý tendenci za odhad vzít právě průměrnou hodnotu měření, tj. číslo x = 1 n n i=1 x i. Provedeme-li ale celý

8 8 Náhodný výběr a statistiky experiment znovu, tj. znovu n-krát změříme vzdálenost d, dostaneme jinou realizaci náhodného výběru a tedy i jinou hodnotu průměru. Vidíme tedy, že i sám průměr je náhodná veličina, jejíž realizace kolísají od jednoho výběru k druhému. Před provedením experimentu pak můžeme odhad d psát ve tvaru X = 1 n n i=1 X i, tj. jako funkci náhodného výběru - takovou funkci budeme nazývat statistikou. Při našem odhadování se můžeme dopustit chyby, jejíž velikost lze vyjádřit jako vzdálenost průměru od měřené vzdálenosti d. Chceme-li např. zjistit, zda je námi zvolený odhad nejlepším možným odhadem (viz kapitola 2), nebo ohodnotit přesnost a spolehlivost odhadu (viz kapitola 3), tj. stanovit hranice, které chyba odhadu nepřekročí s vysokou pravděpodobností, musíme využít teorii pravděpodobnosti. K tomu potřebujeme obecně znát typ rozdělení, z něchož výběr pochází. V našem případě je známo, že se jedná o náhodný výběr z rozdělení N(µ, σ 2 ), kde µ = d je skutečná vzdálenost a rozptyl σ 2 charakterizuje přesnost měřícího přístroje. Chtěli jsme tedy ve skutečnosti odhadnout parametr µ, tj. střední hodnotu normálního rozdělení. Věnujme se ještě rozdělení náhodného výběru. Vzhledem k tomu, že jsou složky X 1, X 2,..., X n náhodného výběru (X 1, X 2,..., X n ) z rozdělení X nezávislé a mají stejné rozdělení jako veličina X, dostáváme: Tvrzení 1.1: Rozdělení náhodného výběru Má-li náhodná veličina X distribuční funkci G, potom má náhodný výběr (X 1, X 2,..., X n ) z X distribuční funkci H(x 1, x 2,..., x n ) = G(x 1 ) G(x 2 )... G(x n ). Má-li náhodná veličina X rozdělovací funkci g, potom má náhodný výběr (X 1, X 2,..., X n ) z X rozdělovací funkci h(x 1, x 2,..., x n ) = g(x 1 ) g(x 2 )... g(x n ). Odtud plyne: Známe-li typ rozdělení náhodné veličiny X, pak známe i typ rozdělení náhodného výběru z X. Jestliže rozdělení náhodné veličiny X závisí na nějakých neznámých konstantách (parametrech), pak na těchto parametrech závisí i rozdělení náhodného výběru z X. Příklad 1.3: Určete rozdělovací funkci náhodného výběru (X 1, X 2,..., X n ) z normálního rozdělení. Řešení : Hustota f náhodné veličiny X N(µ, σ 2 ) je pro x R f = f(x; µ, σ 2 ) = 1 [ exp 1 ] 2πσ 2σ (x 2 µ)2, kde (µ, σ 2 ) (, ) (0, ).

9 1.1 Náhodný výběr 9 Obor hodnot Ω náhodné veličiny X je R. Je-li (X 1, X 2,..., X n ) náhodný výběr z rozdělení X, potom je výběrový prostor množina R n. Hustota s náhodného výběru (X 1, X 2,..., X n ) z X je pro (x 1, x 2,..., x n ) R n s = s(x 1, x 2,..., x n ; µ, σ 2 ) = f(x 1 ; µ, σ 2 ) f(x 2 ; µ, σ 2 )... f(x n ; µ, σ 2 ) 1 [ = ( 2πσ) exp 1 [ (x1 µ) 2 + (x n 2σ 2 2 µ) (x n µ) 2]], kde (µ, σ 2 ) (, ) (0, ) Rozdělení četností a jejich znázornění Je-li rozsah n realizace (x 1, x 2,..., x n ) náhodného výběru z X velký, potom pro větší přehlednost a další analýzu hodnoty x 1, x 2,..., x n roztřídíme do k disjunktních tříd Ω j, j = 1, 2,..., k, a to zpravidla následovně: 1. Je-li mezi zjištěnými hodnotami jen malý počet navzájem různých hodnot, volíme každou hodnotu za třídu Ω j. Mluvíme o tzv. prostém třídění. 2. Je-li mezi zjištěnými hodnotami značně velký počet různých hodnot, volíme za třídy Ω j intervaly. Mluvíme o tzv. skupinovém třídění. Toto třídění je subjektivní, i když existují určitá objektivní pravidla. Např. se doporučuje, aby počet k tříd byl 5 20 podle rozsahu výběru n nebo k. = n nebo k. = log 10 n. Při skupinovém třídění se pak často doporučuje, aby: 1. délka intervalů byla stejná; 2. hranice a středy intervalů byly pokud možno zaokrouhlená čísla. Postup při třídění si ukážeme na příkladech, ale před tím zavedeme ještě další pojmy. Označme n j f j = n j n tzv. absolutní četnost j-té třídy Ω j, tj. počet výsledků, které padly do j-té třídy Ω j, pro j = 1, 2..., k; tzv. relativní četnost j-té třídy Ω j, tj. podíl absolutní četnosti n j a rozsahu výběru n, pro j = 1, 2..., k. Relativní četnost f j aproximuje pravděpodobnost, že náhodná veličina X nabude hodnoty z třídy Ω j pro j = 1, 2..., k. Pro četnosti zřejmě platí n 1 + n n k = n, f 1 + f f k = 1. Výsledky třídění shrnujeme do tzv. tabulky rozdělení četností, ve které jsou uvedeny třídy s příslušnými absolutními, resp. relativními četnostmi a v případě skupinového třídění středy intervalů.

10 10 Náhodný výběr a statistiky Příklad 1.4: Při kontrole vytíženosti vjezdu do určité křižovatky byly zjištěny následující počty vozidel, čekajících ve frontě u semaforu: 5, 1, 2, 5, 2, 5, 9, 5, 2, 5, 2, 3, 4, 7, 4, 5, 1, 3, 8, 5, 2, 6, 5, 8, 6, 7, 4, 1, 1, 4, 2, 3, 3, 3, 5, 6, 2, 4, 1, 3, 4, 5, 6, 4, 9, 6, 5, 2, 1, 6, 6, 2, 6, 2, 7, 6, 7, 6, 3, 7, 3, 6, 1, 2, 4, 4, 3, 3, 5, 3, 5, 4, 6, 3, 3, 4, 3, 5, 3, 1, 1, 1, 4. Setavte tabulku rozdělení četností počtu čekajících vozidel. Řešení: Označme X počet vozidel čekajících na zelenou. Máme k dispozici realizaci (x 1, x 2,..., x n ) náhodného výběru z diskrétního rozdělení o rozsahu n = 83. Mezi zjištěnými hodnotami se vyskytují pouze celá čísla 1 až 9. Zvolme tato čísla za třídy Ω j (j = 1, 2,..., 9). Pro určení absolutních četností tříd Ω j musíme zjistit, kolikrát se v realizaci vyskytlo číslo j. Bez využití výpočetní techniky postupujeme pomocí čárkovací metody tak, že postupně čteme hodnoty z realizace a každou z nich zařadíme do příslušné třídy napsáním čárky. Přitom píšeme vždy čtyři čárky svisle, každou pátou čárkou čtveřici přeškrtneme (u nás podtrhneme). Výsledky jsou uvedeny v tabulce 1.1. Tento postup je pracný a asi by jej dnes již nikdo nepoužíval a pro třídění by použil např. EXCEL nebo nějaký statistický software. Seřadíme-li např. v Excelu hodnoty realizace vzestupně, není již problém zjistit absolutní četnosti jednotlivých tříd. Navíc můžeme využít nabídku Nástroje Analýza dat Histogram. Pomocí této nabídky získáme tabulku rozdělení absolutních četností a tzv. histogram absolutních četností, o kterém budeme hovořit později. Musíme ale zadat horní hranice tříd (u nás čísla 1 až 9). Tabulka 1.1: Rozdělení četností počtu vozidel čekajících na zelenou Počet Absolutní Relativní vozidel četnost četnost j n j f j Součet V případě skupinového třídění, tj. především v případě realizace náhodného výběru ze spojitého rozdělení, kdy za třídy Ω j volíme intervaly, můžeme postupovat např. následovně.

11 1.1 Náhodný výběr 11 Z realizace (x 1, x 2,..., x n ) náhodného výběru z X o rozsahu n zjistíme nejmenší hodnotu x min a největší hodnotu x max. Zřejmě x i x min, x max pro každé i = 1, 2,..., n. Interval x min, x max nazýváme variační obor realizace. Vhodně zvolíme interval a, b x min, x max. Interval a, b rozdělíme stejně vzdálenými body t 0, t 1,..., t k takovými, že a = t 0 < t 1 < < t k = b na k podintervalů Ω j = (t j 1, t j stejné délky d = t j t j 1 (j = 1, 2,..., k). Číslo t j se nazývá horní hranice třídy Ω j, číslo t j 1 se nazývá dolní hranice třídy Ω j. Střed třídy Ω j značíme x j. Zřejmě x j = (t j 1 + t j )/2 pro j = 1, 2,..., k. Příklad 1.5: o Při stavbě betonové konstrukce bylo odebráno 40 vzorků betonové směsi. Po 28 dnech vykázaly kostky tuto krychelnou pevnost v MPa: 23.5, 28.0, 25.1, 30.8, 27.1, 29.3, 32.5, 33.8, 30.4, 26.2, 30.8, 29.2, 30.9, 28.6, 27.5, 28.0, 31.2, 28.2, 30.7, 28.8, 32.7, 29.0, 31.9, 25.4, 32.6, 27.4, 33.1, 29.6, 29.7, 30.3, 26.8, 30.4, 25.6, 34.0, 34.8, 27.2, 31.5, 32.3, 29.7, Sestavte tabulku rozdělení četností pevnosti betonu. Řešení: Náhodnou veličinou X je zde pevnost betonu. Máme k dispozici realizaci (x 1, x 2,..., x n ) náhodného výběru z X o rozsahu n = 40. Vzhledem k tomu, že se jedná o náhodný výběr ze spojitého rozdělení, roztřídíme realizaci náhodného výběru do k intervalů Ω j = (t j 1, t j (j = 1,..., k) stejné délky d. Počet k intervalů zvolíme k =. n = 40 =. 6. Nejprve zjistíme nejmenší hodnotu x min a největší hodnotu x max. Dostaneme x min = 23.5 a x max = Zřejmě 23, , Rozdělme interval 23, 35 do šesti tříd. Potom pro délku d intervalů dostaneme d = = 2. Výsledek 6 třídění pak ukazuje tabulka 1.2. Tabulka 1.2: Rozdělení četností pevnosti betonu Pevnost Absolutní Relativní Střed Třída betonu četnost četnost třídy j (t j 1, t j n j f j x j Ω Ω Ω Ω Ω Ω Součet Názornější než tabulka rozdělení četností je grafické zobrazení četností, které samozřejmě z této tabulky vychází. Zmíníme se zde pouze o úsečkovém diagramu rozdělení četností a histogramu rozdělení četností.

12 12 Náhodný výběr a statistiky Připomeňme, že jsme v případě skupinového třídění označili střed j-té třídy Ω j jako x j. V případě prostého třídění je x j přímo roven j-té nejmenší zjištěné hodnotě. Úsečkový diagram rozdělení absolutních, popř. relativních četností dostaneme tak, že na osu x zobrazíme středy jednotlivých tříd x j a v každém z nich sestrojíme úsečku v kladném směru osy y o délce rovné příslušné absolutní, resp. relativní četnosti, tj. n j, resp. f j. V případě skupinového třídění používáme častěji histogram rozdělení absolutních, resp. relativních četností. Dostaneme jej tak, že na osu x vynášíme opět středy jednotlivých tříd x j a nad každou úsečkou zobrazující třídu Ω j sestrojíme obdélník o výšce rovné příslušné absolutní, resp. realitvní četnosti, tj. n j, resp. f j. Horní obrys obdélníků pak nazýváme histogram relativních, resp. absolutních četností. Příklad 1.6: Sestrojte úsečkový diagram rozdělení absolutních četností v příkladu 1.4 a histogram rozdělení relativních četností v příkladu 1.5. Řešení: Výsledné grafy jsou na obrázku 1.1 a na obrázku 1.2. Obrázek 1.1: Úsečkový diagram rozdělení absolutních četností počtu vozidel čekajících na zelenou Obrázek 1.2: Histogram rozdělení relativních četností pevnosti betonu

13 1.2 Statistiky 13 Histogram (resp. úsečkový diagram) relativních a absolutních četností mají stejný tvar a aproximují tvar rozdělovací funkce náhodné veličiny X. 1.2 Statistiky V předchozích příkladech jsme naznačili, že kromě náhodného výběru budou hrát v teorii odhadu důležitou roli tzv. statistiky, tj. funkce náhodného výběru. Pomocí nich se snažíme z náhodného výběru získat nějaké další informace. Upřesněme nyní tento pojem z matematického hlediska. Definice 1.1: Statistika Je-li (X 1, X 2,..., X n ) náhodný výběr z rozdělení X, V výběrový prostor a T (x 1, x 2,..., x n ) reálná funkce n reálných proměnných definovaná na výběrovém prostoru V, potom se náhodná veličina T = T (X 1, X 2,..., X n ) nazývá statistika. Dosadíme-li do statistiky T realizaci (x 1, x 2,..., x n ) náhodného výběru z X, dostaneme číslo tzv. realizaci statistiky. t = T (x 1, x 2,..., x n ), S příklady realizací statistik jste se již setkali při třídění. Najděte alespoň čtyři! K nejčastěji používaným statistikám patří tzv. výběrové charakteristiky, které - jak poznáme později - používáme pro odhad číselných charakteristik náhodných veličin. Nejpoužívanějšími výběrovými charakteristikami jsou X = 1 n n X i tzv. výběrový průměr; (1.1) i=1 S 2 = 1 n 1 n (X i X) 2 tzv. výběrový rozptyl. (1.2) i=1 Statistika S = S 2 se nazývá výběrová směrodatná odchylka. Výhodou výběrové směrodatné odchylky je, že má stejné jednotky jako měřená veličina. Je-li (x 1, x 2,..., x n ) realizace náhodného výběru z X, pak ze vztahů (1.1) a (1.2) lze usuzovat, že x je mírou polohy (těžištěm) hodnot x 1, x 2,..., x n, s 2 a s jsou mírami rozptýlenosti těchto hodnot okolo x. Čím jsou realizace s 2 a tedy i s větší, tím jsou hodnoty x 1, x 2,..., x n rozptýlenější. Uvědomme si, že střední hodnota E(X), resp. rozptyl D(X) a směrodatná odchylka D(X) náhodné veličiny X, které patří k charakteristikám polohy,

14 14 Náhodný výběr a statistiky resp. rozptýlenosti náhodné veličiny X, jsou konstantami. Na rozdíl od nich jsou výběrové charakteristiky X, S 2 a S náhodné veličiny. Pro konkrétní realizaci (x 1, x 2,..., x n ) náhodného výběru z X dostaneme konkrétní realizace (hodnoty) x a s 2 statistik X a S 2. Pro jinou realizaci náhodného výběru z téhož rozdělení dostaneme jiné hodnoty statistik X a S 2. Výpočet realizací x a s 2 statistik X a S 2 Při výpočtu realizací x a s 2 statistik X a S 2 můžeme postupovat následovně: 1. Dosadíme realizaci (x 1, x 2,..., x n ) náhodného výběru z X do vztahů (1.1) a (1.2). 2. Pro výpočet realizací x a s 2 lze použít jakýkoliv statistický software nebo EXCEL bez dosazování do vzorců. Na nižší úrovni pak kalkulačky, které umožňují statistické výpočty. Realizaci x spočítáme pomocí programu na výpočet x. Na některých kalkulačkách se vyskytuje dvojice s a σ, na některých σ n 1 a σ n. Platí pro ně následující vztahy s = σ n 1 = 1 n 1 n (x i x) 2, i=1 σ = σ n = 1 n n (x i x) 2 (= + m). i=1 O statistice M = 1 n n i=1 (X i X) 2 budeme mluvit v následující kapitole. 3. Při výpočtu realizací výběrového průměru a výběrového rozptylu v případě realizace (x 1, x 2,..., x n ) náhodného výběru z X roztříděného do k tříd Ω j (j = 1, 2,..., k) postupujeme tak, že hodnoty, které padly do j-té třídy nahradíme středem x j této třídy. Potom x = 1 n n i=1 x i. = 1 n k n j x j, (1.3) j=1 s 2 = 1 n 1 n (x i x) 2. 1 = n 1 i=1 k n j (x j x) 2, (1.4) j=1 Příklad 1.7: Při měření veličiny konstantní délky byly zjištěny následující chyby měření v mm: 1, 2, 1, 0, 1, 2, 1, 1, 1, 1. Určete realizace x a s 2. Řešení: Náhodnou veličinou X je zde náhodná chyba měření. K dispozici máme realizaci náhodného výběru z X o rozsahu n = 10. Podle vztahů (1.1)

15 1.3 Kontrolní otázky 15 a (1.2) dostaneme x = 1 10 s 2 = i=1 10 i=1 x i = 1 10 (x 1 + x x 10 ) = 0.10 [mm], (x i + 0.1) 2 = 1 9 [(x ) (x ) 2 ]. = 1.66 [mm 2 ]. Přímo (tj. bez dosazování) s využitím kalkulačky x = 0.10 [mm],. s = σ n 1 = 1.29 [mm] s 2. = 1.66 [mm 2 ]. Příklad 1.8: Vypočtěte realizaci výběrového průměru a výběrové směrodatné odchylky v příkladě 1.5. Řešení: V příkladě 1.5 jsmě měli realizaci (x 1, x 2,..., x n ) o rozsahu n = 40. Tuto realizaci jsme roztřídíli do k = 6 tříd. Podle vztahů (1.3) a (1.4) dostaneme x. = j=1 n j x j = 1 ( ) = [MP a], 40 s = n j (x j 29.65) 2 = [1( ) ( ) 2 )] j=1. = [MP a 2 ] σ = s = [MP a]. Stejně jako v předchozím příkladě můžeme využít statistické výpočty na kalkulačce. Hodnotu x j uložíme n j -krát na většině kalkulaček tak, že x j n j uložíme pomocí nabídky DATA. 1.3 Kontrolní otázky 1. Jaké vlastnosti musí mít složky náhodného výběru z rozdělení X? 2. Uveďte příklad náhodného výběru ze spojitého a diskrétního rozdělení. 3. Jak postupujeme při třídění realizace náhodného výběru z X? 4. Co jsou relativní a absolutní četnosti a jaké vlastnosti pro ně platí? 5. Co to je statistika? 6. Jak je definován a co udává výběrový průměr, rozptyl a směrodatná odchylka?

16 16 Náhodný výběr a statistiky 1.4 Cvičení 1. Mezi deseti výrobky je jeden vadný. Z těchto výrobků náhodně vybereme dva. Označme X i počet vadných výrobků v i-tém tahu (i = 1, 2). a) Výběr provádíme tak, že výrobek po vytažení a zjištění, zda je vadný, vrátíme zpět, takže může být opět vybrán. b) Výběr provádíme tak, že výrobky nevracíme zpět. Jaké rozdělení budou mít veličiny X 1 a X 2? Je (X 1, X 2 ) náhodný výběr? 2. (Pro zájemce.) Uvažujme velkou dodávku N výrobků, z nichž je M vadných. Předpokládejme, že z těchto N výrobků budeme náhodně vybírat n výrobků, kde n je relativně malé číslo vzhledem k N. Označme opět X i počet vadných výrobků v i-tém tahu (i = 1,..., n). Dejme tomu, že N = 500 a n = 10. Lze v tomto případě při výběru bez vracení považovat náhodný vektor (X 1,..., X 10 ) za náhodný výběr z rozdělení A(M/N)? 3. Průměr z pěti měření je 10. Jak se změní, když a) jsme se spletli a místo výsledku 3 jsme zapsali výsledek 2; b) získáme jako další výsledek číslo Předpokládejme, že (x 1,..., x n ) je realizace náhodného výběru z X. a) Proč nemůže být h = 1 n n 1 i=1 (x i x) mírou variability hodnot x 1,..., x n? n b) Ukažte, že platí (x i x) 2 = n xi 2 nx 2 i=1 ( n a tedy s 2 = 1 n 1 i=1 x 2 i nx 2 ). 5. Předpokládejme, že (X 1,..., X n ) je náhodný výběr z X a náhodná veličina Y vznikla lineární transformací náhodné veličiny X, tj. Y = ax + b, kde a, b R, a 0. Ukažte, že a) (Y 1,..., Y n ) = (ax 1 + b,..., ax n + b) je náhodný výběr z Y ; i=1 b) Y = ax + b, kde Y, resp. X je výběrový průměr příslušný veličině Y, resp. veličině X; c) SY 2 = a2 SX 2, kde S2 Y, resp. S2 X je výběrový rozptyl příslušný veličině Y, resp. veličině X. 6. Bylo odzkoušeno 10 náhodně vybraných ocelových tyčí k určení meze průtažnosti s těmito výsledky v MPa: 277, 280, 291, 263, 277, 286, 281, 305, 290, 291. Vypočtěte realizaci výběrového průměru a výběrového rozptylu meze průtažnosti oceli.

17 1.5 Klíč a výsledky cvičení Určete realizaci výběrového průměru, rozptylu a směrodatné odchylky množství ročních srážek v mm v Brně v období : 718.5, 492.3, 431.5, 540.5, 514.7, 548.0, 385.0, 532.0, 531.0, 578.3, 551.9, 613.6, 476.0, 661.3, 518.0, 508.5, 488.7, 494.9, 544.6, Při zkouškách vlhkosti stavebního materiálu Hobrex byla změřena procenta vlhkosti u 100 vzorků. Výsledky jsou uvedeny v tabulce: Třída Vlhkost v % n j Třída Vlhkost v % n i Určete realizaci výběrového průměru a směrodatné odchylky vlhkosti. Nakreslete histogram rozdělení relativních četností. 9. Zvážením 50 součástek vyrobených za ustálených výrobních podmínek jsme dostali tyto výsledky (při měřicí jednotce gram) 83, 85, 81, 82, 84, 82, 79, 84, 80, 81, 82, 82, 80, 82, 80, 82, 83, 84, 79, 79, 83, 82, 83, 85, 82, 82, 81, 80, 82, 82, 83, 80, 82, 85, 81, 83, 81, 81, 83, 82, 81, 85, 83, 79, 81, 85, 81, 84, 81, 82. Sestavte tabulku rozdělení četností. Nakreslete úsečkový diagram a histogram relativních a absolutních četností. Vypočítejte realizaci výběrového průměru a výběrové směrodatné odchylky hmotnosti součástek. 1.5 Klíč a výsledky cvičení Cvičení: 1. V případě a) i b) budou mít obě náhodné veličiny alternativní rozdělení s parametrem 1/10. V případě a) jsou veličiny nezávislé a jedná se o náhodný výběr z rozdělení A(1/10). V případě b) jsou závislé a nejedná se o náhodný výběr. 2. Ano - Veličiny X 1,..., X n mají rozdělení A(M/N). Navíc vybíráme-li z velkého počtu N relativně malý počet n, změní se podmínky zcela nepatrně a veličiny X 1, X 2,..., X n můžeme považovat za nezávislé. 3. a) x = 51/5; b) x = 51/6. 4. a) Protože h = x = MPa, s 2. = MPa x = mm, s 2. = mm 2, s. = mm. 8. x = 22.12%, s. = 0.86%. 9. Volíme-li 9 tříd o délce d = 1 se středy 79 až 85, dostaneme x = g, s. = 1.66 g.

18 Kapitola 2 Bodový odhad Cíle Po přečtení a nastudování této kapitoly budete: vědět, co to je bodový odhad parametrické funkce; znát některé důležité vlastnosti bodových odhadů a umět je posoudit. Doba potřebná ke studiu Pro zvládnutí této kapitoly budete potřebovat asi 3 hodiny studia. Klíčová slova Bodový odhad, realizace bodového odhadu, nestranný odhad, nejlepší nestranný odhad, střední čtvercová chyba, konzistentní odhad. V této a následující kapitole budeme předpokládat, že známe typ rozdělení (tzv. statistický model), ze kterého náhodný výběr pochází. Pokud neznáme typ rozdělení, z něhož výběr pochází (v minulosti nebyly prováděny experimenty daného druhu a rozdělení nelze odvodit ani na základě teoretické úvahy), vybíráme vhodný typ rozdělení např. na základě posouzení tvaru histogramu rozdělení četností a další analýzy realizace náhodného výběru (viz poslední kapitola následujícího modulu). Je-li např. jako vhodný model rozdělení zvolen model normálního rozdělení, známe typ rozdělení obecně až na dva parametry µ a σ 2. Je-li jako vhodný model zvolen model Poissonova rozdělení, známe typ rozdělení až na jediný parametr λ. Budeme tedy předpokládat, že známe typ rozdělení sledované náhodné veličiny X až na m parametrů (neznámých konstant), m 1. Tyto parametry budeme značit ϑ 1, ϑ 2,..., ϑ m. Označme pro ϑ = (ϑ 1, ϑ 2,..., ϑ m ) jako Θ množinu všech přípustných hodnot vektorového parametru ϑ, kterou nazýváme parametrický prostor. Ke stanovení rozdělení pak stačí odhadnout parametry tohoto rozdělení. Někdy ale nemáme tak velké požadavky a zajímá nás pouze odhad určité funkce parametrů rozdělení - např. střední hodnoty. Označme τ(ϑ) = τ(ϑ 1, ϑ 2,..., ϑ m ) určitou reálnou funkci vektorového parametru ϑ definovanou na parametrickém prostoru Θ. Funkci τ(ϑ) nazýváme parametrická funkce.

19 19 Protože parametr ϑ i, tj. i-tá složka vektorového parametru ϑ, je speciálním případem funkce τ(ϑ), budeme se zabývat odhadem funkce τ(ϑ). Příklad 2.1: Při měření vzdálenosti konkrétním přístrojem, který nevykazuje systematickou chybu (tj. náhodné chyby kolísají okolo nuly), je výsledek pokusu X normální náhodná veličina s neznámou střední hodnotou µ - skutečnou vzdáleností a (většinou) známým rozptylem σ 2 (vyjadřujícím přesnost přístroje). Potom pro hustotu f náhodné veličiny X platí f = f(x; µ) = 1 2πσ exp [ 1 2σ 2 (x µ)2 ] pro x R, kde µ (0, ). Známe tedy typ rozdělení až na jeden parametr µ, tj ϑ = ϑ 1 = ϑ = µ, Θ = (0, ). Při měření neodzkoušeným přístrojem bude neznámý i rozptyl, potom f = f(x; µ, σ 2 ) = 1 2πσ exp [ 1 2σ 2 (x µ)2 ] pro x R, kde (µ, σ 2 ) (0, ) (0, ). Známe typ rozdělení až na dva parametry µ a σ 2, tedy ϑ = (ϑ 1, ϑ 2 ) = (µ, σ 2 ) a Θ = (0, ) (0, ). Příklady parametrických funkcí τ(ϑ) = τ(µ, σ 2 ) jsou v případě N(µ, σ 2 ) při obou neznámých parametrech funkce: τ(µ, σ 2 ) = µ střední hodnota rozdělení, τ(µ, σ 2 ) = σ 2 rozptyl rozdělení, τ(µ, σ 2 ) = σ směrodatná odchylka rozdělení, τ(µ, σ 2 ) = µ + u(α)σ 100α procentní kvantil rozdělení, τ(µ, σ 2 ) = Φ((x µ)/σ) hodnota distribuční funkce v bodě x. Vraťme se zpět k našemu odhadování. Na základě realizace náhodného výběru (X 1, X 2,..., X n ) z X budeme chtít odhadnout skutečnou hodnotu parametrické funkce τ(ϑ) pomocí jediného reálného čísla. Je tedy zřejmé, že tímto číslem bude funkce realizace náhodného výběru z X, tj. realizace statistiky. Definice 2.1: Bodový oddhad Statistiku, kterou používáme pro odhad parametrické funkce τ(ϑ), budeme nazývat (bodovým) odhadem funkce τ(ϑ) a její realizaci realizací (bodového) odhadu τ(ϑ). Prakticky se snažíme za odhad τ(ϑ) volit takový odhad, tj. takovou statistiku, jejíž hodnoty v nějaké smyslu co nejlépe aproximují skutečnou hodnotu τ(ϑ). Chceme-li tedy, aby byl odhad kvalitní, měl by mít určité vlastnosti. My se zde budeme zabývat pouze tzv. nestrannými, nejlepšími nestrannými a konzistentními odhady. Ideální by bylo, kdyby odhadová statistika měla všechny výše uvedené vlastnosti. Toho ale nelze běžně dosáhnout. Pro hledání bodových odhadů existují různé metody, které zajišťují dobré vlastnosti odhadů (např. metoda maximální věrohodnosti), těmi se zde ale zabývat nebudeme.

20 20 Bodový odhad 2.1 Vlastnosti odhadů Nestranný odhad Uvědomme si, že odhad T parametrické funkce τ(ϑ) je náhodná veličina. V technické praxi nás samozřejmě zajímá číselná hodnota odhadu, tj. realizace odhadu. Z každé realizace náhodného výběru můžeme obecně dostat jinou realizaci odhadu, tj. jinou číselnou hodnotu. Nejčastěji se vyskytuje požadavek, aby realizace t odhadu T parametrické funkce τ(ϑ) kolísaly okolo skutečné hodnoty této funkce, tj. aby byl odhad T funkce τ(ϑ) nestranný (nevychýlený). Uvědomíme-li si nyní, že realizace náhodné veličiny T kolísají okolo její střední hodnoty (pokud existuje), budeme požadovat, aby střední hodnota odhadu T byla rovna skutečné hodnotě parametrické funkce τ(ϑ). Protože neznáme skutečnou hodnotu vektorového parametru ϑ Θ, budeme chtít, aby požadovaná rovnost platila, ať je skutečná hodnota ϑ kdekoliv v Θ, tj. pro každé ϑ Θ. Definice 2.2: Nestranný odhad Řekneme, že statistika T je nestranným nebo nevychýleným odhadem parametrické funkce τ(ϑ), když pro každé ϑ Θ platí E(T ) = τ(ϑ). Neplatí-li tato rovnost, pak odhad nazýváme vychýleným a rozdíl B(ϑ) = E(T ) τ(ϑ) je vychýlení odhadu T. Příklad 2.2: Předpokládejme, že je (X 1, X 2,..., X n ) náhodný výběr z rozdělení s konečnou střední hodnotou µ a konečným rozptylem σ 2. Zjistěte, zda je výběrový průměr X nestranným odhadem µ a určete jeho rozptyl. Řešení: V tomto případě je τ(ϑ) = µ. Výběrový průměr X je nevychýleným odhadem střední hodnoty µ, když pro každé ϑ Θ platí E(X) = µ. Protože náhodné veličiny X 1, X 2,..., X n mají stejné rozdělení jako náhodná veličina X, platí E(X i ) = µ, D(X i ) = σ 2 pro i = 1, 2,..., n. Potom ( 1 E(X) = E n n ) X i = 1 n i=1 n E(X i ) = 1 n i=1 n µ = µ. (2.1) i=1 Výběrový průměr X je nestranným odhadem střední hodnoty µ rozdělení, z něhož výběr pochází (ať známe nebo neznáme σ 2 ).

21 2.1 Vlastnosti odhadů 21 je Vzhledem k tomu, že jsou veličiny X 1, X 2,..., X n stochasticky nezávislé, ( 1 D(X) = D n n ) X i = 1 n D(X n 2 i ) = 1 n 2 i=1 i=1 n i=1 σ 2 = σ2 n. (2.2) Rozptyl výběrového průměru klesá s rostoucím rozsahem n výběru. Zabývejme se nyní další důležitou číselnou charakteristikou rozdělení X, z něhož výběr pochází. Podobně (jenom složitěji) jako v příkladu 2.2 lze ukázat, že pro výběrový rozptyl S 2 platí E(S 2 ) = σ 2. Tedy statistika S 2 je nestranným odhadem rozptylu σ 2. Výběrová směrodatná odchylka S ale není nestranným odhadem směrodatné odchylky σ. Kdyby byla, muselo by platit D(S 2 ) = E(S 2 ) [E(S)] 2 = σ 2 σ 2 = 0, což by znamenalo, že výběrový rozptyl S 2 je konstantní. V případě, že známe střední hodnotu µ rozdělení X, ze kterého výběr pochází, nebudeme ji samozřejmě odhadovat a je škoda tuto informaci nevyužít i při odhadu rozptylu σ 2. Označme S 2 0 = 1 n n (X i µ) 2. i=1 Potom lze ukázat, že E(S 2 0) = σ 2. Tedy S 2 0 je nestranným odhadem rozptylu σ 2 v případě známé střední hodnoty µ. Vraťme se ještě ke statistice M = 1 n n i=1 (X i X) 2, o které jsme mluvili v minulé kapitole. Zřejmě M = n 1 n S2 = E(M) = n 1 n E(S2 ) = n 1 n σ2 = σ 2 1 n σ2. Statististika M je tedy vychýlený odhad rozptylu σ Nejlepší nestranný odhad V některých případech lze najít více statistik, které jsou nestrannými odhady funkce τ(ϑ). Tak např. výběrový průměr X = 1 n n i=1 X i a náhodná veličina X 1 jsou nestranné odhady střední hodnoty µ rozdělení, z něhož výběr pochází. Přitom nejsou stejně vhodné. Nestrannost těchto odhadů sice zaručuje, že jejich realizace kolísají okolo skutečné střední hodnoty µ, ale samozřejmě vhodnost nestranného odhadu µ závisí na tom, jaká je rozptýlenost jeho realizací okolo skutečné hodnoty µ. V našem případě máme D(X) = σ2 a D(X n 1) = σ 2. Výběrový průměr je tedy vhodnější odhad střední hodnoty µ (pro n > 1). Existují-li nestranné odhady parametrické funkce τ(ϑ), pak samozřejmě budeme chtít použít ten nestranný odhad, který má ze všech nestranných odhadů parametrické funkce τ(ϑ) nejmenší rozptyl. Takový odhad (pokud existuje) budeme nazývat nejlepší nestranný odhad funkce τ(ϑ).

22 22 Bodový odhad Definice 2.3: Nejlepší nestranný odhad Je-li T = T (X 1, X 2,..., X n ) nestranný odhad parametrické funkce τ(ϑ) a jestliže pro každý jiný nestranný odhad T = T (X 1,..., X n ) funkce τ(ϑ) platí D(T ) D(T ) pro každé ϑ Θ, nazývá se statistika T nejlepší nestranný odhad funkce τ(ϑ) Střední kvadratická chyba Uvažujme nyní tři odhady T, U a V parametrické funkce τ(ϑ), jejichž hustoty h(t), g(u) a s(v) mají tvar jako na obrázku 2.1. V tomto případě vidíme, že odhad T je sice nevychýlený, ale má příliš velký rozptyl. Odhad U má sice nejmenší rozptyl, ale je příliš vychýlený. Jako nejvhodnější se jeví odhad V, který má nejlepší kombinaci malého vychýlení a malého rozptylu. Vidíme tedy, že dalším měřítkem kvality odhadu, by měl být ukazatel, který měří právě tuto kombinaci. Tímto ukazatelem je, jak ukážeme, střední hodnota čtverce odchylky odhadu od skutečné hodnoty odhadované parametrické funkce. Obrázek 2.1: Odhad V s nejlepší kombinací malého rozptýlení a malého vychýlení Definice 2.4: Střední kvadratická chyba Střední kvadratická chyba K(ϑ) odhadu T parametrické funkce τ(ϑ) je definována jako K(ϑ) = E{[T τ(ϑ)] 2 }.

23 2.1 Vlastnosti odhadů 23 Protože platí dostáváme D(T ) = D[(T τ(ϑ)] = E{[T τ(ϑ)] 2 } {E[T τ(ϑ)]} 2 = K(ϑ) [E(T ) τ(ϑ)] 2 = K(ϑ) B 2 (ϑ), K(ϑ) = D(T ) + B 2 (ϑ). Kvadratická chyba odhadu je tedy rovna součtu rozptylu odhadu a čtverci vychýlení odhadu. Budeme-li dva odhady funkce τ(ϑ) posuzovat z hlediska K(ϑ) a vybereme ten, který má K(ϑ) menší, dostaneme ten, který má lepší kombinaci rozptylu a vychýlení. Konkrétně ze dvou nevychýlených odhadů vybereme ten, který má menší rozptyl a ze dvou odhadů se stejným rozptylem vybereme ten, který má menší vychýlení. Je-li statistika T nestranným odhadem funkce τ(ϑ), je střední kvadratická chyba K(ϑ) = D(T ). Lze ukázat, že pro střední kvadratickou chybu odhadů S 2 a M rozptylu σ 2 v případě výběru z normálního rozdělení platí: E[(S 2 σ 2 ) 2 ] = 2 n 1 σ4, E[(M σ 2 ) 2 ] = 2n 1 σ 4. n 2 Protože platí 2n 1 < 2, má statistika M menší střední kvadratickou chybu n 2 n 1 než statistika S 2. Tedy každý z těchto odhadů je lepší v jiném smyslu Konzistentní odhad K další často požadované vlastnosti odhadu patří tzv. konzistence odhadu, ta zhruba řečeno znamená, že čím větší bude rozsah výběru n, tím bude realizace odhadu blíž ke skutečné hodnotě odhadované parametrické funkce. Abychom zdůraznili, že zpracováváme náhodný výběr o rozsahu n, budeme odhad značit T n místo T. Definice 2.5: Konzistentní odhad Odhad T n parametrické funkce τ(ϑ) nazýváme konzistentní odhad funkce τ(ϑ), jestliže pro každé ɛ > 0 a pro každé ϑ Θ platí lim P ( T n τ(ϑ) < ɛ ) = 1. n Zřejmě platí P ( T n τ(ϑ) < ɛ ) = P ( τ(ϑ) ɛ < T n < τ(ϑ) + ɛ ) Je-li tedy T n konzistentní odhad funkce τ(ϑ), potom s rostoucím rozsahem výběru n roste pravděpodobnost, že tento odhad nabude hodnoty libovolně blízké skutečné hodnotě odhadované funkce τ(ϑ). Ověření konzistence odhadu nám usnadní následující tvrzení.

24 24 Bodový odhad Tvrzení 2.1: Nutná podmínka konzistence Odhad T n parametrické funkce τ(ϑ) je konzistentní odhad funkce τ(ϑ), jestliže pro každé ϑ Θ platí lim E(T n) = τ(ϑ), (2.3) n lim D(T n) = 0. (2.4) n Vztah (2.3) je triviálně splněn pro nestranné odhady. Vztah (2.4) říká, že se s rostoucím n zužuje rozdělení odhadu T n kolem skutečné hodnoty funkce τ(ϑ). Příklad 2.3: Při stejných podmínkách jako v příkladu 2.2 zjistěte, zda je výběrový průměr X konzistentním odhadem střední hodnoty µ. Řešení: Označme Protože platí T n = X = 1 n E(T n ) = E(X) = µ, dostáváme n X i pro n = 1, 2,.... i=1 D(T n ) = D(X) = σ2 n lim n E(T n) = lim n E(X) = lim n µ = µ, lim D(T σ 2 n) = lim D(X) = lim n n n n = 0. Tedy X je konzistentní odhad střední hodnoty µ. pro n = 1, 2,..., Tuto kapitolu uzavřeme tvrzením, které shrnuje některé ukázané poznatky a některé další o odhadu střední hodnoty a rozptylu náhodné veličiny X. Tvrzení 2.2: Odhady střední hodnoty a rozptylu Pro náhodný výběr z rozdělení N(µ, σ 2 ) platí: 1. Nejlepším nestranným a konzistentním odhadem střední hodnoty µ je výběrový průměr X. 2. Nejlepším nestranným a konzistentním odhadem rozptylu σ 2 je: výběrový rozptyl S 2 v případě, že neznáme střední hodnotu µ; statistika S 2 0 v případě, že známe střední hodnotu µ. Pro náhodný výběr z jiného rozdělení s konečnou střední hodnotou µ a konečným rozptylem σ 2 jsou uvedené odhady nestranné a konzistentní.

25 2.1 Vlastnosti odhadů 25 Pro odhad směrodatné odchylky běžně používáme statistiku S, resp. S 0 v případě, že neznáme, resp. známe střední hodnotu µ, i když se nejedná o nestranné odhady. Příklad 2.4: Vraťte se k příkladu 1.7 a odhadněte: 1. horní hranici náhodné chyby měření, které se můžeme dopustit s pravděpodobností Předpokládejte, že náhodná chyba měření má normální rozdělení. 2. směrodatnou odchylku náhodné chyby měření, když víte, že měřicí přístoj nevykazuje systematickou chybu. Řešení: Náhodná veličina X v příkladě 1.7 je náhodná chyba měření. Předpokládáme, že X N(µ, σ 2 ). 1. Máme odhadnout konstantu k, pro kterou platí P (X k) = Požadovanou pravděpodobnost vyjádříme pomocí normované náhodné veličiny X, tj. pomocí náhodné veličiny U = X µ, která má rozdělení N(0, 1) σ Dostaneme ( X µ 0.95 = P k µ ) ( = P U k µ ). σ σ σ Číslo k µ σ je tedy 95 procentní kvantil veličiny U, tj. u(0.95). V tab A.3 najdeme u(0.95) = Odtud k µ σ = k = µ σ. Odhad k horní hranice k pak dostaneme tak, že najdeme odhad µ střední hodnoty µ a odhad σ směrodatné odchylky σ. V příkladě 1.7 máme µ = x = 0.10[mm], σ = s. = 1.29[mm]. Potom k = µ σ. = 2.02[mm] Realizace odhadu horní hranice chyby měření, které se můžeme dopustit s pravděpodobností 0.95, je 2.02 mm. 2. Realizace σ 2 odhadu rozptylu σ 2 v případě známé střední hodnoty µ je σ 2 = s 2 0 = 1 n n (x i µ) 2. i=1 Protože přístroj nevykazuje systematické chyby, je µ = 0 a dostáváme tedy σ 2 = s 2 0 = i=1 x 2 i = 1.50 σ = s 0. = 1.22[mm] Realizace odhadu směrodatné odchylky chyby měření je 1.22 mm.

26 26 Bodový odhad 2.2 Kontrolní otázky 1. Vysvětlete, co si představujete pod pojmy: nestranný odhad, nejlepší nestranný odhad, konzistentní odhad. 2. Jak je definována statistika S 2 0? Můžete ji použít pro odhad rozptylu, když neznáte střední hodnotu? 3. Rozhodněte, která z následujích tvrzení jsou pravdivá? a) Je-li T nestranný odhad µ, potom E(µ) = T. b) Máme-li dva nestranné odhady parametrické funkce τ(ϑ), lepší je ten, který má větší rozptyl. c) Realizace výběrové směrodatné odchylky kolísají okolo skutečné hodnoty směrodatné odchylky rozdělení, ze kterého výběr pochází. d) Střední hodnota rozdělení, ze kterého výběr pochází, je X. e) Je-li odhad nestranný, pak je konzistentní. 2.3 Cvičení 1. Předpokládejme, že (X 1, X 2, X 3 ) je náhodný výběr z alternativního rozdělení s parametrem p, tj. A(p). Zjistěte, zda jsou statistiky T 1 = X 1 + X 2 X 3, T 2 = 2X 1 + X 2 X 3 a T 3 = 1 3 n i=1 X i = X nestranné odhady parametru p, určete jejich rozptyl a střední kvadratickou chybu. 2. Předpokládejme, že (X 1,..., X n ) náhodný výběr z rovnoměrného rozdělení s parametry 0, b, b > 0, tj. X R(0, b). Ověřte, zda je statistika T = 2X a) nestranným odhadem b; b) konzistentním odhadem b. 3. Dva studenti měřili stejným přístrojem, který nevykazuje systematickou chybu, vzdálenost dvou bodů. Jeden z nich změřil tuto vzdálenost 5 krát a za odhad vzal průměr svých měření. Druhý z nich měřil 10 krát a za odhad vzal také průměr svých měření. Nemohli se ale domluvit, zda za společný odhad vzdálenosti mají vzít a) průměr svých odhadů; b) průměr všech měření. Který postup je lepší? 4. Při sledování doby do poruchy v hodinách určitého zařízení byly získány následující údaje: 23, 49, 69, 98, 75, 15. Předpokládejme, že se jedná o realizaci náhodného výběru z exponenciálního rozdělení X s parametrem λ, tj. z rozdělení s distribuční funkcí F (x; λ) = 1 exp ( x/λ) pro x 0, pro jiná x je F (x; λ) = 0. Odhadněte střední dobu životnosti zařízení a pravděpodobnost, že zařízení bude fungovat ještě po 70 hodinách.

27 2.4 Klíč a výsledky cvičení Při měření určité vzdálenosti jsme získali následující výsledky (v km): 19.01, 19.02, 18.99, 19.00, 19.05, 19.05, 19.00, 18.98, 18.99, Odhadněte přesnost dálkoměru, jestliže víte, že je skutečná vzdálenost 20 km a chyba měření je zatížena systematickou chybou -1 km. Jak se změní výsledek, když neznáte střední hodnotu náhodné chyby měření? 6. Byly zjištěny odchylky od jmenovité hmotnosti 50 kg. Odhadněte směrodatnou odchylku odchylky, když víte, že střední hodnota odchylky je 0 kg. Třída Odchylky v kg n j Klíč a výsledky cvičení Otázky: 3. a) Ne - E(T ) = µ. b) Ne. c) Ano - jedná se o nestranný odhad. d) Ne - není to nestranný odhad. e) Ne - X je odhad střední hodnoty. f) Ne - nemusí být. Cvičení: 1. E(T 1 ) = E(T 3 ) = p, E(T 2 ) = 2p; T 1 a T 3 jsou nestranné odhady. T 2 není nestranný odhad parametru p. D(T 1 ) = 3p(1 p), D(T 2 ) = 6p(1 p), D(T 3 ) = 1p(1 p), K 3 T 1 (p) = 3p(1 p), K T2 (p) = p(6 5p), K T3 (p) = 1 3 p(1 p). 2. E(T ) = b, D(T ) = b2. a) Ano. b) Ano. 3n 3. Oba odhady jsou nestranné. Rozptyl odhadu v a) je 3 40 σ2 a rozptyl odhadu v b) je 1 15 σ2. Postup b) je lepší. 4. x. = h, P (X > 70). = σ2 = s 2 0 = km 2, σ 2 = s 2. = km σ = s 0. = kg.

28 Kapitola 3 Intervalový odhad Cíle Po přečtení a nastudování této kapitoly budete: vědět, co to je intervalový odhad parametrické funkce τ(ϑ) a proč jej hledáme; umět určit realizaci intervalového odhadu střední hodnoty, rozptylu a směrodatné odchylky normálního rozdělení; vědět, co je přesnost a spolehlivost odhadu a umět určit rozsah výběru n z normálního rozdělení tak, aby odhad střední hodnoty normálního rozdělení měl předepsanou přesnost a spolehlivost. Doba potřebná ke studiu Pro zvládnutí této kapitoly budete potřebovat asi 4 hodiny bez řešení příkladů ze cvičení. Klíčová slova Intervalový odhad, koeficeient spolehlivosti odhadu, spolehlivost odhadu, riziko odhadu, přesnost odhadu, přípustná chyba odhadu. V této kapitole (stejně jako v předchozí) budeme předpokládat, že máme náhodný výběr (X 1, X 2,..., X n ) z rozdělení X, které závisí na vektorovém parametru ϑ = (ϑ 1, ϑ 2,..., ϑ m ). O parametru ϑ víme pouze, že patří do parametrického prostoru Θ. V předchozí kapitole jsme se zabývali bodovým odhadem T = T (X 1, X 2,..., X n ) parametrické funkce τ(ϑ) a studiem jeho vlastností. Zdůrazňovali jsme, že bodový odhad T je náhodná veličina, jejíž hodnoty kolísají od jedné realizace náhodného výběru k druhé. V technických aplikacích nás samozřejmě zajímá číselná hodnota bodového odhadu, a ta se prakticky více či méně liší od skutečné hodnoty odhadované funkce τ(ϑ). Při odhadování pomocí bodového odhadu (ať má sebelepší vlastnosti) nejsme schopni určit přesnost odhadu, tj. jaké chyby se dopustíme, když skutečnou hodnotu τ(ϑ)

29 29 nahradíme hodnotou bodového odhadu vypočítanou na základě realizace náhodného výběru z X. Informaci o přesnosti odhadu můžeme získat pomocí tzv. intervalového odhadu. Při konstrukci intervalového odhadu se snažíme najít ne jednu, ale dvě statistiky, dejme tomu T D = T D (X 1, X 2,..., X n ) a T H = T H (X 1, X 2,..., X n ), T D < T H, tak, aby interval T D, T H překryl skutečnou hodnotu parametrické funkce τ(ϑ) s dostatečně velkou pravděpodobností. Definice 3.1: Intervalový odhad, koeficient spolehlivosti, riziko Jsou-li T D a T H takové statistiky, že pro dané α (0, 1) a každé ϑ Θ platí P (T D τ(ϑ) T H ) = 1 α, (3.1) potom se interval T D, T H nazývá 100(1 α) procentní intervalový odhad parametrické funkce τ(ϑ). Číslo 1 α se nazývá koeficient spolehlivosti odhadu, číslo α riziko odhadu. Nahradíme-li statistiky T D a T H jejich realizacemi t D a t H, vypočítanými z jedné realizace náhodného výběru, dostaneme interval t D, t H, který se nazývá realizace intervalového odhadu T D, T H. Intervalový odhad τ(ϑ) se také někdy nazývá interval spolehlivosti nebo konfidenční interval pro τ(ϑ). Někdy nás zajímá pouze největší hodnota τ(ϑ), se kterou lze při daných výsledcích experimentu počítat, nebo naopak pouze nejmenší možná hodnota τ(ϑ). V prvním případě hledáme statistiku T H tak, aby platilo P (T H τ(ϑ)) = 1 α pro každé ϑ Θ. (3.2) V druhém případě hledáme statistiku T D tak, aby P (T D τ(ϑ)) = 1 α pro každé ϑ Θ. (3.3) Dostaneme tzv. 100(1 α) procentní jednostranné intervalové odhady parametrické funkce τ(ϑ). V případě (3.2) budeme mluvit o horním nebo pravostranném intervalovém odhadu, v případě (3.3) budeme mluvit o dolním nebo levostranném intervalovém odhadu. V těchto případech je pouze jeden kraj intervalového odhadu náhodná veličina. Tak např., vímeli jistě, že τ(ϑ) musí být větší než číslo a, bude horní intervalový odhad (a, T H. Jestliže není hodnota τ(ϑ) omezena zdola, bude horní intervalový odhad (, T H. Jsou-li oba kraje intervalového odhadu náhodné veličiny, nazýváme jej oboustranný a slovo oboustranný se často vynechává. Ukážeme, že všechny tyto druhy intervalových odhadů lze získat z intervalu (3.1) vhodným rozdělením rizika α. Interpretace intervalového odhadu Je zapotřebí si uvědomit správný výklad intervalového odhadu. Z každé realizace náhodného výběru dostaneme obecně jinou realizaci intervalového odhadu. Každá z těchto realizací buď τ(ϑ) překrývá nebo nepřekrývá. Zvolíme-li

30 30 Intervalový odhad např. koeficient spolehlivosti 1 α = 0.99 a vypočteme velký počet realizací 99 procentního intervalového odhadu parametrické funkce τ(ϑ), pak průměrně 99 procent těchto realizací překrývá skutečnou hodnotu τ(ϑ). Volíme-li tedy koeficeint spolehlivosti 1 α blízký jedné, je skoro jisté, že realizace intervalového odhadu vypočtená z jedné realizace náhodného výběru překryje skutečnou hodnotu τ(ϑ). Dosavadní technické normy vyžadují většinou počítat 99 procentní nebo 95 procentní intervaly spolehlivosti (tj. volbu α = 0.01 nebo α = 0.05). Koeficient spolehlivosti a délka intervalového odhadu Koeficient spolehlivosti intervalového odhadu udává spolehlivost odhadu, tj. vyjadřuje, s jakou pravděpodobností se můžeme spolehnout na to, že interval překryje skutečnou hodnotu funkce τ(ϑ). Délka oboustranného intervalového odhadu udává přesnost intervalového odhadu. Čím je tato délka menší, tím je odhad přesnější. Při pevně zvoleném rozsahu náhodného výběru platí, že čím větší koeficient spolehlivosti odhadu zvolíme, tím menší bude přesnost odhadu. Čím více si totiž chceme být jisti, že intervalový odhad překryje skutečnou hodnotu τ(ϑ), tím musí být tento interval širší. Nepřiměřeným zvětšováním koeficientu spolehlivosti můžeme dosáhnout tak malou přesnost, tj. tak široký interval, že nebude mít prakticky žádnou vypovídací schopnost. Proto se v technických aplikacích doporučuje volit koeficient spolehlivosti odhadu právě 0.99 nebo 0.95, v některých případech pak Konstrukce intervalového odhadu funkce τ(ϑ) Postup, který se zpravidla používá při konstrukci 100(1 α) procentního intervalového odhadu funkce τ(ϑ), bude uveden na straně 35 až po vyřešení konkrétního příkladu. 3.1 Intervalové odhady parametrů normálního rozdělení Dále se budem zabývat intervalovými odhady parametrů µ a σ 2 rozdělení N(µ, σ 2 ). Tj. u nás bude τ(ϑ) = µ v případě našeho zájmu o odhad µ a τ(ϑ) = σ 2 v případě odhadu σ 2. Přitom budeme rozlišovat situace, kdy jsou neznámé oba parametry nebo pouze jeden z nich. Předpokládejme tedy, že (X 1, X 2,..., X n ) je náhodný výběr z rozdělení N(µ, σ 2 ). Rozdělení některých výběrových charakteristik Při konstrukci intervalových odhadů µ a σ 2 vycházíme z bodových odhadů X, S 2 a S 2 0 těchto parametrů, proto potřebujeme znát jejich rozdělení nebo rozdělení funkcí těchto odhadů, tzv. výběrová rozdělení.

31 3.1 Intervalové odhady parametrů normálního rozdělení 31 Tak např. pro výběrový průměr X platí (viz vztahy (2.1) a (2.2)), že E(X) = µ, D(X) = σ2 n. Protože předpokládáme, že výběr pochází z normálního rozdělení, bude mít normální rozdělení i výběrový průměr X, protože je lineární kombinací nezávislých normálních náhodných veličin. Tedy X N(µ, σ2 n ). Normováním statistiky X dostaneme veličinu X E(X) D(X) = X µ σ 2 n = X µ n, σ která má normované normální rozdělení. Máme-li tedy náhodný výběr z rozdělení N(µ, σ 2 ), má normovaný výběrový průměr rozdělení N(0, 1). Další výběrová rozdělení, která se používají ke konstrukci intervalových odhadů parametrů normálního rozdělení a testech hypotéz o parametrech normálního rozdělení (viz následující modul), zde nebudeme odvozovat, ale shrneme je všechny v následujícím tvrzení. Tvrzení 3.1: Výběrová rozdělení Je-li (X 1,..., X n ) náhodný výběr z rozdělení X N(µ, σ 2 ). Potom X µ n N(0, 1), σ X µ n t(n 1), S (n 1)S 2 ns 2 0 σ 2 χ 2 (n), σ 2 χ 2 (n 1). Při konstrukci i výpočtu intervalových odhadů parametrů µ a σ 2 v jednotlivých situacích budeme potřebovat pracovat s kvantily výše uvedených rozdělení. Úkol 3.1: Zopakujte si z teorie pravděpodobnosti, jak je definován 100γ procentní kvantil rozdělení náhodné veličiny X a co udává. Nakreslete si obrázky.

32 32 Intervalový odhad Poznámka 3.1: Kvantily výběrových rozdělení Kvantily výběrových rozdělení jsou jednak tabelovány (viz [11] a u nás v příloze A), jednak je počítá každý statistický software a můžeme využít i Excel. 100γ procentní kvantily rozdělení N(0, 1), t(n) a χ 2 (n) budeme postupně značit u(γ), t(n; γ) a χ 2 (n; γ). Kvantily u(γ) a t(n; γ) jsou tabelovány pro γ 0.5, pro γ < 0.5 je u(γ) = u(1 γ) a t(n; γ) = t(n; 1 γ). Nakreslete si obrázky a přesvědčte se o těchto rovnostech. Pro n > 30 je. t(n; γ) = u(γ). Pro kvantily χ 2 (n; γ) v tomto případě platí χ 2. (n; γ) = 1 [ 2n 1 + u(γ)] 2, takže v některých statistických tabulkách jsou tyto 2 kvantily tabelovány pro n 30. Úkol 3.2: 1. Jak vypadají tvary hustoty rozdělení N(µ, σ 2 ), t(n) a χ 2 (n)? 2. Určete následující kvantily: u(0.95), u(0.05), t(10; 0.9), t(15; 0.05), t(31; 0.99), χ 2 (5; 0.05), χ 2 (19; 0.99), χ 2 (100; 0.99), χ 2 (100; 0.01). 3. K jaké hodnotě se blíží 100γ procentní kvantily rozdělení N(0, 1), t(n) a χ 2 (n), když se γ blíží k jedné, resp. k nule? Nakreslete si obrázky! Výsledek: , 1.645, 1.372, 1.753, 2.326, 1.146, 36.19, , Když se γ blíží k jedné, blíží se všechny kvantily k. Když se γ blíží k nule, blíží se kvantily N(0, 1) a t(n) k a kvantil χ 2 (n) k nule. Místo limit budeme psát např. u(1) =, u(0) =. Než přejdeme k intervalovým odhadům parametrů normálního rozdělení, ukážeme využití tvrzení 3.1 při výpočtu pravděpodobnosti. Příklad 3.1: Při kontrole stejnorodosti dodávky mandarinek balených po 1 kg se odběratel rozhodl zvážit 20 náhodně vybraných balíčků. Dodávku přijme, jestliže bude výběrová směrodatná odchylka nanejvýš 20 g. Jaká je pravděpodobnost přijetí dodávky, jestliže je známo, že hmotnost balíčků má přibližně rozdělení N(1kg, kg 2 )? Řešení: Odběratel má k dispozici náhodný výběr (X 1,..., X n ) o rozsahu n = 20 z rozdělení N(1kg, kg 2 ). Počítáme pravděpodobnost P (S 0.02). Vyjádříme ji pomocí náhodné veličiny (n 1)S2, která má rozdělení χ 2 (n 1). σ 2 ( (n 1)S 2 (n ) 1)0.022 P (S 0.02) = P σ 2 σ 2 ( (n 1)S 2 19 ) ( (n 1)S 2 ) = P = P σ σ 2 Tedy číslo je 100α procentní kvantil rozdělení χ 2 (19). Z tabulky A.4 dostaneme, že α. = 0.1. Přijetí dodávky lze očekávat s pravděpodobností 0.1.

33 3.1 Intervalové odhady parametrů normálního rozdělení Intervalový odhad střední hodnoty Příklad 3.2: Určete 100(1 α) procentní intervalový odhad střední hodnoty µ normálního rozdělení N(µ, σ 2 ) se známým rozptylem σ 2. Řešení: Podle definice 3.1 potřebujeme určit statistiky T D a T H tak, aby pro každé µ platilo P (T D µ T H ) = 1 α. (3.4) 1. Vyjdeme z nejlepšího nestranného odhadu parametru µ, tj. výběrového průměru X. Hodilo by se nám najít takovou náhodnou veličinu K, která je funkcí parametru µ a jeho odhadu X, tj. K = K(µ, X), jejíž rozdělení známe a nezávisí na µ, tj. je určeno jednoznačně. Takovou veličinou je veličina K = X µ n, σ která má podle tvrzení 3.1 rozdělení N(0, 1), jehož 100γ procentní kvantily u(γ) jsou tabelovány. Všimněte si, že veličina K je skutečně funkcí pouze µ a X, protože σ známe a n je daný rozsah výběru. 2. Znalost a jednoznačnost rozdělení K nám umožňuje určit konstanty k D a k H, k D < k H, takové, že pro každé µ platí P (k D K k H ) = 1 α. (3.5) Když pak za K do vztahu (3.5) dosadíme X µ σ n a z nerovnosti uvnitř kulatých závorek vyjádříme µ, dostaneme hledaný 100(1 α) procentní intervalový odhad µ. Věnujme se tedy určení konstant k D a k H (viz obr. 3.1). Vztah 3.5 patí právě tehdy, když α = P ( K k D, k H ) = P [ (K < k D ) (K > k H ) ] = P (K < k D ) + P (K > k H ). Obrázek 3.1: Určení k D a k H

34 34 Intervalový odhad Konstanty k D a k H tedy stačí vybrat tak, aby P (K > k H ) = α 1 a P (K < k D ) = α 2, kde α 1 a α 2 jsou dvě nezáporná čísla s vlastností α 1 + α 2 = α. Zřejmě k H = u(1 α 1 ) a k D = u(α 2 ). Vzhledem k tomu, že α (a tedy i α 2 ) volíme prakticky malé číslo (určitě menší než 0.5), pro práci s tabulkami potřebujeme převodní vztah u(α 2 ) = u(1 α 2 ). Potom k D = u(1 α 2 ). Tedy P ( u(1 α 2 ) K u(1 α 1 ) ) = α. 3. Z nerovnosti u(1 α 2 ) X µ n u(1 α1 ) σ (která platí z pravděpodobností 1 α) vyjádříme µ. Dostaneme X u(1 α 1 ) σ n µ X + u(1 α 2 ) σ n. Tedy interval X u(1 α 1 ) σ n, X + u(1 α 2 ) σ n (3.6) je hledaný 100(1 α) procentní intervalový odhad střední hodnoty µ. Vraťme se zpět k rozdělení rizika α. Jestliže zvolíme α 1 = α 2, potom α 1 = α 2 = α a 2 u(1 α 1 ) = u(1 α 2 ) = u(1 α). 2 Dosazením do vztahu (3.6) dostaneme X u(1 α 2 ) σ, X + u(1 α n 2 ) σ, n což je 100(1 α) procentní oboustranný intervalový odhad µ. Jestliže zvolíme α 1 = 0, potom α 2 = α a u(1 α 1 ) = u(1) =, u(1 α 2 ) = u(1 α). Dostaneme interval (, X + u(1 α) σ n, což je 100(1 α) procentní horní intervalový odhad µ. Podobně při volbě α 1 = α, α 2 = 0 dostaneme interval X u(1 α) σ ),, n který je 100(1 α) procentním dolním intervalovým odhadem µ. Postup, který jsme použili v příkladu 3.2 ke konstrukci intervalového odhadu parametru µ normálního rozdělení se známým rozptylem σ 2, lze zobecnit na konstrukci intervalového odhadu parametrické funkce τ(ϑ).

35 3.1 Intervalové odhady parametrů normálního rozdělení 35 Konstrukce intervalového odhadu funkce τ(ϑ) Při konstrukci 100(1 α) procentního intervalového odhadu funkce τ(ϑ) se zpravidla postupuje následovně: 1. Vyjdeme z nejlepšího nestranného odhadu T parametrické funkce τ(ϑ). Najdeme náhodnou veličinu K takovou, že K = K(τ(ϑ), T ), tj. K je funkcí τ(ϑ) a jejího odhadu T, jejíž rozdělení známe a nezávisí na ϑ. 2. Pomocí tohoto rozdělení určíme konstanty k D a k H, k D < k H, takové, že P (k D K k H ) = 1 α (3.7) K tomu stačí konstanty k D a k H vybrat tak, aby P (K > k H ) = α 1 a P (K < k D ) = α 2, (3.8) kde α 1 a α 2 jsou dvě nezáporná čísla s vlastností α 1 + α 2 = α. 3. Nerovnost k D K k H pak převedeme na ekvivalentní nerovnost T D τ(ϑ) T H (v případech, které zde budeme uvažovat, to bude vždy možné), takže platí P (k D K k H ) = P (T D τ(ϑ) T H ) = 1 α pro každé ϑ, protože rozdělení náhodné veličiny K nezávisí na ϑ. Tj. interval T D, T H je 100(1 α) procentní intervalový odhad parametrické funkce τ(ϑ). Poznámka 3.2: Rozdělení rizika α Riziko α lze rozdělit na nezáporná čísla α 1 a α 2 nekonečně mnoha způsoby. Běžně se používají (stejně jako v příkladu 3.2) pouze tři: 1. α 1 = α 2 = α 2, 2. α 1 = 0, α 2 = α, 3. α 1 = α, α 2 = 0. Je-li α 1 > 0 a α 2 > 0 dostaneme oboustranný intervalový odhad. Při prvním způsobu rozdělení rizika tedy dostaneme oboustranný intervalový odhad. Dále budeme pod oboustranným intervalovým odhadem rozumět právě tento interval. Jestliže volíme druhý nebo třetí způsob, pak dostaneme jednostranné intervalové odhady. Vraťme se zpět k normálnímu rozdělení. Jestliže potřebujeme najít intervalový odhad střední hodnoty µ normálního rozdělení s neznámým rozptylem σ 2 (což je jistě častější situace), nemůžeme použít intervalový odhad (3.6). Nejlepším nestranným odhadem µ zůstavá X, ale pro konstrukci intervalového odhadu µ zde nemůžeme použít veličinu X µ σ n, protože neznáme σ. V tomto případě pracujeme s veličinou K = X µ S n z tvrzení 3.1, kdy neznámé σ nahradíme odhadem S. Náhodná veličina K má rozdělení t(n 1), jehož tvar hustoty je podobný tvaru hustoty rozdělení N(0, 1) v tom smyslu, že je symetrický podle osy y. Hledaný intervalový odhad bychom dostali analogicky

36 36 Intervalový odhad jako v příkladu 3.2. Od intervalového odhadu (3.6) se bude lišit tím, že místo s kvantily rozdělení N(0, 1) musíme pracovat s kvantily rozdělení t(n 1) a neznámou směrodatnou odchylku σ nahradit jejím odhadem S. Výsledky shrnuje následující tvrzení. Tvrzení 3.2: Intervalový odhad parametru µ Máme-li náhodný výběr o rozsahu n z rozdělení N(µ, σ 2 ), potom 100(1 α), tj. 100[1 (α 1 + α 2 )], procentní intervalový odhad střední hodnoty µ je: 1. v případě známého rozptylu σ 2 interval X u(1 α 1 ) σ n, X + u(1 α 2 ) σ n ; 2. v případě neznámého rozptylu σ 2 interval X t(n 1; 1 α 1 ) S n, X + t(n 1; 1 α 2 ) S n. Rozdělení rizika α na α 1 a α 2 je dáno v poznámce 3.2. Při druhém, resp. třetím způsobu rozdělení rizika dostaneme horní, resp. dolní intervalový odhad. Poznámka 3.3: Intervalový odhad střední hodnoty Intervalové odhady z tvzení 3.1 můžeme použít i pro intervalový odhad střední hodnoty E(X) náhodné veličiny X, která nemá normální rozdělení. Rozsah náhodného výběru z rozdělení X má být v tomto případě větší než 30. Spolehlivost odhadu je pak přibližně 1 α. Příklad 3.3: Z produkce konkrétní cihelny bylo náhodně vybráno osm cihel pálených plných a byla změřena jejich délka v mm. Výsledky meření byly: 290, 287, 289, 292, 293, 291, 286, 291. Předpokládáme, že délka cihly je normální náhodná veličina. Určete realizaci 95 procentního a) oboustranného intervalového odhadu střední hodnoty délky cihly; b) dolního intervalového odhadu střední hodnoty délky cihly. Řešení: Máme realizaci náhodného výběru z rozdělení X N(µ, σ 2 ) o rozsahu n = 8, kde neznáme ani jeden z parametrů µ a σ (1 α) procentní intervalový odhad střední hodnoty µ délky cihly je podle tvzení 3.2 interval X t(n 1; 1 α 1 ) S n, X + t(n 1; 1 α 2 ) S n. 2. Hledáme 95 procentní intervalový odhad µ, tj.

37 3.1 Intervalové odhady parametrů normálního rozdělení (1 α) = 95 1 α = 0.95 α = Rozdělme riziko α (viz poznámka 3.2): a) α 1 = α 2 = α = Odtud t(n 1; 1 α 1 ) = t(7; 0.975) = 2.365, t(n 1; 1 α 2 ) = t(7; 0.975) = b) α 1 = α = 0.05, α 2 = 0. Odtud t(n 1; 1 α 1 ) = t(n 1; 1 α) = t(7; 0.95) = 1.895, t(n 1; 1 α 2 ) = t(n 1; 1) =. 3. Vypočteme realizaci µ odhadu střední hodnoty µ a realizaci σ odhadu směrodatné odchylky σ, dosteneme µ = x = , σ = s = Výsledky dosadíme do krajů intervalového odhadu v bodě 1, dostaneme a) , = , ; b) = 8, ) , ). Realizace 95 procentního oboustranného intervalového odhadu střední hodnoty délky cihly je mm, mm, realizace 95 procentního dolního intervalového odhadu střední hodnoty délky cihly je mm, ). Můžeme se tedy na 95 procent spolehnout, že střední hodnota délky cihly je v rozmezí mm až mm a že střední hodnota délky cihly je se stejnou spolehlivostí větší než mm. Úkol 3.3: Řešte příklad 3.3 při koeficientu spolehlivosti 0.99 a výsledky porovnejte. Výsledek: a) mm, mm, b) mm, ). Oboustranný intervalový odhad má v tomto případě větší délku a dolní hranice dolního intervalového odhadu je menší, protože jsme požadovali větší spolehlivost. Úkol 3.4: Jak by se změnil postup v příkladu 3.3, kdyby z předchozích měření bylo známo, že směrodatná odchylka délky cihly je 2 mm? Výsledek: a) mm, mm, b) mm, ). Rozsah výběru pro odhad střední hodnoty µ Konstrukci intervalového odhadu střední hodnoty µ jsme již vysvětlili. Vraťme se ještě k přesnosti odhadu µ. Často se požaduje, aby měl odhad µ při dané spolehlivosti danou přesnost. Oboustranný intervalový odhad střední hodnoty µ je symetrický podle X (viz tvrzení 3.2 a poznámka (3.2)), tj. můžeme jej zapsat ve tvaru X, X +. Potom je délka intervalového odhadu odhadu µ rovna 2. Lze tedy přesnost odhadu µ vyjádřit pomocí, tzv. přípustné chyby odhadu.

38 38 Intervalový odhad Definice 3.2: Přípustná chyba odhadu µ Přípustná chyba odhadu X parametru µ je polovina délky oboustranného intervalového odhadu µ. V případě, že náhodný výběr pochází z rozdělení N(µ, σ 2 ) se známým rozptylem σ 2, platí: P (X u(1 α 2 ) σ µ X + u(1 α n 2 ) σ ) = 1 α. n Odtud plyne, že přípustná chyba odhadu µ je = u(1 α 2 ) σ n (3.9) a P ( X µ ) = 1 α. (3.10) Potom: 1. Ze vztahu (3.9) dostáváme, že přípustná chyba odhadu X parametru µ se při daném koeficientu spolehlivosti 1 α bude zmenšovat s rostoucím rozsahem výběru n. 2. Ze vztahu (3.10) plyne, že přípustná chyba odhadu µ je horní hranice absolutní hodnoty chyby odhadu µ, tj. X µ, které se dopustíme s pravděpodobností 1 α. 3. Je-li zadán nejen koeficient spolehlivosti odhadu, ale i přípustná chyba odhadu, pak můžeme určit minimální rozsah n min výběru tak, aby byly dodrženy oba požadavky současně. Stačí z nerovnice u(1 α 2 ) σ n vyjádřit n. Dostaneme [ u(1 α 2 n )σ ] 2. (3.11) Za n min pak vezmeme dolní hranici řešení (3.11) zaokrouhlenou nahoru na nejbližší celé číslo. Potom rozsah n min výběru zaručuje, že bude dodržena předepsaná spolehlivost 1 α i přesnost odhadu, vyjádřená přípustnou chybou odhadu. Přípustná chyba odhadu bude maximálně rovna požadované.

39 3.1 Intervalové odhady parametrů normálního rozdělení 39 V případě neznámého rozptylu pro přípustnou chybu odhadu µ platí = t(n 1; 1 α 2 ) S n. (3.12) Tedy na rozdíl od přípustné chyby střední hodnoty µ při známém rozptylu σ 2 je náhodná veličina. V tomto případě lze postupovat pomocí tzv. předvýběru, kdy nejprve provedeme náhodný výběr o rozsahu n 1. Z realizace výběru vypočteme realizaci výběrového rozptylu s 2 1 = 1 n 1 1 n 1 i=1 (x i x) 2 a z nerovnice t(n 1 1; 1 α 2 ) s 1 n vyjádříme n. Dostaneme [ t(n1 1; 1 α 2 n )s ] 2 1. (3.13) Za n min pak opět stačí vzít dolní hranici řešení (3.13) zaokrouhlenou nahoru na nejbližší celé číslo. Náhodný výběr o rozsahu n min už pak dává dostatečně přesný a spolehlivý odhad. Vysvětlení tohoto postupu přesahuje rámec našeho textu (viz např. [4]). Je-li n 1 n min je už v předvýběru splněna požadovaná spolehlivost a přesnost. Je-li n 1 < n min, doplní se výběr o dalších n min n 1 pozorování. Příklad 3.4: Za odhad vzdálenosti se bere průměr měření této vzdálenosti. Náhodné chyby měření mají normální rozdělení se střední hodnotou nula. Kolik měření je třeba provést, aby přípustná chyba při určování vzdálenosti nepřekročila 0.05 cm s pravděpodobností 0.95, jestliže směrodatná odchylka náhodné chyby měření: 1. je 0.1 cm; 2. není známá a z pěti meření byla vypočtena hodnota výběrové směrodatné odchylky 0.1 cm. Řešení: Označme µ neznámou vzdálenost a Y náhodnou chybu měření, potom pro neznámý výsledek měření X platí X = µ+y a tedy X N(µ, σ 2 ). Požadujeme, aby přípustná chyba odhadu byla maximálně 0.05 cm při koeficientu spolehlivosti 1 α = 0.95.

40 40 Intervalový odhad 1. Ze vztahu (3.11) dostáváme [ u(1 α 2 n )σ ] 2 [ ] 2 u(0.975) 0.1.= = 15.4 = n Naše měření budeme považovat za předvýběr, máme n 1 = 5, s 1 = 0.1. Potom podle vztahu (3.13) dostaneme n [ t(n1 1; 1 α 2 )s 1 ] 2 = [ ] 2 t(4; 0.975) 0.1.= 30.8 = n Při známém rozptylu stačí provést 16 měření, při neznámém rozptylu musíme předvýběr doplnit o dalších 26 měření. Potom se můžeme na 95% spolehnout, že skutečná vzdálenost µ je v intervalu x 0.05, x Tedy průměrně v 95% případů bude pro průměrnou vzdálenost vypočítanou z 16, resp. z 31 doplněných měření platit x µ Intervalový odhad rozptylu Příklad 3.5: Určete 100(1 α) procentní intervalový odhad rozptylu σ 2 normálního rozdělení N(µ, σ 2 ) se známou střední hodnotou µ. Řešení: 1. Vyjdeme z nejlepšího nestranného odhadu parametru σ 2 v případě známé střední hodnoty µ, tj. statistiky S 2 0. Potřebujeme najít náhodnou veličinu K tak, že K je funkcí rozptylu σ 2 a jeho odhadu S 2 0, jejíž rozdělení známe a nezávisí na σ 2. Podle tvrzení 3.1 lze za K zvolit náhodnou veličinu K = ns2 0 σ 2, která má rozdělení χ 2 (n), jehož 100γ procentní kvantily χ 2 (n; γ) jsou tabelovány. 2. Určíme konstanty k D a k H, k D < k H, tak, aby P (k D K k h ) = 1 α. K tomu stačí vybrat konstanty k D a k H tak, aby platilo (viz obr. 3.2) P (K > k H ) = α 1 a P (K < k D ) = α 2, kde α 1 a α 2 jsou dvě nezáporná čísla s vlastností α 1 + α 2 = α. Zřejmě k H = χ 2 (n; 1 α 1 ) a k D = χ 2 (n; α 2 ). Potom ( ) P χ 2 (n; α 2 ) K χ 2 (n; 1 α 1 ) = 1 α.

41 3.1 Intervalové odhady parametrů normálního rozdělení 41 Obrázek 3.2: Určení k D a k H 3. Z nerovnosti χ 2 (n; α 2 ) ns2 0 σ 2 χ 2 (n; 1 α 1 ) vyjádříme σ 2, dostaneme Tedy ns 2 0 χ 2 (n; 1 α 1 ) σ2 ns2 0 χ 2 (n; α 2 ). ns0 2 χ 2 (n; 1 α 1 ), ns0 2. (3.14) χ 2 (n; α 2 ) je hledaný 100(1 α) procentní intervalový odhad rozptylu σ 2. Při 1. způsobu dělení rizika α z poznámky 3.2 dostaneme χ 2 (n; 1 α 1 ) = χ 2 (n; 1 α), 2 χ2 (n; α 2 ) = χ 2 (n; α) 2 a tedy interval ns0 2 ns 2 0 χ 2 (n; 1 α), χ 2 2 (n; α) 2 je 100(1 α) procentní oboustranný intervalový odhad σ 2. Při 2. způsobu dělení dostaneme χ 2 (n; 1 α 1 ) = χ 2 (n; 1) =, χ 2 (n; α 2 ) = χ 2 (α) a intervalový odhad ( 0, ns0 2 χ 2 (n; α) je horní intervalový odhad σ 2. Ve třetím případě, pak zcela analogicky dostáváme dolní intervalový odhad σ 2 ns0 2 ) χ 2 (n; 1 α),. Jestliže potřebujeme najít intervalový odhad rozptylu σ 2 normálního rozdělení s neznámou střední hodnotou µ, nemůžeme použít intervalový odhad (3.14). Nestranným odhadem σ 2 je v tomto případě výběrový rozptyl S 2 a pro konstrukci intervalového odhadu σ 2 použijeme veličinu K = (n 1)S2, která σ 2 má podle tvrzení 3.1 rozdělení χ 2 (n 1). Hledaný intervalový odhad bychom dostali analogicky jako v příkladu 3.5. Výsledky shrnuje následující tvrzení.

42 42 Intervalový odhad Tvrzení 3.3: Intervalový odhad parametru σ 2 Máme-li náhodný výběr o rozsahu n z rozdělení N(µ, σ 2 ), potom 100(1 α), tj. 100[1 (α 1 + α 2 )], procentní intervalový odhad rozptylu σ 2 je: 1. v případě známé střední hodnoty µ interval ns0 2 χ 2 (n; 1 α 1 ), ns0 2 ; χ 2 (n; α 2 ) 2. v případě neznámé střední hodnoty µ interval (n 1)S 2 χ 2 (n 1; 1 α 1 ), (n 1)S 2. χ 2 (n 1; α 2 ) Rozdělení rizika α na α 1 a α 2 je dáno v poznámce 3.2. Horní, resp. dolní intervalový odhad dostaneme při druhém, resp. třetím způsobu rozdělení rizika. Poznámka 3.4: Intervalový odhad σ 100(1 α) procentní intervalový odhad směrodatné odchylky σ rozdělení N(µ, σ 2 ) dostaneme z intervalových odhadů v tvrzení 3.3 tak, že kraje příslušných intervalových odhadů odmocníme. Poznámka 3.5: Intervalový odhad rozptylu Intervalové odhady rozptylu z tvrzení 3.3 můžeme na rozdíl od intervalových odhadů střední hodnoty použít pouze v případě, že máme náhodný výběr z rozdělení N(µ, σ 2 ). Příklad 3.6: Vraťte se k příkladu 3.3 a určete realizaci 99 procentního oboustranného intervalového odhadu směrodatné odchylky délky cihly. Řešení: Máme realizaci náhodného výběru z rozdělení X N(µ, σ 2 ) o rozsahu n = 8, kde ani jeden z parametrů neznáme. Nejprve určíme intervalový odhad rozptylu (1 α) procentní intervalový odhad rozptylu σ 2 délky cihly je podle tvzení 3.3 interval (n 1)S 2 χ 2 (n 1; 1 α 1 ), (n 1)S 2 χ 2 (n 1; α 2 ) 2. Hledáme 99 procentní intervalový odhad σ 2, tj. 100(1 α) = 99 1 α = 0.99 α = 0.01 Rozdělme riziko α (viz poznámka 3.2): α 1 = α 2 = α 2 = Odtud.

43 3.2 Kontrolní otázky 43 χ 2 (n 1; 1 α 1 ) = χ 2 (7; 0.995) = 20.28, χ 2 (n 1; α 2 ) = χ 2 (7; 0.005)) = Z příkladu 3.3 máme σ = s = Výsledky dosadíme do krajů intervalového odhadu v bodě 1, dostaneme , = 2.015, Realizace 99 procentního oboustranného intervalového odhadu rozptylu délky cihly je mm 2, mm 2 a tedy realizace 99 procentního oboustranného intervalového odhadu směrodatné odchylky délky cihly je (1.420 mm, mm). V technických aplikacích se většinou 100(1 α) procentní intervalové odhady neznámých parametrů nebo funkcí těchto parametrů neodvozují, ale stačí je najít v příslušné statistické nebo technické literatuře. Pro výpočet realizace intervalového odhadu pak stačí zvolit koeficient spolehlivost odhadu 1 α, vypočítat realizace příslušných statistik v intervalových odhadech se vyskytujících a potřebné kvantily najít ve statistických tabulkách. Realizace intervalových odhadů střední hodnoty a rozptylu normální náhodné veličiny při obou neznámých parametrech počítá STATGRAPHICS v nabídce Describe Numeric Data One-Sample Analysis. EXCEL počítá realizaci intervalového odhadu střední hodnoty normálního rozdělení se známým rozptylem v nabídce průvodce funkcí f x funkce statistické CONFIDENCE. 3.2 Kontrolní otázky 1. Vlastními slovy řekněte, co si představujete pod 100(1 α) procentním intervalovým odhadem funkce τ(ϑ). 2. Musí realizace 90 procentního intervalového odhadu parametrické funkce τ(ϑ) obsahovat skutečnou hodnotu této funkce? 3. Ze 100 realizací náhodného výběru sestrojíme 100 realizací 80 procentního intervalového odhadu funkce τ(ϑ), musí každá z těchto realizací obsahovat skutečnou hodnotu této funkce? 4. Jaké druhy intervalových odhadů rozlišujeme? 5. Z realiazce náhodného výběru z normálního rozdělení o rozsahu n = 5 určíme realizaci výběrového rozptylu s 2 a průměru x a vypočteme realizaci intervalového odhadu střední hodnoty µ tak, že a) s 2 považujeme za odhad σ 2 ; b) s 2 považujeme za skutečnou hodnotu σ 2. Čím se tyto intervaly liší a který postup je správný? 6. Rozhodněte, které tvrzení platí: Přesnost odhadu střední hodnoty µ normálního rozdělení se při známém σ 2 zvětší, když:

44 44 Intervalový odhad a) zvětšíme rozsah výběru; b) zvětšíme koeficient spolehlivosti; c) když se zmenší rozptyl. 3.3 Cvičení 1. Hmotnost jedné porce kávy má přibližně normální rozdělení se střední hodnotou 7 g a směrodatnou odchylkou 0.4 g. Jaká je pravděpodobnost, že k přípravě 14 porcí bude stačit jeden 100 g balíček? 2. Teplota, při které se mění kvalita povrchu dřevotřískových desek, je normální náhodná veličina se střední hodnotou 104 C a směrodatnou odchylkou 8 C. Náhodně bylo vybráno 25 desek. V jakém intervalu lze očekávat X, S 2 a S s pravděpodobností 0.99, mají-li se hodnoty veličin X, S 2 a S vyskytovat se stejnou pravděpodobností nad horní a pod dolní mezí? 3. Najděte realizace 90 procentních horních intervalových odhadů neznámých parametrů v příkladě 6 ze cvičení 1.4. Předpokládejte, že má mez průtažnosti oceli přibližně normální rozdělení. 4. Sledovaný rozměr součástky má normální rozdělení se směrodatnou odchylkou 0.15 mm. Určete realizace 99 procentního oboustranného, horního a dolního intervalového odhadu střední hodnoty sledovaného rozměru, jestliže byl na základě měření osmi náhodně vybraných součástek vypočten průměr mm. V případě, že není přípustná chyba odhadu menší než 0.1 mm, určete rozsah n výběru tak, aby byla dodržena předepsaná přesnost. 5. Opakovaným meřením rychlosti vody v potrubí jsme získali následující výsledky v m/s: 4.20, 4.28, 4.27, Předpokládejme, že naměřené hodnoty lze považovat za realizaci náhodného výběru z normálního rozdělení. a) Najděte realizaci 95 procentního intervalového odhadu střední hodnoty a směrodatné odchylky rychlosti. b) V případě, že není přípustná chyba odhadu střední hodnoty menší než 0.05, určete rozsah výběru tak, aby byla zaručena předepsaná přesnost. 6. Průměrná hodnota vzdálenosti k orientačnímu bodu, získaná ze 4 nezávislých měření, je m. Chyba měřicího přístroje je normální náhodná veličina s parametry 10 m a 50 m 2. Určete realizaci 99 a 95 procentního intervalového odhadu měřené veličiny. 7. Má se určit střední hodnota doby, která je potřebná k vykonání určité činnosti. Byl měřen čas u 40 dělníků a vypočtena průměrná hodnota 42.5 minut a odhad směrodatné odchylky 3.8 minut. Jaké maximální chyby se dopustíme s pravděpodobností 0.99, když za odhad střední hodnoty vezmeme 42.5 minut?

45 3.4 Klíč a výsledky cvičení Vypočtěte realizace 95 procentních oboustranných intervalových odhadů neznámých parametrů v příkladě 6 ze cvičení 2.3 Předpokládejte, že sledovaná náhodná veličina má normální rozdělení. 9. Během 21 dnů byly v určitém regionu registrovány počty nehod za den. Výsledky jsou v následující tabulce: Určete: Počet nehod n j a) realizaci bodového odhadu střední hodnoty a směrodatné odchylky počtu nehod za den; b) realizaci 99 procentního horního odhadu střední hodnoty poču nehod za den, je-li známo, že počet nehod za den má přibližně Poissonovo rozdělení. 3.4 Klíč a výsledky cvičení Cvičení: 1. S pravděpodobností X , S , S µ MP a, σ MP a mm µ mm, µ mm, µ mm. Je třeba provést 15 měření. 5. a) µ = m/s, σ. = m/s, m/s µ m/s, m/s σ m/s. b) Výběr je nutné doplnit o alespoň 7 měření m µ m, m µ m. 7. Maximální chyba je minut kg 2 σ kg a) Ê(X) = x = ,. D(X) = s = b) Náhodná veličina X nemá normální rozdělení a rozsah výběru není vetší než 30, nemůžeme tedy použít intervalový odhad střední hodnoty normálního rozdělení. Pro Poissonovo rozdělení s parametrem λ platí, že E(X) = λ a 100(1 α) procentní intervalový odhad parametru λ je (viz např. [12]) interval χ 2 (2nX;α 1 ), χ2 (2nX+2;1 α 2 ), kde rozdělení rizika α na α 2n 2n 1 a α 2 je dáno v poznámce 3.2. Realizace hledaného intervalového odhadu je (0, (χ 2 (70; 0.99) = ). Tedy střední hodnota počtu nehod za den je téměř jistě nejvýše nehod.

46 Příloha A Tabulky

47 47 Tabulka A.1: Hodnoty distribuční funkce Φ(x) normované normální náhodné veličiny x Φ(x) x Φ(x) x Φ(x) x Φ(x) x Φ(x)

48 48 Tabulky Tabulka A.2: Hodnoty distribuční funkce Φ(x) normované normální náhodné veličiny x Φ(x) x Φ(x) x Φ(x) x Φ(x) x Φ(x) Tabulka A.3: Kvantily u(α) normované normální náhodné veličiny α u(α)

49 49 Tabulka A.4: Kvantily χ 2 (n; α) rozdělení χ 2 (n) n\α

50 50 Tabulky Tabulka A.5: Kvantily t(n; α) rozdělení t(n) n\α

51 Literatura [1] Anděl, J.: Statistické metody. MATFYZPRESS Praha [2] Cyhelský, L., Hustopecký, J., Závodský, P.: Příklady k teorii statistiky. SNTL/ALFA Praha [3] Friedrich, V.: Statistika 1 - vysokoškolská učebnice pro DS. EF ZU Plzeň [4] Hátle, J., Likeš, J.: Základy počtu pravděpodobnosti a matematické statistiky. SNTL/ALFA Praha [5] Hebák, P., Kahounová, J.: Počet pravděpodobnosti v příkladech. SNTL Praha [6] Jarušková, D., Hála, M.: Pravděpodobnost a matematická statistika 12. ČVUT Praha [7] Jarušková, D.: Matematická statistika 12. ČVUT Praha [8] Koutková, H., Moll, I.: Úvod do pravděpodobnosti a matematické statistiky. VUT Brno [9] Koutková, H., Dlouhý, O.: Sbírka příkladů z pravděpodobnosti a matematické statistiky. VUT Brno [10] Křivý, J.: Základy matematické statistiky. Ostrava [11] Likeš, J., Laga, J.: Základní statistické tabulky. SNTL Praha [12] Likeš, J., Machek, J.: Matematická statistika. Matematika pro vysoké školy technické. Sešit XI. SNTL Praha [13] Novovičová, J.: Pravděpodobnost a matematická statistika 12. ČVUT Praha [14] Škrášek, J., Tichý, Z.: Základy aplikované matematiky III. SNTL Praha [15] Vorlíček, M., Holický M., Špačková, M.: Pravděpodobnost a matematická statistika pro inženýry. VUT Praha [16] Walpole, R. E., Myers, R. H.: Probability and Statistics for Engineers and Scientists. MACMILLAN PUBLISHING COMPANY New York 1990.

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D. Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost

Více

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540

Více

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz. Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení

Více

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457. 0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti

Více

8. Normální rozdělení

8. Normální rozdělení 8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, 2 ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) 2 e 2 2, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá

Více

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní ..08 8cv7.tex 7. cvičení - transformace náhodné veličiny Definice pojmů a základní vzorce Je-li X náhodná veličina a h : R R je měřitelná funkce, pak náhodnou veličinu Y, která je definovaná vztahem X

Více

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak. 8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) e, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá normované

Více

Náhodné chyby přímých měření

Náhodné chyby přímých měření Náhodné chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně pravděpodobná.

Více

ÚSTAV MATEMATIKY A DESKRIPTIVNÍ GEOMETRIE. Matematika 0A4. Cvičení, letní semestr DOMÁCÍ ÚLOHY. Jan Šafařík

ÚSTAV MATEMATIKY A DESKRIPTIVNÍ GEOMETRIE. Matematika 0A4. Cvičení, letní semestr DOMÁCÍ ÚLOHY. Jan Šafařík Vysoké učení technické v Brně Stavební fakulta ÚSTAV MATEMATIKY A DESKRIPTIVNÍ GEOMETRIE Matematika 0A4 Cvičení, letní semestr DOMÁCÍ ÚLOHY Jan Šafařík Brno c 200 (1) 120 krát jsme házeli hrací kostkou.

Více

Diskrétní náhodná veličina

Diskrétní náhodná veličina Lekce Diskrétní náhodná veličina Výsledek náhodného pokusu může být vyjádřen slovně to vede k zavedení pojmu náhodného jevu Výsledek náhodného pokusu můžeme někdy vyjádřit i číselně, což vede k pojmu náhodné

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 5. Odhady parametrů základního souboru Mgr. David Fiedor 16. března 2015 Vztahy mezi výběrovým a základním souborem Osnova 1 Úvod, pojmy Vztahy mezi výběrovým a základním

Více

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D. Střední hodnota a rozptyl náhodné veličiny, vybraná rozdělení diskrétních a spojitých náhodných veličin, pojem kvantilu Ing. Michael Rost, Ph.D. Príklad Předpokládejme že máme náhodnou veličinu X která

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

8 Střední hodnota a rozptyl

8 Střední hodnota a rozptyl Břetislav Fajmon, UMAT FEKT, VUT Brno Této přednášce odpovídá kapitola 10 ze skript [1]. Také je k dispozici sbírka úloh [2], kde si můžete procvičit příklady z kapitol 2, 3 a 4. K samostatnému procvičení

Více

3 Bodové odhady a jejich vlastnosti

3 Bodové odhady a jejich vlastnosti 3 Bodové odhady a jejich vlastnosti 3.1 Statistika (Skripta str. 77) Výběr pořizujeme proto, abychom se (více) dověděli o souboru, ze kterého jsme výběr pořídili. Zde se soustředíme na situaci, kdy známe

Více

Základy teorie odhadu parametrů bodový odhad

Základy teorie odhadu parametrů bodový odhad Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Odhady parametrů Úkolem výběrového šetření je podat informaci o neznámé hodnotě charakteristiky základního souboru

Více

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Výsledky některých náhodných pokusů jsou přímo vyjádřeny číselně (např. při hodu kostkou padne 6). Náhodnou veličinou

Více

Výběrové charakteristiky a jejich rozdělení

Výběrové charakteristiky a jejich rozdělení Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový

Více

Diskrétní náhodná veličina. November 12, 2008

Diskrétní náhodná veličina. November 12, 2008 Diskrétní náhodná veličina November 12, 2008 (Náhodná veličina (náhodná proměnná)) Náhodná veličina (nebo též náhodná proměnná) je veličina X, jejíž hodnota je jednoznačně určena výsledkem náhodného pokusu.

Více

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) = Základní rozdělení pravděpodobnosti Diskrétní rozdělení pravděpodobnosti. Pojem Náhodná veličina s Binomickým rozdělením Bi(n, p), kde n je přirozené číslo, p je reálné číslo, < p < má pravděpodobnostní

Více

7. Rozdělení pravděpodobnosti ve statistice

7. Rozdělení pravděpodobnosti ve statistice 7. Rozdělení pravděpodobnosti ve statistice Statistika nuda je, má však cenné údaje, neklesejte na mysli, ona nám to vyčíslí Jednou z úloh statistiky je odhad (výpočet) hodnot statistického znaku x i,

Více

Pravděpodobnost a matematická statistika

Pravděpodobnost a matematická statistika Pravděpodobnost a matematická statistika Příklady k přijímacím zkouškám na doktorské studium 1 Popisná statistika Určete aritmetický průměr dat, zadaných tabulkou hodnot x i a četností n i x i 1 2 3 n

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

Náhodné (statistické) chyby přímých měření

Náhodné (statistické) chyby přímých měření Náhodné (statistické) chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně

Více

STATISTICKÉ ZJIŠŤOVÁNÍ

STATISTICKÉ ZJIŠŤOVÁNÍ STATISTICKÉ ZJIŠŤOVÁNÍ ÚVOD Základní soubor Všechny ryby v rybníce, všechny holky/kluci na škole Cílem určit charakteristiky, pravděpodobnosti Průměr, rozptyl, pravděpodobnost, že Maruška kápne na toho

Více

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení 2 Zpracování naměřených dat Důležitou součástí každé experimentální práce je statistické zpracování naměřených dat. V této krátké kapitole se budeme věnovat určení intervalů spolehlivosti získaných výsledků

Více

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin Příklady k procvičení z Matematické statistiky Poslední úprava. listopadu 207. Konvergence posloupnosti náhodných veličin. Necht X, X 2... jsou nezávislé veličiny s rovnoměrným rozdělením na [0, ]. Definujme

Více

Základy teorie pravděpodobnosti

Základy teorie pravděpodobnosti Základy teorie pravděpodobnosti Náhodná veličina Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 12. února 2012 Statistika by Birom Základy teorie

Více

Regresní analýza 1. Regresní analýza

Regresní analýza 1. Regresní analýza Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému

Více

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y 9. T r a n s f o r m a c e n á h o d n é v e l i č i n y Při popisu procesů zpracováváme vstupní údaj, hodnotu x tak, že výstupní hodnota y závisí nějakým způsobem na vstupní, je její funkcí y = f(x).

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Náhodný výběr Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

Příklad 1. Řešení 1a. Řešení 1b. Řešení 1c ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 7

Příklad 1. Řešení 1a. Řešení 1b. Řešení 1c ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 7 Příklad 1 a) Autobusy městské hromadné dopravy odjíždějí ze zastávky v pravidelných intervalech 5 minut. Cestující může přijít na zastávku v libovolném okamžiku. Určete střední hodnotu a směrodatnou odchylku

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině

Více

Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která

Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která Náhodná veličina a její charakteristiky Náhodná veličina a její charakteristiky Představte si, že provádíte náhodný pokus, jehož výsledek jste schopni ohodnotit nějakým číslem. Před provedením pokusu jeho

Více

ROZDĚLENÍ NÁHODNÝCH VELIČIN

ROZDĚLENÍ NÁHODNÝCH VELIČIN ROZDĚLENÍ NÁHODNÝCH VELIČIN 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č. CZ.1.07/2.2.00/28.0021)

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně 7 Náhodný vektor Nezávislost náhodných veličin Definice 7 Nechť je dán pravděpodobnostní prostor (Ω, A, P) Zobrazení X : Ω R n, které je A-měřitelné, se nazývá (n-rozměrný) náhodný vektor Měřitelností

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 4. Teoretická rozdělení Mgr. David Fiedor 9. března 2015 Osnova Úvod 1 Úvod 2 3 4 5 Vybraná rozdělení náhodných proměnných normální rozdělení normované normální rozdělení

Více

Číselné charakteristiky a jejich výpočet

Číselné charakteristiky a jejich výpočet Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz charakteristiky polohy charakteristiky variability charakteristiky koncetrace charakteristiky polohy charakteristiky

Více

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost Pravděpodobnost Náhodné veličiny a jejich číselné charakteristiky Petr Liška Masarykova univerzita 19.9.2014 Představme si, že provádíme pokus, jehož výsledek dokážeme ohodnotit číslem. Před provedením

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné

Více

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y 9. T r a n s f o r m a c e n á h o d n é v e l i č i n Při popisu procesů zpracováváme vstupní údaj, hodnotu x tak, že výstupní hodnota závisí nějakým způsobem na vstupní, je její funkcí = f(x). Pokud

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 2. KAPITOLA PODMÍNĚNÁ PRAVDĚPODOBNOST 3. KAPITOLA NÁHODNÁ VELIČINA 9.11.2017 Opakování Uveďte příklad aplikace geometrické definice pravděpodobnosti

Více

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D. Zpracování náhodného výběru popisná statistika Ing. Michal Dorda, Ph.D. Základní pojmy Úkolem statistiky je na základě vlastností výběrového souboru usuzovat o vlastnostech celé populace. Populace(základní

Více

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

MATEMATICKÁ STATISTIKA.   Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci Matematická statistika Matematická statistika se zabývá matematickým

Více

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

ÚVOD DO TEORIE ODHADU. Martina Litschmannová ÚVOD DO TEORIE ODHADU Martina Litschmannová Obsah lekce Výběrové charakteristiky parametry populace vs. výběrové charakteristiky limitní věty další rozdělení pravděpodobnosti (Chí-kvadrát (Pearsonovo),

Více

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}. VIII. Náhodný vektor. Náhodný vektor (X, Y má diskrétní rozdělení s pravděpodobnostní funkcí p, kde p(x, y a(x + y +, x, y {,, }. a Určete číslo a a napište tabulku pravděpodobnostní funkce p. Řešení:

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový.

6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový. 6. ZÁKLADY STATIST. ODHADOVÁNÍ X={X 1, X 2,..., X n } výběr z rozdělení s F (x, θ), θ={θ 1,..., θ r } - vektor reálných neznámých param. θ Θ R k. Θ parametrický prostor. Dva základní způsoby odhadu neznámého

Více

12. cvičení z PST. 20. prosince 2017

12. cvičení z PST. 20. prosince 2017 1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace

Více

Téma 22. Ondřej Nývlt

Téma 22. Ondřej Nývlt Téma 22 Ondřej Nývlt nyvlto1@fel.cvut.cz Náhodná veličina a náhodný vektor. Distribuční funkce, hustota a pravděpodobnostní funkce náhodné veličiny. Střední hodnota a rozptyl náhodné veličiny. Sdružené

Více

Pojem a úkoly statistiky

Pojem a úkoly statistiky Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Pojem a úkoly statistiky Statistika je věda, která se zabývá získáváním, zpracováním a analýzou dat pro potřeby

Více

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III Vysoká škola báňská - Technická univerzita Ostrava 4. října 2018 Podmíněná pravděpodobnost Při počítání pravděpodobnosti můžeme k náhodnému pokusu přidat i nějakou dodatečnou podmínku. Podmíněná pravděpodobnost

Více

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ Michal Kořenář 1 Abstrakt Rozvoj výpočetní techniky v poslední době umožnil také rozvoj výpočetních metod, které nejsou založeny na bázi

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

PRAVDĚPODOBNOST A STATISTIKA aneb Krátký průvodce skripty [1] a [2]

PRAVDĚPODOBNOST A STATISTIKA aneb Krátký průvodce skripty [1] a [2] PRAVDĚPODOBNOST A STATISTIKA aneb Krátký průvodce skripty [1] a [2] Použitá literatura: [1]: J.Reif, Z.Kobeda: Úvod do pravděpodobnosti a spolehlivosti, ZČU Plzeň, 2004 (2. vyd.) [2]: J.Reif: Metody matematické

Více

Náhodná veličina a rozdělení pravděpodobnosti

Náhodná veličina a rozdělení pravděpodobnosti 3.2 Náhodná veličina a rozdělení pravděpodobnosti Bůh hraje se světem hru v kostky. Jsou to ale falešné kostky. Naším hlavním úkolem je zjistit, podle jakých pravidel byly označeny, a pak toho využít pro

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

MATEMATICKÁ STATISTIKA

MATEMATICKÁ STATISTIKA MATEMATICKÁ STATISTIKA 1. Úvod. Matematická statistika se zabývá vyšetřováním zákonitostí, které v sobě obsahují prvek náhody. Zpracováním hodnot, které jsou výstupem sledovaného procesu, se snažíme popsat

Více

Charakterizace rozdělení

Charakterizace rozdělení Charakterizace rozdělení Momenty f(x) f(x) f(x) μ >μ 1 σ 1 σ >σ 1 g 1 g σ μ 1 μ x μ x x N K MK = x f( x) dx 1 M K = x N CK = ( x M ) f( x) dx ( xi M 1 C = 1 K 1) N i= 1 K i K N i= 1 K μ = E ( X ) = xf

Více

PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA

PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FAKULTA STAVEBNÍ HELENA KOUTKOVÁ PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA MODUL GA03 M4 ZÁKLADY TESTOVÁNÍ HYPOTÉZ STUDIJNÍ OPORY PRO STUDIJNÍ PROGRAMY S KOMBINOVANOU FORMOU

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

Náhodný vektor a jeho charakteristiky

Náhodný vektor a jeho charakteristiky Náhodný vektor a jeho číselné charakteristiky 1 Náhodný vektor a jeho charakteristiky V následující kapitole budeme věnovat pozornost pouze dvourozměřnému náhodnému vektoru, i když uvedené pojmy a jejich

Více

4. ZÁKLADNÍ TYPY ROZDĚLENÍ PRAVDĚPODOBNOSTI DISKRÉTNÍ NÁHODNÉ VELIČINY

4. ZÁKLADNÍ TYPY ROZDĚLENÍ PRAVDĚPODOBNOSTI DISKRÉTNÍ NÁHODNÉ VELIČINY 4. ZÁKLADNÍ TYPY ROZDĚLENÍ PRAVDĚPODOBNOSTI DISKRÉTNÍ NÁHODNÉ VELIČINY Průvodce studiem V této kapitole se seznámíte se základními typy rozložení diskrétní náhodné veličiny. Vašim úkolem by neměla být

Více

Chyby měření 210DPSM

Chyby měření 210DPSM Chyby měření 210DPSM Jan Zatloukal Stručný přehled Zdroje a druhy chyb Systematické chyby měření Náhodné chyby měření Spojité a diskrétní náhodné veličiny Normální rozdělení a jeho vlastnosti Odhad parametrů

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých

Více

Normální rozložení a odvozená rozložení

Normální rozložení a odvozená rozložení I Normální rozložení a odvozená rozložení I.I Normální rozložení Data, se kterými pracujeme, pocházejí z různých rozložení. Mohou být vychýlena (doleva popř. doprava, nebo v nich není na první pohled vidět

Více

Statistika pro geografy

Statistika pro geografy Statistika pro geografy 2. Popisná statistika Mgr. David Fiedor 23. února 2015 Osnova 1 2 3 Pojmy - Bodové rozdělení četností Absolutní četnost Absolutní četností hodnoty x j znaku x rozumíme počet statistických

Více

Rozdělení náhodné veličiny. Distribuční funkce. Vlastnosti distribuční funkce

Rozdělení náhodné veličiny. Distribuční funkce. Vlastnosti distribuční funkce Náhodná veličina motivace Náhodná veličina Často lze výsledek náhodného pokusu vyjádřit číslem: číslo, které padlo na kostce, výška náhodně vybraného studenta, čas strávený čekáním na metro, délka života

Více

Aplikovaná numerická matematika

Aplikovaná numerická matematika Aplikovaná numerická matematika 6. Metoda nejmenších čtverců doc. Ing. Róbert Lórencz, CSc. České vysoké učení technické v Praze Fakulta informačních technologií Katedra počítačových systémů Příprava studijních

Více

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a báli jste se zeptat Jedinečnou funkcí statistiky je, že umožňuje vědci číselně vyjádřit nejistotu v jeho závěrech. (G. W. Snedecor)

Více

Praktická statistika. Petr Ponížil Eva Kutálková

Praktická statistika. Petr Ponížil Eva Kutálková Praktická statistika Petr Ponížil Eva Kutálková Zápis výsledků měření Předpokládejme, že známe hodnotu napětí U = 238,9 V i její chybu 3,3 V. Hodnotu veličiny zapíšeme na tolik míst, aby až poslední bylo

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními

Více

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu.

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu. 6. NÁHODNÝ VEKTOR Průvodce studiem V počtu pravděpodobnosti i v matematické statistice se setkáváme nejen s náhodnými veličinami, jejichž hodnotami jsou reálná čísla, ale i s takovými, jejichž hodnotami

Více

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Vybraná rozdělení spojitých náhodných veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Třídění Základním zpracováním dat je jejich třídění. Jde o uspořádání získaných dat, kde volba třídícího

Více

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.) Lékařská biofyzika, výpočetní technika I Biostatistika Josef Tvrdík (doc. Ing. CSc.) Přírodovědecká fakulta, katedra informatiky josef.tvrdik@osu.cz konzultace úterý 14.10 až 15.40 hod. http://www1.osu.cz/~tvrdik

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,

Více

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. 1 Statistické odhady Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. Odhad lze provést jako: Bodový odhad o Jedna číselná hodnota Intervalový

Více

Cvičení ze statistiky - 8. Filip Děchtěrenko

Cvičení ze statistiky - 8. Filip Děchtěrenko Cvičení ze statistiky - 8 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Centrální limitní věta Laplaceho věta (+ korekce na spojitost) Konfidenční intervaly

Více

2. Bodové a intervalové rozložení četností

2. Bodové a intervalové rozložení četností . Bodové a intervalové rozložení četností (Jak získat informace z datového souboru?) Po prostudování této kapitoly budete umět: konstruovat diagramy znázorňující rozložení četností vytvářet tabulky četností

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

10. N á h o d n ý v e k t o r

10. N á h o d n ý v e k t o r 10. N á h o d n ý v e k t o r 10.1. Definice: Náhodný vektor. Uspořádanou n tici (X 1, X 2,..., X n ) náhodných veličin X i, 1 i n, nazýváme náhodným vektorem. Poznámka: Pro jednoduchost budeme zavádět

Více

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina. Parametrické metody odhadů z neúplných výběrů 2 1 Metoda maximální věrohodnosti pro cenzorované výběry 11 Náhodné cenzorování Při sledování složitých reálných systémů často nemáme možnost uspořádat experiment

Více

4ST201 STATISTIKA CVIČENÍ Č. 7

4ST201 STATISTIKA CVIČENÍ Č. 7 4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické

Více

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu

Více

STATISTICKÉ ODHADY Odhady populačních charakteristik

STATISTICKÉ ODHADY Odhady populačních charakteristik STATISTICKÉ ODHADY Odhady populačních charakteristik Jak stanovit charakteristiky rozložení sledované veličiny v základní populaci? Populaci většinou nemáme celou k dispozici, musíme se spokojit jen s

Více

Nestranný odhad Statistické vyhodnocování exp. dat M. Čada

Nestranný odhad Statistické vyhodnocování exp. dat M. Čada Nestranný odhad 1 Parametr θ Máme statistický (výběrový) soubor, který je realizací náhodného výběru 1, 2, 3,, n z pravděpodobnostní distribuce, která je kompletně stanovena jedním nebo více parametry

Více

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod. P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod. Matematický přístup k výsledkům únavových zkoušek Náhodnost výsledků únavových zkoušek. Únavové

Více

I. D i s k r é t n í r o z d ě l e n í

I. D i s k r é t n í r o z d ě l e n í 6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

NÁHODNÉ VELIČINY JAK SE NÁHODNÁ ČÍSLA PŘEVEDOU NA HODNOTY NÁHODNÝCH VELIČIN?

NÁHODNÉ VELIČINY JAK SE NÁHODNÁ ČÍSLA PŘEVEDOU NA HODNOTY NÁHODNÝCH VELIČIN? NÁHODNÉ VELIČINY GENEROVÁNÍ SPOJITÝCH A DISKRÉTNÍCH NÁHODNÝCH VELIČIN, VYUŽITÍ NÁHODNÝCH VELIČIN V SIMULACI, METODY TRANSFORMACE NÁHODNÝCH ČÍSEL NA HODNOTY NÁHODNÝCH VELIČIN. JAK SE NÁHODNÁ ČÍSLA PŘEVEDOU

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO

Více

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) . Statistika Teorie odhadu statistická indukce Intervalový odhad µ, σ 2 a π Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 21. února 2012 Statistika

Více

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr StatSoft Intervalový odhad Dnes se budeme zabývat neodmyslitelnou součástí statistiky a to intervaly v nejrůznějších podobách. Toto téma je také úzce spojeno s tématem testování hypotéz, a tedy plynule

Více

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X Náhodný vektor Náhodný vektor zatím jsme sledovali jednu náhodnou veličinu, její rozdělení a charakteristiky často potřebujeme vyšetřovat vzájemný vztah několika náhodných veličin musíme sledovat jejich

Více