1 Statistické odhady Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. Odhad lze provést jako: Bodový odhad o Jedna číselná hodnota Intervalový odhad o Interval (interval spolehlivosti, konfidencí interval) Bodové odhady Nahrazují hodnoty parametru základního souboru výběrovými charakteristikami. Nechť máme: Základní soubor X Náhodný výběr (X 1, X 2,, X n ) Potřebuji odhadnout parametr Θ. Bodový odhad ( je funkce náhodného výběru Bodový odhad nabývá svých hodnot v závislosti na: o konkrétních hodnotách náhodného výběru, o rozsahu výběru, (čím větší, tím spolehlivější) 1
1.1 Bodové odhady Požadavky na bodový odhad: Požadavek maximální koncentrace rozdělení pravděpodobností odhadu okolo skutečné hodnoty parametru Θ Aby funkce byla dobrým odhadem parametru Θ, musí splňovat co nejvíce z následujících podmínek: Konzistence bodového odhadu S rostoucím rozsahem výběru konverguje podle pravděpodobnosti k odhadovanému parametru. Nevychýlenost (nestrannost) Střední hodnota parametru = odhadovanému parametru Efektivnost Odhad je efektivní, má-li ze všech odhadů nejmenší disperzi. Podmínky nemusí platit zároveň. Mohou se také vzájemně vylučovat 2
1.1.1 Metoda momentů výběrové momenty Všeobecný výběrový moment: M k (a) = Momenty základního souboru odhadujeme odpovídajícími výběrovými momenty. První počáteční moment (EX) První výběrový počáteční moment Všeobecný výběrový moment Základní vzorec M k (a) = m k (a) M k (a) Pokud platí a = dostáváme počáteční výběrový moment V k = 1/n x i k Pokud platí k = 1 První počáteční výběrový moment = aritmet. průměr 3
Druhý centrální moment (DX) Druhý centrální výběrový moment (druhého řádu) Všeobecný výběrový moment Základní vzorec M k (a) = m k (a) M k (a) Pokud platí a = ; k = 2 M k (a) = M 2 ( Dosazení M 2 ( = s 2 = rozptyl 4
Příklad: metoda momentů Zkoušela se přesnost přístroje tak, že byla naměřena známá hodnota a zaznamenávaly se odchylky měření od této hodnoty. Odhadněte střední hodnotu a rozptyl těchto odchylek. Odchylky X i -2-1 0 1 n i 2 5 6 4 = = -0,29 DX = s 2 = = 0,9134 5
1.1.1.1 Metoda maximální věrohodnosti (MMV) Předpokládá se, že známe typ rozdělení pravděpodobnosti u základního souboru. Myšlenka MMV: Mám kuličky: 30 bílých P (b) = 2 černé P (b) = 1 zelená P (b) = Pravděpodobnost vytáhnutí: Barva kuličky = statistický znak. Hodnota statistického znaku bílé barvy má vysokou pravděpodobnost. Ostatní mají malé pravděpodobnosti. Největší pravděpodobnost je, že si vytáhnu bílou kuličku. Do náhodného výběru se dostanou hodnoty statistického znaku, které mají velkou pravděpodobnost. 6
2 Typy rozdělení pravděpodobností a odhady parametrů metodou maximální věrohodnosti Normální rozdělení pravděpodobností Je nejdůležitější a nejužívanější ze všech rozdělení. Často uváděno pod názvem Gaussovo Laplaceovo rozdělení. Má dva základní parametry: μ (střední hodnota), μ = E(X) δ (směrodatná odchylka), δ = D(X) Křivka hustoty pravděpodobnosti: zvonovitý tvar, symetrická kolem parametru polohy μ, μ je zároveň mediánem i modem tohoto rozdělení, tvar závisí na parametru δ 2, šikmost rozdělení = 0 Odhady parametrů: = - aritmetický průměr δ 2 = s 2 = - rozptyl 7
3 Intervalové odhady Nevýhoda bodového odhadu: nevíme, do jaké míry se na tento odhad můžeme spolehnout, nedávají informaci o tom, kde leží skutečné hodnoty parametrů, nedávají informaci o chybách. Intervalové odhady: máme předem stanovenou pravděpodobnost (alfa, hladina významnosti), že tento interval bude obsahovat hodnotu odhadovaného parametru. 3.1 IS pro střední hodnotu EX známe δ; normální normované rozdělení pravděpodobností Oboustranný IS Levostranný IS Pravostranný IS 8
3.2 IS pro střední hodnotu EX neznáme δ; studentovo rozdělení pravděpodobností Oboustranný IS Levostranný IS Pravostranný IS 3.3 IS pro rozptyl DX 9
3.4 IS pro směrodatnou odchylku 10
4 Testování hypotéz Statistická hypotéza Je tvrzení o vlastnostech základního souboru, o jehož pravdivosti se chceme přesvědčit. Předem nevíme, zda je pravdivé nebo ne. Nulová hypotéza H 0 Hypotéza, jejíž platnost ověřujeme. Značíme je H 0. Alternativní hypotéza H 1 Říká, co bude platit, když nebude platit nulová hypotéza H 0. Říkáme, že testujeme H 0 proti H 1. Testy jednostranné a dvoustranné: záleží na formulaci alternativní hypotézy Když nulová hypotéza H 0 : A = B potom H 1 : je dvoustranná H 1 : jsou jednostranné Statistický test H 1 : Jednoznačné pravidlo, které určuje podmínky, za kterých hypotézu H 0 zamítneme nebo nezamítneme. Testovací kritérium (Z) Je funkce náhodného výběru, jejíž tvar je závislý na testované hypotéze a rozdělení pravděpodobností základního souboru. Kritická oblasti (KO) 11
Podmnožina množiny hodnot testovacího kritéria, které nepatří do kritické oblasti. Kritická hranice (KH) Odděluje kritickou oblast od oblasti přípustných hodnot. Hladina významnosti testu Je pravděpodobnost kritické oblasti Postup testování hypotézy 1. získání údajů (například měřením), 2. stanovení statistického testu s příslušnou kritickou oblastí, 3. dosazení údajů do vzorce testovacího kritéria a výpočet hodnoty testovacího kritéria Z 4. zjistíme, kam padla hodnota testovacího kritéria: zda do kritické oblasti nebo do oblasti přípustných hodnot. 12
Hodnota testovacího kritéria padne do kritické oblasti H 0 se zamítá. Hodnota testovacího kritéria padne do oblasti přípustných hodnot H 0 se nezamítá, Neznamená to ale potvrzení H 1, Říkáme, že není důvod k zamítnutí H 0 Dělení testů hypotéz podle toho zda známe RP Parametrické testy Rozdělení pravděpodobností základního souboru je známé. Testování se týká pouze hodnot parametrů. Jsou spojovány s testováním parametrů normálního rozdělení pravděpodobností. Neparametrické testy Neznáme rozdělení pravděpodobností Dělení testů hypotéz Testy významnosti Rozdělení pravděpodobností je známé. Testované hypotézy se týkají pouze parametrů základního souboru. Testy shody Týkají se typu rozdělení pravděpodobností základního souboru. 13
4.1 Testy významnosti 4.1.1 Test pro střední hodnotu pokud: známe δ, normální RP Testovací kritérium = aritmetický průměr náhodného výběru n = rozsah náhodného výběru k = střední hodnota (konstanta) δ = směrodatná odchylka náhodného výběru Kritická oblast a) dvoustranná alternativní hypotéza H 0 : EX= k proti H 1 : EX k b) pravostranná alternativní hypotéza H 0 : EX= k proti H 1 : EX k c) levostranná alternativní hypotéza H 0 : EX= k proti H 1 : EX k 14
4.1.2 Test pro střední hodnotu pokud: neznáme δ, studentovo RP Testovací kritérium = aritmetický průměr náhodného výběru n = rozsah náhodného výběru k = střední hodnota (konstanta) s = směrodatná odchylka náhodného výběru (musí se dopočítat) Kritická oblast a) dvoustranná alternativní hypotéza H 0 : EX= k proti H 1 : EX k b) pravostranná alternativní hypotéza H 0 : EX= k proti H 1 : EX k c) levostranná alternativní hypotéza H 0 : EX= k proti H 1 : EX k 15
4.1.3 Test pro rozptyl Testovací kritérium = rozptyl daný v zadání = výběrový rozptyl Kritická oblast a) dvoustranná alternativní hypotéza H 0 : DX= k 2 proti H 1 : DX k 2 b) pravostranná alternativní hypotéza H 0 : DX= k 2 proti H 1 : DX k 2 c) levostranná alternativní hypotéza H 0 : DX= k 2 proti H 1 : DX k 2 16