Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Podobné dokumenty
Testování hypotéz. 4. přednáška

PRAVDĚPODOBNOST A STATISTIKA

Testování statistických hypotéz

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

4ST201 STATISTIKA CVIČENÍ Č. 7

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Testování statistických hypotéz

Testování statistických hypotéz. Obecný postup

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Normální (Gaussovo) rozdělení

Testování statistických hypotéz

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Ing. Michael Rost, Ph.D.

Normální (Gaussovo) rozdělení

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

5 Parametrické testy hypotéz

Zápočtová práce STATISTIKA I

KGG/STG Statistika pro geografy

Testy statistických hypotéz

Aproximace binomického rozdělení normálním

Charakteristika datového souboru

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový.

Jednostranné intervaly spolehlivosti

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Pravděpodobnost a aplikovaná statistika

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testy. Pavel Provinský. 19. listopadu 2013

STATISTICKÉ HYPOTÉZY

Pravděpodobnost a matematická statistika

Stručný úvod do testování statistických hypotéz

Návrh a vyhodnocení experimentu

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

Vybraná rozdělení náhodné veličiny

Testování hypotéz Biolog Statistik: Matematik: Informatik:

15. T e s t o v á n í h y p o t é z

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

STATISTICKÉ ODHADY Odhady populačních charakteristik

2 ) 4, Φ 1 (1 0,005)

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

Úvod do problematiky měření

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

= = 2368

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Tomáš Karel LS 2012/2013

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

7.1. Podstata testu statistické hypotézy

Dva případy chybného rozhodnutí při testování: a) Testační statistika padne mimo obor přijetí nulové H hypotézy O, tj.

STATISTICKÉ TESTY VÝZNAMNOSTI

prosince oboustranný symetrický 95% interval spolehlivosti pro střední hodnotu životnosti τ. X i. X = 1 n.. Podle CLV má veličina

Cvičení ze statistiky - 8. Filip Děchtěrenko

Základní statistické metody v rizikovém inženýrství

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

You created this PDF from an application that is not licensed to print to novapdf printer (

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

Náhodné chyby přímých měření

12. cvičení z PST. 20. prosince 2017

STATISTICKÉ ZJIŠŤOVÁNÍ

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

STATISTICKÉ TESTY VÝZNAMNOSTI

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

15. T e s t o v á n í h y p o t é z

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

Intervalové Odhady Parametrů II Testování Hypotéz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

5. T e s t o v á n í h y p o t é z

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN

Náhodné veličiny, náhodné chyby

3 Bodové odhady a jejich vlastnosti

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

Příklady na testy hypotéz o parametrech normálního rozdělení

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Náhodné (statistické) chyby přímých měření

PRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady

I. D i s k r é t n í r o z d ě l e n í

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

p(x) = P (X = x), x R,

4EK211 Základy ekonometrie

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

Co je to statistika? Úvod statistické myšlení. Základy statistického hodnocení výsledků zkoušek. Petr Misák

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

Odhad parametrů N(µ, σ 2 )

Transkript:

1 Statistické odhady Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. Odhad lze provést jako: Bodový odhad o Jedna číselná hodnota Intervalový odhad o Interval (interval spolehlivosti, konfidencí interval) Bodové odhady Nahrazují hodnoty parametru základního souboru výběrovými charakteristikami. Nechť máme: Základní soubor X Náhodný výběr (X 1, X 2,, X n ) Potřebuji odhadnout parametr Θ. Bodový odhad ( je funkce náhodného výběru Bodový odhad nabývá svých hodnot v závislosti na: o konkrétních hodnotách náhodného výběru, o rozsahu výběru, (čím větší, tím spolehlivější) 1

1.1 Bodové odhady Požadavky na bodový odhad: Požadavek maximální koncentrace rozdělení pravděpodobností odhadu okolo skutečné hodnoty parametru Θ Aby funkce byla dobrým odhadem parametru Θ, musí splňovat co nejvíce z následujících podmínek: Konzistence bodového odhadu S rostoucím rozsahem výběru konverguje podle pravděpodobnosti k odhadovanému parametru. Nevychýlenost (nestrannost) Střední hodnota parametru = odhadovanému parametru Efektivnost Odhad je efektivní, má-li ze všech odhadů nejmenší disperzi. Podmínky nemusí platit zároveň. Mohou se také vzájemně vylučovat 2

1.1.1 Metoda momentů výběrové momenty Všeobecný výběrový moment: M k (a) = Momenty základního souboru odhadujeme odpovídajícími výběrovými momenty. První počáteční moment (EX) První výběrový počáteční moment Všeobecný výběrový moment Základní vzorec M k (a) = m k (a) M k (a) Pokud platí a = dostáváme počáteční výběrový moment V k = 1/n x i k Pokud platí k = 1 První počáteční výběrový moment = aritmet. průměr 3

Druhý centrální moment (DX) Druhý centrální výběrový moment (druhého řádu) Všeobecný výběrový moment Základní vzorec M k (a) = m k (a) M k (a) Pokud platí a = ; k = 2 M k (a) = M 2 ( Dosazení M 2 ( = s 2 = rozptyl 4

Příklad: metoda momentů Zkoušela se přesnost přístroje tak, že byla naměřena známá hodnota a zaznamenávaly se odchylky měření od této hodnoty. Odhadněte střední hodnotu a rozptyl těchto odchylek. Odchylky X i -2-1 0 1 n i 2 5 6 4 = = -0,29 DX = s 2 = = 0,9134 5

1.1.1.1 Metoda maximální věrohodnosti (MMV) Předpokládá se, že známe typ rozdělení pravděpodobnosti u základního souboru. Myšlenka MMV: Mám kuličky: 30 bílých P (b) = 2 černé P (b) = 1 zelená P (b) = Pravděpodobnost vytáhnutí: Barva kuličky = statistický znak. Hodnota statistického znaku bílé barvy má vysokou pravděpodobnost. Ostatní mají malé pravděpodobnosti. Největší pravděpodobnost je, že si vytáhnu bílou kuličku. Do náhodného výběru se dostanou hodnoty statistického znaku, které mají velkou pravděpodobnost. 6

2 Typy rozdělení pravděpodobností a odhady parametrů metodou maximální věrohodnosti Normální rozdělení pravděpodobností Je nejdůležitější a nejužívanější ze všech rozdělení. Často uváděno pod názvem Gaussovo Laplaceovo rozdělení. Má dva základní parametry: μ (střední hodnota), μ = E(X) δ (směrodatná odchylka), δ = D(X) Křivka hustoty pravděpodobnosti: zvonovitý tvar, symetrická kolem parametru polohy μ, μ je zároveň mediánem i modem tohoto rozdělení, tvar závisí na parametru δ 2, šikmost rozdělení = 0 Odhady parametrů: = - aritmetický průměr δ 2 = s 2 = - rozptyl 7

3 Intervalové odhady Nevýhoda bodového odhadu: nevíme, do jaké míry se na tento odhad můžeme spolehnout, nedávají informaci o tom, kde leží skutečné hodnoty parametrů, nedávají informaci o chybách. Intervalové odhady: máme předem stanovenou pravděpodobnost (alfa, hladina významnosti), že tento interval bude obsahovat hodnotu odhadovaného parametru. 3.1 IS pro střední hodnotu EX známe δ; normální normované rozdělení pravděpodobností Oboustranný IS Levostranný IS Pravostranný IS 8

3.2 IS pro střední hodnotu EX neznáme δ; studentovo rozdělení pravděpodobností Oboustranný IS Levostranný IS Pravostranný IS 3.3 IS pro rozptyl DX 9

3.4 IS pro směrodatnou odchylku 10

4 Testování hypotéz Statistická hypotéza Je tvrzení o vlastnostech základního souboru, o jehož pravdivosti se chceme přesvědčit. Předem nevíme, zda je pravdivé nebo ne. Nulová hypotéza H 0 Hypotéza, jejíž platnost ověřujeme. Značíme je H 0. Alternativní hypotéza H 1 Říká, co bude platit, když nebude platit nulová hypotéza H 0. Říkáme, že testujeme H 0 proti H 1. Testy jednostranné a dvoustranné: záleží na formulaci alternativní hypotézy Když nulová hypotéza H 0 : A = B potom H 1 : je dvoustranná H 1 : jsou jednostranné Statistický test H 1 : Jednoznačné pravidlo, které určuje podmínky, za kterých hypotézu H 0 zamítneme nebo nezamítneme. Testovací kritérium (Z) Je funkce náhodného výběru, jejíž tvar je závislý na testované hypotéze a rozdělení pravděpodobností základního souboru. Kritická oblasti (KO) 11

Podmnožina množiny hodnot testovacího kritéria, které nepatří do kritické oblasti. Kritická hranice (KH) Odděluje kritickou oblast od oblasti přípustných hodnot. Hladina významnosti testu Je pravděpodobnost kritické oblasti Postup testování hypotézy 1. získání údajů (například měřením), 2. stanovení statistického testu s příslušnou kritickou oblastí, 3. dosazení údajů do vzorce testovacího kritéria a výpočet hodnoty testovacího kritéria Z 4. zjistíme, kam padla hodnota testovacího kritéria: zda do kritické oblasti nebo do oblasti přípustných hodnot. 12

Hodnota testovacího kritéria padne do kritické oblasti H 0 se zamítá. Hodnota testovacího kritéria padne do oblasti přípustných hodnot H 0 se nezamítá, Neznamená to ale potvrzení H 1, Říkáme, že není důvod k zamítnutí H 0 Dělení testů hypotéz podle toho zda známe RP Parametrické testy Rozdělení pravděpodobností základního souboru je známé. Testování se týká pouze hodnot parametrů. Jsou spojovány s testováním parametrů normálního rozdělení pravděpodobností. Neparametrické testy Neznáme rozdělení pravděpodobností Dělení testů hypotéz Testy významnosti Rozdělení pravděpodobností je známé. Testované hypotézy se týkají pouze parametrů základního souboru. Testy shody Týkají se typu rozdělení pravděpodobností základního souboru. 13

4.1 Testy významnosti 4.1.1 Test pro střední hodnotu pokud: známe δ, normální RP Testovací kritérium = aritmetický průměr náhodného výběru n = rozsah náhodného výběru k = střední hodnota (konstanta) δ = směrodatná odchylka náhodného výběru Kritická oblast a) dvoustranná alternativní hypotéza H 0 : EX= k proti H 1 : EX k b) pravostranná alternativní hypotéza H 0 : EX= k proti H 1 : EX k c) levostranná alternativní hypotéza H 0 : EX= k proti H 1 : EX k 14

4.1.2 Test pro střední hodnotu pokud: neznáme δ, studentovo RP Testovací kritérium = aritmetický průměr náhodného výběru n = rozsah náhodného výběru k = střední hodnota (konstanta) s = směrodatná odchylka náhodného výběru (musí se dopočítat) Kritická oblast a) dvoustranná alternativní hypotéza H 0 : EX= k proti H 1 : EX k b) pravostranná alternativní hypotéza H 0 : EX= k proti H 1 : EX k c) levostranná alternativní hypotéza H 0 : EX= k proti H 1 : EX k 15

4.1.3 Test pro rozptyl Testovací kritérium = rozptyl daný v zadání = výběrový rozptyl Kritická oblast a) dvoustranná alternativní hypotéza H 0 : DX= k 2 proti H 1 : DX k 2 b) pravostranná alternativní hypotéza H 0 : DX= k 2 proti H 1 : DX k 2 c) levostranná alternativní hypotéza H 0 : DX= k 2 proti H 1 : DX k 2 16