PRAVDĚPODOBNOST A STATISTIKA. Testování hypotéz o rozdělení

Podobné dokumenty
PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

You created this PDF from an application that is not licensed to print to novapdf printer (

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

4ST201 STATISTIKA CVIČENÍ Č. 7

INDUKTIVNÍ STATISTIKA

Testování statistických hypotéz

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Národníinformačnístředisko pro podporu jakosti

15. T e s t o v á n í h y p o t é z

Normální (Gaussovo) rozdělení

15. T e s t o v á n í h y p o t é z

5. T e s t o v á n í h y p o t é z

Kontingenční tabulky, korelační koeficienty

Testování statistických hypotéz

Tomáš Karel LS 2012/2013

Normální (Gaussovo) rozdělení

Stručný úvod do testování statistických hypotéz

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

NÁHODNÁ ČÍSLA. F(x) = 1 pro x 1. Náhodná čísla lze generovat některým z následujících generátorů náhodných čísel:

Regresní a korelační analýza

A B C D

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Testy. Pavel Provinský. 19. listopadu 2013

Kontingenční tabulky, korelační koeficienty

6. Testování statistických hypotéz. KGG/STG Zimní semestr 6. Testování statistických hypotéz

2 ) 4, Φ 1 (1 0,005)

PRAVDĚPODOBNOST A STATISTIKA

y = 0, ,19716x.

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

Regresní a korelační analýza

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Pravděpodobnost a aplikovaná statistika

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

Protokol č. 1. Tloušťková struktura. Zadání:

Regresní a korelační analýza

Charakteristika datového souboru

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

Regresní a korelační analýza

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

12. cvičení z PST. 20. prosince 2017

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

Regresní a korelační analýza

Aproximace binomického rozdělení normálním

= = 2368

KONTINGENČNÍ TABULKY Komentované řešení pomocí programu Statistica

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Testování statistických hypotéz

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

KGG/STG Statistika pro geografy

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Přednáška X. Testování hypotéz o kvantitativních proměnných

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Základní statistické metody v rizikovém inženýrství

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

PRAVDĚPODOBNOST A STATISTIKA. Odhady parametrů Postačující statistiky

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

PRAVDĚPODOBNOST A STATISTIKA

Porovnání dvou výběrů

HODNOCENÍ VÝKONNOSTI ATRIBUTIVNÍCH ZNAKŮ JAKOSTI. Josef Křepela, Jiří Michálek. OSSM při ČSJ

ČVUT FAKULTA DOPRAVNÍ

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

PSY117/454 Statistická analýza dat v psychologii Přednáška 10

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Diskrétní náhodná veličina. November 12, 2008

6. T e s t o v á n í h y p o t é z

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Příklad: Test nezávislosti kategoriálních znaků

AKM CVIČENÍ. Opakování maticové algebry. Mějme matice A, B regulární, potom : ( AB) = B A

Regresní analýza 1. Regresní analýza

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

Vybraná rozdělení náhodné veličiny

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

ROZDĚLENÍ NÁHODNÝCH VELIČIN

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

Co je to statistika? Úvod statistické myšlení. Základy statistického hodnocení výsledků zkoušek. Petr Misák

5 Parametrické testy hypotéz

Pravděpodobnost a aplikovaná statistika

PRAVDĚPODOBNOST A STATISTIKA

Cvičení ze statistiky - 9. Filip Děchtěrenko

Základy teorie pravděpodobnosti

Statistika. Testování hypotéz statistická indukce Neparametrické testy. Roman Biskup

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

STATISTICKÉ ZJIŠŤOVÁNÍ

Transkript:

PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz o rozdělení

Testování hypotéz o rozdělení Nechť X e náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládeme, že neznáme tvar distribuční funkce (nevíme aké má rozdělení) a neznáme parametr ϑ. Na základě měření (pokusů) chceme odhadnou typ rozdělení a neznámý parametr ϑ. Provedeme n pokusů (n měření). Výsledky těchto pokusů sou popsány náhodným výběrem X ( X1,, X n ) a eho realizací. x ( x 1,, x n ) Opět předpokládáme, že složky náhodného vektoru sou nezávislé a maí stené rozdělení ako náhodná proměnná X.

Testování hypotéz o rozdělení Při testování hypotéz o rozdělení si zvolíme rozdělení s kterým chceme porovnat naměřená data. Pokud rozdělení obsahue neznámý parametr, pro eho odhad použieme statistiky pro bodový odhad: t T x,, x ) Hypotéza e ve tvaru: H: X F(x, ϑ), H A : X F(x, ϑ). Existue více typů testů o rozdělení. - test Chí-kvadrát (Pearsonův test) o rozdělení. - Kolmogorov Smirnov - Anderson - Darling -.. ( 1 n

Testování hypotéz o rozdělení Chi-kvadrát test Chí-kvadrát testem, který e založen na tříděném statistickém souboru.

Testování hypotéz o rozdělení Chi-kvadrát test Předpokládeme, že X e náhodná proměnná, která má distribuční funkci F(x, ϑ). Provedeme n pokusů (n měření). Výsledky těchto pokusů sou popsány náhodným výběrem X ( X1,, X ) a eho realizací x ( x n 1,, x n ). Neznámý parametr ϑ získáme pomocí bodového odhadu. x ( x 1,, x n ) Statistický soubor převedeme na tříděný statistický soubor. Předpokládeme, že sme dostali m tříd a příslušné četnosti f. K těmto četnostem spočítáme teoretické četnosti t. aké by byly četnosti, pokud by náhodná proměnná X měla distribuční funkci F(x, ϑ). Tyto četnosti označíme fˆ Nechť -tá třída e: x, x pak teoretická četnost se spočítá: fˆ n( F( x ) F( x ))

Testování hypotéz o rozdělení Chi-kvadrát test Testovací kritérium: t 1 doplněk kritického oboru: m ( f fˆ fˆ ) 2 W 2 0, 1 t m 1 f fˆ 2 n 2 kde e kvantil Pearsonova rozdělení s k=m - q-1 stupni volnosti. 1 q e počet parametrů, které bylo třeba spočítat pomocí bodového odhadu. Protože se edná o asymptotický test, e potřeba splnit požadavek: fˆ >5. Toho lze dosáhnout vhodným sloučením sousedních tříd.

Testování hypotéz o rozdělení - Kolmogorov Smirnovov Kolmogorov Smirnov srovnání distribuční funkce a empirické distribuční funkce::

Testování hypotéz o rozdělení - Kolmogorov Smirnov X,, X n Nechť e náhodný výběr. Pak empirická distribuční funkce e definovaná vztahem: card{ i, X i x} FEmp ( x) n 1 X,, X n Nechť e náhodný výběr z rozdělení, která má distribuční funkci F(x, ϑ). Parametr ϑ nahradíme eho bodovým odhadem. Označme: D 1 max FEmp ( x( i1) ) F( x( i), ) D max F( x( i), ) FEmp ( x( i) ) i1,.. n i1,.., n x (i) e prvek z uspořádaného statistického souboru (x (1),, x (n) ) ( x 1,, x n - realizace X,, ). 1 X n Pak hypotézu: H: X F(x, ϑ) vzhledem k H A : X F(x, ϑ) nezamítáme, pokud D e menší rovno než kritická hodnota D n (tabulka). D max D, D

Testování hypotéz o rozdělení - Kolmogorov Smirnov Pro velké n: D n ( ) 1 2 ln 2n

Testování hypotéz o rozdělení Q-Q graf Další testy sou založeny na srovnání kvantilů: Vychází se z naměřených dat a ze zvolené a empirické distribuční funkce: 1 x-osa: F F( x i ) xi 1 y-osa: F Emp ( x i ) F Pokud e X spoitá NP, pak pro osu y lze použít: 1 F i / n

Příklad 1: Házíte kostkou. Testování hypotéz o rozdělení 1 padne 19x 2 padne 16x 3 padne 17x 4 padne 27x 5 padne 25x 6 padne 34x Na hladině významnosti 0,05 otestute hypotézu, že se edná o ideální kostku. Příklad 2: Volební strana XYZ si udělal průzkum své volitelnosti. Z 1200 dotázaných by danou stranu volilo 307, 204 e nerozhodnutých a zbytek by stranu nevolil. Na hladině významnosti 0,01 otestute hypotézu, že stanu volí 30% nerozhodnutých e 20% a nevolí stranu 50%.

Testování hypotéz o rozdělení Příklad 3: Při zkoumání nehod na dálnici D1 mezi Brnem a Prahou byly zištěny následuící údae o počtu nehod: Na hladině významnosti 5% otestute hypotézu, že počet nehod nezávisí na úseku dálnice.