PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz o rozdělení
Testování hypotéz o rozdělení Nechť X e náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládeme, že neznáme tvar distribuční funkce (nevíme aké má rozdělení) a neznáme parametr ϑ. Na základě měření (pokusů) chceme odhadnou typ rozdělení a neznámý parametr ϑ. Provedeme n pokusů (n měření). Výsledky těchto pokusů sou popsány náhodným výběrem X ( X1,, X n ) a eho realizací. x ( x 1,, x n ) Opět předpokládáme, že složky náhodného vektoru sou nezávislé a maí stené rozdělení ako náhodná proměnná X.
Testování hypotéz o rozdělení Při testování hypotéz o rozdělení si zvolíme rozdělení s kterým chceme porovnat naměřená data. Pokud rozdělení obsahue neznámý parametr, pro eho odhad použieme statistiky pro bodový odhad: t T x,, x ) Hypotéza e ve tvaru: H: X F(x, ϑ), H A : X F(x, ϑ). Existue více typů testů o rozdělení. - test Chí-kvadrát (Pearsonův test) o rozdělení. - Kolmogorov Smirnov - Anderson - Darling -.. ( 1 n
Testování hypotéz o rozdělení Chi-kvadrát test Chí-kvadrát testem, který e založen na tříděném statistickém souboru.
Testování hypotéz o rozdělení Chi-kvadrát test Předpokládeme, že X e náhodná proměnná, která má distribuční funkci F(x, ϑ). Provedeme n pokusů (n měření). Výsledky těchto pokusů sou popsány náhodným výběrem X ( X1,, X ) a eho realizací x ( x n 1,, x n ). Neznámý parametr ϑ získáme pomocí bodového odhadu. x ( x 1,, x n ) Statistický soubor převedeme na tříděný statistický soubor. Předpokládeme, že sme dostali m tříd a příslušné četnosti f. K těmto četnostem spočítáme teoretické četnosti t. aké by byly četnosti, pokud by náhodná proměnná X měla distribuční funkci F(x, ϑ). Tyto četnosti označíme fˆ Nechť -tá třída e: x, x pak teoretická četnost se spočítá: fˆ n( F( x ) F( x ))
Testování hypotéz o rozdělení Chi-kvadrát test Testovací kritérium: t 1 doplněk kritického oboru: m ( f fˆ fˆ ) 2 W 2 0, 1 t m 1 f fˆ 2 n 2 kde e kvantil Pearsonova rozdělení s k=m - q-1 stupni volnosti. 1 q e počet parametrů, které bylo třeba spočítat pomocí bodového odhadu. Protože se edná o asymptotický test, e potřeba splnit požadavek: fˆ >5. Toho lze dosáhnout vhodným sloučením sousedních tříd.
Testování hypotéz o rozdělení - Kolmogorov Smirnovov Kolmogorov Smirnov srovnání distribuční funkce a empirické distribuční funkce::
Testování hypotéz o rozdělení - Kolmogorov Smirnov X,, X n Nechť e náhodný výběr. Pak empirická distribuční funkce e definovaná vztahem: card{ i, X i x} FEmp ( x) n 1 X,, X n Nechť e náhodný výběr z rozdělení, která má distribuční funkci F(x, ϑ). Parametr ϑ nahradíme eho bodovým odhadem. Označme: D 1 max FEmp ( x( i1) ) F( x( i), ) D max F( x( i), ) FEmp ( x( i) ) i1,.. n i1,.., n x (i) e prvek z uspořádaného statistického souboru (x (1),, x (n) ) ( x 1,, x n - realizace X,, ). 1 X n Pak hypotézu: H: X F(x, ϑ) vzhledem k H A : X F(x, ϑ) nezamítáme, pokud D e menší rovno než kritická hodnota D n (tabulka). D max D, D
Testování hypotéz o rozdělení - Kolmogorov Smirnov Pro velké n: D n ( ) 1 2 ln 2n
Testování hypotéz o rozdělení Q-Q graf Další testy sou založeny na srovnání kvantilů: Vychází se z naměřených dat a ze zvolené a empirické distribuční funkce: 1 x-osa: F F( x i ) xi 1 y-osa: F Emp ( x i ) F Pokud e X spoitá NP, pak pro osu y lze použít: 1 F i / n
Příklad 1: Házíte kostkou. Testování hypotéz o rozdělení 1 padne 19x 2 padne 16x 3 padne 17x 4 padne 27x 5 padne 25x 6 padne 34x Na hladině významnosti 0,05 otestute hypotézu, že se edná o ideální kostku. Příklad 2: Volební strana XYZ si udělal průzkum své volitelnosti. Z 1200 dotázaných by danou stranu volilo 307, 204 e nerozhodnutých a zbytek by stranu nevolil. Na hladině významnosti 0,01 otestute hypotézu, že stanu volí 30% nerozhodnutých e 20% a nevolí stranu 50%.
Testování hypotéz o rozdělení Příklad 3: Při zkoumání nehod na dálnici D1 mezi Brnem a Prahou byly zištěny následuící údae o počtu nehod: Na hladině významnosti 5% otestute hypotézu, že počet nehod nezávisí na úseku dálnice.