Návrhy experimentů v neparametrické regresi

Rozměr: px
Začít zobrazení ze stránky:

Download "Návrhy experimentů v neparametrické regresi"

Transkript

1 Návrhy eperimentů v neparametrické regresi Zdeněk Hlávka Univerzita Karlova v Praze Matematicko-fyzikální fakulta Katedra pravděpodobnosti a matematické statistiky Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

2 Návrhy eperimentů v neparametrické regresi Parametrická (lineární) regrese: problémy při chybné specifikaci regresní funkce. Neparametrická regrese: odhad regresní funkce, odhad nulových bodů (polohy etrémů), ZH: zobecnění pro slabě závislá pozorování. optimální návrhy eperimentů: přehled literatury (odhady regresní funkce), ZH: návrh eperimentu pro odhad nulového bodu. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

3 Historická poznámka Lineární regrese (metoda nejmenších čtverců): Legendre (1805) Nouvelles méthodes pour la détermination des orbites des comètes. Gauss (1809) Theoria motus corporum coelestium in sectionibus conicis solem ambientium. Galton (1886) Regression towards mediocrity in hereditary stature. Journ. Anthrop. Inst. 15, Neparametrická regrese: Nadaraya (1964), Watson (1964), Gasser & Müller (1984), Fan & Gijbels (1996). Nulové body: Müller (1985), Ziegler (2003), Wieczorek & Ziegler (2010). Optimální návrh eperimentu: H.-G. Müller (1984), Faraway (1990), W.G. Müller (1996), Cheng et al (1998), Fedorov et al (1999), Titterington (2001), Biedermann & Dette (2001a,b), Hlávka (2011, 2012). Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

4 Regresní model Parametrická regrese Pozorujeme dvojice (X i, Y i ), i = 1,..., n. Předpokládáme, že Y i = m(x i ) + ε i, kde ε i jsou náhodné chyby (Eε i = 0, Varε i = σ 2, X i a ε i nezávislé), a chceme odhadnout funkci m(.). Parametrická regrese: Nejčastěji se předpokládá, že m(.) je lineární a závisí pouze na několika parametrech (lineární model). Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

5 Parametrická regrese Příklad: simulovaná data Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

6 Parametrická regrese Příklad: simulovaná data Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

7 Parametrická regrese Příklad: simulovaná data Lineární regrese: Ŷi = α + βx i, i = 1,..., n Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

8 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

9 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

10 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

11 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

12 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

13 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

14 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

15 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

16 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

17 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

18 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

19 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

20 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

21 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

22 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

23 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

24 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

25 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

26 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

27 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

28 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

29 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

30 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

31 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

32 Parametrická regrese Příklad: simulovaná data Kubická regrese: Ŷi = α + β 1 X i + β 2 X 2 i + β 3 X 3 i, i = 1,..., n Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

33 Neparametrická regrese Neparametrické regresní modely Fleibilní modely, které nevyžadují předpoklady o tvaru regresní funkce: spliny, jádrové vyhlazování (lokálně konstantní a lokálně polynomické), regresní stromy, neuronové sítě atd. Jádrové odhady navrhli Nadaraya (1964) a Watson (1964): n mh NW i=1 () = K h( X i )Y i n i=1 K h( X i ) = n i=1 K h ( X i ) n j=1 K h( X j ) Y i, kde K h () = K(/h)/h, K(.) je jádrová funkce a h je bandwidth. Nadaraya (1964) On estimating regression, Theory of Probability and its Applications 9, Watson (1964) Smooth regression analysis, Sankyā A 26, Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

34 Neparametrická regrese My se nyní zaměříme na Gasser-Müllerův odhad vhodný pro plánované eperimenty (pevně zvolené i ), ale obdobné výsledky lze odvodit i pro jiné odhady. Gasser-Müllerův odhad m GM h () = n i=1 si s i 1 K h ( u)duy i, kde s i = ( (i) + (i+1) )/2 a K(.) je jádrová funkce řádu (ν, k). Jedná se opět o vážené průměry Y i, protože n i=1 si s i 1 K h ( u)du = K()d = 1. Gasser & Müller (1984) Estimating regression functions and their derivatives by the kernel method, Scand J Statist 11, Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

35 Neparametrická regrese O neparametrické regresi byly napsány desítky monografií. Zajímavý problém: odhad polohy bodů, ve kterých regresní funkce (nebo její derivace) nabývá dané hodnoty. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

36 Odhad nulových bodů Odhadujeme nulový bod, t.j. polohu bodu, ve kterém funkce m(.) protíná osu. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

37 Odhad nulových bodů Odhadujeme nulový bod, t.j. polohu bodu, ve kterém funkce m(.) protíná osu. y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

38 Odhad nulových bodů Odhadujeme nulový bod, t.j. polohu bodu, ve kterém funkce m(.) protíná osu. y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

39 Odhad nulových bodů Odhadujeme nulový bod, t.j. polohu bodu, ve kterém funkce m(.) protíná osu. y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

40 Odhad nulových bodů Odhadujeme nulový bod, t.j. polohu bodu, ve kterém funkce m(.) protíná osu. y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

41 Odhad nulových bodů Neparametrický odhad nulového bodu Neznámý parametr (nulový bod): ξ : m(ξ) = 0 Odhad (empirický nulový bod): ξ n : m GM h (ξ n ) = 0 Vlastnosti ξ n jako odhadu ξ jsou v článku Müller (1985) odvozeny pro iid náhodné chyby. Müller, H.-G. (1985). Kernel estimators of zeros and of location and size of etrema of regression functions, Scand. J. Statist. 12: Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

42 Odhad nulových bodů 1 Regresní funkce m(.) je 3 spojitě diferencovatelná, m (ξ) 0. Jádrová funkce K(.) je diferencovatelná a K (.) je Lipschitzovsky spojitá. 2 lim inf n nh3 n > 0, nh 3 n/ log n, ε i jsou iid, Eε i = 0, E ε 1 r < pro nějaké r > 2 a lim inf n h nn 1 2/r / log n > 0. 3 Eistují l < ξ < u, c > 0 a τ 1 takové, že m(.) je ryze monotónní na intervalu l, u a m(t) > c t ξ τ pro t l, u,. Müller (1985), Theorem 3.1: Předpokládejme 1 3 a že body měření i jsou rovnoměrně rozložené na intervalu (0, 1). Pokud nhn 5 d 2 0, pak ( ) (nh n ) 1/2 (ξ n ξ) D N dm(2) (ξ)b 2 σ 2 V m, (ξ) {m (ξ)} 2, kde B 2 = (1/2) K(s)s 2 ds a V = K 2 (s)ds. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

43 P {( ξ n u 1 α/2 nhn Odhad nulových bodů σ V m (ξ), ξ n + u 1 α/2 σ ) } V nhn m ξ 1 α (ξ) y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

44 Odhad nulových bodů Závislost na bandwidth h n Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

45 Odhad nulových bodů Závislost na bandwidth h n bandwidth = 0.02 y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

46 Odhad nulových bodů Závislost na bandwidth h n bandwidth = 0.04 y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

47 Odhad nulových bodů Závislost na bandwidth h n bandwidth = 0.06 y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

48 Odhad nulových bodů Závislost na bandwidth h n bandwidth = 0.08 y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

49 Odhad nulových bodů Závislost na bandwidth h n bandwidth = 0.10 y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

50 Odhad nulových bodů Závislost na bandwidth h n bandwidth = 0.12 y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

51 Odhad nulových bodů Závislost na bandwidth h n bandwidth = 0.14 y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

52 Odhad nulových bodů Závislost na bandwidth h n bandwidth = 0.16 y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

53 Odhad nulových bodů Závislost na bandwidth h n bandwidth = 0.18 y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

54 Odhad nulových bodů Závislost na bandwidth h n bandwidth = 0.20 y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

55 Odhad nulových bodů Závislost na bandwidth h n bandwidth = 0.22 y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

56 Odhad nulových bodů Závislost na bandwidth h n bandwidth = 0.24 y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

57 Odhad nulových bodů Závislost na bandwidth h n bandwidth = 0.26 y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

58 Odhad nulových bodů Závislost na bandwidth h n bandwidth = 0.28 y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

59 Odhad nulových bodů Závislost na bandwidth h n bandwidth = 0.30 y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

60 Odhad nulových bodů Optimální bandwidth Teoreticky: asymptoticky optimální bandwidth plyne z porovnání vychýlení (rostoucí funkce h n ) a rozptylu (klesající funkce h n ): konstantní bandwidth h n = O(n 1/(2k+1) ), lokální bandwidth h n () [1/{nf X ()}] 1/(2k+1), kde f X () je hustota měření, lokální bandwidth v heteroskedastickém modelu h n () [σ 2 ()/{nf X ()}] 1/(2k+1). V prai se bandwidth často volí až po ukončení eperimentu (křížové ověřování). Jaká je ale optimální hustota měření f X (.)? Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

61 Optimální návrh eperimentu Optimální návrhy eperimentů pro odhad m(.) Obvyklé kritérium kvality odhadu: MSE (střední čtvercová chyba). Přehledový článek: Titterington (2001) V literatuře jsou popsány dva různé přístupy: Minimalizace IMSE (integrovaná MSE): Müller (1984), Faraway (1990), Cheng, Hall & Titterington (1998), Biedermann & Dette (2001a,b) Klasický přístup (kritéria optimality): W. G. Müller (1996), Fedorov, Montepiedra & Nachtsheim (1999) Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

62 Optimální návrh eperimentu Optimální návrhy eperimentů (minimalizace AIMSE) H.-G. Müller (1984). Optimal designs for nonparametric kernel regression, Statistics & Probability Letters 2, [ ] Var{m GM ()} = σ2 K 2 (s)ds{f X ()} 1 + o(1) nh n Je-li h(.) kladná a spojitá pravděpodobnostní hustota na 0, 1, pak f X () = h()1/2 h(u) 1/2 du h()1/2 minimalizuje: AIMSE = E {m GM () m()} 2 dh(). Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

63 Optimální návrh eperimentu Návrhy eperimentů pro odhad nulového bodu V prai často můžeme získat alespoň přibližnou apriorní informaci o poloze nulového bodu (nebo maima) díky: pilotní studii, epertním znalostem a literatuře. Naše očekávání (apriorní informaci) lze vyjádřit pomocí apriorní hustoty a(.) neznámého parametru ξ. Další postup: závislost rozptylu ξ n na hustotě měření (i pro slabě závislá měření) a odvození optimální hustoty měření f X (.). Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

64 Optimální návrh eperimentu Vlastnosti empirického nulového bodu Zobecnění článku Müller (1985) pro nerovnoměrně rozložené body měření a pro slabě závislé náhodné chyby (motivace: situace, ve kterých po sobě následující měření mohou být závislá). Nástroje: CLV pro nestacionární slabě závislé náhodné veličiny (Peligrad, 1996) a Hoeffdingova nerovnost pro strongly miing posloupnosti náhodných veličin (Roussas, 1996). V heteroskedastickém modelu se slabě závislými náhodnými chybami je ξ n asymptoticky normální a Var ξ n. = σ 2 (ξ)v nh 2ν+1 n {m (ν+1) (ξ)} 2 f X (ξ). Délka konfidenčního intervalu je přímo úměrná σ(ξ)/{f X (ξ)} 1/2. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

65 Optimální návrh eperimentu Optimální návrh eperimentu V homoskedastickém modelu (σ 2 (.) σ 2 ) lze optimální návrh eperimentu vyjádřit ve tvaru: f X (.) aropt (.). Konstantní bandwidth: r opt (MSE) = 1/2 minimalizuje očekávaný rozptyl Var(ξ n ξ)a(ξ)dξ, r opt (MAD) = 2/3 minimalizuje očekávanou délku konfidenčního intervalu. Lokální bandwidth: r opt (MSE) = (2k + 1)/(4k 2ν + 1) minimalizuje očekávaný rozptyl, r opt (MAD) = (2k + 1)/(3k ν + 1) minimalizuje očekávanou délku konfidenčního intervalu. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

66 Optimální návrh eperimentu Optimální návrh eperimentu V heteroskedastickém modelu s konstantní bandwidth je optimální návrh eperimentu: f X (.) {σ2 (.)a(.)} 1/2 pro očekávaný rozptyl, f X (.) {σ(.)a(.)}2/3 pro očekávanou délku konfidenčního intervalu. Pro lokální bandwidth: f X (.) {σ2 (.)} (2k 2ν)/(4k 2ν+1) {a(.)} (2k+1)/(4k 2ν+1) minimalizuje očekávaný rozptyl, f X (.) {σ(.)}(2k 2ν)/(3k ν+1) {a(.)} (2k+1)/(3k 2ν+1) minimalizuje očekávanou délku konfidenčního intervalu. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

67 Simulace Simulace 1 Apriorní rozdělení ξ: a(ξ) = N(0.4, ). 2 Regresní funkce: m() = {( ) 2 (ξ ) 2 }/( ). 3 Hustota měření f X () a r (), r 0, 1. 4 Lokální bandwidth h f () = bf 1/5 (), b 0.005, 0.5. a() Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

68 y Simulace Simulace 1 Apriorní rozdělení ξ: a(ξ) = N(0.4, ). 2 Regresní funkce: m() = {( ) 2 (ξ ) 2 }/( ). 3 Hustota měření f X () a r (), r 0, 1. 4 Lokální bandwidth h f () = bf 1/5 (), b 0.005, 0.5. r = Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

69 y Simulace Simulace 1 Apriorní rozdělení ξ: a(ξ) = N(0.4, ). 2 Regresní funkce: m() = {( ) 2 (ξ ) 2 }/( ). 3 Hustota měření f X () a r (), r 0, 1. 4 Lokální bandwidth h f () = bf 1/5 (), b 0.005, 0.5. r = Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

70 y Simulace Simulace 1 Apriorní rozdělení ξ: a(ξ) = N(0.4, ). 2 Regresní funkce: m() = {( ) 2 (ξ ) 2 }/( ). 3 Hustota měření f X () a r (), r 0, 1. 4 Lokální bandwidth h f () = bf 1/5 (), b 0.005, 0.5. r = Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

71 y Simulace Simulace 1 Apriorní rozdělení ξ: a(ξ) = N(0.4, ). 2 Regresní funkce: m() = {( ) 2 (ξ ) 2 }/( ). 3 Hustota měření f X () a r (), r 0, 1. 4 Lokální bandwidth h f () = bf 1/5 (), b 0.005, 0.5. r = Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

72 y Simulace Simulace 1 Apriorní rozdělení ξ: a(ξ) = N(0.4, ). 2 Regresní funkce: m() = {( ) 2 (ξ ) 2 }/( ). 3 Hustota měření f X () a r (), r 0, 1. 4 Lokální bandwidth h f () = bf 1/5 (), b 0.005, 0.5. r = Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

73 y Simulace Simulace 1 Apriorní rozdělení ξ: a(ξ) = N(0.4, ). 2 Regresní funkce: m() = {( ) 2 (ξ ) 2 }/( ). 3 Hustota měření f X () a r (), r 0, 1. 4 Lokální bandwidth h f () = bf 1/5 (), b 0.005, 0.5. r = Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

74 y Simulace Simulace 1 Apriorní rozdělení ξ: a(ξ) = N(0.4, ). 2 Regresní funkce: m() = {( ) 2 (ξ ) 2 }/( ). 3 Hustota měření f X () a r (), r 0, 1. 4 Lokální bandwidth h f () = bf 1/5 (), b 0.005, 0.5. r = Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

75 y Simulace Simulace 1 Apriorní rozdělení ξ: a(ξ) = N(0.4, ). 2 Regresní funkce: m() = {( ) 2 (ξ ) 2 }/( ). 3 Hustota měření f X () a r (), r 0, 1. 4 Lokální bandwidth h f () = bf 1/5 (), b 0.005, 0.5. r = Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

76 y Simulace Simulace 1 Apriorní rozdělení ξ: a(ξ) = N(0.4, ). 2 Regresní funkce: m() = {( ) 2 (ξ ) 2 }/( ). 3 Hustota měření f X () a r (), r 0, 1. 4 Lokální bandwidth h f () = bf 1/5 (), b 0.005, 0.5. r = Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

77 y Simulace Simulace 1 Apriorní rozdělení ξ: a(ξ) = N(0.4, ). 2 Regresní funkce: m() = {( ) 2 (ξ ) 2 }/( ). 3 Hustota měření f X () a r (), r 0, 1. 4 Lokální bandwidth h f () = bf 1/5 (), b 0.005, 0.5. r = Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

78 y Simulace Simulace 1 Apriorní rozdělení ξ: a(ξ) = N(0.4, ). 2 Regresní funkce: m() = {( ) 2 (ξ ) 2 }/( ). 3 Hustota měření f X () a r (), r 0, 1. 4 Lokální bandwidth h f () = bf 1/5 (), b 0.005, 0.5. r = Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

79 Simulace Simulační studie Vyhodnocení: MSE (Mean Squared Error), optimální hodnota r opt (MSE), MAD (Mean Absolute Deviation), optimální hodnota r opt (MAD) jako funkce parametru bandwidth b a hustoty pozorování r. Teoreticky optimální hodnota r pro homoskedastická data a lokální bandwidth: m(.) m (.) r opt (MSE) 5/9. = /11. = 0.63 r opt (MAD) 5/7. = /9. = 0.78 Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

80 e 04 6e Simulace Simulace: lokální bandwidth, n = 800, σ = e 04 MSE (optimal value. = 0.55) r log(mse) b r Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

81 Simulace Simulace: lokální bandwidth, n = 800, σ = MAD (optimal value. = 0.71) r log(mad) b r Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

82 Shrnutí Závěr Odvození asymptotické normality ξ n i pro slabě závislá pozorování. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

83 Shrnutí Závěr Odvození asymptotické normality ξ n i pro slabě závislá pozorování. Nový přístup k navrhování eperimentů v neparametrické regresi (AIMSE optimální návrhy eperimentů jsou MSE optimální i pro odhad nulového bodu). Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

84 Shrnutí Závěr Odvození asymptotické normality ξ n i pro slabě závislá pozorování. Nový přístup k navrhování eperimentů v neparametrické regresi (AIMSE optimální návrhy eperimentů jsou MSE optimální i pro odhad nulového bodu). Další výzkum: lokálně polynomické modely a modely s více vysvětlujícími pozorování (motivace: závislost GHBC na čase od diagnózy, věku a pohlaví, spolupráce Z. Šumník, 2. LF). Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

85 Shrnutí Závěr Odvození asymptotické normality ξ n i pro slabě závislá pozorování. Nový přístup k navrhování eperimentů v neparametrické regresi (AIMSE optimální návrhy eperimentů jsou MSE optimální i pro odhad nulového bodu). Další výzkum: lokálně polynomické modely a modely s více vysvětlujícími pozorování (motivace: závislost GHBC na čase od diagnózy, věku a pohlaví, spolupráce Z. Šumník, 2. LF). Dále: neparametrické regresní odhady pro korelovaná data s omezeními (aplikace na ceny opcí, spolupráce W. Härdle: JoE, CSDA) a ověřování předpokladů ( ověřování stability modelu v čase, spolupráce S. Meintanis, C. Kirch, M. Hušková: JMVA, TEST, CSDA). Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

86 Shrnutí Závěr Odvození asymptotické normality ξ n i pro slabě závislá pozorování. Nový přístup k navrhování eperimentů v neparametrické regresi (AIMSE optimální návrhy eperimentů jsou MSE optimální i pro odhad nulového bodu). Další výzkum: lokálně polynomické modely a modely s více vysvětlujícími pozorování (motivace: závislost GHBC na čase od diagnózy, věku a pohlaví, spolupráce Z. Šumník, 2. LF). Dále: neparametrické regresní odhady pro korelovaná data s omezeními (aplikace na ceny opcí, spolupráce W. Härdle: JoE, CSDA) a ověřování předpokladů ( ověřování stability modelu v čase, spolupráce S. Meintanis, C. Kirch, M. Hušková: JMVA, TEST, CSDA). DĚKUJI ZA POZORNOST Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25

Ústav matematiky a statistiky Masarykova univerzita Brno. workshopy Finanční matematika v praxi III Matematické modely a aplikace Podlesí

Ústav matematiky a statistiky Masarykova univerzita Brno. workshopy Finanční matematika v praxi III Matematické modely a aplikace Podlesí Ústav matematiky a statistiky Masarykova univerzita Brno workshopy Finanční matematika v praxi III Matematické modely a aplikace Podlesí 3. 6. září 2013 Obsah 1 2 3 4 y Motivace y 10 0 10 20 30 40 0 5

Více

AVDAT Nelineární regresní model

AVDAT Nelineární regresní model AVDAT Nelineární regresní model Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Nelineární regresní model Ey i = f (x i, β) kde x i je k-členný vektor vysvětlujících proměnných

Více

Odhady Parametrů Lineární Regrese

Odhady Parametrů Lineární Regrese Odhady Parametrů Lineární Regrese Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké

Více

BAYESOVSKÉ ODHADY. Michal Friesl V NĚKTERÝCH MODELECH. Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni

BAYESOVSKÉ ODHADY. Michal Friesl V NĚKTERÝCH MODELECH. Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni BAYESOVSKÉ ODHADY V NĚKTERÝCH MODELECH Michal Friesl Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni Slunce Řidiči IQ Regrese Přežití Obvyklý model Pozorování X = (X 1,..., X

Více

AVDAT Klasický lineární model, metoda nejmenších

AVDAT Klasický lineární model, metoda nejmenších AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,

Více

Testy dobré shody pro časové řady s diskrétními veličinami

Testy dobré shody pro časové řady s diskrétními veličinami Testy dobré shody pro časové řady s diskrétními veličinami Šárka Hudecová, Marie Hušková a Simos G. Meintanis KPMS MFF UK Robust 2016 Testy dobré shody pro časové řady s diskrétními veličinami Šárka Hudecová

Více

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie LS 2014/15 Cvičení 10: Heteroskedasticita LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Heteroskedasticita - teorie Druhý

Více

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

Charakterizace rozdělení

Charakterizace rozdělení Charakterizace rozdělení Momenty f(x) f(x) f(x) μ >μ 1 σ 1 σ >σ 1 g 1 g σ μ 1 μ x μ x x N K MK = x f( x) dx 1 M K = x N CK = ( x M ) f( x) dx ( xi M 1 C = 1 K 1) N i= 1 K i K N i= 1 K μ = E ( X ) = xf

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

Strukturální regresní modely. určitý nadhled nad rozličnými typy modelů

Strukturální regresní modely. určitý nadhled nad rozličnými typy modelů Strukturální regresní modely určitý nadhled nad rozličnými typy modelů Jde zlepšit odhad k-nn? Odhad k-nn konverguje pro slušné k očekávané hodnotě. ALE POMALU! Jiné přístupy přidají předpoklad o funkci

Více

Metoda backward výběru proměnných v lineární regresi a její vlastnosti

Metoda backward výběru proměnných v lineární regresi a její vlastnosti Metoda backward výběru proměnných v lineární regresi a její vlastnosti Aktuárský seminář, 13. dubna 2018 Milan Bašta 1 / 30 1 Metody výběru proměnných do modelu 2 Monte Carlo simulace, backward metoda

Více

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Pravděpodobnost a učení Doc. RNDr. Iveta Mrázová,

Více

Lineární a logistická regrese

Lineární a logistická regrese Lineární a logistická regrese Martin Branda Univerzita Karlova v Praze Matematicko-fyzikální fakulta Katedra pravděpodobnosti a matematické statistiky Výpočetní prostředky finanční a pojistné matematiky

Více

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

Matematické modelování Náhled do ekonometrie. Lukáš Frýd Matematické modelování Náhled do ekonometrie Lukáš Frýd Výnos akcie vs. Výnos celého trhu - CAPM model r it = r ft + β 1. (r mt r ft ) r it r ft = α 0 + β 1. (r mt r ft ) + ε it Ekonomický (finanční model)

Více

Intervalové Odhady Parametrů

Intervalové Odhady Parametrů Parametrů Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení technické v Praze

Více

PRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady

PRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady PRAVDĚPODOBNOST A STATISTIKA Bayesovské odhady Bayesovské odhady - úvod Klasický bayesovský přístup: Klasický přístup je založen na opakování pokusech sledujeme rekvenci nastoupení zvolených jevů Bayesovský

Více

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin Příklady k procvičení z Matematické statistiky Poslední úprava. listopadu 207. Konvergence posloupnosti náhodných veličin. Necht X, X 2... jsou nezávislé veličiny s rovnoměrným rozdělením na [0, ]. Definujme

Více

Rozdělení náhodné veličiny. Distribuční funkce. Vlastnosti distribuční funkce

Rozdělení náhodné veličiny. Distribuční funkce. Vlastnosti distribuční funkce Náhodná veličina motivace Náhodná veličina Často lze výsledek náhodného pokusu vyjádřit číslem: číslo, které padlo na kostce, výška náhodně vybraného studenta, čas strávený čekáním na metro, délka života

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Náhodný výběr Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

AVDAT Mnohorozměrné metody, metody klasifikace

AVDAT Mnohorozměrné metody, metody klasifikace AVDAT Mnohorozměrné metody, metody klasifikace Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Mnohorozměrné metody Regrese jedna náhodná veličina je vysvětlována pomocí jiných

Více

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel Regresní analýza Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Regresní analýza 1 / 23

Více

ACTA UNIVERSITATIS AGRICULTURAE ET SILVICULTURAE MENDELIANAE BRUNENSIS SBORNÍK MENDELOVY ZEMĚDĚLSKÉ A LESNICKÉ UNIVERZITY V BRNĚ

ACTA UNIVERSITATIS AGRICULTURAE ET SILVICULTURAE MENDELIANAE BRUNENSIS SBORNÍK MENDELOVY ZEMĚDĚLSKÉ A LESNICKÉ UNIVERZITY V BRNĚ ACTA UNIVERSITATIS AGRICULTURAE ET SILVICULTURAE MENDELIANAE BRUNENSIS SBORNÍK MENDELOVY ZEMĚDĚLSKÉ A LESNICKÉ UNIVERZITY V BRNĚ Ročník LII 6 Číslo 3, 2004 Gasser-Müllerův odhad J. Poměnková Došlo: 8.

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

Prostorová variabilita

Prostorová variabilita Prostorová variabilita prostorová závislost (autokorelace) reprezentuje korelaci mezi hodnotami určité náhodné proměnné v místě i a hodnotami téže proměnné v jiném místě j; prostorová heterogenita je strukturální

Více

odpovídá jedna a jen jedna hodnota jiných

odpovídá jedna a jen jedna hodnota jiných 8. Regresní a korelační analýza Problém: hledání, zkoumání a hodnocení souvislostí, závislostí mezi dvěma a více statistickými znaky (veličinami). Typy závislostí: pevné a volné Pevná závislost každé hodnotě

Více

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK. ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz PŘEHLED TESTŮ rozdělení normální spojité alternativní / diskrétní

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK Základy ekonometrie Odhad klasického lineárního regresního modelu II Cvičení 3 Zuzana Dlouhá Klasický lineární regresní model - zadání příkladu Soubor: CV3_PR.xls Data: y = maloobchodní obrat potřeb

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y β ε Matice n,k je matice realizací. Předpoklad: n > k, h() k - tj. matice je plné hodnosti

Více

Bodové a intervalové odhady parametrů v regresním modelu

Bodové a intervalové odhady parametrů v regresním modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model Mějme lineární regresní model (LRM) Y = Xβ + e, kde y 1 e 1 β y 2 Y =., e

Více

5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I 5EN306 Aplikované kvantitativní metody I Přednáška 5 Zuzana Dlouhá Předmět a struktura kurzu 1. Úvod: struktura empirických výzkumů 2. Tvorba ekonomických modelů: teorie 3. Data: zdroje a typy dat, význam

Více

STATISTICKÉ ODHADY Odhady populačních charakteristik

STATISTICKÉ ODHADY Odhady populačních charakteristik STATISTICKÉ ODHADY Odhady populačních charakteristik Jak stanovit charakteristiky rozložení sledované veličiny v základní populaci? Populaci většinou nemáme celou k dispozici, musíme se spokojit jen s

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOS A SAISIKA Regresní analýza - motivace Základní úlohou regresní analýzy je nalezení vhodného modelu studované závislosti. Je nutné věnovat velkou pozornost tomu aby byla modelována REÁLNÁ

Více

Regresní analýza. Eva Jarošová

Regresní analýza. Eva Jarošová Regresní analýza Eva Jarošová 1 Obsah 1. Regresní přímka 2. Možnosti zlepšení modelu 3. Testy v regresním modelu 4. Regresní diagnostika 5. Speciální využití Lineární model 2 1. Regresní přímka 3 nosnost

Více

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Zpracování dat v edukačních vědách - Testování hypotéz Kamila Fačevicová Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Obsah seminářů 5.11. Úvod do matematické

Více

7. Analýza rozptylu.

7. Analýza rozptylu. 7. Analýza rozptylu. Uvedeme obecnou ideu, která je založena na minimalizaci chyby metodou nejmenších čtverců. Nejdříve uvedeme několik základních tvrzení. Uvažujeme náhodný vektor Y = (Y, Y,..., Y n a

Více

Intervalová data a výpočet některých statistik

Intervalová data a výpočet některých statistik Intervalová data a výpočet některých statistik Milan Hladík 1 Michal Černý 2 1 Katedra aplikované matematiky Matematicko-fyzikální fakulta Univerzita Karlova 2 Katedra ekonometrie Fakulta informatiky a

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

MÍRY ZÁVISLOSTI (KORELACE A REGRESE) zhanel@fsps.muni.cz MÍRY ZÁVISLOSTI (KORELACE A REGRESE) 2.5 MÍRY ZÁVISLOSTI 2.5.1 ZÁVISLOST PEVNÁ, VOLNÁ, STATISTICKÁ A KORELAČNÍ Jednorozměrné soubory - charakterizovány jednotlivými statistickými znaky

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y Xβ ε Předpoklady: Matice X X n,k je matice realizací. Předpoklad: n > k, h(x) k - tj. matice

Více

Inovace bakalářského studijního oboru Aplikovaná chemie

Inovace bakalářského studijního oboru Aplikovaná chemie http://aplchem.upol.cz CZ.1.07/2.2.00/15.0247 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Regrese Závislostproměnných funkční y= f(x) regresní y= f(x)

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie LS 2014/15 Cvičení 7: Autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Autokorelace - teorie Zopakujte si G-M

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

LWS při heteroskedasticitě

LWS při heteroskedasticitě Stochastické modelování v ekonomii a financích Petr Jonáš 7. prosince 2009 Obsah 1 2 3 4 5 47 1 Předpoklad 1: Y i = X i β 0 + e i i = 1,..., n. (X i, e i) je posloupnost nezávislých nestejně rozdělených

Více

Chyby měření 210DPSM

Chyby měření 210DPSM Chyby měření 210DPSM Jan Zatloukal Stručný přehled Zdroje a druhy chyb Systematické chyby měření Náhodné chyby měření Spojité a diskrétní náhodné veličiny Normální rozdělení a jeho vlastnosti Odhad parametrů

Více

Zákony hromadění chyb.

Zákony hromadění chyb. Zákony hromadění chyb. Zákon hromadění skutečných chyb. Zákon hromadění středních chyb. Tomáš Bayer bayertom@natur.cuni.cz Přírodovědecká fakulta Univerzity Karlovy v Praze, Katedra aplikované geoinformatiky

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK11 Základy ekonometrie Autokorelace Cvičení 5 Zuzana Dlouhá Gauss-Markovy předpoklady Náhodná složka: Gauss-Markovy předpoklady 1. E(u) = náhodné vlivy se vzájemně vynulují. E(uu T ) = σ I n konečný

Více

Generování pseudonáhodných. Ing. Michal Dorda, Ph.D.

Generování pseudonáhodných. Ing. Michal Dorda, Ph.D. Generování pseudonáhodných čísel při simulaci Ing. Michal Dorda, Ph.D. 1 Úvodní poznámky V simulačních modelech se velice často vyskytují náhodné proměnné. Proto se budeme zabývat otázkou, jak při simulaci

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz POPISNÉ STATISTIKY - OPAKOVÁNÍ jedna kvalitativní

Více

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D. Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost

Více

Základní statistické modely Statistické vyhodnocování exp. dat M. Čada ~ cada

Základní statistické modely Statistické vyhodnocování exp. dat M. Čada   ~ cada Základní statistické modely 1 Statistika Matematická statistika se zabývá interpretací získaných náhodných dat. Snažíme se přiřadit statistickému souboru vhodnou distribuční funkci a najít základní číselné

Více

Pravděpodobnost a matematická statistika

Pravděpodobnost a matematická statistika Pravděpodobnost a matematická statistika Příklady k přijímacím zkouškám na doktorské studium 1 Popisná statistika Určete aritmetický průměr dat, zadaných tabulkou hodnot x i a četností n i x i 1 2 3 n

Více

5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I 5EN306 Aplikované kvantitativní metody I Přednáška 3 Zuzana Dlouhá Předmět a struktura kurzu 1. Úvod: struktura empirických výzkumů 2. Tvorba ekonomických modelů: teorie 3. Data: zdroje a typy dat, význam

Více

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných

Více

Statistika (KMI/PSTAT)

Statistika (KMI/PSTAT) Statistika (KMI/PSTAT) Cvičení dvanácté aneb Regrese a korelace Statistika (KMI/PSTAT) 1 / 18 V souboru 25 jedinců jsme měřili jejich výšku a hmotnost. Výsledky jsou v tabulce a grafu. Statistika (KMI/PSTAT)

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie ZS 2015/16 Cvičení 7: Časově řady, autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Časové řady Data: HDP.wf1

Více

18AEK Aplikovaná ekonometrie a teorie časových řad. Řešení domácích úkolů č. 1 a 2 příklad 1

18AEK Aplikovaná ekonometrie a teorie časových řad. Řešení domácích úkolů č. 1 a 2 příklad 1 18AEK Aplikovaná ekonometrie a teorie časových řad Řešení domácích úkolů č. 1 a 2 příklad 1 Obecné pravidlo pro všechny testy Je stanovena nulová hypotéza: H 0 Je stanovena alternativní hypotéza: H A Je

Více

12. cvičení z PST. 20. prosince 2017

12. cvičení z PST. 20. prosince 2017 1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie LS 2014/15 Cvičení 4: Statistické vlastnosti MNČ LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE Upřesnění k pojmům a značení

Více

ODHADY VARIABILITY POSLOUPNOSTÍ

ODHADY VARIABILITY POSLOUPNOSTÍ ÚVOD MÍRY VARIABILITY, ODHADY VLASTNOSTI FF SEGMENTACE ZÁZNAMU MINIMALIZACE MSE SNÍŽENÍ ROZPTYLU ODHADY VARIABILITY POSLOUPNOSTÍ NEURONOVÝCH IMPULSŮ Kamil Rajdl Úsav maemaiky a saisiky Přírodovědecká fakula

Více

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup Statistika Testování hypotéz statistická indukce Úvod do problému Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 21. února 2012 Statistika by Birom

Více

6. Lineární regresní modely

6. Lineární regresní modely 6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu

Více

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013 Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika Podrobnější rozpis okruhů otázek pro třetí část SZZ Verze: 13. června 2013 1 Úvodní poznámky 6 Smyslem SZZ by nemělo být toliko

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

Kontingenční tabulky, korelační koeficienty

Kontingenční tabulky, korelační koeficienty Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Budeme předpokládat, že X a Y jsou kvalitativní náhodné veličiny, obor hodnot X obsahuje r hodnot (kategorií,

Více

13.1. Úvod Cílem regresní analýzy je popsat závislost hodnot znaku Y na hodnotách

13.1. Úvod Cílem regresní analýzy je popsat závislost hodnot znaku Y na hodnotách 13 Regrese 13.1. Úvod Cílem regresní analýzy je popsat závislost hodnot znaku Y na hodnotách znaku X. Přitom je třeba vyřešit jednak volbu funkcí k vystižení dané závislosti a dále stanovení konkrétních

Více

AVDAT Geometrie metody nejmenších čtverců

AVDAT Geometrie metody nejmenších čtverců AVDAT Geometrie metody nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model klasický lineární regresní model odhad parametrů MNČ y = Xβ + ε, ε

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 8. KAPITOLA STATISTICKÉ TESTOVÁNÍ HYPOTÉZ 22.11.2016 Opakování: CLV příklad 1 Zadání: Před volbami je v populaci státu 52 % příznivců

Více

Klasická a robustní ortogonální regrese mezi složkami kompozice

Klasická a robustní ortogonální regrese mezi složkami kompozice Klasická a robustní ortogonální regrese mezi složkami kompozice K. Hrůzová, V. Todorov, K. Hron, P. Filzmoser 13. září 2016 Kompoziční data kladná reálná čísla nesoucí pouze relativní informaci, x = (x

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN Rovnoměrné rozdělení R(a,b) rozdělení s konstantní hustotou pravděpodobnosti v intervalu (a,b) f( x) distribuční funkce 0 x a F( x) a x b b a 1 x b b 1 a x a a x b

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 4. Teoretická rozdělení Mgr. David Fiedor 9. března 2015 Osnova Úvod 1 Úvod 2 3 4 5 Vybraná rozdělení náhodných proměnných normální rozdělení normované normální rozdělení

Více

EKONOMICKÁ APLIKACE KOMPOZIČNÍHO REGRESNÍHO MODELU

EKONOMICKÁ APLIKACE KOMPOZIČNÍHO REGRESNÍHO MODELU EKONOMICKÁ APLIKACE KOMPOZIČNÍHO REGRESNÍHO MODELU Klára Hrůzová 1,2, Karel Hron 1,2 1 Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, Univerzita Palackého v Olomouci 2 Katedra

Více

u Pacova Metoda pro validaci koncentrace přízemního ozónu kontinuálně měřené na Atmosférické 1 / 23sta

u Pacova Metoda pro validaci koncentrace přízemního ozónu kontinuálně měřené na Atmosférické 1 / 23sta koncentrace přízemního ozónu kontinuálně měřené na Atmosférické stanici Křešín u Pacova Metoda pro validaci koncentrace přízemního ozónu kontinuálně měřené na Atmosférické 1 / 23sta Obsah Měření Kvalita

Více

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,

Více

populace soubor jednotek, o jejichž vlastnostech bychom chtěli vypovídat letní semestr Definice subjektech.

populace soubor jednotek, o jejichž vlastnostech bychom chtěli vypovídat letní semestr Definice subjektech. Populace a Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 1 populace soubor jednotek, o jejichž vlastnostech bychom

Více

Testování změn v binárnách autoregresních modelech Šárka Hudecová 1/ 36

Testování změn v binárnách autoregresních modelech Šárka Hudecová 1/ 36 Testování změn v binárnách autoregresních modelech Šárka Hudecová KPMS MFF UK ROBUST 2012 Němčičky 9. 14.9.2012 Testování změn v binárnách autoregresních modelech Šárka Hudecová 1/ 36 Uvažovaná situace

Více

Náhodné (statistické) chyby přímých měření

Náhodné (statistické) chyby přímých měření Náhodné (statistické) chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně

Více

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně Testování hypotéz Nechť,, je náhodný výběr z nějakého rozdělení s neznámými parametry. Máme dvě navzájem si odporující hypotézy o parametrech daného rozdělení: Nulová hypotéza parametry (případně jediný

Více

Teorie náhodných matic aneb tak trochu jiná statistika

Teorie náhodných matic aneb tak trochu jiná statistika Teorie náhodných matic aneb tak trochu jiná statistika B. Vlková 1, M.Berg 2, B. Martínek 3, O. Švec 4, M. Neumann 5 Gymnázium Uničov 1, Gymnázium Václava Hraběte Hořovice 2, Mendelovo gymnázium Opava

Více

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová VYBRANÉ DVOUVÝBĚROVÉ TESTY Martina Litschmannová Obsah přednášky Vybrané dvouvýběrové testy par. hypotéz test o shodě rozptylů (F-test), testy o shodě středních hodnot (t-test, Aspinové-Welchův test),

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin EuroMISE Centrum I. ÚVOD vv této přednášce budeme hovořit o jednovýběrových a dvouvýběrových testech týkajících se střední hodnoty

Více

Náhodné chyby přímých měření

Náhodné chyby přímých měření Náhodné chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně pravděpodobná.

Více

Mgr. Rudolf Blažek, Ph.D. prof. RNDr. Roman Kotecký Dr.Sc.

Mgr. Rudolf Blažek, Ph.D. prof. RNDr. Roman Kotecký Dr.Sc. Náhodné veličiny III Mgr. Rudolf Blažek, Ph.D. prof. RNDr. Roman Kotecký Dr.Sc. Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení technické v Praze c Rudolf Blažek, Roman

Více

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457. 0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti

Více

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal Základy navrhování průmyslových experimentů DOE II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal! Testování statistických hypotéz kvalitativní odezva kvantitativní chí-kvadrát test homogenity,

Více

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33 1 / 33 Méně než minimum ze statistiky Michaela Šedová KPMS MFF UK Principy medicíny založené na důkazech a základy vědecké přípravy Příklad Studie syndromu náhodného úmrtí dětí. Dvě skupiny: Děti, které

Více

Výběrové charakteristiky a jejich rozdělení

Výběrové charakteristiky a jejich rozdělení Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový

Více