Návrhy experimentů v neparametrické regresi
|
|
- Vladimíra Slavíková
- před 5 lety
- Počet zobrazení:
Transkript
1 Návrhy eperimentů v neparametrické regresi Zdeněk Hlávka Univerzita Karlova v Praze Matematicko-fyzikální fakulta Katedra pravděpodobnosti a matematické statistiky Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
2 Návrhy eperimentů v neparametrické regresi Parametrická (lineární) regrese: problémy při chybné specifikaci regresní funkce. Neparametrická regrese: odhad regresní funkce, odhad nulových bodů (polohy etrémů), ZH: zobecnění pro slabě závislá pozorování. optimální návrhy eperimentů: přehled literatury (odhady regresní funkce), ZH: návrh eperimentu pro odhad nulového bodu. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
3 Historická poznámka Lineární regrese (metoda nejmenších čtverců): Legendre (1805) Nouvelles méthodes pour la détermination des orbites des comètes. Gauss (1809) Theoria motus corporum coelestium in sectionibus conicis solem ambientium. Galton (1886) Regression towards mediocrity in hereditary stature. Journ. Anthrop. Inst. 15, Neparametrická regrese: Nadaraya (1964), Watson (1964), Gasser & Müller (1984), Fan & Gijbels (1996). Nulové body: Müller (1985), Ziegler (2003), Wieczorek & Ziegler (2010). Optimální návrh eperimentu: H.-G. Müller (1984), Faraway (1990), W.G. Müller (1996), Cheng et al (1998), Fedorov et al (1999), Titterington (2001), Biedermann & Dette (2001a,b), Hlávka (2011, 2012). Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
4 Regresní model Parametrická regrese Pozorujeme dvojice (X i, Y i ), i = 1,..., n. Předpokládáme, že Y i = m(x i ) + ε i, kde ε i jsou náhodné chyby (Eε i = 0, Varε i = σ 2, X i a ε i nezávislé), a chceme odhadnout funkci m(.). Parametrická regrese: Nejčastěji se předpokládá, že m(.) je lineární a závisí pouze na několika parametrech (lineární model). Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
5 Parametrická regrese Příklad: simulovaná data Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
6 Parametrická regrese Příklad: simulovaná data Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
7 Parametrická regrese Příklad: simulovaná data Lineární regrese: Ŷi = α + βx i, i = 1,..., n Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
8 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
9 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
10 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
11 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
12 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
13 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
14 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
15 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
16 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
17 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
18 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
19 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
20 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
21 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
22 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
23 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
24 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
25 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
26 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
27 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
28 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
29 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
30 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
31 Parametrická regrese Příklad: simulovaná data Kvadratická regrese: Ŷi = α + β 1 X i + β 2 X 2 i, i = 1,..., n Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
32 Parametrická regrese Příklad: simulovaná data Kubická regrese: Ŷi = α + β 1 X i + β 2 X 2 i + β 3 X 3 i, i = 1,..., n Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
33 Neparametrická regrese Neparametrické regresní modely Fleibilní modely, které nevyžadují předpoklady o tvaru regresní funkce: spliny, jádrové vyhlazování (lokálně konstantní a lokálně polynomické), regresní stromy, neuronové sítě atd. Jádrové odhady navrhli Nadaraya (1964) a Watson (1964): n mh NW i=1 () = K h( X i )Y i n i=1 K h( X i ) = n i=1 K h ( X i ) n j=1 K h( X j ) Y i, kde K h () = K(/h)/h, K(.) je jádrová funkce a h je bandwidth. Nadaraya (1964) On estimating regression, Theory of Probability and its Applications 9, Watson (1964) Smooth regression analysis, Sankyā A 26, Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
34 Neparametrická regrese My se nyní zaměříme na Gasser-Müllerův odhad vhodný pro plánované eperimenty (pevně zvolené i ), ale obdobné výsledky lze odvodit i pro jiné odhady. Gasser-Müllerův odhad m GM h () = n i=1 si s i 1 K h ( u)duy i, kde s i = ( (i) + (i+1) )/2 a K(.) je jádrová funkce řádu (ν, k). Jedná se opět o vážené průměry Y i, protože n i=1 si s i 1 K h ( u)du = K()d = 1. Gasser & Müller (1984) Estimating regression functions and their derivatives by the kernel method, Scand J Statist 11, Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
35 Neparametrická regrese O neparametrické regresi byly napsány desítky monografií. Zajímavý problém: odhad polohy bodů, ve kterých regresní funkce (nebo její derivace) nabývá dané hodnoty. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
36 Odhad nulových bodů Odhadujeme nulový bod, t.j. polohu bodu, ve kterém funkce m(.) protíná osu. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
37 Odhad nulových bodů Odhadujeme nulový bod, t.j. polohu bodu, ve kterém funkce m(.) protíná osu. y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
38 Odhad nulových bodů Odhadujeme nulový bod, t.j. polohu bodu, ve kterém funkce m(.) protíná osu. y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
39 Odhad nulových bodů Odhadujeme nulový bod, t.j. polohu bodu, ve kterém funkce m(.) protíná osu. y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
40 Odhad nulových bodů Odhadujeme nulový bod, t.j. polohu bodu, ve kterém funkce m(.) protíná osu. y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
41 Odhad nulových bodů Neparametrický odhad nulového bodu Neznámý parametr (nulový bod): ξ : m(ξ) = 0 Odhad (empirický nulový bod): ξ n : m GM h (ξ n ) = 0 Vlastnosti ξ n jako odhadu ξ jsou v článku Müller (1985) odvozeny pro iid náhodné chyby. Müller, H.-G. (1985). Kernel estimators of zeros and of location and size of etrema of regression functions, Scand. J. Statist. 12: Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
42 Odhad nulových bodů 1 Regresní funkce m(.) je 3 spojitě diferencovatelná, m (ξ) 0. Jádrová funkce K(.) je diferencovatelná a K (.) je Lipschitzovsky spojitá. 2 lim inf n nh3 n > 0, nh 3 n/ log n, ε i jsou iid, Eε i = 0, E ε 1 r < pro nějaké r > 2 a lim inf n h nn 1 2/r / log n > 0. 3 Eistují l < ξ < u, c > 0 a τ 1 takové, že m(.) je ryze monotónní na intervalu l, u a m(t) > c t ξ τ pro t l, u,. Müller (1985), Theorem 3.1: Předpokládejme 1 3 a že body měření i jsou rovnoměrně rozložené na intervalu (0, 1). Pokud nhn 5 d 2 0, pak ( ) (nh n ) 1/2 (ξ n ξ) D N dm(2) (ξ)b 2 σ 2 V m, (ξ) {m (ξ)} 2, kde B 2 = (1/2) K(s)s 2 ds a V = K 2 (s)ds. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
43 P {( ξ n u 1 α/2 nhn Odhad nulových bodů σ V m (ξ), ξ n + u 1 α/2 σ ) } V nhn m ξ 1 α (ξ) y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
44 Odhad nulových bodů Závislost na bandwidth h n Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
45 Odhad nulových bodů Závislost na bandwidth h n bandwidth = 0.02 y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
46 Odhad nulových bodů Závislost na bandwidth h n bandwidth = 0.04 y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
47 Odhad nulových bodů Závislost na bandwidth h n bandwidth = 0.06 y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
48 Odhad nulových bodů Závislost na bandwidth h n bandwidth = 0.08 y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
49 Odhad nulových bodů Závislost na bandwidth h n bandwidth = 0.10 y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
50 Odhad nulových bodů Závislost na bandwidth h n bandwidth = 0.12 y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
51 Odhad nulových bodů Závislost na bandwidth h n bandwidth = 0.14 y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
52 Odhad nulových bodů Závislost na bandwidth h n bandwidth = 0.16 y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
53 Odhad nulových bodů Závislost na bandwidth h n bandwidth = 0.18 y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
54 Odhad nulových bodů Závislost na bandwidth h n bandwidth = 0.20 y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
55 Odhad nulových bodů Závislost na bandwidth h n bandwidth = 0.22 y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
56 Odhad nulových bodů Závislost na bandwidth h n bandwidth = 0.24 y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
57 Odhad nulových bodů Závislost na bandwidth h n bandwidth = 0.26 y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
58 Odhad nulových bodů Závislost na bandwidth h n bandwidth = 0.28 y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
59 Odhad nulových bodů Závislost na bandwidth h n bandwidth = 0.30 y Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
60 Odhad nulových bodů Optimální bandwidth Teoreticky: asymptoticky optimální bandwidth plyne z porovnání vychýlení (rostoucí funkce h n ) a rozptylu (klesající funkce h n ): konstantní bandwidth h n = O(n 1/(2k+1) ), lokální bandwidth h n () [1/{nf X ()}] 1/(2k+1), kde f X () je hustota měření, lokální bandwidth v heteroskedastickém modelu h n () [σ 2 ()/{nf X ()}] 1/(2k+1). V prai se bandwidth často volí až po ukončení eperimentu (křížové ověřování). Jaká je ale optimální hustota měření f X (.)? Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
61 Optimální návrh eperimentu Optimální návrhy eperimentů pro odhad m(.) Obvyklé kritérium kvality odhadu: MSE (střední čtvercová chyba). Přehledový článek: Titterington (2001) V literatuře jsou popsány dva různé přístupy: Minimalizace IMSE (integrovaná MSE): Müller (1984), Faraway (1990), Cheng, Hall & Titterington (1998), Biedermann & Dette (2001a,b) Klasický přístup (kritéria optimality): W. G. Müller (1996), Fedorov, Montepiedra & Nachtsheim (1999) Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
62 Optimální návrh eperimentu Optimální návrhy eperimentů (minimalizace AIMSE) H.-G. Müller (1984). Optimal designs for nonparametric kernel regression, Statistics & Probability Letters 2, [ ] Var{m GM ()} = σ2 K 2 (s)ds{f X ()} 1 + o(1) nh n Je-li h(.) kladná a spojitá pravděpodobnostní hustota na 0, 1, pak f X () = h()1/2 h(u) 1/2 du h()1/2 minimalizuje: AIMSE = E {m GM () m()} 2 dh(). Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
63 Optimální návrh eperimentu Návrhy eperimentů pro odhad nulového bodu V prai často můžeme získat alespoň přibližnou apriorní informaci o poloze nulového bodu (nebo maima) díky: pilotní studii, epertním znalostem a literatuře. Naše očekávání (apriorní informaci) lze vyjádřit pomocí apriorní hustoty a(.) neznámého parametru ξ. Další postup: závislost rozptylu ξ n na hustotě měření (i pro slabě závislá měření) a odvození optimální hustoty měření f X (.). Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
64 Optimální návrh eperimentu Vlastnosti empirického nulového bodu Zobecnění článku Müller (1985) pro nerovnoměrně rozložené body měření a pro slabě závislé náhodné chyby (motivace: situace, ve kterých po sobě následující měření mohou být závislá). Nástroje: CLV pro nestacionární slabě závislé náhodné veličiny (Peligrad, 1996) a Hoeffdingova nerovnost pro strongly miing posloupnosti náhodných veličin (Roussas, 1996). V heteroskedastickém modelu se slabě závislými náhodnými chybami je ξ n asymptoticky normální a Var ξ n. = σ 2 (ξ)v nh 2ν+1 n {m (ν+1) (ξ)} 2 f X (ξ). Délka konfidenčního intervalu je přímo úměrná σ(ξ)/{f X (ξ)} 1/2. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
65 Optimální návrh eperimentu Optimální návrh eperimentu V homoskedastickém modelu (σ 2 (.) σ 2 ) lze optimální návrh eperimentu vyjádřit ve tvaru: f X (.) aropt (.). Konstantní bandwidth: r opt (MSE) = 1/2 minimalizuje očekávaný rozptyl Var(ξ n ξ)a(ξ)dξ, r opt (MAD) = 2/3 minimalizuje očekávanou délku konfidenčního intervalu. Lokální bandwidth: r opt (MSE) = (2k + 1)/(4k 2ν + 1) minimalizuje očekávaný rozptyl, r opt (MAD) = (2k + 1)/(3k ν + 1) minimalizuje očekávanou délku konfidenčního intervalu. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
66 Optimální návrh eperimentu Optimální návrh eperimentu V heteroskedastickém modelu s konstantní bandwidth je optimální návrh eperimentu: f X (.) {σ2 (.)a(.)} 1/2 pro očekávaný rozptyl, f X (.) {σ(.)a(.)}2/3 pro očekávanou délku konfidenčního intervalu. Pro lokální bandwidth: f X (.) {σ2 (.)} (2k 2ν)/(4k 2ν+1) {a(.)} (2k+1)/(4k 2ν+1) minimalizuje očekávaný rozptyl, f X (.) {σ(.)}(2k 2ν)/(3k ν+1) {a(.)} (2k+1)/(3k 2ν+1) minimalizuje očekávanou délku konfidenčního intervalu. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
67 Simulace Simulace 1 Apriorní rozdělení ξ: a(ξ) = N(0.4, ). 2 Regresní funkce: m() = {( ) 2 (ξ ) 2 }/( ). 3 Hustota měření f X () a r (), r 0, 1. 4 Lokální bandwidth h f () = bf 1/5 (), b 0.005, 0.5. a() Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
68 y Simulace Simulace 1 Apriorní rozdělení ξ: a(ξ) = N(0.4, ). 2 Regresní funkce: m() = {( ) 2 (ξ ) 2 }/( ). 3 Hustota měření f X () a r (), r 0, 1. 4 Lokální bandwidth h f () = bf 1/5 (), b 0.005, 0.5. r = Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
69 y Simulace Simulace 1 Apriorní rozdělení ξ: a(ξ) = N(0.4, ). 2 Regresní funkce: m() = {( ) 2 (ξ ) 2 }/( ). 3 Hustota měření f X () a r (), r 0, 1. 4 Lokální bandwidth h f () = bf 1/5 (), b 0.005, 0.5. r = Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
70 y Simulace Simulace 1 Apriorní rozdělení ξ: a(ξ) = N(0.4, ). 2 Regresní funkce: m() = {( ) 2 (ξ ) 2 }/( ). 3 Hustota měření f X () a r (), r 0, 1. 4 Lokální bandwidth h f () = bf 1/5 (), b 0.005, 0.5. r = Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
71 y Simulace Simulace 1 Apriorní rozdělení ξ: a(ξ) = N(0.4, ). 2 Regresní funkce: m() = {( ) 2 (ξ ) 2 }/( ). 3 Hustota měření f X () a r (), r 0, 1. 4 Lokální bandwidth h f () = bf 1/5 (), b 0.005, 0.5. r = Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
72 y Simulace Simulace 1 Apriorní rozdělení ξ: a(ξ) = N(0.4, ). 2 Regresní funkce: m() = {( ) 2 (ξ ) 2 }/( ). 3 Hustota měření f X () a r (), r 0, 1. 4 Lokální bandwidth h f () = bf 1/5 (), b 0.005, 0.5. r = Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
73 y Simulace Simulace 1 Apriorní rozdělení ξ: a(ξ) = N(0.4, ). 2 Regresní funkce: m() = {( ) 2 (ξ ) 2 }/( ). 3 Hustota měření f X () a r (), r 0, 1. 4 Lokální bandwidth h f () = bf 1/5 (), b 0.005, 0.5. r = Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
74 y Simulace Simulace 1 Apriorní rozdělení ξ: a(ξ) = N(0.4, ). 2 Regresní funkce: m() = {( ) 2 (ξ ) 2 }/( ). 3 Hustota měření f X () a r (), r 0, 1. 4 Lokální bandwidth h f () = bf 1/5 (), b 0.005, 0.5. r = Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
75 y Simulace Simulace 1 Apriorní rozdělení ξ: a(ξ) = N(0.4, ). 2 Regresní funkce: m() = {( ) 2 (ξ ) 2 }/( ). 3 Hustota měření f X () a r (), r 0, 1. 4 Lokální bandwidth h f () = bf 1/5 (), b 0.005, 0.5. r = Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
76 y Simulace Simulace 1 Apriorní rozdělení ξ: a(ξ) = N(0.4, ). 2 Regresní funkce: m() = {( ) 2 (ξ ) 2 }/( ). 3 Hustota měření f X () a r (), r 0, 1. 4 Lokální bandwidth h f () = bf 1/5 (), b 0.005, 0.5. r = Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
77 y Simulace Simulace 1 Apriorní rozdělení ξ: a(ξ) = N(0.4, ). 2 Regresní funkce: m() = {( ) 2 (ξ ) 2 }/( ). 3 Hustota měření f X () a r (), r 0, 1. 4 Lokální bandwidth h f () = bf 1/5 (), b 0.005, 0.5. r = Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
78 y Simulace Simulace 1 Apriorní rozdělení ξ: a(ξ) = N(0.4, ). 2 Regresní funkce: m() = {( ) 2 (ξ ) 2 }/( ). 3 Hustota měření f X () a r (), r 0, 1. 4 Lokální bandwidth h f () = bf 1/5 (), b 0.005, 0.5. r = Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
79 Simulace Simulační studie Vyhodnocení: MSE (Mean Squared Error), optimální hodnota r opt (MSE), MAD (Mean Absolute Deviation), optimální hodnota r opt (MAD) jako funkce parametru bandwidth b a hustoty pozorování r. Teoreticky optimální hodnota r pro homoskedastická data a lokální bandwidth: m(.) m (.) r opt (MSE) 5/9. = /11. = 0.63 r opt (MAD) 5/7. = /9. = 0.78 Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
80 e 04 6e Simulace Simulace: lokální bandwidth, n = 800, σ = e 04 MSE (optimal value. = 0.55) r log(mse) b r Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
81 Simulace Simulace: lokální bandwidth, n = 800, σ = MAD (optimal value. = 0.71) r log(mad) b r Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
82 Shrnutí Závěr Odvození asymptotické normality ξ n i pro slabě závislá pozorování. Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
83 Shrnutí Závěr Odvození asymptotické normality ξ n i pro slabě závislá pozorování. Nový přístup k navrhování eperimentů v neparametrické regresi (AIMSE optimální návrhy eperimentů jsou MSE optimální i pro odhad nulového bodu). Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
84 Shrnutí Závěr Odvození asymptotické normality ξ n i pro slabě závislá pozorování. Nový přístup k navrhování eperimentů v neparametrické regresi (AIMSE optimální návrhy eperimentů jsou MSE optimální i pro odhad nulového bodu). Další výzkum: lokálně polynomické modely a modely s více vysvětlujícími pozorování (motivace: závislost GHBC na čase od diagnózy, věku a pohlaví, spolupráce Z. Šumník, 2. LF). Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
85 Shrnutí Závěr Odvození asymptotické normality ξ n i pro slabě závislá pozorování. Nový přístup k navrhování eperimentů v neparametrické regresi (AIMSE optimální návrhy eperimentů jsou MSE optimální i pro odhad nulového bodu). Další výzkum: lokálně polynomické modely a modely s více vysvětlujícími pozorování (motivace: závislost GHBC na čase od diagnózy, věku a pohlaví, spolupráce Z. Šumník, 2. LF). Dále: neparametrické regresní odhady pro korelovaná data s omezeními (aplikace na ceny opcí, spolupráce W. Härdle: JoE, CSDA) a ověřování předpokladů ( ověřování stability modelu v čase, spolupráce S. Meintanis, C. Kirch, M. Hušková: JMVA, TEST, CSDA). Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
86 Shrnutí Závěr Odvození asymptotické normality ξ n i pro slabě závislá pozorování. Nový přístup k navrhování eperimentů v neparametrické regresi (AIMSE optimální návrhy eperimentů jsou MSE optimální i pro odhad nulového bodu). Další výzkum: lokálně polynomické modely a modely s více vysvětlujícími pozorování (motivace: závislost GHBC na čase od diagnózy, věku a pohlaví, spolupráce Z. Šumník, 2. LF). Dále: neparametrické regresní odhady pro korelovaná data s omezeními (aplikace na ceny opcí, spolupráce W. Härdle: JoE, CSDA) a ověřování předpokladů ( ověřování stability modelu v čase, spolupráce S. Meintanis, C. Kirch, M. Hušková: JMVA, TEST, CSDA). DĚKUJI ZA POZORNOST Zdeněk Hlávka (KPMS MFF UK) Neparametrická regrese / 25
Ústav matematiky a statistiky Masarykova univerzita Brno. workshopy Finanční matematika v praxi III Matematické modely a aplikace Podlesí
Ústav matematiky a statistiky Masarykova univerzita Brno workshopy Finanční matematika v praxi III Matematické modely a aplikace Podlesí 3. 6. září 2013 Obsah 1 2 3 4 y Motivace y 10 0 10 20 30 40 0 5
VíceAVDAT Nelineární regresní model
AVDAT Nelineární regresní model Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Nelineární regresní model Ey i = f (x i, β) kde x i je k-členný vektor vysvětlujících proměnných
VíceOdhady Parametrů Lineární Regrese
Odhady Parametrů Lineární Regrese Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké
VíceBAYESOVSKÉ ODHADY. Michal Friesl V NĚKTERÝCH MODELECH. Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni
BAYESOVSKÉ ODHADY V NĚKTERÝCH MODELECH Michal Friesl Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni Slunce Řidiči IQ Regrese Přežití Obvyklý model Pozorování X = (X 1,..., X
VíceAVDAT Klasický lineární model, metoda nejmenších
AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i
VíceTestování hypotéz o parametrech regresního modelu
Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO
VíceTestování hypotéz o parametrech regresního modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,
VíceTesty dobré shody pro časové řady s diskrétními veličinami
Testy dobré shody pro časové řady s diskrétními veličinami Šárka Hudecová, Marie Hušková a Simos G. Meintanis KPMS MFF UK Robust 2016 Testy dobré shody pro časové řady s diskrétními veličinami Šárka Hudecová
VíceZáklady biostatistiky II. Veřejné zdravotnictví 3.LF UK - II
Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické
Více4EK211 Základy ekonometrie
4EK211 Základy ekonometrie LS 2014/15 Cvičení 10: Heteroskedasticita LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Heteroskedasticita - teorie Druhý
VíceStatistika. Regresní a korelační analýza Úvod do problému. Roman Biskup
Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009
Více1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou
VíceCharakterizace rozdělení
Charakterizace rozdělení Momenty f(x) f(x) f(x) μ >μ 1 σ 1 σ >σ 1 g 1 g σ μ 1 μ x μ x x N K MK = x f( x) dx 1 M K = x N CK = ( x M ) f( x) dx ( xi M 1 C = 1 K 1) N i= 1 K i K N i= 1 K μ = E ( X ) = xf
VíceOdhad parametrů N(µ, σ 2 )
Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný
VíceStrukturální regresní modely. určitý nadhled nad rozličnými typy modelů
Strukturální regresní modely určitý nadhled nad rozličnými typy modelů Jde zlepšit odhad k-nn? Odhad k-nn konverguje pro slušné k očekávané hodnotě. ALE POMALU! Jiné přístupy přidají předpoklad o funkci
VíceMetoda backward výběru proměnných v lineární regresi a její vlastnosti
Metoda backward výběru proměnných v lineární regresi a její vlastnosti Aktuárský seminář, 13. dubna 2018 Milan Bašta 1 / 30 1 Metody výběru proměnných do modelu 2 Monte Carlo simulace, backward metoda
VíceDobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze
Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Pravděpodobnost a učení Doc. RNDr. Iveta Mrázová,
VíceLineární a logistická regrese
Lineární a logistická regrese Martin Branda Univerzita Karlova v Praze Matematicko-fyzikální fakulta Katedra pravděpodobnosti a matematické statistiky Výpočetní prostředky finanční a pojistné matematiky
VíceMatematické modelování Náhled do ekonometrie. Lukáš Frýd
Matematické modelování Náhled do ekonometrie Lukáš Frýd Výnos akcie vs. Výnos celého trhu - CAPM model r it = r ft + β 1. (r mt r ft ) r it r ft = α 0 + β 1. (r mt r ft ) + ε it Ekonomický (finanční model)
VíceIntervalové Odhady Parametrů
Parametrů Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení technické v Praze
VícePRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady
PRAVDĚPODOBNOST A STATISTIKA Bayesovské odhady Bayesovské odhady - úvod Klasický bayesovský přístup: Klasický přístup je založen na opakování pokusech sledujeme rekvenci nastoupení zvolených jevů Bayesovský
Vícez Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin
Příklady k procvičení z Matematické statistiky Poslední úprava. listopadu 207. Konvergence posloupnosti náhodných veličin. Necht X, X 2... jsou nezávislé veličiny s rovnoměrným rozdělením na [0, ]. Definujme
VíceRozdělení náhodné veličiny. Distribuční funkce. Vlastnosti distribuční funkce
Náhodná veličina motivace Náhodná veličina Často lze výsledek náhodného pokusu vyjádřit číslem: číslo, které padlo na kostce, výška náhodně vybraného studenta, čas strávený čekáním na metro, délka života
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Náhodný výběr Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr
VíceAVDAT Mnohorozměrné metody, metody klasifikace
AVDAT Mnohorozměrné metody, metody klasifikace Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Mnohorozměrné metody Regrese jedna náhodná veličina je vysvětlována pomocí jiných
VíceRegresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel
Regresní analýza Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Regresní analýza 1 / 23
VíceACTA UNIVERSITATIS AGRICULTURAE ET SILVICULTURAE MENDELIANAE BRUNENSIS SBORNÍK MENDELOVY ZEMĚDĚLSKÉ A LESNICKÉ UNIVERZITY V BRNĚ
ACTA UNIVERSITATIS AGRICULTURAE ET SILVICULTURAE MENDELIANAE BRUNENSIS SBORNÍK MENDELOVY ZEMĚDĚLSKÉ A LESNICKÉ UNIVERZITY V BRNĚ Ročník LII 6 Číslo 3, 2004 Gasser-Müllerův odhad J. Poměnková Došlo: 8.
VíceIntervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
VíceProstorová variabilita
Prostorová variabilita prostorová závislost (autokorelace) reprezentuje korelaci mezi hodnotami určité náhodné proměnné v místě i a hodnotami téže proměnné v jiném místě j; prostorová heterogenita je strukturální
Víceodpovídá jedna a jen jedna hodnota jiných
8. Regresní a korelační analýza Problém: hledání, zkoumání a hodnocení souvislostí, závislostí mezi dvěma a více statistickými znaky (veličinami). Typy závislostí: pevné a volné Pevná závislost každé hodnotě
VíceANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.
ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz PŘEHLED TESTŮ rozdělení normální spojité alternativní / diskrétní
VíceIntervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
Více4EK211 Základy ekonometrie
4EK Základy ekonometrie Odhad klasického lineárního regresního modelu II Cvičení 3 Zuzana Dlouhá Klasický lineární regresní model - zadání příkladu Soubor: CV3_PR.xls Data: y = maloobchodní obrat potřeb
VíceOdhad parametrů N(µ, σ 2 )
Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y β ε Matice n,k je matice realizací. Předpoklad: n > k, h() k - tj. matice je plné hodnosti
VíceBodové a intervalové odhady parametrů v regresním modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model Mějme lineární regresní model (LRM) Y = Xβ + e, kde y 1 e 1 β y 2 Y =., e
Více5EN306 Aplikované kvantitativní metody I
5EN306 Aplikované kvantitativní metody I Přednáška 5 Zuzana Dlouhá Předmět a struktura kurzu 1. Úvod: struktura empirických výzkumů 2. Tvorba ekonomických modelů: teorie 3. Data: zdroje a typy dat, význam
VíceSTATISTICKÉ ODHADY Odhady populačních charakteristik
STATISTICKÉ ODHADY Odhady populačních charakteristik Jak stanovit charakteristiky rozložení sledované veličiny v základní populaci? Populaci většinou nemáme celou k dispozici, musíme se spokojit jen s
VíceTomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOS A SAISIKA Regresní analýza - motivace Základní úlohou regresní analýzy je nalezení vhodného modelu studované závislosti. Je nutné věnovat velkou pozornost tomu aby byla modelována REÁLNÁ
VíceRegresní analýza. Eva Jarošová
Regresní analýza Eva Jarošová 1 Obsah 1. Regresní přímka 2. Možnosti zlepšení modelu 3. Testy v regresním modelu 4. Regresní diagnostika 5. Speciální využití Lineární model 2 1. Regresní přímka 3 nosnost
VíceKatedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci
Zpracování dat v edukačních vědách - Testování hypotéz Kamila Fačevicová Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Obsah seminářů 5.11. Úvod do matematické
Více7. Analýza rozptylu.
7. Analýza rozptylu. Uvedeme obecnou ideu, která je založena na minimalizaci chyby metodou nejmenších čtverců. Nejdříve uvedeme několik základních tvrzení. Uvažujeme náhodný vektor Y = (Y, Y,..., Y n a
VíceIntervalová data a výpočet některých statistik
Intervalová data a výpočet některých statistik Milan Hladík 1 Michal Černý 2 1 Katedra aplikované matematiky Matematicko-fyzikální fakulta Univerzita Karlova 2 Katedra ekonometrie Fakulta informatiky a
Více15. T e s t o v á n í h y p o t é z
15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VíceNormální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký
VíceMÍRY ZÁVISLOSTI (KORELACE A REGRESE)
zhanel@fsps.muni.cz MÍRY ZÁVISLOSTI (KORELACE A REGRESE) 2.5 MÍRY ZÁVISLOSTI 2.5.1 ZÁVISLOST PEVNÁ, VOLNÁ, STATISTICKÁ A KORELAČNÍ Jednorozměrné soubory - charakterizovány jednotlivými statistickými znaky
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y Xβ ε Předpoklady: Matice X X n,k je matice realizací. Předpoklad: n > k, h(x) k - tj. matice
VíceInovace bakalářského studijního oboru Aplikovaná chemie
http://aplchem.upol.cz CZ.1.07/2.2.00/15.0247 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Regrese Závislostproměnných funkční y= f(x) regresní y= f(x)
Více4EK211 Základy ekonometrie
4EK211 Základy ekonometrie LS 2014/15 Cvičení 7: Autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Autokorelace - teorie Zopakujte si G-M
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
VíceLWS při heteroskedasticitě
Stochastické modelování v ekonomii a financích Petr Jonáš 7. prosince 2009 Obsah 1 2 3 4 5 47 1 Předpoklad 1: Y i = X i β 0 + e i i = 1,..., n. (X i, e i) je posloupnost nezávislých nestejně rozdělených
VíceChyby měření 210DPSM
Chyby měření 210DPSM Jan Zatloukal Stručný přehled Zdroje a druhy chyb Systematické chyby měření Náhodné chyby měření Spojité a diskrétní náhodné veličiny Normální rozdělení a jeho vlastnosti Odhad parametrů
VíceZákony hromadění chyb.
Zákony hromadění chyb. Zákon hromadění skutečných chyb. Zákon hromadění středních chyb. Tomáš Bayer bayertom@natur.cuni.cz Přírodovědecká fakulta Univerzity Karlovy v Praze, Katedra aplikované geoinformatiky
Více4EK211 Základy ekonometrie
4EK11 Základy ekonometrie Autokorelace Cvičení 5 Zuzana Dlouhá Gauss-Markovy předpoklady Náhodná složka: Gauss-Markovy předpoklady 1. E(u) = náhodné vlivy se vzájemně vynulují. E(uu T ) = σ I n konečný
VíceGenerování pseudonáhodných. Ing. Michal Dorda, Ph.D.
Generování pseudonáhodných čísel při simulaci Ing. Michal Dorda, Ph.D. 1 Úvodní poznámky V simulačních modelech se velice často vyskytují náhodné proměnné. Proto se budeme zabývat otázkou, jak při simulaci
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VíceANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK
ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz POPISNÉ STATISTIKY - OPAKOVÁNÍ jedna kvalitativní
VíceÚvod do teorie odhadu. Ing. Michael Rost, Ph.D.
Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost
VíceZákladní statistické modely Statistické vyhodnocování exp. dat M. Čada ~ cada
Základní statistické modely 1 Statistika Matematická statistika se zabývá interpretací získaných náhodných dat. Snažíme se přiřadit statistickému souboru vhodnou distribuční funkci a najít základní číselné
VícePravděpodobnost a matematická statistika
Pravděpodobnost a matematická statistika Příklady k přijímacím zkouškám na doktorské studium 1 Popisná statistika Určete aritmetický průměr dat, zadaných tabulkou hodnot x i a četností n i x i 1 2 3 n
Více5EN306 Aplikované kvantitativní metody I
5EN306 Aplikované kvantitativní metody I Přednáška 3 Zuzana Dlouhá Předmět a struktura kurzu 1. Úvod: struktura empirických výzkumů 2. Tvorba ekonomických modelů: teorie 3. Data: zdroje a typy dat, význam
VíceRNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných
VíceStatistika (KMI/PSTAT)
Statistika (KMI/PSTAT) Cvičení dvanácté aneb Regrese a korelace Statistika (KMI/PSTAT) 1 / 18 V souboru 25 jedinců jsme měřili jejich výšku a hmotnost. Výsledky jsou v tabulce a grafu. Statistika (KMI/PSTAT)
Více4EK211 Základy ekonometrie
4EK211 Základy ekonometrie ZS 2015/16 Cvičení 7: Časově řady, autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Časové řady Data: HDP.wf1
Více18AEK Aplikovaná ekonometrie a teorie časových řad. Řešení domácích úkolů č. 1 a 2 příklad 1
18AEK Aplikovaná ekonometrie a teorie časových řad Řešení domácích úkolů č. 1 a 2 příklad 1 Obecné pravidlo pro všechny testy Je stanovena nulová hypotéza: H 0 Je stanovena alternativní hypotéza: H A Je
Více12. cvičení z PST. 20. prosince 2017
1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace
Více4EK211 Základy ekonometrie
4EK211 Základy ekonometrie LS 2014/15 Cvičení 4: Statistické vlastnosti MNČ LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE Upřesnění k pojmům a značení
VíceODHADY VARIABILITY POSLOUPNOSTÍ
ÚVOD MÍRY VARIABILITY, ODHADY VLASTNOSTI FF SEGMENTACE ZÁZNAMU MINIMALIZACE MSE SNÍŽENÍ ROZPTYLU ODHADY VARIABILITY POSLOUPNOSTÍ NEURONOVÝCH IMPULSŮ Kamil Rajdl Úsav maemaiky a saisiky Přírodovědecká fakula
VíceStatistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup
Statistika Testování hypotéz statistická indukce Úvod do problému Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 21. února 2012 Statistika by Birom
Více6. Lineární regresní modely
6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu
VíceBakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013
Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika Podrobnější rozpis okruhů otázek pro třetí část SZZ Verze: 13. června 2013 1 Úvodní poznámky 6 Smyslem SZZ by nemělo být toliko
Více15. T e s t o v á n í h y p o t é z
15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:
VíceKontingenční tabulky, korelační koeficienty
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Budeme předpokládat, že X a Y jsou kvalitativní náhodné veličiny, obor hodnot X obsahuje r hodnot (kategorií,
Více13.1. Úvod Cílem regresní analýzy je popsat závislost hodnot znaku Y na hodnotách
13 Regrese 13.1. Úvod Cílem regresní analýzy je popsat závislost hodnot znaku Y na hodnotách znaku X. Přitom je třeba vyřešit jednak volbu funkcí k vystižení dané závislosti a dále stanovení konkrétních
VíceAVDAT Geometrie metody nejmenších čtverců
AVDAT Geometrie metody nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model klasický lineární regresní model odhad parametrů MNČ y = Xβ + ε, ε
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VícePravděpodobnost a aplikovaná statistika
Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 8. KAPITOLA STATISTICKÉ TESTOVÁNÍ HYPOTÉZ 22.11.2016 Opakování: CLV příklad 1 Zadání: Před volbami je v populaci státu 52 % příznivců
VíceKlasická a robustní ortogonální regrese mezi složkami kompozice
Klasická a robustní ortogonální regrese mezi složkami kompozice K. Hrůzová, V. Todorov, K. Hron, P. Filzmoser 13. září 2016 Kompoziční data kladná reálná čísla nesoucí pouze relativní informaci, x = (x
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
VíceROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN
ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN Rovnoměrné rozdělení R(a,b) rozdělení s konstantní hustotou pravděpodobnosti v intervalu (a,b) f( x) distribuční funkce 0 x a F( x) a x b b a 1 x b b 1 a x a a x b
VíceKGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 4. Teoretická rozdělení Mgr. David Fiedor 9. března 2015 Osnova Úvod 1 Úvod 2 3 4 5 Vybraná rozdělení náhodných proměnných normální rozdělení normované normální rozdělení
VíceEKONOMICKÁ APLIKACE KOMPOZIČNÍHO REGRESNÍHO MODELU
EKONOMICKÁ APLIKACE KOMPOZIČNÍHO REGRESNÍHO MODELU Klára Hrůzová 1,2, Karel Hron 1,2 1 Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, Univerzita Palackého v Olomouci 2 Katedra
Víceu Pacova Metoda pro validaci koncentrace přízemního ozónu kontinuálně měřené na Atmosférické 1 / 23sta
koncentrace přízemního ozónu kontinuálně měřené na Atmosférické stanici Křešín u Pacova Metoda pro validaci koncentrace přízemního ozónu kontinuálně měřené na Atmosférické 1 / 23sta Obsah Měření Kvalita
VíceTestování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,
Vícepopulace soubor jednotek, o jejichž vlastnostech bychom chtěli vypovídat letní semestr Definice subjektech.
Populace a Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 1 populace soubor jednotek, o jejichž vlastnostech bychom
VíceTestování změn v binárnách autoregresních modelech Šárka Hudecová 1/ 36
Testování změn v binárnách autoregresních modelech Šárka Hudecová KPMS MFF UK ROBUST 2012 Němčičky 9. 14.9.2012 Testování změn v binárnách autoregresních modelech Šárka Hudecová 1/ 36 Uvažovaná situace
VíceNáhodné (statistické) chyby přímých měření
Náhodné (statistické) chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně
VíceRozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně
Testování hypotéz Nechť,, je náhodný výběr z nějakého rozdělení s neznámými parametry. Máme dvě navzájem si odporující hypotézy o parametrech daného rozdělení: Nulová hypotéza parametry (případně jediný
VíceTeorie náhodných matic aneb tak trochu jiná statistika
Teorie náhodných matic aneb tak trochu jiná statistika B. Vlková 1, M.Berg 2, B. Martínek 3, O. Švec 4, M. Neumann 5 Gymnázium Uničov 1, Gymnázium Václava Hraběte Hořovice 2, Mendelovo gymnázium Opava
VíceVYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová
VYBRANÉ DVOUVÝBĚROVÉ TESTY Martina Litschmannová Obsah přednášky Vybrané dvouvýběrové testy par. hypotéz test o shodě rozptylů (F-test), testy o shodě středních hodnot (t-test, Aspinové-Welchův test),
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza
VíceParametrické testy hypotéz o středních hodnotách spojitých náhodných veličin
Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin EuroMISE Centrum I. ÚVOD vv této přednášce budeme hovořit o jednovýběrových a dvouvýběrových testech týkajících se střední hodnoty
VíceNáhodné chyby přímých měření
Náhodné chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně pravděpodobná.
VíceMgr. Rudolf Blažek, Ph.D. prof. RNDr. Roman Kotecký Dr.Sc.
Náhodné veličiny III Mgr. Rudolf Blažek, Ph.D. prof. RNDr. Roman Kotecký Dr.Sc. Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení technické v Praze c Rudolf Blažek, Roman
Více10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.
0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti
VíceII. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal
Základy navrhování průmyslových experimentů DOE II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal! Testování statistických hypotéz kvalitativní odezva kvantitativní chí-kvadrát test homogenity,
VíceMe neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33
1 / 33 Méně než minimum ze statistiky Michaela Šedová KPMS MFF UK Principy medicíny založené na důkazech a základy vědecké přípravy Příklad Studie syndromu náhodného úmrtí dětí. Dvě skupiny: Děti, které
VíceVýběrové charakteristiky a jejich rozdělení
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový
Více