Bootstrap - konfidenční intervaly a testy
|
|
- Bohumila Kovářová
- před 7 lety
- Počet zobrazení:
Transkript
1 9. prosince 2008
2 Konfidenční intervaly obecně Máme data X 1...X n F,(iid), kde F neznáme.
3 Konfidenční intervaly obecně Máme data X 1...X n F,(iid), kde F neznáme. Chceme odhadnout θ = t(f), např. t(f) = E F (X)
4 Konfidenční intervaly obecně Máme data X 1...X n F,(iid), kde F neznáme. Chceme odhadnout θ = t(f), např. t(f) = E F (X) Plug-in odhad ˆθ = t(ˆf), kde ˆF je odhad d.f.
5 Konfidenční intervaly obecně Máme data X 1...X n F,(iid), kde F neznáme. Chceme odhadnout θ = t(f), např. t(f) = E F (X) Plug-in odhad ˆθ = t(ˆf), kde ˆF je odhad d.f. Dá se vyjádřit t(ˆf) = s(x), např. X n pro průměr.
6 Konfidenční intervaly obecně Máme data X 1...X n F,(iid), kde F neznáme. Chceme odhadnout θ = t(f), např. t(f) = E F (X) Plug-in odhad ˆθ = t(ˆf), kde ˆF je odhad d.f. Dá se vyjádřit t(ˆf) = s(x), např. X n pro průměr. Hodí se nám se F (ˆθ) = var F (ˆθ)
7 Konfidenční intervaly obecně Máme data X 1...X n F,(iid), kde F neznáme. Chceme odhadnout θ = t(f), např. t(f) = E F (X) Plug-in odhad ˆθ = t(ˆf), kde ˆF je odhad d.f. Dá se vyjádřit t(ˆf) = s(x), např. X n pro průměr. Hodí se nám se F (ˆθ) = var F (ˆθ) Pro N(µ,σ 2 ) máme se(x n ) = var(x n ) = σ/ n
8 Konfidenční intervaly obecně Máme data X 1...X n F,(iid), kde F neznáme. Chceme odhadnout θ = t(f), např. t(f) = E F (X) Plug-in odhad ˆθ = t(ˆf), kde ˆF je odhad d.f. Dá se vyjádřit t(ˆf) = s(x), např. X n pro průměr. Hodí se nám se F (ˆθ) = var F (ˆθ) Pro N(µ,σ 2 ) máme se(x n ) = var(x n ) = σ/ n Odhad se(ˆθ) ˆ = var(ˆθ) ˆ
9 Konfidenční intervaly obecně Máme data X 1...X n F,(iid), kde F neznáme. Chceme odhadnout θ = t(f), např. t(f) = E F (X) Plug-in odhad ˆθ = t(ˆf), kde ˆF je odhad d.f. Dá se vyjádřit t(ˆf) = s(x), např. X n pro průměr. Hodí se nám se F (ˆθ) = var F (ˆθ) Pro N(µ,σ 2 ) máme se(x n ) = var(x n ) = σ/ n Odhad se(ˆθ) ˆ = var(ˆθ) ˆ V normálním případě se(x ˆ 1 n ) = n 1 (Xi X n ) 2 / n
10 Konfidenční intervaly obecně Z CLV dostaneme za určitých předpokladů aproximaci ˆθ θ N(0, 1) se(ˆθ) ˆ
11 Konfidenční intervaly obecně Z CLV dostaneme za určitých předpokladů aproximaci ˆθ θ N(0, 1) se(ˆθ) ˆ popř. ˆθ θ se(ˆθ) ˆ t n 1
12 Konfidenční intervaly obecně Z CLV dostaneme za určitých předpokladů aproximaci ˆθ θ N(0, 1) se(ˆθ) ˆ popř. ˆθ θ se(ˆθ) ˆ t n 1 tedy přibližný konfidenční interval: P F (θ [ˆθ t n 1 (1 α/2) ˆ se(ˆθ), ˆθ t n 1 (α/2) ˆ se(ˆθ)]) =1 α
13 Konfidenční intervaly obecně Z CLV dostaneme za určitých předpokladů aproximaci ˆθ θ N(0, 1) se(ˆθ) ˆ popř. ˆθ θ se(ˆθ) ˆ t n 1 tedy přibližný konfidenční interval: P F (θ [ˆθ t n 1 (1 α/2) ˆ se(ˆθ), ˆθ t n 1 (α/2) ˆ se(ˆθ)]) =1 α Pro odhad střední hodnoty v normálním rozdělení ˆθ = X n jsou konfidenční intervaly přesné
14 Bootstrap-t konfidenční intervaly Chceme odhadnout θ = t(f), řekněmě že můžeme zapsat ˆθ = s(x)
15 Bootstrap-t konfidenční intervaly Chceme odhadnout θ = t(f), řekněmě že můžeme zapsat ˆθ = s(x) Odhadneme F (parametricky jako Fˆϑ nebo jako empirickou d.f. ˆF )
16 Bootstrap-t konfidenční intervaly Chceme odhadnout θ = t(f), řekněmě že můžeme zapsat ˆθ = s(x) Odhadneme F (parametricky jako Fˆϑ nebo jako empirickou d.f. ˆF ) Generujeme bootstrapové výběry x b, b = 1...B
17 Bootstrap-t konfidenční intervaly Chceme odhadnout θ = t(f), řekněmě že můžeme zapsat ˆθ = s(x) Odhadneme F (parametricky jako Fˆϑ nebo jako empirickou d.f. ˆF ) Generujeme bootstrapové výběry x b, b = 1...B Pro každé b = 1...B spočítáme ˆθ (b) = s(x b)
18 Bootstrap-t konfidenční intervaly Chceme odhadnout θ = t(f), řekněmě že můžeme zapsat ˆθ = s(x) Odhadneme F (parametricky jako Fˆϑ nebo jako empirickou d.f. ˆF ) Generujeme bootstrapové výběry x b, b = 1...B Pro každé b = 1...B spočítáme ˆθ (b) = s(x b) a ˆ se (ˆθ (b)) = var ˆ ˆθ (b)
19 Bootstrap-t konfidenční intervaly Vyrobíme studentizované hodnoty Z (b) = ˆθ (b) ˆθ ˆ se (ˆθ (b)) kde ˆθ je odhad z původních dat X 1...X n
20 Bootstrap-t konfidenční intervaly Vyrobíme studentizované hodnoty Z (b) = ˆθ (b) ˆθ ˆ se (ˆθ (b)) kde ˆθ je odhad z původních dat X 1...X n Napočítáme percentily Z (b) #{Z (b) ˆt α }/B = α
21 Bootstrap-t konfidenční intervaly Vyrobíme studentizované hodnoty Z (b) = ˆθ (b) ˆθ ˆ se (ˆθ (b)) kde ˆθ je odhad z původních dat X 1...X n Napočítáme percentily Z (b) #{Z (b) ˆt α }/B = α odtud bootstrap-t konfidenční intervaly (ˆθ ˆt 1 α/2 ˆ se, ˆθ ˆt α/2 ˆ se)
22 Percentilové bootstrapové konfidenční intervaly Vyrobíme bootstrapové výběry x b, b = 1...B pro každé b spočtem ˆθ b = s(x b ) označíme Ĝ empirickou distribuční funkci ˆθ b
23 Percentilové bootstrapové konfidenční intervaly Vyrobíme bootstrapové výběry x b, b = 1...B pro každé b spočtem ˆθ b = s(x b ) označíme Ĝ empirickou distribuční funkci ˆθ b Percentilovým bootstrapovým konfidenčním intervalem o spolehlivosti α pak myslíme (Ĝ 1 (α/2), Ĝ 1 (1 α/2)) kde Ĝ 1 (u) = inf(x : Ĝ(x) u) jsou empirické kvantily v obvyklém smyslu.
24 Příklad - porovnání Máme data o myších - délka dožití po experimentální operaci (Efron, 1993) a chceme odhadnout střední hodnotu X = (10, 27, 31, 40, 46, 50, 52, 104, 146)
25 Příklad - porovnání Máme data o myších - délka dožití po experimentální operaci (Efron, 1993) a chceme odhadnout střední hodnotu X = (10, 27, 31, 40, 46, 50, 52, 104, 146) Ukáže se, že můžeme předpokládat nomalitu na hladině Zkonstruujeme konfidenční intervaly pro hladinu α = 0.05:
26 Příklad - porovnání Máme data o myších - délka dožití po experimentální operaci (Efron, 1993) a chceme odhadnout střední hodnotu X = (10, 27, 31, 40, 46, 50, 52, 104, 146) Ukáže se, že můžeme předpokládat nomalitu na hladině Zkonstruujeme konfidenční intervaly pro hladinu α = 0.05: Přibližný interval (X ± u(α/2)ˆσ/ n): (32.97, 79.48)
27 Příklad - porovnání Máme data o myších - délka dožití po experimentální operaci (Efron, 1993) a chceme odhadnout střední hodnotu X = (10, 27, 31, 40, 46, 50, 52, 104, 146) Ukáže se, že můžeme předpokládat nomalitu na hladině Zkonstruujeme konfidenční intervaly pro hladinu α = 0.05: Přibližný interval (X ± u(α/2)ˆσ/ n): (32.97, 79.48) interval z t-rozdělení (X ± t n 1 (α/2)ˆσ/ n): (23.62, 88.83)
28 Příklad - porovnání Máme data o myších - délka dožití po experimentální operaci (Efron, 1993) a chceme odhadnout střední hodnotu X = (10, 27, 31, 40, 46, 50, 52, 104, 146) Ukáže se, že můžeme předpokládat nomalitu na hladině Zkonstruujeme konfidenční intervaly pro hladinu α = 0.05: Přibližný interval (X ± u(α/2)ˆσ/ n): (32.97, 79.48) interval z t-rozdělení (X ± t n 1 (α/2)ˆσ/ n): (23.62, 88.83) Bootstrap-t interval (X ˆt(α/2)ˆσ/ n, X ˆt(1 α/2)ˆσ/ n) (31.80, )
29 Příklad - porovnání Máme data o myších - délka dožití po experimentální operaci (Efron, 1993) a chceme odhadnout střední hodnotu X = (10, 27, 31, 40, 46, 50, 52, 104, 146) Ukáže se, že můžeme předpokládat nomalitu na hladině Zkonstruujeme konfidenční intervaly pro hladinu α = 0.05: Přibližný interval (X ± u(α/2)ˆσ/ n): (32.97, 79.48) interval z t-rozdělení (X ± t n 1 (α/2)ˆσ/ n): (23.62, 88.83) Bootstrap-t interval (X ˆt(α/2)ˆσ/ n, X ˆt(1 α/2)ˆσ/ n) (31.80, ) Bootstrapový percentilový interval (ˆθ B (α/2), ˆθ B (1 α/2)) (34.21, 85.44)
30 bootstrap-t konfidenční intervaly - transformace Pro střední hodnotu odhadneme se ˆ (b) = ˆσ (b)/ 1 n n = n 1 i=1 (x b i x b) 2 / n snadno, jindy ne tak snadné.
31 bootstrap-t konfidenční intervaly - transformace Pro střední hodnotu odhadneme se ˆ (b) = ˆσ (b)/ 1 n n = n 1 i=1 (x b i x b) 2 / n snadno, jindy ne tak snadné. Potřeba pro každé b vyrobit B 2 bootstrapových výběrů z x b se ˆ (b) = 1 B 2 (ˆθ b1 B 2 1 ˆθ B1) 2 b1=1
32 bootstrap-t konfidenční intervaly - transformace Pro střední hodnotu odhadneme se ˆ (b) = ˆσ (b)/ 1 n n = n 1 i=1 (x b i x b) 2 / n snadno, jindy ne tak snadné. Potřeba pro každé b vyrobit B 2 bootstrapových výběrů z x b se ˆ (b) = 1 B 2 (ˆθ b1 B 2 1 ˆθ B1) 2 b1=1 Ulehčení: transformace stabilizující rozptyl: obecně když máme Y (θ, r(θ) 2 ) a vezmeme takovou monotónní funkci g, že g (θ) = 1 r(θ), bude rozptyl n.veličiny Z = g(y) přibližně konstantní (v θ) (důkaz pomocí delta-metody)
33 bootstrap-t konfidenční intervaly - transformace Použití v bootstrapu: místo θ zkoumáme φ = g(θ)
34 bootstrap-t konfidenční intervaly - transformace Použití v bootstrapu: místo θ zkoumáme φ = g(θ) Algoritmus: generuj x b, b = 1...B 1, vyrob ˆθ (b) generuj B 2 bootstrapových výběrů z kadého x b, b = 1...B 1, vyrob se(ˆθ ˆ (b))
35 bootstrap-t konfidenční intervaly - transformace Použití v bootstrapu: místo θ zkoumáme φ = g(θ) Algoritmus: generuj x b, b = 1...B 1, vyrob ˆθ (b) generuj B 2 bootstrapových výběrů z kadého x b, b = 1...B 1, vyrob se(ˆθ ˆ (b)) z grafu [ˆθ (b), se(ˆθ ˆ (b))] získat r(u) = se(ˆθ θ = u) a funkci g
36 bootstrap-t konfidenční intervaly - transformace Použití v bootstrapu: místo θ zkoumáme φ = g(θ) Algoritmus: generuj x b, b = 1...B 1, vyrob ˆθ (b) generuj B 2 bootstrapových výběrů z kadého x b, b = 1...B 1, vyrob se(ˆθ ˆ (b)) z grafu [ˆθ (b), se(ˆθ ˆ (b))] získat r(u) = se(ˆθ θ = u) a funkci g generuj nové x b, b = 1...B 3 vyrob Z g (b) = ˆφ (b) ˆφ ˆ se(ˆθ (b))
37 bootstrap-t konfidenční intervaly - transformace Použití v bootstrapu: místo θ zkoumáme φ = g(θ) Algoritmus: generuj x b, b = 1...B 1, vyrob ˆθ (b) generuj B 2 bootstrapových výběrů z kadého x b, b = 1...B 1, vyrob se(ˆθ ˆ (b)) z grafu [ˆθ (b), se(ˆθ ˆ (b))] získat r(u) = se(ˆθ θ = u) a funkci g generuj nové x b, b = 1...B 3 vyrob Z g (b) = ˆφ (b) ˆφ ˆ se(ˆθ (b)) z Z g (b) bootstrap-t konfidenční intervaly pro φ
38 bootstrap-t konfidenční intervaly - transformace Použití v bootstrapu: místo θ zkoumáme φ = g(θ) Algoritmus: generuj x b, b = 1...B 1, vyrob ˆθ (b) generuj B 2 bootstrapových výběrů z kadého x b, b = 1...B 1, vyrob se(ˆθ ˆ (b)) z grafu [ˆθ (b), se(ˆθ ˆ (b))] získat r(u) = se(ˆθ θ = u) a funkci g generuj nové x b, b = 1...B 3 vyrob Z g (b) = ˆφ (b) ˆφ ˆ se(ˆθ (b)) z Z g (b) bootstrap-t konfidenční intervaly pro φ konfidenční intervaly pro θ = g 1 (φ)
39 percentilové konfidenční intervaly - transformace Lemma: Předpokládejme, že existuje transformace ˆφ = m(ˆθ), která normalizuje rozdělení ˆθ, tj. ˆφ N(φ, c 2 ). Pak percentilový konfidenční interval založen na ˆθ je shodný s intervalem (m 1 (ˆφ u(1 α/2)c, m 1 (ˆφ u(α/2)c))
40 Dvouvýběrové testy Situace: mějme dva nezávislé výběry: X 1,..., X n F Y 1,..., Y m G
41 Dvouvýběrové testy Situace: mějme dva nezávislé výběry: X 1,..., X n F Y 1,..., Y m G chceme testovat H 0 : F G
42 Permutační test Můžem vzít permutační test s testovou statistikou ˆθ = ˆθ(X, Y):
43 Permutační test Můžem vzít permutační test s testovou statistikou ˆθ = ˆθ(X, Y): seřadíme data do (Z 1,..., Z N ) (N = m + n) vyrobíme vektor Z permutací složek Z je n! možností jak může Z vypadat.
44 Permutační test Můžem vzít permutační test s testovou statistikou ˆθ = ˆθ(X, Y): seřadíme data do (Z 1,..., Z N ) (N = m + n) vyrobíme vektor Z permutací složek Z je n! možností jak může Z vypadat. prvních n prvků Z označme X, zbylých m označíme Y bude ( N n) možností jak může X a Y vypadat za platnosti H 0 jsou všechny stejně pravděpodobné
45 Permutační test Můžem vzít permutační test s testovou statistikou ˆθ = ˆθ(X, Y): seřadíme data do (Z 1,..., Z N ) (N = m + n) vyrobíme vektor Z permutací složek Z je n! možností jak může Z vypadat. prvních n prvků Z označme X, zbylých m označíme Y bude ( N n) možností jak může X a Y vypadat za platnosti H 0 jsou všechny stejně pravděpodobné vyrobme ze složek Z vektory Z (b), b = 1...B spočtem ˆθ (b) = ˆθ(X (b), Y (b))
46 Permutační test Můžem vzít permutační test s testovou statistikou ˆθ = ˆθ(X, Y): seřadíme data do (Z 1,..., Z N ) (N = m + n) vyrobíme vektor Z permutací složek Z je n! možností jak může Z vypadat. prvních n prvků Z označme X, zbylých m označíme Y bude ( N n) možností jak může X a Y vypadat za platnosti H 0 jsou všechny stejně pravděpodobné vyrobme ze složek Z vektory Z (b), b = 1...B spočtem ˆθ (b) = ˆθ(X (b), Y (b)) pval = #(ˆθ (b) ˆθ) B
47 Bootstrapový test F G Použijeme testovou statistiku ˆθ = ˆθ(X, Y): seřadíme data do (Z 1,..., Z N ) (N = m + n)
48 Bootstrapový test F G Použijeme testovou statistiku ˆθ = ˆθ(X, Y): seřadíme data do (Z 1,..., Z N ) (N = m + n) nagenerujem Z (b) = (Z1 (b),..., Z N (b)), b = 1...B ze Z (bootstrap, s opakováním) označme vždy X (b) prvních n prvků Z (b) a Y (b) zbylých m prvků označíme Z (b)
49 Bootstrapový test F G Použijeme testovou statistiku ˆθ = ˆθ(X, Y): seřadíme data do (Z 1,..., Z N ) (N = m + n) nagenerujem Z (b) = (Z1 (b),..., Z N (b)), b = 1...B ze Z (bootstrap, s opakováním) označme vždy X (b) prvních n prvků Z (b) a Y (b) zbylých m prvků označíme Z (b) spočtem ˆθ (b) = ˆθ(X (b), Y (b)), b = 1..B pval = #(ˆθ (b) ˆθ) B
50 Bootstrapový test F G Můžeme např. použít ˆθ(Z) = X Y pro detekci změny v poloze (F(x) = G(x µ), µ > 0)
51 Bootstrapový test F G Můžeme např. použít ˆθ(Z) = X Y pro detekci změny v poloze (F(x) = G(x µ), µ > 0) nebo ˆθ(Z) = X Y pro oboustrannou alternativu
52 Bootstrapový test F G Můžeme např. použít ˆθ(Z) = X Y pro detekci změny v poloze (F(x) = G(x µ), µ > 0) nebo ˆθ(Z) = X Y pro oboustrannou alternativu nebo ˆσ X /ˆσ Y resp. log ˆσ X /ˆσ Y pro alternativu změny měřítka
53 Bootstrapový test F G Můžeme např. použít ˆθ(Z) = X Y pro detekci změny v poloze (F(x) = G(x µ), µ > 0) nebo ˆθ(Z) = X Y pro oboustrannou alternativu nebo ˆσ X /ˆσ Y resp. log ˆσ X /ˆσ Y pro alternativu změny měřítka případně studentizovanou statistiku X n Y m σ 1/n + 1/m kde σ = [ n i=1 (X i X n ) 2 + m i=1 (Y i Y m ) 2 ]/[n + m 2] (testová statistika dvouvýběrového t-testu)
54 Bootstrapový test rovnosti středních hodnot předpokládejme normalitu dat jedna možnost: použít testovou statistiku dvouvýběrového t-testu nevýhoda: předpokládá rovnost rozptylů
55 Bootstrapový test rovnosti středních hodnot předpokládejme normalitu dat jedna možnost: použít testovou statistiku dvouvýběrového t-testu nevýhoda: předpokládá rovnost rozptylů alternativa: použít testovou statistiku X n Y m σ 21 /n + σ22 /m, kde σ 2 1 = n i=1 (X i X n ) 2 /(n 1) a σ 2 2 = m i=1 (Y i Y m ) 2 /(m 1)
56 Bootstrapový test rovnosti středních hodnot předpokládejme normalitu dat jedna možnost: použít testovou statistiku dvouvýběrového t-testu nevýhoda: předpokládá rovnost rozptylů alternativa: použít testovou statistiku X n Y m σ 21 /n + σ22 /m, kde σ 2 1 = n i=1 (X i X n ) 2 /(n 1) a σ 2 2 = m i=1 (Y i Y m ) 2 /(m 1) nemá t-rozdělení (Behrens-Fisherův problém)
57 Bootstrapový test rovnosti středních hodnot algoritmus: označme x i = x i x n + z N, i = 1..n a ỹ i = y i y m + z N, i = 1..m
58 Bootstrapový test rovnosti středních hodnot algoritmus: označme x i = x i x n + z N, i = 1..n a ỹ i = y i y m + z N, i = 1..m Generujme (x (b), y (b)) kde x (b) jsou bootstrapové výběry z x a y (b) jsou bootstrapové výběry z ỹ
59 Bootstrapový test rovnosti středních hodnot algoritmus: označme x i = x i x n + z N, i = 1..n a ỹ i = y i y m + z N, i = 1..m Generujme (x (b), y (b)) kde x (b) jsou bootstrapové výběry z x a y (b) jsou bootstrapové výběry z ỹ spočtem ˆθ (b) = x n(b) ỹ m (b) σ 21 (b)/n + σ22 (b)/m, b = 1..B pval = #(ˆθ (b) ˆθ) B
60 Příklad Bootstrap - konfidenční intervaly Máme opět data o myších, na prvních provedli operaci, na druhých ne X = (16, 23, 38, 94, 99, 141, 197) Y = (10, 27, 31, 40, 46, 50, 52, 104, 146)
61 Příklad Bootstrap - konfidenční intervaly Máme opět data o myších, na prvních provedli operaci, na druhých ne X = (16, 23, 38, 94, 99, 141, 197) Y = (10, 27, 31, 40, 46, 50, 52, 104, 146) P-hodnoty jednotlivých testů: (jednostranná alternativa) permutační neparametrický bootstrap bootstrap pro stř. hodnoty dvouvýběrový t-test 0.158
62 Jednovýběrové testy Mějme náhodný výběr X 1,..., X n předpokládejme normalitu dat, testujme H 0 : µ = µ 0
63 Jednovýběrové testy Mějme náhodný výběr X 1,..., X n předpokládejme normalitu dat, testujme H 0 : µ = µ 0 Můžeme použít jednovýběrový t-test - testová statistika: ˆθ(X) = X n µ 0 n σ má za platnosti H 0 t-rozdělení o n 1 stupních volnosti
64 Jednovýběrové testy Bootstrapový přístup: vyrobíme bootstrapové výběry X (b) = (X 1 (b),..., X n (b)), b = 1...B
65 Jednovýběrové testy Bootstrapový přístup: vyrobíme bootstrapové výběry X (b) = (X 1 (b),..., X n (b)), b = 1...B spočteme statistiky ˆθ (X(b)) = X n(b) X n n σ (b)
66 Jednovýběrové testy Bootstrapový přístup: vyrobíme bootstrapové výběry X (b) = (X 1 (b),..., X n (b)), b = 1...B spočteme statistiky ˆθ (X(b)) = X n(b) X n n σ (b) p-hodnota pro jednostrannou alternativu µ > µ 0 pak je pval = #(ˆθ (X(b)) > ˆθ(X)). B
67 Jednovýběrové testy Bootstrapový přístup: vyrobíme bootstrapové výběry X (b) = (X 1 (b),..., X n (b)), b = 1...B spočteme statistiky ˆθ (X(b)) = X n(b) X n n σ (b) p-hodnota pro jednostrannou alternativu µ > µ 0 pak je pval = #(ˆθ (X(b)) > ˆθ(X)). B Pro oboustrannou alternativu vzít absolutní hodnoty z testových statistik.
68 Jednovýběrové testy Srovnejme provedení jednovýběrový bootstrapový test s konstrukcí bootstrapového konfidenčního intervalu.
69 Jednovýběrové testy Srovnejme provedení jednovýběrový bootstrapový test s konstrukcí bootstrapového konfidenčního intervalu. konfidenční interval pomocí percentilů statistiky X n(b) X n n, σ (b) je tvořen takovými hodnotami µ 0, které tento bootstrapový test nezamítne
70 Příklad Bootstrap - konfidenční intervaly Máme opět data o myších. Někdo jiný provedl na svých myších operaci, a vyšla mu průměrná doba dožití 129.
71 Příklad Bootstrap - konfidenční intervaly Máme opět data o myších. Někdo jiný provedl na svých myších operaci, a vyšla mu průměrná doba dožití 129. To nám přijde hodně, protože naše myši se dožily: X = (16, 23, 38, 94, 99, 141, 197)
72 Příklad Bootstrap - konfidenční intervaly Máme opět data o myších. Někdo jiný provedl na svých myších operaci, a vyšla mu průměrná doba dožití 129. To nám přijde hodně, protože naše myši se dožily: X = (16, 23, 38, 94, 99, 141, 197) p-hodnoty jednotlivých testů: (jednostranná alternativa) bootstrapový test 0.10 jednovýběrový t-test 0.07
73 Literatura Bootstrap - konfidenční intervaly Efron B., Tibshirani R.J.:An Introduction to the Bootstrap, Chapman&Hall, 1993
74 Literatura Bootstrap - konfidenční intervaly Efron B., Tibshirani R.J.:An Introduction to the Bootstrap, Chapman&Hall, 1993 Konec
Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
VíceIntervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
Více15. T e s t o v á n í h y p o t é z
15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:
VíceIntervalové Odhady Parametrů
Parametrů Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení technické v Praze
Více15. T e s t o v á n í h y p o t é z
15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:
Více5. T e s t o v á n í h y p o t é z
5. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:
VíceTestování statistických hypotéz
Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné
VíceParametrické testy hypotéz o středních hodnotách spojitých náhodných veličin
Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin EuroMISE Centrum I. ÚVOD vv této přednášce budeme hovořit o jednovýběrových a dvouvýběrových testech týkajících se střední hodnoty
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Náhodný výběr Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr
Více7. Analýza rozptylu.
7. Analýza rozptylu. Uvedeme obecnou ideu, která je založena na minimalizaci chyby metodou nejmenších čtverců. Nejdříve uvedeme několik základních tvrzení. Uvažujeme náhodný vektor Y = (Y, Y,..., Y n a
VíceParametrické testy hypotéz o středních hodnotách spojitých náhodných veličin
Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin EuroMISE Centrum Kontakt: Literatura: Obecné informace Zvárová, J.: Základy statistiky pro biomedicínskéobory I. Vydavatelství
Víceletní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test
Párový Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 motivační příklad Párový Příklad (Platová diskriminace) firma
VíceÚvod do teorie odhadu. Ing. Michael Rost, Ph.D.
Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost
VíceJednostranné intervaly spolehlivosti
Jednostranné intervaly spolehlivosti hledáme jen jednu z obou mezí Princip: dle zadání úlohy hledáme jen dolní či jen horní mez podle oboustranného vzorce s tou změnou, že výraz 1-α/2 ve vzorci nahradíme
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza
VíceKatedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci
Zpracování dat v edukačních vědách - Testování hypotéz Kamila Fačevicová Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Obsah seminářů 5.11. Úvod do matematické
Vícez Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin
Příklady k procvičení z Matematické statistiky Poslední úprava. listopadu 207. Konvergence posloupnosti náhodných veličin. Necht X, X 2... jsou nezávislé veličiny s rovnoměrným rozdělením na [0, ]. Definujme
Více5 Parametrické testy hypotéz
5 Parametrické testy hypotéz 5.1 Pojem parametrického testu (Skripta str. 95-96) Na základě výběru srovnáváme dvě tvrzení o hodnotě určitého parametru θ rozdělení f(x, θ). První tvrzení (které většinou
VíceIng. Michael Rost, Ph.D.
Úvod do testování hypotéz, jednovýběrový t-test Ing. Michael Rost, Ph.D. Testovaná hypotéza Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru, např. o parametru Θ, pak takovéto tvrzení
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr
VíceÚVOD DO TEORIE ODHADU. Martina Litschmannová
ÚVOD DO TEORIE ODHADU Martina Litschmannová Obsah lekce Výběrové charakteristiky parametry populace vs. výběrové charakteristiky limitní věty další rozdělení pravděpodobnosti (Chí-kvadrát (Pearsonovo),
VíceX = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní
..08 8cv7.tex 7. cvičení - transformace náhodné veličiny Definice pojmů a základní vzorce Je-li X náhodná veličina a h : R R je měřitelná funkce, pak náhodnou veličinu Y, která je definovaná vztahem X
Více12. cvičení z PST. 20. prosince 2017
1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace
VícePříklad datového souboru. Pravděpodobnost vs. statistika. Formální definice. Teorie odhadu
Pravděpodobnost vs. statistika Teorie pravděpodobnosti pracuje s jednou nebo více teoretickými náhodnými veličinami, jejichž rozdělení je známo Statistika odvozovali jsme charakteristiky těchto rozdělení
VíceBAYESOVSKÉ ODHADY. Michal Friesl V NĚKTERÝCH MODELECH. Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni
BAYESOVSKÉ ODHADY V NĚKTERÝCH MODELECH Michal Friesl Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni Slunce Řidiči IQ Regrese Přežití Obvyklý model Pozorování X = (X 1,..., X
Více6. T e s t o v á n í h y p o t é z
6. T e s t o v á n í h y p o t é z Na základě hodnot z realizace náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Používáme k tomu vhodně
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
VíceNormální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký
VíceBodové a intervalové odhady parametrů v regresním modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model Mějme lineární regresní model (LRM) Y = Xβ + e, kde y 1 e 1 β y 2 Y =., e
VíceDeskriptivní statistické metody II. Míry polohy Míry variability
Deskriptivní statistické metody II. Míry polohy Míry variability Jana Vránová, 3.lékařská fakulta UK, Praha Náhodný výběr všechny prvky výběru {x i }, i = 1, 2,, n, se chápou jako náhodné veličiny, které
VícePravděpodobnost a statistika
Pravděpodobnost a statistika Bodové odhady a intervaly spolehlivosti Vilém Vychodil KMI/PRAS, Přednáška 10 Vytvořeno v rámci projektu 963/011 FRVŠ V. Vychodil (KMI/PRAS, Přednáška 10) Bodové odhady a intervaly
VícePříklady na testy hypotéz o parametrech normálního rozdělení
Příklady na testy hypotéz o parametrech normálního rozdělení. O životnosti 75W žárovky (v hodinách) je známo, že má normální rozdělení s = 5h. Pro náhodný výběr 0 žárovek byla stanovena průměrná životnost
Vícepopulace soubor jednotek, o jejichž vlastnostech bychom chtěli vypovídat letní semestr Definice subjektech.
Populace a Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 1 populace soubor jednotek, o jejichž vlastnostech bychom
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická
Více12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)
cvičení z PSI 0-4 prosince 06 Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) Z realizací náhodných veličin X a Y s normálním rozdělením) jsme z výběrů daného rozsahu obdrželi
Více8. Normální rozdělení
8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, 2 ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) 2 e 2 2, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá
VíceMatematická statistika. Testy v. v binomickém. Test pravděpodobnosti. Test homogenity dvou. Neparametrické testy. statistika. Testy v.
Opakování Opakování: y o střední hodnotě normálního 1 jednovýběrový t-test 2 párový t-test 3 výběrový t-test Šárka Hudecová Katedra a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy
VíceZákladní statistické modely Statistické vyhodnocování exp. dat M. Čada ~ cada
Základní statistické modely 1 Statistika Matematická statistika se zabývá interpretací získaných náhodných dat. Snažíme se přiřadit statistickému souboru vhodnou distribuční funkci a najít základní číselné
VíceJednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)
Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu) Frank Wilcoxon (1892 1965): Americký statistik a chemik Nechť X 1,..., X n je náhodný výběr ze
VícePravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.
Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení
VíceIntervalové Odhady Parametrů II Testování Hypotéz
Parametrů II Testování Hypotéz Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení
VíceLékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)
Lékařská biofyzika, výpočetní technika I Biostatistika Josef Tvrdík (doc. Ing. CSc.) Přírodovědecká fakulta, katedra informatiky josef.tvrdik@osu.cz konzultace úterý 14.10 až 15.40 hod. http://www1.osu.cz/~tvrdik
VícePřednáška X. Testování hypotéz o kvantitativních proměnných
Přednáška X. Testování hypotéz o kvantitativních proměnných Testování hypotéz o podílech Kontingenční tabulka, čtyřpolní tabulka Testy nezávislosti, Fisherůvexaktní test, McNemarůvtest Testy dobré shody
Více12. prosince n pro n = n = 30 = S X
11 cvičení z PSI 1 prosince 018 111 test střední hodnoty normálního rozdělení při známém rozptylu Teploměrem o jehož chybě předpokládáme že má normální rozdělení se směrodatnou odchylkou σ = 3 jsme provedli
VíceVybrané partie z biostatistiky
1 Úvod Vybrané partie z biostatistiky 10.7.2017, Běstvina Marie Turčičová (turcic@karlin.mff.cuni.cz), MFF UK Pracovat budeme v programu R a jeho nástavbě RStudio, které si můžete bezplatně stáhnout zde:
VíceZáklady teorie odhadu parametrů bodový odhad
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Odhady parametrů Úkolem výběrového šetření je podat informaci o neznámé hodnotě charakteristiky základního souboru
VíceStatistika pro každého. Párový test Test shody dvou rozptylů Dvouvýběrový t-test Porovnání středních hodnot při nestejných rozptylech
Statistika pro každého Párový test Test shody dvou rozptylů Dvouvýběrový t-test Porovnání středních hodnot při stejných rozptylech Testovací kuchařka 1 2 Párový t-test 1 2 Párový t-test -test užijeme v
VíceMATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci
MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci Matematická statistika Matematická statistika se zabývá matematickým
VíceTestování hypotéz o parametrech regresního modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,
VíceCharakteristika datového souboru
Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex
VíceVýběrové charakteristiky a jejich rozdělení
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový
VíceTestování hypotéz o parametrech regresního modelu
Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO
VíceII. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal
Základy navrhování průmyslových experimentů DOE II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal! Testování statistických hypotéz kvalitativní odezva kvantitativní chí-kvadrát test homogenity,
Víceprosince oboustranný symetrický 95% interval spolehlivosti pro střední hodnotu životnosti τ. X i. X = 1 n.. Podle CLV má veličina
10 cvičení z PSI 5-9 prosince 016 101 intervalový odhad Veličina X, představující životnost žárovky, má exponenciální rozdělení s parametrem τ Průměrná životnost n = 64 náhodně vybraných žárovek je x =
Vícediskriminaci žen letní semestr 2012 1 = výrok, o jehož pravdivosti chceme rozhodnout tvrzení o populaci, o jehož platnosti rozhodujeme
motivační příklad Párový Párový Příklad (Platová diskriminace) firma provedla šetření s cílem zjistit, zda dochází k platové diskriminaci žen Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky
VíceAKM CVIČENÍ. Opakování maticové algebry. Mějme matice A, B regulární, potom : ( AB) = B A
AKM - 1-2 CVIČENÍ Opakování maticové algebry Mějme matice A, B regulární, potom : ( AB) = B A 1 1 ( A ) = ( A ) ( A ) = A ( A + B) = A + B 1 1 1 ( AB) = B A, kde A je řádu mxn a B nxk Čtvercová matice
VíceStatistika, Biostatistika pro kombinované studium. Jan Kracík
Statistika, Biostatistika pro kombinované studium Letní semestr 2014/2015 Tutoriál č. 6: ANOVA Jan Kracík jan.kracik@vsb.cz Obsah: Testování hypotéz opakování ANOVA Testování hypotéz (opakování) Testování
VíceBakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013
Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika Podrobnější rozpis okruhů otázek pro třetí část SZZ Verze: 13. června 2013 1 Úvodní poznámky 6 Smyslem SZZ by nemělo být toliko
VíceSTANOVENÍ SPOLEHLIVOSTI GEOTECHNICKÝCH KONSTRUKCÍ. J. Pruška, T. Parák
STANOVENÍ SPOLEHLIVOSTI GEOTECHNICKÝCH KONSTRUKCÍ J. Pruška, T. Parák OBSAH: 1. Co je to spolehlivost, pravděpodobnost poruchy, riziko. 2. Deterministický a pravděpodobnostní přístup k řešení problémů.
VíceTesty. Pavel Provinský. 19. listopadu 2013
Testy Pavel Provinský 19. listopadu 2013 Test a intervalový odhad Testy a intervalové odhady - jsou vlastně to samé. Jiný je jen úhel pohledu. Lze přecházet od jednoho k druhému. Například: Při odvozování
VíceOdhad parametrů N(µ, σ 2 )
Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný
VíceStatistika. Testování hypotéz - statistická indukce Parametrické testy. Roman Biskup
Statistika Testování hypotéz - statistická indukce Parametrické testy Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 1. února 01 Statistika by Birom
VícePřijímací zkouška na navazující magisterské studium 2014
Přijímací zkouška na navazující magisterské studium 24 Příklad (25 bodů) Spočtěte Studijní program: Studijní obor: Matematika Finanční a pojistná matematika Varianta A M x 2 dxdy, kde M = {(x, y) R 2 ;
VíceCvičení 10. Přednášející: Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc.
10 Přednášející: Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení technické
VíceSTATISTICKÉ ZJIŠŤOVÁNÍ
STATISTICKÉ ZJIŠŤOVÁNÍ ÚVOD Základní soubor Všechny ryby v rybníce, všechny holky/kluci na škole Cílem určit charakteristiky, pravděpodobnosti Průměr, rozptyl, pravděpodobnost, že Maruška kápne na toho
Víceletní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika
Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 Opakování t- vs. neparametrické Wilcoxonův jednovýběrový test Opakování
VíceOdhad parametrů N(µ, σ 2 )
Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný
VíceOdhady Parametrů Lineární Regrese
Odhady Parametrů Lineární Regrese Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké
VíceTestování statistických hypotéz. Obecný postup
poznámky k MIII, Tomečková I., poslední aktualizace 9. listopadu 016 9 Testování statistických hypotéz Obecný postup (I) Vyslovení hypotézy O datech vyslovíme doměnku, kterou chceme ověřit statistickým
VíceKGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 7. Testování statistických hypotéz Mgr. David Fiedor 30. března 2015 Osnova 1 2 3 Dělení testů parametrické - o parametrech rozdělení základního souboru (průměr, rozptyl,
VícePřijímací zkouška na navazující magisterské studium 2017
Přijímací zkouška na navazující magisterské studium 27 Studijní program: Studijní obor: Matematika Finanční a pojistná matematika Varianta A Řešení příkladů pečlivě odůvodněte. Věnujte pozornost ověření
VíceNormální rozložení a odvozená rozložení
I Normální rozložení a odvozená rozložení I.I Normální rozložení Data, se kterými pracujeme, pocházejí z různých rozložení. Mohou být vychýlena (doleva popř. doprava, nebo v nich není na první pohled vidět
Více1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Testy hypotéz na základě více než 2 výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů Na analýzu rozptylu lze pohlížet v podstatě
Více8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.
8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) e, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá normované
VíceNormální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními
VíceSTATISTICKÉ TESTY VÝZNAMNOSTI
STATISTICKÉ TESTY VÝZNAMNOSTI jsou statistické postupy, pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Pokud je výsledek šetření statisticky významný (signifikantní), znamená
Více10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.
0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti
VíceCvičení ze statistiky - 8. Filip Děchtěrenko
Cvičení ze statistiky - 8 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Centrální limitní věta Laplaceho věta (+ korekce na spojitost) Konfidenční intervaly
VíceCharakterizace rozdělení
Charakterizace rozdělení Momenty f(x) f(x) f(x) μ >μ 1 σ 1 σ >σ 1 g 1 g σ μ 1 μ x μ x x N K MK = x f( x) dx 1 M K = x N CK = ( x M ) f( x) dx ( xi M 1 C = 1 K 1) N i= 1 K i K N i= 1 K μ = E ( X ) = xf
VíceODHADY NÁVRATOVÝCH HODNOT
ODHADY NÁVRATOVÝCH HODNOT KLIMATOLOGICKÝCH DAT Katedra aplikované matematiky Fakulta přírodovědně-humanitní a pedagogická Technická univerzita v Liberci Robust 2018 ÚVOD Velká pozornost v analýze extrémních
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
VíceAnalýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel
Analýza rozptylu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 1 / 30 Analýza
VíceStatistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .
Statistika Teorie odhadu statistická indukce Intervalový odhad µ, σ 2 a π Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 21. února 2012 Statistika
VícePravděpodobnost a statistika
Pravděpodobnost a statistika Normální rozdělení a centrální limitní věta Vilém Vychodil KMI/PRAS, Přednáška 9 Vytvořeno v rámci projektu 2963/2011 FRVŠ V. Vychodil (KMI/PRAS, Přednáška 9) Normální rozdělení
VíceIntervalová data a výpočet některých statistik
Intervalová data a výpočet některých statistik Milan Hladík 1 Michal Černý 2 1 Katedra aplikované matematiky Matematicko-fyzikální fakulta Univerzita Karlova 2 Katedra ekonometrie Fakulta informatiky a
VíceDVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica
DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica Úloha A) koncentrace glukózy v krvi V této části posoudíme pomocí párového testu, zda nový lék prokazatelně snižuje koncentraci
VíceVYSOKÉ UČENÍ TECHNICKÉ V BRNĚ
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA STROJNÍHO INŽENÝRSTVÍ FACULTY OF MECHANICAL ENGINEERING ÚSTAV MATEMATIKY INSTITUTE OF MATHEMATICS POROVNÁNÍ TESTŮ NULOVOSTI KORELAČNÍHO
VíceNMFM301 Statistika pro finanční matematiky. Michal Kulich
NMFM301 Statistika pro finanční matematiky Přehledový větník Michal Kulich Naposledy upraveno dne 27. září 2014. Katedra pravděpodobnosti a matematické statistiky Matematicko-fysikální fakulta University
Vícejevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.
Parametrické metody odhadů z neúplných výběrů 2 1 Metoda maximální věrohodnosti pro cenzorované výběry 11 Náhodné cenzorování Při sledování složitých reálných systémů často nemáme možnost uspořádat experiment
VíceSTATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)
STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) 1) Význam a využití statistiky v biologických vědách a veterinárním lékařství ) Rozdělení znaků (veličin) ve statistice 3) Základní a
Vícesprávně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B.
Zkouška z předmětu KMA/PST. Anotace předmětu Náhodné jevy, pravděpodobnost, podmíněná pravděpodobnost. Nezávislé náhodné jevy. Náhodná veličina, distribuční funkce. Diskrétní a absolutně spojitá náhodná
VícePravděpodobnost a aplikovaná statistika
Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 8. KAPITOLA STATISTICKÉ TESTOVÁNÍ HYPOTÉZ 22.11.2016 Opakování: CLV příklad 1 Zadání: Před volbami je v populaci státu 52 % příznivců
VíceRegresní analýza 1. Regresní analýza
Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému
VíceMatematická statistika Zimní semestr Testy o proporci
Testy o proporci 18.12.2018 Jednovýběrový problém pro binární data. V roce 2008 se v České republice živě narodilo 119 570 dětí, z toho 58 244 dívek a 61 326 chlapců (zdroj ČSÚ). Zajímá nás, zda je pravděpodobnost
VícePRAVDĚPODOBNOST A STATISTIKA. Testování hypotéz o rozdělení
PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz o rozdělení Testování hypotéz o rozdělení Nechť X e náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládeme, že neznáme tvar distribuční funkce
Více6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový.
6. ZÁKLADY STATIST. ODHADOVÁNÍ X={X 1, X 2,..., X n } výběr z rozdělení s F (x, θ), θ={θ 1,..., θ r } - vektor reálných neznámých param. θ Θ R k. Θ parametrický prostor. Dva základní způsoby odhadu neznámého
VíceRozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně
Testování hypotéz Nechť,, je náhodný výběr z nějakého rozdělení s neznámými parametry. Máme dvě navzájem si odporující hypotézy o parametrech daného rozdělení: Nulová hypotéza parametry (případně jediný
VíceVYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová
VYBRANÉ DVOUVÝBĚROVÉ TESTY Martina Litschmannová Obsah přednášky Vybrané dvouvýběrové testy par. hypotéz test o shodě rozptylů (F-test), testy o shodě středních hodnot (t-test, Aspinové-Welchův test),
VíceNávrh a vyhodnocení experimentu
Návrh a vyhodnocení experimentu Návrh a vyhodnocení experimentů v procesech vývoje a řízení kvality vozidel Ing. Bohumil Kovář, Ph.D. FD ČVUT Ústav aplikované matematiky kovar@utia.cas.cz Mladá Boleslav
Více