Bootstrap - konfidenční intervaly a testy

Rozměr: px
Začít zobrazení ze stránky:

Download "Bootstrap - konfidenční intervaly a testy"

Transkript

1 9. prosince 2008

2 Konfidenční intervaly obecně Máme data X 1...X n F,(iid), kde F neznáme.

3 Konfidenční intervaly obecně Máme data X 1...X n F,(iid), kde F neznáme. Chceme odhadnout θ = t(f), např. t(f) = E F (X)

4 Konfidenční intervaly obecně Máme data X 1...X n F,(iid), kde F neznáme. Chceme odhadnout θ = t(f), např. t(f) = E F (X) Plug-in odhad ˆθ = t(ˆf), kde ˆF je odhad d.f.

5 Konfidenční intervaly obecně Máme data X 1...X n F,(iid), kde F neznáme. Chceme odhadnout θ = t(f), např. t(f) = E F (X) Plug-in odhad ˆθ = t(ˆf), kde ˆF je odhad d.f. Dá se vyjádřit t(ˆf) = s(x), např. X n pro průměr.

6 Konfidenční intervaly obecně Máme data X 1...X n F,(iid), kde F neznáme. Chceme odhadnout θ = t(f), např. t(f) = E F (X) Plug-in odhad ˆθ = t(ˆf), kde ˆF je odhad d.f. Dá se vyjádřit t(ˆf) = s(x), např. X n pro průměr. Hodí se nám se F (ˆθ) = var F (ˆθ)

7 Konfidenční intervaly obecně Máme data X 1...X n F,(iid), kde F neznáme. Chceme odhadnout θ = t(f), např. t(f) = E F (X) Plug-in odhad ˆθ = t(ˆf), kde ˆF je odhad d.f. Dá se vyjádřit t(ˆf) = s(x), např. X n pro průměr. Hodí se nám se F (ˆθ) = var F (ˆθ) Pro N(µ,σ 2 ) máme se(x n ) = var(x n ) = σ/ n

8 Konfidenční intervaly obecně Máme data X 1...X n F,(iid), kde F neznáme. Chceme odhadnout θ = t(f), např. t(f) = E F (X) Plug-in odhad ˆθ = t(ˆf), kde ˆF je odhad d.f. Dá se vyjádřit t(ˆf) = s(x), např. X n pro průměr. Hodí se nám se F (ˆθ) = var F (ˆθ) Pro N(µ,σ 2 ) máme se(x n ) = var(x n ) = σ/ n Odhad se(ˆθ) ˆ = var(ˆθ) ˆ

9 Konfidenční intervaly obecně Máme data X 1...X n F,(iid), kde F neznáme. Chceme odhadnout θ = t(f), např. t(f) = E F (X) Plug-in odhad ˆθ = t(ˆf), kde ˆF je odhad d.f. Dá se vyjádřit t(ˆf) = s(x), např. X n pro průměr. Hodí se nám se F (ˆθ) = var F (ˆθ) Pro N(µ,σ 2 ) máme se(x n ) = var(x n ) = σ/ n Odhad se(ˆθ) ˆ = var(ˆθ) ˆ V normálním případě se(x ˆ 1 n ) = n 1 (Xi X n ) 2 / n

10 Konfidenční intervaly obecně Z CLV dostaneme za určitých předpokladů aproximaci ˆθ θ N(0, 1) se(ˆθ) ˆ

11 Konfidenční intervaly obecně Z CLV dostaneme za určitých předpokladů aproximaci ˆθ θ N(0, 1) se(ˆθ) ˆ popř. ˆθ θ se(ˆθ) ˆ t n 1

12 Konfidenční intervaly obecně Z CLV dostaneme za určitých předpokladů aproximaci ˆθ θ N(0, 1) se(ˆθ) ˆ popř. ˆθ θ se(ˆθ) ˆ t n 1 tedy přibližný konfidenční interval: P F (θ [ˆθ t n 1 (1 α/2) ˆ se(ˆθ), ˆθ t n 1 (α/2) ˆ se(ˆθ)]) =1 α

13 Konfidenční intervaly obecně Z CLV dostaneme za určitých předpokladů aproximaci ˆθ θ N(0, 1) se(ˆθ) ˆ popř. ˆθ θ se(ˆθ) ˆ t n 1 tedy přibližný konfidenční interval: P F (θ [ˆθ t n 1 (1 α/2) ˆ se(ˆθ), ˆθ t n 1 (α/2) ˆ se(ˆθ)]) =1 α Pro odhad střední hodnoty v normálním rozdělení ˆθ = X n jsou konfidenční intervaly přesné

14 Bootstrap-t konfidenční intervaly Chceme odhadnout θ = t(f), řekněmě že můžeme zapsat ˆθ = s(x)

15 Bootstrap-t konfidenční intervaly Chceme odhadnout θ = t(f), řekněmě že můžeme zapsat ˆθ = s(x) Odhadneme F (parametricky jako Fˆϑ nebo jako empirickou d.f. ˆF )

16 Bootstrap-t konfidenční intervaly Chceme odhadnout θ = t(f), řekněmě že můžeme zapsat ˆθ = s(x) Odhadneme F (parametricky jako Fˆϑ nebo jako empirickou d.f. ˆF ) Generujeme bootstrapové výběry x b, b = 1...B

17 Bootstrap-t konfidenční intervaly Chceme odhadnout θ = t(f), řekněmě že můžeme zapsat ˆθ = s(x) Odhadneme F (parametricky jako Fˆϑ nebo jako empirickou d.f. ˆF ) Generujeme bootstrapové výběry x b, b = 1...B Pro každé b = 1...B spočítáme ˆθ (b) = s(x b)

18 Bootstrap-t konfidenční intervaly Chceme odhadnout θ = t(f), řekněmě že můžeme zapsat ˆθ = s(x) Odhadneme F (parametricky jako Fˆϑ nebo jako empirickou d.f. ˆF ) Generujeme bootstrapové výběry x b, b = 1...B Pro každé b = 1...B spočítáme ˆθ (b) = s(x b) a ˆ se (ˆθ (b)) = var ˆ ˆθ (b)

19 Bootstrap-t konfidenční intervaly Vyrobíme studentizované hodnoty Z (b) = ˆθ (b) ˆθ ˆ se (ˆθ (b)) kde ˆθ je odhad z původních dat X 1...X n

20 Bootstrap-t konfidenční intervaly Vyrobíme studentizované hodnoty Z (b) = ˆθ (b) ˆθ ˆ se (ˆθ (b)) kde ˆθ je odhad z původních dat X 1...X n Napočítáme percentily Z (b) #{Z (b) ˆt α }/B = α

21 Bootstrap-t konfidenční intervaly Vyrobíme studentizované hodnoty Z (b) = ˆθ (b) ˆθ ˆ se (ˆθ (b)) kde ˆθ je odhad z původních dat X 1...X n Napočítáme percentily Z (b) #{Z (b) ˆt α }/B = α odtud bootstrap-t konfidenční intervaly (ˆθ ˆt 1 α/2 ˆ se, ˆθ ˆt α/2 ˆ se)

22 Percentilové bootstrapové konfidenční intervaly Vyrobíme bootstrapové výběry x b, b = 1...B pro každé b spočtem ˆθ b = s(x b ) označíme Ĝ empirickou distribuční funkci ˆθ b

23 Percentilové bootstrapové konfidenční intervaly Vyrobíme bootstrapové výběry x b, b = 1...B pro každé b spočtem ˆθ b = s(x b ) označíme Ĝ empirickou distribuční funkci ˆθ b Percentilovým bootstrapovým konfidenčním intervalem o spolehlivosti α pak myslíme (Ĝ 1 (α/2), Ĝ 1 (1 α/2)) kde Ĝ 1 (u) = inf(x : Ĝ(x) u) jsou empirické kvantily v obvyklém smyslu.

24 Příklad - porovnání Máme data o myších - délka dožití po experimentální operaci (Efron, 1993) a chceme odhadnout střední hodnotu X = (10, 27, 31, 40, 46, 50, 52, 104, 146)

25 Příklad - porovnání Máme data o myších - délka dožití po experimentální operaci (Efron, 1993) a chceme odhadnout střední hodnotu X = (10, 27, 31, 40, 46, 50, 52, 104, 146) Ukáže se, že můžeme předpokládat nomalitu na hladině Zkonstruujeme konfidenční intervaly pro hladinu α = 0.05:

26 Příklad - porovnání Máme data o myších - délka dožití po experimentální operaci (Efron, 1993) a chceme odhadnout střední hodnotu X = (10, 27, 31, 40, 46, 50, 52, 104, 146) Ukáže se, že můžeme předpokládat nomalitu na hladině Zkonstruujeme konfidenční intervaly pro hladinu α = 0.05: Přibližný interval (X ± u(α/2)ˆσ/ n): (32.97, 79.48)

27 Příklad - porovnání Máme data o myších - délka dožití po experimentální operaci (Efron, 1993) a chceme odhadnout střední hodnotu X = (10, 27, 31, 40, 46, 50, 52, 104, 146) Ukáže se, že můžeme předpokládat nomalitu na hladině Zkonstruujeme konfidenční intervaly pro hladinu α = 0.05: Přibližný interval (X ± u(α/2)ˆσ/ n): (32.97, 79.48) interval z t-rozdělení (X ± t n 1 (α/2)ˆσ/ n): (23.62, 88.83)

28 Příklad - porovnání Máme data o myších - délka dožití po experimentální operaci (Efron, 1993) a chceme odhadnout střední hodnotu X = (10, 27, 31, 40, 46, 50, 52, 104, 146) Ukáže se, že můžeme předpokládat nomalitu na hladině Zkonstruujeme konfidenční intervaly pro hladinu α = 0.05: Přibližný interval (X ± u(α/2)ˆσ/ n): (32.97, 79.48) interval z t-rozdělení (X ± t n 1 (α/2)ˆσ/ n): (23.62, 88.83) Bootstrap-t interval (X ˆt(α/2)ˆσ/ n, X ˆt(1 α/2)ˆσ/ n) (31.80, )

29 Příklad - porovnání Máme data o myších - délka dožití po experimentální operaci (Efron, 1993) a chceme odhadnout střední hodnotu X = (10, 27, 31, 40, 46, 50, 52, 104, 146) Ukáže se, že můžeme předpokládat nomalitu na hladině Zkonstruujeme konfidenční intervaly pro hladinu α = 0.05: Přibližný interval (X ± u(α/2)ˆσ/ n): (32.97, 79.48) interval z t-rozdělení (X ± t n 1 (α/2)ˆσ/ n): (23.62, 88.83) Bootstrap-t interval (X ˆt(α/2)ˆσ/ n, X ˆt(1 α/2)ˆσ/ n) (31.80, ) Bootstrapový percentilový interval (ˆθ B (α/2), ˆθ B (1 α/2)) (34.21, 85.44)

30 bootstrap-t konfidenční intervaly - transformace Pro střední hodnotu odhadneme se ˆ (b) = ˆσ (b)/ 1 n n = n 1 i=1 (x b i x b) 2 / n snadno, jindy ne tak snadné.

31 bootstrap-t konfidenční intervaly - transformace Pro střední hodnotu odhadneme se ˆ (b) = ˆσ (b)/ 1 n n = n 1 i=1 (x b i x b) 2 / n snadno, jindy ne tak snadné. Potřeba pro každé b vyrobit B 2 bootstrapových výběrů z x b se ˆ (b) = 1 B 2 (ˆθ b1 B 2 1 ˆθ B1) 2 b1=1

32 bootstrap-t konfidenční intervaly - transformace Pro střední hodnotu odhadneme se ˆ (b) = ˆσ (b)/ 1 n n = n 1 i=1 (x b i x b) 2 / n snadno, jindy ne tak snadné. Potřeba pro každé b vyrobit B 2 bootstrapových výběrů z x b se ˆ (b) = 1 B 2 (ˆθ b1 B 2 1 ˆθ B1) 2 b1=1 Ulehčení: transformace stabilizující rozptyl: obecně když máme Y (θ, r(θ) 2 ) a vezmeme takovou monotónní funkci g, že g (θ) = 1 r(θ), bude rozptyl n.veličiny Z = g(y) přibližně konstantní (v θ) (důkaz pomocí delta-metody)

33 bootstrap-t konfidenční intervaly - transformace Použití v bootstrapu: místo θ zkoumáme φ = g(θ)

34 bootstrap-t konfidenční intervaly - transformace Použití v bootstrapu: místo θ zkoumáme φ = g(θ) Algoritmus: generuj x b, b = 1...B 1, vyrob ˆθ (b) generuj B 2 bootstrapových výběrů z kadého x b, b = 1...B 1, vyrob se(ˆθ ˆ (b))

35 bootstrap-t konfidenční intervaly - transformace Použití v bootstrapu: místo θ zkoumáme φ = g(θ) Algoritmus: generuj x b, b = 1...B 1, vyrob ˆθ (b) generuj B 2 bootstrapových výběrů z kadého x b, b = 1...B 1, vyrob se(ˆθ ˆ (b)) z grafu [ˆθ (b), se(ˆθ ˆ (b))] získat r(u) = se(ˆθ θ = u) a funkci g

36 bootstrap-t konfidenční intervaly - transformace Použití v bootstrapu: místo θ zkoumáme φ = g(θ) Algoritmus: generuj x b, b = 1...B 1, vyrob ˆθ (b) generuj B 2 bootstrapových výběrů z kadého x b, b = 1...B 1, vyrob se(ˆθ ˆ (b)) z grafu [ˆθ (b), se(ˆθ ˆ (b))] získat r(u) = se(ˆθ θ = u) a funkci g generuj nové x b, b = 1...B 3 vyrob Z g (b) = ˆφ (b) ˆφ ˆ se(ˆθ (b))

37 bootstrap-t konfidenční intervaly - transformace Použití v bootstrapu: místo θ zkoumáme φ = g(θ) Algoritmus: generuj x b, b = 1...B 1, vyrob ˆθ (b) generuj B 2 bootstrapových výběrů z kadého x b, b = 1...B 1, vyrob se(ˆθ ˆ (b)) z grafu [ˆθ (b), se(ˆθ ˆ (b))] získat r(u) = se(ˆθ θ = u) a funkci g generuj nové x b, b = 1...B 3 vyrob Z g (b) = ˆφ (b) ˆφ ˆ se(ˆθ (b)) z Z g (b) bootstrap-t konfidenční intervaly pro φ

38 bootstrap-t konfidenční intervaly - transformace Použití v bootstrapu: místo θ zkoumáme φ = g(θ) Algoritmus: generuj x b, b = 1...B 1, vyrob ˆθ (b) generuj B 2 bootstrapových výběrů z kadého x b, b = 1...B 1, vyrob se(ˆθ ˆ (b)) z grafu [ˆθ (b), se(ˆθ ˆ (b))] získat r(u) = se(ˆθ θ = u) a funkci g generuj nové x b, b = 1...B 3 vyrob Z g (b) = ˆφ (b) ˆφ ˆ se(ˆθ (b)) z Z g (b) bootstrap-t konfidenční intervaly pro φ konfidenční intervaly pro θ = g 1 (φ)

39 percentilové konfidenční intervaly - transformace Lemma: Předpokládejme, že existuje transformace ˆφ = m(ˆθ), která normalizuje rozdělení ˆθ, tj. ˆφ N(φ, c 2 ). Pak percentilový konfidenční interval založen na ˆθ je shodný s intervalem (m 1 (ˆφ u(1 α/2)c, m 1 (ˆφ u(α/2)c))

40 Dvouvýběrové testy Situace: mějme dva nezávislé výběry: X 1,..., X n F Y 1,..., Y m G

41 Dvouvýběrové testy Situace: mějme dva nezávislé výběry: X 1,..., X n F Y 1,..., Y m G chceme testovat H 0 : F G

42 Permutační test Můžem vzít permutační test s testovou statistikou ˆθ = ˆθ(X, Y):

43 Permutační test Můžem vzít permutační test s testovou statistikou ˆθ = ˆθ(X, Y): seřadíme data do (Z 1,..., Z N ) (N = m + n) vyrobíme vektor Z permutací složek Z je n! možností jak může Z vypadat.

44 Permutační test Můžem vzít permutační test s testovou statistikou ˆθ = ˆθ(X, Y): seřadíme data do (Z 1,..., Z N ) (N = m + n) vyrobíme vektor Z permutací složek Z je n! možností jak může Z vypadat. prvních n prvků Z označme X, zbylých m označíme Y bude ( N n) možností jak může X a Y vypadat za platnosti H 0 jsou všechny stejně pravděpodobné

45 Permutační test Můžem vzít permutační test s testovou statistikou ˆθ = ˆθ(X, Y): seřadíme data do (Z 1,..., Z N ) (N = m + n) vyrobíme vektor Z permutací složek Z je n! možností jak může Z vypadat. prvních n prvků Z označme X, zbylých m označíme Y bude ( N n) možností jak může X a Y vypadat za platnosti H 0 jsou všechny stejně pravděpodobné vyrobme ze složek Z vektory Z (b), b = 1...B spočtem ˆθ (b) = ˆθ(X (b), Y (b))

46 Permutační test Můžem vzít permutační test s testovou statistikou ˆθ = ˆθ(X, Y): seřadíme data do (Z 1,..., Z N ) (N = m + n) vyrobíme vektor Z permutací složek Z je n! možností jak může Z vypadat. prvních n prvků Z označme X, zbylých m označíme Y bude ( N n) možností jak může X a Y vypadat za platnosti H 0 jsou všechny stejně pravděpodobné vyrobme ze složek Z vektory Z (b), b = 1...B spočtem ˆθ (b) = ˆθ(X (b), Y (b)) pval = #(ˆθ (b) ˆθ) B

47 Bootstrapový test F G Použijeme testovou statistiku ˆθ = ˆθ(X, Y): seřadíme data do (Z 1,..., Z N ) (N = m + n)

48 Bootstrapový test F G Použijeme testovou statistiku ˆθ = ˆθ(X, Y): seřadíme data do (Z 1,..., Z N ) (N = m + n) nagenerujem Z (b) = (Z1 (b),..., Z N (b)), b = 1...B ze Z (bootstrap, s opakováním) označme vždy X (b) prvních n prvků Z (b) a Y (b) zbylých m prvků označíme Z (b)

49 Bootstrapový test F G Použijeme testovou statistiku ˆθ = ˆθ(X, Y): seřadíme data do (Z 1,..., Z N ) (N = m + n) nagenerujem Z (b) = (Z1 (b),..., Z N (b)), b = 1...B ze Z (bootstrap, s opakováním) označme vždy X (b) prvních n prvků Z (b) a Y (b) zbylých m prvků označíme Z (b) spočtem ˆθ (b) = ˆθ(X (b), Y (b)), b = 1..B pval = #(ˆθ (b) ˆθ) B

50 Bootstrapový test F G Můžeme např. použít ˆθ(Z) = X Y pro detekci změny v poloze (F(x) = G(x µ), µ > 0)

51 Bootstrapový test F G Můžeme např. použít ˆθ(Z) = X Y pro detekci změny v poloze (F(x) = G(x µ), µ > 0) nebo ˆθ(Z) = X Y pro oboustrannou alternativu

52 Bootstrapový test F G Můžeme např. použít ˆθ(Z) = X Y pro detekci změny v poloze (F(x) = G(x µ), µ > 0) nebo ˆθ(Z) = X Y pro oboustrannou alternativu nebo ˆσ X /ˆσ Y resp. log ˆσ X /ˆσ Y pro alternativu změny měřítka

53 Bootstrapový test F G Můžeme např. použít ˆθ(Z) = X Y pro detekci změny v poloze (F(x) = G(x µ), µ > 0) nebo ˆθ(Z) = X Y pro oboustrannou alternativu nebo ˆσ X /ˆσ Y resp. log ˆσ X /ˆσ Y pro alternativu změny měřítka případně studentizovanou statistiku X n Y m σ 1/n + 1/m kde σ = [ n i=1 (X i X n ) 2 + m i=1 (Y i Y m ) 2 ]/[n + m 2] (testová statistika dvouvýběrového t-testu)

54 Bootstrapový test rovnosti středních hodnot předpokládejme normalitu dat jedna možnost: použít testovou statistiku dvouvýběrového t-testu nevýhoda: předpokládá rovnost rozptylů

55 Bootstrapový test rovnosti středních hodnot předpokládejme normalitu dat jedna možnost: použít testovou statistiku dvouvýběrového t-testu nevýhoda: předpokládá rovnost rozptylů alternativa: použít testovou statistiku X n Y m σ 21 /n + σ22 /m, kde σ 2 1 = n i=1 (X i X n ) 2 /(n 1) a σ 2 2 = m i=1 (Y i Y m ) 2 /(m 1)

56 Bootstrapový test rovnosti středních hodnot předpokládejme normalitu dat jedna možnost: použít testovou statistiku dvouvýběrového t-testu nevýhoda: předpokládá rovnost rozptylů alternativa: použít testovou statistiku X n Y m σ 21 /n + σ22 /m, kde σ 2 1 = n i=1 (X i X n ) 2 /(n 1) a σ 2 2 = m i=1 (Y i Y m ) 2 /(m 1) nemá t-rozdělení (Behrens-Fisherův problém)

57 Bootstrapový test rovnosti středních hodnot algoritmus: označme x i = x i x n + z N, i = 1..n a ỹ i = y i y m + z N, i = 1..m

58 Bootstrapový test rovnosti středních hodnot algoritmus: označme x i = x i x n + z N, i = 1..n a ỹ i = y i y m + z N, i = 1..m Generujme (x (b), y (b)) kde x (b) jsou bootstrapové výběry z x a y (b) jsou bootstrapové výběry z ỹ

59 Bootstrapový test rovnosti středních hodnot algoritmus: označme x i = x i x n + z N, i = 1..n a ỹ i = y i y m + z N, i = 1..m Generujme (x (b), y (b)) kde x (b) jsou bootstrapové výběry z x a y (b) jsou bootstrapové výběry z ỹ spočtem ˆθ (b) = x n(b) ỹ m (b) σ 21 (b)/n + σ22 (b)/m, b = 1..B pval = #(ˆθ (b) ˆθ) B

60 Příklad Bootstrap - konfidenční intervaly Máme opět data o myších, na prvních provedli operaci, na druhých ne X = (16, 23, 38, 94, 99, 141, 197) Y = (10, 27, 31, 40, 46, 50, 52, 104, 146)

61 Příklad Bootstrap - konfidenční intervaly Máme opět data o myších, na prvních provedli operaci, na druhých ne X = (16, 23, 38, 94, 99, 141, 197) Y = (10, 27, 31, 40, 46, 50, 52, 104, 146) P-hodnoty jednotlivých testů: (jednostranná alternativa) permutační neparametrický bootstrap bootstrap pro stř. hodnoty dvouvýběrový t-test 0.158

62 Jednovýběrové testy Mějme náhodný výběr X 1,..., X n předpokládejme normalitu dat, testujme H 0 : µ = µ 0

63 Jednovýběrové testy Mějme náhodný výběr X 1,..., X n předpokládejme normalitu dat, testujme H 0 : µ = µ 0 Můžeme použít jednovýběrový t-test - testová statistika: ˆθ(X) = X n µ 0 n σ má za platnosti H 0 t-rozdělení o n 1 stupních volnosti

64 Jednovýběrové testy Bootstrapový přístup: vyrobíme bootstrapové výběry X (b) = (X 1 (b),..., X n (b)), b = 1...B

65 Jednovýběrové testy Bootstrapový přístup: vyrobíme bootstrapové výběry X (b) = (X 1 (b),..., X n (b)), b = 1...B spočteme statistiky ˆθ (X(b)) = X n(b) X n n σ (b)

66 Jednovýběrové testy Bootstrapový přístup: vyrobíme bootstrapové výběry X (b) = (X 1 (b),..., X n (b)), b = 1...B spočteme statistiky ˆθ (X(b)) = X n(b) X n n σ (b) p-hodnota pro jednostrannou alternativu µ > µ 0 pak je pval = #(ˆθ (X(b)) > ˆθ(X)). B

67 Jednovýběrové testy Bootstrapový přístup: vyrobíme bootstrapové výběry X (b) = (X 1 (b),..., X n (b)), b = 1...B spočteme statistiky ˆθ (X(b)) = X n(b) X n n σ (b) p-hodnota pro jednostrannou alternativu µ > µ 0 pak je pval = #(ˆθ (X(b)) > ˆθ(X)). B Pro oboustrannou alternativu vzít absolutní hodnoty z testových statistik.

68 Jednovýběrové testy Srovnejme provedení jednovýběrový bootstrapový test s konstrukcí bootstrapového konfidenčního intervalu.

69 Jednovýběrové testy Srovnejme provedení jednovýběrový bootstrapový test s konstrukcí bootstrapového konfidenčního intervalu. konfidenční interval pomocí percentilů statistiky X n(b) X n n, σ (b) je tvořen takovými hodnotami µ 0, které tento bootstrapový test nezamítne

70 Příklad Bootstrap - konfidenční intervaly Máme opět data o myších. Někdo jiný provedl na svých myších operaci, a vyšla mu průměrná doba dožití 129.

71 Příklad Bootstrap - konfidenční intervaly Máme opět data o myších. Někdo jiný provedl na svých myších operaci, a vyšla mu průměrná doba dožití 129. To nám přijde hodně, protože naše myši se dožily: X = (16, 23, 38, 94, 99, 141, 197)

72 Příklad Bootstrap - konfidenční intervaly Máme opět data o myších. Někdo jiný provedl na svých myších operaci, a vyšla mu průměrná doba dožití 129. To nám přijde hodně, protože naše myši se dožily: X = (16, 23, 38, 94, 99, 141, 197) p-hodnoty jednotlivých testů: (jednostranná alternativa) bootstrapový test 0.10 jednovýběrový t-test 0.07

73 Literatura Bootstrap - konfidenční intervaly Efron B., Tibshirani R.J.:An Introduction to the Bootstrap, Chapman&Hall, 1993

74 Literatura Bootstrap - konfidenční intervaly Efron B., Tibshirani R.J.:An Introduction to the Bootstrap, Chapman&Hall, 1993 Konec

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

Intervalové Odhady Parametrů

Intervalové Odhady Parametrů Parametrů Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení technické v Praze

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

5. T e s t o v á n í h y p o t é z

5. T e s t o v á n í h y p o t é z 5. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné

Více

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin EuroMISE Centrum I. ÚVOD vv této přednášce budeme hovořit o jednovýběrových a dvouvýběrových testech týkajících se střední hodnoty

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Náhodný výběr Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

7. Analýza rozptylu.

7. Analýza rozptylu. 7. Analýza rozptylu. Uvedeme obecnou ideu, která je založena na minimalizaci chyby metodou nejmenších čtverců. Nejdříve uvedeme několik základních tvrzení. Uvažujeme náhodný vektor Y = (Y, Y,..., Y n a

Více

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin EuroMISE Centrum Kontakt: Literatura: Obecné informace Zvárová, J.: Základy statistiky pro biomedicínskéobory I. Vydavatelství

Více

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test Párový Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 motivační příklad Párový Příklad (Platová diskriminace) firma

Více

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D. Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost

Více

Jednostranné intervaly spolehlivosti

Jednostranné intervaly spolehlivosti Jednostranné intervaly spolehlivosti hledáme jen jednu z obou mezí Princip: dle zadání úlohy hledáme jen dolní či jen horní mez podle oboustranného vzorce s tou změnou, že výraz 1-α/2 ve vzorci nahradíme

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Zpracování dat v edukačních vědách - Testování hypotéz Kamila Fačevicová Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Obsah seminářů 5.11. Úvod do matematické

Více

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin Příklady k procvičení z Matematické statistiky Poslední úprava. listopadu 207. Konvergence posloupnosti náhodných veličin. Necht X, X 2... jsou nezávislé veličiny s rovnoměrným rozdělením na [0, ]. Definujme

Více

5 Parametrické testy hypotéz

5 Parametrické testy hypotéz 5 Parametrické testy hypotéz 5.1 Pojem parametrického testu (Skripta str. 95-96) Na základě výběru srovnáváme dvě tvrzení o hodnotě určitého parametru θ rozdělení f(x, θ). První tvrzení (které většinou

Více

Ing. Michael Rost, Ph.D.

Ing. Michael Rost, Ph.D. Úvod do testování hypotéz, jednovýběrový t-test Ing. Michael Rost, Ph.D. Testovaná hypotéza Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru, např. o parametru Θ, pak takovéto tvrzení

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

ÚVOD DO TEORIE ODHADU. Martina Litschmannová ÚVOD DO TEORIE ODHADU Martina Litschmannová Obsah lekce Výběrové charakteristiky parametry populace vs. výběrové charakteristiky limitní věty další rozdělení pravděpodobnosti (Chí-kvadrát (Pearsonovo),

Více

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní ..08 8cv7.tex 7. cvičení - transformace náhodné veličiny Definice pojmů a základní vzorce Je-li X náhodná veličina a h : R R je měřitelná funkce, pak náhodnou veličinu Y, která je definovaná vztahem X

Více

12. cvičení z PST. 20. prosince 2017

12. cvičení z PST. 20. prosince 2017 1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace

Více

Příklad datového souboru. Pravděpodobnost vs. statistika. Formální definice. Teorie odhadu

Příklad datového souboru. Pravděpodobnost vs. statistika. Formální definice. Teorie odhadu Pravděpodobnost vs. statistika Teorie pravděpodobnosti pracuje s jednou nebo více teoretickými náhodnými veličinami, jejichž rozdělení je známo Statistika odvozovali jsme charakteristiky těchto rozdělení

Více

BAYESOVSKÉ ODHADY. Michal Friesl V NĚKTERÝCH MODELECH. Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni

BAYESOVSKÉ ODHADY. Michal Friesl V NĚKTERÝCH MODELECH. Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni BAYESOVSKÉ ODHADY V NĚKTERÝCH MODELECH Michal Friesl Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni Slunce Řidiči IQ Regrese Přežití Obvyklý model Pozorování X = (X 1,..., X

Více

6. T e s t o v á n í h y p o t é z

6. T e s t o v á n í h y p o t é z 6. T e s t o v á n í h y p o t é z Na základě hodnot z realizace náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Používáme k tomu vhodně

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

Bodové a intervalové odhady parametrů v regresním modelu

Bodové a intervalové odhady parametrů v regresním modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model Mějme lineární regresní model (LRM) Y = Xβ + e, kde y 1 e 1 β y 2 Y =., e

Více

Deskriptivní statistické metody II. Míry polohy Míry variability

Deskriptivní statistické metody II. Míry polohy Míry variability Deskriptivní statistické metody II. Míry polohy Míry variability Jana Vránová, 3.lékařská fakulta UK, Praha Náhodný výběr všechny prvky výběru {x i }, i = 1, 2,, n, se chápou jako náhodné veličiny, které

Více

Pravděpodobnost a statistika

Pravděpodobnost a statistika Pravděpodobnost a statistika Bodové odhady a intervaly spolehlivosti Vilém Vychodil KMI/PRAS, Přednáška 10 Vytvořeno v rámci projektu 963/011 FRVŠ V. Vychodil (KMI/PRAS, Přednáška 10) Bodové odhady a intervaly

Více

Příklady na testy hypotéz o parametrech normálního rozdělení

Příklady na testy hypotéz o parametrech normálního rozdělení Příklady na testy hypotéz o parametrech normálního rozdělení. O životnosti 75W žárovky (v hodinách) je známo, že má normální rozdělení s = 5h. Pro náhodný výběr 0 žárovek byla stanovena průměrná životnost

Více

populace soubor jednotek, o jejichž vlastnostech bychom chtěli vypovídat letní semestr Definice subjektech.

populace soubor jednotek, o jejichž vlastnostech bychom chtěli vypovídat letní semestr Definice subjektech. Populace a Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 1 populace soubor jednotek, o jejichž vlastnostech bychom

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) cvičení z PSI 0-4 prosince 06 Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) Z realizací náhodných veličin X a Y s normálním rozdělením) jsme z výběrů daného rozsahu obdrželi

Více

8. Normální rozdělení

8. Normální rozdělení 8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, 2 ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) 2 e 2 2, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá

Více

Matematická statistika. Testy v. v binomickém. Test pravděpodobnosti. Test homogenity dvou. Neparametrické testy. statistika. Testy v.

Matematická statistika. Testy v. v binomickém. Test pravděpodobnosti. Test homogenity dvou. Neparametrické testy. statistika. Testy v. Opakování Opakování: y o střední hodnotě normálního 1 jednovýběrový t-test 2 párový t-test 3 výběrový t-test Šárka Hudecová Katedra a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy

Více

Základní statistické modely Statistické vyhodnocování exp. dat M. Čada ~ cada

Základní statistické modely Statistické vyhodnocování exp. dat M. Čada   ~ cada Základní statistické modely 1 Statistika Matematická statistika se zabývá interpretací získaných náhodných dat. Snažíme se přiřadit statistickému souboru vhodnou distribuční funkci a najít základní číselné

Více

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu) Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu) Frank Wilcoxon (1892 1965): Americký statistik a chemik Nechť X 1,..., X n je náhodný výběr ze

Více

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz. Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení

Více

Intervalové Odhady Parametrů II Testování Hypotéz

Intervalové Odhady Parametrů II Testování Hypotéz Parametrů II Testování Hypotéz Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení

Více

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.) Lékařská biofyzika, výpočetní technika I Biostatistika Josef Tvrdík (doc. Ing. CSc.) Přírodovědecká fakulta, katedra informatiky josef.tvrdik@osu.cz konzultace úterý 14.10 až 15.40 hod. http://www1.osu.cz/~tvrdik

Více

Přednáška X. Testování hypotéz o kvantitativních proměnných

Přednáška X. Testování hypotéz o kvantitativních proměnných Přednáška X. Testování hypotéz o kvantitativních proměnných Testování hypotéz o podílech Kontingenční tabulka, čtyřpolní tabulka Testy nezávislosti, Fisherůvexaktní test, McNemarůvtest Testy dobré shody

Více

12. prosince n pro n = n = 30 = S X

12. prosince n pro n = n = 30 = S X 11 cvičení z PSI 1 prosince 018 111 test střední hodnoty normálního rozdělení při známém rozptylu Teploměrem o jehož chybě předpokládáme že má normální rozdělení se směrodatnou odchylkou σ = 3 jsme provedli

Více

Vybrané partie z biostatistiky

Vybrané partie z biostatistiky 1 Úvod Vybrané partie z biostatistiky 10.7.2017, Běstvina Marie Turčičová (turcic@karlin.mff.cuni.cz), MFF UK Pracovat budeme v programu R a jeho nástavbě RStudio, které si můžete bezplatně stáhnout zde:

Více

Základy teorie odhadu parametrů bodový odhad

Základy teorie odhadu parametrů bodový odhad Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Odhady parametrů Úkolem výběrového šetření je podat informaci o neznámé hodnotě charakteristiky základního souboru

Více

Statistika pro každého. Párový test Test shody dvou rozptylů Dvouvýběrový t-test Porovnání středních hodnot při nestejných rozptylech

Statistika pro každého. Párový test Test shody dvou rozptylů Dvouvýběrový t-test Porovnání středních hodnot při nestejných rozptylech Statistika pro každého Párový test Test shody dvou rozptylů Dvouvýběrový t-test Porovnání středních hodnot při stejných rozptylech Testovací kuchařka 1 2 Párový t-test 1 2 Párový t-test -test užijeme v

Více

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

MATEMATICKÁ STATISTIKA.   Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci Matematická statistika Matematická statistika se zabývá matematickým

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,

Více

Charakteristika datového souboru

Charakteristika datového souboru Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex

Více

Výběrové charakteristiky a jejich rozdělení

Výběrové charakteristiky a jejich rozdělení Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO

Více

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal Základy navrhování průmyslových experimentů DOE II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal! Testování statistických hypotéz kvalitativní odezva kvantitativní chí-kvadrát test homogenity,

Více

prosince oboustranný symetrický 95% interval spolehlivosti pro střední hodnotu životnosti τ. X i. X = 1 n.. Podle CLV má veličina

prosince oboustranný symetrický 95% interval spolehlivosti pro střední hodnotu životnosti τ. X i. X = 1 n.. Podle CLV má veličina 10 cvičení z PSI 5-9 prosince 016 101 intervalový odhad Veličina X, představující životnost žárovky, má exponenciální rozdělení s parametrem τ Průměrná životnost n = 64 náhodně vybraných žárovek je x =

Více

diskriminaci žen letní semestr 2012 1 = výrok, o jehož pravdivosti chceme rozhodnout tvrzení o populaci, o jehož platnosti rozhodujeme

diskriminaci žen letní semestr 2012 1 = výrok, o jehož pravdivosti chceme rozhodnout tvrzení o populaci, o jehož platnosti rozhodujeme motivační příklad Párový Párový Příklad (Platová diskriminace) firma provedla šetření s cílem zjistit, zda dochází k platové diskriminaci žen Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky

Více

AKM CVIČENÍ. Opakování maticové algebry. Mějme matice A, B regulární, potom : ( AB) = B A

AKM CVIČENÍ. Opakování maticové algebry. Mějme matice A, B regulární, potom : ( AB) = B A AKM - 1-2 CVIČENÍ Opakování maticové algebry Mějme matice A, B regulární, potom : ( AB) = B A 1 1 ( A ) = ( A ) ( A ) = A ( A + B) = A + B 1 1 1 ( AB) = B A, kde A je řádu mxn a B nxk Čtvercová matice

Více

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Statistika, Biostatistika pro kombinované studium. Jan Kracík Statistika, Biostatistika pro kombinované studium Letní semestr 2014/2015 Tutoriál č. 6: ANOVA Jan Kracík jan.kracik@vsb.cz Obsah: Testování hypotéz opakování ANOVA Testování hypotéz (opakování) Testování

Více

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013 Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika Podrobnější rozpis okruhů otázek pro třetí část SZZ Verze: 13. června 2013 1 Úvodní poznámky 6 Smyslem SZZ by nemělo být toliko

Více

STANOVENÍ SPOLEHLIVOSTI GEOTECHNICKÝCH KONSTRUKCÍ. J. Pruška, T. Parák

STANOVENÍ SPOLEHLIVOSTI GEOTECHNICKÝCH KONSTRUKCÍ. J. Pruška, T. Parák STANOVENÍ SPOLEHLIVOSTI GEOTECHNICKÝCH KONSTRUKCÍ J. Pruška, T. Parák OBSAH: 1. Co je to spolehlivost, pravděpodobnost poruchy, riziko. 2. Deterministický a pravděpodobnostní přístup k řešení problémů.

Více

Testy. Pavel Provinský. 19. listopadu 2013

Testy. Pavel Provinský. 19. listopadu 2013 Testy Pavel Provinský 19. listopadu 2013 Test a intervalový odhad Testy a intervalové odhady - jsou vlastně to samé. Jiný je jen úhel pohledu. Lze přecházet od jednoho k druhému. Například: Při odvozování

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

Statistika. Testování hypotéz - statistická indukce Parametrické testy. Roman Biskup

Statistika. Testování hypotéz - statistická indukce Parametrické testy. Roman Biskup Statistika Testování hypotéz - statistická indukce Parametrické testy Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 1. února 01 Statistika by Birom

Více

Přijímací zkouška na navazující magisterské studium 2014

Přijímací zkouška na navazující magisterské studium 2014 Přijímací zkouška na navazující magisterské studium 24 Příklad (25 bodů) Spočtěte Studijní program: Studijní obor: Matematika Finanční a pojistná matematika Varianta A M x 2 dxdy, kde M = {(x, y) R 2 ;

Více

Cvičení 10. Přednášející: Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc.

Cvičení 10. Přednášející: Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. 10 Přednášející: Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení technické

Více

STATISTICKÉ ZJIŠŤOVÁNÍ

STATISTICKÉ ZJIŠŤOVÁNÍ STATISTICKÉ ZJIŠŤOVÁNÍ ÚVOD Základní soubor Všechny ryby v rybníce, všechny holky/kluci na škole Cílem určit charakteristiky, pravděpodobnosti Průměr, rozptyl, pravděpodobnost, že Maruška kápne na toho

Více

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 Opakování t- vs. neparametrické Wilcoxonův jednovýběrový test Opakování

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

Odhady Parametrů Lineární Regrese

Odhady Parametrů Lineární Regrese Odhady Parametrů Lineární Regrese Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké

Více

Testování statistických hypotéz. Obecný postup

Testování statistických hypotéz. Obecný postup poznámky k MIII, Tomečková I., poslední aktualizace 9. listopadu 016 9 Testování statistických hypotéz Obecný postup (I) Vyslovení hypotézy O datech vyslovíme doměnku, kterou chceme ověřit statistickým

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 7. Testování statistických hypotéz Mgr. David Fiedor 30. března 2015 Osnova 1 2 3 Dělení testů parametrické - o parametrech rozdělení základního souboru (průměr, rozptyl,

Více

Přijímací zkouška na navazující magisterské studium 2017

Přijímací zkouška na navazující magisterské studium 2017 Přijímací zkouška na navazující magisterské studium 27 Studijní program: Studijní obor: Matematika Finanční a pojistná matematika Varianta A Řešení příkladů pečlivě odůvodněte. Věnujte pozornost ověření

Více

Normální rozložení a odvozená rozložení

Normální rozložení a odvozená rozložení I Normální rozložení a odvozená rozložení I.I Normální rozložení Data, se kterými pracujeme, pocházejí z různých rozložení. Mohou být vychýlena (doleva popř. doprava, nebo v nich není na první pohled vidět

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů Na analýzu rozptylu lze pohlížet v podstatě

Více

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak. 8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) e, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá normované

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními

Více

STATISTICKÉ TESTY VÝZNAMNOSTI

STATISTICKÉ TESTY VÝZNAMNOSTI STATISTICKÉ TESTY VÝZNAMNOSTI jsou statistické postupy, pomocí nichž ověřujeme, zda mezi proměnnými existuje vztah (závislost, rozdíl). Pokud je výsledek šetření statisticky významný (signifikantní), znamená

Více

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457. 0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti

Více

Cvičení ze statistiky - 8. Filip Děchtěrenko

Cvičení ze statistiky - 8. Filip Děchtěrenko Cvičení ze statistiky - 8 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Centrální limitní věta Laplaceho věta (+ korekce na spojitost) Konfidenční intervaly

Více

Charakterizace rozdělení

Charakterizace rozdělení Charakterizace rozdělení Momenty f(x) f(x) f(x) μ >μ 1 σ 1 σ >σ 1 g 1 g σ μ 1 μ x μ x x N K MK = x f( x) dx 1 M K = x N CK = ( x M ) f( x) dx ( xi M 1 C = 1 K 1) N i= 1 K i K N i= 1 K μ = E ( X ) = xf

Více

ODHADY NÁVRATOVÝCH HODNOT

ODHADY NÁVRATOVÝCH HODNOT ODHADY NÁVRATOVÝCH HODNOT KLIMATOLOGICKÝCH DAT Katedra aplikované matematiky Fakulta přírodovědně-humanitní a pedagogická Technická univerzita v Liberci Robust 2018 ÚVOD Velká pozornost v analýze extrémních

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel Analýza rozptylu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 1 / 30 Analýza

Více

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) . Statistika Teorie odhadu statistická indukce Intervalový odhad µ, σ 2 a π Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 21. února 2012 Statistika

Více

Pravděpodobnost a statistika

Pravděpodobnost a statistika Pravděpodobnost a statistika Normální rozdělení a centrální limitní věta Vilém Vychodil KMI/PRAS, Přednáška 9 Vytvořeno v rámci projektu 2963/2011 FRVŠ V. Vychodil (KMI/PRAS, Přednáška 9) Normální rozdělení

Více

Intervalová data a výpočet některých statistik

Intervalová data a výpočet některých statistik Intervalová data a výpočet některých statistik Milan Hladík 1 Michal Černý 2 1 Katedra aplikované matematiky Matematicko-fyzikální fakulta Univerzita Karlova 2 Katedra ekonometrie Fakulta informatiky a

Více

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica Úloha A) koncentrace glukózy v krvi V této části posoudíme pomocí párového testu, zda nový lék prokazatelně snižuje koncentraci

Více

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA STROJNÍHO INŽENÝRSTVÍ FACULTY OF MECHANICAL ENGINEERING ÚSTAV MATEMATIKY INSTITUTE OF MATHEMATICS POROVNÁNÍ TESTŮ NULOVOSTI KORELAČNÍHO

Více

NMFM301 Statistika pro finanční matematiky. Michal Kulich

NMFM301 Statistika pro finanční matematiky. Michal Kulich NMFM301 Statistika pro finanční matematiky Přehledový větník Michal Kulich Naposledy upraveno dne 27. září 2014. Katedra pravděpodobnosti a matematické statistiky Matematicko-fysikální fakulta University

Více

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina. Parametrické metody odhadů z neúplných výběrů 2 1 Metoda maximální věrohodnosti pro cenzorované výběry 11 Náhodné cenzorování Při sledování složitých reálných systémů často nemáme možnost uspořádat experiment

Více

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) 1) Význam a využití statistiky v biologických vědách a veterinárním lékařství ) Rozdělení znaků (veličin) ve statistice 3) Základní a

Více

správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B.

správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B. Zkouška z předmětu KMA/PST. Anotace předmětu Náhodné jevy, pravděpodobnost, podmíněná pravděpodobnost. Nezávislé náhodné jevy. Náhodná veličina, distribuční funkce. Diskrétní a absolutně spojitá náhodná

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 8. KAPITOLA STATISTICKÉ TESTOVÁNÍ HYPOTÉZ 22.11.2016 Opakování: CLV příklad 1 Zadání: Před volbami je v populaci státu 52 % příznivců

Více

Regresní analýza 1. Regresní analýza

Regresní analýza 1. Regresní analýza Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému

Více

Matematická statistika Zimní semestr Testy o proporci

Matematická statistika Zimní semestr Testy o proporci Testy o proporci 18.12.2018 Jednovýběrový problém pro binární data. V roce 2008 se v České republice živě narodilo 119 570 dětí, z toho 58 244 dívek a 61 326 chlapců (zdroj ČSÚ). Zajímá nás, zda je pravděpodobnost

Více

PRAVDĚPODOBNOST A STATISTIKA. Testování hypotéz o rozdělení

PRAVDĚPODOBNOST A STATISTIKA. Testování hypotéz o rozdělení PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz o rozdělení Testování hypotéz o rozdělení Nechť X e náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládeme, že neznáme tvar distribuční funkce

Více

6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový.

6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový. 6. ZÁKLADY STATIST. ODHADOVÁNÍ X={X 1, X 2,..., X n } výběr z rozdělení s F (x, θ), θ={θ 1,..., θ r } - vektor reálných neznámých param. θ Θ R k. Θ parametrický prostor. Dva základní způsoby odhadu neznámého

Více

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně Testování hypotéz Nechť,, je náhodný výběr z nějakého rozdělení s neznámými parametry. Máme dvě navzájem si odporující hypotézy o parametrech daného rozdělení: Nulová hypotéza parametry (případně jediný

Více

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová VYBRANÉ DVOUVÝBĚROVÉ TESTY Martina Litschmannová Obsah přednášky Vybrané dvouvýběrové testy par. hypotéz test o shodě rozptylů (F-test), testy o shodě středních hodnot (t-test, Aspinové-Welchův test),

Více

Návrh a vyhodnocení experimentu

Návrh a vyhodnocení experimentu Návrh a vyhodnocení experimentu Návrh a vyhodnocení experimentů v procesech vývoje a řízení kvality vozidel Ing. Bohumil Kovář, Ph.D. FD ČVUT Ústav aplikované matematiky kovar@utia.cas.cz Mladá Boleslav

Více