RNDr. Marie Forbelská, Ph.D. 1

Rozměr: px
Začít zobrazení ze stránky:

Download "RNDr. Marie Forbelská, Ph.D. 1"

Transkript

1 RNDr. Marie Forbelská, Ph.D. 1 M cvičení : M6120cv07 (Klasický lineární regresní model) A. Klasický lineární regresní model, modely neúplné hodnosti, rozšířený lineární regresní model a vážená metoda nejmenších čtverců. Mějme regresní model plné hodnosti: Y=Xβ+ ε h(x)=h(x X)=p+1 n > p+1 ε L n (0,σ 2 I n ) vektor závisle proměnných Y=(Y 1,...,Y n ) matice plánu X=(x ij ) i=1,...,n; j=0,...,p vektor chyb ε=(ε 1,...,ε n ), Eε=0, Dε=σ 2 I n ; Odhad neznámých parametrů β provedený metodou nejmenších čtverců je řešením normálních rovnic X Xβ=X Y a platí: β=(x X) 1 X Y Označme Ŷ = Xˆβ=X ( X X ) 1 X Y=HY }{{} H ˆε = Y Ŷ=(I } H {{} )Y=MY=M(Xβ+ ε))=mx }{{} β+mε=(i H)ε M =0 s 2 S = e n p 1 = 1 1 n p 1 (Y Ŷ) (Y Ŷ)= n p 1ˆε ˆε= 1 1 n p 1Ŷ (I H)Ŷ= Platí E β= β Es 2 = E(Se) n p 1 = σ2, tj. s 2 je nestranným odhadem rozptylu D β= σ 2 (X X) 1 Platí li navíc ε N n (0,σ 2 I n ), pak Y N n (Xβ,σ 2 I n ) ε N n (O,σ 2 (I H)) β Np+1 (β,σ 2 (X X) 1 ) S e σ 2 χ 2 (n p 1) β a s 2 jsou stochasticky nezávislé T j = ˆβ j β j t(n p 1), kde(x X) 1 =(v ij ) i,j=0,...,p s 2 v jj n p 1 ε (I H)ε F= 1 (ˆβ qs 2 2 β 2 ) W 1 (ˆβ 2 β 2 ) F(q,n p 1), ( ) ( ) ( ) V U kde (X X) 1 β1 ˆβ1 =, β= ˆβ= a h(w)=q U W β 2 ˆβ 2 c T= ˆβ c β t(n p 1), kde c=(c s 0,c 1,...,c p ) a E(c β)=c β 2 c (X X) 1 c Y i =x i β+ ε i N(x i β,σ2 ) Ŷ i =x i β N(x i β,σ2 x i (X X) 1 x i ) kde x i =(x i0,...,x ip ) je i-tý řádek matice plánux } Y i Ŷi N(0,σ 2 (1+x i (X X) 1 x i ))

2 2 Lineární statistické modely II (7. cvičení) pro parametry β j j=0,..., p Intervaly spolehlivosti β j t 1 α2 (n p 1)s v jj, β j+ t 1 α2 (n p 1)s v jj pro střední hodnotu predikce EŶi=Ex i b β=x iβ pro predikci Ŷ i=x i b β i=1,..., n x i b β t 1 α2 (n p 1)s p x i (X X) 1 x i, x i b β+ t 1 α2 (n p 1)s p x i (X X) 1 x i x i b β t 1 α2 (n p 1)s p 1+x i (X X) 1 x i,x i b β+t 1 α2 (n p 1)s p 1+x i (X X) 1 x i kde t 1 α 2 (n p 1) je1 α 2 kvantil Studentova rozdělení o n p 1 stupních volnosti Až doposud jsme uvažovali lineární regresní model plné hodnosti. V některých situacích je však vhodné použít model s neúplnou hodností, tj. h(x)=r<k n. V tom případě systém normálních rovnic má nekonečně mnoho řešení, takže žádný vektor středních hodnot EY=µ=Xβ neurčuje jednoznačně vektor β. Není však vyloučeno, že existují nějaké lineární kombinace vektoru β, jejichž hodnoty jsou vektorem středních hodnot µ M(X) určeny jednoznačně. Ukazuje se (viz Anděl, 1978), že těmito hledanými vektory jsou (nestranně lineárně) odhadnutelné parametrické funkce θ=c β. Jejich důležitou vlastností je, že jsou to právě lineární kombinace řádků matice X, tj. c M(X ). Pokud máme vektor θ=(θ 1,...,θ m ), m N, jehož složky jsou odhadnutelné, jde o odhadnutelný vektor parametrů. Dá se ukázat (viz Anděl, 1978), že nejlepším nestranným lineárním odhadem odhadnutelné parametrické funkce θ=c β jeˆθ=c β, kde β je libovolné řešení normálních rovnic. Odtud je ihned vidět, že vektor středních hodnot µ=ey=xβ je vždy odhadnutelný a jeho nejlepší nestranný lineární odhad je tvaru µ=x(x X) - X Y=HY. Platí li navícy N n (Xβ,σ 2 I n ), pak (viz Anděl, 1978) (1) Statistika S e /σ 2 = 1 σ 2 (Y X β) (Y X β)= 1 σ 2 Y [I n H]Y χ 2 (n r). (2) Statistika s 2 = Se n r je nestranným odhadem parametru σ2. (3) Vektor β=(x X) - X Y a s 2 jsou nezávislé. (4) Statistika T= q c β c b β s c (X X) - c t(n r). Někdy musíme vzít současně se základním lineárním modelem v úvahu i několik speciálních případů tohoto modelu, kterým se říká podmodely nebo submodely. Mějme náhodný vektory=(y 1,...,Y n ) a předpokládejme, že platí model M a jsou dány další dva submodely M 1 a M 2, přičemž pro n k r r 1 r 2 máme M Y N n (Xβ,σ 2 I n ), X je typu n k, h(x)=r, β je typu k 1 M 1 Y N n (Uβ 1,σ 2 I n ), U je typu n k 1, h(u)=r 1, β 1 je typu k 1 1 M 2 Y N n (Tβ 2,σ 2 I n ), T je typu n k 2, h(t)=r 2, β 2 je typu k 2 1 Položme µ 1 = U(U U) - U Y a µ 2 = T(T T) - T Y, pak (viz Anděl, 1978) (5) platí-li model M 1 F 1 = (bµ bµ 1 ) (bµ bµ 1 ) 1 r r 1 s F(r r 2 1,n r), (6) platí-li model M 2 F 2 = (bµ 1 bµ 2 ) (bµ 1 bµ 2 ) r 1 r 2 1 s 2 F(r 1 r 2,n r).

3 RNDr. Marie Forbelská, Ph.D. 3 Podmodel vzniklý vypuštěním sloupců matice plánu. Podmodel může být dán požadavkem vynechat z matice plánu X některé sloupce. Bez újmy na obecnosti předpokládejme, že matice, které určují model a podmodel se liší právě posledními sloupci maticex, takže X=(X 0,X 1 ). Mějme náhodný vektory=(y 1,...,Y n ) a předpokládejme, že platí model M a je dán submodel M 0, přičemž M Y N n (Xβ,σ 2 I n ) kdex je typu n k, h(x)=r, β je typu k 1 M 0 Y N n (X 0 β 0,σ 2 I n ) kdex 0 je typu n k 0, h(x 0 )=r 0, β 0 je typu k 0 1 kde n k r r 0 Podle definice ) model M 0 je podmodelem M pokud X 0 =XK, v našem případě matice K= je typu k k 0. ( Ik0 0 Položme µ=hy=x(x X) - X Y a µ 0 =H 0 Y=X 0 (X 0 X 0) - X 0 Y, pak Pokud platí model M 0, pak statistika S e =(Y µ) (Y µ) S e0 =(Y µ 0 ) (Y µ 0 ) S 0 =( µ µ 0 ) ( µ µ 0 ) S e = S e0 S 0 F 0 = (S e 0 S e )/(r r 0 ) S e /(n r) F(r r 0,n r). Rozšířený lineární regresní model a vážená metoda nejmenších čtverců. Mějme regresní model, ve kterémy=xβ+ε, ε L n (0,σ 2 V),V>0, a hodnost matice h(x) = k (tj. V je pozitivně definitní), pak odhad pomocí metody nejmenších čtverců je roven β=(x V 1 X) 1 X V 1 Y, což lze snadno dokázat. Vzhledem k předpokaduv>0(tj.vje pozitivně definitní) existujev 1 2, která je symetrická a regulární. Proto h(v 1 2X)=h(X)=k=h(X V 1 X)=h(X V 1 2V 1 2X) takžex V 1 X je regulární. Položme Z=V 1 2 Y, F=V 1 2 X, η=v 1 2 ε. Pak z Y=Xβ+ ε plyne, že V 1 2Y=V 1 2Xβ+V 1 2ε, tj. Z=Fβ+ η. Pak a Eη= EV 1 2ε=V 1 2 }{{} Eε =0 =0 Dη= D(V 1 2ε)=σ 2 V 1 2VV 1 2= σ 2 V 1 2V 1 2V 1 2V 1 2= σ 2 I n a tento model již splňuje předpoklady klasického lineárního regresního modelu, ve kterém odhad vektoru neznámých parametrů metodou nejmenších čtverců je roven β=(f F) 1 F Z=(X V 1 2V 1 2X) 1 X V 1 2V 1 2Y=(X V 1 X) 1 X V 1 Y.

4 4 Lineární statistické modely II (7. cvičení) Nejčastěji se maticevuvažuje jako diagonální matice ve tvaru V=diag{v 1,...,v n }. Položíme-li W=V 1 = diag{ 1 v 1,..., 1 v n }=diag{w 1,...,w n }, přičemž prvky w 1,...,w n se nazývají váhami (tedy čím je rozptyl větší, tím je váha pozorování menší). Pak odhad neznámých parametrů metodou nejmenších čtverců: β=(x WX) 1 X WY se nazývá vážená metoda nejmenších čtverců. Poznámka: V prostředí R se ve funkci lm() přidá parametr weights. B. Testování rovnoběžnosti a shodnosti dvou regresních přímek Mějme dva nezávislé náhodné výběry a k tomu odpovídající hodnoty regresorů Y 11,...,Y 1n1 (resp. Y 21,...,Y 2n1 ) x 11,...,x 1n1 (resp. x 21,...,x 2n2 ). Předpokládejme, že Y 1i = a 1 + b 1 x 1i + ε 1i, ε 1i N(0,σ 2 ) i=1,...,n 1 Y 2i = a 2 + b 2 x 2i + ε 2i ε 2i N(0,σ 2 ) i=1,...,n 2 Vytvořme společný regresní model: Y 11 1 x Y 1n1 Y 21 = 1 x 1n x a 1 b 1 a 2 b 2 + ε 11. ε 1n1 ε Y 2n x 2n2 ε 2n2 Vyjádřeno blokově: ( Y1 Y 2 ) ( X1 0 = 0 X 2 Pak ( ) ( ) X X X= 1 X 1 0 X 0 X 2 X, X Y= 1 Y 1 2 X 2 Y 2 )( β1 a β 2 ) ( ε1 + ε 2 ) ) ( β1 β= = β 2 Označme ) ( ) ( ) (ˆε1 Y ˆε=Y Ŷ=Y X β= = 1 Ŷ1 Y = 1 X 1 β1 ˆε 2 Y 2 Ŷ2 Y 2 X 2 β2 ( (X 1 X 1 ) 1 X 1 Y ) 1 (X 2 X 2) 1 X 2 Y. 2 S e = ε ε= ε 1 ε 1 + ε 2 ε 2 = S e1 + S e2 s 2 1 = Se 1 n 1 2 = bε 1 bε 1 n 1 2, s2 2 = Se 1 n 2 2 = bε 2 bε 2 n 2 2 s 2 S = e n 1 +n 2 4 = (n 1 2)s 2 1 +(n 2 2)s 2 2 n 1 +n 2 4

5 RNDr. Marie Forbelská, Ph.D. 5 Testování rovnoběžnosti dvou regresních přímek Při testování hypotézy H 0 : b 1 = b 2 proti alternativě H 1 : b 1 b 2 využijeme toho, že statistika c T= ˆβ c β t(n p 1). s 2 c (X X) 1 c Položmec=(0,1,0, 1), pak c (X X) 1 c=v 22 + v 44, přičemž (X X) 1 =(v ij ) i,j=1,...,4. Za platnosti nulové hypotézy statistika T 0 = ˆb 1 ˆb 2 s v 22 +v 44 t(n 1 + n 2 4). Nulovou hypotézu zamítáme na hladině významnosti α pokud t 0 > t 1 α 1+ n 2 2 4) nebo p-value p 0 = P(T 0 > t 0 ) < α 2. Testování shodnosti dvou regresních přímek Budeme testovat hypotézu H 0 : β 1 = β 2 proti alternativě H 1 : β 1 β 2. Využijeme vztahů K 2 = Se β 1 β ( 2 N σ 2 = (n 1+n 2 4)s 2 σ χ 2 (n n 2 4) β 1 β 2,σ 2( (X 1 X 1) 1 +(X 2 X 2) 1 }{{} W a za platnosti H 0 K 1 = 1 σ 2 ( β1 β 2 ) W 1 ( β1 β 2 ) χ 2 (2) pak F 0 = K 1 /2 K 2 /(n 1 +n 2 4) = 1 Nulovou hypotézu zamítáme na hladině významnosti α ) ) 2s 2 ( β1 β 2 ) W 1 ( β1 β 2 ) F(2,n1 +n 2 4) pokud f 0 < F α 2 (2,n 1+ n 2 4) nebo f 0 > F 1 α 2 (2,n 1+ n 2 4) nebo p-value p 0 = P(F > f 0 ) < α 2 nebo 1 p 0 < α 2. Ověřování shodnosti rozptylů Při testování hypotézy H 0 : σ1 2= σ2 2 proti alternativě H 1: σ1 2 σ2 2 statistika F 0 za platnosti H 0 má F-rozdělení využijeme toho, že F 0 = Se 1 (n 1 2)σ 2 Se 2 = s2 1 s 2 (n 2 2)σ 2 2 F(n 1 2,n 2 2) Nulovou hypotézu zamítáme na hladině významnosti α pokud f 0 < F α 2 (n 1 2,n 2 2) nebo f 0 > F 1 α 2 (n 1 2,n 2 2) nebo p-value p 0 = P(F 0 > f 0 ) < α 2 nebo 1 p 0 < α 2. Reference: Anděl, J. Matematická statistika. SNTL, ALFA Praha 1978

6 6 Lineární statistické modely II (7. cvičení) Příklad 1: Rozvodovost v České a Slovenské republice ( ) V celostátních statistikách byl v letech sledován počet rozvodů na 1000 obyvatel zvlášt pro Českou a Slovenskou republiku. Do proměnných y1 a y2 vložíme počty rozvodů na 1000 obyvatel pro jednotlivé republiky. > TXT <- "Rozvodovost v CR a SR v letech " > TxtY <- "pocet rozvodu na 1000 obyvatel" > TxtX <- "roky" > TxtGr <- "republika" > y1 <- c(1.34, 1.45, 1.47, 1.52, 1.48, 1.66, 1.77, 1.76, 1.89, 2.08, 2.19) > y2 <- c(0.58, 0.59, 0.58, 0.55, 0.54, 0.57, 0.64, 0.57, 0.67, 0.75, 0.76) > xtime <- 1960:1970 Hodnoty obou republik vykreslíme do jediného grafu pomocí funkce matplot(). Do grafu zakreslíme také regresní přímky. > matplot(xtime, cbind(y1, y2), type = "o", xlab = TxtX, main = TXT, ylab = paste(txty, ": CR(1), SR(2)", sep = ""), lty = 1, col = c("darkblue", "darkgreen")) > abline(lm(y1 ~ xtime), col = "lightblue3", lty = 1) > abline(lm(y2 ~ xtime), col = "lightgreen", lty = 1) Rozvodovost v CR a SR v letech pocet rozvodu na 1000 obyvatel: CR(1), SR(2) roky Obrázek 1: matplot: pro data Rozvodovost v České a Slovenské republice v letech

7 RNDr. Marie Forbelská, Ph.D. 7 Pro obě dvě republiky provedeme odhad všech parametrů regresní přímky pomocí funkce lm(). Kvůli vysokým x vým hodnotám se doporučuje proměnnou x (roky) centrovat. > n <- length(xtime) > xshift <- mean(xtime) > model.cr <- lm(y1 ~ I(xtime - xshift)) > summary(model.cr) Call: lm(formula = y1 ~ I(xtime - xshift)) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-14 *** I(xtime - xshift) e-06 *** --- Signif. codes: 0 *** ** 0.01 * Residual standard error: on 9 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 1 and 9 DF, p-value: 1.534e-06 > model.sr <- lm(y2 ~ I(xtime - xshift)) > summary(model.sr) Call: lm(formula = y2 ~ I(xtime - xshift)) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-11 *** I(xtime - xshift) ** --- Signif. codes: 0 *** ** 0.01 * Residual standard error: on 9 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 1 and 9 DF, p-value:

8 8 Lineární statistické modely II (7. cvičení) Testování homogenity rozptylu Chceme li testovat rovnoběžnost a shodnost obou přímek, musíme nejprve otestovat homogenitu rozptylu pomocí statistiky F 0 = s 2 1 /s2 2 F(n 1 2,n 2 2). Pomocí funkcesummary() získáme odhady statistik s 2 1 a s2 2 (vizresidual standard error v předchozích výpisech) a spočítáme hodnotu statistiky F 0. > (s.cr <- summary(model.cr)$sigma) [1] > (s.sr <- summary(model.sr)$sigma) [1] > (f0 <- s.cr^2/s.sr^2) [1] Abychom mohli provést testování, potřebuje mít bud kritickou hodnotu testu nebo příslušnou p hodnotu. K tomu potřebujeme znát stupně volnosti, zbytek spočítáme pomocí distribuční a kvantilové funkce F rozdělení. > (nu.sigma.cr <- model.cr$df.residual) [1] 9 > (nu.sigma.sr <- model.sr$df.residual) [1] 9 > (F.kritH <- qf(0.975, nu.sigma.cr, nu.sigma.sr)) [1] > (F.kritD <- qf(0.025, nu.sigma.cr, nu.sigma.sr)) [1] > (pvalf0 <- 1 - pf(f0, nu.sigma.cr, nu.sigma.sr)) [1]

9 RNDr. Marie Forbelská, Ph.D. 9 Protože konkrétní hodnota f 0 = statistiky F neleží v kritické oblasti testu W α = {(0, ) ( , )} a také p hodnota není menší než 0.05, nezamítáme hypotézu o shodě rozptylu. Testování rovnoběžnosti přímek Při testování hypotézy H 0 : b 1 = b 2 proti alternativě H 1 : b 1 b 2 využijeme toho, že statistika T= ˆb 1 ˆb 2 s v 22 +v 44 t(n 1 + n 2 4). Diagonální prvky matice(x X) 1 získáme pomocí funkce summary(). > (vjj.cr <- diag(summary(model.cr)$cov.unscaled)) (Intercept) I(xtime - xshift) > (vjj.sr <- diag(summary(model.sr)$cov.unscaled)) (Intercept) I(xtime - xshift) Protože obě regresní přímky byly odhadnuty na základě stejného počtu pozorování, tak vážený průměr obou rozptylů je obyčejným aritmetickým průměrem. A pak již snadno spočítáme hodnotu testové statistiky a příslušnou kritickou hodnotu a p hodnotu. > (s2 <- 0.5 * (s.cr^2 + s.sr^2)) [1] > (t0 <- (coef(model.cr)[2] - coef(model.sr)[2])/sqrt(s2 * (vjj.cr[2] + vjj.sr[2]))) I(xtime - xshift) > (t.krit <- qt(0.975, nu.sigma.cr + nu.sigma.sr)) [1] > (pvalt <- 2 * (1 - pt(t0, nu.sigma.cr + nu.sigma.sr))) I(xtime - xshift) e-06

10 10 Lineární statistické modely II (7. cvičení) Protože vypočtená hodnota t 0 = W α = {(, ) ( , )} a také p hodnota je menší než 0.05, proto zamítáme nulovou hypotézu o rovnoběžnosti obou přímek. Testování shodnosti přímek Testování shodnosti přímek provedeme pomocí F statistiky kde F 0 = 1 2s 2 ( β1 β 2 ) W 1 ( β1 β 2 ) F(2,n1 +n 2 4) W=(X 1 X 1) 1 +(X 2 X 2) 1 Nejprve spočítáme maticiw, pak její inverzní matici pomocí funkce solve(). > W <- summary(model.cr)$cov.unscaled + summary(model.sr)$cov.unscaled > (invw <- solve(w)) (Intercept) I(xtime - xshift) (Intercept) e e-16 I(xtime - xshift) e e+01 Nakonec dopočítáme hodnotu statistiky F 0, kritické hodnoty a p hodnotu. > diffbeta <- as.matrix(coef(model.cr) - coef(model.sr)) > F0 <- t(diffbeta) %*% invw %*% diffbeta > (F0 <- F0/(2 * s2)) [,1] [1,] > (F0.kritH <- qf(0.975, 2, nu.sigma.cr + nu.sigma.sr)) [1] > (F0.kritD <- qf(0.025, 2, nu.sigma.cr + nu.sigma.sr)) [1] > (pvalf00 <- 1 - pf(f0, 2, nu.sigma.cr + nu.sigma.sr)) [,1] [1,] 0 Protože konkrétní hodnota f 0 = statistiky F 0 leží v kritické oblasti testu W α = {(0, ) ( , )} a také p hodnota je menší než 0.05, zamítáme hypotézu o shodě regresních přímek.

11 RNDr. Marie Forbelská, Ph.D. 11 Testování rovnoběžnosti a shodnosti přímek pomocí podmodelů Předchozí postup testování rovnoběžnosti a shodnosti dvou přímek je velmi pracný. Naštěstí totéž můžeme provést mnohem jednodušším postupem, a to pomocí podmodelů. Vytvoříme jediný regresní model s využitím kategoriální proměnné, která bude udávat, zda se jedná o data jedné či druhé republiky. Dostaneme tak tzv. ANCOVA model nebo též mluvíme o analýze kovariance. ANCOVA modely jsou lineární regresní modely, jejichž závisle proměnné (nazývané též kovariáty či regresory) jsou jak spojité, tak kategoriální. Ve shodě s implicitním nastavení kontrastů v prostředí R vytvoříme jediný regresní model a to tak, abychom vypuštěním jednoho sloupce mohli testovat i rovnoběžnost přímek. Plný model, který označíme jako M, bude mít různé koeficienty α i β, tedy předpokládá, že přímky mohou být různoběžné. M : Y ji = α+α 2 +(β+ β 2 )x ji + ε ji kde j=1,2 i=1,...,n j (n 1 = n 2 =11) a parametry α 2 a β 2 budou nulové pro Českou republiku a pro Slovenskou republiku budou značit odchylku od parametru α (Intercept), resp. β (směrnice přímky). Nejprve vytvoříme datový rámec. > data <- data.frame(x = rep(xtime - xshift, 2), y = c(y1, y2), gr = c(rep("cr", n), rep("sr", n))) > str(data) data.frame : 22 obs. of 3 variables: $ x : num $ y : num $ gr: Factor w/ 2 levels "CR","SR": Nyní pomocí funkce lm() provedeme odhad modelu M. Všimněme si, jak zadáme různé směrnice i průsečíky (y ~ x * gr), což lze také zapsat názornější a tím i delší formou y ~ x + gr + x:gr. > model.m <- lm(y ~ x * gr, data) > summary(model.m) Call: lm(formula = y ~ x * gr, data = data) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) < 2e-16 *** x e-10 *** grsr < 2e-16 ***

12 12 Lineární statistické modely II (7. cvičení) x:grsr e-06 *** --- Signif. codes: 0 *** ** 0.01 * Residual standard error: on 18 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 3 and 18 DF, p-value: < 2.2e-16 Vypočteme koeficienty obou přímek. > (Coef.M <- coef(model.m)) (Intercept) x grsr x:grsr > a1.m <- Coef.M[1] > a2.m <- Coef.M[1] + Coef.M[3] > b1.m <- Coef.M[2] > b2.m <- Coef.M[2] + Coef.M[4] > txtcoef.m <- paste("a1 =", round(a1.m, 3), " a2 =", round(a2.m, 3), " b1 =", round(b1.m, 3), " b2 =", round(b2.m, 3)) > cat(paste("model M :", txtcoef.m, "\n")) Model M : a1 = a2 = b1 = 0.08 b2 = Vykreslíme do jednoho grafu obě dvě přímky, přidáme intervaly spolehlivosti kolem střední hodnoty a prediční intervaly. > pred.m.cr <- predict(model.m, newdata = data.frame(x = xtime - xshift, gr = "CR")) > pred.m.sr <- predict(model.m, newdata = data.frame(x = xtime - xshift, gr = "SR")) > CR.ci.conf.M <- predict(model.m, newdata = data.frame(x = xtime - xshift, gr = "CR"), interval = "confidence") > CR.ci.pred.M <- predict(model.m, newdata = data.frame(x = xtime - xshift, gr = "CR"), interval = "prediction") > SR.ci.conf.M <- predict(model.m, newdata = data.frame(x = xtime - xshift, gr = "SR"), interval = "confidence") > SR.ci.pred.M <- predict(model.m, newdata = data.frame(x = xtime - xshift, gr = "SR"), interval = "prediction") > yrange <- range(c(data$y, pred.m.cr, pred.m.sr)) > plot(xtime[c(1, n)], yrange, type = "n", xlab = TxtX, main = TXT, ylab = TxtY) > matlines(xtime, cbind(y1, y2), type = "o", pch = c(21, 22), bg = c("red", "cyan"), lty = c(1, 1), col = c("darkred", "darkcyan")) > matlines(xtime, cbind(pred.m.cr, pred.m.sr), lty = c(1, 1), col = c("dodgerblue", "darkgreen"), lwd = 2) > matlines(xtime, cbind(cr.ci.conf.m[, 2:3], SR.ci.conf.M[, 2:3]), lty = c(2, 2, 2, 2), col = c("lightblue4", "lightblue4", "lightgreen", "lightgreen"), lwd = 2) > matlines(xtime, cbind(cr.ci.pred.m[, 2:3], SR.ci.pred.M[, 2:3]), lty = c(3, 3, 3, 3), col = c("lightblue4", "lightblue4", "lightgreen", "lightgreen"), lwd = 2) > mtext(txtcoef.m)

13 RNDr. Marie Forbelská, Ph.D. 13 Rozvodovost v CR a SR v letech a1 = a2 = b1 = 0.08 b2 = pocet rozvodu na 1000 obyvatel roky České a Slovenské re- Obrázek 2: Různoběžné regresní přímky pro data Rozvodovost v publice v letech Nyní budeme uvažovat podmodel modelu M, kdy v matici plánu vypustíme poslední sloupec. Model bude tvaru M 1 : Y ji = α+α 2 + βx ji + ε ji kde j=1,2 i=1,...,n j (n 1 = n 2 =11) a parametr α 2 bude nulový pro Českou republiku a pro Slovenskou republiku bude značit odchylku od parametru α (Intercept). Nyní pomocí funkce lm() provedeme odhad modelu M 1. > model.m1 <- lm(y ~ x + gr, data) > summary(model.m1) Call: lm(formula = y ~ x + gr, data = data) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) < 2e-16 *** x e-05 *** grsr e-14 *** --- Signif. codes: 0 *** ** 0.01 *

14 14 Lineární statistické modely II (7. cvičení) Residual standard error: on 19 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 2 and 19 DF, p-value: 5.988e-14 Vypočteme koeficienty obou přímek. > (Coef.M1 <- coef(model.m1)) (Intercept) x grsr > a1.m1 <- Coef.M1[1] > a2.m1 <- Coef.M1[1] + Coef.M1[3] > b1.m1 <- Coef.M1[2] > b2.m1 <- Coef.M1[2] > txtcoef.m1 <- paste("a1 =", round(a1.m1, 3), " a2 =", round(a2.m1, 3), " b1 =", round(b1.m1, 3), " b2 =", round(b2.m1, 3)) > cat(paste("model M1 :", txtcoef.m1, "\n")) Model M1 : a1 = a2 = b1 = b2 = Vykreslíme do jednoho grafu obě dvě přímky, intervaly spolehlivosti kolem střední hodnoty a prediční intervaly. > pred.m1.cr <- predict(model.m1, newdata = data.frame(x = xtime - xshift, gr = "CR")) > pred.m1.sr <- predict(model.m1, newdata = data.frame(x = xtime - xshift, gr = "SR")) > CR.ci.conf.M1 <- predict(model.m1, newdata = data.frame(x = xtime - xshift, gr = "CR"), interval = "confidence") > CR.ci.pred.M1 <- predict(model.m1, newdata = data.frame(x = xtime - xshift, gr = "CR"), interval = "prediction") > SR.ci.conf.M1 <- predict(model.m1, newdata = data.frame(x = xtime - xshift, gr = "SR"), interval = "confidence") > SR.ci.pred.M1 <- predict(model.m1, newdata = data.frame(x = xtime - xshift, gr = "SR"), interval = "prediction") > yrange <- range(c(data$y, pred.m1.cr, pred.m1.sr)) > plot(xtime[c(1, n)], yrange, type = "n", xlab = TxtX, main = TXT, ylab = TxtY) > matlines(xtime, cbind(y1, y2), type = "o", pch = c(21, 22), bg = c("red", "cyan"), lty = c(1, 1), col = c("darkred", "darkcyan")) > matlines(xtime, cbind(pred.m1.cr, pred.m1.sr), lty = c(1, 1), col = c("dodgerblue", "darkgreen"), lwd = 2) > matlines(xtime, cbind(cr.ci.conf.m1[, 2:3], SR.ci.conf.M1[, 2:3]), lty = c(2, 2, 2, 2), col = c("lightblue4", "lightblue4", "lightgreen", "lightgreen"), lwd = 2) > matlines(xtime, cbind(cr.ci.pred.m1[, 2:3], SR.ci.pred.M1[, 2:3]), lty = c(3, 3, 3, 3), col = c("lightblue4", "lightblue4", "lightgreen", "lightgreen"), lwd = 2) > mtext(txtcoef.m1)

15 RNDr. Marie Forbelská, Ph.D. 15 Rozvodovost v CR a SR v letech a1 = a2 = b1 = b2 = pocet rozvodu na 1000 obyvatel roky České a Slovenské re- Obrázek 3: Rovnoběžné regresní přímky pro data Rozvodovost v publice v letech Nakonec budeme uvažovat podmodel modelu M 1, kdy v matici plánu vypustíme poslední sloupec. Model bude tvaru M 2 : Y ji = α+βx ji + ε ji kde j=1,2 i=1,...,n j (n 1 = n 2 =11) a parametry α a β budou společné pro Českou i pro Slovenskou republiku. Pomocí funkce lm() provedeme odhad modelu M 2. > model.m2 <- lm(y ~ x, data) > summary(model.m2) Call: lm(formula = y ~ x, data = data) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-09 *** x Signif. codes: 0 *** ** 0.01 * Residual standard error: on 20 degrees of freedom

16 16 Lineární statistické modely II (7. cvičení) Multiple R-squared: , Adjusted R-squared: F-statistic: on 1 and 20 DF, p-value: Vypočteme koeficienty. > (Coef.M2 <- coef(model.m2)) (Intercept) x > a1.m2 <- Coef.M2[1] > a2.m2 <- Coef.M2[1] > b1.m2 <- Coef.M2[2] > b2.m2 <- Coef.M2[2] > txtcoef.m2 <- paste("a1 =", round(a1.m2, 3), " a2 =", round(a2.m2, 3), " b1 =", round(b1.m2, 3), " b2 =", round(b2.m2, 3)) > cat(paste("model M2 :", txtcoef.m2, "\n")) Model M2 : a1 = a2 = b1 = b2 = Vykreslíme do jednoho grafu jedinou regresní přímku, intervaly spolehlivosti kolem střední hodnoty a prediční intervaly. > pred.m2 <- predict(model.m2, newdata = data.frame(x = xtime - xshift, gr = "CR")) > pred.m2 <- predict(model.m2, newdata = data.frame(x = xtime - xshift, gr = "SR")) > ci.conf.m2 <- predict(model.m2, newdata = data.frame(x = xtime - xshift, gr = "CR"), interval = "confidence") > ci.pred.m2 <- predict(model.m2, newdata = data.frame(x = xtime - xshift, gr = "CR"), interval = "prediction") > yrange <- range(c(data$y, pred.m2)) > plot(xtime[c(1, n)], yrange, type = "n", xlab = TxtX, main = TXT, ylab = TxtY) > matlines(xtime, cbind(y1, y2), type = "o", pch = c(21, 22), bg = c("red", "cyan"), lty = c(1, 1), col = c("darkred", "darkcyan")) > lines(xtime, pred.m2, lty = 1, col = c("orchid"), lwd = 2) > matlines(xtime, ci.conf.m2[, 2:3], lty = c(2, 2), col = c("orchid2"), lwd = 2) > matlines(xtime, ci.pred.m2[, 2:3], lty = c(3, 3), col = c("orchid4"), lwd = 2) > mtext(txtcoef.m2)

17 RNDr. Marie Forbelská, Ph.D. 17 Rozvodovost v CR a SR v letech a1 = a2 = b1 = b2 = pocet rozvodu na 1000 obyvatel roky Obrázek 4: Jediná regresní přímka pro data Rozvodovost v České a Slovenské republice v letech Nyní pomocí příkazu anova() otestujeme pomocí F testů, zda se modely významně zhoršily, když jsme postupně odstranili poslední sloupec matice plánu. > anova(model.m, model.m1, model.m2) Analysis of Variance Table Model 1: y ~ x * gr Model 2: y ~ x + gr Model 3: y ~ x Res.Df RSS Df Sum of Sq F Pr(>F) e-06 *** < 2.2e-16 *** --- Signif. codes: 0 *** ** 0.01 * Z výsledků jasně vidíme to, co již bylo patrné z grafů, a to že není možné uvažovat ani model, kde jsou regresní přímky rovnoběžné. Takže musíme zůstat u plného modelu, který jsme označili jako M.

18 18 Lineární statistické modely II (7. cvičení) Testování homogenity rozptylu Pro výsledný model M ještě provedeme test homogenity rozptylu, a to jak pomocí F testu, tak pomocí Bartlettova testu. Testovat samozřejmě musíme rezidua modelu. > var.test(resid(model.m) ~ data$gr) F test to compare two variances data: resid(model.m) by data$gr F = , num df = 10, denom df = 10, p-value = alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: sample estimates: ratio of variances > bartlett.test(resid(model.m) ~ data$gr) Bartlett test of homogeneity of variances data: resid(model.m) by data$gr Bartlett s K-squared = , df = 1, p-value = Oba dva testy ukazují, že homogenitu rozpylu nezamítáme, nebot F test interval spolehlivosti neobsahuje jedničku p hodnota není menší než 0.05 Bartlettův test p hodnota není menší než 0.05

19 RNDr. Marie Forbelská, Ph.D. 19 C. Úkol: U 126 podniků řepařské oblasti v České republice byl sledován hektarový výnos cukrovky ve vztahu ke spotřebě průmyslových hnojiv. Data jsou uložena v souboru nazvaném cukrovka.txt ve 4 sloupcích: 1. sloupec dolní hranice spotřeby K 2 0 (kg/ha) 2. sloupec horní hranice spotřeby K 2 0 (kg/ha) 3. sloupec četnosti 4. sloupec průměrné výnosy cukrovky (q/ha) (a) Načtěte soubor dat cukrovka.txt. (b) Odhadněte parametry regresních funkcí tvaru y=β 0 + β 1 x y=β 0 + β 1 x+β 2 x 2 y=β 0 + β 1 x 0.5 Poznámka: Za hodnoty nezávisle proměnné volte střed intervalu. Nezapomeňte zohlednit fakt, že v každém intervalu byl jiný počet pozorování (viz 3. sloupec). (c) Porovnejte vhodnost tří použitých regresních modelů.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal Základy navrhování průmyslových experimentů DOE II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal! Testování statistických hypotéz kvalitativní odezva kvantitativní chí-kvadrát test homogenity,

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO

Více

AVDAT Klasický lineární model, metoda nejmenších

AVDAT Klasický lineární model, metoda nejmenších AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Vícenásobná regresní a korelační analýza 1 1 Tto materiál bl vtvořen za pomoci grantu FRVŠ číslo 1145/2004. O vícenásobné závislosti mluvíme tehd, jestliže je závisle proměnná závislá na více nezávislých

Více

Opravená data Úloha (A) + (E) Úloha (C) Úloha (B) Úloha (D) Lineární regrese

Opravená data Úloha (A) + (E) Úloha (C) Úloha (B) Úloha (D) Lineární regrese - základní ukazatele Komentované řešení pomocí programu R Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze - základní ukazatele Načtení vstupních dat Vstupní data

Více

Bodové a intervalové odhady parametrů v regresním modelu

Bodové a intervalové odhady parametrů v regresním modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model Mějme lineární regresní model (LRM) Y = Xβ + e, kde y 1 e 1 β y 2 Y =., e

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y Xβ ε Předpoklady: Matice X X n,k je matice realizací. Předpoklad: n > k, h(x) k - tj. matice

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y β ε Matice n,k je matice realizací. Předpoklad: n > k, h() k - tj. matice je plné hodnosti

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

odpovídá jedna a jen jedna hodnota jiných

odpovídá jedna a jen jedna hodnota jiných 8. Regresní a korelační analýza Problém: hledání, zkoumání a hodnocení souvislostí, závislostí mezi dvěma a více statistickými znaky (veličinami). Typy závislostí: pevné a volné Pevná závislost každé hodnotě

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

Testování předpokladů pro metodu chain-ladder. Seminář z aktuárských věd Petra Španihelová

Testování předpokladů pro metodu chain-ladder. Seminář z aktuárských věd Petra Španihelová Testování předpokladů pro metodu chain-ladder Seminář z aktuárských věd 4. 11. 2016 Petra Španihelová Obsah Datová struktura Posouzení dat Předpoklady metody chain-ladder dle T. Macka Běžná lineární regrese

Více

Regresní analýza 1. Regresní analýza

Regresní analýza 1. Regresní analýza Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému

Více

M cvičení : GLM04b (Vztah mezi Poissonovým a

M cvičení : GLM04b (Vztah mezi Poissonovým a RNDr. Marie Forbelská, Ph.D. 1 M7222 4. cvičení : GLM04b (Vztah mezi Poissonovým a binomických rozdělením) Připomeňme, že pomocí Poissonova rozdělení P o(λ) lze dobře aproximovat binomické rozdělení Bi(n,

Více

Statistické metody v marketingu. Ing. Michael Rost, Ph.D.

Statistické metody v marketingu. Ing. Michael Rost, Ph.D. Statistické metody v marketingu Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Regresní analýza doplnění základů Vzhledem k požadavku Vašich kolegů zařazuji doplňující partii o regresní

Více

Design Experimentu a Statistika - AGA46E

Design Experimentu a Statistika - AGA46E Design Experimentu a Statistika - AGA46E Czech University of Life Sciences in Prague Department of Genetics and Breeding Summer Term 2015 Matúš Maciak (@ A 211) Office Hours: T 9:00 10:30 or by appointment

Více

M cvičení : GLM03a (The Working Activities of Bees)

M cvičení : GLM03a (The Working Activities of Bees) RNDr. Marie Forbelská, Ph.D. 1 M7222 3. cvičení : GLM03a (The Working Activities of Bees) Popis dat je v souboru bees.txt, samotná data jsou uložena v souboru bees.dat. Nejprve načteme popisný soubor pomocí

Více

13.1. Úvod Cílem regresní analýzy je popsat závislost hodnot znaku Y na hodnotách

13.1. Úvod Cílem regresní analýzy je popsat závislost hodnot znaku Y na hodnotách 13 Regrese 13.1. Úvod Cílem regresní analýzy je popsat závislost hodnot znaku Y na hodnotách znaku X. Přitom je třeba vyřešit jednak volbu funkcí k vystižení dané závislosti a dále stanovení konkrétních

Více

M cvičení : GLM01a (Toxic Chemical Production Data)

M cvičení : GLM01a (Toxic Chemical Production Data) RNDr. Marie Forbelská, Ph.D. 1 M7222 1. cvičení : GLM01a (Toxic Chemical Production Data) Popis dat je v souboru toxic.txt, samotná data jsou uložena v souboru toxic.dat. Nejprve načteme popisný soubor

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOS A SAISIKA Regresní analýza - motivace Základní úlohou regresní analýzy je nalezení vhodného modelu studované závislosti. Je nutné věnovat velkou pozornost tomu aby byla modelována REÁLNÁ

Více

7. Analýza rozptylu.

7. Analýza rozptylu. 7. Analýza rozptylu. Uvedeme obecnou ideu, která je založena na minimalizaci chyby metodou nejmenších čtverců. Nejdříve uvedeme několik základních tvrzení. Uvažujeme náhodný vektor Y = (Y, Y,..., Y n a

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

AVDAT Geometrie metody nejmenších čtverců

AVDAT Geometrie metody nejmenších čtverců AVDAT Geometrie metody nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model klasický lineární regresní model odhad parametrů MNČ y = Xβ + ε, ε

Více

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel Analýza rozptylu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO Brno) Analýza rozptylu 1 / 30 Analýza

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními

Více

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D. Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít

Více

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Zpracování dat v edukačních vědách - Testování hypotéz Kamila Fačevicová Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Obsah seminářů 5.11. Úvod do matematické

Více

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel Regresní analýza Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Regresní analýza 1 / 23

Více

12. cvičení z PST. 20. prosince 2017

12. cvičení z PST. 20. prosince 2017 1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace

Více

Problém 1: Ceny nemovitostí Poznámkykřešení 1

Problém 1: Ceny nemovitostí Poznámkykřešení 1 Problém 1: Ceny nemovitostí Poznámkykřešení 1 Zadání 1.Majínemovitostiurčenékbydlenívyššícenutam,kdeječistšíovzduší?Pokudano,okolik? 2. Lze vztah mezi znečištěním a cenou, pokud existuje, vysvětlit tím,

Více

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin EuroMISE Centrum I. ÚVOD vv této přednášce budeme hovořit o jednovýběrových a dvouvýběrových testech týkajících se střední hodnoty

Více

Statistické metody v marketingu. Ing. Michael Rost, Ph.D.

Statistické metody v marketingu. Ing. Michael Rost, Ph.D. Statistické metody v marketingu Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Úvodem Modelování vztahů mezi vysvětlující a vysvětlovanou (závisle) proměnnou patří mezi základní aktivity,

Více

Lineární regrese. Komentované řešení pomocí MS Excel

Lineární regrese. Komentované řešení pomocí MS Excel Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie LS 2014/15 Cvičení 7: Autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Autokorelace - teorie Zopakujte si G-M

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu Jednofaktorová analýza rozptylu David Hampel Ústav statistiky a operačního výzkumu, Mendelova univerzita v Brně Kurz pokročilých statistických metod Global Change Research Centre AS CR, 5 7 8 2015 Tato

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie ZS 2015/16 Cvičení 7: Časově řady, autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Časové řady Data: HDP.wf1

Více

Statistické metody v marketingu. Ing. Michael Rost, Ph.D.

Statistické metody v marketingu. Ing. Michael Rost, Ph.D. Statistické metody v marketingu Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Pojem závislosti Je nutné rozlišit mezi závislostí nepodstatnou a mezi příčinnou čili kauzální závislostí.ta

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz. Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení

Více

Zadání Máme data hdp.wf1, která najdete zde: Bodová předpověď: Intervalová předpověď:

Zadání Máme data hdp.wf1, která najdete zde:  Bodová předpověď: Intervalová předpověď: Predikce Text o predikci pro upřesnění pro ty, které zajímá, kde se v EViews všechna ta čísla berou. Ruční výpočty u průběžného testu nebudou potřeba. Co bude v závěrečném testu, to nevím. Ale přečíst

Více

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) cvičení z PSI 0-4 prosince 06 Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) Z realizací náhodných veličin X a Y s normálním rozdělením) jsme z výběrů daného rozsahu obdrželi

Více

AKM CVIČENÍ. Opakování maticové algebry. Mějme matice A, B regulární, potom : ( AB) = B A

AKM CVIČENÍ. Opakování maticové algebry. Mějme matice A, B regulární, potom : ( AB) = B A AKM - 1-2 CVIČENÍ Opakování maticové algebry Mějme matice A, B regulární, potom : ( AB) = B A 1 1 ( A ) = ( A ) ( A ) = A ( A + B) = A + B 1 1 1 ( AB) = B A, kde A je řádu mxn a B nxk Čtvercová matice

Více

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

Matematické modelování Náhled do ekonometrie. Lukáš Frýd Matematické modelování Náhled do ekonometrie Lukáš Frýd Výnos akcie vs. Výnos celého trhu - CAPM model r it = r ft + β 1. (r mt r ft ) r it r ft = α 0 + β 1. (r mt r ft ) + ε it Ekonomický (finanční model)

Více

Přednáška IX. Analýza rozptylu (ANOVA)

Přednáška IX. Analýza rozptylu (ANOVA) Přednáška IX. Analýza rozptylu (ANOVA) Princip a metodika výpočtu Předpoklady analýzy rozptylu a jejich ověření Rozbor rozdílů jednotlivých skupin násobné testování hypotéz Analýza rozptylu jako lineární

Více

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin EuroMISE Centrum Kontakt: Literatura: Obecné informace Zvárová, J.: Základy statistiky pro biomedicínskéobory I. Vydavatelství

Více

Bodové a intervalové odhady parametrů v regresním modelu

Bodové a intervalové odhady parametrů v regresním modelu Bodové a intervalové odhady parametrů v regresním modelu 1 Odhady parametrů 11 Bodové odhady Mějme lineární regresní model (LRM) kde Y = y 1 y 2 y n, e = e 1 e 2 e n Y = Xβ + e, x 11 x 1k, X =, β = x n1

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze

Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze Komentované řešení pomocí programu R Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze Popis vstupních dat Vstupní data pro úlohu (A) se nacházejí v souboru "glukoza.csv".

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů Na analýzu rozptylu lze pohlížet v podstatě

Více

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D. Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost

Více

5 Parametrické testy hypotéz

5 Parametrické testy hypotéz 5 Parametrické testy hypotéz 5.1 Pojem parametrického testu (Skripta str. 95-96) Na základě výběru srovnáváme dvě tvrzení o hodnotě určitého parametru θ rozdělení f(x, θ). První tvrzení (které většinou

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Statistika, Biostatistika pro kombinované studium. Jan Kracík Statistika, Biostatistika pro kombinované studium Letní semestr 2014/2015 Tutoriál č. 6: ANOVA Jan Kracík jan.kracik@vsb.cz Obsah: Testování hypotéz opakování ANOVA Testování hypotéz (opakování) Testování

Více

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je = Příklad 1 Metodou nejmenších čtverců nalezněte odhad lineární regresní funkce popisující závislost mezi výnosy pšenice a množstvím použitého hnojiva na základě hodnot výběrového souboru uvedeného v tabulce.

Více

Lineární a logistická regrese

Lineární a logistická regrese Lineární a logistická regrese Martin Branda Univerzita Karlova v Praze Matematicko-fyzikální fakulta Katedra pravděpodobnosti a matematické statistiky Výpočetní prostředky finanční a pojistné matematiky

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK Základy ekonometrie Odhad klasického lineárního regresního modelu II Cvičení 3 Zuzana Dlouhá Klasický lineární regresní model - zadání příkladu Soubor: CV3_PR.xls Data: y = maloobchodní obrat potřeb

Více

Pozn. 1. Při návrhu aproximace bychom měli aproximační funkci vybírat tak, aby vektory ϕ (i) byly lineárně

Pozn. 1. Při návrhu aproximace bychom měli aproximační funkci vybírat tak, aby vektory ϕ (i) byly lineárně 9. Řešení typických úloh diskrétní metodou nejmenších čtverců. DISKRÉTNÍ METODA NEJMENŠÍCH ČTVERCŮ použití: v případech, kdy je nevhodná interpolace využití: prokládání dat křivkami, řešení přeurčených

Více

Pokud data zadáme přes "Commands" okno: SDF1$X1<-c(1:15) //vytvoření řady čísel od 1 do 15 SDF1$Y1<-c(1.5,3,4.5,5,6,8,9,11,13,14,15,16,18.

Pokud data zadáme přes Commands okno: SDF1$X1<-c(1:15) //vytvoření řady čísel od 1 do 15 SDF1$Y1<-c(1.5,3,4.5,5,6,8,9,11,13,14,15,16,18. Regresní analýza; transformace dat Pro řešení vztahů mezi proměnnými kontinuálního typu používáme korelační a regresní analýzy. Korelace se používá pokud nelze určit "kauzalitu". Regresní analýza je určena

Více

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457. 0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti

Více

Testy nezávislosti kardinálních veličin

Testy nezávislosti kardinálních veličin Testy nezávislosti kardinálních veličin Komentované řešení pomocí programu R Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze Načtení vstupních dat Vstupní data

Více

M praktikum : M0130pr03

M praktikum : M0130pr03 RNDr. Marie Forbelská, Ph.D. 1 M0130 3. praktikum : M0130pr03 (Úvodní analýza časových řad) A. Roční data: Příklad 1 Máme k dispozici historická roční data, která se týkají minimálních (dolních) hladin

Více

Statistická analýza dat

Statistická analýza dat Statistická analýza dat Jméno: Podpis: Cvičení Zkouška (písemná + ústní) 25 Celkem 50 Známka Pokyny k vypracování: doba řešení je 120min, jasně zodpovězte pokud možno všechny otázky ze zadání, pracujte

Více

velkou variabilitou: underdispersion, overdispersion)

velkou variabilitou: underdispersion, overdispersion) RNDr. Marie Forbelská, Ph.D. 1 M7222 4. cvičení : GLM04a (Problémy s příliš malou či příliš velkou variabilitou: underdispersion, overdispersion) Mějme náhodný výběry n =(Y 1,...,Y n ) T z rozdělení exponenciálního

Více

Technická univerzita v Liberci

Technická univerzita v Liberci Technická univerzita v Liberci Ekonomická fakulta Analýza výsledků z dotazníkového šetření Jména studentů: Adam Pavlíček Michal Karlas Tomáš Vávra Anna Votavová Ročník: 2015/2016 Datum odevzdání: 13/05/2016

Více

Charakteristika datového souboru

Charakteristika datového souboru Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex

Více

Základní statistické metody v rizikovém inženýrství

Základní statistické metody v rizikovém inženýrství Základní statistické metody v rizikovém inženýrství Petr Misák Ústav stavebního zkušebnictví Fakulta stavební, VUT v Brně misak.p@fce.vutbr.cz Základní pojmy Jev souhrn skutečností zobrazujících ucelenou

Více

Příklady na testy hypotéz o parametrech normálního rozdělení

Příklady na testy hypotéz o parametrech normálního rozdělení Příklady na testy hypotéz o parametrech normálního rozdělení. O životnosti 75W žárovky (v hodinách) je známo, že má normální rozdělení s = 5h. Pro náhodný výběr 0 žárovek byla stanovena průměrná životnost

Více

Regrese. 28. listopadu Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly:

Regrese. 28. listopadu Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly: Regrese 28. listopadu 2013 Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly: 1. Ukázat, že data jsou opravdu závislá. 2. Provést regresi. 3. Ukázat, že zvolená křivka

Více

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 Opakování t- vs. neparametrické Wilcoxonův jednovýběrový test Opakování

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie LS 2014/15 Cvičení 10: Heteroskedasticita LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Heteroskedasticita - teorie Druhý

Více

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných

Více

LWS při heteroskedasticitě

LWS při heteroskedasticitě Stochastické modelování v ekonomii a financích Petr Jonáš 7. prosince 2009 Obsah 1 2 3 4 5 47 1 Předpoklad 1: Y i = X i β 0 + e i i = 1,..., n. (X i, e i) je posloupnost nezávislých nestejně rozdělených

Více

6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový.

6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový. 6. ZÁKLADY STATIST. ODHADOVÁNÍ X={X 1, X 2,..., X n } výběr z rozdělení s F (x, θ), θ={θ 1,..., θ r } - vektor reálných neznámých param. θ Θ R k. Θ parametrický prostor. Dva základní způsoby odhadu neznámého

Více

Regrese. Karel Zvára. Poznámky k přednášce STP094, akademický rok 2001/2002

Regrese. Karel Zvára. Poznámky k přednášce STP094, akademický rok 2001/2002 1 Regrese Karel Zvára Poznámky k přednášce STP094, akademický rok 2001/2002 2 Uvítám všechny připomínky a zejména každé upozornění na chybu či nedopatření, ať už budou ústní, písemné nebo elektronickou

Více

AVDAT Nelineární regresní model

AVDAT Nelineární regresní model AVDAT Nelineární regresní model Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Nelineární regresní model Ey i = f (x i, β) kde x i je k-členný vektor vysvětlujících proměnných

Více

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina. Parametrické metody odhadů z neúplných výběrů 2 1 Metoda maximální věrohodnosti pro cenzorované výběry 11 Náhodné cenzorování Při sledování složitých reálných systémů často nemáme možnost uspořádat experiment

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Náhodný výběr Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

1 Determinanty a inverzní matice

1 Determinanty a inverzní matice Determinanty a inverzní matice Definice Necht A = (a ij ) je matice typu (n, n), n 2 Subdeterminantem A ij matice A příslušným pozici (i, j) nazýváme determinant matice, která vznikne z A vypuštěním i-tého

Více

ADDS cviceni. Pavlina Kuranova

ADDS cviceni. Pavlina Kuranova ADDS cviceni Pavlina Kuranova Testy pro dva nezávislé výběry Mannův Whitneyho test - Založen na Wilcoxnově statistice W - založen na pořadí jednotlivých pozorování (oba výběry spojeny do jednoho celku)

Více

Výběrové charakteristiky a jejich rozdělení

Výběrové charakteristiky a jejich rozdělení Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový

Více

Inovace bakalářského studijního oboru Aplikovaná chemie

Inovace bakalářského studijního oboru Aplikovaná chemie http://aplchem.upol.cz CZ.1.07/2.2.00/15.0247 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Regrese Závislostproměnných funkční y= f(x) regresní y= f(x)

Více

Matematika I, část I. Rovnici (1) nazýváme vektorovou rovnicí roviny ABC. Rovina ABC prochází bodem A a říkáme, že má zaměření u, v. X=A+r.u+s.

Matematika I, část I. Rovnici (1) nazýváme vektorovou rovnicí roviny ABC. Rovina ABC prochází bodem A a říkáme, že má zaměření u, v. X=A+r.u+s. 3.4. Výklad Předpokládejme, že v prostoru E 3 jsou dány body A, B, C neležící na jedné přímce. Těmito body prochází jediná rovina, kterou označíme ABC. Určíme vektory u = B - A, v = C - A, které jsou zřejmě

Více

Aplikovaná statistika v R - cvičení 2

Aplikovaná statistika v R - cvičení 2 Aplikovaná statistika v R - cvičení 2 Filip Děchtěrenko Matematicko-fyzikální fakulta filip.dechterenko@gmail.com 5.6.2014 Filip Děchtěrenko (MFF UK) Aplikovaná statistika v R 5.6.2014 1 / 18 Přehled Rkových

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK11 Základy ekonometrie Autokorelace Cvičení 5 Zuzana Dlouhá Gauss-Markovy předpoklady Náhodná složka: Gauss-Markovy předpoklady 1. E(u) = náhodné vlivy se vzájemně vynulují. E(uu T ) = σ I n konečný

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 5. Odhady parametrů základního souboru Mgr. David Fiedor 16. března 2015 Vztahy mezi výběrovým a základním souborem Osnova 1 Úvod, pojmy Vztahy mezi výběrovým a základním

Více

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík SEMESTRÁLNÍ PRÁCE Leptání plasmou Ing. Pavel Bouchalík 1. ÚVOD Tato semestrální práce obsahuje písemné vypracování řešení příkladu Leptání plasmou. Jde o praktickou zkoušku znalostí získaných při přednáškách

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie LS 2014/15 Cvičení 4: Statistické vlastnosti MNČ LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE Upřesnění k pojmům a značení

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více