kovů v sedimentech řeky Moravy

Rozměr: px
Začít zobrazení ze stránky:

Download "kovů v sedimentech řeky Moravy"

Transkript

1 Smíšené regresní modely při sledování obsahu těžkých kovů v sedimentech řeky Moravy Marie Forbelská Masarykova univerzita Brno Přírodovědecká fakulta Ústav matematiky a statistiky Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

2 Obsah 1 Skupinově závislá data 2 Jednoduché modely 3 Obecná definice LMM modelů 4 Odhady parametrů 5 Jednoduchý model pro reálná data Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

3 Skupinově závislá data Skupinově závislá data Klasické statistické metody se obvykle zajímají buď nezávislými pozorováními nebo časovými řadami V praxi se však občas setkáváme s daty, která se sestávají z nezávislých skupin vzájemně závislých pozorování. Ke správné a efektivní analýze takových dat potřebujeme speciální a zatím relativně málo známé metody. Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

4 Skupinově závislá data Typy skupinově závislých dat Skupinově závislá data lze zhruba rozdělit do tří skupin 1 čistě skupinová data pozorování, který se týkají skupin vzájemně spřízněných a souvisejících objektů či subjektů, např. pozorování na členech jedné rodiny či sourozencích na výrobcích pocházejících ze stejné dílny na plodinách sklizených z různých částí téhož pole 2 opakovaná měření učiněná na téže jednotce 3 longitudinální data opakovaná měření probíhající v čase Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

5 Specifikace skupin Skupinově závislá data 1 Čistě skupinová data vyznačují se tím, že nemají žádné přirozené uspořádání mezi jednotlivými závislými měřeními. 2 Opakovaná měření pozorování jsou uspořádána podle pořadí: první, druhé, třetí... 3 Longitudinální data navíc poskytují informaci o čase měření; podobají se pozorováním kratších úseků nezávislých časových řad. Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

6 Skupinově závislá data Cíle modelování skupinově závislých dat Modelovat závislost jejich středních hodnot a rozptylu na experimentálních podmínkách, při nichž byla učiněna jednotlivá měření na pozorovaných charakteristikách experimentálních objektů Tato formulace vede k problému regresního modelování po skupinách korelovaných pozorování. jako funkce experimentálních podmínek charakteristik měřených objektů rizikových faktorů, apod. Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

7 Skupinově závislá data Matematická formulace problému Značení index j (j = 1,..., N) označení nezávislé experimentální jednotky (skupiny, subjekty) dvojice indexů ji (i = 1,..., n j ) označení pro korelovaná pozorování na j-té jednotce n = N celkový počet pozorování n j j=1 Y ji = β 0 + x ji1 β x jip β p + ε ji měření, kde ε ji regresní model pro ji-té náhodné odchylky s nulovou střední hodnotou a pro něž C(ε ji, ε j i ) = 0 pro j j, ale C(ε ji, ε ji ) může být nenulové. Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

8 Skupinově závislá data Maticový zápis pro j -tou jednotku Y j = X j β + ε j Y j = (Y j1,..., Y jnj ) vektor opakovaných měření na j -té jednotce x j1 1 X j =.., kde x x ji1 (nenáhodná) ji = matice plánu. pro j -tou jednotku x jn j x jip ε j = (ε j1,..., ε jnj ) N nj (0, σ 2 Σ j ) vektor náhodných chyb pro j -tou jednotku β = (β 0,..., β p ) vektor neznámých parametrů Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

9 Skupinově závislá data Společný maticový zápis Y = Xβ + ε, kde ε N n (0, Σ) Y = Y 1. Y N, X = X 1. X N Σ Σ = σ Σ N, ε = ε 1. ε N, Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

10 Skupinově závislá data Náhodné efekty a lineární smíšený model Znovu předpokládáme model Y j = X j β + ε j, ε j N nj (0, σ 2 Σ j ) Rozptylová matice určující korelace mezi Y ji a Y ji kde není diagonální varε j = V j = σ 2 Σ j = V j (ψ) a lineární smíšený model odhaduje vektor parametrů ψ z pozorovaných dat (tj. na základě prediktorů) společně s regresními parametry β. Parametrizace rozptylu může mít několik komponent, mezi nimiž hrají důležitou roli náhodné efekty. Dále na jednoduchém motivačním příkladu ukážeme, jak fungují náhodné efekty v případě lineárního růstového modelu. Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

11 Jednoduché modely Jednoduché příklady Uvažujme lineární růstový model Y ji = β 0 + β 1 t ji + ε ji, kde EY ji = β 0 + β 1 t ji a t ji je čas i -tého pozorování subjektu j. Pokud například odezvu Y ji interpretujeme jako výšku sledovaného subjektu (člověka, stromu, apod.) v čase t ji, pak parametr β 0 β 1 označuje průměrnou výšku v čase 0 a je průměrný přírůstek za jednotku času. Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

12 Jednoduché modely Náhodný absolutní člen Předpokládejme, že sledovaní jedinci mají tendenci být buď systematicky vyšší nebo systematicky nižší než průměr, a to po celou dobu sledování. Proto pro j -tý subjekt zavedeme nepozorovanou náhodnou odchylku od průměru b 0 N(0, σ 2 0 ). Pak model upravíme takto Y ji = β 0 + β 1 t ji + b 0 + η ji, kde } {{ } ε ji η ji iid N(0, σ 2 ) a η ji b 0. Pak R(Y ji, Y ji )=R(ε ji, ε ji )= C(ε ji,ε ji Dεji Dεji = (b0+η ji,b 0+η ji ) = Db0 b0+η ji b0+η ji Db 0+Dη ji = σ2 0 > 0 σ0 2+σ2 Navíc pořád bude platit EY ji = β 0 + β 1 t ji Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

13 Jednoduché modely Náhodný absolutní člen i směrnice Nyní budeme předpokládat, že sledovaní jedinci se liší nejen polohou, ale i směrnicí růstu. Zavedeme navíc nepozorovanou náhodnou veličinu b 1 N(0, σ 2 1 ). Pak model upravíme takto Y ji = β 0 + β 1 t ji + b 0 + b 1 t ji + η ji, kde } {{ } ε ji η ji, b 0, b 1 jsou nezávislé náhodné veličiny. Pak C(Y ji, Y ji )=C(ε ji, ε ji )=C(b 0 +b 1 t ji +η ji, b 0 +b 1 t ji +η ji ) a vidíme, že v =Db 0 + t ji t ji Db 1 = σ0 2 + t jit ji σ1 2 > 0 modelu s náhodnou směricí jak rozptyl Y ji, tak kovariance mezi Y ji a Y ji rostou s časem. Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

14 Obecná definice LMM modelů Lineární smíšený model (Linear Mixed Model LMM) Obecný model s náhodnými efekty zobecňuje princip, který jsme ilustrovali zavedením náhodného absolutního členu a náhodné směrnice. Uvažujme náhodné parametry pro jakékoli prediktory. Dostaneme model Y j = X j β + Z j b j + η j, kde } {{ } ε j matice plánu X j je typu n j k (k = p + 1) a Z j je typu n j q, vektor pevných efektů β je typu k 1 vektor náhodných efektů b j N q (0, D) je typu q 1 η j N nj (0, σ 2 Σ j ), oba normální vektory b j a η j jsou nezávislé. Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

15 Obecná definice LMM modelů Varianční struktura LMM Zavedením náhodných efektů modelujeme rozptyl V j = DY j = Dε j = D(Z j b j + η j ) = Z j DZ j + σ2 Σ j (a tím i korelace mezi Y ji a Y ji ) Pro longitudinální data přidáme autoregresní složku W j (t), tj. ε j = Z j b j + W j (t) + η j, kde W j (t) je vektor hodnot autoregresního procesu v časech t = (t j1,..., t jnj ) s rozptylem τ 2 a korelační funkcí R(W j(s 1), W j(s 2))=e φ s 1 s 2 Pak autokorelační složka vnáší do modelu pozitivní korelace, které klesají se vzrůstajícím rozdílem času. Časově blízká pozorování jsou pak více korelovaná, než pozorování vzdálená. Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

16 Odhady parametrů Odhady parametrů v LMM modelech Parametry LMM modelu se odhadují za předpokladu, že všechny složky náhodné chyby mají mnohorozměrné normální rozdělení. Označíme-li neznámé parametry matice V j jako ψ a budeme-li předpokládat, že je známe, pak ML odhad 1 N N β = X jv 1 j X j X jv 1 j Y j (1) j=1 Lze ukázat, že jde o nejlepší nestranný lineární odhad (Best Linear Unbiased Estimator, BLUE) pro β, kde nejlepší znamená, že má minimální střední kvadratickou chybu. j=1 Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

17 Odhady parametrů BLUP odhady náhodných efektů Chceme li predikovat náhodné efekty, použijeme podmíněnou střední hodnotu E(b j Y j ) Za předpokladu, že ψ známe dostaneme b j = DZ jv 1 j (Y j X j β), (2) Lze ukázat, že jde o nejlepší nestranný lineární prediktor (Best Linear Unbiased Predictor, BLUP) pro b j, kde nejlepší je opět ve smyslu minimální střední kvadratické chyby. Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

18 ML (REML) odhady ψ Odhady parametrů Odhad parametrů ψ se provádí pomocí metody maximální věrohodnosti (ML-odhad, l 1 ), popř. REML (Restricted Maximum Likelihood, l 2 ). N N l 1(ψ; y 1,..., y N )= c 1 1 log( V 2 j ) 1 2 j=1 j=1 N N l 2(ψ; y 1,..., y N )= c 2 1 log( V 2 j ) 1 2 kde r j = y j X j j=1 N 1 2 j=1 ( N j=1 j=1 r j V 1 j r j (3) r j V 1 j r j log( X jv 1 j X j ) (4) X j V 1 j X j ) 1 ( N c 1 a c 2 jsou vhodné konstanty. j=1 X j V 1 j y j ) 1 Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

19 Odhady parametrů Numerické výpočty Rovnice (3) a (4) se maximalizují iterativně (Fisher scoring, Newton Raphson, více viz Demidenko, 2004). V rovnicích (1) a (2) se neznámé ψ nahradí ψml nebo ψ REML, v tom případě mluvíme o empirickém BLUE odhadu pro β, popř. empirickém BLUP odhadu pro b j Pro testování fixních efektů, náhodných efektů a variančních komponent se využívají testy poměrem věrohodností nebo Waldovy testy (více Verbeke and Molenberghs, 2000). Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

20 Predikce Odhady parametrů Prediktor pro podmíněnou střední hodnotu E(Y j b j ) = µ j bj = X j β + Z j b j dostaneme po dosazení příslušných odhadů do rovnic (1) a (2) µ j bj = X j β + Zj bj = X j β + Zj DZ j V 1 j (Y j X j β) = (I nj Z j DZ j V 1 j )X j β + Zj DZ j V 1 j Y j = Σ j V 1 j X j β + (Inj Σ j V 1 j X j )Y j. Vidíme, že výraz µ j bj je váženým průměrem X j β (vztahující se k celé populaci) a Y j (vztahující se k subjektu j ). Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

21 Jednoduchý model pro reálná data Dlouhodobé sledování obsahu prioritních a dalších nebezpečných látek v sedimentech řeky Moravy v letech V nejvíce zatížených úsecích, situovaných v podélném profilu řeky Moravy mezi 298. a 93. říčním kilometrem, bylo sledováno více než 50 ukazatelů ze skupin těžké kovy, polychlorované bifenyly (PCB), organochlorované pesticidy (OCP) a polyaromatické uhlovodíky (PAU). Příklad prezentuje první výsledky účelového sledování a následného statistického zhodnocení časového vývoje obsahu prioritních a dalších nebezpečných látek v sedimentech řeky Moravy, a to v letech Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

22 Jednoduchý model pro reálná data Specifikace sběru dat Vzorky sedimentů byly odebírány v 7 lokalitách v podélném profilu řeky Moravy 1. Šumperk pod 5. Uherské Hradiště pod 2. Olomouc pod 6. Hodonín pod 3. Kroměříž pod 7. Lanžhot pod 4. Otrokovice pod ze dna tzv. brodící metodou pomocí ručního vzorkovače na tyči. Část předupraveného vzorku pak byla uřčena ke stanovení těžkých kovů olova (Pb), rtuti (Hg), kadmia (Cd) a niklu (Ni). Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

23 Jednoduchý model pro reálná data Model Y ji = β 0 + β 1 t ji + ε ji = β 0 + β 1 t ji + b j0 + η ji } {{ } ε ji lokality j = 1,..., 7 η ji N(0, σ 2 j ) (heteroskedastický) b j0 N(0, σ 2 b ) počty pozorování uvnitř lokalit n j lokalita Šumperk pod Olomouc pod Kroměříž pod Otrokovice pod Uherské Hradiště pod Hodonín pod Lanžhot pod Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

24 Olovo Pb Jednoduchý model pro reálná data Morava Šumperk pod Morava Olomouc pod 300 Morava Kroměříž pod Morava Otrokovice pod Pb[mg/kg] Morava Uherské Hradiště pod Morava Hodonín pod Morava Lanžhot pod Morava Šumperk pod Morava Olomouc pod year Morava Kroměříž pod Morava Otrokovice pod 5 logpb[mg/kg] Morava Uherské Hradiště pod Morava Hodonín pod Morava Lanžhot pod year Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

25 Rtuť Hg Jednoduchý model pro reálná data Morava Šumperk pod Morava Olomouc pod Morava Kroměříž pod Morava Otrokovice pod Hg[mg/kg] Morava Uherské Hradiště pod Morava Hodonín pod Morava Lanžhot pod year 1 Morava Šumperk pod Morava Olomouc pod Morava Kroměříž pod Morava Otrokovice pod loghg[mg/kg] 3 Morava Uherské Hradiště pod Morava Hodonín pod Morava Lanžhot pod year Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

26 Kadmium Cd Jednoduchý model pro reálná data Morava Šumperk pod Morava Olomouc pod 4 3 Morava Kroměříž pod Morava Otrokovice pod Cd[mg/kg] Morava Uherské Hradiště pod Morava Hodonín pod Morava Lanžhot pod year Morava Šumperk pod Morava Olomouc pod Morava Kroměříž pod Morava Otrokovice pod logcd[mg/kg] 3 Morava Uherské Hradiště pod Morava Hodonín pod Morava Lanžhot pod year Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

27 Nikl Ni Jednoduchý model pro reálná data Ni[mg/kg] Morava Šumperk pod Morava Uherské Hradiště pod Morava Olomouc pod Morava Hodonín pod Morava Kroměříž pod Morava Lanžhot pod 100 Morava Otrokovice pod year Morava Šumperk pod Morava Olomouc pod Morava Kroměříž pod Morava Otrokovice pod logni[mg/kg] 2.5 Morava Uherské Hradiště pod Morava Hodonín pod Morava Lanžhot pod year Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

28 Jednoduchý model pro reálná data Výpočet v prostředí R library(nlme) t <- year model<-lme(y~t,data,random=~1 locality, weights=varident(form=~1 locality), na.action = na.omit) summary(model) Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

29 Olovo - Pb Jednoduchý model pro reálná data Linear mixed-effects model fit by REML Data: data AIC BIC loglik Random effects: Formula: ~1 locality (Intercept) Residual StdDev: Variance function: Structure: Different standard deviations per stratum Formula: ~1 locality Parameter estimates: Morava - Šumperk pod Morava - Olomouc pod Morava - Kroměříž pod Morava - Otrokovice pod Morava - Uherské Hradiště pod Morava - Hodonín pod Morava - Lanžhot pod Fixed effects: y ~ t Value Std.Error DF t-value p-value (Intercept) t Correlation: (Intr) t Standardized Within-Group Residuals: Min Q1 Med Q3 Max Number of Observations: 149 Number of Groups: 7 Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

30 Olovo - Pb Jednoduchý model pro reálná data Morava Šumperk pod Morava Olomouc pod Morava Kroměříž pod Morava Otrokovice pod log(pb) 2 Morava Uherské Hradiště pod Morava Hodonín pod Morava Lanžhot pod year 2003 OLS fitted curve river averaged curve location specific curve Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

31 Rtuť - Hg Jednoduchý model pro reálná data Linear mixed-effects model fit by REML Data: data AIC BIC loglik Random effects: Formula: ~1 locality (Intercept) Residual StdDev: Variance function: Structure: Different standard deviations per stratum Formula: ~1 locality Parameter estimates: Morava - Šumperk pod Morava - Olomouc pod Morava - Kroměříž pod Morava - Otrokovice pod Morava - Uherské Hradiště pod Morava - Hodonín pod Morava - Lanžhot pod Fixed effects: y ~ t Value Std.Error DF t-value p-value (Intercept) t Correlation: (Intr) t Standardized Within-Group Residuals: Min Q1 Med Q3 Max Number of Observations: 145 Number of Groups: 7 Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

32 Rtuť - Hg Jednoduchý model pro reálná data Morava Šumperk pod Morava Olomouc pod Morava Kroměříž pod Morava Otrokovice pod log(hg) Morava Uherské Hradiště pod Morava Hodonín pod Morava Lanžhot pod year 2003 OLS fitted curve river averaged curve location specific curve Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

33 Kadmium - Cd Jednoduchý model pro reálná data Linear mixed-effects model fit by REML Data: data AIC BIC loglik Random effects: Formula: ~1 locality (Intercept) Residual StdDev: Variance function: Structure: Different standard deviations per stratum Formula: ~1 locality Parameter estimates: Morava - Šumperk pod Morava - Olomouc pod Morava - Kroměříž pod Morava - Otrokovice pod Morava - Uherské Hradiště pod Morava - Hodonín pod Morava - Lanžhot pod Fixed effects: y ~ t Value Std.Error DF t-value p-value (Intercept) e+00 t e-04 Correlation: (Intr) t 0.01 Standardized Within-Group Residuals: Min Q1 Med Q3 Max Number of Observations: 149 Number of Groups: 7 Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

34 Kadmium - Cd Jednoduchý model pro reálná data Morava Šumperk pod Morava Olomouc pod Morava Kroměříž pod Morava Otrokovice pod log(cd) 3 Morava Uherské Hradiště pod Morava Hodonín pod Morava Lanžhot pod year 2003 OLS fitted curve river averaged curve location specific curve Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

35 Nikl - Ni Jednoduchý model pro reálná data Linear mixed-effects model fit by REML Data: data AIC BIC loglik Random effects: Formula: ~1 locality (Intercept) Residual StdDev: Variance function: Structure: Different standard deviations per stratum Formula: ~1 locality Parameter estimates: Morava - Šumperk pod Morava - Olomouc pod Morava - Kroměříž pod Morava - Otrokovice pod Morava - Uherské Hradiště pod Morava - Hodonín pod Morava - Lanžhot pod Fixed effects: y ~ t Value Std.Error DF t-value p-value (Intercept) t Correlation: (Intr) t Standardized Within-Group Residuals: Min Q1 Med Q3 Max Number of Observations: 105 Number of Groups: 7 Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

36 Nikl - Ni Jednoduchý model pro reálná data Morava Šumperk pod Morava Olomouc pod Morava Kroměříž pod Morava Otrokovice pod log(ni) Morava Uherské Hradiště pod Morava Hodonín pod Morava Lanžhot pod year 2003 OLS fitted curve river averaged curve location specific curve Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě / 36

DÚ 7 Identifikace dopadů antropogenních tlaků na povrchové vody a vodní ekosystém

DÚ 7 Identifikace dopadů antropogenních tlaků na povrchové vody a vodní ekosystém DÚ 7 Identifikace dopadů antropogenních tlaků na povrchové vody a vodní ekosystém Řešitelé: Ing. Hana Hudcová Ing. Ilja Bernardová Spoluřešitelé a spolupracovníci: VÚV T.G.M., v.v.i. Mgr. Petr Medek Ing.

Více

AVDAT Klasický lineární model, metoda nejmenších

AVDAT Klasický lineární model, metoda nejmenších AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i

Více

LINEÁRNÍ MODELY. Zdeňka Veselá

LINEÁRNÍ MODELY. Zdeňka Veselá LINEÁRNÍ MODELY Zdeňka Veselá vesela.zdenka@vuzv.cz Genetika kvantitativních vlastností Jednotlivé geny nejsou zjistitelné ani měřitelné Efekty většího počtu genů poskytují variabilitu, kterou lze většinou

Více

Smíšené regresní modely a možnosti jejich využití. Karel Drápela

Smíšené regresní modely a možnosti jejich využití. Karel Drápela Smíšené regresní modely a možnosti jejich využití Karel Drápela Regresní modely Základní úloha regresní analýzy nalezení vhodného modelu studované závislosti vyjádření reálného tvaru závislosti minimalizace

Více

Předpověď plemenné hodnoty Něco málo z praxe. Zdeňka Veselá

Předpověď plemenné hodnoty Něco málo z praxe. Zdeňka Veselá Předpověď plemenné hodnoty Něco málo z praxe Zdeňka Veselá vesela.zdenka@vuzv.cz Příprava datových souboru Databáze s výsledky užitkovosti jsou zpravidla obrovské soubory Např. kontrola užitkovosti masného

Více

5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I 5EN306 Aplikované kvantitativní metody I Přednáška 5 Zuzana Dlouhá Předmět a struktura kurzu 1. Úvod: struktura empirických výzkumů 2. Tvorba ekonomických modelů: teorie 3. Data: zdroje a typy dat, význam

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,

Více

odpovídá jedna a jen jedna hodnota jiných

odpovídá jedna a jen jedna hodnota jiných 8. Regresní a korelační analýza Problém: hledání, zkoumání a hodnocení souvislostí, závislostí mezi dvěma a více statistickými znaky (veličinami). Typy závislostí: pevné a volné Pevná závislost každé hodnotě

Více

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, KMA/SZZS1 Matematika 1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, operace s limitami. 2. Limita funkce

Více

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

MATEMATICKÁ STATISTIKA.   Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci Matematická statistika Matematická statistika se zabývá matematickým

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO

Více

Aplikovaná statistika v R - cvičení 3

Aplikovaná statistika v R - cvičení 3 Aplikovaná statistika v R - cvičení 3 Filip Děchtěrenko Matematicko-fyzikální fakulta filip.dechterenko@gmail.com 5.8.2014 Filip Děchtěrenko (MFF UK) Aplikovaná statistika v R 5.8.2014 1 / 10 Lineární

Více

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

Matematické modelování Náhled do ekonometrie. Lukáš Frýd Matematické modelování Náhled do ekonometrie Lukáš Frýd Výnos akcie vs. Výnos celého trhu - CAPM model r it = r ft + β 1. (r mt r ft ) r it r ft = α 0 + β 1. (r mt r ft ) + ε it Ekonomický (finanční model)

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Náhodný výběr Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

AVDAT Nelineární regresní model

AVDAT Nelineární regresní model AVDAT Nelineární regresní model Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Nelineární regresní model Ey i = f (x i, β) kde x i je k-členný vektor vysvětlujících proměnných

Více

INDUKTIVNÍ STATISTIKA

INDUKTIVNÍ STATISTIKA 10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ HODNOCENÍ ZÁVISLOSTÍ KVALITATIVNÍ VELIČINY - Vychází se z kombinační (kontingenční) tabulky, která je výsledkem třídění druhého stupně KVANTITATIVNÍ

Více

Měření závislosti statistických dat

Měření závislosti statistických dat 5.1 Měření závislosti statistických dat Každý pořádný astronom je schopen vám předpovědět, kde se bude nacházet daná hvězda půl hodiny před půlnocí. Ne každý je však téhož schopen předpovědět v případě

Více

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé. 1. Korelační analýza V životě většinou nesledujeme pouze jeden statistický znak. Sledujeme více statistických znaků zároveň. Kromě vlastností statistických znaků nás zajímá také jejich těsnost (velikost,

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých

Více

Statistické metody v marketingu. Ing. Michael Rost, Ph.D.

Statistické metody v marketingu. Ing. Michael Rost, Ph.D. Statistické metody v marketingu Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Regresní analýza doplnění základů Vzhledem k požadavku Vašich kolegů zařazuji doplňující partii o regresní

Více

Základy ekonometrie. XI. Vektorové autoregresní modely. Základy ekonometrie (ZAEK) XI. VAR modely Podzim / 28

Základy ekonometrie. XI. Vektorové autoregresní modely. Základy ekonometrie (ZAEK) XI. VAR modely Podzim / 28 Základy ekonometrie XI. Vektorové autoregresní modely Základy ekonometrie (ZAEK) XI. VAR modely Podzim 2015 1 / 28 Obsah tématu 1 Prognózování s VAR modely 2 Vektorové modely korekce chyb (VECM) 3 Impulzní

Více

Eva Fišerová a Karel Hron. Katedra matematické analýzy a aplikací matematiky Přírodovědecká fakulta Univerzity Palackého v Olomouci.

Eva Fišerová a Karel Hron. Katedra matematické analýzy a aplikací matematiky Přírodovědecká fakulta Univerzity Palackého v Olomouci. Ortogonální regrese pro 3-složkové kompoziční data využitím lineárních modelů Eva Fišerová a Karel Hron Katedra matematické analýzy a aplikací matematiky Přírodovědecká fakulta Univerzity Palackého v Olomouci

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Pravděpodobnost, náhoda, kostky

Pravděpodobnost, náhoda, kostky Pravděpodobnost, náhoda, kostky Radek Pelánek IV122 Výhled pravděpodobnost náhodná čísla lineární regrese detekce shluků Dnes lehce nesourodá směs úloh souvisejících s pravděpodobností připomenutí, souvislosti

Více

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel Regresní analýza Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Regresní analýza 1 / 23

Více

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X Náhodný vektor Náhodný vektor zatím jsme sledovali jednu náhodnou veličinu, její rozdělení a charakteristiky často potřebujeme vyšetřovat vzájemný vztah několika náhodných veličin musíme sledovat jejich

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOS A SAISIKA Regresní analýza - motivace Základní úlohou regresní analýzy je nalezení vhodného modelu studované závislosti. Je nutné věnovat velkou pozornost tomu aby byla modelována REÁLNÁ

Více

Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Stochastický proces Posloupnost náhodných veličin {Y t, t = 0, ±1, ±2 } se nazývá stochastický proces

Více

Chyba predikce při rezervování metodou Chain Ladder u korelovaných vývojových trojúhelníků

Chyba predikce při rezervování metodou Chain Ladder u korelovaných vývojových trojúhelníků Chyba predikce při rezervování metodou Chain Ladder u korelovaných vývojových trojúhelníků Mgr. Marcela Martinů 13. května 2016 5/13/2016 0 Obsah 1. Úvod a. Motivace a cíle b. Základní metody 2. Rozšířená

Více

Pravděpodobnost, náhoda, kostky

Pravděpodobnost, náhoda, kostky Pravděpodobnost, náhoda, kostky Radek Pelánek IV122, jaro 2015 Výhled pravděpodobnost náhodná čísla lineární regrese detekce shluků Dnes lehce nesourodá směs úloh souvisejících s pravděpodobností krátké

Více

7. Analýza rozptylu.

7. Analýza rozptylu. 7. Analýza rozptylu. Uvedeme obecnou ideu, která je založena na minimalizaci chyby metodou nejmenších čtverců. Nejdříve uvedeme několik základních tvrzení. Uvažujeme náhodný vektor Y = (Y, Y,..., Y n a

Více

Regresní analýza 1. Regresní analýza

Regresní analýza 1. Regresní analýza Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému

Více

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

MÍRY ZÁVISLOSTI (KORELACE A REGRESE) zhanel@fsps.muni.cz MÍRY ZÁVISLOSTI (KORELACE A REGRESE) 2.5 MÍRY ZÁVISLOSTI 2.5.1 ZÁVISLOST PEVNÁ, VOLNÁ, STATISTICKÁ A KORELAČNÍ Jednorozměrné soubory - charakterizovány jednotlivými statistickými znaky

Více

Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných)

Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných) Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných) 1. SPECIFIKACE (12 bodů): (1) Graf průběhu proměnných (1) Obě řady se chovají stejně, lze předpokládat jejich lineární vztah

Více

Odhady Parametrů Lineární Regrese

Odhady Parametrů Lineární Regrese Odhady Parametrů Lineární Regrese Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké

Více

Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů Časové řady, typy trendových funkcí a odhady trendů Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Jiří Neubauer (Katedra ekonometrie UO Brno) Časové

Více

Aplikovaná statistika v R - cvičení 2

Aplikovaná statistika v R - cvičení 2 Aplikovaná statistika v R - cvičení 2 Filip Děchtěrenko Matematicko-fyzikální fakulta filip.dechterenko@gmail.com 5.6.2014 Filip Děchtěrenko (MFF UK) Aplikovaná statistika v R 5.6.2014 1 / 18 Přehled Rkových

Více

Bodové a intervalové odhady parametrů v regresním modelu

Bodové a intervalové odhady parametrů v regresním modelu Bodové a intervalové odhady parametrů v regresním modelu 1 Odhady parametrů 11 Bodové odhady Mějme lineární regresní model (LRM) kde Y = y 1 y 2 y n, e = e 1 e 2 e n Y = Xβ + e, x 11 x 1k, X =, β = x n1

Více

6. Lineární regresní modely

6. Lineární regresní modely 6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu

Více

NELINEÁRNÍ REGRESE V PŘÍKLADECH NONLINEAR REGRESSION IN EXAMPLES. Karel Zvára. 1. Úvodem. 2. Bodový a intervalový odhad

NELINEÁRNÍ REGRESE V PŘÍKLADECH NONLINEAR REGRESSION IN EXAMPLES. Karel Zvára. 1. Úvodem. 2. Bodový a intervalový odhad 7 7 7 Ročník 26, číslo 3, září 2015 Informační bulletin České statistické společnosti, 3/2015 NELINEÁRNÍ REGRESE V PŘÍKLADECH NONLINEAR REGRESSION IN EXAMPLES Karel Zvára Adresa: ÚAMVT PřF UK v Praze,

Více

AVDAT Mnohorozměrné metody, metody klasifikace

AVDAT Mnohorozměrné metody, metody klasifikace AVDAT Mnohorozměrné metody, metody klasifikace Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Mnohorozměrné metody Regrese jedna náhodná veličina je vysvětlována pomocí jiných

Více

Stavový model a Kalmanův filtr

Stavový model a Kalmanův filtr Stavový model a Kalmanův filtr 2 prosince 23 Stav je veličina, kterou neznáme, ale chtěli bychom znát Dozvídáme se o ní zprostředkovaně prostřednictvím výstupů Příkladem může býapř nějaký zašuměný signál,

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie ZS 2015/16 Cvičení 7: Časově řady, autokorelace LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE 1. Časové řady Data: HDP.wf1

Více

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup Statistika Regresní a korelační analýza Úvod do problému Roman Biskup Jihočeská univerzita v Českých Budějovicích Ekonomická fakulta (Zemědělská fakulta) Katedra aplikované matematiky a informatiky 2008/2009

Více

Statistické metody v marketingu. Ing. Michael Rost, Ph.D.

Statistické metody v marketingu. Ing. Michael Rost, Ph.D. Statistické metody v marketingu Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Pojem závislosti Je nutné rozlišit mezi závislostí nepodstatnou a mezi příčinnou čili kauzální závislostí.ta

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza Korelační a regresní analýza 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza Pearsonův korelační koeficient u intervalových a poměrových dat můžeme jako

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK Základy ekonometrie Odhad klasického lineárního regresního modelu II Cvičení 3 Zuzana Dlouhá Klasický lineární regresní model - zadání příkladu Soubor: CV3_PR.xls Data: y = maloobchodní obrat potřeb

Více

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1 Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu

Více

Testování předpokladů pro metodu chain-ladder. Seminář z aktuárských věd Petra Španihelová

Testování předpokladů pro metodu chain-ladder. Seminář z aktuárských věd Petra Španihelová Testování předpokladů pro metodu chain-ladder Seminář z aktuárských věd 4. 11. 2016 Petra Španihelová Obsah Datová struktura Posouzení dat Předpoklady metody chain-ladder dle T. Macka Běžná lineární regrese

Více

Statistické metody v marketingu. Ing. Michael Rost, Ph.D.

Statistické metody v marketingu. Ing. Michael Rost, Ph.D. Statistické metody v marketingu Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Úvodem Modelování vztahů mezi vysvětlující a vysvětlovanou (závisle) proměnnou patří mezi základní aktivity,

Více

8 Coxův model proporcionálních rizik I

8 Coxův model proporcionálních rizik I 8 Coxův model proporcionálních rizik I Předpokládané výstupy z výuky: 1. Student umí formulovat Coxův model proporcionálních rizik 2. Student rozumí významu regresních koeficientů modelu 3. Student zná

Více

Metoda nejmenších čtverců Michal Čihák 26. listopadu 2012

Metoda nejmenších čtverců Michal Čihák 26. listopadu 2012 Metoda nejmenších čtverců Michal Čihák 26. listopadu 2012 Metoda nejmenších čtverců Matematicko-statistická metoda používaná zejména při zpracování nepřesných dat (typicky experimentálních empirických

Více

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Zpracování dat v edukačních vědách - Testování hypotéz Kamila Fačevicová Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Obsah seminářů 5.11. Úvod do matematické

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Vícenásobná regresní a korelační analýza 1 1 Tto materiál bl vtvořen za pomoci grantu FRVŠ číslo 1145/2004. O vícenásobné závislosti mluvíme tehd, jestliže je závisle proměnná závislá na více nezávislých

Více

Lineární a logistická regrese

Lineární a logistická regrese Lineární a logistická regrese Martin Branda Univerzita Karlova v Praze Matematicko-fyzikální fakulta Katedra pravděpodobnosti a matematické statistiky Výpočetní prostředky finanční a pojistné matematiky

Více

KVADRATICKÁ KALIBRACE

KVADRATICKÁ KALIBRACE Petra Širůčková, prof. RNDr. Gejza Wimmer, DrSc. Finanční matematika v praxi III. a Matematické modely a aplikace 4. 9. 2013 Osnova Kalibrace 1 Kalibrace Pojem kalibrace Cíle kalibrace Předpoklady 2 3

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Diagnostika regrese pomocí grafu 7krát jinak

Diagnostika regrese pomocí grafu 7krát jinak StatSoft Diagnostika regrese pomocí grafu 7krát jinak V tomto článečku si uděláme exkurzi do teorie regresní analýzy a detailně se podíváme na jeden jediný diagnostický graf. Jedná se o graf Předpovědi

Více

AVDAT Geometrie metody nejmenších čtverců

AVDAT Geometrie metody nejmenších čtverců AVDAT Geometrie metody nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model klasický lineární regresní model odhad parametrů MNČ y = Xβ + ε, ε

Více

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, 532 10 Pardubice 10. licenční studium chemometrie STATISTICKÉ ZPRACOVÁNÍ DAT Semestrální práce KALIBRACE

Více

1. Přednáška. Ing. Miroslav Šulai, MBA

1. Přednáška. Ing. Miroslav Šulai, MBA N_OFI_2 1. Přednáška Počet pravděpodobnosti Statistický aparát používaný ve financích Ing. Miroslav Šulai, MBA 1 Počet pravděpodobnosti -náhodné veličiny 2 Počet pravděpodobnosti -náhodné veličiny 3 Jevy

Více

AVDAT Náhodný vektor, mnohorozměrné rozdělení

AVDAT Náhodný vektor, mnohorozměrné rozdělení AVDAT Náhodný vektor, mnohorozměrné rozdělení Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Opakování, náhodná veličina, rozdělení Náhodná veličina zobrazuje elementární

Více

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina. Parametrické metody odhadů z neúplných výběrů 2 1 Metoda maximální věrohodnosti pro cenzorované výběry 11 Náhodné cenzorování Při sledování složitých reálných systémů často nemáme možnost uspořádat experiment

Více

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných

Více

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013 Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika Podrobnější rozpis okruhů otázek pro třetí část SZZ Verze: 13. června 2013 1 Úvodní poznámky 6 Smyslem SZZ by nemělo být toliko

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace Jan Slovák Masarykova univerzita Fakulta informatiky 28. 11 2. 12. 2016 Obsah přednášky 1 Literatura 2 Střední

Více

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X Náhodný vektor Náhodný vektor zatím jsme sledovali jednu náhodnou veličinu, její rozdělení a charakteristik často potřebujeme všetřovat vzájemný vztah několika náhodných veličin musíme sledovat jejich

Více

Náhodný vektor a jeho charakteristiky

Náhodný vektor a jeho charakteristiky Náhodný vektor a jeho číselné charakteristiky 1 Náhodný vektor a jeho charakteristiky V následující kapitole budeme věnovat pozornost pouze dvourozměřnému náhodnému vektoru, i když uvedené pojmy a jejich

Více

Value at Risk. Karolína Maňáková

Value at Risk. Karolína Maňáková Value at Risk Karolína Maňáková Value at risk Historická metoda Model-Building přístup Lineární model variance a kovariance Metoda Monte Carlo Stress testing a Back testing Potenciální ztráta s danou pravděpodobností

Více

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) cvičení z PSI 0-4 prosince 06 Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) Z realizací náhodných veličin X a Y s normálním rozdělením) jsme z výběrů daného rozsahu obdrželi

Více

SEMINÁRNÍ PRÁCE Z 4ST432 Tereza Michlíková (xmict05) ZS 06/07

SEMINÁRNÍ PRÁCE Z 4ST432 Tereza Michlíková (xmict05) ZS 06/07 SEMINÁRNÍ PRÁCE Z 4ST432 Tereza Michlíková (xmict05) ZS 06/07 Nesezónní časová řada - Základní údaje o časové řadě Časová řada příjmy z daní z příjmu v Austrálii ( http://www.economagic.com/emcgi/data.exe/tmp/213-220-208-205!20061203093308

Více

Statistická analýza dat

Statistická analýza dat Statistická analýza dat Jméno: Podpis: Cvičení Zkouška (písemná + ústní) 25 Celkem 50 Známka Pokyny k vypracování: doba řešení je 120min, jasně zodpovězte pokud možno všechny otázky ze zadání, pracujte

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost

Více

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků Příklad: Test nezávislosti kategoriálních znaků Určete na hladině významnosti 5 % na základě dat zjištěných v rámci dotazníkového šetření ve Šluknově, zda existuje závislost mezi pohlavím respondenta a

Více

Popis modelu pro odhady PH mléčné užitkovosti

Popis modelu pro odhady PH mléčné užitkovosti Plemdat, s.r.o. 2.4.206 Popis modelu pro odhady P mléčné užitkovosti vířata zařazená do hodnocení V modelu plemene jsou hodnoceny krávy s podílem krve nebo 75% a výše. Krávy s podílem krve masného plemene

Více

POLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými.

POLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými. POLYNOMICKÁ REGRESE Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými. y = b 0 + b 1 x + b 2 x 2 + + b n x n kde b i jsou neznámé parametry,

Více

Popis modelu pro odhady PH mléčné užitkovosti

Popis modelu pro odhady PH mléčné užitkovosti Popis modelu pro odhady PH mléčné užitkovosti Zvířata zařazená do hodnocení V modelu plemene H jsou hodnoceny krávy s podílem krve H nebo 75% a výše. V modelu plemene C jsou hodnoceny krávy s podílem krve

Více

Biostatistika Cvičení 7

Biostatistika Cvičení 7 TEST Z TEORIE 1. Střední hodnota pevně zvolené náhodné veličiny je a) náhodná veličina, b) konstanta, c) náhodný jev, d) výběrová charakteristika. 2. Výběrový průměr je a) náhodná veličina, b) konstanta,

Více

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz. Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení

Více

Měření dat Filtrace dat, Kalmanův filtr

Měření dat Filtrace dat, Kalmanův filtr Měření dat Filtrace dat, Matematické metody pro ITS (11MAMY) Jan Přikryl Ústav aplikované matematiky ČVUT v Praze, Fakulta dopravní 3. přednáška 11MAMY čtvrtek 28. února 2018 verze: 2018-03-21 16:45 Obsah

Více

MATEMATICKÁ STATISTIKA - XP01MST

MATEMATICKÁ STATISTIKA - XP01MST MATEMATICKÁ STATISTIKA - XP01MST 1. Úvod. Matematická statistika (statistics) se zabývá vyšetřováním zákonitostí, které v sobě obsahují prvek náhody. Zpracováním hodnot, které jsou výstupem sledovaného

Více

Normální rozložení a odvozená rozložení

Normální rozložení a odvozená rozložení I Normální rozložení a odvozená rozložení I.I Normální rozložení Data, se kterými pracujeme, pocházejí z různých rozložení. Mohou být vychýlena (doleva popř. doprava, nebo v nich není na první pohled vidět

Více

REGRESNÍ MODELY V POJIŠŤOVNICTVÍ. Seminář z aktuárských věd 2. prosince 2016 Kateřina Vlčková

REGRESNÍ MODELY V POJIŠŤOVNICTVÍ. Seminář z aktuárských věd 2. prosince 2016 Kateřina Vlčková REGRESNÍ MODELY V POJIŠŤOVNICTVÍ Seminář z aktuárských věd 2. prosince 2016 Kateřina Vlčková REGRESNÍ MODELY V POJIŠŤOVNICTVÍ 1. PŘEDSTAVENÍ 2. ÚVOD 3. REGRESNÍ MODELY 1. LM Lineární modely (Linear Model)

Více

http: //meloun.upce.cz,

http: //meloun.upce.cz, Porovnání rozlišovací schopnosti regresní analýzy spekter a spolehlivosti Prof. RNDr. Milan Meloun, DrSc. Katedra analytické chemie, Chemickotechnologická fakulta, Univerzita Pardubice, nám. s. Legií 565,

Více

M cvičení : GLM04b (Vztah mezi Poissonovým a

M cvičení : GLM04b (Vztah mezi Poissonovým a RNDr. Marie Forbelská, Ph.D. 1 M7222 4. cvičení : GLM04b (Vztah mezi Poissonovým a binomických rozdělením) Připomeňme, že pomocí Poissonova rozdělení P o(λ) lze dobře aproximovat binomické rozdělení Bi(n,

Více

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal Základy navrhování průmyslových experimentů DOE II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal! Testování statistických hypotéz kvalitativní odezva kvantitativní chí-kvadrát test homogenity,

Více

Praktikum z ekonometrie Panelová data

Praktikum z ekonometrie Panelová data Praktikum z ekonometrie Panelová data Jan Zouhar Katedra ekonometrie, FIS VŠE v Praze, zouharj@vse.cz 9. května 2014 1 Terminologie a značení Sledujeme-li pro všechny průřezové jednotky stejná časová období,

Více

Úvodem Dříve les než stromy 3 Operace s maticemi

Úvodem Dříve les než stromy 3 Operace s maticemi Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová

Více

Měření dat Filtrace dat, Kalmanův filtr

Měření dat Filtrace dat, Kalmanův filtr Měření dat Filtrace dat, Matematické metody pro ITS (11MAMY) Jan Přikryl Ústav aplikované matematiky ČVUT v Praze, Fakulta dopravní 3. přednáška 11MAMY čtvrtek 28. února 2018 verze: 2018-02-28 12:20 Obsah

Více

Test z teorie VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY

Test z teorie VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY Test z teorie 1. Střední hodnota pevně zvolené náhodné veličiny je a) náhodná veličina, b) konstanta, c) náhodný jev, d) výběrová charakteristika. 2. Výběrový

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y Xβ ε Předpoklady: Matice X X n,k je matice realizací. Předpoklad: n > k, h(x) k - tj. matice

Více

11 Analýza hlavních komponet

11 Analýza hlavních komponet 11 Analýza hlavních komponet Tato úloha provádí transformaci měřených dat na menší počet tzv. fiktivních dat tak, aby většina informace obsažená v původních datech zůstala zachována. Jedná se tedy o úlohu

Více

Intervalová data a výpočet některých statistik

Intervalová data a výpočet některých statistik Intervalová data a výpočet některých statistik Milan Hladík 1 Michal Černý 2 1 Katedra aplikované matematiky Matematicko-fyzikální fakulta Univerzita Karlova 2 Katedra ekonometrie Fakulta informatiky a

Více

Maticí typu (m, n), kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru:

Maticí typu (m, n), kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru: 3 Maticový počet 3.1 Zavedení pojmu matice Maticí typu (m, n, kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru: a 11 a 12... a 1k... a 1n a 21 a 22...

Více

5 Časové řady. Definice 16 Posloupnost náhodných veličin {X t, t T } nazveme slabě stacionární, pokud

5 Časové řady. Definice 16 Posloupnost náhodných veličin {X t, t T } nazveme slabě stacionární, pokud 5 Časové řady Časovou řadou rozumíme posloupnost reálných náhodných veličin X 1,..., X n, přičemž indexy t = 1,..., n interpretujeme jako časové okamžiky. Někdy však uvažujeme i nekonečné posloupnosti

Více