kovů v sedimentech řeky Moravy



Podobné dokumenty
DÚ 7 Identifikace dopadů antropogenních tlaků na povrchové vody a vodní ekosystém

AVDAT Klasický lineární model, metoda nejmenších

LINEÁRNÍ MODELY. Zdeňka Veselá

Smíšené regresní modely a možnosti jejich využití. Karel Drápela

Předpověď plemenné hodnoty Něco málo z praxe. Zdeňka Veselá

5EN306 Aplikované kvantitativní metody I

Testování hypotéz o parametrech regresního modelu

odpovídá jedna a jen jedna hodnota jiných

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Testování hypotéz o parametrech regresního modelu

Aplikovaná statistika v R - cvičení 3

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

PRAVDĚPODOBNOST A STATISTIKA

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

AVDAT Nelineární regresní model

INDUKTIVNÍ STATISTIKA

Měření závislosti statistických dat

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Jednofaktorová analýza rozptylu

Statistické metody v marketingu. Ing. Michael Rost, Ph.D.

Základy ekonometrie. XI. Vektorové autoregresní modely. Základy ekonometrie (ZAEK) XI. VAR modely Podzim / 28

Eva Fišerová a Karel Hron. Katedra matematické analýzy a aplikací matematiky Přírodovědecká fakulta Univerzity Palackého v Olomouci.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost, náhoda, kostky

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

PRAVDĚPODOBNOST A STATISTIKA

Časové řady, typy trendových funkcí a odhady trendů

Chyba predikce při rezervování metodou Chain Ladder u korelovaných vývojových trojúhelníků

Pravděpodobnost, náhoda, kostky

7. Analýza rozptylu.

Regresní analýza 1. Regresní analýza

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných)

Odhady Parametrů Lineární Regrese

Časové řady, typy trendových funkcí a odhady trendů

Aplikovaná statistika v R - cvičení 2

Bodové a intervalové odhady parametrů v regresním modelu

6. Lineární regresní modely

NELINEÁRNÍ REGRESE V PŘÍKLADECH NONLINEAR REGRESSION IN EXAMPLES. Karel Zvára. 1. Úvodem. 2. Bodový a intervalový odhad

AVDAT Mnohorozměrné metody, metody klasifikace

Stavový model a Kalmanův filtr

4EK211 Základy ekonometrie

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Statistické metody v marketingu. Ing. Michael Rost, Ph.D.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

4EK211 Základy ekonometrie

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Testování předpokladů pro metodu chain-ladder. Seminář z aktuárských věd Petra Španihelová

Statistické metody v marketingu. Ing. Michael Rost, Ph.D.

8 Coxův model proporcionálních rizik I

Metoda nejmenších čtverců Michal Čihák 26. listopadu 2012

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Lineární a logistická regrese

KVADRATICKÁ KALIBRACE

Regresní a korelační analýza

Diagnostika regrese pomocí grafu 7krát jinak

AVDAT Geometrie metody nejmenších čtverců

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

1. Přednáška. Ing. Miroslav Šulai, MBA

AVDAT Náhodný vektor, mnohorozměrné rozdělení

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013

Regresní a korelační analýza

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

Náhodný vektor a jeho charakteristiky

Value at Risk. Karolína Maňáková

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

SEMINÁRNÍ PRÁCE Z 4ST432 Tereza Michlíková (xmict05) ZS 06/07

Statistická analýza dat

KGG/STG Statistika pro geografy

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

Popis modelu pro odhady PH mléčné užitkovosti

POLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými.

Popis modelu pro odhady PH mléčné užitkovosti

Biostatistika Cvičení 7

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Měření dat Filtrace dat, Kalmanův filtr

MATEMATICKÁ STATISTIKA - XP01MST

Normální rozložení a odvozená rozložení

REGRESNÍ MODELY V POJIŠŤOVNICTVÍ. Seminář z aktuárských věd 2. prosince 2016 Kateřina Vlčková

http: //meloun.upce.cz,

M cvičení : GLM04b (Vztah mezi Poissonovým a

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

Praktikum z ekonometrie Panelová data

Úvodem Dříve les než stromy 3 Operace s maticemi

Měření dat Filtrace dat, Kalmanův filtr

Test z teorie VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY

Statistická analýza jednorozměrných dat

PRAVDĚPODOBNOST A STATISTIKA

11 Analýza hlavních komponet

Intervalová data a výpočet některých statistik

Maticí typu (m, n), kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru:

5 Časové řady. Definice 16 Posloupnost náhodných veličin {X t, t T } nazveme slabě stacionární, pokud

Transkript:

Smíšené regresní modely při sledování obsahu těžkých kovů v sedimentech řeky Moravy Marie Forbelská Masarykova univerzita Brno Přírodovědecká fakulta Ústav matematiky a statistiky 3. 5. 6. 2012 Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 1 / 36

Obsah 1 Skupinově závislá data 2 Jednoduché modely 3 Obecná definice LMM modelů 4 Odhady parametrů 5 Jednoduchý model pro reálná data Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 2 / 36

Skupinově závislá data Skupinově závislá data Klasické statistické metody se obvykle zajímají buď nezávislými pozorováními nebo časovými řadami V praxi se však občas setkáváme s daty, která se sestávají z nezávislých skupin vzájemně závislých pozorování. Ke správné a efektivní analýze takových dat potřebujeme speciální a zatím relativně málo známé metody. Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 3 / 36

Skupinově závislá data Typy skupinově závislých dat Skupinově závislá data lze zhruba rozdělit do tří skupin 1 čistě skupinová data pozorování, který se týkají skupin vzájemně spřízněných a souvisejících objektů či subjektů, např. pozorování na členech jedné rodiny či sourozencích na výrobcích pocházejících ze stejné dílny na plodinách sklizených z různých částí téhož pole 2 opakovaná měření učiněná na téže jednotce 3 longitudinální data opakovaná měření probíhající v čase Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 4 / 36

Specifikace skupin Skupinově závislá data 1 Čistě skupinová data vyznačují se tím, že nemají žádné přirozené uspořádání mezi jednotlivými závislými měřeními. 2 Opakovaná měření pozorování jsou uspořádána podle pořadí: první, druhé, třetí... 3 Longitudinální data navíc poskytují informaci o čase měření; podobají se pozorováním kratších úseků nezávislých časových řad. Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 5 / 36

Skupinově závislá data Cíle modelování skupinově závislých dat Modelovat závislost jejich středních hodnot a rozptylu na experimentálních podmínkách, při nichž byla učiněna jednotlivá měření na pozorovaných charakteristikách experimentálních objektů Tato formulace vede k problému regresního modelování po skupinách korelovaných pozorování. jako funkce experimentálních podmínek charakteristik měřených objektů rizikových faktorů, apod. Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 6 / 36

Skupinově závislá data Matematická formulace problému Značení index j (j = 1,..., N) označení nezávislé experimentální jednotky (skupiny, subjekty) dvojice indexů ji (i = 1,..., n j ) označení pro korelovaná pozorování na j-té jednotce n = N celkový počet pozorování n j j=1 Y ji = β 0 + x ji1 β 1 + + x jip β p + ε ji měření, kde ε ji regresní model pro ji-té náhodné odchylky s nulovou střední hodnotou a pro něž C(ε ji, ε j i ) = 0 pro j j, ale C(ε ji, ε ji ) může být nenulové. Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 7 / 36

Skupinově závislá data Maticový zápis pro j -tou jednotku Y j = X j β + ε j Y j = (Y j1,..., Y jnj ) vektor opakovaných měření na j -té jednotce x j1 1 X j =.., kde x x ji1 (nenáhodná) ji = matice plánu. pro j -tou jednotku x jn j x jip ε j = (ε j1,..., ε jnj ) N nj (0, σ 2 Σ j ) vektor náhodných chyb pro j -tou jednotku β = (β 0,..., β p ) vektor neznámých parametrů Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 8 / 36

Skupinově závislá data Společný maticový zápis Y = Xβ + ε, kde ε N n (0, Σ) Y = Y 1. Y N, X = X 1. X N Σ 1 0 0. Σ = σ 2 0............. 0 0 Σ N, ε = ε 1. ε N, Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 9 / 36

Skupinově závislá data Náhodné efekty a lineární smíšený model Znovu předpokládáme model Y j = X j β + ε j, ε j N nj (0, σ 2 Σ j ) Rozptylová matice určující korelace mezi Y ji a Y ji kde není diagonální varε j = V j = σ 2 Σ j = V j (ψ) a lineární smíšený model odhaduje vektor parametrů ψ z pozorovaných dat (tj. na základě prediktorů) společně s regresními parametry β. Parametrizace rozptylu může mít několik komponent, mezi nimiž hrají důležitou roli náhodné efekty. Dále na jednoduchém motivačním příkladu ukážeme, jak fungují náhodné efekty v případě lineárního růstového modelu. Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 10 / 36

Jednoduché modely Jednoduché příklady Uvažujme lineární růstový model Y ji = β 0 + β 1 t ji + ε ji, kde EY ji = β 0 + β 1 t ji a t ji je čas i -tého pozorování subjektu j. Pokud například odezvu Y ji interpretujeme jako výšku sledovaného subjektu (člověka, stromu, apod.) v čase t ji, pak parametr β 0 β 1 označuje průměrnou výšku v čase 0 a je průměrný přírůstek za jednotku času. Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 11 / 36

Jednoduché modely Náhodný absolutní člen Předpokládejme, že sledovaní jedinci mají tendenci být buď systematicky vyšší nebo systematicky nižší než průměr, a to po celou dobu sledování. Proto pro j -tý subjekt zavedeme nepozorovanou náhodnou odchylku od průměru b 0 N(0, σ 2 0 ). Pak model upravíme takto Y ji = β 0 + β 1 t ji + b 0 + η ji, kde } {{ } ε ji η ji iid N(0, σ 2 ) a η ji b 0. Pak R(Y ji, Y ji )=R(ε ji, ε ji )= C(ε ji,ε ji Dεji Dεji = (b0+η ji,b 0+η ji ) = Db0 b0+η ji b0+η ji Db 0+Dη ji = σ2 0 > 0 σ0 2+σ2 Navíc pořád bude platit EY ji = β 0 + β 1 t ji Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 12 / 36

Jednoduché modely Náhodný absolutní člen i směrnice Nyní budeme předpokládat, že sledovaní jedinci se liší nejen polohou, ale i směrnicí růstu. Zavedeme navíc nepozorovanou náhodnou veličinu b 1 N(0, σ 2 1 ). Pak model upravíme takto Y ji = β 0 + β 1 t ji + b 0 + b 1 t ji + η ji, kde } {{ } ε ji η ji, b 0, b 1 jsou nezávislé náhodné veličiny. Pak C(Y ji, Y ji )=C(ε ji, ε ji )=C(b 0 +b 1 t ji +η ji, b 0 +b 1 t ji +η ji ) a vidíme, že v =Db 0 + t ji t ji Db 1 = σ0 2 + t jit ji σ1 2 > 0 modelu s náhodnou směricí jak rozptyl Y ji, tak kovariance mezi Y ji a Y ji rostou s časem. Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 13 / 36

Obecná definice LMM modelů Lineární smíšený model (Linear Mixed Model LMM) Obecný model s náhodnými efekty zobecňuje princip, který jsme ilustrovali zavedením náhodného absolutního členu a náhodné směrnice. Uvažujme náhodné parametry pro jakékoli prediktory. Dostaneme model Y j = X j β + Z j b j + η j, kde } {{ } ε j matice plánu X j je typu n j k (k = p + 1) a Z j je typu n j q, vektor pevných efektů β je typu k 1 vektor náhodných efektů b j N q (0, D) je typu q 1 η j N nj (0, σ 2 Σ j ), oba normální vektory b j a η j jsou nezávislé. Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 14 / 36

Obecná definice LMM modelů Varianční struktura LMM Zavedením náhodných efektů modelujeme rozptyl V j = DY j = Dε j = D(Z j b j + η j ) = Z j DZ j + σ2 Σ j (a tím i korelace mezi Y ji a Y ji ) Pro longitudinální data přidáme autoregresní složku W j (t), tj. ε j = Z j b j + W j (t) + η j, kde W j (t) je vektor hodnot autoregresního procesu v časech t = (t j1,..., t jnj ) s rozptylem τ 2 a korelační funkcí R(W j(s 1), W j(s 2))=e φ s 1 s 2 Pak autokorelační složka vnáší do modelu pozitivní korelace, které klesají se vzrůstajícím rozdílem času. Časově blízká pozorování jsou pak více korelovaná, než pozorování vzdálená. Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 15 / 36

Odhady parametrů Odhady parametrů v LMM modelech Parametry LMM modelu se odhadují za předpokladu, že všechny složky náhodné chyby mají mnohorozměrné normální rozdělení. Označíme-li neznámé parametry matice V j jako ψ a budeme-li předpokládat, že je známe, pak ML odhad 1 N N β = X jv 1 j X j X jv 1 j Y j (1) j=1 Lze ukázat, že jde o nejlepší nestranný lineární odhad (Best Linear Unbiased Estimator, BLUE) pro β, kde nejlepší znamená, že má minimální střední kvadratickou chybu. j=1 Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 16 / 36

Odhady parametrů BLUP odhady náhodných efektů Chceme li predikovat náhodné efekty, použijeme podmíněnou střední hodnotu E(b j Y j ) Za předpokladu, že ψ známe dostaneme b j = DZ jv 1 j (Y j X j β), (2) Lze ukázat, že jde o nejlepší nestranný lineární prediktor (Best Linear Unbiased Predictor, BLUP) pro b j, kde nejlepší je opět ve smyslu minimální střední kvadratické chyby. Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 17 / 36

ML (REML) odhady ψ Odhady parametrů Odhad parametrů ψ se provádí pomocí metody maximální věrohodnosti (ML-odhad, l 1 ), popř. REML (Restricted Maximum Likelihood, l 2 ). N N l 1(ψ; y 1,..., y N )= c 1 1 log( V 2 j ) 1 2 j=1 j=1 N N l 2(ψ; y 1,..., y N )= c 2 1 log( V 2 j ) 1 2 kde r j = y j X j j=1 N 1 2 j=1 ( N j=1 j=1 r j V 1 j r j (3) r j V 1 j r j log( X jv 1 j X j ) (4) X j V 1 j X j ) 1 ( N c 1 a c 2 jsou vhodné konstanty. j=1 X j V 1 j y j ) 1 Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 18 / 36

Odhady parametrů Numerické výpočty Rovnice (3) a (4) se maximalizují iterativně (Fisher scoring, Newton Raphson, více viz Demidenko, 2004). V rovnicích (1) a (2) se neznámé ψ nahradí ψml nebo ψ REML, v tom případě mluvíme o empirickém BLUE odhadu pro β, popř. empirickém BLUP odhadu pro b j Pro testování fixních efektů, náhodných efektů a variančních komponent se využívají testy poměrem věrohodností nebo Waldovy testy (více Verbeke and Molenberghs, 2000). Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 19 / 36

Predikce Odhady parametrů Prediktor pro podmíněnou střední hodnotu E(Y j b j ) = µ j bj = X j β + Z j b j dostaneme po dosazení příslušných odhadů do rovnic (1) a (2) µ j bj = X j β + Zj bj = X j β + Zj DZ j V 1 j (Y j X j β) = (I nj Z j DZ j V 1 j )X j β + Zj DZ j V 1 j Y j = Σ j V 1 j X j β + (Inj Σ j V 1 j X j )Y j. Vidíme, že výraz µ j bj je váženým průměrem X j β (vztahující se k celé populaci) a Y j (vztahující se k subjektu j ). Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 20 / 36

Jednoduchý model pro reálná data Dlouhodobé sledování obsahu prioritních a dalších nebezpečných látek v sedimentech řeky Moravy v letech 1997 2010 V nejvíce zatížených úsecích, situovaných v podélném profilu řeky Moravy mezi 298. a 93. říčním kilometrem, bylo sledováno více než 50 ukazatelů ze skupin těžké kovy, polychlorované bifenyly (PCB), organochlorované pesticidy (OCP) a polyaromatické uhlovodíky (PAU). Příklad prezentuje první výsledky účelového sledování a následného statistického zhodnocení časového vývoje obsahu prioritních a dalších nebezpečných látek v sedimentech řeky Moravy, a to v letech 1997 2010. Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 21 / 36

Jednoduchý model pro reálná data Specifikace sběru dat Vzorky sedimentů byly odebírány v 7 lokalitách v podélném profilu řeky Moravy 1. Šumperk pod 5. Uherské Hradiště pod 2. Olomouc pod 6. Hodonín pod 3. Kroměříž pod 7. Lanžhot pod 4. Otrokovice pod ze dna tzv. brodící metodou pomocí ručního vzorkovače na tyči. Část předupraveného vzorku pak byla uřčena ke stanovení těžkých kovů olova (Pb), rtuti (Hg), kadmia (Cd) a niklu (Ni). Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 22 / 36

Jednoduchý model pro reálná data Model Y ji = β 0 + β 1 t ji + ε ji = β 0 + β 1 t ji + b j0 + η ji } {{ } ε ji lokality j = 1,..., 7 η ji N(0, σ 2 j ) (heteroskedastický) b j0 N(0, σ 2 b ) počty pozorování uvnitř lokalit n j lokalita 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2008 2009 2010 Šumperk pod 2 2 2 2 2 2 2 2 2 1 1 2 1 23 Olomouc pod 2 2 2 2 2 2 1 2 2 1 2 2 1 23 Kroměříž pod 0 2 2 2 2 2 2 2 2 1 2 2 1 22 Otrokovice pod 2 2 2 2 2 2 1 3 2 1 2 2 1 24 Uherské Hradiště pod 2 2 2 2 2 2 2 2 2 1 2 2 1 24 Hodonín pod 2 2 2 2 2 2 2 2 3 1 0 0 0 20 Lanžhot pod 2 2 0 0 2 2 0 2 2 2 2 2 1 19 12 14 12 12 14 14 10 15 15 8 11 12 6 155 Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 23 / 36

Olovo Pb Jednoduchý model pro reálná data Morava Šumperk pod Morava Olomouc pod 300 Morava Kroměříž pod Morava Otrokovice pod 250 200 150 Pb[mg/kg] 100 50 0 Morava Uherské Hradiště pod Morava Hodonín pod Morava Lanžhot pod 300 250 200 150 Morava Šumperk pod Morava Olomouc pod year Morava Kroměříž pod 100 50 0 Morava Otrokovice pod 5 logpb[mg/kg] 4 3 2 Morava Uherské Hradiště pod Morava Hodonín pod Morava Lanžhot pod 5 4 3 2 year Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 24 / 36

Rtuť Hg Jednoduchý model pro reálná data Morava Šumperk pod Morava Olomouc pod Morava Kroměříž pod Morava Otrokovice pod 2.0 1.5 1.0 Hg[mg/kg] 0.5 0.0 Morava Uherské Hradiště pod Morava Hodonín pod Morava Lanžhot pod 2.0 1.5 1.0 0.5 0.0 year 1 Morava Šumperk pod Morava Olomouc pod Morava Kroměříž pod Morava Otrokovice pod 0 1 2 loghg[mg/kg] 3 Morava Uherské Hradiště pod Morava Hodonín pod Morava Lanžhot pod 1 0 1 2 3 year Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 25 / 36

Kadmium Cd Jednoduchý model pro reálná data Morava Šumperk pod Morava Olomouc pod 4 3 Morava Kroměříž pod Morava Otrokovice pod Cd[mg/kg] 2 1 0 Morava Uherské Hradiště pod Morava Hodonín pod Morava Lanžhot pod 4 3 2 1 0 year Morava Šumperk pod Morava Olomouc pod Morava Kroměříž pod Morava Otrokovice pod 1 0 1 2 logcd[mg/kg] 3 Morava Uherské Hradiště pod Morava Hodonín pod Morava Lanžhot pod 1 0 1 2 3 year Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 26 / 36

Nikl Ni Jednoduchý model pro reálná data Ni[mg/kg] 100 80 60 40 20 Morava Šumperk pod Morava Uherské Hradiště pod Morava Olomouc pod Morava Hodonín pod Morava Kroměříž pod Morava Lanžhot pod 100 Morava Otrokovice pod 80 60 40 20 year Morava Šumperk pod Morava Olomouc pod Morava Kroměříž pod Morava Otrokovice pod 4.5 4.0 3.5 3.0 logni[mg/kg] 2.5 Morava Uherské Hradiště pod Morava Hodonín pod Morava Lanžhot pod 4.5 4.0 3.5 3.0 2.5 year Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 27 / 36

Jednoduchý model pro reálná data Výpočet v prostředí R library(nlme) t <- year - 2003 model<-lme(y~t,data,random=~1 locality, weights=varident(form=~1 locality), na.action = na.omit) summary(model) Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 28 / 36

Olovo - Pb Jednoduchý model pro reálná data Linear mixed-effects model fit by REML Data: data AIC BIC loglik 193.0593 222.9636-86.52963 Random effects: Formula: ~1 locality (Intercept) Residual StdDev: 0.1215337 0.7152695 Variance function: Structure: Different standard deviations per stratum Formula: ~1 locality Parameter estimates: Morava - Šumperk pod Morava - Olomouc pod Morava - Kroměříž pod Morava - Otrokovice pod 1.0000000 0.4156350 0.8607895 0.3959277 Morava - Uherské Hradiště pod Morava - Hodonín pod Morava - Lanžhot pod 0.5931589 0.6695564 0.2898930 Fixed effects: y ~ t Value Std.Error DF t-value p-value (Intercept) 3.582707 0.05720364 141 62.63075 0.0000 t 0.014127 0.00703942 141 2.00680 0.0467 Correlation: (Intr) t 0.018 Standardized Within-Group Residuals: Min Q1 Med Q3 Max -2.96290294-0.43938097-0.07563171 0.43379565 3.56820630 Number of Observations: 149 Number of Groups: 7 Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 29 / 36

Olovo - Pb Jednoduchý model pro reálná data 5 0 5 5 0 5 Morava Šumperk pod Morava Olomouc pod Morava Kroměříž pod Morava Otrokovice pod 6 5 4 3 log(pb) 2 Morava Uherské Hradiště pod Morava Hodonín pod Morava Lanžhot pod 6 5 4 3 2 5 0 5 5 0 5 year 2003 OLS fitted curve river averaged curve location specific curve Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 30 / 36

Rtuť - Hg Jednoduchý model pro reálná data Linear mixed-effects model fit by REML Data: data AIC BIC loglik 208.6709 238.2994-94.33546 Random effects: Formula: ~1 locality (Intercept) Residual StdDev: 0.1997158 0.9465204 Variance function: Structure: Different standard deviations per stratum Formula: ~1 locality Parameter estimates: Morava - Šumperk pod Morava - Olomouc pod Morava - Kroměříž pod Morava - Otrokovice pod 1.0000000 0.5659930 0.4167185 0.2944500 Morava - Uherské Hradiště pod Morava - Hodonín pod Morava - Lanžhot pod 0.4919709 0.5011731 0.1773115 Fixed effects: y ~ t Value Std.Error DF t-value p-value (Intercept) -1.532692 0.08478625 137-18.077123 0.0000 t -0.000878 0.00685534 137-0.128075 0.8983 Correlation: (Intr) t 0.004 Standardized Within-Group Residuals: Min Q1 Med Q3 Max -3.04813481-0.65959081 0.07809591 0.63179852 2.77514292 Number of Observations: 145 Number of Groups: 7 Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 31 / 36

Rtuť - Hg Jednoduchý model pro reálná data 5 0 5 5 0 5 3 Morava Šumperk pod Morava Olomouc pod Morava Kroměříž pod Morava Otrokovice pod 2 1 0 1 2 3 log(hg) Morava Uherské Hradiště pod Morava Hodonín pod Morava Lanžhot pod 3 2 1 0 1 2 3 5 0 5 5 0 5 year 2003 OLS fitted curve river averaged curve location specific curve Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 32 / 36

Kadmium - Cd Jednoduchý model pro reálná data Linear mixed-effects model fit by REML Data: data AIC BIC loglik 199.7368 229.6412-89.86842 Random effects: Formula: ~1 locality (Intercept) Residual StdDev: 0.1353709 0.5714681 Variance function: Structure: Different standard deviations per stratum Formula: ~1 locality Parameter estimates: Morava - Šumperk pod Morava - Olomouc pod Morava - Kroměříž pod Morava - Otrokovice pod 1.0000000 0.6380117 0.5532498 0.5530684 Morava - Uherské Hradiště pod Morava - Hodonín pod Morava - Lanžhot pod 1.1976323 1.1036569 0.3270760 Fixed effects: y ~ t Value Std.Error DF t-value p-value (Intercept) -0.3182117 0.06197359 141-5.134635 0e+00 t -0.0246454 0.00699199 141-3.524809 6e-04 Correlation: (Intr) t 0.01 Standardized Within-Group Residuals: Min Q1 Med Q3 Max -3.93709373-0.59880135 0.07143175 0.63996725 2.11808314 Number of Observations: 149 Number of Groups: 7 Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 33 / 36

Kadmium - Cd Jednoduchý model pro reálná data 5 0 5 5 0 5 Morava Šumperk pod Morava Olomouc pod Morava Kroměříž pod Morava Otrokovice pod 1 0 1 2 log(cd) 3 Morava Uherské Hradiště pod Morava Hodonín pod Morava Lanžhot pod 1 0 1 2 3 5 0 5 5 0 5 year 2003 OLS fitted curve river averaged curve location specific curve Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 34 / 36

Nikl - Ni Jednoduchý model pro reálná data Linear mixed-effects model fit by REML Data: data AIC BIC loglik 108.6352 134.9825-44.31761 Random effects: Formula: ~1 locality (Intercept) Residual StdDev: 0.003858363 0.4539426 Variance function: Structure: Different standard deviations per stratum Formula: ~1 locality Parameter estimates: Morava - Šumperk pod Morava - Olomouc pod Morava - Kroměříž pod Morava - Otrokovice pod 1.0000000 0.7358266 0.7145150 0.7510095 Morava - Uherské Hradiště pod Morava - Hodonín pod Morava - Lanžhot pod 0.8001173 0.6859501 0.7251079 Fixed effects: y ~ t Value Std.Error DF t-value p-value (Intercept) 3.659876 0.03394462 97 107.81904 0 t 0.039504 0.00760393 97 5.19526 0 Correlation: (Intr) t 0.081 Standardized Within-Group Residuals: Min Q1 Med Q3 Max -2.79472216-0.58620001 0.07943316 0.69946996 2.18148263 Number of Observations: 105 Number of Groups: 7 Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 35 / 36

Nikl - Ni Jednoduchý model pro reálná data 5 0 5 5 0 5 Morava Šumperk pod Morava Olomouc pod Morava Kroměříž pod Morava Otrokovice pod 5.0 4.5 4.0 3.5 3.0 2.5 log(ni) Morava Uherské Hradiště pod Morava Hodonín pod Morava Lanžhot pod 5.0 4.5 4.0 3.5 3.0 2.5 5 0 5 5 0 5 year 2003 OLS fitted curve river averaged curve location specific curve Marie Forbelská (MU ÚMS) LMM obsah těžkých kovů v řece Moravě 3. 5. 6. 2012 36 / 36