David Zelený GRADIENTOVÁ ANALÝZA

Podobné dokumenty
PCA BIPLOT ŠKÁLOVÁNÍ OS (1)

PŘÍKLADY POUŽITÍ ORDINAČNÍCH METOD

ZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV

ZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV

STATISTICKÉ METODY; ZÍSKÁVÁNÍ INFORMACÍ Z DRUHOVÝCH A ENVIRONMENTÁLNÍCH DAT

Ordinační analýzy v programu JUICE

ZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV

Vícerozměrné statistické metody

Gradient. Gradient změna některého faktoru prostředí

EKOLOGICKÁ PODOBNOST (ECOLOGICAL RESEMBLANCE) David Zelený Zpracování dat v ekologii společenstev

Úvodem Dříve les než stromy 3 Operace s maticemi

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

ELLENBERGOVY INDIKAČNÍ HODNOTY. David Zelený Zpracování dat v ekologii společenstev

ELLENBERGOVY INDIKAČNÍ HODNOTY. David Zelený Zpracování dat v ekologii společenstev

SPECIES ATTRIBUTES IN ANALYSIS OF COMMUNITY ECOLOGY DATA

INDEXY DIVERZITY. David Zelený Zpracování dat v ekologii společenstev

Vícerozměrné statistické metody

NUMERICKÁ KLASIFIKACE. David Zelený Zpracování dat v ekologii společenstev

INDEXY DIVERZITY. David Zelený Zpracování dat v ekologii společenstev

Přednáška 13 Redukce dimenzionality

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Univerzita Pardubice 8. licenční studium chemometrie

REGRESE VS KALIBRACE. David Zelený Zpracování dat v ekologii společenstev

Fakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody

2019/03/31 17:38 1/2 Klasifikační a regresní stromy

Vícerozměrné statistické metody

Cronbachův koeficient α nová adaptovaná metoda uvedení vlastností položkové analýzy deskriptivní induktivní parametrické

4EK211 Základy ekonometrie

ZX510 Pokročilé statistické metody geografického výzkumu

6. Lineární regresní modely

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

Vícerozměrné statistické metody

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Statistická analýza jednorozměrných dat

Regresní analýza 1. Regresní analýza

Mnohorozměrná analýza ekologických dat

Úvod do vícerozměrných metod. Statistické metody a zpracování dat. Faktorová a komponentní analýza (Úvod do vícerozměrných metod)

Smíšené regresní modely a možnosti jejich využití. Karel Drápela

AVDAT Mnohorozměrné metody, metody klasifikace

Statistické metody a zpracování dat. IX Faktorová a komponentní analýza (Úvod do vícerozměrných metod) Petr Dobrovolný

PSY117/454 Statistická analýza dat v psychologii. Zobrazení dvojrozměrných dat Bodový graf - Scatterplot Korelační koeficient

UNIVERZITA PARDUBICE. 4.4 Aproximace křivek a vyhlazování křivek

Vícerozměrné statistické metody

Metodika. Zájmová území

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

LINEÁRNÍ REGRESE. Lineární regresní model

Testování hypotéz a měření asociace mezi proměnnými

10. Předpovídání - aplikace regresní úlohy

SEMESTRÁLNÍ PRÁCE 3.5 Klasifikace analýzou vícerozměrných dat

Ilustrační příklad odhadu LRM v SW Gretl

KGG/STG Statistika pro geografy

DIVERZITA. David Zelený Zpracování dat v ekologii společenstev

Vícerozměrné statistické metody

Hodnocení obcí podle zastoupení druhů pozemků 1

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )

Metody zvýrazňování obrazu III. Vícepásmová zvýraznění. Spektrální příznaky. Příznakový prostor. Podstata vícepásmových zvýraznění

Regrese. používáme tehdy, jestliže je vysvětlující proměnná kontinuální pokud je kategoriální, jde o ANOVA

Regresní a korelační analýza

ZPRACOVÁNÍ DAT V EKOLOGII

Tomáš Karel LS 2012/2013

Vyhodnocení průměrných denních analýz kalcinátu ananasového typu. ( Metoda hlavních komponent )

Měření závislosti statistických dat

POLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými.

Prostorová variabilita

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Tomáš Karel LS 2012/2013

odpovídá jedna a jen jedna hodnota jiných

Testování hypotéz o parametrech regresního modelu

Regresní a korelační analýza

KGG/STG Statistika pro geografy

Pokročilé neparametrické metody. Klára Kubošová

Hluboká říční údolí jako objekt pro modelování vztahů vegetace a proměnných prostředí?

6. Lineární regresní modely

Příklad 2: Obsah PCB v játrech zemřelých lidí. Zadání: Data: Program:

Inovace bakalářského studijního oboru Aplikovaná chemie

Statistické vyhodnocení průzkumu funkční gramotnosti žáků 4. ročníku ZŠ

Příklad 2: Určení cihlářských surovin na základě chemické silikátové analýzy

3.4 Určení vnitřní struktury analýzou vícerozměrných dat

Eva Fišerová a Karel Hron. Katedra matematické analýzy a aplikací matematiky Přírodovědecká fakulta Univerzity Palackého v Olomouci.

Analýza rozptylu. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Srovnávání více než dvou průměrů

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy

Vytěžování znalostí z dat

Testování hypotéz o parametrech regresního modelu

ZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV

4EK211 Základy ekonometrie

ZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů

Faktorová analýza. PSY252 Statistická analýza dat v psychologii II

Analýza dat na PC I.

Statistické testování hypotéz II

Zpracování geobotanických dat v. Sestavili Tomáš Herben a Zuzana Münzbergová

Odhalení skryté struktury a vnitřních vazeb dat vícerozměrnou statistickou analýzou pitné vody

Kanonická korelační analýza

11.Metody molekulové spektrometrie pro kvantitativní analýzu léčiv

Matematika pro geometrickou morfometrii

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

Vícerozměrné metody. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Schematický úvod

Transkript:

David Zelený Zpracování dat v ekologii společenstev G GRADIENTOVÁ ANALÝZA

HISTORIE WHITTAKER 1956 - PŘÍMÁ GRADIENTOVÁ ANALÝZA Zpracování dat v ekologii společenstev 108 Whittaker (1956): Vegetation of the Great Smoky Mountains. Ecological Monographs 26: 2-80

HISTORIE BRAY & CURTIS 1957 - NEPŘÍMÁ GRADIENTOVÁ ANALÝZA Zpracování dat v ekologii společenstev 109 Bray & Curtis (1957): An ordination of the upland forest communities of Southern Wisconsin. Ecological Monographs 27: 326-349

H HISTORIE... P.C.A. cannot be carried out practically without a computer, unless the number of individuals is very small. European phytosociologists generally don t have computers at their disposal. Hence they are in need of approximative methods that can be carried out by hand or with simple desk calculators... van der Maarel, 1969, Vegetatio Zpracová ní dat v eko ologii společenstev 110

M METODY GRADIENTOVÉ ANALÝZY Data, která máme: počet charakteristik prostředí počet druhů Apriorní znalost vztahů mezi druhy a prostředím? Použijeme: Dostaneme: 1, n 1 ne regrese závislost druhu na prostředí žádné n ano kalibrace odhady hodnot charakteristik prostředí žádné n ne nepřímá ordinace 1, n n ne přímá ordinace osy variability v druhovém složení variabilita ve druhovém složení vysvětlená charakteristikami prostředí Zpracová ní dat v eko ologii společ čenstev Lepš & Šmilauer (2003) Multivariate analysis of... 111

David Zelený Zpracování dat v ekologii společenstev N NEPŘÍMÁ ORDINAČNÍ ANALÝZA

K KONCEPCE MNOHOROZMĚRNÉHO PROSTORU Prostor může být definován 1) druhy (species space ) druhy jsou osami mnohorozměrného prostoru vzorky jsou body v tomto prostoru zobrazení původní matice druhy-vzorky 2) vzorky (sample space) vzorky jsou osami mnohorozměrného prostoru druhy jsou body v tomto prostoru zobrazení původní matice druhy-vzorky 3) vzdálenostmi mezi druhy (species dissimilarity space) osami jsou vzdálenosti k druhu x druhy jsou body v tomto prostoru zobrazení matice nepodobností mezi druhy 4) vzdálenostmi mezi snímky (sample dissimilarity space) osami jsou vzdálenosti ke vzorku y vzorky jsou body v tomto t prostoru zobrazení matice nepodobností mezi vzorky 5) ekologickými gradienty (ecological space) osami jsou ekologické gradienty jako body do něj lze zobrazit druhy i vzorky Zuur et al. (2007) 118 Zpracová ní dat v eko ologii společ čenstev

O ORDINACE OPODSTATNĚNÍ jeden gradient prostředí většinou ovlivňuje chování (abundanci) několika druhů najednou základní chování společenstev druhová data jsou redundantní pokud znám chování (abundanci) jednoho druhu, můžu do určité míry odhadnout chování i některých dalších druhů díky této redundanci je možné (a hlavně smysluplné) zredukovat mnohorozměrný prostor, ve kterém jsou druhy/vzorky rozmístěny (prostory 1-4), na několik málo dimenzí ekologického prostoru (protor č.5) ) pokud by chování druhů bylo na sobě úplně nezávislé, existovala by celá řada ekvivalentních možností, jak mnohorozměrný prostor zredukovat, a ani jedna by nepřinesla nic nového 119 Zpracová ní dat v eko ologii společ čenstev

O ORDINACE RŮZNÉ FORMULACE PROBLÉMU 1) hledání skrytých proměnných (ordinačních os) najdi několik proměnných (ordinačních os), které nejlépe vystihují vliv všech druhů eigenvalue based methods 2) rozmístění vzorků vordinačním prostoru najdi takové rozmístění vzorků v redukovaném ordinačním prostoru, aby vzdálenost mezi vzorky co nejvěrněji odrážela jejich nepodobnost vypočtenou z druhového složení jednotlivých vzorků distance based methods Zpracová ní dat v eko ologii společenstev 120 http://ordination.okstate.edu/

NEPŘÍMÁ VS. PŘÍMÁ ORDINACE UNCONSTRAINED VS CONSTRAINED ORD. Nepřímá ordinace vychází pouze z matice vzorky druhy hledá proměnné (ordinační osy), které nejlépe reprezentují variabilitu v druhových datech slouží k popisu mnohorozměrných ě h dat (pattern description) ) a generování hypotéz, ne k testování hypotéz Přímá ordinace vychází ze dvou matic: vzorky druhy a vzorky proměnné prostředí ordinační osy představují směr největší variability v druhových datech, která může být vysvětlena na základě aprioriznámých proměnných prostředí slouží spíše k testování hypotéz o vlivu proměnných prostředí na 121 p yp p ý p druhová data, neslouží k popisu dat Zpracová ní dat v eko ologii společ čenstev

David Zelený Zpracování dat v ekologii společenstev MODELY ODPOVĚĎI DRUHŮ NA GRADIENT PROSTŘEDÍ lineární unimodální 122 abundance 1. 0 1.5 2.0 abundan nce 0.0 0.2 0.4 0.6 0.8 gradient gradient

ZÁKLADNÍ TYPY ORDINAČNÍCH TECHNIK (ZALOŽENÝCH NA VÝPOČTU EIGENVALUES) nepřímá ordinace (unconstrained) lineární odpověď druhů PCA (Principal Component Analysis, analýza hlavních komponent) unimodální odpověď druhů CA (Correspondence Analysis, korespondenční analýza) DCA (Detrended Correspondence analysis, detrendovaná korespondenční analýza) přímá ordinace RDA CCA (constrained) (Redundancy Analysis, (Canonical Correspondence redundanční analýza) Analysis, kanonická korespondenční analýza) Zpracová ní dat v eko ologii společ čenstev 123

NEPŘÍMÁ ORDINACE PRINCIP hledání skryté proměnné (gradientu), který nejlépe reprezentuje chování všech druhů podél tohoto gradientu první ordinační osa (ordination axis) a skóre vzorků na této ordinační ose (sample scores) odhad optima (odpovědi) jednotlivých druhů na této ose (species scores) druhá a vyšší ordinační osy musejí být lineárně nezávislé na všech nižších ordinačních osách Zpracová ní dat v eko ologii společenstev 124

NEPŘÍMÁ ORDINACE PRINCIP (PCA) sp1 sp2 samp1 2 1 samp4 samp2 3 4 samp3 5 0 samp4 7 6 samp5 9 2 sp2 samp2 samp1 samp3 sp1 samp5 Zpracová ní dat v eko ologii společ čenstev 125 Legendre & Legendre (1998)

NEPŘÍMÁ ORDINACE ALGORITMUS (CA) 5 výpočetních kroků 1. začni s arbitrárním (náhodným) skóre vzorků (x i ) 2. vypočti nové skóre pro jednotlivé druhy (species score, y i ) jako průměr skóre vzorků x i vážený abundancí druhu ve vzorcích 3. vypočti nové skóre pro jednotlivé vzorky (sample score, x i ) jako průměr skóre druhů y i vážený abundancí druhů ve vzorku 4. standardizuj skóre jednotlivých vzorků (natáhni osu) 5. pokud se skóre nemění, zastav, pokud ano, pokračuj krokem 2 Zpracová ní dat v eko ologii společ čenstev 126

David Zelený Zpracování dat v ekologii společenstev NEPŘÍMÁ ORDINACE O C CA UNIMODÁLNÍ METODA Lepš & Šmilauer (2003) Multivariate analysis of... 127

David Zelený Zpracování dat v ekologii společenstev NEPŘÍMÁ ORDINACE O C CA UNIMODÁLNÍ METODA Lepš & Šmilauer (2003) Multivariate analysis of... 128

David Zelený Zpracování dat v ekologii společenstev NEPŘÍMÁ ORDINACE O C CA UNIMODÁLNÍ METODA Lepš & Šmilauer (2003) Multivariate analysis of... 129

David Zelený Zpracování dat v ekologii společenstev NEPŘÍMÁ ORDINACE O C CA UNIMODÁLNÍ METODA Lepš & Šmilauer (2003) Multivariate analysis of... 130

David Zelený Zpracování dat v ekologii společenstev NEPŘÍMÁ ORDINACE O C CA UNIMODÁLNÍ METODA Lepš & Šmilauer (2003) Multivariate analysis of... 131

David Zelený Zpracování dat v ekologii společenstev Lepš & Šmilauer (2003) Multivariate analysis of... ORDINAČNÍ DIAGRAM lineární metoda unimodální metoda nepřímá ordinace přímá ordinace 132

ORDINAČNÍO Č DIAGRAMY KONVENCE zobrazení vzorků -> body zobrazení druhů -> šipky (lineární metody) -> body, centroidy (unimodální metody) zobrazení ordinačních os vodorovná bývá osa vyššího řádu (např. první) orientace os je arbitrární zobrazení proměnných prostředí šipky (kvantitativní proměnné) centroidy (kategoriální proměnné) typ ordinačního diagramu: scatterplot - 1 typ dat (vzorky nebo druhy) biplot - 2 typy dat (např. vzorky a druhy) triplot - 3 typy dat (např. vzorky, druhy a proměnné prostředí) 133 Le epš & Šmilauer (200 03) Multiva ariate analysis of... Zpracová ní dat v eko ologii společ čenstev

ARTEFAKTY V ORDINACÍCH Podkova (Horseshoeh effect ) Oblouk (Arch h effect ) PCA CA pořadí vzorků podél první osy pořadí vzorků podél první osy neodráží jejich skutečnou stále odráží jejich nepodobnost nepodobnost druhá osa je nelineární kombinací v extrémním případě se mohou první osy okraje přiblížit nebo dokonce překřížit http://ord ination.okst tate.edu 134 David Zelený Zpracová ní dat v eko ologii společ čenstev

A ARTEFAKTY V ORDINACÍCH Podkova a oblouk (Horseshoe and arch effect) důsledek algoritmu - každá následující osa musí být lineárně nezávislá na předchozích osách, ale neuvažuje se nelineární závislost důsledek d projekce - nelineární vztahy mezi druhy a gradienty prostředí se promítají do lineárního prostoru definovaného Euklidovskými vzdálenostmi http:/ //ordination.o okstate.edu Zpracová ní dat v eko ologii společ čenstev 135

S SIMULOVANÁ DATA POUZE JEDEN EKOLOGICKÝ GRADIENT simulovaný gradient dlouhý 5000 jednotek 300 druhů s unimodální odpovědí, různými šířkami nik 500 vzorků náhodně rozmístěných podél gradientu Zpracová ní dat v ekologii společenstev 136

SIMULOVANÁ DATA S U O ARTEFAKTY David Zelený PCA - podkova CA - oblouk Zpracování dat v eko 0.5 1 ologii společ 0.0 PC2-1 0 CA2 čenstev -0.5-2 - 137-0.5 0.0 0.5 PC1-2 -1 0 1 2 CA1 o vzorky druhy

ARTEFAKTY V ORDINACÍCH C MOŽNOSTI ŘEŠENÍ odstranění trendu z ordinačních os (detrending) detrendovaná korespondenční analýza, Detrended Correspondence Analysis (DCA, Hill & Gauch 1980) detrending by segments (nejčastější) detrending by polynomials (pokud v analýze používám kovariáty) použití takových ordinačních technik, které umožňují ordinaci vzorků v prostoru pomocí jiných metrik než je Euklidovská distance (PCA) nebo chi-kvadrát distance (CA) analýza hlavních koordinát, Principal Coordinate Analysis (PCoA) nemetrické mnohorozměrné škálování, Non-metric Multidimensional Scaling (NMDS) Zpracová ní dat v eko ologii společ čenstev 138

DETRENDED CORRESPONDENCE O C ANALYSIS SS PROCES ODSTRANĚNÍ TRENDU Krok 1 rozdělení první osy na několik segmentů Krok 2 vycentrování druhé osy každého segmentu kolem nuly http: //ordination.okstate.edu Zpracová ní dat v eko ologii společ čenstev 139

DETRENDED CORRESPONDENCE O C ANALYSIS SS PROCES ODSTRANĚNÍ TRENDU Krok 3 nelineární přeškálování první osy, které odstraňuje nahloučení vzorků na koncích gradientů -> výsledný ordinační diagram má osy naškálované v jednotkách směrodatné odchylky (SD) -> platí, že druhové složení se změní o polovinu na gradientu o délce 1-1,4SD (half-change in species composition) ter Braak (198 87) Zpracová ní dat v eko ologii společenstev 140 http://ordination.okstate.edu

DETRENDED CORRESPONDENCE O C ANALYSIS SS VÝHODY A NEVÝHODY neelegantní metoda, která je někdy přirovnávána k použití kladiva na data (hlavně část týkající se rozdělení osy na segmenty a jejich centrování) výsledek je silně ovlivněn arbitrárním rozhodnutím o počtu segmentů (doporučuje se vyzkoušet více možností) pokud jsou v datech dva nebo více hlavních gradientů (ordinačních os), DCA si s nimi neporadí (detrending do určité míry poškodí druhou a vyšší ordinační osy) i kladivo, pokud je v rukou odborníka, může být použito efektivně - metoda často dává ekologicky dobře interpretovatelné t t výsledky osy DCA jsou v jednotkách SD, které umožňují zjistit, jak dlouhý gradient naše data pokrývají 141 Zpracová ní dat v eko ologii společ čenstev

SIMULOVANÁ DATA (JEDEN EKOLOGICKÝ GRADIENT) DCA DCA2 2 0-2 o vzorky druhy Zpracová ní dat v eko ologii společ čenstev -4-4 -2 0 2 4 DCA1 142

VÝBĚR ORDINAČNÍ METODY NA ZÁKLADĚ DCA LINEÁRNÍ NEBO UNIMODÁLNÍ? lineární metody vyžadují homogenní data, unimodální jsou vhodná i pro data heterogenní kuchařka alá Lepš & Šmilauer (2003) - zjištění délky gradientu (heterogenity dat) pomocí metody DCA, detrending by segments pokud je délka 1. osy DCA menší než 3 SD použiji lineární techniku větší než 4 SD použiji unimodální techniku v rozmezí 3-4 SD obě techniky pracují rozumně Zpracová ní dat v eko ologii společ čenstev alternativní doporučení (Jari Oksanen) pokud se nemůžu rozhodnout mezi lineární a unimodální metodou, použiji unimodální ta se chová rozumně i na lineárních datech 143

PCOA (PRINCIPAL( C COORDINATE ANALYSIS) SS) ORDINACE ZALOŽENÁ NA DISTANCÍCH syn. MDS Metric Dimensional Scaling alternativní metoda nepřímé ordinace vstupní data matice nepodobností mezi vzorky výpočet matice nepodobností jakýkoliv index nepodobnosti pokud zvolím Euklidovskou vzdálenost -> identické s PCA pokud zvolím Chi-kvadrát vzdálenost -> obdoba CA v CANOCO se počítá programem PrCoord Zpracová ní dat v eko ologii společ čenstev 144

NMDS (NON-METRIC MULTIDIMENSIONAL SCALING) ORDINACE ZALOŽENÁ NA DISTANCÍCH další alternativa nepřímých ordinací, nemetrická varianta PCoA vstupní data matice nepodobností mezi vzorky výpočet matice nepodobností jakýkoliv index nepodobnosti výsledek je značně č ě ovlivněn ě výběrem indexu nepodobnosti iterativní algoritmus, který nemusí pokaždé dojít ke stejnému výsledku (lokální optima) na začátku je nutno určit počet dimenzí, se kterými bude metoda pracovat (obvykle k = 2 nebo 3) při větším množství dat VELMI časově náročná Zpracová ní dat v eko ologii společ čenstev v CANOCO se počítá programem WinKyst, který je ke stažení 145 zde: http://www.canodraw.com/winkyst.htm

NMDS NON-METRIC MULTIDIMENSIONAL SCALING David Zelený Zpracování dat v ekologii společenstev náhodné rozmístění vzorků v prostoru rozmístění vzorků v prostoru respektuje jejich nepodobnost 146

David Zelený Zpracování dat v ekologii společenstev NMDS NON-METRIC MULTIDIMENSIONAL SCALING stress = 7.47 Non-metric fit, R2 = 0.955 Linear fit, R2 = 0.77 Ordination Distance 0.0 0.2 0.4 0.6 0.8 1.0 03 0.3 04 0.4 05 0.5 06 0.6 07 0.7 08 0.8 09 0.9 10 1.0 Observed Dissimilarity 147

David Zelený Zpracování dat v ekologii společenstev 148 P POROVNÁNÍ METOD DCA A NMDS DCA NMDS DCA2-2 -5-1 0 NMDS2 0 5 1 2 10-2 -1 0 1 2-5 0 5 10 DCA1 NMDS1 data z údolí Vltavy, klasifikace metodou TWINSPAN (Zelený & Chytrý 2007)

POROVNÁNÍ METOD DCA A NMDS DCA NMDS David Zelený Zpracování dat v ekologii společenstev při větším počtu vzorků tvoří trojúhelník nebo pěticípou hvězdu (artefakt) má tendenci jakákoliv data zobrazit jako kouli 149

POROVNÁNÍ METOD DCA A NMDS O O O C S SIMULOVANÁ DATA (JEDEN GRADIENT) David Zelený DCA NMDS Zpracová 0 ní dat v eko 0.5 1. 2 ologii společ -0.5 0.0 NMDS2 0 DCA2 čenstev -1.0 - -4-2 150-1.5-1.0-0.5 0.0 0.5 1.0-1.5 NMDS1-4 -2 0 2 4 DCA1 k o vzorky druhy

David Zelený Zpracování dat v ekologii společenstev SIMULOVANÁ S DATA DVA RŮZNĚ DLOUHÉ GRADIENTY 151 Gradient 1 Gradient 2

David Zelený Zpracování dat v ekologii společenstev SIMULOVANÁ S DATA DVA RŮZNĚ DLOUHÉ GRADIENTY 152 gradient2 gradient1 gradient1 gradient2 DCA2-2.0-1.0 0.0 1.0 NMDS2-0.4-0.2 0.0 0.2-3 -2-1 0 1 2 3-0.6-0.4-0.2 0.0 0.2 0.4 0.6 DCA1 NMDS1 gradient1 gradient2 PC2-0.5 0.00 0.5 1.0 CA2-2 -1 0 1 gradient1 gradient2-1 1.5-1 1.0-0 0.5 00 0.0 05 0.5 10 1.0 15 1.5-3 -2-1 0 1 2 3 PC1 CA1

S SIMULOVANÁ DATA DCA2 1.0-2 0 2 4 DVA STEJNĚ DLOUHÉ GRADIENTY gradient1 gradient2-6 -4-2 0 2 4 6 DCA1 NMDS2-0.2 0.0 0.2 0.4 PC2 0.0 0.5 CA2 0 1 2 gradient1 gradient2-0.6-0.4-0.2 0.0 0.2 0.4 0.6 NMDS1 Zpracová ní dat v eko ologii společ čenstev -0.5 gradient1 gradient2-1.5-1.0-0.5 00 0.0 05 0.5 10 1.0 15 1.5-2 -1 gradient2 gradient1-4 -2 0 2 4 153 PC1 CA1

David Zelený Zpracování dat v ekologii společenstev 154 SIMULOVANÁ S DATA DVA RŮZNĚ DLOUHÉ GRADIENTY krátké gradienty dlouhé gradienty

POROVNÁNÍ O METOD ZALOŽENÝCH NA VÝPOČTU EIGENVALUES A DISTANCÍ Eigenvalue-based ordination methods DCA, PCA a CA a jejich omezené (constrained) varianty DCCA, RDA a CCA vstupní data = matice vzorky x druhy, ze kterých se extrahují hlavní ordinační osy (eigenvectors) interpretace zaměřena na směry variability v datech, vysvětlené jednotlivými ordinačními osami Distance-based ordination methods NMDS a PCoA Zpracová ní dat v eko ologii společ čenstev vstupní data = matice nepodobností interpretace zaměřena se na vzdálenosti mezi vzorky v 155 redukovaném ordinačním prostoru

POUŽITÍ PROMĚNNÝCH PROSTŘEDÍ V ORDINACI DVA ALTERNATIVNÍ POSTUPY 1. nepřímá ordinace korelace získám skóre vzorků na hlavních ordinačních osách skóre vzorků koreluji s jednotlivými proměnnými prostředí určitě zachytím hlavní gradienty v druhovém složení nemusím zachytit tu část t variability v druhovém složení, která je vztažená k jednotlivým proměnným prostředí 2. přímá ordinace proměnné prostředí vstupují přímo jako vysvětlující proměnné do ordinace skóre vzorků na osách je ovlivněno vztahem k těmto proměnným prostředí určitě zachytím variabilitu v datech, která se vztahuje k jednotlivým proměnným prostředím nemusím zachytit část variability v druhových datech, která není 156 vysvětlena žádnou proměnnou prostředí Zpracová ní dat v eko ologii společ čenstev

POUŽITÍ PROMĚNNÝCH PROSTŘEDÍ V ORDINACI DVA ALTERNATIVNÍ POSTUPY Y samples species matrix X samples environmental factors matrix oba přístupy jsou relevantní a navzájem se doplňují! Zpracová ní dat v ekologii společ čenstev 157 Legendre & Legendre (1998)

ordinační osy s omezením David Zelený spe 3 spe 2 spe 1 sam 1 sam 2 sam 3 Zpracování dat v ekologii společenstev P sam 4 PŘÍMÁ ORDINAČNÍ ANALÝZA sam 5 sam 6 100 původní druhová matice sam 7 3 spe 1 2 spe 2 spe 3 1 (predicted) 60 80 1 spe spe spe sam 1 sam 2 sam 1 sam 3 sam 4 sam 5 regrese abundance druhu na proměnné ě prostředí predikované hodnoty 100 species 0 20 40 sam 2 sam 3 sam 4 0 5 10 15 20 25 30 gradient species 1 40 60 80 sam 5 sam 6 sam 7 0 20 40 0 5 10 15 20 25 30 gradient sam 6 sam 7 residuály species 1 (residual) 0 20 gradient sam 1 sam 2 sam 3-20 sam 4 0 5 10 15 20 25 30 6 gradient ordinační osy bez omezení sam 5 sam 6 sam 7

PŘÍMÁ ORDINAČNÍ Č ANALÝZA MONTE-CARLO PERMUTAČNÍ TEST testuje nulovou hypotézu, že druhové složení je nezávislé na vysvětlující proměnné test t první kanonické ké osy vliv jen jedné kvantitativní proměnnéě test všech kanonických os vliv všech proměnných, nebo vliv jedné nominální proměnné s více kategoriemi (počet os = počet kategorií 1) n x počet permutací s n x Zpracová ní dat v ekologii společenstev F perm >= F data N celkový počet permutací 159

David Zelený Zpracování dat v ekologii společenstev PŘÍMÁ ORDINAČNÍ Č ANALÝZA MONTE-CARLO PERMUTAČNÍ TEST 160 Herben & Münzbergová 2001

PŘÍMÁ ORDINAČNÍ Č ANALÝZA MONTE-CARLO PERMUTAČNÍ TEST Zpracování dat v ekologii společenstev randomizace ploch bez omezení (unrestricted randomization) randomizace ploch v blocích (randomization within blocks defined by covariables) Herben & Münzbergová 2001 161

J JAK ČÍST VÝSLEDKY ORDINAČNÍCH METOD?? procento variability vysvětlené hlavními osami CANOCO: cummulative percentage variance of species data vypočte se také jako eigenvalue / total variance ukazuje, jak úspěšný byl celý proces ordinace čím více jsou jednotlivé druhy korelované, tím více variability bude vysvětleno několika málo hlavními osami má smysl srovnávat vysvětlenou variabilitu hlavních os různými ordinačními technikami na stejných datech nemá smysl srovnávat vysvětlenou variabilitu hlavních os stejnými ordinačními technikami na různých datech (eigenvalues jsou závislé na počtu hráčů ve hře druhů, vzorků) skóry (souřadnice) závisle proměnných (druhů) na osách u lineárních technik skóre = regresní koeficient, vordinačních diagramech zobrazeny jako šipky u unimodálních technik skóre = optimum druhu, v ordinačních diagramech zobrazeny jako body 162 Zpracová ní dat v eko ologii společ čenstev

J JAK ČÍST VÝSLEDKY ORDINAČNÍCH METOD?? skóry vzorků (snímků) na osách v ordinačních diagramech vzorky zobrazeny jako body (lineární i unimodální techniky) vzdálenost mezi body v ordinačním prostoru odpovídá nepodobnosti mezi vzorky (ne ale nepodobnosti celého floristického složení, ale jenom té části, která je vyjádřena zobrazenými ordinačními osami) skóry nezávislých (vysvětlujících proměnných) * regresní koeficienty, důležitá jsou jejich znaménka test signifikance (Monte-Carlo permutační test) * ukazuje na statistickou významnost použitých vysvětlujících proměnných Zpracová ní dat v eko ologii společ čenstev 163 * jen přímé ordinační techniky

JEDNOTLIVÉJ PROMĚNNÉ TERMINOLOGIE vysvětlované / závislé proměnné CANOCO: druhy (species) vysvětlující / nezávislé proměnné, prediktory * CANOCO: proměnné prostředí (environmental variables) ) měřené nebo odhadované proměnné vzorky, objekty, případy p (cases) CANOCO: snímky (samples) kovariáty, nezajímavé vysvětlující / nezávislé proměnné * CANOCO: kovariáty (covariables) proměnné, jejichž vliv nás nezajímá a chceme ho z analýzy odstranit Zpracová ní dat v eko ologii společ čenstev * jen přímé ordinační techniky 164

PARCIÁLNÍ ORDINACE PARTIAL ORDINATION odstraňuje část variability vysvětlené proměnnými, které jsou pro nás nezajímavé (například vliv umístění ploch do bloků) následně se přímou nebo nepřímou ordinací analyzuje zbytková variabilita nezajímavé proměnné se definují jako kovariáty pokud následuje přímá ordinace ordinační osy představují čistý vliv ostatních vysvětlujících proměnných bez vlivu kovariát pokud následuje nepřímá ordinace ordinační osy zachycují zbytkovou variabilitu v druhových datech po odstranění vlivu kovariát Zpracová ní dat v eko ologii společ čenstev 165

ROZKLAD VARIANCE VARIANCE PARTITIONING zbytková variabilita variabilita vysvětlená proměnnou 1 variabilita vysvětlená proměnnou 2 vysvětlená variabilita sdílená proměnnou 1 a proměnnou 2 Bo orcard et al. 1992, E cology 73 : 1045 10 055 166 Zpracová ní dat v eko ologii společ čenstev

ROZKLAD VARIANCE Postup výpočtu: vysvětlující proměnná VARIANCE PARTITIONING kovariáta vysvětlená variabilita 1 a 2 není A BC 1 2 A 2 1 B 1 není A C sdílená variabilita C = (A C) A nevysvětlená variabilita D = Total inertia (A B C) D A C B proměnná 1 proměnná 2 Zpracová ní dat v eko ologii společ čenstev 167 Borcard et al. 1992, Ecology 73: 1045 1055

ROZKLAD VARIANCE ALE: VARIANCE PARTITIONING ordinační metody jsou založené na modelu (lineární nebo unimodální) odpovědi druhu na gradient prostředí, který je velkým zjednodušením skutečnosti variance nevysvětlená modelem (složka D) ve skutečnosti obsahuje variabilitu, která by mohla být vysvětlena některou z proměnných, pokud by se data chovala podle teoretického modelu varianci nevysvětlenou modelem tedy nelze interpretovat jako zbytkovou variabilitu, která je dána jednak šumem v datech, jednak faktem, že ne všechny proměnné prostředí byly měřeny Total inertia proto není měřítkem celkové variability v druhových datech, ale variability, kterou je možné zachytit pomocí zvoleného modelu (lineárního nebo unimodálního) variabilita vysvětlená danou proměnnou prostředí a vypočtená jako eigenvalue / total inertia je proto podhodnocená doporučení: nepočítejte procento variability, kterou proměnná vysvětlí, jako poměr eigenvalue / total inertia; místo toho se zaměřte na relativní množství variability, kterou daná proměnná vysvětlí z celkové variability vysvětlené všemi proměnnými ě prostředí Øk kland (199 9) J. Veg. Sci. 10: 13 31-136 168 Zpracová ní dat v eko ologii společ čenstev

POSTUPNÝ VÝBĚR VYSVĚTLUJÍCÍCH PROMĚNNÝCH FORWARD SELECTION ze souboru vysvětlujících proměnných umožňuje vybrat jen ty, které mají průkazný vliv v každém kroku testuje zvlášť vliv jednotlivých proměnných (Monte-Carlo permutační test) vybere tu proměnnou, která vysvětlí nejvíce variability a zároveň je signifikantní; tuto proměnnou pak do modelu zahrne jako kovariátu v dalším kroku znovu testuje vliv jednotlivých proměnných na druhová data (s odstraněním vlivu kovariát) a opakuje předchozí kroky testy signifikance jsou zatíženy mnohonásobným porovnáním, a jsou proto poměrně ě ě liberální (počet č signifikantních ifik proměnných je často nerealisticky vysoký a vyžaduje např. Bonferroniho korekci) 169 Zpracová ní dat v eko ologii společ čenstev

P PROČ ORDINACE?? není možné zobrazit zároveň víc jak 3 dimenze přitom ekologická data mají často dimenzí stovky redukovaný ordinační prostor reprezentuje hlavní a interpretovatelné ekologické gradienty a redukuje šum (ordination = noise reduction technique) přímá ordinační metoda v případě statistického testování netrpí problémem mnohonásobného porovnání umožňuje určit relativní význam jednotlivých gradientů některé techniky (DCA) vyjadřují míru betadiversity v datech Zpracová ní dat v eko ologii společ čenstev grafický výstup (ordinační diagram) často nabízí přehledný a snadno interpretovatelný náhled do vztahů mezi druhy (případně vzorky) a proměnnými prostředí 170 http://ordination.okstate.edu