Gradient. Gradient změna některého faktoru prostředí

Podobné dokumenty
PCA BIPLOT ŠKÁLOVÁNÍ OS (1)

David Zelený GRADIENTOVÁ ANALÝZA

ELLENBERGOVY INDIKAČNÍ HODNOTY. David Zelený Zpracování dat v ekologii společenstev

PŘÍKLADY POUŽITÍ ORDINAČNÍCH METOD

ELLENBERGOVY INDIKAČNÍ HODNOTY. David Zelený Zpracování dat v ekologii společenstev

Vícerozměrné statistické metody

Úvodem Dříve les než stromy 3 Operace s maticemi

Ordinační analýzy v programu JUICE

SPECIES ATTRIBUTES IN ANALYSIS OF COMMUNITY ECOLOGY DATA

EKOLOGICKÁ PODOBNOST (ECOLOGICAL RESEMBLANCE) David Zelený Zpracování dat v ekologii společenstev

Statistická analýza jednorozměrných dat

STATISTICKÉ METODY; ZÍSKÁVÁNÍ INFORMACÍ Z DRUHOVÝCH A ENVIRONMENTÁLNÍCH DAT

REGRESE VS KALIBRACE. David Zelený Zpracování dat v ekologii společenstev

ZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

Univerzita Pardubice 8. licenční studium chemometrie

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy

ZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan

Hluboká říční údolí jako objekt pro modelování vztahů vegetace a proměnných prostředí?

Zpracování geobotanických dat v. Sestavili Tomáš Herben a Zuzana Münzbergová

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

6. Lineární regresní modely

INDUKTIVNÍ STATISTIKA

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Inovace bakalářského studijního oboru Aplikovaná chemie

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

ZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV

UNIVERZITA PARDUBICE. 4.4 Aproximace křivek a vyhlazování křivek

Regresní a korelační analýza

Cronbachův koeficient α nová adaptovaná metoda uvedení vlastností položkové analýzy deskriptivní induktivní parametrické

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

AVDAT Mnohorozměrné metody, metody klasifikace

AVDAT Mnohorozměrné metody metody redukce dimenze

NUMERICKÁ KLASIFIKACE. David Zelený Zpracování dat v ekologii společenstev

2019/03/31 17:38 1/2 Klasifikační a regresní stromy

Fakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody

Vícerozměrné statistické metody

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

SEMESTRÁLNÍ PRÁCE 3.5 Klasifikace analýzou vícerozměrných dat

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Porovnání dvou výběrů

Prostorová variabilita

Regresní a korelační analýza

INDEXY DIVERZITY. David Zelený Zpracování dat v ekologii společenstev

Regrese. používáme tehdy, jestliže je vysvětlující proměnná kontinuální pokud je kategoriální, jde o ANOVA

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

UNIVERZITA PARDUBICE. Semestrální práce z 5. soustředění

Klasická a robustní ortogonální regrese mezi složkami kompozice

AVDAT Geometrie metody nejmenších čtverců

Analýza dat na PC I.

Pravděpodobnost a aplikovaná statistika

Korelace. Komentované řešení pomocí MS Excel

LINEÁRNÍ REGRESE. Lineární regresní model

Jednofaktorová analýza rozptylu

Měření závislosti statistických dat

Normální (Gaussovo) rozdělení

KGG/STG Statistika pro geografy

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

Pokročilé neparametrické metody. Klára Kubošová

Testování hypotéz o parametrech regresního modelu

Přednáška 13 Redukce dimenzionality

INDEXY DIVERZITY. David Zelený Zpracování dat v ekologii společenstev

Lineární regrese. Komentované řešení pomocí MS Excel

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

Tomáš Karel LS 2012/2013

Vícerozměrné metody. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Schematický úvod

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

LINEÁRNÍ MODELY. Zdeňka Veselá

5EN306 Aplikované kvantitativní metody I

Příklad 2: Určení cihlářských surovin na základě chemické silikátové analýzy

Testování hypotéz o parametrech regresního modelu

Metoda backward výběru proměnných v lineární regresi a její vlastnosti

Pokročilé neparametrické metody. Klára Kubošová

Statistická analýza jednorozměrných dat

Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )

Popisná statistika. Komentované řešení pomocí MS Excel

Vícerozměrné statistické metody

KORELACE. Komentované řešení pomocí programu Statistica

TERMINOLOGIE ... NAMĚŘENÁ DATA. Radek Mareček PŘEDZPRACOVÁNÍ DAT. funkční skeny

Vícerozměrná rozdělení

Eva Fišerová a Karel Hron. Katedra matematické analýzy a aplikací matematiky Přírodovědecká fakulta Univerzity Palackého v Olomouci.

Aplikovaná statistika v R - cvičení 3

AVDAT Klasický lineární model, metoda nejmenších

Normální (Gaussovo) rozdělení

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

dat Robust ledna 2018

Pokud data zadáme přes "Commands" okno: SDF1$X1<-c(1:15) //vytvoření řady čísel od 1 do 15 SDF1$Y1<-c(1.5,3,4.5,5,6,8,9,11,13,14,15,16,18.

SPOLEHLIVOST KONSTRUKCÍ & TEORIE SPOLEHLIVOSTI část 5: Aproximační techniky

PRAVDĚPODOBNOST A STATISTIKA

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

Popisná statistika kvantitativní veličiny

Testování hypotéz a měření asociace mezi proměnnými

Úvod do problematiky měření

Transkript:

Gradientová analýza

Gradient Gradient změna některého faktoru prostředí Historické zdroje Teorie vegetačního kontinua (Gleason 1917, Ramenskij 1924) Wisconsinská škola (50. léta): Curtis, McIntosh, Bray R. H. Whittaker (1956, 1960)

Tři hlavní problémy s daty o společenstvech zero truncation problem dáno výběrem měřítka významu (performance) druhu = abundance pokud druh chybí (tj. abundance = 0), chybí i informace o tom jak moc nevhodné je prostředí pro druh odpovědní křivky druhů jsou většinou komplikované a vztahy mezi druhy jsou většinou nelineární odpovědní křivky druhů nejsou většinou ideální, ale zrnité druhy jsou většinou méně abundantní než je jejich potenciál v daném bodu gradientu prostředí důvodem je vliv dalších proměnných prostředí, interakcí mezi druhy, náhody a limitů šíření taxonů

Ideální vs. reálné? Lineární a unimodání model hodně idealistické vhodné pro velmi krátké gradienty chování druhu je popsatelné optimem (průměr), standard. odchylkou a výškou vrcholu vztah 2 druhů s unimod. Gausovým modelem odpovědi je nelineární a komplikovaný ( )

Parametry Gaussovy křivky t - tolerance rozdíl mezi optimem a polohou inflexního bodu Gaussovy křivky c maximální mohutnost populace u druhové optimum (x-ová souřadnice vrcholu křivky hodnoty faktoru prostředí (gradient)

Odpovědní křivky druhů A a B k faktoru prostředí X a očekávané abundance druhů Lineární model Unimodální model (Jongman et al. 1995, p. 94)

Přímá a nepřímá gradientová analýza Přímá gradientová analýza analyzuje změny druhového složení podle známého a předem stanoveného jednoho nebo několika gradientů prostředí (ekoklina) např. nadmořská výška rybník litorál rákosiny louky ph půdy Nepřímá gradientová analýza analyzuje variabilitu druhového složení společenstva nezávisle na prostředí hledá směr největší variability druhového složení (cenoklina) komplexní gradient prostředí

Gradienty prostředí Přímé bezprostředně ovlivňují růst rostlin světlo teplota voda živiny Nepřímé (zástupné) snadno se měří a korelují s přímými faktory nadmořská výška geologické podloží typ půdy sklon a orientace svahu aj.

Přehled ordinace

Metody gradientové analýzy Regrese regression (přímá GA) Kalibrace calibration (nepřímá GA) Ordinace (indirect) ordination (nepřímá GA) Ordinace s omezením constrained (direct) ordination (přímá GA)

Přímá a nepřímá gradientová analýza: přehled

Regrese lineární model y ki = a k + b k x i + e ki y ki... odpověď k-tého druhu na i-té lokalitě a k... posun přímky (intercept) b k... sklon přímky (slope) e ki... chyba unimodální model proložení Gaussovské křivky pomocí GLIM (= generalized linear modeling) vážené průměrování (weighted averaging) u k = Σ i ( y ki x i / y k. )

Regrese mnohonásobná regrese (multiple regression) regrese jedné závisle proměnné na několika nezávisle proměnných logistická regrese (logistic regression) regrese s kategoriální závisle proměnnou; odhaduje se pravděpodobnost, že při dané hodnotě odhaduje se pravděpodobnost, že při dané hodnotě nezávisle proměnné dosáhne závisle proměnná hodnoty 1

obrácená regrese Kalibrace známe: druhové složení na lokalitě i vztah mezi druhy a faktory prostředí odhadujeme: faktory prostředí na lokalitě i

Kalibrace: lineární model Druh 1 Druh 2 Druh 3 Faktor prostředí Σ k y ki b k x i = Σ k b k 2

Kalibrace: unimodální model Σ k y ki u k x i = Σ k y ki pracuje s druhovými optimy (= indikační hodnoty) zpravidla zanedbává rozdílné tolerance druhů využívá tabelovaných hodnot optim druhů Ellenberg 1974, 1979, Ellenberg et al. 1992 (střední Evropa) světlo (1 9) vlhkost (1 12) halofilnost (0-2) teplota (1 9) reakce (1 9) kontinentalita (1 9) živiny (1-9) Zólyomi et al. 1966, Borhidi, Soó, Simon (Maďarsko) Landolt 1977 (Švýcarsko) Jurko 1990 (Slovensko)

Ellenbergovy tabulky ukázka tabulek + výpočtu (Lepš et Šmilauer, 2003, p. 33) (Ellenberg et al. 1992, p. 100)

Ellenbergovy indikační hodnoty: srovnání smrkových lesů tří pohoří Reakce Vlhkost 9 7 8 7 Ellenberg reaction value 6 5 4 3 Ellenberg moisture value 6 5 2 1 4 Alps Carpathians Bohemian Massif Alps Carpathians Bohemian Massif

Ellenbergovy indikační hodnoty: projekce do síťových map rozšíření (Chytrý et al. 1999, Preslia 71: 1 19)

Ellenbergovy indikační hodnoty: změny druhového složení v čase (Chytrý & Danihelka 1993, Folia Geobot. Phytotax. 28: 225 245)

Kritika Ellenbergovy metody ordinální stupnice neumožňuje provádět základní aritmetické výpočty hodnoty jsou tabelovány pro Německo, zatímco v jiných oblastech se druhy mohou chovat jinak druhy často nejsou taxonomicky a ekologicky homogenní a různé ekotypy mohou mít různá optima průměry jsou zatíženy chybou vyplývající z interakce mezi faktory prostředí Faktor DUSÍK má charakter DOSTUPNOSTI ŽIVIN (tj. spíše fosforu) další čtení: Mucina (1985; Biologia), Jurko (1986; Biologia), Klimeš (1987; Preslia)

Ordinace: 2 různé způsoby přístupu 1. nalezni konfiguraci snímků v ordinačním prostoru tak, aby vzdálenost mezi vzorky v prostoru korespondovala nejlépe s nepodobností jejich druhového složení... multidimenzionální škálování (multidimensional scaling, MDS) ----- metrické MDS (Analýza hlavních kordinát, PCoA) ----- ne-metrické MDS 2. nalezni latentní proměnné (ordinační osy), které reprezentují nejlepší prediktory pro hodnoty všech druhů - -> vyžaduje specifikaci modelu odpovědi druhu k takové latentní proměnné... lineární a unimodální techniky ordinace

Běžné ordinační techniky (ter Braak and Prentice 1988) Indirect gradient analysis Distance-based approaches Polar ordination, PO (Bray-Curtis ordination) Principal Coordinates Analysis, PCoA (Metric multidimensional scaling) Nonmetric Multidimensional Scaling, NMDS Eigenanalysis-based approaches Linear model Principal Components Analysis, PCA Unimodal model Correspondence Analysis, CA (Reciprocal Averaging) Detrended Correspondence Analysis, DCA Direct gradient analysis Linear model Redundancy Analysis, RDA Unimodal model Canonical Correspondence Analysis, CCA Detrended Canonical Correspondence Analysis, DCCA

Metoda Základní přehled hlavních ordinačních technik Použitá míra nepodobnosti (vzdálenosti, distance) Proměnné PCA Euklideovská vzdálenost Kvantitativní data, lineární vztah (pozor na dvojité nuly) PCoA, MDS jakákoliv Libovolné, i smíšené NMDS jakákoliv Libovolné, i smíšené CA Chi-square vzdálenost (distance) Nezáporné, škálově homogenní kvantitativní nebo binární data (abundance nebo prezence-absence) Faktorová analýza Euklideovská vzdálenost Kvantitativní data, lineární vztah (pozor na dvojité nuly) (Legendre & Legendre 1998, p. 388)

Přehled základních typů ordinace v historickém kontextu

Ordinace lokalizace vzorků v mnohorozměrném prostoru, jehož osami jsou druhy Abundance druhu B

Ordinace Ale také: lokalizace druhů v mnohorozměrném prostoru, jehož osami jsou vzorky Abundance ve vzorku 2

Ordinační metody zjednodušují mnohorozměrný prostor na 1 4 rozměry (princip není v redukci, ale v rotaci pohledu) 1. osa zachycuje směr největší variability v hyperprostoru 2. osa zachycuje další směr největší variability nezachycený 1. osou => nekoreluje s 1. osou (= orthogonalita) další osy zachycují další směry největší variability, nezachycené předchozími osami a nekorelují s předchozími osami variabilita zachycená jednotlivými osami je vyjádřena tzv. charakteristickými čísly (eigenvalues)

Příklad ordinačního diagramu 1.5 21 28 17 11 10 15 14 30 29 9 256 20 12 7 1 34 816 13 ordinační osy -1.0-1.5 1.0

Centroid a inertia Centroid je střed objektu. Např. bod daný souřadnicemi - průměry dimenzí objektu (délka, výška, šířka). Pokud se objekty liší v hustotě, je nutné zahrnout tuto variabilitu do výpočtu polohy centroidu. Inertia je tendence objektu ležícího na daném místě v něm zůstat. Hodnota inertia objektu je přímo závislá na tom, jak je masa objektu rozložena kolem centroidu objektu. (= měřítko variability v mnohorozměrném prostoru)

Iterativní algoritmus ordinace Krok 1: Každému vzorku je přidělena určitá libovolná, ale navzájem nestejná hodnota (stanovištní skore) x i Krok 2: Pro každý druh se vypočítá závislost na hodnotách stanovištních skore x i (lineární regresí druhů na stanovištní skore pro lineární model nebo váženým průměrováním pro unimodální model) Krok 3: Vypočítají se nové hodnoty x i kalibrací s užitím závislostí získaných v předešlém kroku Krok 4: Odstranění zmenšení měřítka Krok 5: Pokud se hodnoty x i během cyklu nezměnily (změna je menší než stanovená mez), cyklus se zastavuje, v opačném případě se vrací na krok 2

Analýza hlavních komponent, PCA Principal Components Analysis Hotelling (1933) Lineární model (iterativní algoritmus využívá lineární regrese) Hlavní uplatnění při analýze kvantitativních dat (faktory prostředí, taxonomická data) nebo relativně homogenních dat o druhovém složení (krátký, ostrý gradient) Dvě nejpoužívanější varianty PCA na kovarianční matici (species-centered PCA) x i = x i Σ x i / n o nelze použít u proměnných měřených v různých jednotkách, málo vhodná u druhových dat s procentickými pokryvnostmi PCA na korelační matici (standardized PCA) x i Σ x i / n x i = s x o dává všem proměnným stejnou váhu

Jak funguje PCA? centroid Centrování + (standardizace) Druhy X1, X2, X3 Standardizované osy S1, S2, S3 Ordinační osy PCA 1, 2, 3 rotace

1.0-0.8 Poa pra Lol per Ordinační diagram PCA: druhy Škálování druhových skóre I Poa tri Ely rep Poa ann Ach mil Pla lan Tri rep Ran acr Rum ace Tri pra Ant odo Jun buf Cir arv Alo gen Em p nig Sal rep Air pra Hyp rad Agr sto Pot pal Jun art Ran fla Ele pal Cal cus -1.0 1.0 Co značí délky vektorů druhů: 1. standardizace skóre děleno standardní odchylkou výsledkem je korelační biplot a délka vektoru je měřítkem fitu (R, mnohonásobný korelační koeficient) příslušného druhu v ordinačním diagramu. 2. bez dělení standardní odchylkou: délka odráží změny v abundanci druhu (dlouhý vektor = velká změna abundance, často dominantní druhy).

Ordinační diagram PCA: druhy Škálování druhových skóre II 1.0 hypnando Příklad: stejný datový soubor hypncupr lophbarb leucglau grimhart cynopoly paralong Vlevo: druhová skóre transformována (děleno standardní odchylkou) Dole vpravo: druhová skore bez transformace -0.2 plagchas plagtsuc schistsp -1.0 0.6-0.5 2.5 hypncupr hypnando cynopoly paralong isotalop grimhart leucglau lophbarb plagchas rhizpunc schistsp plagtsuc -4.0 2.0

Ordinační diagram PCA: snímky 1.0 3 4 13 9 12 2 8 16 1 10 6 7 5 11 28 20 14 15 30-0.8 17 21 29-1.0 1.5

PCA: Biplot a biplot rule Dvě možnosti prezentace: o o o o o o o o o o distance biplot: vzdálenosti mezi objekty jsou aproximací jejich Euklideovských vzdáleností délka vektoru druhu indikuje jeho příspěvek k tomuto prostoru úhly mezi vektory druhů nemají význam vhodné pro reprezentaci vztahů mezi plochami correlation biplot: vzdálenosti mezi objekty nejsou aproximací jejich Euklideovských vzdáleností délka vektoru druhu je aproximací jeho standardní odchylky (variability) úhel mezi vektory druhů reprezentuje jejich korelaci vhodné pro reprezentaci vztahů mezi druhy 1.0 Poa tri Ely rep Poa pra 2 Bel per Lol per Bro hor 1 Tri rep Rum ace 7 5 Ach mil 10Tri pra Vic lat 6 Leo aut Pla lan 11 Ant odo 3 Alo gen 13 4 9 Jun buf 12 Sag pro Cir arv Che alb 8 Pot pal Emp nig 14 Bra rut Air pra Hyp rad Sal rep 18 17 19 Agr sto Jun art 16 Ran fla Ele pal Cal cus 15 20-1.0-1.0 1.0

Kolik os (komponent)? o V případě standardizované PCA je možné interpretovat osy s vlastními čísly > 1 o Pro nestandardizovanou PCA je možné interpretovat osy s vlastními čísly > průměrné vlastní číslo všech os čísly > průměrné vlastní číslo všech os o Empiricky: interpretovatelných je několik první os, většinou 2-4 o pomocné kritérium: Broken stick model (Frontier 1976)

Výhody a nevýhody PCA Lze použít i na ordinální či binární data (ale ne smíšená) + - Není vhodná pro vícestavové kvalitativní znaky PCA je dostatečně robustní Efekt podkovy u binárních (nevyžaduje data s dat mnohorozměrně normálním rozdělením) Počet znaků by měl být menší než počet vzorků (nevýhoda u RAPD či AFLP)

Analýza hlavních koordinát (PCoA) umožňuje pracovat se všemi typy proměnných a s různými mírami nepodobnosti (distancí), i neeukleidovskými může být s nimi problém některé hodnoty vlastních čísel mohou být negativní (řešení: transformace hodnot koef. disimilarity nebo ignorace negat. hodnot) obecnější forma PCA zobrazí pouze Euklideovskou část matice vzdáleností = nejlepší možná Euklideovská aproximace originální matice nepodobností!!! pracujeme pouze s několika prvními osami nevýhoda: nespecifikuje vztah druhů k ordinačním osám volná volba modelu (lineární, unimodální...) + souřadnice objektů na ordinačním grafu nejsou lineárně závislé na hodnotách původních znaků Duchoslav et al., Ann. Bot. 2010

Nemetrické mnohonásobné škálování (NMDS) cílem analýzy není uchování vzdáleností mezi objekty, ale pořadí vzdáleností mezi objekty, v několika málo dimenzích (tj. podobnější objekty jsou si blíže a méně podobné dále v ordinačním prostoru) umožňuje pracovat se všemi typy proměnných a s různými mírami nepodobnosti (distancí), i neeukleidovskými, symetrickými a nesymetrickými vhodná též pro situace, kdy chybějí některé párové hodnoty distancí Stress: míra kvality ordinace, míra shody založená na diferencích mezi fitovanou vzdáleností modelem (d ij ) a predikovanou (d ij ) regresní funkcí mezi empirickou vzdáleností a fitovanou vzdáleností rozsah 0-1, čím nižší, tím lepší, do 0.15 akceptovatelné, dle hodnoty volíme počet os Doporučené čtení: Fasham M. (1977), Ecology 58: 551-561.

NMDS - příklad Matice nepodobností mezi sporty

Korespondenční analýza (CA) I. Correspondence Analysis Unimodální model (iterativní algoritmus využívá váženého průměrování) Hlavní uplatnění při analýze dat o druhovém složení, která obsahují hodně nulových hodnot Vážené průměrování zahrnuje standardizaci jak snímky tak druhy jakékoliv dva vzorky s identickými relativními abundancemi (vz. A: 1,2,3; vz. B: 10,20,30) budou považovány za identické!!! Odstranění zmenšení měřítka: x resc =(x-x min )/(x max -x min )*délka (Lepš et Šmilauer 2003, p. 36)

Korespondenční analýza (CA) II. Eigenvalue měří zároveň míru separace nik mezi druhy podél osy Pokud chci vědět % vysvětlené variability dané osy, musím dělit hodnotu eigenvalue celkovou variabilitou (total inertia) problém: efekt podkovy (arch effect) a zkreslení ekologické vzdálenosti

Detrendovaná korespondenční analýza, DCA, Detrended Correspondence Analysis Odstraňuje z CA arch effect a zkreslené ekologické vzdálenosti (v CA jsou snímky se stejnými rozdíly v druhovém složení umístěny blíže k sobě na koncích než uprostřed ordinační osy) Detrendování (detrending) odstraňuje arch effect po segmentech (by segments) přes mnohočleny (by polynomials) máš-li v DCA analýze kovariáty či faktory prostředí, použij tento typ!!! Přeškálování (rescaling) srovnává ekologické vzdálenosti po přeškálování je průměrná rychlost objevování se a mizení druhů na gradientech přibližně konstantní SD units (jednotky směrodatné odchylky) na vzdálenosti 1 SDU se vymění 1/2 druhů ve snímcích na vzdálenosti 4 SDU se úplně změní druhové složení snímků

Arch efekt v CA

Detrendování po segmentech Hill & Gauch 1980, Vegetatio 42: 47 58

Přeškálování Originální gradient 1. Osa CA 1. Osa DCA

Ordinační diagram DCA: vzorky 1.5 21 28 17 11 10 15 14 30 29 9 256 20 12 7 1 34 816 13-1.0-1.5 1.0

Ordinační diagram DCA: druhy 1.5 Vic lat Hip rha Hyp rad Air pra Sal rep Emp nig Pot pal Ant odo Pla lan Leo aut Ach mil Ran acr Bra rut Tri pra Rum ace Tri rep Bro hor Bel per Lol per Poa pra Poa ann Sag pro Ely rep Poa tri Cal cus Ran fla Jun art Ele pal Jun buf Agr sto Alo gen -1.5 Che alb Cir arv -1.5 1.5

DCA: joint diagram a centroid principe 4-1 Ant odo Pla lan Ach mil 17 Rum ace 5 6 Bel per Lol per 19 7 10 Bro hor 1 11 2 Sag pro Leo aut 18 Poa pra Ely rep Tri rep Poa tri Jun buf 12 Bra rut Sal rep Alo gen 20 14 15 16-1 5 4 3 9 138 Dvě možnosti škálování: 1. distance rule: Ran fla Jun art pro dlouhé strmé 16 Agr sto gradienty (nad 2 Ele pal SD; Hillovo škálování) 2. biplot rule: pro krátké gradienty (do 2 SD)

Příklady použití ordinačních technik

DCA: ordinační diagram s klasifikací + Interpretace os pomocí korelační analýzy I (Hanáková et Duchoslav, Čas. Slez. Mus. 2002, p. 246-247)

DCA: ordinační diagram s klasifikací + Interpretace os pomocí korelační analýzy II Vztah průměrné indikační hodnoty pro dusík a pozicí fyt.snímků na 1. ordinační ose DCA (viz předchozí snímek prezentace) (Hanáková et Duchoslav, Čas. Slez. Mus. 2002, p. 246-247)

Ordinační diagram s klasifikací Chytrý & Sádlo 1997, Ann. Bot. 55: 105 126

Ordinační diagram s klasifikací Chytrý & Sádlo 1997, Ann. Bot. 55: 105 126

Změny vegetace hodnocené ordinací Chytrý & Danihelka 1993, Folia Geobot. Phytotax. 28: 225 245

Změny vegetace hodnocené ordinací Chytrý & Danihelka 1993, Folia Geobot. Phytotax. 28: 225 245

Změny vegetace hodnocené ordinací Chytrý & Danihelka 1993, Folia Geobot. Phytotax. 28: 225 245

Přímá ordinace (ordinace s omezením) Direct (constrained) ordination metoda přímé gradientové analýzy spojení ordinace a lineární regrese nehledá se cenoklina, ale popisuje se změna druhového složení v závislosti na měřených proměnných prostředí není vhodná, když nemáme žádnou představu o vztahu mezi proměnnými prostředí a druhovým složením společenstva: tehdy použijeme spíš nepřímou ordinaci je vhodná pro hodnocení ekologických experimentů nebo pozorování, kdy nás zajímá vztah druhového složení k předem vybraným proměnným

Iterativní algoritmus přímé ordinace Do iterativního algoritmu nepřímé ordinace se přidá: Krok 3a: Výpočet mnohonásobné lineární regrese získaných stanovištních skóre na měřených proměnných prostředí a nahrazení původních stanovištních skóre hodnotami aproximovanými touto regresí

Metody přímé ordinace Analýza redundance (redundancy analysis, RDA) metoda pro lineární model odvozená od PCA Kanonická korespondenční analýza (canonical correspondence analysis, CCA) metoda pro unimodální model odvozená od CA Detrendovaná kanonická korespondenční analýza (detrended canonical correspondence analysis, DCCA) metoda pro unimodální model odvozená od DCA

Jak pracuje CCA nejlepší gradient...

Metody přímé ordinace (RDA) Dune Meadow Data 1.0 15 A1 1.0 Pot pal 5 20 14-0.6 1 28 6 11 7 2 3 17 10 4 21 9 12 Moisture -0.6 1.2 30 13 16 8 29-0.6 Ran acr Rum ace Tri pra Tri rep Ele pal Bel per Bra rut Vic lat Cir arv Cal cus Agr sto Ely rep Che alb Ran fla Leo aut Poa ann Poa tri Hip rha Jun buf Alo gen Jun art Hyp rad Emp nig Sal rep -0.6 1.2

Metody přímé ordinace (RDA) Dune Meadow Data Axes 1 2 3 4 Total variance Eigenvalues :.227.028.212.115 1.000 Species-environment correlations :.902.597.000.000 Cumulative percentage variance of species data: 22.7 25.5 46.7 58.2 of species-environment relation: 89.0 100.0.0.0 Sum of all unconstrained eigenvalues 1.000 Sum of all canonical eigenvalues.255

Metody přímé ordinace (CCA) Dune Meadow Data 2.5 2.5 Pot pal 15 20 5 28 6 11 4 2 7 1 10 21 3 17 9 A1 12 13 8 29 30 16 14 Moisture Tri pra Ran acr Pla lan Rum ace Bel per Cir arv Leo aut Tri rep Bra rut Hyp rad Air pra Sal rep Agr sto Poa ann Poa tri Alo gen Ant odo Hip rha Jun buf Sag pro Jun art Ele pal Cal cus Ran fla Che alb -1.5-1.5 Emp nig -1.0 2.0-1.0 2.0

Metody přímé ordinace (CCA) Dune Meadow Data Axes 1 2 3 4 Total inertia Eigenvalues:.414.111.401.277 2.130 Species-environment correlations:.921.728.000.000 Cumulative percentage variance of species data: 19.4 24.6 43.4 56.5 of species-environment relation: 78.9 100.0.0.0 Sum of all unconstrained eigenvalues 2.130 Sum of all canonical eigenvalues.524

Metody přímé ordinace (CCA) Dune Meadow Data s nominálními proměnnými prostředí 2.0 2.0 21 Hip rha Air pra Ant odo Sal rep Emp nig 20 28 10 5 11 17 Hayfield 9 29 30 Pasture A1 7 8 3 1 2 6 4 Haypastu 12 13 16 14 Moisture 15 Vic lat Hyp rad Pla lan Ach mil Ran acr Rum ace Leo aut Bra rut Bel per Tri rep Bro hor Poa pra Jun buf Tri pra Poa ann Lol per Poa tri Sag pro Jun art Ran fla Agr sto Cal cus Ele pal Pot pal Alo gen -1.5-1.0 2.5-1.5 Cir arv Che alb -1.0 2.5

Metody přímé ordinace (CCA) Dune Meadow Data s nominálními proměnnými prostředí Axes 1 2 3 4 Total inertia Eigenvalues:.426.152.144.043 2.130 Species-environment correlations:.929.684.793.776 Cumulative percentage variance of species data: 20.0 27.1 33.9 35.9 of species-environment relation: 55.7 75.5 94.3 100.0 Sum of all unconstrained eigenvalues 2.130 Sum of all canonical eigenvalues.765

Kódování proměnných prostředí v přímé ordinaci Dune Meadow Data ENVIRONMENTAL DATA IN FULL FORMAT - DUNE MEADOW DATA (I5,F5.0,1X,2F3.0,3X,3F2.0,3X,4F2.0) 10 1 2.8 1 4 0 1 0 1 0 0 0 2 3.5 1 2 0 1 0 0 1 0 0 3 4.3 2 4 0 1 0 1 0 0 0 4 4.2 2 4 0 1 0 1 0 0 0 5 6.3 1 2 1 0 0 0 0 1 0 6 4.3 1 2 0 1 0 0 0 1 0 7 2.8 1 3 0 0 1 0 0 1 0 8 4.2 5 3 0 0 1 0 0 1 0 9 3.7 4 1 1 0 0 0 0 1 0 10 3.3 2 1 1 0 0 0 1 0 0 11 3.5 1 1 0 0 1 0 1 0 0 12 5.8 4 2 0 1 0 1 0 0 0 13 6.0 5 3 0 1 0 1 0 0 0 14 9.3 5 0 0 0 1 0 0 0 1 15 11.5 5 0 0 1 0 0 0 0 1 16 5.7 5 3 0 0 1 1 0 0 0 17 4.0 2 0 1 0 0 0 0 0 1 28 4.6 1 0 1 0 0 0 0 0 1 29 3.7 5 0 1 0 0 0 0 0 1 30 3.5 5 0 1 0 0 0 0 0 1 0 0.0 0 0 0 0 0 0 0 0 0 A1 MoistureManure HayfieldHaypastuPasture SF BF HF NM Sample 1Sample 2Sample 3Sample 4Sample 5Sample 6Sample 7Sample 8Sample 9Sample10 Sample11Sample12Sample13Sample14Sample15Sample16Sample17 SupplSAM Duplic17 Sample18Sample19Sample20

Parciální ordinace Odstraňuje část variability vysvětlené nezajímavými proměnnými (např. vliv bloku při hodnocení dat z pokusů) Následně se přímými nebo nepřímými ordinačním metodami analyzuje zbytková variabilita Technicky: nezajímavé proměnné se definují jako kovariáty (koproměnné, covariables) provede se regrese proměnných prostředí na kovariátách a rezidua této regrese zaujmou místo původních proměnných prostředí ordinační osy parciální ordinace reprezentují čistý vliv proměnných prostředí, s vyloučením vlivu kovariát

Parciální CCA Dune Meadow Data kovariáta: vlhkost, proměnná prostředí: hloubka půdního horizontu A1 4 4 Emp nig Air pra Hyp rad 21 29 17 Ant odo -1 11 28 10 30 6 7 20 8 2 16 12 9 1 4 3 13 A1-2 3 5 14 15-1 Sal rep Hip rha Pla lan Vic lat Tri pra Pot pal Bra rut Rum ace Sag pro Ran acr Bro hor Cal cus Poa pra Bel per Ele pal Poa ann Agr sto Alo gen Che alb -2 3

Parciální CCA Dune Meadow Data kovariáta: vlhkost, proměnná prostředí: hloubka půdního horizontu A1 Axes 1 2 3 4 Total inertia Eigenvalues:.125.401.277.199 2.130 Species-environment correlations:.725.000.000.000 Cumulative percentage variance of species data: 7.2 30.4 46.4 57.9 of species-environment relation: 100.0.0.0.0 Sum of all unconstrained eigenvalues 1.730 Sum of all canonical eigenvalues.125

Case study: Jak ovlivňuje podíl smrku ve stromovém patru druhové složení podrostu? Model: Partial RDA Envir. variable Picea cover Covariables Altitude Slope aspect Slope inclination Mineral soil depth Free carbonate depth Mottling depth Tree layer cover Results: Ax 1 eigenvalue 0.022 Ax 1 significance 0.001 % variance of species data 2.7 % variance of spec.-env. relation 100 RDA Ax 1 scores: positive negative Dicranum scopa 0.36 Fagus sylvatica -0.36 Plagiomn affine 0.32 Sanicula europa -0.29 Plagiothe curvif 0.29 Carex flacca -0.27 Pleuroziu schre 0.28 Cicerbita alpina -0.22 Hypnum cupres 0.26 Veronica monta -0.21 Ewald 2000, Appl. Veg. Sci. 3: 123-138

Rozklad variance (variance partitioning) Borcard et al. 1992, Ecology 73: 1045 1055 odděluje varianci vysvětlenou dvěma skupinami proměnných např. abiotické vs. biotické faktory proměnné prostředí vs. čas edafické vs. klimatické proměnné vlastnosti přírodního prostředí vs. zásahy člověka

Rozklad variance (variance partitioning) Borcard et al. 1992, Ecology 73: 1045 1055 celková variabilita zbytková variabilita sdílená variabilita variabilita vysvětlená první skupinou proměnných variabilita vysvětlená druhou skupinou proměnných

Rozklad variance (variance partitioning) Borcard et al. 1992, Ecology 73: 1045 1055 celková variabilita druhových dat (total inertia) minus součet zelené, fialové a červené variability variabilita vysvětlená 1. skupinou proměnných v analýze, kde 2. skupina proměnných tvoří kovariáty variabilita vysvětlená jednou ze dvou skupin proměnných v analýze bez kovariát minus variabilita vysvětlená v analýze s kovariátami variabilita vysvětlená 2. skupinou proměnných v analýze, kde 1. skupina proměnných tvoří kovariáty

Permutační test (Monte Carlo test) Testuje, zda vybraná proměnná prostředí má signifikantní vliv na druhové složení Nulová hypotéza: variabilita druhového složení je nezávislá na testované proměnné prostředí Spočítá se statistika F (poměr variability vysvětlené regresí a reziduální variability) pro reálná data Permutace: náhodně se přeskupí hodnoty proměnné prostředí mezi jednotlivými snímky a spočítá se F Envir. variable 3 5 3 8 4 6 Species 1 0 2 0 1 1 2 Species 2 1 1 1 0 3 3 Species 3 2 2 1 0 0 1

Permutační test (Monte Carlo test) Permutace se provede mnohokrát a vždy se zaznamená hodnota F Udělá se rozložení těchto hodnot a porovná se s hodnotou F pro skutečná (nepermutovaná) data rozložení hodnot F pro všechny permutace F původních dat vliv proměnné je signifikantní F původních dat vliv proměnné je nesignifikantní F

Permutační test (Monte Carlo test) 19 permutací test pro 5% hladinu významnosti (P<0.05) 99 permutací test pro 1% hladinu významnosti (P<0.01) 999 permutací test pro 0.1% hladinu významnosti (P<0.001)

Permutační test (Monte Carlo test) test první kanonické osy např. zajímá-li nás vliv jedné kvantitativní proměnné test všech kanonických os např. zajímá-li nás vliv nominální proměnné s několika kategoriemi test částečného (podmíněného; partial, conditional) vlivu proměnné, jsou-li v modelu zahrnuty už jiné proměnné

Permutační test (Monte Carlo test) unrestricted permutations data nemají žádnou vnitřní strukturu, zápisy jsou nezávislé unrestricted permutation within blocks defined by covariables 2 3 7 6 5 3 7 2 3 4 5 3 8 5 7 2 3 3 6 4 3 3 5 8 2 7 6 3 2 5 3 7 3 4 2 8 5 7 3 restricted permutations for time series or line transects pro potenciálně autokorelovaná data 2 3 7 6 5 3 7 2 3 4 5 3 8 5 3 8 2 3 7 6 5 3 7 2 3 4 3 7 2 3 4 5 3 8 2 3 7 6 5 split-plot design složitější uspořádání: split plots jsou vřazeny do whole plots

Příklady použití přímé ordinace pro studium vztahů mezi druhovým složením a vnějšími faktory

Změna vegetace v čase: opakování starých fytocenologických snímků testovaná proměnná: čas (nominální proměnná: staré zápisy 0, nové zápisy 1) kovariáty: jakékoliv změřené proměnné, které mohou ovlivňovat variabilitu vegetace v prostoru např. nominálně kódovaná lokalita nominálně kódované geologické podloží topografický index xericity nadmořská výška randomizace: unrestricted permutations; jsou-li nominální kovariáty, unrestricted permutations within blocks defined by covariables

Změna vegetace v čase: trvalé plochy testovaná proměnná: čas jeden záznam každoročně nebo studium změn během jediné sezóny kovariáty: jakékoliv změřené proměnné, které mohou ovlivňovat variabilitu vegetace v prostoru randomizace: restricted permutations for time series or line transects within blocks defined by covariables (jednotlivé plochy jsou definovány jako kovariáty); jsou-li další nominální kovariáty, použije se split-plot design víceleté studium s několika záznamy v každém roce kovariáty: tytéž, navíc nominální proměnné kódující sezónu (např. květen, červenec, září) nebo čas od začátku roku randomizace: je-li sezóna kódována nominálními proměnnými, použije se split-plot design, kde plochy jsou randomizovány odděleně ve whole plots a sezóny ve split-plots

Permutace dat z trvalých ploch V každém obdélníku restricted permutations for time series Plot 1 Whole plots Plot 2 Plot 3 1997 1998 1999 2000 2001 1997 1998 1999 2000 2001 1997 1998 1999 2000 2001 1997 1998 1999 2000 2001 1997 1998 1999 2000 2001 1997 1998 1999 2000 2001

Analýza dat z transektů testovaná proměnná: např. ph, hloubka půdy, pokryvnost stromového patra apod., zaznamenávané na transektu randomizace: restricted permutation for time series or line transects prochází-li transekt výrazným gradientem, lze tento gradient odstranit použitím pořadí plochy na transektu jako kovariáty společná analýza dat z více transektů variabilita mezi transekty se může odstranit definováním transektů jako série nominálních kovariát randomizace restricted permutation for time series or line transects, blocks defined by covariables

Analýza terénních manipulativních pokusů testovaná proměnná: interakce času a pokusného zásahu (např. kosení a kontrola) kovariáty: nominálně kódované plochy (zahrnují i pokusné zásahy), čas randomizace: split-plot design: whole plots (zásahy): freely exchangeable split plots (stejné plochy v různých časech: restricted permutation for time series or line transects je-li víc typů pokusných zásahů, testují se společně, každý jako interakce s časem v jednom modelu, čas jako kovariáta každý zvlášť jako interakce s časem, přičemž vždy interakce ostatních zásahů s časem jsou kovariáty a čas je také kovariáta

Kódování orientace svahu 360 o = 0 o PDSI modely 315 o 45 o (potential direct solar irradiation) Heat index (Parker 1988) 270 o 225 o 180 o 90 o 135 o HI = cos (orientace 225 o ) * tg sklonu Topografický index relativní vlhkosti (Parker 1982) vrchol hřebene = 0, dno údolí = 20 JJZ = 0, SSV = 20 sklon > 30 o = 0, 0 o = 10 konvexní = 0, konkávní = 10