ELLENBERGOVY INDIKAČNÍ HODNOTY. David Zelený Zpracování dat v ekologii společenstev

Podobné dokumenty
ELLENBERGOVY INDIKAČNÍ HODNOTY. David Zelený Zpracování dat v ekologii společenstev

REGRESE VS KALIBRACE. David Zelený Zpracování dat v ekologii společenstev

SPECIES ATTRIBUTES IN ANALYSIS OF COMMUNITY ECOLOGY DATA

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Úvodem Dříve les než stromy 3 Operace s maticemi

Inovace bakalářského studijního oboru Aplikovaná chemie

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Statistická analýza jednorozměrných dat

Hluboká říční údolí jako objekt pro modelování vztahů vegetace a proměnných prostředí?

2019/03/31 17:38 1/2 Klasifikační a regresní stromy

6. Lineární regresní modely

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

Smíšené regresní modely a možnosti jejich využití. Karel Drápela

odpovídá jedna a jen jedna hodnota jiných

LINEÁRNÍ REGRESE. Lineární regresní model

Korelační a regresní analýza

Statistika (KMI/PSTAT)

5EN306 Aplikované kvantitativní metody I

Pokročilé neparametrické metody. Klára Kubošová

Tomáš Karel LS 2012/2013

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

INDUKTIVNÍ STATISTIKA

Regresní analýza 1. Regresní analýza

Aplikovaná statistika v R - cvičení 3

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Testování hypotéz o parametrech regresního modelu

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Ilustrační příklad odhadu LRM v SW Gretl

Regresní a korelační analýza

Regresní analýza. Eva Jarošová

Regrese. používáme tehdy, jestliže je vysvětlující proměnná kontinuální pokud je kategoriální, jde o ANOVA

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan

Testování hypotéz o parametrech regresního modelu

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Měření závislosti statistických dat

4EK211 Základy ekonometrie

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

Pokud data zadáme přes "Commands" okno: SDF1$X1<-c(1:15) //vytvoření řady čísel od 1 do 15 SDF1$Y1<-c(1.5,3,4.5,5,6,8,9,11,13,14,15,16,18.

PŘÍKLADY POUŽITÍ ORDINAČNÍCH METOD

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

6. Lineární regresní modely

AVDAT Klasický lineární model, metoda nejmenších

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Tomáš Karel LS 2012/2013

Bodové a intervalové odhady parametrů v regresním modelu

POLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými.

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Analýza rozptylu. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Srovnávání více než dvou průměrů

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Pokročilé neparametrické metody. Klára Kubošová

LINEÁRNÍ MODELY. Zdeňka Veselá

6. Lineární regresní modely

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

AVDAT Geometrie metody nejmenších čtverců

4EK211 Základy ekonometrie

UNIVERZITA PARDUBICE. 4.4 Aproximace křivek a vyhlazování křivek

EKONOMETRIE 7. přednáška Fáze ekonometrické analýzy

STATISTICKÉ METODY; ZÍSKÁVÁNÍ INFORMACÍ Z DRUHOVÝCH A ENVIRONMENTÁLNÍCH DAT

4ST201 STATISTIKA CVIČENÍ Č. 10

PRAVDĚPODOBNOST A STATISTIKA

4EK211 Základy ekonometrie

Lineární a logistická regrese

4EK211 Základy ekonometrie

=10 =80 - =

Prostorová variabilita

AVDAT Nelineární regresní model

Regresní a korelační analýza

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

VÝUKA: Biostatistika základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ

Univerzita Pardubice SEMESTRÁLNÍ PRÁCE. Tvorba lineárních regresních modelů. 2015/2016 RNDr. Mgr. Leona Svobodová, Ph.D.

Vztah mezi počtem květů a celkovou biomasou rostliny

6. Lineární regresní modely

Diverzita doubrav ve vztahu k produktivitě stanoviště. Irena Veselá

TLOUŠŤKOVÁ A VÝŠKOVÁ STRUKTURA A JEJÍ MODELOVÁNÍ

Testování hypotéz a měření asociace mezi proměnnými

You created this PDF from an application that is not licensed to print to novapdf printer (

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Cvičení 12: Binární logistická regrese

, Brno Hanuš Vavrčík Základy statistiky ve vědě

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

Statistická analýza jednorozměrných dat

MODEL TVÁŘECÍHO PROCESU

Cvičící Kuba Kubina Kubinčák Body u závěrečného testu

Regresní a korelační analýza

Kontingenční tabulky, korelační koeficienty

10. Předpovídání - aplikace regresní úlohy

AVDAT Mnohorozměrné metody, metody klasifikace

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

Jana Vránová, 3. lékařská fakulta, UK Praha

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ

Základy navrhování průmyslových experimentů DOE

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )

Transkript:

3 2 6 6 5 2 ELLENBERGOVY INDIKAČNÍ HODNOTY

ELLENBERGOVY INDIKAČNÍ HODNOTY (EIH) optima druhů rostlin na gradientu ţivin, vlhkosti, půdní reakce, kontinentality, teploty, světla a salinity (salinita se ve Střední Evropě nepouţívá) hodnoty na ordinální škále (1-9, případně 1-12 pro vlhkost) optima stanovená na základě terénních pozorování, v některých případech upřesněna experimentálně hodnoty tabelované původně pro Německo, ale pouţívané i v okolních zemích, pro vzdálenější státy (Anglie, Itálie, Řecko) byly tyto hodnoty překalibrovány, jinde (Maďarsko, Švýcarsko) se pouţívají alternativní hodnoty od jiných autorů (Borhidi, resp. Landolt) tabulky obsahují pouze údaje o druhových optimech, ne o šířkách druhové niky v případě, ţe nemám měřená data o proměnných prostředí, průměrné EIH nabízejí ekologicky intuitivní odhad stanovištních podmínek 180

ELLENBERGOVY INDIKAČNÍ HODNOTY (EIH) POUŢITÍ PRO KALIBRACI EIV pro půdní reakci 1 2 3 Mycelis muralis 6 1 0 0 Moehringia trinervia 7 0 1 1 Mercurialis perennis 7 1 0 1 Lathyrus vernus 4 0 1 0 Myosotis sylvatica 7 1 1 0 Milium effusum 5 0 0 1 Melica nutans 3 1 1 0 Melampyrum pratense 2 0 1 1 Myosotis ramosissima 1 1 1 0 Lychnis viscaria 2 0 0 1 Melittis melissophyllum 3 0 1 0 4.8 průměr 181

ELLENBERGOVY INDIKAČNÍ HODNOTY (EIH) POUŢITÍ PRO KALIBRACI EIV pro půdní reakci 1 2 3 Mycelis muralis 6 1 0 0 Moehringia trinervia 7 0 1 1 Mercurialis perennis 7 1 0 1 Lathyrus vernus 4 0 1 0 Myosotis sylvatica 7 1 1 0 Milium effusum 5 0 0 1 Melica nutans 3 1 1 0 Melampyrum pratense 2 0 1 1 Myosotis ramosissima 1 1 1 0 Lychnis viscaria 2 0 0 1 Melittis melissophyllum 3 0 1 0 průměrná hodnota: 4.8 3.9 4.6 182

POUŢITÍ PRŮMĚRNÝCH EIH V CCA empirická zkušenost s ekologií druhů (Ellenberg) vypočtené průměrné Ellenbergovy hodnoty druhové složení nepoužívat! (vysvětlující i vysvětlovaná proměnná odvozená ze stejných dat) vegetace vysvětlující proměnná vysvětlovaná proměnná 183

POUŢITÍ PRŮMĚRNÝCH EIH V DCA empirická zkušenost s ekologií druhů (Ellenberg) vypočtené průměrné Ellenbergovy hodnoty druhové složení možno použít, nelze ale testovat signifikanci korelace skóre vzorků na hlavních ordinačních osách vegetace korelace 184

PROČ SE EIH TVÁŘÍ JAKO LEPŠÍ PROMĚNNÉ NEŢ MĚŘENÉ FAKTORY PROSTŘEDÍ? díky způsobu jak jsou počítány, obsahují průměrné EIH informaci o podobnosti v druhovém sloţení mezi vegetačními snímky vegetační snímky s úplně stejným druhovým sloţením budou mít přesně stejné průměrné EIH pro měřené faktory toto ale neplatí malý rozdíl v druhovém sloţení mezi vegetačními snímky povede jen k malému rozdílu v jejich průměrných EIH průměrná EIH pro daný vegetační snímek obsahuje dvojí informaci: 1. ekologicky relevantní informaci o charakteru stanoviště, a to díky pouţití tabelovaných druhových EIH, které jsou zaloţeny na empirických pozorování ekologických nároků druhů v terénu 2. informaci o podobnosti druhového sloţení daného snímku k ostatním snímkům v datovém souboru, která je v nich uloţena díky způsobu, jak jsou průměrné EIH počítány měřené faktory prostředí obsahují jen informaci o ekologickém charakteru stanoviště, ne o podobnosti v druhovém sloţení 185

VYTVOŘENÍ PRŮMĚRNÝCH EIH, KTERÉ NEOBSAHUJÍ EKOLOGICKOU INFORMACI průměrné reálné EIH pro půdní reakci: průměrné znáhodněné EIH pro půdní reakci: průměrné reálné EIH obsahují ekologicky relevantní informaci a informaci o podobnosti v druhovém sloţení průměrné znáhodněné EIH obsahují pouze informaci o podobnosti v druhovém sloţení (ekologicky relevantní informace byla zničena promícháním druhových EIH mezi druhy) 186

průměrná Mean EIH Ellenberg pro reaction půdní reakci vysvětlená Explained variability variabilita [%] [%] měřené ph náhodná čísla průměrné reálné EIH průměrné znáhodnéné EIH náhodná čísla POROVNÁNÍ MĚŘENÉHO PŮDNÍHO PH A VYPOČTENÉ PRŮMĚRNÉ EIH PRO PŮDNÍ REAKCI VYSVĚTLUJÍCÍ PROMĚNNÉ V CCA 7 6 5 4 3 2 3.5 4.0 4.5 5.0 měřené ph Measured soil ph 5 4 3 2 1 0 real ph měřené ph Ellenberg reaction EIH pro půdní reakci průměrná EIH pro půdní reakci vysvětlí víc variability neţ měřené ph, i kdyţ obě proměnné jsou spolu těsně korelované 187

KORELACE PRŮMĚRNÝCH EIH SE SKÓRY SNÍMKU NA OSÁCH DCA průměrná EIH bude s velkou pravděpodobností signifikantně korelovaná s DCA, i když neobsahuje ekologickou informaci! Počet signifikantních korelací mezí osami DCA a průměrnými znáhodněnými EIH (šedé sloupečky) nebo náhodnými čísly (bílé sloupečky) 1000 opakování 188

KORELACE PRŮMĚRNÝCH EIH SE SKÓRY SNÍMKU NA OSÁCH DCA průměrné EIH mohou mít výrazně vyšší koeficienty korelace s osami DCA, i když neobsahují žádnou ekologicky relevantní informaci korelace DCA s průměrnými znáhodněnými EIH korelace DCA s náhodnými čísly 189

PRŮMĚRNÉ ELLENBERGOVY INDIKAČNÍ HODNOTY PRAVIDLA POUŢITÍ průměrné EIH jsou odvozeny z druhového sloţení nelze je proto používat jako vysvětlující proměnné v přímých ordinačních analýzách (argumentace kruhem) i při korelacích se skóry snímků na hlavních osách DCA nejde o korelaci dvou nezávislých proměnných nelze testovat signifikanci této korelace! (neúměrně vysoká pravděpodobnost, ţe bude korelace průkazná, i kdyţ proměnná nemá ekologický vliv) není vhodné promítat průměrné EIH do ordinačních diagramů (např. DCA) spolu s měřenými proměnnými průměrné EIH budou mít vyšší korelační koeficient a tím i delší šipky problém je přítomen i v dalších analýzách, např. korelaci počtu druhů a průměrných EIH, nebo výpočtu ANOVA rozdílů v průměrných EIH mezi vegetačními typy 190

ZOBECNĚNÉ LINEÁRNÍ MODELY REGRESNÍ A KLASIFIKAČNÍ STROMY

REGRESE KORELACE Korelace popis závislosti mezi dvěma proměnnými, bez znalosti kauzálního vztahu počítám: korelační koeficient (r), případně signifikanci korelačního koeficientu (t-test) Regrese předpokládá kauzální vztah mezi vysvětlující (x) a vysvětlovanou (y) proměnnou jedná se o typ modelu výběr nejlepší vysvětlující proměnné, nejlepšího modelu, predikce vysvětlované proměnné počítám: regresní koeficient (b = sklon regresní přímky), koeficient determinace (R 2 ), signifikanci regrese (t-test, ANOVA, Monte-Carlo permutační test) 192

REGRESE KORELACE Ale: většinou platí, ţe i kdyţ počítám korelaci, předpokládám (moţná jen podvědomě), ţe mezi proměnnými existuje nějaký kauzální vztah a tím se rozdíl mezi korelací a regresí stírají Dvě situace: vysvětlující proměnná (x) je měřená bez chyby (většinou proto, ţe je kontrolovaná experimentálním designem) pouţijeme regresi (korelace v tomto případě nemá smysl) obě proměnné (x a y) jsou měřené s chybou (případ jak dat z experimentů, tak z empirických pozorování) záleţí na tom, co od analýzy očekáváme pokud je cílem vytvoření modelu nebo testování hypotéz, pak pouţijeme regresi pokud ne pouţijeme korelaci 193

LINEÁRNÍ REGRESE PŘEDPOKLADY 1. lineární model správně popisuje funkční vztah mezi vysvětlující a vysvětlovanou proměnnou pokud je vztah nelineární a nepomůţe transformace, je třeba pouţít nelineární regresní model nebo zobecněný lineární model 2. vysvětlující proměnná je měřená přesně (bez náhodné sloţky) metoda nejmenších čtverců ale funguje i v případě, ţe vysvětlující proměnná je měřená s chybou 3. kaţdá hodnota vysvětlované proměnné (y) je nezávislá na ostatních hodnotách y, náhodná sloţka vysvětlované proměnné má normální rozdělení zvláště pro data z observačních studií často neplatí pravidlo o nezávislosti (a většinou ani nevíme, jak moc toto pravidlo neplatí) 4. variance vysvětlující proměnné je konstantní podél celé regresní přímky (homoskedasticita) transformace dat málokdy řeší oba problémy najednou ztransformovaná proměnná bude mít normální rozdělení, ale ne konstantní varianci, a naopak toto řeší metoda zobecněných lineárních modelů (GLM) 194

REGRESE lineární model y i = β 0 β 1 x i ε i y i... hodnota vysvětlované (závislé) proměnné pro i-té pozorování x i... hodnota vysvětlující (nezávislé) proměnné pro i-té pozorování β 0... regresní koeficient, posun regresní přímky (intercept), udává souřadnici průsečíku regresní přímky s osou y β 1... regresní koeficient, sklon regresní přímky (slope) ε i... chyba mnohonásobná regrese regrese jedné vysvětlované proměnné na několika (j) vysvětlujících proměnných y i = β 0 Σ j β j x ij ε i 195

REGRESE ZOBECNĚNÉ LINEÁRNÍ MODELY (GLM) umoţňují modelovat vysvětlované proměnné s jiným neţ normálním (Gaussovým) rozloţením náhodné sloţky počty jedinců Poissonovo rozloţení presence/absence binomické rozloţení zavádí tzv. link-funkci (η, theta), která překládá rozsah hodnot vysvětlujících proměnných (pravá strana rovnice) na rozsah hodnot vysvětlované proměnné (levá strana rovnice) η i = b 0 Σ j b j x ij η i... lineární prediktor y i = ŷ i ε i ŷ i... hodnota vysvětlované proměnné y i predikovaná modelem -> platí g (ŷ i ) = η i g... link funkce Poissonovo rozloţení log link: η = log (ŷ i ) Binomické rozloţení logit link: η = log [ŷ i / (1 ŷ i )] Gaussovo rozloţení identity link: η = ŷ i 196

REGRESNÍ A KLASIFIKAČNÍ STROMY REGRESSION AND CLASSIFICATION TREES, CART metoda podobná mnohonásobné regresi jedna vysvětlovaná a několik vysvětlujících proměnných má minimální předpoklady na charakter (rozloţení) dat explorativní analýza slouţí k popisu dat, ne k testování hypotéz vysvětlující proměnné mohou být kategoriální i kvantitativní vysvětlovaná proměnná: pokud je kategoriální klasifikační strom pokud je kvantitativní regresní strom 197

REGRESNÍ A KLASIFIKAČNÍ STROMY REGRESSION AND CLASSIFICATION TREES, CART FLUVISOL <> a 31.2 ; 71 obs; 35.8% COVERE32 <> 67.5 30.18 ; 17 obs; 3.4% 1 26.38 8 obs ELEVATION <> 467.5 26.6 ; 42 obs; 5.7% 2 33.56 9 obs ph.h <> 4.23 28.63 ; 59 obs; 9.3% ph.h <> 3.755 24.16 ; 25 obs; 2.8% 3 SURFIS <> -0.5 25.5 ; 20 obs; 1.6% 18.8 5 obs COVERE32 <> 87.5 33.65 ; 17 obs; 6.5% 6 39.57 7 obs 7 29.5 10 obs SOILDPT <> 36.585 43.83 ; 12 obs; 5.3% 8 49.17 6 obs 9 38.5 6 obs 4 5 21.6 5 obs 26.8 15 obs Total deviance explained = 70.4 % 198 data o druhové bohatosti lesů na Vltavě v závislosti na měřených faktorech prostředí (Zelený, nepubl.)