ZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV

Podobné dokumenty
EKOLOGICKÝCH EXPERIMENTŮ

ZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV

ZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV

ZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV

ZPRACOVÁNÍ DAT V EKOLOGII

ZPRACOVÁNÍ DAT V EKOLOGII

STATISTICKÉ METODY; ZÍSKÁVÁNÍ INFORMACÍ Z DRUHOVÝCH A ENVIRONMENTÁLNÍCH DAT

Analýza dat na PC I.

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Úvodem Dříve les než stromy 3 Operace s maticemi

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

KORELACE. Komentované řešení pomocí programu Statistica

Popisná statistika. Statistika pro sociology

EKOLOGICKÁ PODOBNOST (ECOLOGICAL RESEMBLANCE) David Zelený Zpracování dat v ekologii společenstev

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

INDEXY DIVERZITY. David Zelený Zpracování dat v ekologii společenstev

Pokročilé neparametrické metody. Klára Kubošová

ZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)

PŘÍKLADY POUŽITÍ ORDINAČNÍCH METOD

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Regresní analýza. Eva Jarošová

ELLENBERGOVY INDIKAČNÍ HODNOTY. David Zelený Zpracování dat v ekologii společenstev

ELLENBERGOVY INDIKAČNÍ HODNOTY. David Zelený Zpracování dat v ekologii společenstev

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

pravděpodobnosti, popisné statistiky

Pokud data zadáme přes "Commands" okno: SDF1$X1<-c(1:15) //vytvoření řady čísel od 1 do 15 SDF1$Y1<-c(1.5,3,4.5,5,6,8,9,11,13,14,15,16,18.

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Korelační a regresní analýza

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie

INDEXY DIVERZITY. David Zelený Zpracování dat v ekologii společenstev

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan

PCA BIPLOT ŠKÁLOVÁNÍ OS (1)

4. Zpracování číselných dat


Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat

5EN306 Aplikované kvantitativní metody I

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

, Brno Hanuš Vavrčík Základy statistiky ve vědě

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

5EN306 Aplikované kvantitativní metody I

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Korelace. Komentované řešení pomocí MS Excel

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

Cvičení 12: Binární logistická regrese

Robustní statistické metody

UNIVERZITA PARDUBICE

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

Regresní a korelační analýza

PSY Statistická analýza dat v psychologii Přednáška 3. Transformace skórů a kvantily normálního rozložení

ČETNOSTI A ROZLOŽENÍ ČETNOSTÍ

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

ANALÝZA DAT V R 2. POPISNÉ STATISTIKY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

Tomáš Karel LS 2012/2013

Diverzita doubrav ve vztahu k produktivitě stanoviště. Irena Veselá

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

TLOUŠŤKOVÁ A VÝŠKOVÁ STRUKTURA A JEJÍ MODELOVÁNÍ

Statistika pro geografy

Regresní a korelační analýza

PRAVDĚPODOBNOST A STATISTIKA

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA Sylabus pro předmět STATISTIKA Pomůcky... 7

ZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV

Hluboká říční údolí jako objekt pro modelování vztahů vegetace a proměnných prostředí?

Aplikovaná statistika v R

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Optimalizace provozních podmínek. Eva Jarošová

Průzkumová analýza dat

Otázky k měření centrální tendence. 1. Je dáno rozložení, ve kterém průměr = medián. Co musí být pravdivé o tvaru tohoto rozložení?

S E M E S T R Á L N Í

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Karta předmětu prezenční studium

7. Rozdělení pravděpodobnosti ve statistice

Statistika. cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací!

Statistická analýza jednorozměrných dat

Úloha E301 Čistota vody v řece testem BSK 5 ( Statistická analýza jednorozměrných dat )

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )

Statistické metody. Martin Schindler KAP, tel , budova G. naposledy upraveno: 9.

Testy nezávislosti kardinálních veličin

VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA METALURGIE A MATERIÁLOVÉHO INŽENÝRSTVÍ KATEDRA KONTROLY A ŘÍZENÍ JAKOSTI

Pravděpodobnost a matematická statistika

DIVERZITA. David Zelený Zpracování dat v ekologii společenstev

Základy teorie pravděpodobnosti

Transkript:

ZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV

OSNOVA PŘEDNÁŠKY Příprava dat pro numerické analýzy čištění dat, odlehlé body, transformace, standardizace, EDA Design ekologických experimentů manipulativní experimenty vs přírodní experimenty (pozorování) Typy sbíraných dat kategoriální vs kvantitativní, pokryvnosti, frekvence Ekologická podobnost indexy podobnosti a vzdálenosti mezi vzorky Klasifikace hierarchická vs nehierarchická, aglomerativní vs divisivní Ordinace lineární vs unimodální, přímá vs nepřímá Regrese zobecněné lineární modely, regresní a klasifikační stromy Ellenbergovy indikační hodnoty kalibrace Indexy druhové bohatosti alfa, beta a gamma diverzita, akumulační druhová křivka, rarefaction Případové studie na použití jednotlivých metod 2

LITERATURA Doporučená Lepš J. & Šmilauer P. (2001) Mnohorozměrná analýza ekologických dat v anglické verzi vyšlo v nakladatelství Cambridge v roce 2003 jako Multivariate Analysis of Ecological Data using CANOCO http://regent.jcu.cz/skripta.pdf Herben T. & Münzbergová Z. (2003) Zpracování geobotanických dat v příkladech. Část 1. Data o druhovém složení ftp://botany.natur.cuni.cz/skripta/zpracovani_geobot_dat/multivar.pdf Pro fajnšmekry Wildi O. (2010) Data Analysis in Vegetation Ecology. Wiley-Blackwell. Gotelli N.J. & Ellison A.M. (2004) A Primer of Ecological Statistics. Sinauer Associates. Palmer M. Ordination methods for ecologists, website http://ordination.okstate.edu/ Oksanen J. (2004) Multivariate Analysis in Ecology, Lecture Notes. http://cc.oulu.fi/~jarioksa/opetus/metodi/notes.pdf Legendre P. & Legendre L. (1998) Numerical Ecology (Second English Edition). Elsevier. 3

SOFTWARE CANOCO for Windows 4.5 ordinační analýzy CanoDraw for Windows 4.0 kreslení ordinačních diagramů a odpovědních křivek druhů PC-ORD 5 numerické klasifikace, ordinační analýzy, analýza odlehlých bodů STATISTICA 9.0 regrese, regresní a klasifikační stromy Kde co sehnat: CANOCO, CanoDraw a PC-ORD instalace z AVRUMELu nebo webových stránek předmětu (záložka Software) STATISTICA licenci je třeba získat po přihlášení na http://inet.sci.muni.cz v sekci Nabídka software 4

DALŠÍ INFORMACE Webové stránky předmětu: www.bit.ly/zpradat přednášky, software, příklady ke cvičení, studijní materiály některé sekce vyžadují přihlášení Cvičení probíhat bude v Bohunicích v druhé půlce semestru a zaměřené bude na analýzu dat v programu CANOCO a jejich vizualizaci v programu CanoDraw tři čtyřhodinové bloky Zkouška vypracování závěrečné práce (pokyny viz webové stránky předmětu, sekce Závěrečná práce) vlastní zkouška představuje asi půlhodinovou diskuzi nad závěrečnou prací, doplněná o rozšiřující otázky týkající se probírané látky 5

TYPY SBÍRANÝCH DAT PŘÍPRAVA DAT PRO ANALÝZY

DATA O EKOLOGII SPOLEČENSTEV popisují společenstvo, případně i jeho prostředí společenstvo je typicky sledováno na určité ploše (v případě rostlin a některých málo mobilních živočichů) nebo např. v pastech (v případě mobilních živočichů) složení živého společenstva je popsáno přítomností jednotlivých druhů daného typu organismů, na jedné ploše (v jedné pasti) se přitom vyskytuje většinou více než jeden druh prostředí je popisováno jednou nebo více proměnnými, o kterých se předpokládá, že ovlivňují studovaný typ organismů ekologická data jsou ve své podstatě mnohorozměrná a dají se vyjádřit maticí dat (data matrix) ekologická data vždy obsahují řadu zkreslení (bias) např. sampling bias přehlédnutí některých druhů 7

TYPY PROMĚNNÝCH Kategoriální (kvalitativní, nominální, prezenčně-absenční) např. geologický substrát, půdní typy, binární proměnné (přítomnostabsence druhu) kategorie jsou unikátní (každý jedinec/pozorování spadá právě do jedné z nich) a nelze je smysluplně seřadit Ordinální (semikvantitativní) např. Braun-Blanquetova stupnice pro odhad pokryvnosti druhů jednotlivé stupně (kategorie) lze seřadit, rozdíly mezi stupni jsou různě velké Kvantitativní diskrétní (počty, měření s malou přesností) x kontinuální (přesná měření) poměrová stupnice (ratio scale) x rozdílová stupnice (interval scale) 0 100 0 8

TYPY PROMĚNNÝCH ALTERNATIVNÍ TŘÍDĚNÍ Typ proměnné binární (dvoustavový, presence-absence) mnohostavový neseřazený seřazený semikvantitativní (ordinální) kvantitativní (měření) diskontinuální (počty, diskrétní) kontinuální Příklady přítomnost nebo absence druhu geologický substrát stupnice pokryvností druhy počet jedinců teplota, hloubka půdy Legendre & Legendre 1998 9

PRIMÁRNÍ DATA 10

PRIMÁRNÍ DATA 11

http://www.cggveritas.com/data//1/rec_i mgs/5152_tapes-small.jpg PRIMÁRNÍ DATA Zadávání primárních dat spreadsheet, metadata Uchování a zpřístupnění primárních dat problematika dlouhodobé archivace a nosičů dat zpřístupnění primárních dat Kontrola a čištění dat sloučení taxonomické nomenklatury chyby a chybějící data (možnosti nahrazení chybějících dat) analýza odlehlých bodů (outlier analysis) někdy i vyloučení vzácných druhů (odstranění šumu v datech) EDA exploratory data analysis 12

EDA EXPLORATORY DATA ANALYSIS obecně: metoda pro odhalení různých vlastností dat (description of pattern in data) slouží např. k vytěžování dat (data mining, data dredging moderní, ale problematická metoda zpracování dat) grafická EDA: odhalení odlehlých bodů (outlier analysis) distribuce dat (normalita) a nutnost transformace box-plot (krabicový graf) a histogram pro jednorozměrná data scatterplot (bodový graf) pro dvou a vícerozměrná data John Tukey (1915-2000) 13

EDA EXPLORATORY DATA ANALYSIS ANALÝZA ODLEHLÝCH BODŮ BOX-PLOT & HISTOGRAM XERSSW Frequency -8-6 -4-2 0 2 4 50 40 30 20 Median 25%-75% Range Outliers 10 0-8 -7-6 -5-4 -3-2 -1 0 1 2 3 4 XERSSW (head index) 14

EDA EXPLORATORY DATA ANALYSIS ANALÝZA ODLEHLÝCH BODŮ - SCATTERPLOT 3 2 1 0 XERSSW -1-2 -3-4 -5-6 -7-3 -2-1 0 1 2 3 4 5 6 XERSW XERSSW 3.0 2.5 2.0 1.5 1.0 0.5 0.0-0.5-1.0-3 -2-1 0 1 2 3 4 5 XERSW 15

DETAILY KE KRABICOVÝM GRAFŮM (BOXPLOT) Klasický boxplot (střední hodnota = medián) maximální hodnota Q3 horní kvartil Q2 - medián Q1 spodní kvartil minimální hodnota Definice odlehlých bodů a extrémů (STATISTICA) outlier 16

PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY TRANSFORMACE Transformace dat mění relativní vzdálenosti mezi jednotlivými hodnotami a tím i tvar jejich distribuce Proč data transformovat? protože škála měření je arbitrární a nemusí odpovídat ekologickému významu proměnné deset prstů => používání desítkové soustavy protože (některé) statistické testy vyžadují, aby data byla normálně rozložená (normal distribution) měla homogenní varianci (homoskedasticita, mezi průměrem a směrodatnou odchylkou není žádný vztah) protože lineární vztahy se interpretují lépe než vztahy nelineární 17

PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY TRANSFORMACE Na co si dát při transformaci pozor? aby transformace rozložení dat ještě nezhoršila a nevytvořila nové odlehlé body abychom při komentování výsledků používali netransformované hodnoty proměnných Typy transformace lineární přičtení konstanty nebo vynásobení konstantou nemění výsledky statistického testování nulových hypotéz např. převod teploty měřené ve stupních Celsia na stupně Fahrenheita nelineární log transformace, odmocninová transformace atd. může změnit výsledky statistického testování 18

0 50 100 150 200 0 50 100 150 200 0 100 200 300 400 500 600 700 ROZDĚLENÍ DAT (DATA DISTRIBUTION) symetrické (symetrical) 0 2 4 6 8 10 12 pozitivně (doprava) zešikmené* (right skewed) negativně (doleva) zešikmené (left skewed) -3-2 -1 0 1 2 3-8 -6-4 -2 0 2 * ekologická data jsou často zešikmená pozitivně (doprava), protože jsou omezená nulou na začátku 19

PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY zdroj: wikipedia.org TRANSFORMACE Logaritmická transformace (log transformation) pro data s výrazně pozitivně (doprava) šikmou distribucí (right skewed), u kterých existuje vztah mezi směrodatnou odchylkou a průměrem (lognormální rozložení) Y* = log (Y), případně Y* = log (a*y + c) na základě logaritmu nezáleží (10, 2, e) konstanta a = 1; pokud je Y z intervalu <0;1>, potom a > 1 konstanta c se přidává, pokud proměnná Y obsahuje nuly c může být např. 1, nebo arbitrárně zvolené malé číslo (0,001) na konstantě c může záležet výsledek analýz (ANOVA), a proto je dobré vybírat takové číslo, aby transformovaná proměnná byla co nejvíce symetrická 20

PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY Odmocninová transformace (square-root transformation) vhodná pro mírně doprava zešikmená data (right skewed), např. počty druhů (Poisson distribution) Y* = Y, případně Y* = (Y + c) konstanta c se přičítá, pokud soubor obsahuje nuly c může být např. 0,5, nebo 3/8 (0,325) třetí a vyšší odmocnina je účinnější na více zešikmená data (čtvrtá odmocnina se používá pro abundance druhů s mnoha nulami a několika vysokými hodnotami) Mocninná transformace (power transformation) vhodná pro data negativně (doleva) sešikmená (left skewed) Y* = Y p TRANSFORMACE pokud p < 1 - odmocninová transformace (p = 0,5 druhá odmocnina, p = 0,25 čtvrtá odmocnina atd.) 21

PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY TRANSFORMACE logaritmická odmocninová Legendre & Legendre (1998) 22

PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY TRANSFORMACE 23 Münch. Med. Wschr. 124, 1982

PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY TRANSFORMACE Transformace pomocí arcsin (angular transformation) vhodná pro procentické hodnoty (a obecně podíly) Y* = arcsin Y nebo Y* = arcsin Y použitelná pro hodnoty v intervalu <-1; 1> transformované hodnoty jsou v radiánech Reciproká transformace (reciprocal transformation) vhodná pro poměry (například výška/hmotnost, počet dětí v populaci na počet žen atd.) Y* = 1/Y 24

PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY TRANSFORMACE Box-Cox transformace (zobecněná mocniná transformace) zobecněná parametrická transformace iterativní hledání parametru λ (lambda), pro které je rozdělení transformované proměnné nejblíže normálnímu rozdělení používá se v případě, že nemáme a priori představu, jakou transformaci použít Neparametrické metody transformace např. metoda Omnibus pro ordinální data Legendre & Legendre 1998 25

MAJÍ DATA NORMÁLNÍ ROZDĚLENÍ? GRAFICKÁ ANALÝZA Histogram s křivkou normálního rozdělení Počet pozorování 35 30 25 20 15 10 5 0-10 0 10 20 30 40 50 60 70 80 Soil depth vizuální zhodnocení normality dat možno otestovat Kolmogorov-Smirnov testem Q-Q diagram (Quantile-Quantile plot) Oček. normál. hodnoty 3 2 1 0-1 -2-3 -10 0 10 20 30 40 50 60 70 Pozorovaný kvantil porovnání rozdělení dvou proměnných, vynáší proti sobě kvantily jednotlivých proměnných jedna proměnná může být teoretická distribuce (v tomto případě normální rozdělení, kdy se vychází z kumulativní distribuční funkce) na stejném principu pracuje Shapiro-Wilk test 26

Theoretical quantiles -3-2 -1 0 1 2 3 Theoretical quantiles -3-2 -1 0 1 2 3 Theoretical quantiles -3-2 -1 0 1 2 3 Frequency 0 50 100 150 200 Frequency 0 100 200 300 400 500 600 Frequency 0 50 100 150 200 MAJÍ DATA NORMÁLNÍ ROZDĚLENÍ? GRAFICKÁ ANALÝZA normální rozdělení pozitivně zešikmené negativně zešikmené -3-2 -1 0 1 2 3 variable 0 2 4 6 8 10 12 variable -8-6 -4-2 0 2 variable -3-2 -1 0 1 2 3 Sample quantiles 0 5 10 15 20 Sample quantiles -5-4 -3-2 -1 0 1 Sample quantiles 27

Soil ph 6.0 6.5 7.0 7.5 8.0 Soil ph 6.0 6.5 7.0 7.5 8.0 Frequency 0 5 10 15 20 Frequency 0 5 10 15 20 BIMODÁLNÍ DATA transformace nepomůže, možnost rozdělit na dva podsoubory 6.0 6.5 7.0 7.5 8.0 Soil ph 6.0 6.5 7.0 7.5 8.0 Soil ph 28 600 650 700 750 800 850 900 950 Annual precipitation [mm] 600 650 700 750 800 850 900 950 Annual precipitation [mm]

PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY Centrování výsledná proměnná má průměr roven nule Y i * = Y i průměr (Y) Standardizace v úzkém slova smyslu STANDARDIZACE PROMĚNNÝCH výsledná proměnná má průměr roven nule a směrodatnou odchylku rovnu jedné synchronizuje proměnné měřené v různých jednotkách a na různých stupnicích Y i * = (Y i průměr (Y)) / směrodatná odchylka (Y) Změna rozsahu hodnot (ranging) výsledná proměnná je v rozsahu 0 až 1 Y i * = Y i / Y max nebo Y i * = (Y i Y min ) / (Y max Y min ) 29

PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY STANDARDIZACE MATICE SPOLEČENSTVA Standardizace v případě matice společenstva (vzorky x druhy) standardizace po druzích (by species) dává velkou váhu vzácným druhům ne vždy smysluplná (pokud se druh vyskytuje vzácně v jednom snímku, standardizace po druzích dá tomuto snímku velkou váhu) standardizace po vzorcích (by samples) pokud je analýza zaměřená na relativní proporce mezi druhy, ne jejich absolutní abundance vhodné v případě, že výsledné abundance závisí na důkladnosti, s jakou sbíráme data (např. při odchytu živočichů doba strávená na ploše nebo počet pastí) 30

PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY TRANSFORMACE matematická funkce, jejíž argumenty nejsou odvozené z dat, na která je transformace aplikovaná (data independent) nejčastější důvod je změnit tvar rozložení proměnné, případně zajistit homoskedasticitu STANDARDIZACE mění data pomocí statistiky, která je spočtená na datech samotných, např. průměr, součet, rozsah aj. (data dependent) nejčastější důvod použití je vyrovnat rozdíly v relativním významu (váze) jednotlivých ekologických proměnných, druhů nebo vzorků ve své podstatě je to další typ transformace 31

PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY KÓDOVÁNÍ DAT (DATA CODING) např. nahrazení kódů u alfa-numerických stupnic, např. Braun-Blanquetovy stupnice dominance-abundance Br.-Bl.: r + 1 2 3 4 5 ordinální hodnoty: 1 2 3 4 5 6 7 střední hodnoty procent: 1 2 3 15 38 63 88 32

PŘÍPRAVA DAT PRO NUMERICKÉ ANALÝZY KÓDOVÁNÍ DAT (DATA CODING) Dummy variables metoda, jak převést kvalitativní (kategoriální) proměnnou na kvantitativní (binární) proměnné použitelné v analýzách pokud má kategoriální proměnná n stavů (hodnot), pro její vyjádření stačí n-1 dummy proměnných (jedna z proměnných je vždy lineárně závislá na ostatních) hodnoty dummy proměnné KAMB LITO RANK FLUVI kambizem 1 0 0 0 litozem 0 1 0 0 ranker 0 0 1 0 fluvizem 0 0 0 1 33

SOUBORY S VELKÝM POČTEM NUL (ANEB VÝZNAM NULY V EKOLOGII) dva možné významy nuly: 1. hodnota může být ve skutečnosti nenulová, ale díky našim možnostem měření jsme ji naměřili jako nulovou (například koncentrace látky v roztoku) 2. hodnota je skutečná nula například absence druhu data obsahující pravé nuly obsahují dva typy informace: 1. druh chybí nebo je přítomen? 2. pokud je druh přítomen, jaká je jeho abundance? v datech obsahujících velké množství pravých nul je většina informace prvního typu problém pravých nul při logaritmické transformaci soubor s velkým počtem pravých nul není vhodné logaritmicky transformovat (přičítat k nim konstantu c), ale lépe ji nahradit binární proměnnou (prezence-absence) 34

DESIGN EKOLOGICKÝCH EXPERIMENTŮ To call in the statistician after the experiment is done may be no more than asking him to perform a post mortem examination: he may be able to say what the experiment died of. Sir Ronald Fisher, Indian Statistical Congress, Sankhya 1939

ZÁKLADNÍ OTÁZKA: CO CHCI EXPERIMENTEM ZJISTIT? Jaká je variabilita proměnné Y v čase nebo prostoru? pattern description nejčastější otázka v ekologických observačních studiích Má faktor X vliv na proměnnou Y? hypothesis testing, otázka pro manipulativní experiment může platit i pro některé přírodní experimenty, ale výsledky těchto testů jsou podstatně slabší (nemáme kontrolu nad vlivem ostatních faktorů, které mohou výsledky ovlivnit) Chová se proměnná Y tak, jak předpovídá hypotéza H? klasická konfrontace mezi teorií a reálnými daty platí pro data získaná jak manipulativním tak přírodním experimentem ne vždy je snadné najít správnou hypotézu Jaký model nejlépe vystihuje vztah mezi faktorem X a proměnnou Y? experimentem sbíráme podklady pro matematické modelování 36

MANIPULATIVNÍ VS PŘÍRODNÍ EXPERIMENTY Manipulativní experimenty uměle manipulujeme vysvětlující proměnnou (X) a sledujeme reakci vysvětlované proměnné (Y) umožňuje přímé testování hypotéz známe směr vztahu mezi příčinou a důsledkem - kauzalita Přírodní experimenty (pozorování, observační studie) vysvětlující proměnnou manipuluje sama příroda slouží spíše ke generování než testování hypotéz neznáme směr vztahu mezi příčinou a důsledkem - korelace 37

MANIPULATIVNÍ VS PŘÍRODNÍ EXPERIMENTY SROVNÁNÍ TESTOVANÝCH HYPOTÉZ Příklad: na ostrovech v Karibiku sledujeme vztah mezi počtem ještěrek na určité ploše a počtem pavouků (Gotelli & Ellison 2004) Manipulativní experiment Provedení: v jednotlivých plochách (klecích) je uměle ovlivněn počet ještěrek a sledováno množství pavouků Nulová hypotéza: počet ještěrek nemá vliv na počet pavouků v klecích Alternativní hypotéza: se vzrůstající hustotou ještěrek klesá počet pavouků (ještěrky žerou pavouky) 38

MANIPULATIVNÍ VS PŘÍRODNÍ EXPERIMENTY Přírodní experiment (pozorování, observační studie) Provedení: SROVNÁNÍ TESTOVANÝCH HYPOTÉZ na vybraných plochách je sledován počet ještěrek a počet pavouků Možné hypotézy: 1. počet ještěrek (negativně) ovlivňuje počet pavouků (ještěrky žerou pavouky) 2. počet pavouků má vliv na počet ještěrek (draví pavouci napadají mláďata ještěrek) 3. počet ještěrek i pavouků je ovlivňován neměřeným faktorem prostředí (třeba vlhkostí) 4. některý faktor prostředí ovlivňuje sílu vztahu mezi ještěrkami a pavouky (třeba zase vlhkost) 39

závisle proměnná závisle proměnná MANIPULATIVNÍ EXPERIMENT PRESS VS PULSE EXPERIMENT Press experiment (experiment pod stálým tlakem ) zásah je proveden na začátku experimentu a pak znovu v pravidelných intervalech měří resistenci systému na experimentální zásah jak je systém (společenstvo) schopné odolávat, případně se přizpůsobit změnám v podmínkách prostředí Pulse experiment (pulzní experiment, jednou a dost ) zásah je proveden jen jednou, obvykle na začátku experimentu měří resilienci systému jak pružně je systém (společenstvo) schopné reagovat na experimentální zásah čas čas 40

PŘÍRODNÍ EXPERIMENT (POZOROVÁNÍ) SNAPSHOT VS TRAJECTORY EXPERIMENT Snapshot experiment (momentka) opakuje se v prostoru, ale ne v čase sběr vzorků provedu na několika (mnoha) lokalitách v relativně krátkém čase (týden, sezóna, dva roky sběru dat pro diplomku...) představuje většinu přírodních experimentů v ekologii zahrnuje i sukcesní studie, kdy sledujeme zároveň různá sukcesní stadia Trajectory experiment (sledujeme trajektorii procesu v čase) opakuje se v čase (a případně i v prostoru) sběr vzorků se na daných (většinou pevně vymezených plochách) opakuje několikrát za sebou sukcesní studie prováděné několik let, trvalé plochy v lesních porostech opakovaně měřené jednou za x let 41

MANIPULATIVNÍ EXPERIMENT ZÁKLADNÍ TYPY ROZMÍSTĚNÍ PLOCH kompletně znáhodněný design nebere v úvahu heterogenitu prostředí ne vždy je nejvhodnější znáhodněné bloky vlastní bloky jsou vnitřně homogenní (pokud možno) počet bloků = počet opakování bloky jsou umístěné podle gradientu prostředí v každém bloku je právě jedna replikace každého zásahu gradient prostředí 42

MANIPULATIVNÍ EXPERIMENT ZÁKLADNÍ TYPY ROZMÍSTĚNÍ PLOCH latinský čtverec předpokládá přítomnost dvou gradientů v prostředí každý sloupec a každý řádek obsahuje právě jednu variantu zásahu možno použít i několik latinských čtverců gradient 1 gradient 2 43

MANIPULATIVNÍ EXPERIMENT NEJČASTĚJŠÍ CHYBY pseudoreplikace testovat lze jen rozdíly v průměrech jednotlivých bloků plochy se stejným zásahem jsou umístěny blízko sebe, a mají proto větší pravděpodobnost, že si budou podobné i bez vlivu vlastního zásahu neúplně znáhodněný design v podstatě pseudoreplikace, jen méně zřejmá gradient prostředí gradient prostředí 44

gradient prostředí gradient prostředí gradient prostředí MANIPULATIVNÍ EXPERIMENT NEJČASTĚJŠÍ CHYBY design se znáhodněnými bloky špatná orientace bloků správně špatně špatně 45

MANIPULATIVNÍ EXPERIMENT S VÍCE NEŽ JEDNÍM TYPEM ZÁSAHU faktoriální design každá hladina prvního faktoru je kombinovaná s každou hladinou druhého faktoru (případně třetího atd.) například kombinace koseno vs nekoseno hnojeno vs nehnojeno jednotlivé kombinace mohou být rozmístěny v prostoru např. v rámci latinského čtverce ano ne koseno hnojeno 46

MANIPULATIVNÍ EXPERIMENT S VÍCE NEŽ JEDNÍM TYPEM ZÁSAHU split-plot design faktory jsou strukturovány hierarchicky (nested) například plochy hnojené různými hnojivy (C, N, P) v rámci bloků umístěných na vápenci (modrá) a žule (červená barva) N N P C C P N C P C P N P P N C C N 47

letecký pohled plán zásahů MANIPULATIVNÍ EXPERIMENTY PŘÍPADOVÉ STUDIE ROTHAMSTED (ENGLAND) PARK GRASSLAND EXPERIMENT (ZALOŽEN 1843) 48 Silvertown et al. (2006) J.Ecol.

MANIPULATIVNÍ EXPERIMENTY PŘÍPADOVÉ STUDIE ROTHAMSTED (ENGLAND) PARK GRASSLAND EXP. 49 Třídění bylinné biomasy do druhů (kolem roku 1930) (http://www.rothamsted.ac.uk)

MANIPULATIVNÍ EXPERIMENTY PŘÍPADOVÉ STUDIE KOMPETICE O SVĚTLO V EXPERIMENTÁLNÍM PROSTŘEDÍ Při vyšším přísunu živin rostou rostliny rychleji a začnou si konkurovat o světlo tak proč jim trochu nepřisvítit? Hautier et al. (2009) Science 324: 636-638 50

MANIPULATIVNÍ EXPERIMENTY PŘÍPADOVÉ STUDIE STANOVENÍ POTENCIÁLNÍ STANOVIŠTNÍ PRODUKTIVITY V DOUBRAVÁCH PĚSTOVÁNÍM ŘEDKVIČEK VE SKLENÍKU 51 Veselá et. al (2008): Bioassay experiment for assessment of site productivity in oak forests. - 17th International Workshop European Vegetation Survey, Brno, Czech Republic, 1-4. 5. 2008.

MANIPULATIVNÍ EXPERIMENTY PŘÍPADOVÉ STUDIE VLIV HERBIVORNÍCH RYB NA DRUHOVÉ SLOŽENÍ KORÁLOVÝCH ÚTESŮ hustá klec zabrání všem rybám na začátku experimentu... řídká klec zabrání jen velkým rybám... a po čtyřech měsících pod klecí Atol Agatti (Lakedivy, Indie) Autor: Nicole Černohorská (v rámci vypracování její disertační práce na zoologii) 52

detailní pohled na korálový útes s nárostem řas (autor: Nicole Černohorská) 53

PŘÍRODNÍ EXPERIMENT (OBSERVAČNÍ STUDIE) Preferenční ROZMÍSTĚNÍ VZORKOVACÍCH PLOCH 54

PŘÍRODNÍ EXPERIMENT (OBSERVAČNÍ STUDIE) ROZMÍSTĚNÍ VZORKOVACÍCH PLOCH Systematické rozmístění v síti (lattice) 55

PŘÍRODNÍ EXPERIMENT (OBSERVAČNÍ STUDIE) ROZMÍSTĚNÍ VZORKOVACÍCH PLOCH Systematické rozmístění v síti (grid) 56

PŘÍRODNÍ EXPERIMENT (OBSERVAČNÍ STUDIE) ROZMÍSTĚNÍ VZORKOVACÍCH PLOCH Systematické rozmístění na transektu 57

PŘÍRODNÍ EXPERIMENT (OBSERVAČNÍ STUDIE) ROZMÍSTĚNÍ VZORKOVACÍCH PLOCH Náhodné rozmístění 58

PŘÍRODNÍ EXPERIMENT (OBSERVAČNÍ STUDIE) ROZMÍSTĚNÍ VZORKOVACÍCH PLOCH Preferenční rozmístění statistické hledisko: snímky nejsou náhodným výběrem, což limituje jejich použití při statistických analýzách (Lajer 2007, Folia Geobotanica) hledisko vegetačního ekologa: popisují maximální variabilitu vegetace praktické důsledky: snímky bývají druhově bohatší, obsahují větší počet diagnostických nebo vzácných druhů Náhodné (a systematické) rozmístění statistické hledisko: snímky jsou náhodným výběrem v reálném prostoru (ne ale v ekologickém hyperprostoru) hledisko veg. ekologa: nezachytí celou variabilitu vegetace - chybí maloplošné a vzácné vegetační typy, převládají velkoplošné a běžné typy, zahrnují řadu špatně klasifikovatelných vegetačních přechodů praktické důsledky: snímky odrážejí reálnou strukturu a bohatost vegetace v krajině, ale metoda je neúměrně pracná 59

PŘÍRODNÍ EXPERIMENT (OBSERVAČNÍ STUDIE) ROZMÍSTĚNÍ VZORKOVACÍCH PLOCH Stratifikované náhodné rozmístění 60

STRATIFIKACE KRAJINY V GIS Teplota Srážky Půdní typy Stratifikované jednotky Austin et al. 2000 61

PROBLÉM PROSTOROVÉ AUTOKORELACE bližší plochy jsou si podobnější 62

PROBLÉM PROSTOROVÉ AUTOKORELACE Transekty podél nadmořské výšky prostorově neautokorelované (každý transekt na různé hoře) prostorově autokorelované (paralelně vedle sebe na jedné hoře) 63

PROBLÉM PROSTOROVÉ ŠKÁLY (SCALE OF THE STUDY) zrno (grain size) velikost nejmenší studované jednotky, zpravidla vzorkované plochy rozsah (extent) velikost studovaného území interval vzdálenost mezi vzorkovanými plochami Legendre & Legendre (1998) 65

PROBLÉM PROSTOROVÉ ŠKÁLY (SCALE OF THE STUDY) velikost zrna (plochy, vzorku) je daná vlastnostmi a velikostí studovaných objektů různý prostorový rozsah zachycení různých ekologických procesů, vliv různých ekologických faktorů platí pravidlo, že studie malého rozsahu jsou hůře zobecnitelné Legendre & Legendre (1998) 66

TVAR PLOCHY čtvercová obdélníková kruhová čtverec obdélník kruh celková plocha 100 m 2 100 m 2 100 m 2 rozměr tvaru 10 10 m 20 5 m poloměr 5,64 m obvod 40 m 50 m ~ 35 m 67

TVAR PLOCHY Whittaker Stohlgren Keeley & Fotheringham (2005) J.Veg.Sci. Kunin 68

gradient prostředí VLIV TVARU A ORIENTACE PLOCHY NA ZAZNAMENANOU DRUHOVOU BOHATOST obdélníkové plochy mohou mít vyšší druhovou bohatost než čtvercové plochy (o stejné ploše) 69 Stohlgren et al. (1995) Vegetatio 117:113-121; Condit et al. (1996) J.Ecol. 84: 549-562; Keeley & Fotheringham (2005) J.Veg.Sci. 16: 249-256.

VELIKOST PLOCHY STUDIUM VEGETACE NA VÍCE MĚŘÍTCÍCH SOUČASNĚ 70

VELIKOST PLOCHY STUDIUM VEGETACE NA VÍCE MĚŘÍTCÍCH SOUČASNĚ Vztah mezi velikostí snímku a počtem druhů ve snímku bělokarpatské louky ve srovnání s jinými typy travinné vegetace Jongepierová [ed.](2008): Louky Bílých Karpat. 71