EKOLOGICKÁ PODOBNOST (ECOLOGICAL RESEMBLANCE) David Zelený Zpracování dat v ekologii společenstev

Podobné dokumenty
ZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV

PCA BIPLOT ŠKÁLOVÁNÍ OS (1)

INDEXY DIVERZITY. David Zelený Zpracování dat v ekologii společenstev

PŘÍKLADY POUŽITÍ ORDINAČNÍCH METOD

Vícerozměrné statistické metody

ZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV

INDEXY DIVERZITY. David Zelený Zpracování dat v ekologii společenstev

ZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV

ZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV

NUMERICKÁ KLASIFIKACE. David Zelený Zpracování dat v ekologii společenstev

ZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV

DIVERZITA. David Zelený Zpracování dat v ekologii společenstev

Vícerozměrné statistické metody

STATISTICKÉ METODY; ZÍSKÁVÁNÍ INFORMACÍ Z DRUHOVÝCH A ENVIRONMENTÁLNÍCH DAT

David Zelený GRADIENTOVÁ ANALÝZA

ELLENBERGOVY INDIKAČNÍ HODNOTY. David Zelený Zpracování dat v ekologii společenstev

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

ELLENBERGOVY INDIKAČNÍ HODNOTY. David Zelený Zpracování dat v ekologii společenstev

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

REGRESE VS KALIBRACE. David Zelený Zpracování dat v ekologii společenstev

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Neparametrické metody

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Úvodem Dříve les než stromy 3 Operace s maticemi

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy

Fakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody

6. Lineární regresní modely

PSY117/454 Statistická analýza dat v psychologii Přednáška 10

STATISTICKÉ ZJIŠŤOVÁNÍ

F p Test. statistika p 13,9 <,001 Muž 249 <,001 Žena 281 <,001. T test t df p Průměrný rozdíl 5, ,48 <,001 4,56

Pearsonův korelační koeficient

Výhody a nevýhody jednotlivých reprezentací jsou shrnuty na konci kapitoly.

Cílem této kapitoly je uvedení pojmu matice a jejich speciálních typů. Čtenář se seznámí se základními vlastnostmi matic a s operacemi s maticemi

Vícerozměrné metody. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Schematický úvod

Tomáš Karel LS 2012/2013

různé typy přehledových studií integrativní typ snaha o zobecnění výsledků z množství studií

Vyhodnocení průměrných denních analýz kalcinátu ananasového typu. ( Metoda hlavních komponent )

Měření závislosti statistických dat

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Metody sociálních výzkumů. Velmi skromný úvod do statistiky. Motto: Jsou tři druhy lži-lež prostá, lež odsouzeníhodná a statistika.

4 Kriteriální matice a hodnocení variant

MĚŘENÍ, TYPY VELIČIN a TYPY ŠKÁL

Vektory a matice. Obsah. Aplikovaná matematika I. Carl Friedrich Gauss. Základní pojmy a operace

NADSTAVBOVÝ MODUL MOHSA V1

Testy statistických hypotéz

Analýza dat na PC I.

Testování statistických hypotéz

Náhodné vektory a matice

Induktivní statistika. z-skóry pravděpodobnost

KGG/STG Statistika pro geografy

Vektorový prostor. d) Ke každému prvku u V n existuje tzv. opačný prvek u, pro který platí, že u + u = o (vektor u nazýváme opačný vektor k vektoru u)

Shluková analýza. Jiří Militky. Analýza experimentálních dat V. Červeně označené slide jsou jen pro doplnění informací a nezkouší se.

Cvičná bakalářská zkouška, 1. varianta

Shluková analýza dat a stanovení počtu shluků

Neparametrické testy

Regresní a korelační analýza

3.4 Určení vnitřní struktury analýzou vícerozměrných dat

2D transformací. červen Odvození transformačního klíče vybraných 2D transformací Metody vyrovnání... 2

Vícerozměrná analýza dat

Psaní na mokrý papír. Andrew Kozlik KA MFF UK

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )

Problémy konstrukce a implementace modelů strukturální analýzy

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

AVDAT Mnohorozměrné metody metody redukce dimenze

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

INDUKTIVNÍ STATISTIKA

Intervalové Odhady Parametrů II Testování Hypotéz

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

Metody analýzy dat II

Příloha č. 1 Grafy a protokoly výstupy z adstatu

4 STATISTICKÁ ANALÝZA VÍCEROZMĚRNÝCH DAT

Statistická analýza jednorozměrných dat

Regresní a korelační analýza

Cvičení ze statistiky - 3. Filip Děchtěrenko

SPECIES ATTRIBUTES IN ANALYSIS OF COMMUNITY ECOLOGY DATA

Rozšířené regulační diagramy

Testování hypotéz o parametrech regresního modelu

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Nám. Čs. Legií 565, Pardubice

NIKA A KOEXISTENCE. Populační ekologie živočichů

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Metody výběru variant

Univerzita Pardubice 8. licenční studium chemometrie

Teorie informace a kódování (KMI/TIK) Reed-Mullerovy kódy

Vícerozměrné statistické metody

Ordinační analýzy v programu JUICE

Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů

Rozhodovací procesy 8

Lineární algebra - I. část (vektory, matice a jejich využití)

4EK211 Základy ekonometrie

Q-diagramy. Jiří Michálek ÚTIA AVČR

Hluboká říční údolí jako objekt pro modelování vztahů vegetace a proměnných prostředí?

S E M E S T R Á L N Í

Popisná statistika. Statistika pro sociology

5. Odhady parametrů. KGG/STG Zimní semestr

( ) Jako základ mocnin nemusíme používat jen 10. Pokud není jasné, že číslo je uvedeno v desítkové soustavě, píšeme jej takto: ( ) 10

Transkript:

EKOLOGICKÁ PODOBNOST (ECOLOGICAL RESEMBLANCE)

EKOLOGICKÁ PODOBNOST Q VS R ANALÝZA Vzorky Druhy druh 1 druh 2 druh 3 vzorek 1 0 1 1 vzorek 2 1 0 0 vzorek 3 0 4 4 vztahy mezi vzorky Q analýza vztahy mezi druhy (nebo obecně mezi deskriptory) R analýza 68

PODOBNOSTI X VZDÁLENOSTI (Q ANALÝZA) Indexy podobnosti slouží k vyjádření podobnosti mezi vzorky, ne k jejich umístění do mnohorozměrného prostoru (například ordinace) nejnižší hodnota 0 vzorky nesdílejí žádný druh nejvyšší hodnota (1 nebo jiná) vzorky jsou identické Vzdálenosti mezi vzorky slouží k umístění vzorků v mnohorozměrném prostoru nejnižší hodnota 0 vzorky jsou identické (ve stejné lokaci) hodnota se zvyšuje se zvyšující se nepodobností mezi vzorky 69

INDEXY PODOBNOSTI kvalitativní vs kvantitativní kvalitativní pro presenčně-absenční data kvantitativní pro data vyjadřující abundance, počty aj. symetrické vs asymetrické dvojité nepřítomnosti ( double-zero ) počet druhů, které chybí zároveň v obou vzorcích, v kontrastu s počtem druhů které se vyskytují zároveň v obou vzorcích symetrické dvojité nepřítomnosti hodnotí stejně jako dvojité přítomnosti (totiž že vyjadřují podobnost mezi vzorky); v ekologii se prakticky nepoužívají asymetrické dvojité nepřítomnosti ignorují; nejčastější typ indexů podobnosti v ekologii 70

PROBLÉM DVOJITÝCH NEPŘÍTOMNOSTÍ (DOUBLE-ZEROS) Fakt, že druh chybí zároveň v obou snímcích, může mít několik významů: vzorky leží mimo ekologickou niku druhu nemůžeme ale říct, jestli oba vzorky leží na stejné straně ekologického gradientu mimo druhovou niku (a jsou si tedy docela podobné) nebo na stranách opačných (a jsou pak úplně odlišné) vzorky leží uvnitř ekologické niky druhy, ale druh se ve vzorku nevyskytuje, protože se tam nedostal (dispersal limitation) jsme ho přehlédli a nezaznamenali (sampling bias) nachází se právě v dormantním stadiu a není proto vidět (jednoletky, geofyty) 71

vlhkomilný druh 1 vlhkomilný druh 2 mezický druh 1 mezický druh 2 suchomilný druh 1 suchomilný druh 2 PROBLÉM DVOJITÝCH NEPŘÍTOMNOSTÍ (DOUBLE-ZEROS) snímek 1 1 1 0 0 0 0 snímek 2 0 1 1 1 1 0 snímek 3 0 0 0 0 1 1 snímky 1 až 3 jsou seřazeny podle vlhkosti stanoviště snímek 1 je nejvlhčí, snímek 3 nejsušší snímek 1 a 3 neobsahují ani jeden mezický druh snímek 1 je pro tyto druhy příliš vlhký, snímek 3 příliš suchý symetrické indexy podobnosti: dvojitá nepřítomnost mezických druhů bude zvyšovat podobnost snímků 1 a 3 asymetrické indexy: dvojité nepřítomnosti jsou ignorovány 72

INDEXY PODOBNOSTI PRO KVALITATIVNÍ DATA druh je ve vzorku č. 1 a počet druhů přítomných v obou vzorcích b, c počet druhů přítomných jen v jednom vzorku přítomen d počet druhů, které chybí v obou vzorcích ( double zeros ) nepřítomen ve vzorku č. 2 přítomen a b Pokud nebereme v úvahu druhy nepřítomné v obou vzorcích (d), lze zobrazit i pomocí Vennova diagramu nepřítomen c d c a b 73 vzorek č. 1 vzorek č. 2

INDEXY PODOBNOSTI PRO KVALITATIVNÍ DATA Jaccardův koeficient J = a / (a + b + c) Sørensenův koeficient S = 2a / (2a + b + c) přítomnosti druhu v obou vzorcích (a) přisuzuje dvojnásobnou váhu Simpsonův koeficient Si = a / [a + min (b,c)] vhodný pro vzorky velmi odlišné počtem druhů c a b 74 vzorek č. 1 vzorek č. 2

INDEXY PODOBNOSTI PRO KVANTITATIVNÍ DATA např. zobecněný Sørensenův koeficient (procentická podobnost, percentage similarity) PS = [2 Σ min (x i, y i )] / Σ (x i + y i ) x i, y i... kvantita i-tého druhu ve srovnávaných vzorcích má rozsah od 0 do 1 pro presenčně absenční data přechází v 2a / (2a + b + c) velmi vhodný pro ekologická data percentage dissimilarity (PD, Bray-Curtis index) = 1 PS 75

VZDÁLENOSTI MEZI VZORKY (DISTANCE MEASURES) všechny indexy podobnosti (kvalitativní i kvantitativní) lze převést na distance D = 1 S, nebo D = (1 S) kde D je vzdálenost (distance) a S je podobnost (similarity) odmocninový převod se používá například pro Sørensenův koeficient neplatí obráceně (ne všechny vzdálenosti se dají převést na podobnosti např. Euklidovská vzdálenost) 76

VZDÁLENOSTI MEZI VZORKY (DISTANCE MEASURES) Euklidovská vzdálenost (Euclidean distance) ED = Σ (x i y i ) 2 rozsah: od 0 (identické vzorky), horní mez není dána rozsah hodnot výrazně záleží na použitých jednotkách míra citlivá na odlehlé body - nevhodná pro ekologická data Tětivová vzdálenost (chord distance, relativized Euclidean distance) Euklidovská vzdálenost použitá na datech standardizovaných přes vzorky (by sample norm) rozsah: od 0 (identické vzorky) do 2 (vzorky nesdílí žádný druh) Chi-kvadrát vzdálenost (chi-square distance) málokdy se používá přímo na výpočet vzdálenosti mezi vzorky vyjadřuje vzdálenost mezi vzorky v unimodálních ordinačních metodách (např. v korespondenční analýze, CA) 77

EUKLIDOVSKÁ VZDÁLENOST PARADOX může se stát, že dva vzorky, které sdílí některé druhy (vzorky 1 a 3), budou mít větší vzdálenost než dva vzorky, které nesdílí ani jeden druh (vzorky 1 a 2) Vzorky Druhy druh 1 druh 2 druh 3 vzorek 1 0 1 1 vzorek 2 1 0 0 vzorek 3 0 4 4 1,732 4,243 Eucl (vzorek 1, vzorek 2) = (0-1) 2 + (1-0) 2 + (1-0) 2 = 1,732 Eucl (vzorek 1, vzorek 3) = (0-0) 2 + (1-4) 2 + (1-4) 2 = 4,243 78

INDEXY PODOBNOSTI MEZI DRUHY (R ANALÝZA) V kolika vzorcích je... druh č. 1 přítomen nepřítomen druh č. 2 přítomen a b nepřítomen c d Diceův index Dice = 2a / (2a + b + c) stejný jako Sørensenův index pro podobnost mezi vzorky uveden dříve než Sørensen (Dice 1945 vs Sørensen 1948) Pearsonův korelační koeficient r není vhodný pro data s velkým počtem nul, ani po transformaci 79

MATICE PODOBNOSTÍ (VZDÁLENOSTÍ) MEZI VZORKY (NEBO DRUHY) je symetrická (podobnost mezi 2. a 3. snímkem = podobnost mezi 3. a 2. snímkem) diagonála obsahuje pouze nuly (matice vzdáleností) nebo pouze jedničky (matice podobností) 1 2 3 4 5 6 7 8 9 10 1 0 12.37 11.70 17.92 13.86 10.58 11.92 10.54 13.82 15.59 2 12.37 0 11.14 13.34 16.58 13.96 9.64 13.56 13.64 13.42 3 11.70 11.14 0 14.42 16.16 11.53 10.34 13.71 14.90 13.78 4 17.92 13.34 14.42 0 18.36 15.78 9.64 17.03 14.42 7.48 5 13.86 16.58 16.16 18.36 0 13.71 14.49 9.00 14.04 15.46 6 10.58 13.96 11.53 15.78 13.71 0 11.31 11.87 10.54 12.85 7 11.92 9.64 10.34 9.64 14.49 11.31 0 13.82 12.77 9.43 8 10.54 13.56 13.71 17.03 9.00 11.87 13.82 0 10.95 14.35 9 13.82 13.64 14.90 14.42 14.04 10.54 12.77 10.95 0 10.39 10 15.59 13.42 13.78 7.48 15.46 12.85 9.43 14.35 10.39 0 matice Euklidovských vzdáleností mezi 10 vzorky 80

vzorky Zastoupení nul v matici [%] 97.0 97.5 98.0 98.5 99.0 MATICE VZORKY DRUHY V EKOLOGII SPOLEČENSTEV (SPARSE MATRIX, ŘÍDKÁ MATICE) více než 90% hodnot tvoří nuly, u velkých souborů až 99% 100 2000 4000 6000 8000 Počet vegetačních snímků v matici 81 druhy