STATISTICKÉ METODY; ZÍSKÁVÁNÍ INFORMACÍ Z DRUHOVÝCH A ENVIRONMENTÁLNÍCH DAT

Podobné dokumenty
STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Úvodem Dříve les než stromy 3 Operace s maticemi

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Tomáš Karel LS 2012/2013

PŘÍKLADY POUŽITÍ ORDINAČNÍCH METOD

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Vícerozměrné statistické metody

Korelační a regresní analýza

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

6. Lineární regresní modely

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

ZPRACOVÁNÍ DAT V EKOLOGII

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy

Inovace bakalářského studijního oboru Aplikovaná chemie

Statistická analýza jednorozměrných dat

Ing. Michael Rost, Ph.D.

PCA BIPLOT ŠKÁLOVÁNÍ OS (1)

4EK211 Základy ekonometrie

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

Lineární regrese. Komentované řešení pomocí MS Excel

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy

Regresní analýza 1. Regresní analýza

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

INDUKTIVNÍ STATISTIKA

KORELACE. Komentované řešení pomocí programu Statistica

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

Testování hypotéz a měření asociace mezi proměnnými

Tomáš Karel LS 2012/2013

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

Plánování experimentu

You created this PDF from an application that is not licensed to print to novapdf printer (

Odhady parametrů základního souboru. Cvičení 6 Statistické metody a zpracování dat 1 (podzim 2016) Brno, říjen listopad 2016 Ambrožová Klára

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

Aplikovaná statistika v R - cvičení 2

Popisná statistika. Statistika pro sociology

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Metody sociálních výzkumů. Velmi skromný úvod do statistiky. Motto: Jsou tři druhy lži-lež prostá, lež odsouzeníhodná a statistika.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

ZX510 Pokročilé statistické metody geografického výzkumu. Téma: Měření síly asociace mezi proměnnými (korelační analýza)

Aplikovaná statistika v R - cvičení 3

Cvičení 12: Binární logistická regrese

Porovnání dvou výběrů

Příklad 2: Obsah PCB v játrech zemřelých lidí. Zadání: Data: Program:

3.4 Určení vnitřní struktury analýzou vícerozměrných dat

POLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými.

Tomáš Karel LS 2012/2013

Korelace. Komentované řešení pomocí MS Excel

Statistické testování hypotéz II

Nadstavba pro statistické výpočty Statistics ToolBox obsahuje více než 200 m-souborů které podporují výpočty v následujících oblastech.

Statistická analýza jednorozměrných dat

STATISTIKA VĚDA O USUZOVÁNÍ NA ZÁKLADĚ DAT. Patrícia Martinková Ústav informatiky AV ČR

LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

4. Zpracování číselných dat

Statistické zpracování naměřených experimentálních dat za rok 2012

Téma 9: Vícenásobná regrese

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA Sylabus pro předmět STATISTIKA Pomůcky... 7

Pokročilé neparametrické metody. Klára Kubošová

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

S E M E S T R Á L N Í

2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat

Vícerozměrné statistické metody

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

4EK211 Základy ekonometrie

Hledání optimální polohy stanic a zastávek na tratích regionálního významu

ELLENBERGOVY INDIKAČNÍ HODNOTY. David Zelený Zpracování dat v ekologii společenstev

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

Stručný úvod do vybraných zredukovaných základů statistické analýzy dat

Analýza rozptylu. opakovaná měření faktoriální analýza rozptylu analýza kovariance vícerozměrná analýza rozptylu

Zobecněná analýza rozptylu, více faktorů a proměnných

Analýza dat na PC I.

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

Regresní analýza. Eva Jarošová

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Měření závislosti statistických dat

přesné jako tabulky, ale rychle a lépe mohou poskytnou názornou představu o důležitých tendencích a souvislostech.

Regresní a korelační analýza

Tématické okruhy pro státní závěrečné zkoušky. magisterské studium

Cronbachův koeficient α nová adaptovaná metoda uvedení vlastností položkové analýzy deskriptivní induktivní parametrické

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

STATISTIKA I Metodický list č. 1 Název tématického celku:

23. Matematická statistika

Návrh a vyhodnocení experimentu

Úvod do kurzu. Moodle kurz. (a) (b) heslo pro hosty: statistika (c) skripta na pravděpodobnost

StatSoft Jak poznat vliv faktorů vizuálně

Design of Experiment (DOE) Petr Misák. Brno 2017

PRAVDĚPODOBNOST A STATISTIKA 1 Metodický list č 1.

Pozn. přeskakuji zde popisnou statistiku, jinak by měla být součástí každé analýzy.

Transkript:

STATISTICKÉ METODY; ZÍSKÁVÁNÍ INFORMACÍ Z DRUHOVÝCH A ENVIRONMENTÁLNÍCH DAT

(NE)VÝHODY STATISTIKY OTÁZKY si klást ještě před odběrem a podle nich naplánovat design, metodiku odběru (experimentální vs. pozorování), analýzy, grafy a testy.

(NE)VÝHODY STATISTIKY OTÁZKY si klást ještě před odběrem a podle nich naplánovat design, metodiku odběru (experimentální vs. pozorování), analýzy, grafy a testy. Je důležité, aby se srovnávaly porovnatelné OBJEKTY (tj. takové, které se liší pouze, nebo hlavně studovaným jevem a v ostatních parametrech jsou si podobné).

(NE)VÝHODY STATISTIKY OTÁZKY si klást ještě před odběrem a podle nich naplánovat design, metodiku odběru (experimentální vs. pozorování), analýzy, grafy a testy. Je důležité, aby se srovnávaly porovnatelné OBJEKTY (tj. takové, které se liší pouze, nebo hlavně studovaným jevem a v ostatních parametrech jsou si podobné). Identifikace DRUHŮ není tolik důležitá z pohledu taxonomie, ale záleží na jednotnosti určování; pojmenovávat organismy jednotně napříč vzorky.

(NE)VÝHODY STATISTIKY OTÁZKY si klást ještě před odběrem a podle nich naplánovat design, metodiku odběru (experimentální vs. pozorování), analýzy, grafy a testy. Je důležité, aby se srovnávaly porovnatelné OBJEKTY (tj. takové, které se liší pouze, nebo hlavně studovaným jevem a v ostatních parametrech jsou si podobné). Identifikace DRUHŮ není tolik důležitá z pohledu taxonomie, ale záleží na jednotnosti určování; pojmenovávat organismy jednotně napříč vzorky. Možnost využití jiných taxonomických jednotek (OTU) než je druh (morfotypy, rody).

(NE)VÝHODY STATISTIKY Nepoužívat PROGRAMY bez dobré znalosti metod.

(NE)VÝHODY STATISTIKY Nepoužívat PROGRAMY bez dobré znalosti metod. Nedá se určit, která z METOD je obecně lepší záleží na povaze dat; často možnost použít více vhodných analýz.

(NE)VÝHODY STATISTIKY Nepoužívat PROGRAMY bez dobré znalosti metod. Nedá se určit, která z METOD je obecně lepší záleží na povaze dat; často možnost použít více vhodných analýz. STATISTIKA není všemocná, někdy z dat nic nevyplývá.

(NE)VÝHODY STATISTIKY Nepoužívat PROGRAMY bez dobré znalosti metod. Nedá se určit, která z METOD je obecně lepší záleží na povaze dat; často možnost použít více vhodných analýz. STATISTIKA není všemocná, někdy z dat nic nevyplývá. Usuzování na parametry základního souboru pomocí parametrů VÝBĚRU. Spolehlivost tohoto odhadu.

(NE)VÝHODY STATISTIKY Nepoužívat PROGRAMY bez dobré znalosti metod. Nedá se určit, která z METOD je obecně lepší záleží na povaze dat; často možnost použít více vhodných analýz. STATISTIKA není všemocná, někdy z dat nic nevyplývá. Usuzování na parametry základního souboru pomocí parametrů VÝBĚRU. Spolehlivost tohoto odhadu. Nejjednodušší závislost je LINEÁRNÍ. To neznamená, že předpokládám, že svět se chová lineárně, ale to, že jej mohu lineárním modelem aproximovat (v určitém rozsahu hodnot).

(NE)VÝHODY STATISTIKY Nepoužívat PROGRAMY bez dobré znalosti metod. Nedá se určit, která z METOD je obecně lepší záleží na povaze dat; často možnost použít více vhodných analýz. STATISTIKA není všemocná, někdy z dat nic nevyplývá. Usuzování na parametry základního souboru pomocí parametrů VÝBĚRU. Spolehlivost tohoto odhadu. Nejjednodušší závislost je LINEÁRNÍ. To neznamená, že předpokládám, že svět se chová lineárně, ale to, že jej mohu lineárním modelem aproximovat (v určitém rozsahu hodnot). Podíl VARIABILITY jedné proměnné vysvětlené změnami druhé proměnné.

OTÁZKY, KTERÉ SI LZE KLÁST otázky spojené s organismy; nenáhodnost jevů

OTÁZKY, KTERÉ SI LZE KLÁST otázky spojené s organismy; nenáhodnost jevů DIVERZITA porovnávání na různých úrovních

OTÁZKY, KTERÉ SI LZE KLÁST otázky spojené s organismy; nenáhodnost jevů DIVERZITA porovnávání na různých úrovních SPOLEČENSTVA výskyt druhů, podobnost, abundance

OTÁZKY, KTERÉ SI LZE KLÁST otázky spojené s organismy; nenáhodnost jevů DIVERZITA porovnávání na různých úrovních SPOLEČENSTVA výskyt druhů, podobnost, abundance MORFOLOGIE velikost, tvar, struktury

OTÁZKY, KTERÉ SI LZE KLÁST otázky spojené s organismy; nenáhodnost jevů DIVERZITA porovnávání na různých úrovních SPOLEČENSTVA výskyt druhů, podobnost, abundance MORFOLOGIE velikost, tvar, struktury VÝZNAMNOST FAKTORŮ fyzikálně-chemické parametry, vzdálenost lokalit/vzorků, sezónní změny

TYPY DAT/PROMĚNNÝCH druhová, morfologická a environmentální data

TYPY DAT/PROMĚNNÝCH druhová, morfologická a environmentální data KVANTITATIVNÍ diskrétní (např. jen určitá čísla), spojité (měření; počítání buněk druhu)

TYPY DAT/PROMĚNNÝCH druhová, morfologická a environmentální data KVANTITATIVNÍ diskrétní (např. jen určitá čísla), spojité (měření; počítání buněk druhu) SEMIKVANTITATIVNÍ odhad proměnné (procentuální; kategorie kvantit)

TYPY DAT/PROMĚNNÝCH druhová, morfologická a environmentální data KVANTITATIVNÍ diskrétní (např. jen určitá čísla), spojité (měření; počítání buněk druhu) SEMIKVANTITATIVNÍ odhad proměnné (procentuální; kategorie kvantit) KVALITATIVNÍ binární (výskyt/nevýskyt), vícestavové (faktory, dummy variables), rozdělení kvantitativních do skupin/kategorií

TERMINOLOGIE VARIANCE/VARIABILITA/KOVARIANCE variance hodnot určité proměnné/variabilita druhových dat (změny v druzích a/nebo v abundancích), variabilita morfologických dat (mnohorozměrná data o tvaru)/kovariance: společný vliv na variabilitu dat

TERMINOLOGIE VARIANCE/VARIABILITA/KOVARIANCE variance hodnot určité proměnné/variabilita druhových dat (změny v druzích a/nebo v abundancích), variabilita morfologických dat (mnohorozměrná data o tvaru)/kovariance: společný vliv na variabilitu dat (NE)ZÁVISLÁ PROMĚNNÁ - nezávislá proměnná: prediktor, faktor, kovariáta (odstínění vlivu proměnné na data); závislá proměnná: response variable, sledovaná proměnná

TERMINOLOGIE VARIANCE/VARIABILITA/KOVARIANCE variance hodnot určité proměnné/variabilita druhových dat (změny v druzích a/nebo v abundancích), variabilita morfologických dat (mnohorozměrná data o tvaru)/kovariance: společný vliv na variabilitu dat (NE)ZÁVISLÁ PROMĚNNÁ - nezávislá proměnná: prediktor, faktor, kovariáta (odstínění vlivu proměnné na data); závislá proměnná: response variable, sledovaná proměnná DISTANCE/SIMILARITA vzdálenost v prostoru dat/ podobnost (distance = 1-hodnota podobnosti)

TERMINOLOGIE VARIANCE/VARIABILITA/KOVARIANCE variance hodnot určité proměnné/variabilita druhových dat (změny v druzích a/nebo v abundancích), variabilita morfologických dat (mnohorozměrná data o tvaru)/kovariance: společný vliv na variabilitu dat (NE)ZÁVISLÁ PROMĚNNÁ - nezávislá proměnná: prediktor, faktor, kovariáta (odstínění vlivu proměnné na data); závislá proměnná: response variable, sledovaná proměnná DISTANCE/SIMILARITA vzdálenost v prostoru dat/ podobnost (distance = 1-hodnota podobnosti) SIGNIFIKANCE - pravděpodobnost sebraných dat za podmínky neexistence závislosti (platnosti nulové hypotézy)

METODY ANALÝZ odhad typu a intensity závislosti proměnných JEDNOROZMĚRNÉ změny nebo vztahy několika málo proměnných; popisná statistika, analýza variance (ANOVA), korelace/regrese; druhy přes indexy diverzity nebo podobnosti MNOHOROZMĚRNÉ zjednodušení mnohorozměrných dat; shlukové analýzy, ordinační metody, mnohonásobné korelace/regrese, diskriminační analýzy TESTOVÁNÍ test jen předpokladem toho, aby bylo možné se o výsledcích vůbec bavit

TESTOVÁNÍ Vybrat vhodný TEST (hlavně na základě znalosti o povaze dat) a rozhodnout se pro něj před provedením vlastní analýzy (nikoli zkoušet mnoho testů naslepo).

TESTOVÁNÍ Vybrat vhodný TEST (hlavně na základě znalosti o povaze dat) a rozhodnout se pro něj před provedením vlastní analýzy (nikoli zkoušet mnoho testů naslepo). Pokud nelineární vztah hledání různých modelů (funkce).

TESTOVÁNÍ Vybrat vhodný TEST (hlavně na základě znalosti o povaze dat) a rozhodnout se pro něj před provedením vlastní analýzy (nikoli zkoušet mnoho testů naslepo). Pokud nelineární vztah hledání různých modelů (funkce). Parametrické testy mají předpoklad určitého rozdělení (např. normální není časté u menších výběrů a také obecně u biologických dat), neparametrické testy (permutace/randomizace, pořadí dle hodnot).

ZOBRAZENÍ DAT výběr uzpůsobit pro sdělnost a zvýraznění důležitých aspektů

ZOBRAZENÍ DAT výběr uzpůsobit pro sdělnost a zvýraznění důležitých aspektů NĚKOLIK MÁLO PROMĚNNÝCH: záv. kvantitativní vs. nezáv. kvalitativní popisná statistika, box ploty, sloupcové grafy, xy graf průměrů objektů; záv. kvantitativní vs. nezáv. kvantitativní korelace, spojnicový graf, bodový xy graf (matematický model), box ploty (rozdělení spojité proměnné na intervaly); záv. kvalitativní vs. nezáv. kvalitativní frekvenční tabulky

ZOBRAZENÍ DAT výběr uzpůsobit pro sdělnost a zvýraznění důležitých aspektů NĚKOLIK MÁLO PROMĚNNÝCH: záv. kvantitativní vs. nezáv. kvalitativní popisná statistika, box ploty, sloupcové grafy, xy graf průměrů objektů; záv. kvantitativní vs. nezáv. kvantitativní korelace, spojnicový graf, bodový xy graf (matematický model), box ploty (rozdělení spojité proměnné na intervaly); záv. kvalitativní vs. nezáv. kvalitativní frekvenční tabulky MNOHO PROMĚNNÝCH: hypotézy PCA/DCA, NMDS, shlukové analýzy; vliv faktorů: RDA/CCA, rozdělení variability, Mantelův test

INTERPRETACE DAT porovnávání výsledků, umět číst z grafů JEDNOROZMĚRNÉ predikce hodnot na základě pozorování; porovnání závislostí mezi skupinami z hodnot a diagramů MNOHOROZMĚRNÉ shluky interpretovat na základě vnější informace (znalost ekologie druhů, znalost stanovišť); pozor na argumentaci kruhem. Významnost parametrů, zjištění vzájemně korelovaných parametrů (spolu-působení faktorů na variabilitu druhů), rozklad celkové variability.

REFERENCE NÁPOVĚDA a MANUÁLY programů; wikipedia. materiály T HERBENA http://web.natur.cuni.cz/~herben/ biostat.html nebo.../multivar.html BORCARD D, LEGENDRE P a DRAPEAU P (1992) Partialling out the spatial component of ecological variation. LEGENDRE P a LEGENDRE L (1998) Numerical ecology. LEPŠ J a ŠMILAUER P (2003) Multivariate analysis of ecological data using CANOCO. McCUNE B a GRACE JB (2002) Analysis of ecological communities. MARHOLD K a SUDA J (2001) Analýza multivariačních dat v taxonomii (fenetické metody).

STATISTICKÉ APLIKACE komunikace přes MS Excel nebo clipboard (ctrl+c ctrl+v) MS EXCEL zaznamenávání dat, pouze jednorozměrné analýzy CANOCO mnohorozměrné ordinační analýzy erko spíše přes příkazový řádek, spousta skriptů; zdarma PAST obyčejné grafy, tabulkové výpočty; zdarma PRIMER jen mnohorozm., počítá s distancemi/podobnostmi SIGMA PLOT pouze kreslení grafů ZT WIN Mantelovy testy prostorová autokorelace; zdarma STATISTICA, ORIGIN, S-PLUS, NCSS klikací, pěkná grafika grafů TPS mnohorozměrné morfometrické analýzy tvaru; zdarma

ZKUŠEBNÍ DATA MORFOMETRICKÁ data ČASOVÁ data PROSTOROVÁ data

POPISNÉ TABULKY

MATICE

SLOUPCOVÉ a VÝSEČOVÉ GRAFY

SLOUPCOVÉ GRAFY

SLOUPCOVÉ GRAFY

KOMBINOVANÉ GRAFY

SPOJNICOVÉ GRAFY

BOX PLOTY (krabicové diagramy)

CENTROIDY/PRŮMĚRNÉ HODNOTY s odchylkami

CENTROIDY/PRŮMĚRNÉ HODNOTY s odchylkami

KORELACE (bodové grafy, xy plots)

KORELACE (bodový grafy, xy plots, scatter plots)

DALŠÍ TYPY GRAFŮ

SHLUKOVÉ ANALÝZY (cluster analyses)

KOMBINOVANÉ ANALÝZY

ORDINAČNÍ ANALÝZY

ORDINAČNÍ ANALÝZY

ORDINAČNÍ ANALÝZY