Gradient. Gradient změna některého faktoru prostředí

Rozměr: px
Začít zobrazení ze stránky:

Download "Gradient. Gradient změna některého faktoru prostředí"

Transkript

1 Gradientová analýza

2 Gradient Gradient změna některého faktoru prostředí Historické zdroje Teorie vegetačního kontinua (Gleason 1917, Ramenskij 1924) Wisconsinská škola (50. léta): Curtis, McIntosh, Bray R. H. Whittaker (1956, 1960)

3 Tři hlavní problémy s daty o společenstvech zero truncation problem dáno výběrem měřítka významu (performance) druhu = abundance pokud druh chybí (tj. abundance = 0), chybí i informace o tom jak moc nevhodné je prostředí pro druh odpovědní křivky druhů jsou většinou komplikované a vztahy mezi druhy jsou většinou nelineární odpovědní křivky druhů nejsou většinou ideální, ale zrnité druhy jsou většinou méně abundantní než je jejich potenciál v daném bodu gradientu prostředí důvodem je vliv dalších proměnných prostředí, interakcí mezi druhy, náhody a limitů šíření taxonů

4 Ideální vs. reálné? Lineární a unimodání model hodně idealistické vhodné pro velmi krátké gradienty chování druhu je popsatelné optimem (průměr), standard. odchylkou a výškou vrcholu vztah 2 druhů s unimod. Gausovým modelem odpovědi je nelineární a komplikovaný ( )

5 Parametry Gaussovy křivky t - tolerance rozdíl mezi optimem a polohou inflexního bodu Gaussovy křivky c maximální mohutnost populace u druhové optimum (x-ová souřadnice vrcholu křivky hodnoty faktoru prostředí (gradient)

6 Odpovědní křivky druhů A a B k faktoru prostředí X a očekávané abundance druhů Lineární model Unimodální model (Jongman et al. 1995, p. 94)

7 Přímá a nepřímá gradientová analýza Přímá gradientová analýza analyzuje změny druhového složení podle známého a předem stanoveného jednoho nebo několika gradientů prostředí (ekoklina) např. nadmořská výška rybník litorál rákosiny louky ph půdy Nepřímá gradientová analýza analyzuje variabilitu druhového složení společenstva nezávisle na prostředí hledá směr největší variability druhového složení (cenoklina) komplexní gradient prostředí

8 Gradienty prostředí Přímé bezprostředně ovlivňují růst rostlin světlo teplota voda živiny Nepřímé (zástupné) snadno se měří a korelují s přímými faktory nadmořská výška geologické podloží typ půdy sklon a orientace svahu aj.

9 Přehled ordinace

10 Metody gradientové analýzy Regrese regression (přímá GA) Kalibrace calibration (nepřímá GA) Ordinace (indirect) ordination (nepřímá GA) Ordinace s omezením constrained (direct) ordination (přímá GA)

11 Přímá a nepřímá gradientová analýza: přehled

12 Regrese lineární model y ki = a k + b k x i + e ki y ki... odpověď k-tého druhu na i-té lokalitě a k... posun přímky (intercept) b k... sklon přímky (slope) e ki... chyba unimodální model proložení Gaussovské křivky pomocí GLIM (= generalized linear modeling) vážené průměrování (weighted averaging) u k = Σ i ( y ki x i / y k. )

13 Regrese mnohonásobná regrese (multiple regression) regrese jedné závisle proměnné na několika nezávisle proměnných logistická regrese (logistic regression) regrese s kategoriální závisle proměnnou; odhaduje se pravděpodobnost, že při dané hodnotě odhaduje se pravděpodobnost, že při dané hodnotě nezávisle proměnné dosáhne závisle proměnná hodnoty 1

14 obrácená regrese Kalibrace známe: druhové složení na lokalitě i vztah mezi druhy a faktory prostředí odhadujeme: faktory prostředí na lokalitě i

15 Kalibrace: lineární model Druh 1 Druh 2 Druh 3 Faktor prostředí Σ k y ki b k x i = Σ k b k 2

16 Kalibrace: unimodální model Σ k y ki u k x i = Σ k y ki pracuje s druhovými optimy (= indikační hodnoty) zpravidla zanedbává rozdílné tolerance druhů využívá tabelovaných hodnot optim druhů Ellenberg 1974, 1979, Ellenberg et al (střední Evropa) světlo (1 9) vlhkost (1 12) halofilnost (0-2) teplota (1 9) reakce (1 9) kontinentalita (1 9) živiny (1-9) Zólyomi et al. 1966, Borhidi, Soó, Simon (Maďarsko) Landolt 1977 (Švýcarsko) Jurko 1990 (Slovensko)

17 Ellenbergovy tabulky ukázka tabulek + výpočtu (Lepš et Šmilauer, 2003, p. 33) (Ellenberg et al. 1992, p. 100)

18 Ellenbergovy indikační hodnoty: srovnání smrkových lesů tří pohoří Reakce Vlhkost Ellenberg reaction value Ellenberg moisture value Alps Carpathians Bohemian Massif Alps Carpathians Bohemian Massif

19 Ellenbergovy indikační hodnoty: projekce do síťových map rozšíření (Chytrý et al. 1999, Preslia 71: 1 19)

20 Ellenbergovy indikační hodnoty: změny druhového složení v čase (Chytrý & Danihelka 1993, Folia Geobot. Phytotax. 28: )

21 Kritika Ellenbergovy metody ordinální stupnice neumožňuje provádět základní aritmetické výpočty hodnoty jsou tabelovány pro Německo, zatímco v jiných oblastech se druhy mohou chovat jinak druhy často nejsou taxonomicky a ekologicky homogenní a různé ekotypy mohou mít různá optima průměry jsou zatíženy chybou vyplývající z interakce mezi faktory prostředí Faktor DUSÍK má charakter DOSTUPNOSTI ŽIVIN (tj. spíše fosforu) další čtení: Mucina (1985; Biologia), Jurko (1986; Biologia), Klimeš (1987; Preslia)

22 Ordinace: 2 různé způsoby přístupu 1. nalezni konfiguraci snímků v ordinačním prostoru tak, aby vzdálenost mezi vzorky v prostoru korespondovala nejlépe s nepodobností jejich druhového složení... multidimenzionální škálování (multidimensional scaling, MDS) metrické MDS (Analýza hlavních kordinát, PCoA) ne-metrické MDS 2. nalezni latentní proměnné (ordinační osy), které reprezentují nejlepší prediktory pro hodnoty všech druhů - -> vyžaduje specifikaci modelu odpovědi druhu k takové latentní proměnné... lineární a unimodální techniky ordinace

23 Běžné ordinační techniky (ter Braak and Prentice 1988) Indirect gradient analysis Distance-based approaches Polar ordination, PO (Bray-Curtis ordination) Principal Coordinates Analysis, PCoA (Metric multidimensional scaling) Nonmetric Multidimensional Scaling, NMDS Eigenanalysis-based approaches Linear model Principal Components Analysis, PCA Unimodal model Correspondence Analysis, CA (Reciprocal Averaging) Detrended Correspondence Analysis, DCA Direct gradient analysis Linear model Redundancy Analysis, RDA Unimodal model Canonical Correspondence Analysis, CCA Detrended Canonical Correspondence Analysis, DCCA

24 Metoda Základní přehled hlavních ordinačních technik Použitá míra nepodobnosti (vzdálenosti, distance) Proměnné PCA Euklideovská vzdálenost Kvantitativní data, lineární vztah (pozor na dvojité nuly) PCoA, MDS jakákoliv Libovolné, i smíšené NMDS jakákoliv Libovolné, i smíšené CA Chi-square vzdálenost (distance) Nezáporné, škálově homogenní kvantitativní nebo binární data (abundance nebo prezence-absence) Faktorová analýza Euklideovská vzdálenost Kvantitativní data, lineární vztah (pozor na dvojité nuly) (Legendre & Legendre 1998, p. 388)

25 Přehled základních typů ordinace v historickém kontextu

26 Ordinace lokalizace vzorků v mnohorozměrném prostoru, jehož osami jsou druhy Abundance druhu B

27 Ordinace Ale také: lokalizace druhů v mnohorozměrném prostoru, jehož osami jsou vzorky Abundance ve vzorku 2

28 Ordinační metody zjednodušují mnohorozměrný prostor na 1 4 rozměry (princip není v redukci, ale v rotaci pohledu) 1. osa zachycuje směr největší variability v hyperprostoru 2. osa zachycuje další směr největší variability nezachycený 1. osou => nekoreluje s 1. osou (= orthogonalita) další osy zachycují další směry největší variability, nezachycené předchozími osami a nekorelují s předchozími osami variabilita zachycená jednotlivými osami je vyjádřena tzv. charakteristickými čísly (eigenvalues)

29 Příklad ordinačního diagramu ordinační osy

30 Centroid a inertia Centroid je střed objektu. Např. bod daný souřadnicemi - průměry dimenzí objektu (délka, výška, šířka). Pokud se objekty liší v hustotě, je nutné zahrnout tuto variabilitu do výpočtu polohy centroidu. Inertia je tendence objektu ležícího na daném místě v něm zůstat. Hodnota inertia objektu je přímo závislá na tom, jak je masa objektu rozložena kolem centroidu objektu. (= měřítko variability v mnohorozměrném prostoru)

31 Iterativní algoritmus ordinace Krok 1: Každému vzorku je přidělena určitá libovolná, ale navzájem nestejná hodnota (stanovištní skore) x i Krok 2: Pro každý druh se vypočítá závislost na hodnotách stanovištních skore x i (lineární regresí druhů na stanovištní skore pro lineární model nebo váženým průměrováním pro unimodální model) Krok 3: Vypočítají se nové hodnoty x i kalibrací s užitím závislostí získaných v předešlém kroku Krok 4: Odstranění zmenšení měřítka Krok 5: Pokud se hodnoty x i během cyklu nezměnily (změna je menší než stanovená mez), cyklus se zastavuje, v opačném případě se vrací na krok 2

32 Analýza hlavních komponent, PCA Principal Components Analysis Hotelling (1933) Lineární model (iterativní algoritmus využívá lineární regrese) Hlavní uplatnění při analýze kvantitativních dat (faktory prostředí, taxonomická data) nebo relativně homogenních dat o druhovém složení (krátký, ostrý gradient) Dvě nejpoužívanější varianty PCA na kovarianční matici (species-centered PCA) x i = x i Σ x i / n o nelze použít u proměnných měřených v různých jednotkách, málo vhodná u druhových dat s procentickými pokryvnostmi PCA na korelační matici (standardized PCA) x i Σ x i / n x i = s x o dává všem proměnným stejnou váhu

33 Jak funguje PCA? centroid Centrování + (standardizace) Druhy X1, X2, X3 Standardizované osy S1, S2, S3 Ordinační osy PCA 1, 2, 3 rotace

34 Poa pra Lol per Ordinační diagram PCA: druhy Škálování druhových skóre I Poa tri Ely rep Poa ann Ach mil Pla lan Tri rep Ran acr Rum ace Tri pra Ant odo Jun buf Cir arv Alo gen Em p nig Sal rep Air pra Hyp rad Agr sto Pot pal Jun art Ran fla Ele pal Cal cus Co značí délky vektorů druhů: 1. standardizace skóre děleno standardní odchylkou výsledkem je korelační biplot a délka vektoru je měřítkem fitu (R, mnohonásobný korelační koeficient) příslušného druhu v ordinačním diagramu. 2. bez dělení standardní odchylkou: délka odráží změny v abundanci druhu (dlouhý vektor = velká změna abundance, často dominantní druhy).

35 Ordinační diagram PCA: druhy Škálování druhových skóre II 1.0 hypnando Příklad: stejný datový soubor hypncupr lophbarb leucglau grimhart cynopoly paralong Vlevo: druhová skóre transformována (děleno standardní odchylkou) Dole vpravo: druhová skore bez transformace -0.2 plagchas plagtsuc schistsp hypncupr hypnando cynopoly paralong isotalop grimhart leucglau lophbarb plagchas rhizpunc schistsp plagtsuc

36 Ordinační diagram PCA: snímky

37 PCA: Biplot a biplot rule Dvě možnosti prezentace: o o o o o o o o o o distance biplot: vzdálenosti mezi objekty jsou aproximací jejich Euklideovských vzdáleností délka vektoru druhu indikuje jeho příspěvek k tomuto prostoru úhly mezi vektory druhů nemají význam vhodné pro reprezentaci vztahů mezi plochami correlation biplot: vzdálenosti mezi objekty nejsou aproximací jejich Euklideovských vzdáleností délka vektoru druhu je aproximací jeho standardní odchylky (variability) úhel mezi vektory druhů reprezentuje jejich korelaci vhodné pro reprezentaci vztahů mezi druhy 1.0 Poa tri Ely rep Poa pra 2 Bel per Lol per Bro hor 1 Tri rep Rum ace 7 5 Ach mil 10Tri pra Vic lat 6 Leo aut Pla lan 11 Ant odo 3 Alo gen Jun buf 12 Sag pro Cir arv Che alb 8 Pot pal Emp nig 14 Bra rut Air pra Hyp rad Sal rep Agr sto Jun art 16 Ran fla Ele pal Cal cus

38 Kolik os (komponent)? o V případě standardizované PCA je možné interpretovat osy s vlastními čísly > 1 o Pro nestandardizovanou PCA je možné interpretovat osy s vlastními čísly > průměrné vlastní číslo všech os čísly > průměrné vlastní číslo všech os o Empiricky: interpretovatelných je několik první os, většinou 2-4 o pomocné kritérium: Broken stick model (Frontier 1976)

39 Výhody a nevýhody PCA Lze použít i na ordinální či binární data (ale ne smíšená) + - Není vhodná pro vícestavové kvalitativní znaky PCA je dostatečně robustní Efekt podkovy u binárních (nevyžaduje data s dat mnohorozměrně normálním rozdělením) Počet znaků by měl být menší než počet vzorků (nevýhoda u RAPD či AFLP)

40 Analýza hlavních koordinát (PCoA) umožňuje pracovat se všemi typy proměnných a s různými mírami nepodobnosti (distancí), i neeukleidovskými může být s nimi problém některé hodnoty vlastních čísel mohou být negativní (řešení: transformace hodnot koef. disimilarity nebo ignorace negat. hodnot) obecnější forma PCA zobrazí pouze Euklideovskou část matice vzdáleností = nejlepší možná Euklideovská aproximace originální matice nepodobností!!! pracujeme pouze s několika prvními osami nevýhoda: nespecifikuje vztah druhů k ordinačním osám volná volba modelu (lineární, unimodální...) + souřadnice objektů na ordinačním grafu nejsou lineárně závislé na hodnotách původních znaků Duchoslav et al., Ann. Bot. 2010

41 Nemetrické mnohonásobné škálování (NMDS) cílem analýzy není uchování vzdáleností mezi objekty, ale pořadí vzdáleností mezi objekty, v několika málo dimenzích (tj. podobnější objekty jsou si blíže a méně podobné dále v ordinačním prostoru) umožňuje pracovat se všemi typy proměnných a s různými mírami nepodobnosti (distancí), i neeukleidovskými, symetrickými a nesymetrickými vhodná též pro situace, kdy chybějí některé párové hodnoty distancí Stress: míra kvality ordinace, míra shody založená na diferencích mezi fitovanou vzdáleností modelem (d ij ) a predikovanou (d ij ) regresní funkcí mezi empirickou vzdáleností a fitovanou vzdáleností rozsah 0-1, čím nižší, tím lepší, do 0.15 akceptovatelné, dle hodnoty volíme počet os Doporučené čtení: Fasham M. (1977), Ecology 58:

42 NMDS - příklad Matice nepodobností mezi sporty

43 Korespondenční analýza (CA) I. Correspondence Analysis Unimodální model (iterativní algoritmus využívá váženého průměrování) Hlavní uplatnění při analýze dat o druhovém složení, která obsahují hodně nulových hodnot Vážené průměrování zahrnuje standardizaci jak snímky tak druhy jakékoliv dva vzorky s identickými relativními abundancemi (vz. A: 1,2,3; vz. B: 10,20,30) budou považovány za identické!!! Odstranění zmenšení měřítka: x resc =(x-x min )/(x max -x min )*délka (Lepš et Šmilauer 2003, p. 36)

44 Korespondenční analýza (CA) II. Eigenvalue měří zároveň míru separace nik mezi druhy podél osy Pokud chci vědět % vysvětlené variability dané osy, musím dělit hodnotu eigenvalue celkovou variabilitou (total inertia) problém: efekt podkovy (arch effect) a zkreslení ekologické vzdálenosti

45 Detrendovaná korespondenční analýza, DCA, Detrended Correspondence Analysis Odstraňuje z CA arch effect a zkreslené ekologické vzdálenosti (v CA jsou snímky se stejnými rozdíly v druhovém složení umístěny blíže k sobě na koncích než uprostřed ordinační osy) Detrendování (detrending) odstraňuje arch effect po segmentech (by segments) přes mnohočleny (by polynomials) máš-li v DCA analýze kovariáty či faktory prostředí, použij tento typ!!! Přeškálování (rescaling) srovnává ekologické vzdálenosti po přeškálování je průměrná rychlost objevování se a mizení druhů na gradientech přibližně konstantní SD units (jednotky směrodatné odchylky) na vzdálenosti 1 SDU se vymění 1/2 druhů ve snímcích na vzdálenosti 4 SDU se úplně změní druhové složení snímků

46 Arch efekt v CA

47 Detrendování po segmentech Hill & Gauch 1980, Vegetatio 42: 47 58

48 Přeškálování Originální gradient 1. Osa CA 1. Osa DCA

49 Ordinační diagram DCA: vzorky

50 Ordinační diagram DCA: druhy 1.5 Vic lat Hip rha Hyp rad Air pra Sal rep Emp nig Pot pal Ant odo Pla lan Leo aut Ach mil Ran acr Bra rut Tri pra Rum ace Tri rep Bro hor Bel per Lol per Poa pra Poa ann Sag pro Ely rep Poa tri Cal cus Ran fla Jun art Ele pal Jun buf Agr sto Alo gen -1.5 Che alb Cir arv

51 DCA: joint diagram a centroid principe 4-1 Ant odo Pla lan Ach mil 17 Rum ace 5 6 Bel per Lol per Bro hor Sag pro Leo aut 18 Poa pra Ely rep Tri rep Poa tri Jun buf 12 Bra rut Sal rep Alo gen Dvě možnosti škálování: 1. distance rule: Ran fla Jun art pro dlouhé strmé 16 Agr sto gradienty (nad 2 Ele pal SD; Hillovo škálování) 2. biplot rule: pro krátké gradienty (do 2 SD)

52 Příklady použití ordinačních technik

53 DCA: ordinační diagram s klasifikací + Interpretace os pomocí korelační analýzy I (Hanáková et Duchoslav, Čas. Slez. Mus. 2002, p )

54 DCA: ordinační diagram s klasifikací + Interpretace os pomocí korelační analýzy II Vztah průměrné indikační hodnoty pro dusík a pozicí fyt.snímků na 1. ordinační ose DCA (viz předchozí snímek prezentace) (Hanáková et Duchoslav, Čas. Slez. Mus. 2002, p )

55 Ordinační diagram s klasifikací Chytrý & Sádlo 1997, Ann. Bot. 55:

56 Ordinační diagram s klasifikací Chytrý & Sádlo 1997, Ann. Bot. 55:

57 Změny vegetace hodnocené ordinací Chytrý & Danihelka 1993, Folia Geobot. Phytotax. 28:

58 Změny vegetace hodnocené ordinací Chytrý & Danihelka 1993, Folia Geobot. Phytotax. 28:

59 Změny vegetace hodnocené ordinací Chytrý & Danihelka 1993, Folia Geobot. Phytotax. 28:

60 Přímá ordinace (ordinace s omezením) Direct (constrained) ordination metoda přímé gradientové analýzy spojení ordinace a lineární regrese nehledá se cenoklina, ale popisuje se změna druhového složení v závislosti na měřených proměnných prostředí není vhodná, když nemáme žádnou představu o vztahu mezi proměnnými prostředí a druhovým složením společenstva: tehdy použijeme spíš nepřímou ordinaci je vhodná pro hodnocení ekologických experimentů nebo pozorování, kdy nás zajímá vztah druhového složení k předem vybraným proměnným

61 Iterativní algoritmus přímé ordinace Do iterativního algoritmu nepřímé ordinace se přidá: Krok 3a: Výpočet mnohonásobné lineární regrese získaných stanovištních skóre na měřených proměnných prostředí a nahrazení původních stanovištních skóre hodnotami aproximovanými touto regresí

62 Metody přímé ordinace Analýza redundance (redundancy analysis, RDA) metoda pro lineární model odvozená od PCA Kanonická korespondenční analýza (canonical correspondence analysis, CCA) metoda pro unimodální model odvozená od CA Detrendovaná kanonická korespondenční analýza (detrended canonical correspondence analysis, DCCA) metoda pro unimodální model odvozená od DCA

63 Jak pracuje CCA nejlepší gradient...

64 Metody přímé ordinace (RDA) Dune Meadow Data A1 1.0 Pot pal Moisture Ran acr Rum ace Tri pra Tri rep Ele pal Bel per Bra rut Vic lat Cir arv Cal cus Agr sto Ely rep Che alb Ran fla Leo aut Poa ann Poa tri Hip rha Jun buf Alo gen Jun art Hyp rad Emp nig Sal rep

65 Metody přímé ordinace (RDA) Dune Meadow Data Axes Total variance Eigenvalues : Species-environment correlations : Cumulative percentage variance of species data: of species-environment relation: Sum of all unconstrained eigenvalues Sum of all canonical eigenvalues.255

66 Metody přímé ordinace (CCA) Dune Meadow Data Pot pal A Moisture Tri pra Ran acr Pla lan Rum ace Bel per Cir arv Leo aut Tri rep Bra rut Hyp rad Air pra Sal rep Agr sto Poa ann Poa tri Alo gen Ant odo Hip rha Jun buf Sag pro Jun art Ele pal Cal cus Ran fla Che alb Emp nig

67 Metody přímé ordinace (CCA) Dune Meadow Data Axes Total inertia Eigenvalues: Species-environment correlations: Cumulative percentage variance of species data: of species-environment relation: Sum of all unconstrained eigenvalues Sum of all canonical eigenvalues.524

68 Metody přímé ordinace (CCA) Dune Meadow Data s nominálními proměnnými prostředí Hip rha Air pra Ant odo Sal rep Emp nig Hayfield Pasture A Haypastu Moisture 15 Vic lat Hyp rad Pla lan Ach mil Ran acr Rum ace Leo aut Bra rut Bel per Tri rep Bro hor Poa pra Jun buf Tri pra Poa ann Lol per Poa tri Sag pro Jun art Ran fla Agr sto Cal cus Ele pal Pot pal Alo gen Cir arv Che alb

69 Metody přímé ordinace (CCA) Dune Meadow Data s nominálními proměnnými prostředí Axes Total inertia Eigenvalues: Species-environment correlations: Cumulative percentage variance of species data: of species-environment relation: Sum of all unconstrained eigenvalues Sum of all canonical eigenvalues.765

70 Kódování proměnných prostředí v přímé ordinaci Dune Meadow Data ENVIRONMENTAL DATA IN FULL FORMAT - DUNE MEADOW DATA (I5,F5.0,1X,2F3.0,3X,3F2.0,3X,4F2.0) A1 MoistureManure HayfieldHaypastuPasture SF BF HF NM Sample 1Sample 2Sample 3Sample 4Sample 5Sample 6Sample 7Sample 8Sample 9Sample10 Sample11Sample12Sample13Sample14Sample15Sample16Sample17 SupplSAM Duplic17 Sample18Sample19Sample20

71 Parciální ordinace Odstraňuje část variability vysvětlené nezajímavými proměnnými (např. vliv bloku při hodnocení dat z pokusů) Následně se přímými nebo nepřímými ordinačním metodami analyzuje zbytková variabilita Technicky: nezajímavé proměnné se definují jako kovariáty (koproměnné, covariables) provede se regrese proměnných prostředí na kovariátách a rezidua této regrese zaujmou místo původních proměnných prostředí ordinační osy parciální ordinace reprezentují čistý vliv proměnných prostředí, s vyloučením vlivu kovariát

72 Parciální CCA Dune Meadow Data kovariáta: vlhkost, proměnná prostředí: hloubka půdního horizontu A1 4 4 Emp nig Air pra Hyp rad Ant odo A Sal rep Hip rha Pla lan Vic lat Tri pra Pot pal Bra rut Rum ace Sag pro Ran acr Bro hor Cal cus Poa pra Bel per Ele pal Poa ann Agr sto Alo gen Che alb -2 3

73 Parciální CCA Dune Meadow Data kovariáta: vlhkost, proměnná prostředí: hloubka půdního horizontu A1 Axes Total inertia Eigenvalues: Species-environment correlations: Cumulative percentage variance of species data: of species-environment relation: Sum of all unconstrained eigenvalues Sum of all canonical eigenvalues.125

74 Case study: Jak ovlivňuje podíl smrku ve stromovém patru druhové složení podrostu? Model: Partial RDA Envir. variable Picea cover Covariables Altitude Slope aspect Slope inclination Mineral soil depth Free carbonate depth Mottling depth Tree layer cover Results: Ax 1 eigenvalue Ax 1 significance % variance of species data 2.7 % variance of spec.-env. relation 100 RDA Ax 1 scores: positive negative Dicranum scopa 0.36 Fagus sylvatica Plagiomn affine 0.32 Sanicula europa Plagiothe curvif 0.29 Carex flacca Pleuroziu schre 0.28 Cicerbita alpina Hypnum cupres 0.26 Veronica monta Ewald 2000, Appl. Veg. Sci. 3:

75 Rozklad variance (variance partitioning) Borcard et al. 1992, Ecology 73: odděluje varianci vysvětlenou dvěma skupinami proměnných např. abiotické vs. biotické faktory proměnné prostředí vs. čas edafické vs. klimatické proměnné vlastnosti přírodního prostředí vs. zásahy člověka

76 Rozklad variance (variance partitioning) Borcard et al. 1992, Ecology 73: celková variabilita zbytková variabilita sdílená variabilita variabilita vysvětlená první skupinou proměnných variabilita vysvětlená druhou skupinou proměnných

77 Rozklad variance (variance partitioning) Borcard et al. 1992, Ecology 73: celková variabilita druhových dat (total inertia) minus součet zelené, fialové a červené variability variabilita vysvětlená 1. skupinou proměnných v analýze, kde 2. skupina proměnných tvoří kovariáty variabilita vysvětlená jednou ze dvou skupin proměnných v analýze bez kovariát minus variabilita vysvětlená v analýze s kovariátami variabilita vysvětlená 2. skupinou proměnných v analýze, kde 1. skupina proměnných tvoří kovariáty

78 Permutační test (Monte Carlo test) Testuje, zda vybraná proměnná prostředí má signifikantní vliv na druhové složení Nulová hypotéza: variabilita druhového složení je nezávislá na testované proměnné prostředí Spočítá se statistika F (poměr variability vysvětlené regresí a reziduální variability) pro reálná data Permutace: náhodně se přeskupí hodnoty proměnné prostředí mezi jednotlivými snímky a spočítá se F Envir. variable Species Species Species

79 Permutační test (Monte Carlo test) Permutace se provede mnohokrát a vždy se zaznamená hodnota F Udělá se rozložení těchto hodnot a porovná se s hodnotou F pro skutečná (nepermutovaná) data rozložení hodnot F pro všechny permutace F původních dat vliv proměnné je signifikantní F původních dat vliv proměnné je nesignifikantní F

80 Permutační test (Monte Carlo test) 19 permutací test pro 5% hladinu významnosti (P<0.05) 99 permutací test pro 1% hladinu významnosti (P<0.01) 999 permutací test pro 0.1% hladinu významnosti (P<0.001)

81 Permutační test (Monte Carlo test) test první kanonické osy např. zajímá-li nás vliv jedné kvantitativní proměnné test všech kanonických os např. zajímá-li nás vliv nominální proměnné s několika kategoriemi test částečného (podmíněného; partial, conditional) vlivu proměnné, jsou-li v modelu zahrnuty už jiné proměnné

82 Permutační test (Monte Carlo test) unrestricted permutations data nemají žádnou vnitřní strukturu, zápisy jsou nezávislé unrestricted permutation within blocks defined by covariables restricted permutations for time series or line transects pro potenciálně autokorelovaná data split-plot design složitější uspořádání: split plots jsou vřazeny do whole plots

83

84 Příklady použití přímé ordinace pro studium vztahů mezi druhovým složením a vnějšími faktory

85 Změna vegetace v čase: opakování starých fytocenologických snímků testovaná proměnná: čas (nominální proměnná: staré zápisy 0, nové zápisy 1) kovariáty: jakékoliv změřené proměnné, které mohou ovlivňovat variabilitu vegetace v prostoru např. nominálně kódovaná lokalita nominálně kódované geologické podloží topografický index xericity nadmořská výška randomizace: unrestricted permutations; jsou-li nominální kovariáty, unrestricted permutations within blocks defined by covariables

86 Změna vegetace v čase: trvalé plochy testovaná proměnná: čas jeden záznam každoročně nebo studium změn během jediné sezóny kovariáty: jakékoliv změřené proměnné, které mohou ovlivňovat variabilitu vegetace v prostoru randomizace: restricted permutations for time series or line transects within blocks defined by covariables (jednotlivé plochy jsou definovány jako kovariáty); jsou-li další nominální kovariáty, použije se split-plot design víceleté studium s několika záznamy v každém roce kovariáty: tytéž, navíc nominální proměnné kódující sezónu (např. květen, červenec, září) nebo čas od začátku roku randomizace: je-li sezóna kódována nominálními proměnnými, použije se split-plot design, kde plochy jsou randomizovány odděleně ve whole plots a sezóny ve split-plots

87 Permutace dat z trvalých ploch V každém obdélníku restricted permutations for time series Plot 1 Whole plots Plot 2 Plot

88 Analýza dat z transektů testovaná proměnná: např. ph, hloubka půdy, pokryvnost stromového patra apod., zaznamenávané na transektu randomizace: restricted permutation for time series or line transects prochází-li transekt výrazným gradientem, lze tento gradient odstranit použitím pořadí plochy na transektu jako kovariáty společná analýza dat z více transektů variabilita mezi transekty se může odstranit definováním transektů jako série nominálních kovariát randomizace restricted permutation for time series or line transects, blocks defined by covariables

89 Analýza terénních manipulativních pokusů testovaná proměnná: interakce času a pokusného zásahu (např. kosení a kontrola) kovariáty: nominálně kódované plochy (zahrnují i pokusné zásahy), čas randomizace: split-plot design: whole plots (zásahy): freely exchangeable split plots (stejné plochy v různých časech: restricted permutation for time series or line transects je-li víc typů pokusných zásahů, testují se společně, každý jako interakce s časem v jednom modelu, čas jako kovariáta každý zvlášť jako interakce s časem, přičemž vždy interakce ostatních zásahů s časem jsou kovariáty a čas je také kovariáta

90 Kódování orientace svahu 360 o = 0 o PDSI modely 315 o 45 o (potential direct solar irradiation) Heat index (Parker 1988) 270 o 225 o 180 o 90 o 135 o HI = cos (orientace 225 o ) * tg sklonu Topografický index relativní vlhkosti (Parker 1982) vrchol hřebene = 0, dno údolí = 20 JJZ = 0, SSV = 20 sklon > 30 o = 0, 0 o = 10 konvexní = 0, konkávní = 10

PCA BIPLOT ŠKÁLOVÁNÍ OS (1)

PCA BIPLOT ŠKÁLOVÁNÍ OS (1) PCA BIPLOT ŠKÁLOVÁNÍ OS (1) 1 (sites) o zaměření na odlišnosti mezi lokalitami zachovány euklidovské vzdálenosti mezi vzorky úhly mezi šipkami neodpovídají kovariancím (korelacím) proměnných variance skóre

Více

David Zelený GRADIENTOVÁ ANALÝZA

David Zelený GRADIENTOVÁ ANALÝZA David Zelený Zpracování dat v ekologii společenstev G GRADIENTOVÁ ANALÝZA HISTORIE WHITTAKER 1956 - PŘÍMÁ GRADIENTOVÁ ANALÝZA Zpracování dat v ekologii společenstev 108 Whittaker (1956): Vegetation of

Více

ELLENBERGOVY INDIKAČNÍ HODNOTY. David Zelený Zpracování dat v ekologii společenstev

ELLENBERGOVY INDIKAČNÍ HODNOTY. David Zelený Zpracování dat v ekologii společenstev 3 2 6 6 5 2 ELLENBERGOVY INDIKAČNÍ HODNOTY ELLENBERGOVY INDIKAČNÍ HODNOTY (EIH) optima druhů rostlin na gradientu živin, vlhkosti, půdní reakce, kontinentality, teploty, světla a salinity (salinita se

Více

PŘÍKLADY POUŽITÍ ORDINAČNÍCH METOD

PŘÍKLADY POUŽITÍ ORDINAČNÍCH METOD PŘÍKLADY POUŽITÍ ORDINAČNÍCH METOD 1 PŘÍKLAD NA ROZKLAD VARIANCE SPOLEČENSTVA MĚKKÝŠŮ NA PRAMENIŠTÍCH druhové složení společenstev měkkýšů druhové složení slatiništní vegetace ph Ca cond Mg Na měřené proměnné

Více

ELLENBERGOVY INDIKAČNÍ HODNOTY. David Zelený Zpracování dat v ekologii společenstev

ELLENBERGOVY INDIKAČNÍ HODNOTY. David Zelený Zpracování dat v ekologii společenstev 3 2 6 6 5 2 ELLENBERGOVY INDIKAČNÍ HODNOTY ELLENBERGOVY INDIKAČNÍ HODNOTY (EIH) optima druhů rostlin na gradientu ţivin, vlhkosti, půdní reakce, kontinentality, teploty, světla a salinity (salinita se

Více

Vícerozměrné statistické metody

Vícerozměrné statistické metody Vícerozměrné statistické metody Ordinační analýzy principy redukce dimenzionality Jiří Jarkovský, Simona Littnerová FSTA: Pokročilé statistické metody Ordinační analýza a její cíle Cíle ordinační analýzy

Více

Úvodem Dříve les než stromy 3 Operace s maticemi

Úvodem Dříve les než stromy 3 Operace s maticemi Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová

Více

Ordinační analýzy v programu JUICE

Ordinační analýzy v programu JUICE Ordinační analýzy v programu JUICE Martina Nejezchlebová, Blansko, 30. 8. 2011 1.1 Ordinační analýzy Jsou nedílnou součástí mnoha vegetačních a ekologických analýz. V programu JUICE (Tichý 2002) v kombinaci

Více

SPECIES ATTRIBUTES IN ANALYSIS OF COMMUNITY ECOLOGY DATA

SPECIES ATTRIBUTES IN ANALYSIS OF COMMUNITY ECOLOGY DATA SPECIES ATTRIBUTES IN ANALYSIS OF COMMUNITY ECOLOGY DATA HOW TO ANALYSE RELATIONSHIP BETWEEN SAMPLE ATTRIBUTES AND SPECIES ATTRIBUTES VIA SPECIES COMPOSITION? species sample attributes samples L R 222

Více

EKOLOGICKÁ PODOBNOST (ECOLOGICAL RESEMBLANCE) David Zelený Zpracování dat v ekologii společenstev

EKOLOGICKÁ PODOBNOST (ECOLOGICAL RESEMBLANCE) David Zelený Zpracování dat v ekologii společenstev EKOLOGICKÁ PODOBNOST (ECOLOGICAL RESEMBLANCE) EKOLOGICKÁ PODOBNOST Q VS R ANALÝZA Vzorky Druhy druh 1 druh 2 druh 3 vzorek 1 0 1 1 vzorek 2 1 0 0 vzorek 3 0 4 4 vztahy mezi vzorky Q analýza vztahy mezi

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

STATISTICKÉ METODY; ZÍSKÁVÁNÍ INFORMACÍ Z DRUHOVÝCH A ENVIRONMENTÁLNÍCH DAT

STATISTICKÉ METODY; ZÍSKÁVÁNÍ INFORMACÍ Z DRUHOVÝCH A ENVIRONMENTÁLNÍCH DAT STATISTICKÉ METODY; ZÍSKÁVÁNÍ INFORMACÍ Z DRUHOVÝCH A ENVIRONMENTÁLNÍCH DAT (NE)VÝHODY STATISTIKY OTÁZKY si klást ještě před odběrem a podle nich naplánovat design, metodiku odběru (experimentální vs.

Více

REGRESE VS KALIBRACE. David Zelený Zpracování dat v ekologii společenstev

REGRESE VS KALIBRACE. David Zelený Zpracování dat v ekologii společenstev REGRESE VS KALIBRACE David Zelený METODY GRADIENTOVÉ ANALÝZY Data, která máme: počet charakteristik prostředí počet druhů Apriorní znalost vztahů mezi druhy a prostředím? Použijeme: Dostaneme: 1, n 1 ne

Více

ZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV

ZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV ZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV OSNOVA PŘEDNÁŠKY Příprava dat pro numerické analýzy typy sbíraných dat, čištění dat, odlehlé body, transformace, standardizace, EDA Ekologická podobnost indexy podobnosti

Více

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza Korelační a regresní analýza 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza Pearsonův korelační koeficient u intervalových a poměrových dat můžeme jako

Více

Univerzita Pardubice 8. licenční studium chemometrie

Univerzita Pardubice 8. licenční studium chemometrie Univerzita Pardubice 8. licenční studium chemometrie Statistické zpracování dat při managementu jakosti Semestrální práce Metody s latentními proměnnými a klasifikační metody Ing. Jan Balcárek, Ph.D. vedoucí

Více

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Autor práce : RNDr. Ivo Beroun,CSc. Vedoucí práce: prof. RNDr. Milan Meloun, DrSc. PROFILOVÁNÍ Profilování = klasifikace a rozlišování

Více

ZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV

ZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV ZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV OSNOVA PŘEDNÁŠKY Příprava dat pro numerické analýzy typy sbíraných dat, čištění dat, odlehlé body, transformace, standardizace, EDA Ekologická podobnost indexy podobnosti

Více

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan 1 Úvod 1.1 Empirický výzkum a jeho etapy 1.2 Význam teorie pro výzkum 1.2.1 Konstrukty a jejich operacionalizace 1.2.2 Role teorie ve výzkumu 1.2.3 Proces ověření hypotéz a teorií 1.3 Etika vědecké práce

Více

Hluboká říční údolí jako objekt pro modelování vztahů vegetace a proměnných prostředí?

Hluboká říční údolí jako objekt pro modelování vztahů vegetace a proměnných prostředí? David Zelený Biologická fakulta JčU v Českých Budějovicích školitel: Milan Chytrý (PřF MU Brno) Hluboká říční údolí jako objekt pro modelování vztahů vegetace a proměnných prostředí? Vltava pod Dívčím

Více

Zpracování geobotanických dat v. Sestavili Tomáš Herben a Zuzana Münzbergová

Zpracování geobotanických dat v. Sestavili Tomáš Herben a Zuzana Münzbergová Zpracování geobotanických dat v Sestavili Tomáš Herben a Zuzana Münzbergová Praha, 2002 1 Poznámka na úvod zvem), kterým chceme pokrýt typické problémy v analyzovat a s v taxonomii, Marhold a Suda 2001).

Více

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou Úvod.................................................................. 11 Kapitola 1 Než začneme.................................................................. 17 1.1 Logika kvantitativního výzkumu...........................................

Více

6. Lineární regresní modely

6. Lineární regresní modely 6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu

Více

INDUKTIVNÍ STATISTIKA

INDUKTIVNÍ STATISTIKA 10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ HODNOCENÍ ZÁVISLOSTÍ KVALITATIVNÍ VELIČINY - Vychází se z kombinační (kontingenční) tabulky, která je výsledkem třídění druhého stupně KVANTITATIVNÍ

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

Inovace bakalářského studijního oboru Aplikovaná chemie

Inovace bakalářského studijního oboru Aplikovaná chemie http://aplchem.upol.cz CZ.1.07/2.2.00/15.0247 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Regrese Závislostproměnných funkční y= f(x) regresní y= f(x)

Více

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných

Více

ZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV

ZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV ZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV OSNOVA PŘEDNÁŠKY Typy sbíraných dat kategoriální vs kvantitativní, pokryvnosti, frekvence Příprava dat pro numerické analýzy čištění dat, odlehlé body, transformace,

Více

UNIVERZITA PARDUBICE. 4.4 Aproximace křivek a vyhlazování křivek

UNIVERZITA PARDUBICE. 4.4 Aproximace křivek a vyhlazování křivek UNIVERZITA PARDUBICE Licenční Studium Archimedes Statistické zpracování dat a informatika 4.4 Aproximace křivek a vyhlazování křivek Mgr. Jana Kubátová Endokrinologický ústav V Praze, leden 2012 Obsah

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

Cronbachův koeficient α nová adaptovaná metoda uvedení vlastností položkové analýzy deskriptivní induktivní parametrické

Cronbachův koeficient α nová adaptovaná metoda uvedení vlastností položkové analýzy deskriptivní induktivní parametrické Československá psychologie 0009-062X Metodologické požadavky na výzkumné studie METODOLOGICKÉ POŽADAVKY NA VÝZKUMNÉ STUDIE Výzkumné studie mají přinášet nová konkrétní zjištění získaná specifickými výzkumnými

Více

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1 Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu

Více

AVDAT Mnohorozměrné metody, metody klasifikace

AVDAT Mnohorozměrné metody, metody klasifikace AVDAT Mnohorozměrné metody, metody klasifikace Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Mnohorozměrné metody Regrese jedna náhodná veličina je vysvětlována pomocí jiných

Více

AVDAT Mnohorozměrné metody metody redukce dimenze

AVDAT Mnohorozměrné metody metody redukce dimenze AVDAT Mnohorozměrné metody metody redukce dimenze Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Opakování vlastní čísla a vlastní vektory A je čtvercová matice řádu n. Pak

Více

NUMERICKÁ KLASIFIKACE. David Zelený Zpracování dat v ekologii společenstev

NUMERICKÁ KLASIFIKACE. David Zelený Zpracování dat v ekologii společenstev NUMERICKÁ KLASIFIKACE http://wfc3.gsfc.nasa.gov PROČ MÁ SMYSL VĚCI KLASIFIKOVAT? vlnová délka (~ ekologický gradient) 172 http://wfc3.gsfc.nasa.gov PROČ MÁ SMYSL VĚCI KLASIFIKOVAT? vlnová délka (~ ekologický

Více

2019/03/31 17:38 1/2 Klasifikační a regresní stromy

2019/03/31 17:38 1/2 Klasifikační a regresní stromy 2019/03/31 17:38 1/2 Klasifikační a regresní stromy Table of Contents Klasifikační a regresní stromy... 1 rpart (library rpart)... 1 draw.tree (library maptree)... 3 plotcp a rsq.rpart (library rpart)...

Více

Fakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody

Fakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody Fakulta chemicko-technologická Katedra analytické chemie 3.2 Metody s latentními proměnnými a klasifikační metody Vypracoval: Ing. Tomáš Nekola Studium: licenční Datum: 21. 1. 2008 Otázka 1. Vypočtěte

Více

Vícerozměrné statistické metody

Vícerozměrné statistické metody Vícerozměrné statistické metody Ordinační analýzy přehled metod Jiří Jarkovský, Simona Littnerová FSTA: Pokročilé statistické metody Analýza hlavních komponent jako příklad výpočtu redukce dimenzionality

Více

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

MÍRY ZÁVISLOSTI (KORELACE A REGRESE) zhanel@fsps.muni.cz MÍRY ZÁVISLOSTI (KORELACE A REGRESE) 2.5 MÍRY ZÁVISLOSTI 2.5.1 ZÁVISLOST PEVNÁ, VOLNÁ, STATISTICKÁ A KORELAČNÍ Jednorozměrné soubory - charakterizovány jednotlivými statistickými znaky

Více

SEMESTRÁLNÍ PRÁCE 3.5 Klasifikace analýzou vícerozměrných dat

SEMESTRÁLNÍ PRÁCE 3.5 Klasifikace analýzou vícerozměrných dat UNIVERZITA PARDUBICE FAKULTA CHEMICKO-TECHNOLOGICKÁ KATEDRA ANALYTICKÉ CHEMIE LICENČNÍ STUDIUM - STATISTICKÉ ZPRACOVÁNÍ DAT SEMESTRÁLNÍ PRÁCE Ing. Věra Fialová BIOPHARM VÝZKUMNÝ ÚSTAV BIOFARMACIE A VETERINÁRNÍCH

Více

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek 10. Neparametrické y Mann-Whitney U- Wilcoxonův Znaménkový Shrnutí statistických ů Typ srovnání Nulová hypotéza Parametrický Neparametrický 1 skupina dat vs. etalon Střední hodnota je rovna hodnotě etalonu.

Více

Porovnání dvou výběrů

Porovnání dvou výběrů Porovnání dvou výběrů Menu: QCExpert Porovnání dvou výběrů Tento modul je určen pro podrobnou analýzu dvou datových souborů (výběrů). Modul poskytuje dva postupy analýzy: porovnání dvou nezávislých výběrů

Více

Prostorová variabilita

Prostorová variabilita Prostorová variabilita prostorová závislost (autokorelace) reprezentuje korelaci mezi hodnotami určité náhodné proměnné v místě i a hodnotami téže proměnné v jiném místě j; prostorová heterogenita je strukturální

Více

Regresní a korelační analýza

Regresní a korelační analýza Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).

Více

INDEXY DIVERZITY. David Zelený Zpracování dat v ekologii společenstev

INDEXY DIVERZITY. David Zelený Zpracování dat v ekologii společenstev INDEXY DIVERZITY ALFA, BETA A GAMA DIVERZITA Alfa diverzita druhová bohatost vzorku Beta diverzita (species turnover) změna v druhovém složení mezi vzorky Gama diverzita celková druhová bohatost regionu

Více

Regrese. používáme tehdy, jestliže je vysvětlující proměnná kontinuální pokud je kategoriální, jde o ANOVA

Regrese. používáme tehdy, jestliže je vysvětlující proměnná kontinuální pokud je kategoriální, jde o ANOVA Regrese používáme tehd, jestliže je vsvětlující proměnná kontinuální pokud je kategoriální, jde o ANOVA Specifikace modelu = a + bx a závisle proměnná b x vsvětlující proměnná Cíl analýz Odhadnout hodnot

Více

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, KMA/SZZS1 Matematika 1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, operace s limitami. 2. Limita funkce

Více

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu

Více

UNIVERZITA PARDUBICE. Semestrální práce z 5. soustředění

UNIVERZITA PARDUBICE. Semestrální práce z 5. soustředění UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Licenční studium chemometrie na téma Statistické zpracování dat Semestrální práce z 5. soustředění Předmět: 3.5 Klasifikace

Více

Klasická a robustní ortogonální regrese mezi složkami kompozice

Klasická a robustní ortogonální regrese mezi složkami kompozice Klasická a robustní ortogonální regrese mezi složkami kompozice K. Hrůzová, V. Todorov, K. Hron, P. Filzmoser 13. září 2016 Kompoziční data kladná reálná čísla nesoucí pouze relativní informaci, x = (x

Více

AVDAT Geometrie metody nejmenších čtverců

AVDAT Geometrie metody nejmenších čtverců AVDAT Geometrie metody nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model klasický lineární regresní model odhad parametrů MNČ y = Xβ + ε, ε

Více

Analýza dat na PC I.

Analýza dat na PC I. CENTRUM BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita Analýza dat na PC I. Popisná analýza v programu Statistica IBA výuka Základní popisná statistika Popisná statistika

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 2. KAPITOLA PODMÍNĚNÁ PRAVDĚPODOBNOST 3. KAPITOLA NÁHODNÁ VELIČINA 9.11.2017 Opakování Uveďte příklad aplikace geometrické definice pravděpodobnosti

Více

Korelace. Komentované řešení pomocí MS Excel

Korelace. Komentované řešení pomocí MS Excel Korelace Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A2:B84 (viz. obrázek) Prvotní představu o tvaru a síle závislosti docházky a počtu bodů nám poskytne

Více

LINEÁRNÍ REGRESE. Lineární regresní model

LINEÁRNÍ REGRESE. Lineární regresní model LINEÁRNÍ REGRESE Chemometrie I, David MILDE Lineární regresní model 1 Typy závislosti 2 proměnných FUNKČNÍ VZTAH: 2 závisle proměnné: určité hodnotě x odpovídá jediná hodnota y. KORELACE: 2 náhodné (nezávislé)

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých

Více

Měření závislosti statistických dat

Měření závislosti statistických dat 5.1 Měření závislosti statistických dat Každý pořádný astronom je schopen vám předpovědět, kde se bude nacházet daná hvězda půl hodiny před půlnocí. Ne každý je však téhož schopen předpovědět v případě

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost

Více

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz PSY117/454 Statistická analýza dat v psychologii seminář 9 Statistické testování hypotéz Základní výzkumné otázky/hypotézy 1. Stanovení hodnoty parametru =stanovení intervalu spolehlivosti na μ, σ, ρ,

Více

Pokročilé neparametrické metody. Klára Kubošová

Pokročilé neparametrické metody. Klára Kubošová Klára Kubošová Další typy stromů CHAID, PRIM, MARS CHAID - Chi-squared Automatic Interaction Detector G.V.Kass (1980) nebinární strom pro kategoriální proměnné. Jako kriteriální statistika pro větvení

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO

Více

Přednáška 13 Redukce dimenzionality

Přednáška 13 Redukce dimenzionality Vytěžování Dat Přednáška 13 Redukce dimenzionality Miroslav Čepek Fakulta Elektrotechnická, ČVUT Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti ČVUT (FEL) Redukce dimenzionality 1 /

Více

INDEXY DIVERZITY. David Zelený Zpracování dat v ekologii společenstev

INDEXY DIVERZITY. David Zelený Zpracování dat v ekologii společenstev INDEXY DIVERZITY Jurasinski et al. (2009) ALFA, BETA A GAMA DIVERZITA Alfa diverzita druhová bohatost vzorku Beta diverzita (species turnover) změna v druhovém složení mezi vzorky Gama diverzita celková

Více

Lineární regrese. Komentované řešení pomocí MS Excel

Lineární regrese. Komentované řešení pomocí MS Excel Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních

Více

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA 2018 4. dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Typy proměnných nominální (nominal) o dvou hodnotách lze říci pouze

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

Vícerozměrné metody. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Schematický úvod

Vícerozměrné metody. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Schematický úvod PSY117/454 Statistická analýza dat v psychologii Přednáška 12 Vícerozměrné metody Schematický úvod Co je na slově statistika tak divného, že jeho vyslovení tak často způsobuje napjaté ticho? William Kruskal

Více

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků Příklad: Test nezávislosti kategoriálních znaků Určete na hladině významnosti 5 % na základě dat zjištěných v rámci dotazníkového šetření ve Šluknově, zda existuje závislost mezi pohlavím respondenta a

Více

LINEÁRNÍ MODELY. Zdeňka Veselá

LINEÁRNÍ MODELY. Zdeňka Veselá LINEÁRNÍ MODELY Zdeňka Veselá vesela.zdenka@vuzv.cz Genetika kvantitativních vlastností Jednotlivé geny nejsou zjistitelné ani měřitelné Efekty většího počtu genů poskytují variabilitu, kterou lze většinou

Více

5EN306 Aplikované kvantitativní metody I

5EN306 Aplikované kvantitativní metody I 5EN306 Aplikované kvantitativní metody I Přednáška 5 Zuzana Dlouhá Předmět a struktura kurzu 1. Úvod: struktura empirických výzkumů 2. Tvorba ekonomických modelů: teorie 3. Data: zdroje a typy dat, význam

Více

Příklad 2: Určení cihlářských surovin na základě chemické silikátové analýzy

Příklad 2: Určení cihlářských surovin na základě chemické silikátové analýzy Příklad 2: Určení cihlářských surovin na základě chemické silikátové analýzy Zadání: Deponie nadložních jílových sedimentů SHP byla testována za účelem využití v cihlářské výrobě. Z deponie bylo odebráno

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,

Více

Metoda backward výběru proměnných v lineární regresi a její vlastnosti

Metoda backward výběru proměnných v lineární regresi a její vlastnosti Metoda backward výběru proměnných v lineární regresi a její vlastnosti Aktuárský seminář, 13. dubna 2018 Milan Bašta 1 / 30 1 Metody výběru proměnných do modelu 2 Monte Carlo simulace, backward metoda

Více

Pokročilé neparametrické metody. Klára Kubošová

Pokročilé neparametrické metody. Klára Kubošová Pokročilé neparametrické metody Klára Kubošová Pokročilé neparametrické metody Výuka 13 přednášek doplněných o praktické cvičení v SW Úvod do neparametrických metod + princip rozhodovacích stromů Klasifikační

Více

Statistická analýza jednorozměrných dat

Statistická analýza jednorozměrných dat Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem

Více

Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů

Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů Inferenční statistika - úvod z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů Pravděpodobnost postupy induktivní statistiky vycházejí z teorie pravděpodobnosti pravděpodobnost, že

Více

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Licenční studium Pythagoras Statistické zpracování experimentálních dat Semestrální práce ANOVA vypracoval: Ing. David Dušek

Více

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )

Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely ) Úloha M608 Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely ) Zadání : Při kvantitativní analýze lidského krevního séra ovlivňují hodnotu obsahu vysokohustotního

Více

Popisná statistika. Komentované řešení pomocí MS Excel

Popisná statistika. Komentované řešení pomocí MS Excel Popisná statistika Komentované řešení pomocí MS Excel Vstupní data Máme k dispozici data o počtech bodů z 1. a 2. zápočtového testu z Matematiky I v zimním semestru 2015/2016 a to za všech 762 studentů,

Více

Vícerozměrné statistické metody

Vícerozměrné statistické metody Vícerozměrné statistické metody Podobnosti a vzdálenosti ve vícerozměrném prostoru, asociační matice II Jiří Jarkovský, Simona Littnerová Vícerozměrné statistické metody Práce s asociační maticí Vzdálenosti

Více

KORELACE. Komentované řešení pomocí programu Statistica

KORELACE. Komentované řešení pomocí programu Statistica KORELACE Komentované řešení pomocí programu Statistica Vstupní data I Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná

Více

TERMINOLOGIE ... NAMĚŘENÁ DATA. Radek Mareček PŘEDZPRACOVÁNÍ DAT. funkční skeny

TERMINOLOGIE ... NAMĚŘENÁ DATA. Radek Mareček PŘEDZPRACOVÁNÍ DAT. funkční skeny PŘEDZPRACOVÁNÍ DAT Radek Mareček TERMINOLOGIE Session soubor skenů nasnímaných během jednoho běhu stimulačního paradigmatu (řádově desítky až stovky skenů) Sken jeden nasnímaný objem... Voxel elementární

Více

Vícerozměrná rozdělení

Vícerozměrná rozdělení Vícerozměrná rozdělení 7. září 0 Učivo: Práce s vícerozměrnými rozděleními. Sdružené, marginální, podmíněné rozdělení pravděpodobnosti. Vektorová střední hodnota. Kovariance, korelace, kovarianční matice.

Více

Eva Fišerová a Karel Hron. Katedra matematické analýzy a aplikací matematiky Přírodovědecká fakulta Univerzity Palackého v Olomouci.

Eva Fišerová a Karel Hron. Katedra matematické analýzy a aplikací matematiky Přírodovědecká fakulta Univerzity Palackého v Olomouci. Ortogonální regrese pro 3-složkové kompoziční data využitím lineárních modelů Eva Fišerová a Karel Hron Katedra matematické analýzy a aplikací matematiky Přírodovědecká fakulta Univerzity Palackého v Olomouci

Více

Aplikovaná statistika v R - cvičení 3

Aplikovaná statistika v R - cvičení 3 Aplikovaná statistika v R - cvičení 3 Filip Děchtěrenko Matematicko-fyzikální fakulta filip.dechterenko@gmail.com 5.8.2014 Filip Děchtěrenko (MFF UK) Aplikovaná statistika v R 5.8.2014 1 / 10 Lineární

Více

AVDAT Klasický lineární model, metoda nejmenších

AVDAT Klasický lineární model, metoda nejmenších AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními

Více

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně

Více

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY zhanel@fsps.muni.cz ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY METODY DESKRIPTIVNÍ STATISTIKY 1. URČENÍ TYPU ŠKÁLY (nominální, ordinální, metrické) a) nominální + ordinální neparametrické stat. metody b) metrické

Více

dat Robust ledna 2018

dat Robust ledna 2018 Analýza prostorově závislých funkcionálních dat V. Římalová, A. Menafoglio, A. Pini, E. Fišerová Robust 2018 25. ledna 2018 Motivace Data a náhled lokace Měsíční měření (březen-říjen 2015 a 2016) 5 chemických

Více

Pokud data zadáme přes "Commands" okno: SDF1$X1<-c(1:15) //vytvoření řady čísel od 1 do 15 SDF1$Y1<-c(1.5,3,4.5,5,6,8,9,11,13,14,15,16,18.

Pokud data zadáme přes Commands okno: SDF1$X1<-c(1:15) //vytvoření řady čísel od 1 do 15 SDF1$Y1<-c(1.5,3,4.5,5,6,8,9,11,13,14,15,16,18. Regresní analýza; transformace dat Pro řešení vztahů mezi proměnnými kontinuálního typu používáme korelační a regresní analýzy. Korelace se používá pokud nelze určit "kauzalitu". Regresní analýza je určena

Více

SPOLEHLIVOST KONSTRUKCÍ & TEORIE SPOLEHLIVOSTI část 5: Aproximační techniky

SPOLEHLIVOST KONSTRUKCÍ & TEORIE SPOLEHLIVOSTI část 5: Aproximační techniky SPOLEHLIVOST KONSTRUKCÍ & TEORIE SPOLEHLIVOSTI část 5: Aproximační techniky Drahomír Novák Jan Eliáš 2012 Spolehlivost konstrukcí, Drahomír Novák & Jan Eliáš 1 část 5 Aproximační techniky 2012 Spolehlivost

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y β ε Matice n,k je matice realizací. Předpoklad: n > k, h() k - tj. matice je plné hodnosti

Více

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )

Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace ) Příklad č. 1 Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace ) Zadání : Stanovení manganu ve vodách se provádí oxidací jodistanem v kyselém prostředí až na manganistan. (1) Sestrojte

Více

Popisná statistika kvantitativní veličiny

Popisná statistika kvantitativní veličiny StatSoft Popisná statistika kvantitativní veličiny Protože nám surová data obvykle žádnou smysluplnou informaci neposkytnou, je žádoucí vyjádřit tyto ve zhuštěnější formě. V předchozím dílu jsme začali

Více

Testování hypotéz a měření asociace mezi proměnnými

Testování hypotéz a měření asociace mezi proměnnými Testování hypotéz a měření asociace mezi proměnnými Testování hypotéz Nulová a alternativní hypotéza většina statistických analýz zahrnuje různá porovnání, hledání vztahů, efektů Tvrzení, že efekt je nulový,

Více

Úvod do problematiky měření

Úvod do problematiky měření 1/18 Lord Kelvin: "Když to, o čem mluvíte, můžete změřit, a vyjádřit to pomocí čísel, něco o tom víte. Ale když to nemůžete vyjádřit číselně, je vaše znalost hubená a nedostatečná. Může to být začátek

Více