Gradient. Gradient změna některého faktoru prostředí
|
|
- Alois Prokop
- před 7 lety
- Počet zobrazení:
Transkript
1 Gradientová analýza
2 Gradient Gradient změna některého faktoru prostředí Historické zdroje Teorie vegetačního kontinua (Gleason 1917, Ramenskij 1924) Wisconsinská škola (50. léta): Curtis, McIntosh, Bray R. H. Whittaker (1956, 1960)
3 Tři hlavní problémy s daty o společenstvech zero truncation problem dáno výběrem měřítka významu (performance) druhu = abundance pokud druh chybí (tj. abundance = 0), chybí i informace o tom jak moc nevhodné je prostředí pro druh odpovědní křivky druhů jsou většinou komplikované a vztahy mezi druhy jsou většinou nelineární odpovědní křivky druhů nejsou většinou ideální, ale zrnité druhy jsou většinou méně abundantní než je jejich potenciál v daném bodu gradientu prostředí důvodem je vliv dalších proměnných prostředí, interakcí mezi druhy, náhody a limitů šíření taxonů
4 Ideální vs. reálné? Lineární a unimodání model hodně idealistické vhodné pro velmi krátké gradienty chování druhu je popsatelné optimem (průměr), standard. odchylkou a výškou vrcholu vztah 2 druhů s unimod. Gausovým modelem odpovědi je nelineární a komplikovaný ( )
5 Parametry Gaussovy křivky t - tolerance rozdíl mezi optimem a polohou inflexního bodu Gaussovy křivky c maximální mohutnost populace u druhové optimum (x-ová souřadnice vrcholu křivky hodnoty faktoru prostředí (gradient)
6 Odpovědní křivky druhů A a B k faktoru prostředí X a očekávané abundance druhů Lineární model Unimodální model (Jongman et al. 1995, p. 94)
7 Přímá a nepřímá gradientová analýza Přímá gradientová analýza analyzuje změny druhového složení podle známého a předem stanoveného jednoho nebo několika gradientů prostředí (ekoklina) např. nadmořská výška rybník litorál rákosiny louky ph půdy Nepřímá gradientová analýza analyzuje variabilitu druhového složení společenstva nezávisle na prostředí hledá směr největší variability druhového složení (cenoklina) komplexní gradient prostředí
8 Gradienty prostředí Přímé bezprostředně ovlivňují růst rostlin světlo teplota voda živiny Nepřímé (zástupné) snadno se měří a korelují s přímými faktory nadmořská výška geologické podloží typ půdy sklon a orientace svahu aj.
9 Přehled ordinace
10 Metody gradientové analýzy Regrese regression (přímá GA) Kalibrace calibration (nepřímá GA) Ordinace (indirect) ordination (nepřímá GA) Ordinace s omezením constrained (direct) ordination (přímá GA)
11 Přímá a nepřímá gradientová analýza: přehled
12 Regrese lineární model y ki = a k + b k x i + e ki y ki... odpověď k-tého druhu na i-té lokalitě a k... posun přímky (intercept) b k... sklon přímky (slope) e ki... chyba unimodální model proložení Gaussovské křivky pomocí GLIM (= generalized linear modeling) vážené průměrování (weighted averaging) u k = Σ i ( y ki x i / y k. )
13 Regrese mnohonásobná regrese (multiple regression) regrese jedné závisle proměnné na několika nezávisle proměnných logistická regrese (logistic regression) regrese s kategoriální závisle proměnnou; odhaduje se pravděpodobnost, že při dané hodnotě odhaduje se pravděpodobnost, že při dané hodnotě nezávisle proměnné dosáhne závisle proměnná hodnoty 1
14 obrácená regrese Kalibrace známe: druhové složení na lokalitě i vztah mezi druhy a faktory prostředí odhadujeme: faktory prostředí na lokalitě i
15 Kalibrace: lineární model Druh 1 Druh 2 Druh 3 Faktor prostředí Σ k y ki b k x i = Σ k b k 2
16 Kalibrace: unimodální model Σ k y ki u k x i = Σ k y ki pracuje s druhovými optimy (= indikační hodnoty) zpravidla zanedbává rozdílné tolerance druhů využívá tabelovaných hodnot optim druhů Ellenberg 1974, 1979, Ellenberg et al (střední Evropa) světlo (1 9) vlhkost (1 12) halofilnost (0-2) teplota (1 9) reakce (1 9) kontinentalita (1 9) živiny (1-9) Zólyomi et al. 1966, Borhidi, Soó, Simon (Maďarsko) Landolt 1977 (Švýcarsko) Jurko 1990 (Slovensko)
17 Ellenbergovy tabulky ukázka tabulek + výpočtu (Lepš et Šmilauer, 2003, p. 33) (Ellenberg et al. 1992, p. 100)
18 Ellenbergovy indikační hodnoty: srovnání smrkových lesů tří pohoří Reakce Vlhkost Ellenberg reaction value Ellenberg moisture value Alps Carpathians Bohemian Massif Alps Carpathians Bohemian Massif
19 Ellenbergovy indikační hodnoty: projekce do síťových map rozšíření (Chytrý et al. 1999, Preslia 71: 1 19)
20 Ellenbergovy indikační hodnoty: změny druhového složení v čase (Chytrý & Danihelka 1993, Folia Geobot. Phytotax. 28: )
21 Kritika Ellenbergovy metody ordinální stupnice neumožňuje provádět základní aritmetické výpočty hodnoty jsou tabelovány pro Německo, zatímco v jiných oblastech se druhy mohou chovat jinak druhy často nejsou taxonomicky a ekologicky homogenní a různé ekotypy mohou mít různá optima průměry jsou zatíženy chybou vyplývající z interakce mezi faktory prostředí Faktor DUSÍK má charakter DOSTUPNOSTI ŽIVIN (tj. spíše fosforu) další čtení: Mucina (1985; Biologia), Jurko (1986; Biologia), Klimeš (1987; Preslia)
22 Ordinace: 2 různé způsoby přístupu 1. nalezni konfiguraci snímků v ordinačním prostoru tak, aby vzdálenost mezi vzorky v prostoru korespondovala nejlépe s nepodobností jejich druhového složení... multidimenzionální škálování (multidimensional scaling, MDS) metrické MDS (Analýza hlavních kordinát, PCoA) ne-metrické MDS 2. nalezni latentní proměnné (ordinační osy), které reprezentují nejlepší prediktory pro hodnoty všech druhů - -> vyžaduje specifikaci modelu odpovědi druhu k takové latentní proměnné... lineární a unimodální techniky ordinace
23 Běžné ordinační techniky (ter Braak and Prentice 1988) Indirect gradient analysis Distance-based approaches Polar ordination, PO (Bray-Curtis ordination) Principal Coordinates Analysis, PCoA (Metric multidimensional scaling) Nonmetric Multidimensional Scaling, NMDS Eigenanalysis-based approaches Linear model Principal Components Analysis, PCA Unimodal model Correspondence Analysis, CA (Reciprocal Averaging) Detrended Correspondence Analysis, DCA Direct gradient analysis Linear model Redundancy Analysis, RDA Unimodal model Canonical Correspondence Analysis, CCA Detrended Canonical Correspondence Analysis, DCCA
24 Metoda Základní přehled hlavních ordinačních technik Použitá míra nepodobnosti (vzdálenosti, distance) Proměnné PCA Euklideovská vzdálenost Kvantitativní data, lineární vztah (pozor na dvojité nuly) PCoA, MDS jakákoliv Libovolné, i smíšené NMDS jakákoliv Libovolné, i smíšené CA Chi-square vzdálenost (distance) Nezáporné, škálově homogenní kvantitativní nebo binární data (abundance nebo prezence-absence) Faktorová analýza Euklideovská vzdálenost Kvantitativní data, lineární vztah (pozor na dvojité nuly) (Legendre & Legendre 1998, p. 388)
25 Přehled základních typů ordinace v historickém kontextu
26 Ordinace lokalizace vzorků v mnohorozměrném prostoru, jehož osami jsou druhy Abundance druhu B
27 Ordinace Ale také: lokalizace druhů v mnohorozměrném prostoru, jehož osami jsou vzorky Abundance ve vzorku 2
28 Ordinační metody zjednodušují mnohorozměrný prostor na 1 4 rozměry (princip není v redukci, ale v rotaci pohledu) 1. osa zachycuje směr největší variability v hyperprostoru 2. osa zachycuje další směr největší variability nezachycený 1. osou => nekoreluje s 1. osou (= orthogonalita) další osy zachycují další směry největší variability, nezachycené předchozími osami a nekorelují s předchozími osami variabilita zachycená jednotlivými osami je vyjádřena tzv. charakteristickými čísly (eigenvalues)
29 Příklad ordinačního diagramu ordinační osy
30 Centroid a inertia Centroid je střed objektu. Např. bod daný souřadnicemi - průměry dimenzí objektu (délka, výška, šířka). Pokud se objekty liší v hustotě, je nutné zahrnout tuto variabilitu do výpočtu polohy centroidu. Inertia je tendence objektu ležícího na daném místě v něm zůstat. Hodnota inertia objektu je přímo závislá na tom, jak je masa objektu rozložena kolem centroidu objektu. (= měřítko variability v mnohorozměrném prostoru)
31 Iterativní algoritmus ordinace Krok 1: Každému vzorku je přidělena určitá libovolná, ale navzájem nestejná hodnota (stanovištní skore) x i Krok 2: Pro každý druh se vypočítá závislost na hodnotách stanovištních skore x i (lineární regresí druhů na stanovištní skore pro lineární model nebo váženým průměrováním pro unimodální model) Krok 3: Vypočítají se nové hodnoty x i kalibrací s užitím závislostí získaných v předešlém kroku Krok 4: Odstranění zmenšení měřítka Krok 5: Pokud se hodnoty x i během cyklu nezměnily (změna je menší než stanovená mez), cyklus se zastavuje, v opačném případě se vrací na krok 2
32 Analýza hlavních komponent, PCA Principal Components Analysis Hotelling (1933) Lineární model (iterativní algoritmus využívá lineární regrese) Hlavní uplatnění při analýze kvantitativních dat (faktory prostředí, taxonomická data) nebo relativně homogenních dat o druhovém složení (krátký, ostrý gradient) Dvě nejpoužívanější varianty PCA na kovarianční matici (species-centered PCA) x i = x i Σ x i / n o nelze použít u proměnných měřených v různých jednotkách, málo vhodná u druhových dat s procentickými pokryvnostmi PCA na korelační matici (standardized PCA) x i Σ x i / n x i = s x o dává všem proměnným stejnou váhu
33 Jak funguje PCA? centroid Centrování + (standardizace) Druhy X1, X2, X3 Standardizované osy S1, S2, S3 Ordinační osy PCA 1, 2, 3 rotace
34 Poa pra Lol per Ordinační diagram PCA: druhy Škálování druhových skóre I Poa tri Ely rep Poa ann Ach mil Pla lan Tri rep Ran acr Rum ace Tri pra Ant odo Jun buf Cir arv Alo gen Em p nig Sal rep Air pra Hyp rad Agr sto Pot pal Jun art Ran fla Ele pal Cal cus Co značí délky vektorů druhů: 1. standardizace skóre děleno standardní odchylkou výsledkem je korelační biplot a délka vektoru je měřítkem fitu (R, mnohonásobný korelační koeficient) příslušného druhu v ordinačním diagramu. 2. bez dělení standardní odchylkou: délka odráží změny v abundanci druhu (dlouhý vektor = velká změna abundance, často dominantní druhy).
35 Ordinační diagram PCA: druhy Škálování druhových skóre II 1.0 hypnando Příklad: stejný datový soubor hypncupr lophbarb leucglau grimhart cynopoly paralong Vlevo: druhová skóre transformována (děleno standardní odchylkou) Dole vpravo: druhová skore bez transformace -0.2 plagchas plagtsuc schistsp hypncupr hypnando cynopoly paralong isotalop grimhart leucglau lophbarb plagchas rhizpunc schistsp plagtsuc
36 Ordinační diagram PCA: snímky
37 PCA: Biplot a biplot rule Dvě možnosti prezentace: o o o o o o o o o o distance biplot: vzdálenosti mezi objekty jsou aproximací jejich Euklideovských vzdáleností délka vektoru druhu indikuje jeho příspěvek k tomuto prostoru úhly mezi vektory druhů nemají význam vhodné pro reprezentaci vztahů mezi plochami correlation biplot: vzdálenosti mezi objekty nejsou aproximací jejich Euklideovských vzdáleností délka vektoru druhu je aproximací jeho standardní odchylky (variability) úhel mezi vektory druhů reprezentuje jejich korelaci vhodné pro reprezentaci vztahů mezi druhy 1.0 Poa tri Ely rep Poa pra 2 Bel per Lol per Bro hor 1 Tri rep Rum ace 7 5 Ach mil 10Tri pra Vic lat 6 Leo aut Pla lan 11 Ant odo 3 Alo gen Jun buf 12 Sag pro Cir arv Che alb 8 Pot pal Emp nig 14 Bra rut Air pra Hyp rad Sal rep Agr sto Jun art 16 Ran fla Ele pal Cal cus
38 Kolik os (komponent)? o V případě standardizované PCA je možné interpretovat osy s vlastními čísly > 1 o Pro nestandardizovanou PCA je možné interpretovat osy s vlastními čísly > průměrné vlastní číslo všech os čísly > průměrné vlastní číslo všech os o Empiricky: interpretovatelných je několik první os, většinou 2-4 o pomocné kritérium: Broken stick model (Frontier 1976)
39 Výhody a nevýhody PCA Lze použít i na ordinální či binární data (ale ne smíšená) + - Není vhodná pro vícestavové kvalitativní znaky PCA je dostatečně robustní Efekt podkovy u binárních (nevyžaduje data s dat mnohorozměrně normálním rozdělením) Počet znaků by měl být menší než počet vzorků (nevýhoda u RAPD či AFLP)
40 Analýza hlavních koordinát (PCoA) umožňuje pracovat se všemi typy proměnných a s různými mírami nepodobnosti (distancí), i neeukleidovskými může být s nimi problém některé hodnoty vlastních čísel mohou být negativní (řešení: transformace hodnot koef. disimilarity nebo ignorace negat. hodnot) obecnější forma PCA zobrazí pouze Euklideovskou část matice vzdáleností = nejlepší možná Euklideovská aproximace originální matice nepodobností!!! pracujeme pouze s několika prvními osami nevýhoda: nespecifikuje vztah druhů k ordinačním osám volná volba modelu (lineární, unimodální...) + souřadnice objektů na ordinačním grafu nejsou lineárně závislé na hodnotách původních znaků Duchoslav et al., Ann. Bot. 2010
41 Nemetrické mnohonásobné škálování (NMDS) cílem analýzy není uchování vzdáleností mezi objekty, ale pořadí vzdáleností mezi objekty, v několika málo dimenzích (tj. podobnější objekty jsou si blíže a méně podobné dále v ordinačním prostoru) umožňuje pracovat se všemi typy proměnných a s různými mírami nepodobnosti (distancí), i neeukleidovskými, symetrickými a nesymetrickými vhodná též pro situace, kdy chybějí některé párové hodnoty distancí Stress: míra kvality ordinace, míra shody založená na diferencích mezi fitovanou vzdáleností modelem (d ij ) a predikovanou (d ij ) regresní funkcí mezi empirickou vzdáleností a fitovanou vzdáleností rozsah 0-1, čím nižší, tím lepší, do 0.15 akceptovatelné, dle hodnoty volíme počet os Doporučené čtení: Fasham M. (1977), Ecology 58:
42 NMDS - příklad Matice nepodobností mezi sporty
43 Korespondenční analýza (CA) I. Correspondence Analysis Unimodální model (iterativní algoritmus využívá váženého průměrování) Hlavní uplatnění při analýze dat o druhovém složení, která obsahují hodně nulových hodnot Vážené průměrování zahrnuje standardizaci jak snímky tak druhy jakékoliv dva vzorky s identickými relativními abundancemi (vz. A: 1,2,3; vz. B: 10,20,30) budou považovány za identické!!! Odstranění zmenšení měřítka: x resc =(x-x min )/(x max -x min )*délka (Lepš et Šmilauer 2003, p. 36)
44 Korespondenční analýza (CA) II. Eigenvalue měří zároveň míru separace nik mezi druhy podél osy Pokud chci vědět % vysvětlené variability dané osy, musím dělit hodnotu eigenvalue celkovou variabilitou (total inertia) problém: efekt podkovy (arch effect) a zkreslení ekologické vzdálenosti
45 Detrendovaná korespondenční analýza, DCA, Detrended Correspondence Analysis Odstraňuje z CA arch effect a zkreslené ekologické vzdálenosti (v CA jsou snímky se stejnými rozdíly v druhovém složení umístěny blíže k sobě na koncích než uprostřed ordinační osy) Detrendování (detrending) odstraňuje arch effect po segmentech (by segments) přes mnohočleny (by polynomials) máš-li v DCA analýze kovariáty či faktory prostředí, použij tento typ!!! Přeškálování (rescaling) srovnává ekologické vzdálenosti po přeškálování je průměrná rychlost objevování se a mizení druhů na gradientech přibližně konstantní SD units (jednotky směrodatné odchylky) na vzdálenosti 1 SDU se vymění 1/2 druhů ve snímcích na vzdálenosti 4 SDU se úplně změní druhové složení snímků
46 Arch efekt v CA
47 Detrendování po segmentech Hill & Gauch 1980, Vegetatio 42: 47 58
48 Přeškálování Originální gradient 1. Osa CA 1. Osa DCA
49 Ordinační diagram DCA: vzorky
50 Ordinační diagram DCA: druhy 1.5 Vic lat Hip rha Hyp rad Air pra Sal rep Emp nig Pot pal Ant odo Pla lan Leo aut Ach mil Ran acr Bra rut Tri pra Rum ace Tri rep Bro hor Bel per Lol per Poa pra Poa ann Sag pro Ely rep Poa tri Cal cus Ran fla Jun art Ele pal Jun buf Agr sto Alo gen -1.5 Che alb Cir arv
51 DCA: joint diagram a centroid principe 4-1 Ant odo Pla lan Ach mil 17 Rum ace 5 6 Bel per Lol per Bro hor Sag pro Leo aut 18 Poa pra Ely rep Tri rep Poa tri Jun buf 12 Bra rut Sal rep Alo gen Dvě možnosti škálování: 1. distance rule: Ran fla Jun art pro dlouhé strmé 16 Agr sto gradienty (nad 2 Ele pal SD; Hillovo škálování) 2. biplot rule: pro krátké gradienty (do 2 SD)
52 Příklady použití ordinačních technik
53 DCA: ordinační diagram s klasifikací + Interpretace os pomocí korelační analýzy I (Hanáková et Duchoslav, Čas. Slez. Mus. 2002, p )
54 DCA: ordinační diagram s klasifikací + Interpretace os pomocí korelační analýzy II Vztah průměrné indikační hodnoty pro dusík a pozicí fyt.snímků na 1. ordinační ose DCA (viz předchozí snímek prezentace) (Hanáková et Duchoslav, Čas. Slez. Mus. 2002, p )
55 Ordinační diagram s klasifikací Chytrý & Sádlo 1997, Ann. Bot. 55:
56 Ordinační diagram s klasifikací Chytrý & Sádlo 1997, Ann. Bot. 55:
57 Změny vegetace hodnocené ordinací Chytrý & Danihelka 1993, Folia Geobot. Phytotax. 28:
58 Změny vegetace hodnocené ordinací Chytrý & Danihelka 1993, Folia Geobot. Phytotax. 28:
59 Změny vegetace hodnocené ordinací Chytrý & Danihelka 1993, Folia Geobot. Phytotax. 28:
60 Přímá ordinace (ordinace s omezením) Direct (constrained) ordination metoda přímé gradientové analýzy spojení ordinace a lineární regrese nehledá se cenoklina, ale popisuje se změna druhového složení v závislosti na měřených proměnných prostředí není vhodná, když nemáme žádnou představu o vztahu mezi proměnnými prostředí a druhovým složením společenstva: tehdy použijeme spíš nepřímou ordinaci je vhodná pro hodnocení ekologických experimentů nebo pozorování, kdy nás zajímá vztah druhového složení k předem vybraným proměnným
61 Iterativní algoritmus přímé ordinace Do iterativního algoritmu nepřímé ordinace se přidá: Krok 3a: Výpočet mnohonásobné lineární regrese získaných stanovištních skóre na měřených proměnných prostředí a nahrazení původních stanovištních skóre hodnotami aproximovanými touto regresí
62 Metody přímé ordinace Analýza redundance (redundancy analysis, RDA) metoda pro lineární model odvozená od PCA Kanonická korespondenční analýza (canonical correspondence analysis, CCA) metoda pro unimodální model odvozená od CA Detrendovaná kanonická korespondenční analýza (detrended canonical correspondence analysis, DCCA) metoda pro unimodální model odvozená od DCA
63 Jak pracuje CCA nejlepší gradient...
64 Metody přímé ordinace (RDA) Dune Meadow Data A1 1.0 Pot pal Moisture Ran acr Rum ace Tri pra Tri rep Ele pal Bel per Bra rut Vic lat Cir arv Cal cus Agr sto Ely rep Che alb Ran fla Leo aut Poa ann Poa tri Hip rha Jun buf Alo gen Jun art Hyp rad Emp nig Sal rep
65 Metody přímé ordinace (RDA) Dune Meadow Data Axes Total variance Eigenvalues : Species-environment correlations : Cumulative percentage variance of species data: of species-environment relation: Sum of all unconstrained eigenvalues Sum of all canonical eigenvalues.255
66 Metody přímé ordinace (CCA) Dune Meadow Data Pot pal A Moisture Tri pra Ran acr Pla lan Rum ace Bel per Cir arv Leo aut Tri rep Bra rut Hyp rad Air pra Sal rep Agr sto Poa ann Poa tri Alo gen Ant odo Hip rha Jun buf Sag pro Jun art Ele pal Cal cus Ran fla Che alb Emp nig
67 Metody přímé ordinace (CCA) Dune Meadow Data Axes Total inertia Eigenvalues: Species-environment correlations: Cumulative percentage variance of species data: of species-environment relation: Sum of all unconstrained eigenvalues Sum of all canonical eigenvalues.524
68 Metody přímé ordinace (CCA) Dune Meadow Data s nominálními proměnnými prostředí Hip rha Air pra Ant odo Sal rep Emp nig Hayfield Pasture A Haypastu Moisture 15 Vic lat Hyp rad Pla lan Ach mil Ran acr Rum ace Leo aut Bra rut Bel per Tri rep Bro hor Poa pra Jun buf Tri pra Poa ann Lol per Poa tri Sag pro Jun art Ran fla Agr sto Cal cus Ele pal Pot pal Alo gen Cir arv Che alb
69 Metody přímé ordinace (CCA) Dune Meadow Data s nominálními proměnnými prostředí Axes Total inertia Eigenvalues: Species-environment correlations: Cumulative percentage variance of species data: of species-environment relation: Sum of all unconstrained eigenvalues Sum of all canonical eigenvalues.765
70 Kódování proměnných prostředí v přímé ordinaci Dune Meadow Data ENVIRONMENTAL DATA IN FULL FORMAT - DUNE MEADOW DATA (I5,F5.0,1X,2F3.0,3X,3F2.0,3X,4F2.0) A1 MoistureManure HayfieldHaypastuPasture SF BF HF NM Sample 1Sample 2Sample 3Sample 4Sample 5Sample 6Sample 7Sample 8Sample 9Sample10 Sample11Sample12Sample13Sample14Sample15Sample16Sample17 SupplSAM Duplic17 Sample18Sample19Sample20
71 Parciální ordinace Odstraňuje část variability vysvětlené nezajímavými proměnnými (např. vliv bloku při hodnocení dat z pokusů) Následně se přímými nebo nepřímými ordinačním metodami analyzuje zbytková variabilita Technicky: nezajímavé proměnné se definují jako kovariáty (koproměnné, covariables) provede se regrese proměnných prostředí na kovariátách a rezidua této regrese zaujmou místo původních proměnných prostředí ordinační osy parciální ordinace reprezentují čistý vliv proměnných prostředí, s vyloučením vlivu kovariát
72 Parciální CCA Dune Meadow Data kovariáta: vlhkost, proměnná prostředí: hloubka půdního horizontu A1 4 4 Emp nig Air pra Hyp rad Ant odo A Sal rep Hip rha Pla lan Vic lat Tri pra Pot pal Bra rut Rum ace Sag pro Ran acr Bro hor Cal cus Poa pra Bel per Ele pal Poa ann Agr sto Alo gen Che alb -2 3
73 Parciální CCA Dune Meadow Data kovariáta: vlhkost, proměnná prostředí: hloubka půdního horizontu A1 Axes Total inertia Eigenvalues: Species-environment correlations: Cumulative percentage variance of species data: of species-environment relation: Sum of all unconstrained eigenvalues Sum of all canonical eigenvalues.125
74 Case study: Jak ovlivňuje podíl smrku ve stromovém patru druhové složení podrostu? Model: Partial RDA Envir. variable Picea cover Covariables Altitude Slope aspect Slope inclination Mineral soil depth Free carbonate depth Mottling depth Tree layer cover Results: Ax 1 eigenvalue Ax 1 significance % variance of species data 2.7 % variance of spec.-env. relation 100 RDA Ax 1 scores: positive negative Dicranum scopa 0.36 Fagus sylvatica Plagiomn affine 0.32 Sanicula europa Plagiothe curvif 0.29 Carex flacca Pleuroziu schre 0.28 Cicerbita alpina Hypnum cupres 0.26 Veronica monta Ewald 2000, Appl. Veg. Sci. 3:
75 Rozklad variance (variance partitioning) Borcard et al. 1992, Ecology 73: odděluje varianci vysvětlenou dvěma skupinami proměnných např. abiotické vs. biotické faktory proměnné prostředí vs. čas edafické vs. klimatické proměnné vlastnosti přírodního prostředí vs. zásahy člověka
76 Rozklad variance (variance partitioning) Borcard et al. 1992, Ecology 73: celková variabilita zbytková variabilita sdílená variabilita variabilita vysvětlená první skupinou proměnných variabilita vysvětlená druhou skupinou proměnných
77 Rozklad variance (variance partitioning) Borcard et al. 1992, Ecology 73: celková variabilita druhových dat (total inertia) minus součet zelené, fialové a červené variability variabilita vysvětlená 1. skupinou proměnných v analýze, kde 2. skupina proměnných tvoří kovariáty variabilita vysvětlená jednou ze dvou skupin proměnných v analýze bez kovariát minus variabilita vysvětlená v analýze s kovariátami variabilita vysvětlená 2. skupinou proměnných v analýze, kde 1. skupina proměnných tvoří kovariáty
78 Permutační test (Monte Carlo test) Testuje, zda vybraná proměnná prostředí má signifikantní vliv na druhové složení Nulová hypotéza: variabilita druhového složení je nezávislá na testované proměnné prostředí Spočítá se statistika F (poměr variability vysvětlené regresí a reziduální variability) pro reálná data Permutace: náhodně se přeskupí hodnoty proměnné prostředí mezi jednotlivými snímky a spočítá se F Envir. variable Species Species Species
79 Permutační test (Monte Carlo test) Permutace se provede mnohokrát a vždy se zaznamená hodnota F Udělá se rozložení těchto hodnot a porovná se s hodnotou F pro skutečná (nepermutovaná) data rozložení hodnot F pro všechny permutace F původních dat vliv proměnné je signifikantní F původních dat vliv proměnné je nesignifikantní F
80 Permutační test (Monte Carlo test) 19 permutací test pro 5% hladinu významnosti (P<0.05) 99 permutací test pro 1% hladinu významnosti (P<0.01) 999 permutací test pro 0.1% hladinu významnosti (P<0.001)
81 Permutační test (Monte Carlo test) test první kanonické osy např. zajímá-li nás vliv jedné kvantitativní proměnné test všech kanonických os např. zajímá-li nás vliv nominální proměnné s několika kategoriemi test částečného (podmíněného; partial, conditional) vlivu proměnné, jsou-li v modelu zahrnuty už jiné proměnné
82 Permutační test (Monte Carlo test) unrestricted permutations data nemají žádnou vnitřní strukturu, zápisy jsou nezávislé unrestricted permutation within blocks defined by covariables restricted permutations for time series or line transects pro potenciálně autokorelovaná data split-plot design složitější uspořádání: split plots jsou vřazeny do whole plots
83
84 Příklady použití přímé ordinace pro studium vztahů mezi druhovým složením a vnějšími faktory
85 Změna vegetace v čase: opakování starých fytocenologických snímků testovaná proměnná: čas (nominální proměnná: staré zápisy 0, nové zápisy 1) kovariáty: jakékoliv změřené proměnné, které mohou ovlivňovat variabilitu vegetace v prostoru např. nominálně kódovaná lokalita nominálně kódované geologické podloží topografický index xericity nadmořská výška randomizace: unrestricted permutations; jsou-li nominální kovariáty, unrestricted permutations within blocks defined by covariables
86 Změna vegetace v čase: trvalé plochy testovaná proměnná: čas jeden záznam každoročně nebo studium změn během jediné sezóny kovariáty: jakékoliv změřené proměnné, které mohou ovlivňovat variabilitu vegetace v prostoru randomizace: restricted permutations for time series or line transects within blocks defined by covariables (jednotlivé plochy jsou definovány jako kovariáty); jsou-li další nominální kovariáty, použije se split-plot design víceleté studium s několika záznamy v každém roce kovariáty: tytéž, navíc nominální proměnné kódující sezónu (např. květen, červenec, září) nebo čas od začátku roku randomizace: je-li sezóna kódována nominálními proměnnými, použije se split-plot design, kde plochy jsou randomizovány odděleně ve whole plots a sezóny ve split-plots
87 Permutace dat z trvalých ploch V každém obdélníku restricted permutations for time series Plot 1 Whole plots Plot 2 Plot
88 Analýza dat z transektů testovaná proměnná: např. ph, hloubka půdy, pokryvnost stromového patra apod., zaznamenávané na transektu randomizace: restricted permutation for time series or line transects prochází-li transekt výrazným gradientem, lze tento gradient odstranit použitím pořadí plochy na transektu jako kovariáty společná analýza dat z více transektů variabilita mezi transekty se může odstranit definováním transektů jako série nominálních kovariát randomizace restricted permutation for time series or line transects, blocks defined by covariables
89 Analýza terénních manipulativních pokusů testovaná proměnná: interakce času a pokusného zásahu (např. kosení a kontrola) kovariáty: nominálně kódované plochy (zahrnují i pokusné zásahy), čas randomizace: split-plot design: whole plots (zásahy): freely exchangeable split plots (stejné plochy v různých časech: restricted permutation for time series or line transects je-li víc typů pokusných zásahů, testují se společně, každý jako interakce s časem v jednom modelu, čas jako kovariáta každý zvlášť jako interakce s časem, přičemž vždy interakce ostatních zásahů s časem jsou kovariáty a čas je také kovariáta
90 Kódování orientace svahu 360 o = 0 o PDSI modely 315 o 45 o (potential direct solar irradiation) Heat index (Parker 1988) 270 o 225 o 180 o 90 o 135 o HI = cos (orientace 225 o ) * tg sklonu Topografický index relativní vlhkosti (Parker 1982) vrchol hřebene = 0, dno údolí = 20 JJZ = 0, SSV = 20 sklon > 30 o = 0, 0 o = 10 konvexní = 0, konkávní = 10
PCA BIPLOT ŠKÁLOVÁNÍ OS (1)
PCA BIPLOT ŠKÁLOVÁNÍ OS (1) 1 (sites) o zaměření na odlišnosti mezi lokalitami zachovány euklidovské vzdálenosti mezi vzorky úhly mezi šipkami neodpovídají kovariancím (korelacím) proměnných variance skóre
VíceDavid Zelený GRADIENTOVÁ ANALÝZA
David Zelený Zpracování dat v ekologii společenstev G GRADIENTOVÁ ANALÝZA HISTORIE WHITTAKER 1956 - PŘÍMÁ GRADIENTOVÁ ANALÝZA Zpracování dat v ekologii společenstev 108 Whittaker (1956): Vegetation of
VíceELLENBERGOVY INDIKAČNÍ HODNOTY. David Zelený Zpracování dat v ekologii společenstev
3 2 6 6 5 2 ELLENBERGOVY INDIKAČNÍ HODNOTY ELLENBERGOVY INDIKAČNÍ HODNOTY (EIH) optima druhů rostlin na gradientu živin, vlhkosti, půdní reakce, kontinentality, teploty, světla a salinity (salinita se
VícePŘÍKLADY POUŽITÍ ORDINAČNÍCH METOD
PŘÍKLADY POUŽITÍ ORDINAČNÍCH METOD 1 PŘÍKLAD NA ROZKLAD VARIANCE SPOLEČENSTVA MĚKKÝŠŮ NA PRAMENIŠTÍCH druhové složení společenstev měkkýšů druhové složení slatiništní vegetace ph Ca cond Mg Na měřené proměnné
VíceELLENBERGOVY INDIKAČNÍ HODNOTY. David Zelený Zpracování dat v ekologii společenstev
3 2 6 6 5 2 ELLENBERGOVY INDIKAČNÍ HODNOTY ELLENBERGOVY INDIKAČNÍ HODNOTY (EIH) optima druhů rostlin na gradientu ţivin, vlhkosti, půdní reakce, kontinentality, teploty, světla a salinity (salinita se
VíceVícerozměrné statistické metody
Vícerozměrné statistické metody Ordinační analýzy principy redukce dimenzionality Jiří Jarkovský, Simona Littnerová FSTA: Pokročilé statistické metody Ordinační analýza a její cíle Cíle ordinační analýzy
VíceÚvodem Dříve les než stromy 3 Operace s maticemi
Obsah 1 Úvodem 13 2 Dříve les než stromy 17 2.1 Nejednoznačnost terminologie 17 2.2 Volba metody analýzy dat 23 2.3 Přehled vybraných vícerozměrných metod 25 2.3.1 Metoda hlavních komponent 26 2.3.2 Faktorová
VíceOrdinační analýzy v programu JUICE
Ordinační analýzy v programu JUICE Martina Nejezchlebová, Blansko, 30. 8. 2011 1.1 Ordinační analýzy Jsou nedílnou součástí mnoha vegetačních a ekologických analýz. V programu JUICE (Tichý 2002) v kombinaci
VíceSPECIES ATTRIBUTES IN ANALYSIS OF COMMUNITY ECOLOGY DATA
SPECIES ATTRIBUTES IN ANALYSIS OF COMMUNITY ECOLOGY DATA HOW TO ANALYSE RELATIONSHIP BETWEEN SAMPLE ATTRIBUTES AND SPECIES ATTRIBUTES VIA SPECIES COMPOSITION? species sample attributes samples L R 222
VíceEKOLOGICKÁ PODOBNOST (ECOLOGICAL RESEMBLANCE) David Zelený Zpracování dat v ekologii společenstev
EKOLOGICKÁ PODOBNOST (ECOLOGICAL RESEMBLANCE) EKOLOGICKÁ PODOBNOST Q VS R ANALÝZA Vzorky Druhy druh 1 druh 2 druh 3 vzorek 1 0 1 1 vzorek 2 1 0 0 vzorek 3 0 4 4 vztahy mezi vzorky Q analýza vztahy mezi
VíceStatistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
VíceSTATISTICKÉ METODY; ZÍSKÁVÁNÍ INFORMACÍ Z DRUHOVÝCH A ENVIRONMENTÁLNÍCH DAT
STATISTICKÉ METODY; ZÍSKÁVÁNÍ INFORMACÍ Z DRUHOVÝCH A ENVIRONMENTÁLNÍCH DAT (NE)VÝHODY STATISTIKY OTÁZKY si klást ještě před odběrem a podle nich naplánovat design, metodiku odběru (experimentální vs.
VíceREGRESE VS KALIBRACE. David Zelený Zpracování dat v ekologii společenstev
REGRESE VS KALIBRACE David Zelený METODY GRADIENTOVÉ ANALÝZY Data, která máme: počet charakteristik prostředí počet druhů Apriorní znalost vztahů mezi druhy a prostředím? Použijeme: Dostaneme: 1, n 1 ne
VíceZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV
ZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV OSNOVA PŘEDNÁŠKY Příprava dat pro numerické analýzy typy sbíraných dat, čištění dat, odlehlé body, transformace, standardizace, EDA Ekologická podobnost indexy podobnosti
VíceKorelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza
Korelační a regresní analýza 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza Pearsonův korelační koeficient u intervalových a poměrových dat můžeme jako
VíceUniverzita Pardubice 8. licenční studium chemometrie
Univerzita Pardubice 8. licenční studium chemometrie Statistické zpracování dat při managementu jakosti Semestrální práce Metody s latentními proměnnými a klasifikační metody Ing. Jan Balcárek, Ph.D. vedoucí
VíceProfilování vzorků heroinu s využitím vícerozměrné statistické analýzy
Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Autor práce : RNDr. Ivo Beroun,CSc. Vedoucí práce: prof. RNDr. Milan Meloun, DrSc. PROFILOVÁNÍ Profilování = klasifikace a rozlišování
VíceZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV
ZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV OSNOVA PŘEDNÁŠKY Příprava dat pro numerické analýzy typy sbíraných dat, čištění dat, odlehlé body, transformace, standardizace, EDA Ekologická podobnost indexy podobnosti
VíceGrafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan
1 Úvod 1.1 Empirický výzkum a jeho etapy 1.2 Význam teorie pro výzkum 1.2.1 Konstrukty a jejich operacionalizace 1.2.2 Role teorie ve výzkumu 1.2.3 Proces ověření hypotéz a teorií 1.3 Etika vědecké práce
VíceHluboká říční údolí jako objekt pro modelování vztahů vegetace a proměnných prostředí?
David Zelený Biologická fakulta JčU v Českých Budějovicích školitel: Milan Chytrý (PřF MU Brno) Hluboká říční údolí jako objekt pro modelování vztahů vegetace a proměnných prostředí? Vltava pod Dívčím
VíceZpracování geobotanických dat v. Sestavili Tomáš Herben a Zuzana Münzbergová
Zpracování geobotanických dat v Sestavili Tomáš Herben a Zuzana Münzbergová Praha, 2002 1 Poznámka na úvod zvem), kterým chceme pokrýt typické problémy v analyzovat a s v taxonomii, Marhold a Suda 2001).
VíceObsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou
Úvod.................................................................. 11 Kapitola 1 Než začneme.................................................................. 17 1.1 Logika kvantitativního výzkumu...........................................
Více6. Lineární regresní modely
6. Lineární regresní modely 6.1 Jednoduchá regrese a validace 6.2 Testy hypotéz v lineární regresi 6.3 Kritika dat v regresním tripletu 6.4 Multikolinearita a polynomy 6.5 Kritika modelu v regresním tripletu
VíceINDUKTIVNÍ STATISTIKA
10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ HODNOCENÍ ZÁVISLOSTÍ KVALITATIVNÍ VELIČINY - Vychází se z kombinační (kontingenční) tabulky, která je výsledkem třídění druhého stupně KVANTITATIVNÍ
Více1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou
VíceInovace bakalářského studijního oboru Aplikovaná chemie
http://aplchem.upol.cz CZ.1.07/2.2.00/15.0247 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Regrese Závislostproměnných funkční y= f(x) regresní y= f(x)
VíceRNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.
Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 7 Jak hodnotit vztah spojitých proměnných
VíceZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV
ZPRACOVÁNÍ DAT V EKOLOGII SPOLEČENSTEV OSNOVA PŘEDNÁŠKY Typy sbíraných dat kategoriální vs kvantitativní, pokryvnosti, frekvence Příprava dat pro numerické analýzy čištění dat, odlehlé body, transformace,
VíceUNIVERZITA PARDUBICE. 4.4 Aproximace křivek a vyhlazování křivek
UNIVERZITA PARDUBICE Licenční Studium Archimedes Statistické zpracování dat a informatika 4.4 Aproximace křivek a vyhlazování křivek Mgr. Jana Kubátová Endokrinologický ústav V Praze, leden 2012 Obsah
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VíceCronbachův koeficient α nová adaptovaná metoda uvedení vlastností položkové analýzy deskriptivní induktivní parametrické
Československá psychologie 0009-062X Metodologické požadavky na výzkumné studie METODOLOGICKÉ POŽADAVKY NA VÝZKUMNÉ STUDIE Výzkumné studie mají přinášet nová konkrétní zjištění získaná specifickými výzkumnými
VícePravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1
Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu
VíceAVDAT Mnohorozměrné metody, metody klasifikace
AVDAT Mnohorozměrné metody, metody klasifikace Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Mnohorozměrné metody Regrese jedna náhodná veličina je vysvětlována pomocí jiných
VíceAVDAT Mnohorozměrné metody metody redukce dimenze
AVDAT Mnohorozměrné metody metody redukce dimenze Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Opakování vlastní čísla a vlastní vektory A je čtvercová matice řádu n. Pak
VíceNUMERICKÁ KLASIFIKACE. David Zelený Zpracování dat v ekologii společenstev
NUMERICKÁ KLASIFIKACE http://wfc3.gsfc.nasa.gov PROČ MÁ SMYSL VĚCI KLASIFIKOVAT? vlnová délka (~ ekologický gradient) 172 http://wfc3.gsfc.nasa.gov PROČ MÁ SMYSL VĚCI KLASIFIKOVAT? vlnová délka (~ ekologický
Více2019/03/31 17:38 1/2 Klasifikační a regresní stromy
2019/03/31 17:38 1/2 Klasifikační a regresní stromy Table of Contents Klasifikační a regresní stromy... 1 rpart (library rpart)... 1 draw.tree (library maptree)... 3 plotcp a rsq.rpart (library rpart)...
VíceFakulta chemicko-technologická Katedra analytické chemie. 3.2 Metody s latentními proměnnými a klasifikační metody
Fakulta chemicko-technologická Katedra analytické chemie 3.2 Metody s latentními proměnnými a klasifikační metody Vypracoval: Ing. Tomáš Nekola Studium: licenční Datum: 21. 1. 2008 Otázka 1. Vypočtěte
VíceVícerozměrné statistické metody
Vícerozměrné statistické metody Ordinační analýzy přehled metod Jiří Jarkovský, Simona Littnerová FSTA: Pokročilé statistické metody Analýza hlavních komponent jako příklad výpočtu redukce dimenzionality
VíceMÍRY ZÁVISLOSTI (KORELACE A REGRESE)
zhanel@fsps.muni.cz MÍRY ZÁVISLOSTI (KORELACE A REGRESE) 2.5 MÍRY ZÁVISLOSTI 2.5.1 ZÁVISLOST PEVNÁ, VOLNÁ, STATISTICKÁ A KORELAČNÍ Jednorozměrné soubory - charakterizovány jednotlivými statistickými znaky
VíceSEMESTRÁLNÍ PRÁCE 3.5 Klasifikace analýzou vícerozměrných dat
UNIVERZITA PARDUBICE FAKULTA CHEMICKO-TECHNOLOGICKÁ KATEDRA ANALYTICKÉ CHEMIE LICENČNÍ STUDIUM - STATISTICKÉ ZPRACOVÁNÍ DAT SEMESTRÁLNÍ PRÁCE Ing. Věra Fialová BIOPHARM VÝZKUMNÝ ÚSTAV BIOFARMACIE A VETERINÁRNÍCH
VíceMann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek
10. Neparametrické y Mann-Whitney U- Wilcoxonův Znaménkový Shrnutí statistických ů Typ srovnání Nulová hypotéza Parametrický Neparametrický 1 skupina dat vs. etalon Střední hodnota je rovna hodnotě etalonu.
VícePorovnání dvou výběrů
Porovnání dvou výběrů Menu: QCExpert Porovnání dvou výběrů Tento modul je určen pro podrobnou analýzu dvou datových souborů (výběrů). Modul poskytuje dva postupy analýzy: porovnání dvou nezávislých výběrů
VíceProstorová variabilita
Prostorová variabilita prostorová závislost (autokorelace) reprezentuje korelaci mezi hodnotami určité náhodné proměnné v místě i a hodnotami téže proměnné v jiném místě j; prostorová heterogenita je strukturální
VíceRegresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
VíceINDEXY DIVERZITY. David Zelený Zpracování dat v ekologii společenstev
INDEXY DIVERZITY ALFA, BETA A GAMA DIVERZITA Alfa diverzita druhová bohatost vzorku Beta diverzita (species turnover) změna v druhovém složení mezi vzorky Gama diverzita celková druhová bohatost regionu
VíceRegrese. používáme tehdy, jestliže je vysvětlující proměnná kontinuální pokud je kategoriální, jde o ANOVA
Regrese používáme tehd, jestliže je vsvětlující proměnná kontinuální pokud je kategoriální, jde o ANOVA Specifikace modelu = a + bx a závisle proměnná b x vsvětlující proměnná Cíl analýz Odhadnout hodnot
Více1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,
KMA/SZZS1 Matematika 1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností, operace s limitami. 2. Limita funkce
VíceJEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica
JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu
VíceUNIVERZITA PARDUBICE. Semestrální práce z 5. soustředění
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Licenční studium chemometrie na téma Statistické zpracování dat Semestrální práce z 5. soustředění Předmět: 3.5 Klasifikace
VíceKlasická a robustní ortogonální regrese mezi složkami kompozice
Klasická a robustní ortogonální regrese mezi složkami kompozice K. Hrůzová, V. Todorov, K. Hron, P. Filzmoser 13. září 2016 Kompoziční data kladná reálná čísla nesoucí pouze relativní informaci, x = (x
VíceAVDAT Geometrie metody nejmenších čtverců
AVDAT Geometrie metody nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model klasický lineární regresní model odhad parametrů MNČ y = Xβ + ε, ε
VíceAnalýza dat na PC I.
CENTRUM BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita Analýza dat na PC I. Popisná analýza v programu Statistica IBA výuka Základní popisná statistika Popisná statistika
VícePravděpodobnost a aplikovaná statistika
Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 2. KAPITOLA PODMÍNĚNÁ PRAVDĚPODOBNOST 3. KAPITOLA NÁHODNÁ VELIČINA 9.11.2017 Opakování Uveďte příklad aplikace geometrické definice pravděpodobnosti
VíceKorelace. Komentované řešení pomocí MS Excel
Korelace Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A2:B84 (viz. obrázek) Prvotní představu o tvaru a síle závislosti docházky a počtu bodů nám poskytne
VíceLINEÁRNÍ REGRESE. Lineární regresní model
LINEÁRNÍ REGRESE Chemometrie I, David MILDE Lineární regresní model 1 Typy závislosti 2 proměnných FUNKČNÍ VZTAH: 2 závisle proměnné: určité hodnotě x odpovídá jediná hodnota y. KORELACE: 2 náhodné (nezávislé)
VíceJednofaktorová analýza rozptylu
I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých
VíceMěření závislosti statistických dat
5.1 Měření závislosti statistických dat Každý pořádný astronom je schopen vám předpovědět, kde se bude nacházet daná hvězda půl hodiny před půlnocí. Ne každý je však téhož schopen předpovědět v případě
VíceNormální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký
VíceKGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost
VícePSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz
PSY117/454 Statistická analýza dat v psychologii seminář 9 Statistické testování hypotéz Základní výzkumné otázky/hypotézy 1. Stanovení hodnoty parametru =stanovení intervalu spolehlivosti na μ, σ, ρ,
VícePokročilé neparametrické metody. Klára Kubošová
Klára Kubošová Další typy stromů CHAID, PRIM, MARS CHAID - Chi-squared Automatic Interaction Detector G.V.Kass (1980) nebinární strom pro kategoriální proměnné. Jako kriteriální statistika pro větvení
VíceTestování hypotéz o parametrech regresního modelu
Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO
VícePřednáška 13 Redukce dimenzionality
Vytěžování Dat Přednáška 13 Redukce dimenzionality Miroslav Čepek Fakulta Elektrotechnická, ČVUT Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti ČVUT (FEL) Redukce dimenzionality 1 /
VíceINDEXY DIVERZITY. David Zelený Zpracování dat v ekologii společenstev
INDEXY DIVERZITY Jurasinski et al. (2009) ALFA, BETA A GAMA DIVERZITA Alfa diverzita druhová bohatost vzorku Beta diverzita (species turnover) změna v druhovém složení mezi vzorky Gama diverzita celková
VíceLineární regrese. Komentované řešení pomocí MS Excel
Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních
VíceKategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1
Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA 2018 4. dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Typy proměnných nominální (nominal) o dvou hodnotách lze říci pouze
VíceTomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
VíceVícerozměrné metody. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Schematický úvod
PSY117/454 Statistická analýza dat v psychologii Přednáška 12 Vícerozměrné metody Schematický úvod Co je na slově statistika tak divného, že jeho vyslovení tak často způsobuje napjaté ticho? William Kruskal
Více{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků
Příklad: Test nezávislosti kategoriálních znaků Určete na hladině významnosti 5 % na základě dat zjištěných v rámci dotazníkového šetření ve Šluknově, zda existuje závislost mezi pohlavím respondenta a
VíceLINEÁRNÍ MODELY. Zdeňka Veselá
LINEÁRNÍ MODELY Zdeňka Veselá vesela.zdenka@vuzv.cz Genetika kvantitativních vlastností Jednotlivé geny nejsou zjistitelné ani měřitelné Efekty většího počtu genů poskytují variabilitu, kterou lze většinou
Více5EN306 Aplikované kvantitativní metody I
5EN306 Aplikované kvantitativní metody I Přednáška 5 Zuzana Dlouhá Předmět a struktura kurzu 1. Úvod: struktura empirických výzkumů 2. Tvorba ekonomických modelů: teorie 3. Data: zdroje a typy dat, význam
VícePříklad 2: Určení cihlářských surovin na základě chemické silikátové analýzy
Příklad 2: Určení cihlářských surovin na základě chemické silikátové analýzy Zadání: Deponie nadložních jílových sedimentů SHP byla testována za účelem využití v cihlářské výrobě. Z deponie bylo odebráno
VíceTestování hypotéz o parametrech regresního modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,
VíceMetoda backward výběru proměnných v lineární regresi a její vlastnosti
Metoda backward výběru proměnných v lineární regresi a její vlastnosti Aktuárský seminář, 13. dubna 2018 Milan Bašta 1 / 30 1 Metody výběru proměnných do modelu 2 Monte Carlo simulace, backward metoda
VícePokročilé neparametrické metody. Klára Kubošová
Pokročilé neparametrické metody Klára Kubošová Pokročilé neparametrické metody Výuka 13 přednášek doplněných o praktické cvičení v SW Úvod do neparametrických metod + princip rozhodovacích stromů Klasifikační
VíceStatistická analýza jednorozměrných dat
Statistická analýza jednorozměrných dat Prof. RNDr. Milan Meloun, DrSc. Univerzita Pardubice, Pardubice 31.ledna 2011 Tato prezentace je spolufinancována Evropským sociálním fondem a státním rozpočtem
VíceInferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů
Inferenční statistika - úvod z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů Pravděpodobnost postupy induktivní statistiky vycházejí z teorie pravděpodobnosti pravděpodobnost, že
VíceUNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie
UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie Licenční studium Pythagoras Statistické zpracování experimentálních dat Semestrální práce ANOVA vypracoval: Ing. David Dušek
VíceZávislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely )
Úloha M608 Závislost obsahu lipoproteinu v krevním séru na třech faktorech ( Lineární regresní modely ) Zadání : Při kvantitativní analýze lidského krevního séra ovlivňují hodnotu obsahu vysokohustotního
VícePopisná statistika. Komentované řešení pomocí MS Excel
Popisná statistika Komentované řešení pomocí MS Excel Vstupní data Máme k dispozici data o počtech bodů z 1. a 2. zápočtového testu z Matematiky I v zimním semestru 2015/2016 a to za všech 762 studentů,
VíceVícerozměrné statistické metody
Vícerozměrné statistické metody Podobnosti a vzdálenosti ve vícerozměrném prostoru, asociační matice II Jiří Jarkovský, Simona Littnerová Vícerozměrné statistické metody Práce s asociační maticí Vzdálenosti
VíceKORELACE. Komentované řešení pomocí programu Statistica
KORELACE Komentované řešení pomocí programu Statistica Vstupní data I Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná
VíceTERMINOLOGIE ... NAMĚŘENÁ DATA. Radek Mareček PŘEDZPRACOVÁNÍ DAT. funkční skeny
PŘEDZPRACOVÁNÍ DAT Radek Mareček TERMINOLOGIE Session soubor skenů nasnímaných během jednoho běhu stimulačního paradigmatu (řádově desítky až stovky skenů) Sken jeden nasnímaný objem... Voxel elementární
VíceVícerozměrná rozdělení
Vícerozměrná rozdělení 7. září 0 Učivo: Práce s vícerozměrnými rozděleními. Sdružené, marginální, podmíněné rozdělení pravděpodobnosti. Vektorová střední hodnota. Kovariance, korelace, kovarianční matice.
VíceEva Fišerová a Karel Hron. Katedra matematické analýzy a aplikací matematiky Přírodovědecká fakulta Univerzity Palackého v Olomouci.
Ortogonální regrese pro 3-složkové kompoziční data využitím lineárních modelů Eva Fišerová a Karel Hron Katedra matematické analýzy a aplikací matematiky Přírodovědecká fakulta Univerzity Palackého v Olomouci
VíceAplikovaná statistika v R - cvičení 3
Aplikovaná statistika v R - cvičení 3 Filip Děchtěrenko Matematicko-fyzikální fakulta filip.dechterenko@gmail.com 5.8.2014 Filip Děchtěrenko (MFF UK) Aplikovaná statistika v R 5.8.2014 1 / 10 Lineární
VíceAVDAT Klasický lineární model, metoda nejmenších
AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i
VíceNormální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními
Více5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza
5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně
VíceZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY
zhanel@fsps.muni.cz ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY METODY DESKRIPTIVNÍ STATISTIKY 1. URČENÍ TYPU ŠKÁLY (nominální, ordinální, metrické) a) nominální + ordinální neparametrické stat. metody b) metrické
Vícedat Robust ledna 2018
Analýza prostorově závislých funkcionálních dat V. Římalová, A. Menafoglio, A. Pini, E. Fišerová Robust 2018 25. ledna 2018 Motivace Data a náhled lokace Měsíční měření (březen-říjen 2015 a 2016) 5 chemických
VícePokud data zadáme přes "Commands" okno: SDF1$X1<-c(1:15) //vytvoření řady čísel od 1 do 15 SDF1$Y1<-c(1.5,3,4.5,5,6,8,9,11,13,14,15,16,18.
Regresní analýza; transformace dat Pro řešení vztahů mezi proměnnými kontinuálního typu používáme korelační a regresní analýzy. Korelace se používá pokud nelze určit "kauzalitu". Regresní analýza je určena
VíceSPOLEHLIVOST KONSTRUKCÍ & TEORIE SPOLEHLIVOSTI část 5: Aproximační techniky
SPOLEHLIVOST KONSTRUKCÍ & TEORIE SPOLEHLIVOSTI část 5: Aproximační techniky Drahomír Novák Jan Eliáš 2012 Spolehlivost konstrukcí, Drahomír Novák & Jan Eliáš 1 část 5 Aproximační techniky 2012 Spolehlivost
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Definice lineárního normálního regresního modelu Lineární normální regresní model Y β ε Matice n,k je matice realizací. Předpoklad: n > k, h() k - tj. matice je plné hodnosti
VíceStanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace )
Příklad č. 1 Stanovení manganu a míry přesnosti kalibrace ( Lineární kalibrace ) Zadání : Stanovení manganu ve vodách se provádí oxidací jodistanem v kyselém prostředí až na manganistan. (1) Sestrojte
VícePopisná statistika kvantitativní veličiny
StatSoft Popisná statistika kvantitativní veličiny Protože nám surová data obvykle žádnou smysluplnou informaci neposkytnou, je žádoucí vyjádřit tyto ve zhuštěnější formě. V předchozím dílu jsme začali
VíceTestování hypotéz a měření asociace mezi proměnnými
Testování hypotéz a měření asociace mezi proměnnými Testování hypotéz Nulová a alternativní hypotéza většina statistických analýz zahrnuje různá porovnání, hledání vztahů, efektů Tvrzení, že efekt je nulový,
VíceÚvod do problematiky měření
1/18 Lord Kelvin: "Když to, o čem mluvíte, můžete změřit, a vyjádřit to pomocí čísel, něco o tom víte. Ale když to nemůžete vyjádřit číselně, je vaše znalost hubená a nedostatečná. Může to být začátek
Více