ČVUT V PRAZE, Fakulta stavební, Geoinformatika Pokročilé metody geostatistiky v R-projektu Autoři: Vedoucí projektu: RNDr. Dr. Nosková Jana Studentská grantová soutěž ČVUT 2011 Praha, 2011
Geostatistika Geostatistika se zabývá odhady a předpovědí spojitých jevů v prostoru za použití dat jen z omezeného počtu míst v tomto prostoru. Využití: nadmořské výšky, teploty, znečištění, vegetační indexy, naleziště nerostných surovin, výskyty epidemíı,...
Projekt R Nástroj pro statistické výpočty a tvorbu grafů Open source software pod GNU licencí Pro UNIX, Windows, MacOS Některé vlastnosti: Vytváření grafů Operátory pro práci s poli (matice) Analýza a zobrazování dat Jednoduchý a efektivní programovací jazyk Mnoho rozšíření a baĺıčků
Projekt R - geostatistické baĺıčky (1) Baĺıčky pro geostatistiku: geor geostatistická analýza dat a predikce, doplňuje dříve vytvořené funkce pro geostatistiku v R, používá výpočty založené na modelech gstat velké množství funkcí pro geostatistiku jedné i více proměnných, samozřejmostí je také tvorba variogramů a kriging sgeostat objektově orientované prostředí pro geostatistické modelování v S+ fields dobrá manipulace s prostorovými daty v rastrovém formátu RandomFields funkce pro simulace a analýzu náhodných prostorových dat, kriging vardiag interaktivní diagnóza variogramu sgeostat, tripack, akima, spatial, splancs, spatstat,...
Vzorová data (1) Data jsou odvozená z digitálního modelu terénu z oblasti Walker Lake v Nevadě. Dostupná jsou v jazyce R přes baĺıček gstat pod názvem walker. U rozptyl daných 25 hodnot vypočtený podle vzorce U = σ 2 = 1 25 25 i=1 (x i x) 2, kde x 1, x 2,..., x 25 jsou hodnoty nadmořské výšky v metrech, V je funkcí průměru a rozptylu, danou vzorcem V = [ x log(u + 1)]/10.
Vzorová data (2)
Vzorová data (3) Ukázka veličiny V : V = [ x log(u +1)]/10. Celkem 78 000 hodnot. Vybráno 470 bodů.
Vzorová data (4) Ukázka veličiny V : V = [ x log(u +1)]/10. Celkem 78 000 hodnot. Vybráno 470 bodů.
# základní statistika - popis dat > summary(v) Number of data points: 470 Coordinates summary V2 V3 min 8 8 max 251 291 Distance summary min max 2.0000 370.4187 Data summary Min. 1st Qu. Median Mean 3rd Qu. Max. 0.0 184.6 424.0 435.3 640.8 1528.0 # rozptyl > rozptyl = sqrt(sum((v-435.3)^2)/length(v)) 299.56 # mezikvartilový rozptyl > IQR = 640.8-184.6 456.2 # koeficient šikmosti > CS = sum((v-435.3)^3)/rozptyl^3/length(v) 0.46 # koeficient variace > CV = rozptyl/435.3 0.69
Základní statistiké výpočty pro jednu proměnnou (2) Grafický popis dat: Histogram Box-and-whisker plot Q-Q plot
Prostorový popis a analýza Vykreslení dat Vrstevnice Pohyblivá okna scatterplot pro průměr a směrodatnou odchylku h scatterplot
Náhrada mapy ve stupních šedi Y Coord 0 50 100 150 200 250 300 0 50 100 150 200 250 X Coord
Variogram Popisuje prostorovou korelaci mezi daty. γ(h) = 1 [Y (x i ) Y (x i + h)] 2. 2n i=1
Empirický variogram
Teoretický variogram
Predikce pomocí ordinary kriging (1) # grid pro výslednou předpověd loci <- expand.grid(seq(0,260,by=1), seq(0,300,by=1)) # ordinary kriging kc <- krige.conv(data,loc=loci, krige=krige.control( type.krige="ok", cov.model="exponential", cov.pars=c(80000,40)))
Predikce pomocí ordinary kriging (2)
Predikce pomocí ordinary kriging (3)
Webová aplikace
Závěr Základy geostatistiky Pokročilé metody v geostatistice Zobecněné lineární modely pro geostatistická data Bayesovské metody Webová aplikace
Děkujeme za pozornost