GEOSTATISTIKA. Ing. Jan Popelka, Ph.D. Fakulta životního prostředí UJEP (výběr z materiálu)

Podobné dokumenty
Prostorová variabilita

REGIONÁLNÍ KONCENTRACE AKTIVIT PODNIKŮ. Příklad využití individuálních dat ve spojení s autokorelační statistikou

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)

Algoritmy pro shlukování prostorových dat

Cíl Vyhodnotit současný stav migračně prostorové diferenciace území ČR a migrační tendence na základě údajů za obce ČR

Prostorová autokorelace všudypřítomný jev při analýze prostorových dat?

Popisná statistika. Statistika pro sociology

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Interpolační funkce. Lineární interpolace

Statistika. cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací!

Vytěžování znalostí z dat

Základní statistické charakteristiky

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Karta předmětu prezenční studium

Číselné charakteristiky

Pokročilé metody geostatistiky v R-projektu

Rizikové úseky silnic z pohledu dopravních nehod

Úvodem Dříve les než stromy 3 Operace s maticemi

Statistika pro geografy

Metodologie pro ISK II

Prostorové vzorce aktivit high-tech sektoru

STATISTICKÉ CHARAKTERISTIKY

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

3.4 Určení vnitřní struktury analýzou vícerozměrných dat

Základy popisné statistiky

Metodologie pro Informační studia a knihovnictví 2

mezi studenty. Dále bychom rádi posoudili, zda dobrý výsledek v prvním testu bývá doprovázen dobrým výsledkem i v druhém testu.

Inferenční statistika - úvod. z-skóry normální rozdělení pravděpodobnost rozdělení výběrových průměrů

Úvod do problematiky měření

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky

5EN306 Aplikované kvantitativní metody I

Vícerozměrné statistické metody

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Metodologie pro Informační studia a knihovnictví 2

Cvičná bakalářská zkouška, 1. varianta

Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy

Státnice odborné č. 20

Uni- and multi-dimensional parametric tests for comparison of sample results

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Kartogramy. Přednáška z předmětu Tematická kartografie (KMA/TKA) Otakar Čerba Západočeská univerzita

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

Praktická statistika. Petr Ponížil Eva Kutálková

UKAZATELÉ VARIABILITY

Rastrové digitální modely terénu

Metody prostorové interpolace

Protokol č. 5. Vytyčovací údaje zkusných ploch

Popisná statistika kvantitativní veličiny

Semestrální projekt. Vyhodnocení přesnosti sebelokalizace VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. Fakulta elektrotechniky a komunikačních technologií

Metody analýzy dat I. Míry a metriky - pokračování

5EN306 Aplikované kvantitativní metody I

Shluková analýza dat a stanovení počtu shluků

3. ROZMÍSTĚNÍ OBYVATELSTVA

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD

Statistická analýza dat podzemních vod. Statistical analysis of ground water data. Vladimír Sosna 1

Gymnázium Jiřího Ortena, Kutná Hora

Analýza dat na PC I.

Karta předmětu prezenční studium

Geoinformatika. IX GIS modelování

Otázky k měření centrální tendence. 1. Je dáno rozložení, ve kterém průměr = medián. Co musí být pravdivé o tvaru tohoto rozložení?

Kartografické modelování. VIII Modelování vzdálenosti

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

Metody analýzy dat I (Data Analysis I) Rozsáhlé struktury a vlastnosti sítí (Large-scale Structures and Properties of Networks) - pokračování

Charakterizace rozdělení

Robustní statistické metody

Metody sociálních výzkumů. Velmi skromný úvod do statistiky. Motto: Jsou tři druhy lži-lež prostá, lež odsouzeníhodná a statistika.

odlehlých hodnot pomocí algoritmu k-means

Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy

4. ROZMÍSTĚNÍ OBYVATELSTVA

SYLABUS PŘEDNÁŠKY 10 Z GEODÉZIE 1

Statistické metody. Martin Schindler KAP, tel , budova G. naposledy upraveno: 9.

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Průzkumová analýza dat

SOCIÁLNĚGEOGRAFICKÁ EXPONOVANOST OBCÍ JIHOČESKÉHO KRAJE # SOCIOGEGRAPHICAL EXPOSITION OF COMMUNITIES IN THE SOUTHBOHEMIAN REGION.

Číselné charakteristiky a jejich výpočet

PROSTOROVÁ STATISTIKA V MATLABU. , Liberci, Liberec

Modelování sesuvu svahu v Halenkovicích pomocí metody kriging

Induktivní statistika. z-skóry pravděpodobnost

Karta předmětu prezenční studium

Vícerozměrné statistické metody

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

Charakteristika datového souboru

ANALÝZA DAT V R 2. POPISNÉ STATISTIKY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Pravděpodobnost a aplikovaná statistika

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

IDENTIFIKACE BIMODALITY V DATECH

Náhodné (statistické) chyby přímých měření

Národní informační středisko pro podporu kvality

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie STATISTICKÉ ZPRACOVÁNÍ EXPERIMENTÁLNÍCH DAT

Porovnání dvou výběrů

Vybraná rozdělení náhodné veličiny

Aplikovaná statistika pro učitele a žáky v hodinách zeměpisu aneb jak využít MS Excel v praxi. Geografický seminář 30. března 2011 Pavel Bednář

Statistické vyhodnocení průzkumu funkční gramotnosti žáků 4. ročníku ZŠ

Jednofaktorová analýza rozptylu


Navrženy v 60. letech jako experimentální optimalizační metoda. Velice rychlá s dobrou podporou teorie

9. přednáška z předmětu GIS1 Digitální model reliéfu a odvozené povrchy. Vyučující: Ing. Jan Pacina, Ph.D.

Transkript:

GEOSTATISTIKA Ing. Jan Popelka, Ph.D. Fakulta životního prostředí UJEP (výběr z materiálu) 1

ZÁKLADNÍ POJMY ŠIRŠÍ VYMEZENÍ GEOSTATISTIKY GEOSTATISTIKA je statistická analýza prostorově lokalizovaných dat. GEOSTATISTIKA je odvětví prostorové statistiky s konečným počtem měřených dat s prostorovým rozmístěním. 2

ZÁKLADNÍ POJMY Jedno- a vícerozměrné klasické statistické metody lze jen omezeně využít k popisu prostorových vlastností objektů a jevů jako jsou: spojitost jevů v prostoru, prostorová závislost autokorelace, prostorové uspořádání (struktura). 3

četnost četnost ZÁKLADNÍ POJMY Příklad: Znečištění půdy na vybraném území. Histogram 500 400 300 Histogram 500 400 300 200 200 100 100 0 0 30 60 90 120 150 180 koncentrace 0 0 30 60 90 120 150 180 koncentrace 4

GEOSTATISTICKÝ POPIS BODŮ Body představují nejčastější způsob prezentace geografických jevů. Body jsou zpravidla umísťovány v těžišti objektů. Např. místo křížení nejdelší a nejkratší osy objektu (zpravidla plochy). Geostatistika dokáže pracovat i s liniemi (např. vodní toky) a plochami (např. územní celky). 5

CHARAKTERISTIKY POLOHY Geostatistické charakteristiky polohy (úrovně) Slouží k určování geografického středu či mediánu bodových objektů. průměry (průměrný střed, vážený průměrný střed, agregovaný průměrný střed, geograficky vážený průměr), mediánový střed. 6

CHARAKTERISTIKY POLOHY Průměrný střed (mean centre) x i a y i jsou souřadnice i-tého bodu, n je počet bodů. Leží na průměru souřadnic X a Y. Má stejné nevýhody jako klasický aritmetický průměr citlivost na geograficky odlehlé a extrémní hodnoty, v případě shlukového uspořádání dobře nereprezentuje množinu bodů. 7

CHARAKTERISTIKY POLOHY Mediánový střed (median center) x i a y i jsou souřadnice i-tého bodu, u a v jsou souřadnice mediánového středu. Je robustní charakteristikou polohy, není citlivý na geograficky odlehlé nebo extrémní hodnoty. Minimalizuje celkovou vzdálenost (euklidovskou) z mediánového středu do každého z bodů. Počítá se iterativním postupem - postupné přibližování k mediánovému středu. 8

CHARAKTERISTIKY POLOHY Vážený průměrný střed (weighted mean centre) w i jsou váhy i-tého bodu (hodnota proměnné) Souřadnice bodů X a Y jsou váženy hodnotou sledované proměnné W. Např. počet obyvatel ve městech, hodnota znečištění v místě měření apod. 9

CHARAKTERISTIKY POLOHY Vážený průměrný střed Vážený průměrný střed světelných zdrojů na Zemi od roku 1992 do roku 2009 Nicola Pestalozzi, Peter Cauwels, Didier Sornette. Dynamics and Spatial Distribution of Global Nighttime Lights. arxiv:1303.2901 [physics.socph] 10

CHARAKTERISTIKY POLOHY Vážený mediánový střed Vážený mediánový střed populace USA od roku 1880 do roku 2010 U.S. Census Bureau. Median centers of population for the United States, 1880-2010. USA, 2011. 11

CHARAKTERISTIKY POLOHY Geograficky vážený průměr (geographically weighted mean) Doposud uvedené charakteristiky lze považovat za globální (počítají se ze všech bodů). Lokální charakteristiky se počítají pro konkrétní místo (jejich hodnoty lze zakreslit do mapy). Nepočítají se ze všech bodů, ale jen z vybrané množiny bodů (bodů z blízkého okolí prostřednictví geografického vážení). Základní princip geografického vážení: čím blíže k místu výpočtu, tím vyšší váha. 12

CHARAKTERISTIKY POLOHY Geograficky vážený průměr Geograficky vážený průměr cen nemovitostí ve Velké Británii FOTHERINGHAM, A. S., BRUNSDON, C., and M. CHARLTON. Geographically Weighted Regression: The Analysis of Spatially Varying Relationships. Chichester: John Wiley & Sons, 2002. 13

CHARAKTERISTIKY VARIABILITY Geostatistické charakteristiky variability Popisují rozmístění (distribuci) bodů kolem středu (míry polohy). směrodatná vzdálenost (vážená směrodatná vzdálenost), směrodatná elipsa odchylek, směrodatná odchylka. 14

CHARAKTERISTIKY VARIABILITY Směrodatná vzdálenost (standard distance) x i a y i jsou souřadnice i-tého bodu, x mc a y mc jsou souřadnice průměrného středu, n je počet bodů. Zobrazuje se ve formě kružnice kolem průměrného středu s poloměrem o hodnotě směrodatné vzdálenosti. 15

CHARAKTERISTIKY VARIABILITY Vážená směrodatná vzdálenost (weighted standard distance) f i jsou váhy i-tého bodu. I pro sm. vzdálenost lze počítat váženou variantu, kdy vahami jsou hodnoty zkoumané proměnné. Středem kružnice je vážený průměrný střed. 16

CHARAKTERISTIKY VARIABILITY Směrodatná elipsa odchylek (standard deviational ellipse) Prostorové rozdělení jevů může často vykazovat určité rysy směrovosti (directional bias). Místo kruhu je vhodnější použití elipsy σ se třemi parametry: x θ úhel otočení elipsy θ, směrodatná odchylka podél hlavní osy elipsy σ x, směrodatná odchylka podél vedlejší osy elipsy σ y. 17

CHARAKTERISTIKY VARIABILITY Pomocí geostatistických charakteristik polohy a variability lze porovnávat prostorovou variabilitu více souborů mezi sebou. Porovnání výskytu horečky u domácích a divokých prasat v Severní Osetii Rusko V.M. Gulenkin, F.I. Korennoy, A.K. Karaulov, S.A. Dudnikov, Cartographical analysis of African swine fever outbreaks in the territory of the Russian Federation and computer modeling of the basic reproduction ratio, Preventive Veterinary Medicine, Volume 102, Issue 3, 1 December 2011, Pages 167-174, ISSN 0167-5877 18

CHARAKTERISTIKY VARIABILITY Pomocí geostatistických charakteristik polohy a variability lze porovnávat prostorovou variabilitu více souborů mezi sebou. Porovnání vývoje požárů vegetace v USA mezi roky 2001 až 2011. Satoshi Miyazawa. [Note] Hotspot Analysis of Fires in U.S. during 2001 to 2011 based on Vegetation Type [online]. Dostupné z: http://www.koitaroh.com/search/label/gis 19

PROSTOROVÉ USPOŘÁDÁNÍ BODŮ Rozlišujeme tři základní typy prostorového uspořádání bodů: Shlukové (Clustered) Rozptýlené (Dispersed) Náhodné (Random) Shlukové Náhodné Rozptýlené 20

PROSTOROVÉ USPOŘÁDÁNÍ BODŮ Základní metody statistického popisu prostorového uspořádání bodů: Analýza kvadrátů (podobnost polohy bodů). Průměrný nejbližší soused (podobnost poloha bodů) - ANN. Metody prostorové autokorelace (podobnost hodnot proměnné s ohledem na polohu bodů) Moranův index I, Gearyho poměr C, Getis-Ordovo obecné G. 21

PROSTOROVÉ USPOŘÁDÁNÍ BODŮ Analýza kvadrátů (Quadrat Analysis) Hodnocení změn hustoty bodů v prostoru. Studované území se rozdělí pravidelnou sítí na buňky a spočte se počet bodů v každé buňce. Rozdělení četností buněk s určitým počtem bodů se porovná s náhodným rozdělením četností (nejčastěji s Poissonovým rozdělením pomocí Kolmogorov-Smirnova testu). Buňky mohou mít tvar čtverce, kruhu, šestiúhelníku. Tvar a velikost musí být v území konstantní. 22

PROSTOROVÉ USPOŘÁDÁNÍ BODŮ Analýza kvadrátů (Quadrat Analysis) Extrémní možnosti: Extrémně shlukové uspořádání většina bodů v jedné či několika málo buňkách. Extrémně pravidelné ve všech buňkách přibližně stejně Analýzu lze modifikovat tak, že se buňky stejné velikosti náhodně rozmístí po studované ploše. 23

PROSTOROVÉ USPOŘÁDÁNÍ BODŮ Průměrný nejbližší soused (Average Nearest Neighbor ANN) Založena na průměrné minimální vzdálenosti mezi body. ANN = D O /D E D O je průměrná minimální vzdálenost D O = Σd i /n, D E je očekávaná průměrná vzdálenost = 0,5/odmocnina (n/a), A je velikost území (plocha). 24

PROSTOROVÉ USPOŘÁDÁNÍ BODŮ Průměrný nejbližší soused (Average Nearest Neighbor ANN) ANN > 1 Rozptýlené uspořádání. ANN = 1 Náhodné uspořádání. ANN < 1 Shlukové uspořádání. Shlukové Náhodné Rozptýlené 25

PROSTOROVÉ USPOŘÁDÁNÍ BODŮ Metody prostorové autokorelace Většina jevů se v prostoru mění spojitě. Blízké body budou mít podobné hodnoty studovaného jevu a naopak (First law of geography - Tobler, 1970). Moranův index I (Moran s I) je koeficientem prostorové autokorelace. Kombinuje míru podobnosti proměnné a míru podobnosti polohy bodů. Míra podobnosti mezi dvěma body se počítá jako: kde x i resp. x j jsou hodnoty proměnné v bodě i resp. j, x je průměrná hodnota proměnné. 26

PROSTOROVÉ USPOŘÁDÁNÍ BODŮ Moranův index I (Moran s I) I > 0 přesněji I > E(I) Shlukové uspořádání, sousední body vykazují podobné hodnoty jako zkoumaný bod (autokorelace). I = 0 přesněji I E(I) Náhodné uspořádání, body nevykazují znaky podobnosti (bez autokorelace). I < 0 přesněji I < E(I) Rozptýlené uspořádání, sousední body vykazují rozdílné charakteristiky (autokorelace). E(I) = -1/(n-1). Pravidelné Náhodné Shlukové 27

PROSTOROVÉ USPOŘÁDÁNÍ BODŮ Lokální Moranův index I Lokální varianta indexu se počítá pro každý bod zvlášť! Pomocí jeho standardizované hodnoty (Z-skóre), lze do mapy zakreslit statisticky významné: Oblasti bodů bez prostorové autokorelace. Shluky bodů s vysokými hodnotami proměnné Shluky bodů s nízkými hodnotami proměnné. Lokálně odlehlý bod s vysokou hodnotou proměnné. Lokálně odlehlý bod s nízkou hodnotou proměnné. 28

PROSTOROVÉ USPOŘÁDÁNÍ BODŮ Míra nezaměstnanosti v obcích ČR interpretace lokálního Moranova indexu (I=0,28; Z=73) 29

PROSTOROVÉ USPOŘÁDÁNÍ BODŮ Gearyho poměr C (Geary's Ratio) Další z koeficientů prostorové autokorelace. Jeho lokální varianta dokáže identifikovat body, které se nepodobají svému okolí (odlehlé hodnoty). Míra podobnosti mezi dvěma body se počítá jako: kde x i resp. x j jsou hodnoty proměnné v bodě i resp. j. 30

PROSTOROVÉ USPOŘÁDÁNÍ BODŮ Gearyho poměr C (Geary's Ratio) 0 < C < 1 Shlukové uspořádání, sousední body vykazují podobné hodnoty jako zkoumaný bod (autokorelace). C 1 Náhodné uspořádání, body nevykazují znaky podobnosti (bez autokorelace). 1 < C < 2 Rozptýlené uspořádání, sousední body vykazují rozdílné charakteristiky (autokorelace). Pravidelné Náhodné Shlukové 31

PROSTOROVÉ USPOŘÁDÁNÍ BODŮ Getis-Ordovo obecné G (Getis-Ord General G) Používá se pro tzv. nalýzu Hot-Spot, tedy k identifikaci shluků s vysokými (hot spot) a nízkými (cold spot) hodnotami. Shluk nízkých hodnot (cold spot) Náhodné Shluk vysokých hodnot (hot spot) 32

PROSTOROVÉ USPOŘÁDÁNÍ BODŮ Getis-Ordovo obecné G (Getis-Ord General G) C < 1 Shluk nízkých hodnot (Cold-spot), sousední body vykazují podobné nízké hodnoty jako zkoumaný bod (autokorelace). C 1 Náhodné uspořádání, body nevykazují znaky podobnosti (bez autokorelace). C > 1 Shluk vysokých hodnot (Hot-spot), sousední body vykazují podobné vysoké hodnoty jako zkoumaný bod (autokorelace). Shluk nízkých hodnot (cold spot) Náhodné Shluk vysokých hodnot (hot spot) 33

PROSTOROVÉ USPOŘÁDÁNÍ BODŮ Getis-Ordovo lokální G i * (Getis-Ord G i *) Lokální varianta indexu se počítá pro každý bod zvlášť! Vhodný nástroj pro interpretaci prostorově nespojitých jevů (jevů, které není vhodné interpolovat). Pomocí jeho standardizované hodnoty (Z-skóre), lze do mapy zakreslit statisticky významné: Oblasti bodů bez prostorové autokorelace. Shluky bodů s vysokými hodnotami proměnné (Hot-spot). Shluky bodů s nízkými hodnotami proměnné (Cold-spot). 34

PROSTOROVÉ USPOŘÁDÁNÍ BODŮ Míra nezaměstnanosti v obcích ČR Z-skóre Gettis-Ordova Gi* Míra nezaměstnanosti v obcích ČR z-skóre Getis-Ordova lokálního Gi* (G=0,28; Z=73) 35

ZDROJE (pro celý původní materiál) Použité zdroje: CHARLTON, Martin and A Stewart FOTHERINGHAM. Geographically Weighted Regression. A Tutorial on using GWR in ArcGIS 9.3. National University of Ireland Maynooth, 2009. ESRI. ArcGIS 10.1 Help. Esri. Copyright 1995-2012. FOTHERINGHAM, A. S., BRUNSDON, C., and M. CHARLTON. Geographically Weighted Regression: The Analysis of Spatially Varying Relationships. Chichester: John Wiley & Sons, 2002. LLOYD, Christopher D. Local models for spatial analysis. 2nd ed. CRC Press Taylor & Francis Group, 2011. ISBN 978-1-4398-2919-6. SCHEJBAL, Ctirad. Úvod do geostatistiky. Ostrava: VŠB, 1996. ISBN 80-7078-325-7. 36