SOUČASNÉ TRENDY V APLIKACÍCH STATISTICKÝCH A KVANTITATIVNÍCH METOD V KONTEXTU PROSTOROVÝCH ANALÝZ



Podobné dokumenty
Cíl Vyhodnotit současný stav migračně prostorové diferenciace území ČR a migrační tendence na základě údajů za obce ČR

Prostorová variabilita

Karta předmětu prezenční studium

REGIONÁLNÍ KONCENTRACE AKTIVIT PODNIKŮ. Příklad využití individuálních dat ve spojení s autokorelační statistikou

3. ROZMÍSTĚNÍ OBYVATELSTVA

GEOSTATISTIKA. Ing. Jan Popelka, Ph.D. Fakulta životního prostředí UJEP (výběr z materiálu)

Prostorová autokorelace všudypřítomný jev při analýze prostorových dat?

Statistická analýza jednorozměrných dat

You created this PDF from an application that is not licensed to print to novapdf printer (

STATISTICKÉ PROGRAMY

SOCIÁLNĚGEOGRAFICKÁ EXPONOVANOST OBCÍ JIHOČESKÉHO KRAJE # SOCIOGEGRAPHICAL EXPOSITION OF COMMUNITIES IN THE SOUTHBOHEMIAN REGION.

Smíšené regresní modely a možnosti jejich využití. Karel Drápela

4. ROZMÍSTĚNÍ OBYVATELSTVA

KGG/STG Statistika pro geografy

aktivita A0705 Metodická a faktografická příprava řešení regionálních disparit ve fyzické dostupnosti bydlení v ČR

Aplikace konceptu lokalit a relačního prostoru na diferenciaci venkovského prostoru

Úvodem Dříve les než stromy 3 Operace s maticemi

6. Dokončená bytová výstavba v relaci s vybranými statistickými charakteristikami území správních obvodů obcí s rozšířenou působností Zlínského kraje

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

METODOLOGIE I - METODOLOGIE KVANTITATIVNÍHO VÝZKUMU

Karta předmětu prezenční studium

Tabulka 1 Rizikové online zážitky v závislosti na místě přístupu k internetu N M SD Min Max. Přístup ve vlastním pokoji ,61 1,61 0,00 5,00

ZX510 Pokročilé statistické metody geografického výzkumu. Téma: Měření síly asociace mezi proměnnými (korelační analýza)

Korelace. Komentované řešení pomocí MS Excel

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

, Brno Hanuš Vavrčík Základy statistiky ve vědě

ANALÝZA DLOUHODOBÉ NEZAMĚSTNANOSTI V ZEMÍCH EU # ANALYSIS OF LONG-TERM UNEMPLOYMENT IN EU COUNTRIES. KLÍMA Jan, PALÁT Milan.

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Aplikace výsledků European Social Survey a Schwartzových hodnotových orientací v oblasti reklamy

ANALÝZA POPULAČNÍHO VÝVOJE VE VYBRANÝCH REGIONECH ČR # POPULATION MOVEMENT ANALYSIS IN SELECTED REGIONS OF THE CZECH REPUBLIC. PALÁT, Milan.

Algoritmy pro shlukování prostorových dat

Vybrané aspekty vztahu nabídky a poptávky v lokalizačních analýzách

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA Sylabus pro předmět STATISTIKA Pomůcky... 7

Užití země v České republice v letech 1994 až 2012 Karel Matějka IDS, Na Komořsku 2175/2a, Praha 4, Česká republika matejka@infodatasys.

INDUKTIVNÍ STATISTIKA

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan

Testování hypotéz o parametrech regresního modelu

DISPARITY KRAJŮ ČR. Pavla Jindrová Univerzita Pardubice, Fakulta ekonomicko-správní, Ústav matematiky

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

PRAVDĚPODOBNOST A STATISTIKA 1

PROSTOROVÁ STATISTIKA V MATLABU. , Liberci, Liberec

METODOLOGICKÁ VÝCHODISKA ANALÝZ REGIONÁLNÍHO ROZVOJE METHODOLOGICAL STARTING POINTS OF REGIONAL DEVELOPMENT ANALYSES.

STATISTIKA jako vědní obor

SOUČASNÉ TRENDY V KVANTITATIVNÍ ANALÝZE GEOGRAFICKÝCH DAT

BRNO KOMPLEXNÍ DOPRAVNÍ ANALÝZA

Testování hypotéz a měření asociace mezi proměnnými

Statistika. Základní pojmy a cíle statistiky. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Cíle korelační studie

Testování hypotéz o parametrech regresního modelu

Tvorba nelineárních regresních modelů v analýze dat

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

VYUŽITÍ SOFTWARU MATHEMATICA VE VÝUCE PŘEDMĚTU MATEMATIKA V EKONOMII 1

Využití analýz viditelnosti v procesech veřejné správy

Organizační chování. Rozvoj poznání v organizačním chování

Proměny počtu žáků základních škol v souvislosti s populačním vývojem v obcích Česka

KORELACE. Komentované řešení pomocí programu Statistica

Statistická analýza dat podzemních vod. Statistical analysis of ground water data. Vladimír Sosna 1

Korelační a regresní analýza

MOŽNOSTI VYUŽITÍ SHLUKOVÉ ANALÝZY V Q-METODOLOGII

LIMITY APLIKACE STATISTICKÝCH TESTŮ VÝZNAMNOSTI V PEDAGOGICKÉM VÝZKUMU: SEMINÁŘ PRO NESTATISTIKY

HODNOCENÍ JIHOČESKÉHO KRAJE Z HLEDISKA CEN NEMOVITOSTÍ URČENÝCH PRO BYDLENÍ V NÁVAZNOSTI NA EKONOMICKÝ RŮST REGIONU 1

Statistické vyhodnocení průzkumu funkční gramotnosti žáků 4. ročníku ZŠ

Aplikovaná statistika v R - cvičení 3

6. Lineární regresní modely

REGIONÁLNÍ DISPARITY DISPARITY V REGIONÁLNÍM ROZVOJI ZEMĚ, JEJICH POJETÍ, IDENTIFIKACE A HODNOCENÍ

PRAVDĚPODOBNOST A STATISTIKA

Regresní a korelační analýza

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

VÝVOJ INDEXŮ SPOTŘEBITELSKÝCH CEN

Pracovní celky 3.2, 3.3 a 3.4 Sémantická harmonizace - Srovnání a přiřazení datových modelů

Prostorové vzorce aktivit high-tech sektoru

HYPOTÉZY. Kvantitativní výzkum není nic jiného než testování hypotéz. (Disman 2002, s. 76) DEDUKCE (kvantitativní přístup)

ZNALOSTI A DOVEDNOSTI ČESKÝCH MUŽŮ V OBLASTI INFORMAČNÍ BEZPEČNOSTI - VÝSLEDKY STATISTICKÉ ANALÝZY

PRAVDĚPODOBNOST A STATISTIKA 1 Metodický list č 1.

VÝVOJ PLODNOSTI VE STÁTECH A REGIONECH EVROPSKÉ UNIE PO ROCE 1991

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Aplikovaná statistika pro učitele a žáky v hodinách zeměpisu aneb jak využít MS Excel v praxi. Geografický seminář 30. března 2011 Pavel Bednář

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

MODERNÍ TRENDY V KARTOGRAFICKÉM DESIGNU Z HLEDISKA UŽIVATELSKÝCH ASPETŮ ALENA VONDRÁKOVÁ KATEDRA GEOINFORMATIKY UNIVERZITA PALACKÉHO V OLOMOUCI

UKÁZKA VYUŽITÍ PROGRAMU WINQSB PŘI VÝUCE KVANTITATIVNÍCH METOD V ROZHODOVÁNÍ V DISTANČNÍ FORMĚ STUDIA

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Metodika. Zájmová území

VÝVOJOVÉ TENDENCE V MĚŘENÍ FINANČNÍ VÝKONNOSTI A JEJICH

Měření závislosti statistických dat

1. Statistická analýza dat Jak vznikají informace Rozložení dat

Statistické testování hypotéz II

Jana Vránová, 3. lékařská fakulta UK

Úvod do problematiky měření

9.1 BYTOVÝ FOND V ČESKU Zuzana Kopecká, Jana Jíchová

2.3 Proměna věkové struktury

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

Současný stav likvidace dat v organizacích

Modelování sesuvu svahu v Halenkovicích pomocí metody kriging

T T. Think Together Martina Urbanová THINK TOGETHER. Jak měřit spolupráci obcí How to measure inter-municipality cooperation

Č. j.: TF/5/14 V Praze dne

MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ

2.1 Dlouhodobý vývoj počtu obyvatel

Organizační chování. Vědy o organizaci (cvičení)

Studium závislosti výpočetního času algoritmu GPC prediktivního řízení na volbě typu popisu matematického modelu v regulátoru

Transkript:

Medzinárodná vedecká konferencia TRENDY V APLIKOVANÍ ŠTATISTICKÝCH METÓD PRI ZLEPŠOVANÍ KVALITY 12.-13. júl 2010, Malá Ida ISBN 978-80-225-3016-3 SOUČASNÉ TRENDY V APLIKACÍCH STATISTICKÝCH A KVANTITATIVNÍCH METOD V KONTEXTU PROSTOROVÝCH ANALÝZ CURRENT TRENDS IN APPLICATIONS OF STATISTICS AND QUANTITATIVE METHODS IN THE CONTEXT OF SPATIAL ANALYSIS Eva Heřmanová RNDr. Eva Heřmanová (odborná asistentka) Katedra arts managementu Podnikohospodářská fakulta Vysoké školy ekonomické v Praze, Česká republika e-mail: eva.hermanova@seznam.cz Abstrakt Předkládaný příspěvek by měl velmi stručnou formou představit hlavní specifika a problémy související s používáním klasických statistických metod na prostorově definovaná data. Jedná se zejména o problém tzv. prostorové autokorelace a prostorové nestacionarity, jejichž existenci do relativně nedávné doby sociální geografové víceméně nevnímali, resp. jim nevěnovali zvláštní pozornost a v podstatě jim nepříkládali žádný význam. Kľúčové slová Prostorové analýzy, statistické a kvantitatívni metody Abstract This paper should present a very concise form the main specifics and problems associated with using traditional statistical methods for spatial data defined. These include so-called problem. Spatial autocorrelation and spatial non-stationarity, the existence of relatively recent social geographers broadly "perceive", respectively. They did not pay special attention and virtually no attach much importance to them. Key words Spatial analysis, statistical and quantitative methods 23

TRENDY V APLIKOVANÍ ŠTATISTICKÝCH METÓD PRI ZLEPŠOVANÍ KVALITY 2010 Úvod Předkládaný příspěvek by měl velmi stručnou formou představit hlavní specifika a problémy související s používáním klasických statistických metod na prostorově definovaná data. Jedná se zejména o problém tzv. prostorové autokorelace a prostorové nestacionarity, jejichž existenci do relativně nedávné doby sociální geografové víceméně nevnímali, resp. jim nevěnovali zvláštní pozornost a v podstatě jim nepříkládali žádný význam. Teprve se vznikem nových kvantitativních metod vyvinutých explicitně pro prostorové analýzy (např. Fotheringham, Brundson, Charlton (2000)) se zviditelňuje i nová kvantitativní geografie, která již není pouhým uživatelem zavedených statistických metod, ale zabývá se i vlastní tvorbou, specifickými aplikacemi a novými myšlenkami v kontextu možného zkvalitnění prováděných analýz prostorových dat, a to nejen na poli geografie. Velké množství problémů spojených s analýzami prostorových dat, jež však nelze vtěsnat do tohoto příspěvku, je řešeno nejen sociální geografií, ale i prostorovou statistikou, prostorovou ekonometrií či nejobecněji řečeno prostorovým modelováním sociálně ekonomických charakteristik a vztahů. K těmto účelům jsou využívány zejména regresní modely zahrnující i prostorovou dimenzi (Anselin 1988), které bývají odvozeny od regresních modeků a analýz časových řad (Hepple 1996). Terminologicky lze snad ještě předeslat (viz i Horák 2002), že pojem analýza prostorových dat nelze ztotožnit s pojmem prostorová analýza dat. V prvním případě totiž může jít o jakoukoliv popisnou či vývojovou - analýzu prostorově definovaných dat, ve druhém případě pak jde o výhradně geografický úhel pohledu, tj. o snahu o podchycení, poznání či vysvětlení prostorových zákonitostí, vztahů či územních gradientů. Ve vztahu k analýze prostorových dat je nutné zdůraznit i význam geografických informačních systémů (dále GIS), jejichž aplikace umožňuje získat nové poznatky a informace o zkoumaných jevech. Hlavní výhodou GISů je možnost zahrnutí dále popsaných metod a vizualizace výsledků prostorových analýz na libovolné hierarchické úrovni. I když použití GISů není nutnou podmínkou prostorového modelování, přináší jejich propojení se statistickými analýzami výsledky, které bychom jinak těžko získávali. Z autorů a ze základních prací, z nichž tento příspěvek přímo nebo i nepřímo, ale nejvýznamněji čerpá, resp. na něž navazuje, je třeba uvést zejména následující práce - Nezdařilová (1984b), Spurná (2006), Spurná (2008a, 2008b), Netrdová, Nosek (2009). Specifika a povaha prostorových dat Problémy spojené se statistickou analýzou geografických dat vyplývají z jejich komplexní povahy (Hampl 1971, Hampl 1983) a dále z toho, že jak jevy, tak i vztahy nelze ve zkoumaném území považovat za homogenní, neboť se mění v závislosti na umístění v prostoru, tj. v závislosti a konkrétních reálných podmínkách. Aplikaci statistických metod v geografii komplikuje samotná prostorová, tj. vzájemně závislá povaha geografických dat, čímž nebývá ve většině případů splněna podmínka nezávislosti dat, která je vyžadována v souvislosti s použitím metod regresního a korelačního počtu. Další problémy spojené s používáním standartních statistických metod souvisí s tím, že řada sociálně-ekonomických jevů a je popisujících souborů dat nevykazuje normální rozložení četností, jež je předpokládáno (viz i Korčák 1941). To má dopad zejména na veličiny popisné statistiky, např. při měření variability souborů dat aj. Jednou z dalších diskutovaných otázek spojených s analýzou prostorových dat je volba určitého typu i hierarchie územních jednotek, kdy různá vymezení sousedních prostorových jednotek mohou přispět k rozdílným výsledkům. Možnost takovéhoto zkreslení je proto potřeba si při analýzách neustále uvědomovat (podrobněji viz Spurná 2006, s. 61-68). 24

Eva Heřmanová Problém a metoda prostorové autokorelace Do geografické literatury zavedli pojem prostorová autokorelace Cliff, Ord (1973), když z ekonometrie převzali princip metody časové autokorelace. Základní myšlenka prostorové autokorelace nebyla nicméně ani předtím v geografii neznámá, ba právě naopak. Jednu ze stěžejních otázek geografického výzkumu totiž tvoří otázka, zda geografická prostorová data vykazují prostorovou závislost, tj. do jaké míry je výskyt určitého jevu v dané územní jednotce závislý na výskytu tohoto jevu v jednotkách sousedních. Na myšlenku, resp. existenci prostorové autokorelace však upozorňovala řada autorů již předtím, když např. uváděla, že charakteristiky určitého místa nejsou závislé jen na ostatních charakteristikách tohoto místa, ale jsou také ovlivněny vazbami k ostatním místům a jejich vlivem (Spurná 2006, s. 76). Matematicky řečeno lze prostorovou autokorelaci chápat jako pravděpodobnost jevu y v prostorové jednotce i je určitou funkcí pravděpodobností tohoto jevu v jednotkách j, které jsou prostorově blízké jednotce i. (Nezdařilová 1984a). Laičtěji řečeno, jak vyplývá i z prostého překladu tohoto pojmu, představuje prostorová autokorelace korelaci jednoho jevu se sebou samým v prostoru a projevuje se statisticky významným uspořádáním hodnot sledovaného jevu v daném území. Stejně jako v případě párové korelace neukazuje ani signifikantní prostorová autokorelace na kauzální vztah a nevypovídá nic o příčinách daného prostorového uspořádání. (Nezdařilová 1984a). Prostorová autokorelace je dnes měřena různými statistikami (Spurná 2006, s. 77-78, Netrdová, Nosek 2009), které popisují míru (ne)podobnosti pozorovaných hodnot v blízkých územních jednotkách (či bodech). Pokud vysoké hodnoty dané proměnné vykazují tendenci shlukovat se v některých částech studovaného regionu a nízké hodnoty tíhnou k tomu shlukovat se v jiných oblastech, hovoříme o pozitivní prostorové autokorelaci. Analogicky i naopak, pokud se vysoké hodnoty proměnné nacházejí v těsné blízkosti s nízkými hodnotami, hovoříme o negativní prostorové autokorelaci. Pokud jsou data lokalizována tak, že neexistuje žádný vztah mezi blízkými hodnotami, hovoříme o nulové prostorové autokorelaci. Dnes je již prokázáno, že téměř všechna prostorová data vykazují nějakou formu pozitivní prostorové autokorelace, což může mít různé dopady na závěry v rámci prostorového modelování (Fotheringham a kol. 2002). Problém prostorové nestacionarity regresních modelů Pojem prostorová nestacionarita (Fotheringham a kol. 2002), se týká nestability zkoumaných často zejména sociálních - jevů a vztahů v prostoru, a to z hlediska a v závislosti na jejich umístění. Laicky řečeno, při použití klasických modelů regresní analýzy lze totiž získat jiný funkční vztah mezi dvěma proměnnými např. v jihozápadní a severovýchodní části Česka, v různě rozvinutých územích (např. v regionech rostoucích, stagnujících či zaostávajících, viz např. Lavický 2009) nebo i na různých hierarchických úrovních (obce, okresy, regiony). Pro věcně shodnou zkoumanou souvztažnost mezi proměnnými lze tedy získat vzájemně se lišící dílčí lokální regresní modely, které jsou navíc zpravidla i odlišné od modelů globálních, tj. např. za celé Česko. Problematika prostorové nestacionarity tedy velmi úzce souvisí se současným trendem a zaměřením kvantitativních metod na lokální statistiky. Ve statistické literatuře se v souvislosti se zmíněnou problematikou nestacionarity setkáváme s pojmem stabilní regresní funkce, a to ve smyslu obecně platného vztahu. Hebák, Novák (1978, s. 72) definují stabilní regresní funkce jakožto funkce, jejichž typ je v čase a v prostoru relativně neměnný a jejichž parametry jsou neměnné nebo se mění formalizovatelným způsobem. V souvislosti se stabilitou regresních funkcí je také možno diskutovat i otázku složitosti a výstižnosti regresního modelu. Je zřejmé, že se zvyšováním počtu parametrů či počtu statisticky významných proměnných v určitém regresním modelu nebo použitím vhodného složitějšího tvaru matematické funkce dochází obecně ke zvýšení 25

TRENDY V APLIKOVANÍ ŠTATISTICKÝCH METÓD PRI ZLEPŠOVANÍ KVALITY 2010 výstižnosti tohoto modelu. Zároveň však model ztrácí svoji zobecňující schopnost a v extrémním případě by se mohl stát i jen formálně přesným popisem specifických vztahů v určitém prostoru a čase (Nezdařilová 1983a). Jak k tomu dál ještě výstižně poznamenávají Hebák, Novák (1978), neustálé zlepšování modelu z hlediska kritéria založeného na shodě údajů s regresním modelem může mít za následek vzdálení se od obecných rysů zkoumané závislosti, tzn. takový výsledek, že daným údajům perfektně vyhovující funkce bude časoprostorově zcela nestabilní. Mezi hlavní důvody prostorové nestability regresních funkcí patří bezesporu pravá podstata analyzovaných vztahů či závislostí, které se za určitých okolností mohou v prostoru skutečně odlišovat. Rozdíly mohou způsobovat například odlišné lidské postoje či preference v různých oblastech, rozdílné reakce na stejné podněty může indikovat i administrativní či politické prostředí. Často se v této souvislosti hovoří o kontextuálních faktorech ovlivňujících chování jedinců. (Spurná 2006, s. 85). Myšlenka, že chování jednotlivců se může i velmi významně v prostoru odlišovat koresponduje nejen s postmoderními přístupy v geografii (zdůrazňujícími místo a lokální podmínky jako důležitý rámec pro pochopení příčin určitého chování, viz např. Holt-Jensen, 1999), ale i s řadou sociologických prací zkoumajících problematiku tzv. regionálních mentalit. Další důvod prostorové nestacionarity lze možná spatřovat i v nesprávně navrženém regresním modelu (nezahrnutí některých významných proměnných) nebo v použití nesprávného funkčního vztahu, které může vést až k přílišnému zjednodušení reality a reálné nemožnosti nalezení jakýchkoli pravidelností, byť možná existujících. Z výše uvedených důvodů je jak identifikace odchylek od globálního modelu (klasicky metodou zbytků z regrese), tak zejména identifikace odchylek lokálně či regionálně platných vztahů (dále popsaná metoda geograficky vážené regrese) velmi přínosná, neboť umoňuje lepší vhled do problematiky a nasměrování i větší efektivnost dalšího případného výzkumu. Jednoduchý a velmi názorný příklad prostorové nestacionarity zjištěných regresních vztahů si dovolím pro oživení příspěvku převzít z diplomové práce P. Spurné (Netrdové) (2006), jíž mi bylo ctí dělat oponentku. Autorka propočetla vztah mezi podílem vysokoškolsky vzdělaných osob a volební účastí sledovanou na úrovni obcí a městských částí, a to zvlášť pro okresy Blansko, Brno-město a Brno-venkov. Celkový globální výsledek za 296 územních jednotek vypovídá o mírné negativní závislosti mezi uvedenými proměnnými. Propočtou-li se však dílčí regresní modely za jednotlivé okresy, vychází každá ze závislostí výrazně odlišně, ve dvou případech (okres Brno-město a Brno-venkov) dokonce dochází k převrácení směru závislosti (viz obr. č. 1). Jak uvádí Spurná (2006), zatímco obce v okrese Blansko s obecně nižším podílem vysokoškolsky vzdělaných osob a vysokou volební účastí vykazují negativní závislost znázorněnou přímkou s větším sklonem, u dvou brněnských okresů, jejichž jednotky jsou více variabilní z hlediska zastoupení vysokoškolsky vzdělaných osob, se závislost obrací výrazným způsobem na pozitivní. Další prostorový příklad Simpsonova paradoxu u vztahu mezi cenou domu a hustotou zalidnění nalezneme ve Fotheringham a kol. (2002). Výše zmíněný jev je znám jako tzv. Simpsonův paradox (Hendl 2004) a přestože se jeho původní popsání vztahovalo na neprostorová data, platí jak je vidět níže - i pro různě agregovaná prostorová data. Při nejrůznějších geografických analýzách podobného typu tedy může dojít k tomu, že celkový výsledek za hierarchicky větší území nejen, že nebude reprezentovat skutečné vztahy mezi proměnnými, ale bude možná i pravým opakem vztahů reálných, platných na lokální úrovni. 26

Eva Heřmanová Obr. č. 1: Simpsonův paradox na příkladu volebního chování Zdroj: Spurná, 2006, s. 87 Výše uvedeným problémům je zejména v poslední době v české geografické literatuře věnována zvýšená pozornost a lze říci, že svým způsobem lze považovat jejich diskusi, zviditelňování a zejména snahu o řešení za impuls pro další vývoj speciálních kvantitativních metod, které lze označit za prostorové, a tedy i geografické. Jednou z nich je i metoda geograficky vážené regrese (geographically weighted regression, dále GWR). Metoda geograficky vážené regrese Metoda GWR patří do skupiny metod lokálních analýz, které zohledňují prostorové efekty na zkoumané vztahy (další, zde nejmenované metody viz Spurná 2006, s. 88-95) a výrazným způsobem tak rozšiřují možnosti statistické analýzy prostorových dat. Autory metody, která vznikla v 90. letech 20. století a kterou lze označit i jako metodu analýzy prostorově proměnlivých vztahů, jsou profesor kvantitativní geografie Fotheringham a jeho spolupracovníci Brunsdon a Charlton. Tito autoři také vyvinuli speciální software GWR (viz http://ncg.nuim.ie/ncg/gwr/index.htm), jehož výstupy lze propojit jak s běžnými statistickými programy (SPSS), tak i se softwarem GISů (ArcMap). Protože na tomto místě nelze plně vysvětlit matematický aparát, resp. matematický a statistický rámec metody GWR, je třeba zájemce odkázat na primární zdroj (citovanou publikaci autorů GWR a příslušné internetové stránky). Jen velmi orientačně lze snad uvést rozdíl mezi klasickým regresním modelem (spojeným s požadavkem a představou prostorové stacionarity regresních parametrů) a metodou GWR, která využívá pohyblivé, resp. proměnlivé lokální regresní koeficienty, tj. jinak řečeno, přímo předpokládá existenci odlišných prostorových vztahů dvou a více proměnných. Jestliže je klasický regresní model popsán jako y = + β x + ε, lze model geograficky vážené regrese obecně vyjádřit jako y = β ( u, v ) β ( u, v ) i i β 0 k k ik + x + 0 i i k k i i ik i, kde kde (u i,v i ) označuje souřadnice i-tého bodu v prostoru a lokální regresní koeficient β k (u i,v i ) vyjadřuje hodnotu spojité funkce β k (u,v) v bodě i. i ε 27

TRENDY V APLIKOVANÍ ŠTATISTICKÝCH METÓD PRI ZLEPŠOVANÍ KVALITY 2010 Mezi základní výstupy, které lze touto metodou získat, patří soubor odhadů lokálních regresních koeficientů, který je obvykle znázorňován kartograficky (jako spojitý povrch). Tyto odhady mohou být rovněž testovány z hlediska významnosti prostorových odlišností. Dále mohou být jako výstup získány a využity i lokální směrodatné odchylky a lokální verze dalších klasických regresních výstupů (lokální absolutní člen, lokální koeficient determinace). Příklady a možnosti aplikace GWR Pro ilustraci a snad i inspiraci lze dále alespoň stručně a výběrově uvést příklady aplikace metody GWR, které byly dosud publikovány. Brunsdon a kol. (1998) použili diskutovanou metodu k hledání závislostí mezi dlouhodobou nemocnosti lidí ve věku 45 až 65 let a různými socioekonomickými charakteristikami (nezaměstnanost mužů, hustota zalidnění, průměrný počer ososb připadajících na jednu místnost) v oblasti severní Anglie. Fotheringham a kol. (2001, 2002) např. zkoumali prostorovou nestacionaritu faktorů školní (ne)úspěšnosti žáků (ve standardizovaných testech z matematiky) na základních školách v severní Anglii. Mezi faktory, které do ananlýzy zahrnuli patřila např. velikost škol, nezaměstnanost ve spádové oblasti školy, podíl jednočlenných domácností či podíl černošského obyvatelstva atd. Výsledky analýz v obou případech prokázaly existenci výrazných lokální odchylky ve sledovaných vztazích. O rok později byl vytvořen model závislosti tržní ceny domu na jeho kvalitativních charakteristikách (počet koupelen, stáří domu, vzdálenost od centra), jenž byl zkoumán z hlediska jeho lokálních modifikací. Další z modelů, který uvádí i Spurná (2006), vytvořili Huang a Leung (2002) v rámci zkoumání úrovně regionální industrializace v čínské provincii Jiangsu; mezi zkoumané podmiňující faktory pak zahrnuli např. míru urbanizace a HDP na 1 obyvatele. Další model vytvořili Kyratso a Yiorgos (2004), kteří cenu půdy v měřítku domovních bloků zkoumali v metropolitní oblasti řeckého města Volos a vztahovali ji ke vzdálenosti od obchodních center, podílu zastavěnosti ploch a k dalším veličinám. V Česku je zatím asi jedinou aplikací převážně didakticky zaměřený model geograficky vážené regrese zkoumající globální a lokální podoby vztahu mezi volební účastí a podílem vysokoškolsky vzdělaného obyvatelstva (Spurná 2006). V blíže necitované zahraniční literatuře (http://lesprace.silvarium.cz/content/view/62/0/) se však snad vyskytují i aplikace GWR, kde tato metoda byla využita k modelování vztahu mezi vývojem kruhové výčetní základny a výčetní tloušťky a k upřesnění parametrů výškových funkcí, tj. v rámci modelování specifické problematiky lesních porostů. Závěr Lze říci, že donedávna bylo používání statistických a kvantitativních metod v geografii výrazně volnější než v jiných, exaktnějších oborech. Specifická povaha geografických dat (vzájemná prostorová závislost jevů, levostranně asymetrické rozložení četností) společně se způsobem vymezení územních jednotek způsobovaly porušování řady předpokladů klasické popisné statistiky i metod regresního a korelačního počtu. Především však - z pohledu geografa neoddiskutovatelná existence prostorové nestacionarity sociálněekonomických vztahů by měla být v budoucnu reflektována jak v rámci interpretace výsledků analýz, tak v rámci nových kvantitativních metod, a to daleko více než dosud. Většina z nemnoha dosavadních uživatelů přisuzuje již dnes metodě GWR budoucí vysokou využitelnost v sociálněgeografickém výzkumu a právem ji považuje za statistickou metodu s výraznou explorační povahou a schopností odhalit prostorové odchylky v charakteru zkoumaných vztahů. Výhodou této metody je, že modelovaný vztah vždy popisuje realitu výstižněji ve srovnání s výsledky globálního modelu a že svým způsobem řeší i problém předem daného (např. administrativního) rozčlenění územních jednotek, jež zpravidla neodpovídá přirozenému prostorovému rozložení zkoumaného jevu či vztahu. Výhodou této metody je i její vysoká intuitivní srozumitelnost v kontextu celkem všeobecně známého 28

Eva Heřmanová konceptu regresní ananlýzy. Její budoucí pravděpodobně vysokou využitelnost lze spojovat i s neustále se zlepšujícími vizualizačními možnostmi (GIS) a rozvojem počítačové techniky i speciálních softwarů. Aplikační oblasti metody GWR lze spatřovat jak již bylo naznačeno - v prostorové analýze domovního a bytového fondu, v analýze lokálních podmíněností cen nemovitostí, v analýze sítí občanské vybavenosti, ale i sociálně-patologických jevů či lokálních podmínek v kontextu zemědělské výroby či lesnických prací. Máme-li tedy závěrem shrnout hlavní trendy využívání statistických či kvantitativních metod v rámci prostorových analýz, lze uvést zejména primární zaměření na explorační (nikoli nutně generalizující) povahu analýz, na metody lokální analýzy a na vizualizaci výstupů pomocí GISů. Literatura [1] Anselin, L. (1988): Spatial econometrics: Methods and models. Kluwer Academic Publishers, Dordrecht, 284 s. [2] Brundson, C., Fotheringham, S., Charlton, M. (1998): Geographically weighted regression modelling spatial non-stationarity. The Statistician, 47, č. 3, str. 431 443. [3] Cliff, A. D., Ord, J. K. (1973): Spatial autocorrelation. Pion, London, 178 s. [4] Cliff, A. D., Haggett, P., Ord, J. K., Bassett, K., Davies, R. (1975): Elements of spatial structure a quantitative approach. Cambridge University Press, Cambridge, 258 s. [5] Drápela, K.: Využití výsledků NIL ČR pomocí geograficky vážené regrese (GWR). LDF MZLU v Brně, přístup z http://lesprace.silvarium.cz/content/view/62/0/, 1.5.2010 [6] Fotheringham, A. S., Brundson, C., Charlton, M. (2000): Quantitative geography Perspectives on spatial data analysis. SAGE Publications, London, 270 s. [7] Fotheringham, A. S., Charlton, M. E., Brundson, C. (2001): Spatial variations in school performance: a local analysis using geographically weighted regression. Geographical & Environmental Modelling, 5, č. 1, str. 43 66. [8] Fotheringham, A. S., Brundson, C., Charlton, M. (2002): Geographically weighted regression the analysis of spatially varying relationships. John Wiley & Sons, London, 269 str. [9] Hampl, M. (1971): Teorie diferenciace a komplexity světa. Univerzita Karlova, Praha, 183 s. [10] Hampl, M. (1983): K problematice sociálněgeografických pravidelností. In: Geografický výzkum v Československé akademii věd 1952 1982, sborník referátů. Geografický ústav ČSAV, Liblice, str. 182 186. [11] Hebák, P., Novák, I. (1978): K problému stability regresních funkcí. Statistika 1978, str. 69 74. [12] Hendl, J. (2004): Přehled statistických metod zpracování dat analýza a metaanalýza dat. Portál, Praha, 584 s. [13] Hepple, L. W. (1996): Directions and opportunities in spatial econometrics. In: Longley, P., Batty, M. (eds): Spatial analysis: Modelling in a GIS environment. GeoInformation International, Cambridge, s. 231 246. [14] Heřmanová, E. (1991): Vybrané vícerozměrné statistické metody v geografii. SPN, Praha, 133 s. [15] Hindls, R., Hronová, S., Seger, J., Fischer, J. (2007): Statistika pro ekonomy. 8. vyd. Praha, Professional Publishing, 417 s., ISBN 978-80-86946-43-6. [16] Horák, J. (2002): Prostorová analýza dat. Učební text VŠB-TU Ostrava. [http://gis.vsb.cz/pad/] 1. 12. 2005. [17] Holt-Jensen, A. (1999): Geography history and concepts. SAGE Publications, London, 228 s. [18] Huang, Y., Leung, Y. (2002): Analysing regional industrialisation in Jiangsu province using geographically weighted regression. Journal of Geographical Systems, 4, str. 233 249. [19] Korčák, J. (1941): Přírodní dualita statistického rozložení. Statistický obzor, 5 6, str. 171 222. 29

TRENDY V APLIKOVANÍ ŠTATISTICKÝCH METÓD PRI ZLEPŠOVANÍ KVALITY 2010 [20] Kyratso, M., Yiorgos, (2004): Defining a geographically weighted regression model of urban evolution. Application to the city of Volos, Greece. 44th European Congress of the European Regional Science Association: Regions and Fiscal Federalism, University of Porto, 25. 29. 8. 2004, přístup z http://www.ersa.org/ersaconfs/ersa04/pdf/507.pdf, 16. 12. 2005 [21] Lavický, M. (2009): Analýza regionální nezaměstnanosti v České republice během hospodářské recese 2008-2009. Diplomová práce. Katedra sociální geografie a regionálního rozvoje PřF UK, Praha, 68 s., rukopis. [22] Meloun, M., Militký, J. (2002): Kompendium statistického zpracování dat. ACADEMIA, Praha, 764 s. [23] Netrdová, P., Nosek, V. (2009): Přístupy k měření významu geografického rozměru společenských nerovnoměrností. Geografie Sborník České geografické společnosti, 2009/1, roč. 114, s. 52-65. [24] Nezdařilová, E. (1984a): Metody kvantitativní analýzy v geografii se zaměřením na metody regrese a korelace. Diplomová práce. Katedra sociální geografie a regionálního rozvoje PřF UK, Praha, 157 s., rukopis. [25] Nezdařilová, E. (1984b): Prostorová autokorelace jako pojem a metoda geografické analýzy. Geografie Sborník ČGS, 89, č. 1, s. 44 50. [26] Pavlík, Z., Kűhnl, K. (1981): Úvod do kvantitativních metod pro geografy. SPN, Praha, 267 s. [27] Spurná, P. (2006): Současné trendy v kvantitativní analýze geografických dat se zaměřením na využití metody geograficky vážené regrese. Diplomová práce. Katedra sociální geografie a regionálního rozvoje PřF UK, Praha, 150 s., rukopis. [28] Spurná, P. (2008a): Prostorová autokorelace všudypřítomný jev při analýze prostorových dat? Sociologický časopis/czech Sociological Review, 2008, Vol. 44, No. 4, s. 767-787. [29] Spurná, P. (2008b): Geograficky vážená regrese metoda analýzy prostorové nestacionarity geografických jevů. Geografie Sborník České geografické společnosti. 113/2, s. 125-139. [30] Unwin, A., Unwin, D. (1998): Exploratory spatial data analysis with local statistics. The Statistician, 47, č. 3, s. 415 421. [31] Wei, Y. D., Yu, D. (2005): Geographically weighted regression. [www.uwm.edu/course/geog547/gisday_gwr2.ppt], 16. 12. 2005 [32] Zhang, L., Shi, H. (2004): Local modeling of tree growth by geographically weighted regression. Forest Science, 50, č. 2, s. 225 244. [33] Oficiální stránky týkající se metody GWR. [http://ncg.nuim.ie/ncg/gwr/index.htm] [34] Oficiální stránky týkající se softwaru GeoDa. [https://geoda.uiuc.edu/default.php] 30