Prostorové vzorce aktivit high-tech sektoru Kristýna Meislová, Technologické centrum AV ČR ÚVOD Znalost socio-ekonomických rozdílů v území a jejich prostorových vzorců je důležitým předpokladem pro hledání příčin a odhadování budoucího vývoje v území. Poznání regionálních specifik je také základním kamenem formování politik a strategií rozvoje. Sociálně-ekonomické prostorové vzorce úzce souvisí s aktivitami, které v území dominují. Právě formování a realizace regionálních strategií na základě jedinečných specifik v širším kontextu větších územních celků je momentálně klíčovým znakem evropské regionální politiky. V posledních letech se pozornost soustředí zejména na tzv. aktivity s vysokou přidanou hodnotou a inovativní aktivity s vysokým potenciálem růstu. Regionální politika všech členských zemí EU se do značné míry inspiruje a řídí modelem strategií v duchu tzv. smart specialisation (chytré specializace), která staví právě na potenciálně růstových, konkurenceschopných a zároveň specifických ekonomických aktivitách v daném regionu. Česká republika není výjimkou a její regionální i národní strategie následuje evropský trend. Existuje mnoho metod zkoumání prostorové diferenciace (nejen) socio-ekonomických jevů. Pro spolehlivé poznání zejména regionálních či lokálních specifik jsou mimo jiné vhodné kvantitativní analýzy velmi podrobných dat. Princip takového přístupu tkví v zachování specifické individuální informace, která by agregací dat mohla zaniknout. Analýzy prostorových dat na nejnižší dostupné měřítkové úrovni se stále objevují zřídka, přitom je tento přístup cenný z hlediska zachování co nejpřesnější informace o charakteristikách zkoumaného jevu v území. Práci na takto podrobné úrovni ale často brání nedostupnost kvalitních a dostatečně detailních dat. I přesto v Česku existuje řada datových podkladů na vyhovující úrovni obcí, která lze využít a získat zajímavé výstupy. Cíl příspěvku má proto dvě úrovně. Za prvé, představit jednu z možností analýzy high-tech odvětví, která jsou v popředí zájmu inovačních strategií a politik rozvoje, prostřednictvím využití datové základny z Registru ekonomických subjektů. Ten obsahuje kompletní databázi ekonomicky aktivních subjektů v Česku, včetně informace o ekonomických činnostech, které provádějí. A identifikovat prostorový vzorec a případné signifikantní koncentrace high-tech aktivit. A za druhé je cílem ověřit, zda lze identifikovat taková prostorová specifika na základě dostupné datové základny o ekonomických subjektech prostřednictvím prostorové autokorelační statistiky a nástroje, který umožní i vizualizaci výsledků. METODOLOGIE A POUŽITÁ DATA Možnosti kvantifikace prostorových nerovností a rozdílů jsou široké. Řada těchto nástrojů směřuje k absolutnímu vyjádření nerovnosti míry variability bez prostorového aspektu. Zde použitá metoda explorační prostorové analýzy dat však akcentuje nerovnoměrnost v prostoru a umožňuje vystihnout přirozené areály v území. Analýza prostorové autokorelace vyhodnocuje uspořádání sledovaného jevu v prostoru a identifikuje statisticky významné koncentrace nízkých a vysokých hodnot, které se projevují jako shluky. Aplikovaná metoda známá jako Hot spot analýza (Getis-Ord G*) identifikuje 1
statisticky významné (signifikantní) shluky vysokých hodnot, tzv. hot spots, a nízkých hodnot, tzv. cold spots. Využití tohoto nástroje v GIS pak umožňuje analýzu vizualizovat a získat tak poměrně koncentrovanou informaci ve snadno uchopitelném formátu mapového výstupu. Getis-Ord G* vyhodnotí signifikantní shlukování sledovaného jevu v prostoru, v tomto případě určité typy činností ekonomických subjektů, které definujeme prostřednictvím zařazení ekonomického subjektu dle jeho kódu prováděné ekonomické činnosti uvedeného v databázi. Hot Spot Analýza generuje z-skóry a p-hodnoty, které pomáhají při rozhodování při zamítnutí či přijetí nulové hypotézy, která předpokládá náhodné rozmístění hodnot (ESRI 2012b). Zcela zásadní je, že Hot Spot Analýza počítá statistiku pro každý prvek souboru zvlášť v kontextu sousedících prvků. Výsledná hodnota je navíc porovnána globálně s celým zkoumaným souborem - jde tedy o lokální statistiku v globálním kontextu (Getis, Ord 1995). Klíčem k identifikování hot nebo cold spotu je fakt, že aby se jím prvek stal, nestačí, aby měl výjimečně vysokou nebo nízkou hodnotu, ale musí být obklopen rovněž prvky s vysokými či nízkými hodnotami (Getis 2007). Getis-Ord G* statistika je pak definována vztahem: G i = n w n j=1 i,j x j X j=1 w i,j S [n n j=1 w i,j 2 n ( j=1 w i,j ) 2 ] n 1 Kde x j je hodnota atributu prvku j; w i,j prostorová váha mezi prvky i a j a n je hodnota celkového počtu prvků. Dále pak platí, že: X = S = n j=1 x j 2 n n j=1 x j n (X ) 2. G i index je ve výsledné statistice přímo vyjádřen hodnotou z-score. Při využívání nástroje Hot spot analysis (Getis-Ord G*), v tomto případě za použití softwaru ArcGIS umožňujícího provádět prostorové analýzy dat, je třeba splnit základní předpoklady, jako je určitý minimální počet prvků, počet sousedů a správná konceptualizace prostorových vztahů. Konceptualizace prostorových vztahů může při nevhodném zadání parametrů významně ovlivnit výsledek. Použitý software umožňuje vizualizaci výsledku analýzy v přehledné mapě. Použitá data vycházejí z databáze Registru ekonomických subjektů 2015 (RES). Do analýzy vstupují všechny aktivní (živé) ekonomické subjekty, které jsou právnickými osobami. Uvažovány jsou hlavní (převažující) ekonomické činnosti (vyjádřené kódy NACE) jednotlivých subjektů. V tomto případě použitá statistika hledá významné shluky nízkých a vysokých hodnot odvětví, která spadají pod tzv. high-tech sektor. High-tech sektor je definován dle obvyklé technologické náročnosti aktivit a nákladů na inovační činnosti a výzkum a vývoj. Zpravidla se rozlišuje high-tech sektor služeb a (zpracovatelského) průmyslu. Český statistický úřad klasifikuje high-tech sektor dle parametrů Eurostatu a OECD (2015), který definuje seznam high-tech činností v rámci Klasifikace ekonomických 2
činností NACE 1. Kromě odvětví s vysokou technologickou náročností (tedy high-tech), odlišujeme i také středně vysokou (medium-high tech), středně nízkou (medium low-tech) a nízkou (low-tech) technologickou náročnost. PROSTOROVÁ DISTRIBUCE EKONOMICKÝCH AKTIVIT PODNIKŮ V SEKTORU HIGH-TECH Prostorové vyjádření sledovaných hodnot je samozřejmě možné i bez provedení autokorelační prostorové statistiky. Avšak při využití takto podrobných dat za jednotlivé ekonomické subjekty v nejmenších dostupných sledovaných prostorových jednotkách (v Česku se jedná o obce) je výsledek velmi fragmentovaný a těžko interpretovatelný (ilustrativně obrázek 1). Často se proto při vyjádření prostých hodnot nebo podílů i při provádění dalších statistik přistupuje k agregaci dat do větších územních celků, které sice redukují fragmentaci výsledku, ale za cenu značné ztráty specifické informace, která s sebou individuální data nesou. Obrázek 1: Příklad prostého vyjádření podílu [%] high-tech sektoru služeb na celkovém počtu subjektů v obci bez využití prostorové autokorelační analýzy (2015) 1 https://www.czso.cz/csu/czso/klasifikace_ekonomickych_cinnosti_cz_nace 3
Hot spot analýza Getis-Ord G* naopak s jedinečnou informací v individuálních datech pracuje a umožňuje odhalit statisticky významné koncentrace. Výsledek hot spot analýzy totožných individuálních dat, pak poskytuje zcela jinou perspektivu (obrázek 1 vs. obrázek 2). Sektor služeb se tradičně koncentruje spíše v centrech. I v případě high-tech služeb, které jsou často spojeny i s dalšími vyššími funkcemi center (značná část výzkumu a vývoje se soustředí kolem univerzit atp.) předpokládáme vysokou koncentraci do důležitých center. Ani Česko není výjimkou a statisticky významné a výrazné koncentrace high-tech služeb hot spot odhalila právě uvnitř a v bezprostřední blízkosti našich nejvýznamnějších center (obrázek 2). Hot spot analýza také identifikuje statisticky významné nízké koncentrace high-tech služeb (tzv. cold spots). Tradiční vnitřní periferie Vysočiny v tomto případě vystupuje výraznějším výskytem cold spotů, stejně jako šumavské podhůří na pomezí Jihočeského a Plzeňského kraje. Obrázek 2: Hot spot analýza high-tech sektoru služeb (2015) Na rozdíl od sektoru služeb, průmysl tak výrazně koncentrován do hlavních center a metropolitních areálů není (obrázek 3). Česko nemá příliš rozvinutý high-tech sektor zpracovatelského průmyslu a česká ekonomika nedisponuje významnějším centrem high-tech průmyslu, které by na sebe ve větší míře nabalovalo další high-tech aktivity. Signifikantní koncentrace jsou proto spíše lokálního charakteru a shluky jsou rozptýlené po celém území. Zajímavé je, že metoda hot spot analýzy nebyla v tomto případě schopna identifikovat významně nízké koncentrace. Hodnoty koncentrace high-tech průmyslu jsou kromě zmíněných hot spotů víceméně náhodné (tzn., mimo identifikované hot spoty se nepodařilo vyvrátit nulovou hypotézu o náhodném výskytu subjektů high-tech sektoru). Identifikované hot spoty se koncentrují většinou v oblastech, kde působí nějaký výrobce či výrobci ze specifického odvětví. Je pravděpodobné, že pokud by do podobně podrobné analýzy vstupovaly další 4
sousedící regiony/státy, řada těchto identifikovaných hot spotů by neobstála v konkurenci globálního hlediska celkového sledovaného území. Obrázek 3: Hot spot analýza high-tech zpracovatelského průmyslu (2015) Pokud analyzujeme celý sektor high-tech (obrázek 4), tedy high-tech služby a zpracovatelský průmysl dohromady, výsledné prostorové vyjádření hot a cold spotů se do značné míry podobá analýze hightech služeb. Síla identifikovaných jader high-tech služeb v tomto případě dominuje, i když cold spots nejsou tak výrazné. Dominance našich největších center přetrvává a vysoká četnost subjektů služeb překonává prostorový vzorec high-tech zpracovatelského průmyslu. Při hodnocení technologicky náročných aktivit v ekonomice se kromě high-tech oborů sledují i obory technologicky o něco méně náročné, avšak stále relativně významné a v ekonomice Česka zastoupené více než ty nejvíce technologicky náročné, tedy medium high-tech obory. Např. v hodnocení Innovation Scoreboard 2016 2 Česká republika v celkovém hodnocení zaujímá místo pod průměrem EU28 a je zařazena do kategorie tzv. moderate innovators (průměr EU28 spadá do kategorie tzv. strong innovators). Přesto, že řada složek indexu vyznívá pro Česko negativně, složka, která hodnotí i export high-tech a medium high-tech produktů Česko, spolu s dalšími výrazně exportně založenými ekonomikami, obsazuje přední příčky. Hot spot analýza medium high-tech oborů (obrázek 5) je proto zajímavým doplňkem k hot-spot analýzy high-tech sektoru. 2 http://ec.europa.eu/growth/industry/innovation/facts-figures/scoreboards_cs 5
Obrázek 4: Hot spot analýza high-tech sektoru (služby i průmysl, 2015) Signifikantní medium high-tech hot spoty vznikají opět v oblastech, kde často dominují významní výrobci a exportéři. Z center jako hot spot vystupuje Ostravsko, Zlínsko a částečně Brněnsko spolu s Blanskem a Karlovarskem. Zajímavý je taktéž výrazný pás identifikovaný jako cold spot na pomezí Jihočeského kraje a kraje Vysočina. SHRNUTÍ Individuální data za ekonomické subjekty mohou být zajímavým zdrojem specifických informací o ekonomických aktivitách v Česku. Hot Spot Analýza (Getis-Ord G*) je příkladem, jak efektivně pracovat s podrobnými daty bez nutnosti agregace a následné ztráty lokálně specifických informací. Při interpretaci výsledků je však třeba mít na paměti, že se jedná pouze o explorativní analýzu, která neříká nic o příčinách vzniku ani o vývoji zkoumaného prostorového vzorce. Může tak být sice zajímavým, ale výhradně pouhým podkladem pro další práci s těmito daty nebo vstupním pohledem na distribuci zkoumaného jevu v území, který vytipuje určité oblasti či lokality pro další hlubší analýzu či výzkum. V uvedeném příkladu bylo uvažováno pouze se subjekty jako s aktivními jednotkami, reprezentujícími specifickou ekonomickou činnost (dle klasifikace NACE). K podrobnější představě o prostorových vzorcích ekonomických aktivit by mohlo být dále přihlédnuto např. k velikosti subjektu nebo k tomu, zda subjekt podléhá zahraniční kontrole. Avšak i za využití představené sady 6
jednoduchých kritérií dokáže prostorová autokorelační statistika odhalit některé základní vzorce, zde high-tech aktivit (reprezentovanými jednotlivými subjekty) v území prostřednictvím identifikovaných hot a cold spotů. Obrázek 5: Hot spot analýza skupiny medium high-tech oborů zpracovatelského průmyslu (2015) 7
ZDROJE ARCDATA Praha (2015): Digitální vektorová geografická databáze České republiky ArcČR 500 ČSÚ (2015): Registr ekonomických subjektů. Individuální data. Praha. ESRI (2012): ArcGIS Desktop: Release 10. Redlands, CA: Environmental Systems Research Institute. ESRI (2012b): Spatial Statistics. How Hot Spot Analysis (Getis-Ord Gi*) Works. [online] European Commission (2016): European Innovation Scoreboard 2016, 96 pp. [online] Getis, A. (2007): Reflections on Spatial Autocorrelation. Regional Science and Urban Economics, 37(4), 491-496. Getis, A., Ord, J.K. (1995): Local Spatial Autocorrelation Statistics: Distributional Issues and an Application. Geographical Analysis, 27(4), 286-306. OECD (2015): OECD Methodology for Classifying High-Technology Industries. [online] 8