EASYSTAT.0 Užvatelsý manuál Josef Novotný, Votěch Nose, Kael Jelíne Kontat: pepno@natu.cun.cz Příodovědecá faulta Unvezt Kalov v Paze OBSAH. Úvod... 2. Spuštění pogamu, načtení dat, volba počítaných ndátoů... 2 3. Dostupné statst... 4 3.. Půmě a mí vaablt... 4 3.2. Rozlad Thelova oefcentu a testování statstcé významnost... 5 3.3. Loalzační vocent... 7 3.4. Mí postoové příbuznost Upavený Jaccadův ndex, Upavený Dceho ndex... 8 4. Použtá lteatua... 0. Úvod EasStat e volně dostupný pogam funguící v opeačním sstému Wndows. Umožňue výpočt vbaných statstcých ndátoů, teé nesou zahnut do neběžně používaných tabulových pocesoů. Veze.0 obsahue výpočt: Vbaných mě vaablt (Vaačního oefcentu, Gnho oefcentu a Thelova oefcentu) v ech nevážené (obvlé), ale vážené fomě. Rozladu Thelova oefcentu na eho mez-supnovou a vnto-supnovou složu včetně očštění o stochastcou (náhodnou) složu. Loalzačních vocentů z matce dat. Upaveného Jaccadova ndexu a Upaveného Dceho ndexu, aožto ndátoů postoové příbuznost evů odvozované na záladě sledování ech společných výstů v egonech učtého územního sstému. Př použtí aplace posím uváděte následuící odaz: Novotný, J., Nose, V., Jelíne, K. (204): EasStat. Příodovědecá faulta UK, Paha, dostupné na: http://web.natu.cun.cz/~pepno/easstat.zp
2. Spuštění pogamu, načtení dat, volba počítaných ndátoů Pogam e dspozc e stažení na adese: http://web.natu.cun.cz/~pepno/easstat.zp. Staženou zp složu e nutno ozbalt na ds počítače. Obsahue něol souboů (včetně manuálu), teé musí po spávné fungování pogamu zůstat uložen ve společném adesář. Zde e též spouštěcí soubo EasStat.exe. Po lnutí na ně se obeví výchozí ono pogamu (Obáze ). Další nstalace pogamu do počítače není potřebná. Pogam EasStat načítá vstupní data z CSV souboů ( csv oddělený středníem př uládání z MS Excel). Ve vstupním soubou e zapotřebí mít ednotlvé poměnné ve sloupcích (př výpočtech ndátoů podobnost v matc, vz dále). Pvní řáde může obsahovat pops poměnných, v opačném případě sou poměnné po načtení dat pomenován automatc písmen dle abeced. Načtení vstupního csv soubou z daného adesáře počítače se povádí zadáním cest tomuto soubou lnutím na tlačíto označené třem tečam vpavo nahoře vedle řádu, de se poté zobazí cesta danému soubou. Vedleší tlačíta Obnovt a Včstt slouží atualzac zdoového soubou, esp. eho odstanění z pogamu EasStat (nolv z příslušného adesáře počítače). Obáze : Výchozí ono pogamu EasStat po spuštění (záloža Vstupní data) 2
Před načtením dat e možné upavt fomát načítaného soubou v záložce Nastavení (vz Obáze 2). Mmo né e zde možno specfovat způsob nahazování nevplněných a nečíselných hodnot vstupních dat. Záladní nastavení nahazue nevplněné a nečíselné hodnot nulam. Poud maí poměnné (sloupce dat) v ednom soubou ůzný počet pozoování (řádů), dode poto př zachování záladního nastavení automatcému doplnění nul do aždého sloupce dle ozsahu poměnné s nevětším počtem pozoování. Poud chceme, ab vpočtené ndáto efletoval sutečný počet pozoování u ednotlvých poměnných, e třeba v záložce Nastavení zvolt možnost vnechání nevplněných hodnot. V záložce Nastavení e taé možno zvolt ozsah zobazených dat načteného soubou (záladní nastavení e 00 sloupců a 000 řádů). Je možné a v případech větších souboů dat vhodné zobazovat pouze část výchozího soubou dat. Toto nemá vlv na výpočt, neboť pogam pacue vžd s úplným souboem výchozích dat, bez ohledu na zobazený ozsah. Obáze 2: Záloža Nastavení Volba ndátoů (funcí) po výpočt se povádí výběem z nabíd ndátoů ve spodní část ttulní zálož Vstupní data u popsu Funce (Obáze 3). Pogam umožňue současné výpočt více ndátoů po aždou další volbu e třeba lnout na text Přdat výpočet (vlevo dole). Vsvětlení paametů, zadávaných ednotlvým ndátoům, e níže. Volba ndátoů (funcí) po výpočt se povádí výběem z nabíd ndátoů ve spodní část ttulní zálož Vstupní data u popsu Funce (). Pogam umožňue současné výpočt více ndátoů po aždou další volbu e třeba lnout na text Přdat výpočet (vlevo dole). Vsvětlení paametů, zadávaných ednotlvým ndátoům, e níže. 3
Obáze 3: Volba počítaných ndátoů 3. Dostupné statst 3.. Půmě a mí vaablt - Vaační oefcent, Gnho oefcent, Thelův oefcent v ech nevážené a vážené fomě Pops ndátou: Z popsných statst e dspozc výpočet půměu, ve vážené nevážené podobě. Po měření mí neovnoměnost sou dspozc vaační oefcent, Gnho oefcent a Thelův oefcent. Vstupní data: Matce dat, ve teé sloupce označuí sledované poměnné, u nchž sledueme míu neovnoměnost nebo půmě, a řád ednotlvá pozoování. Thelův ndex neumí pacovat s nulovým hodnotam, v Nastavení e poto nutné nastavt Nahadt 0 hodnotou blízou nule. Výstup: Výstupem sou ednočíselné hodnot zvolených statst. Volba paametů: Komě zvoleného uazatele lze volt Váh. Je možné volt mez Nevážený (všechna pozoování maí stenou váhu) nebo aýmolv ným číselným uazatelem ze vstupních dat (ednotlvá pozoování vážena podle zvoleného uazatele). Přílad použtí: Půmě e záladní popsnou statstou, vaační, Gnho a Thelův oefcent měří míu neovnoměnost sledovaného uazatele. Buď sledueme ozdíl mez postým hodnotam (bez použtí vah, ao Váh volíme Nevážený), nebo pacueme s populačně č 4
na váženým hodnotam (ao Váh volíme lbovolný číselný uazatel, tpc počet obvatel). S neváženou míou neovnoměnost se setáme nečastě př studu výonnost egonů ao eonomcých ednote, vážená mía neovnoměnost zachcue lépe dopad neovnoměnost na obvatele těchto egonů. Fomální záps výpočtu (v nevážené vážené fomě): V G 2 2 ; V v n n 2 ; Gv 2 n n n n T n ln ; Tv ln n Kde V značí vaační oefcent, G Gnho oefcent a T Thelův oefcent. Spodní ndex v značí váženou fomu výpočtu; značí půmě sledovaného uazatele, a hodnot ednotlvých pozoování a n a n ech váh n. 3.2. Rozlad Thelova oefcentu a testování statstcé významnost Pops ndátou: Rozlad Thelova oefcentu umožňue ozdělt míu neovnoměnost (změřenou pomocí Thelova oefcentu) beze zbtu na mez-supnovou a vntosupnovou složu. Rozlad ta umožňue odlšt, a velá část neovnoměnost může být přsouzena ozdílům uvntř supn nebo mez supnovým půmě (např. Novotný 2007). Výpočt lze očstt o stochastcou (náhodnou) složu neovnoměnost (vz Novotný a Nose 202). Vstupní data: Matce dat, ve teé sloupce označuí sledované poměnné, u nchž sledueme míu neovnoměnost, a řád ednotlvá pozoování. Mnmálně eden ze sloupců označue ozřazení ednotlvých pozoování do supn. Supn musí být defnované číselným hodnotam. Thelův ndex neumí pacovat s nulovým hodnotam, v Nastavení e poto nutné nastavt Nahadt 0 hodnotou blízou nule. Výstup: Pogam vpočte celový Thelův oefcent, eho mez-supnovou a vntosupnovou složu a podíl ednotlvých částí. Př použtí Převzoování e vedle hodnot mez-supnové složu uváděna taé hodnota očštěná o stochastcou (náhodnou) složu (vz Novotný a Nose 202). Součet mez-supnové a vnto-supnové slož e vžd oven 00 %. Volba paametů: Zvolen musí být Uazatel, poměnná, po teou e vpočítávána mía neovnoměnost. Po výpočet ozladu e nutné zvolt Regon, uazatel, podle teého e hodnota Thelova oefcentu ozdělena na mez-supnovou a vnto-supnovou složu. Dále lze vbat Váh. Je možné volt mez Nevážený (všechna pozoování maí stenou váhu) nebo aýmolv ným číselným uazatelem ze vstupních dat (ednotlvá pozoování vážena 5
podle zvoleného uazatele). Výsled lze očstt o stochastcou složu pomocí zaštnutí pole Převzoování. Stochastcá složa e vpočtena po náhodném přesupení ednotlvých pozoování ao půmě z n-opaování. Počet opaování lze nastavt lbovolně v záložce Nastavení Počet vzoů. Jao postačuící hodnota se většnou uvádí 000 opaování. Poovnáním hodnot bez převzoování a s převzoováním lze taé testovat statstcou významnost. Přílad použtí: Výpočet ozladu mí neovnoměnost obcí Středočesého ae s ozladem mí neovnoměnost na mez-oesní (mez oesním půmě) a vnto-oesní složu (mez obcem uvntř oesů). Vstupem sou data za ednotlvé obce, oes, ve teém se nachází, počet obvatel a mía nezaměstnanost. Jao uazatel zvolíme NEZAM (míu nezaměstnanost), budeme vážt podle počtu obvatel (OBYV) a za supnu zvolíme oes (od_oes). Výsled očstíme o stochastcou složu zaštnutím Převzoování. Vz Obáze 4. Výsledný podíl mez-supnové slož e oven cca 49,9 %, po odečtení stochastcé slož cca 45,2 %. Většna neovnoměnost (cca 55 %) mez obcem Středočesého ae se ta nachází uvntř oesů. Výsled vz Obáze 5. Po onétní přílad použtí vz taé Nose a Netdová (204) nebo Netdová a Nose (205). Obáze 4: Zadání dat po výpočet ozladu Thelova ndexu 6
Obáze 5: Zobazení dat výsledů ozladu Thelova ndexu Fomální záps výpočtu: T n n C ln n n ln T Kde T B e mez-supnová složa celové mí neovnoměnost T C a T W vnto-supnová složa. Podíl mez-supnové slož odpovídá podílu T B /T C ; značí půmě sledovaného uazatele, a hodnot ednotlvých pozoování a n a n ech váh n; značí půměnou hodnotu sledovaného evu v -té ednotce ve supně. B T W 3.3. Loalzační vocent Pops ndátou: Loalzační vocent uazue míu oncentace učtého evu v učtém egonu. Poměřue elatvní četnost výstu tohoto evu v daném egonu s elatvní četností tohoto evu v územním sstému vššího řádu. Vstupní data: Matce zdoových dat, ve teé sloupce označuí ev, u nchž sledueme míu oncentace, a řád označuí egon. Výstup: Pogam vpočte loalzační vocent po aždou buňu dané matce. Výsledem e poto matce shodného ozsahu ao zdoová data, přčemž v aždé z buně e vpočten loalzační vocent po daný ev a egon. Volba paametů: Tento ndáto nemá žádné další paamet. Přílad: Výpočet loalzačních vocentů po supn mgantů v egonech Česa. Vstupem e matce dat, de sloupce označuí ednotlvé supn mgantů a řád egon Česa. Poud že v populac učtého egonu např. % mgantů z Uan, zatímco v celé populac dané země že pouze 0,5 % mgantů z Uan, e loalzační vocent oncentace Uanců v daném egonu oven 2. Obdobně po další supn mgantů a egon. 7
Fomální záps výpočtu: LQ, F F,, F, F, Kde LQ, e loalzační vocent vpočtený po učtou supnu (ev) a egon a F, e elatvní četnost této supn v egonu. 3.4. Mí postoové příbuznost Upavený Jaccadův ndex, Upavený Dceho ndex Pops ndátoů: Oba tto ndáto měří tzv. postoovou příbuznost dvou evů na záladě vhodnocení fevence společných oncentací těchto evů v egonech (aždý z ndátoů povádí toto vhodnocení tochu odlšným způsobem). Exstence č neexstence oncentace daného evu v daném egonu e přtom měřena pomocí loalzačního oefcentu. Vstupní data: Matce zdoových dat, ve teé sloupce označuí ev, echž vzáemnou postoovou příbuznost chceme vhodnott a řád označuí egon. Výstup: Pogam vpočítá mí daného ndátou postoové příbuznost (Upavený Jaccadův ndex nebo Upavený Dceho ndex) po všechn dvoce evů (tzn. sloupců) ve vstupní matc. Výstupem e ted vžd soubo n*(n-)/2 výsledů, de n = počet sloupců dat. U soubou s méně sloupc e výsled možno zobazt přímo v záložce Výsled (Obáze 6). V taovém případě e ale nutno nezadávat výstupní Soubo př volbě paametů ndátou (Obáze 7). Poud cestu výstupnímu csv soubou zadáme, uloží se výsled do ně. Zobazený výstup na Obázu 6 má popse ndátou a tř sloupce dat, přčemž pvní dva označuí pomocí pořadových čísel sloupců vstupního soubou dvoc sledovaných evů a ve třetím sloupc e hodnota zvoleného ndátou postoové příbuznost. Výsled zde sou zapsán obdobným způsobem (t. v ednotlvých řádcích sou pořadová čísla dané dvoce poměnných a hodnota zvoleného ndátou), přčemž polož v ednotlvých řádcích sou oddělen čáou (z tohoto soubou lze ednoduše načíst výsledná data např. do tabul MS Excel pomocí funce mpot dat z textu ) Obáze 6: Zobazení výsledů př výpočtech ndátoů postoové příbuznost 8
Obáze 7: Volba paametů př zadávání výpočtů ndátoů postoové příbuznost Volba paametů: Př zadání ndátoů postoové příbuznost e vedle paametu Soubo (vz výše) možno stanovt paamet Mez. Ten udává hodnotu loalzačního vocentu, teou e defnována oncentace sledovaných evů v ednotlvých egonech. Defaultně e nastavena mez ovna,0. Přílad použtí: Výpočet ndátoů postoové příbuznost supn mgantů v Česu. Vstupem e matce dat, de sloupce označuí ednotlvé supn mgantů (např. Uance, Vetnamce, Slová, Němce) a řád egon Česa. Indáto postoové příbuznost (Upavený Jaccadův ndex nebo Upavený Dceho ndex) e možno použít výpočtům vzáemné postoové příbuznost mez dvocem těchto supn. Výpočt postoové příbuznost mohou být z ůzných důvodů užtečné, neboť postoová příbuznost velm často odáží né aspet příbuznost sledovaných evů. Po onétní přílad použtí těchto ndátoů vz Novotný, Cheshe (202); Novotný, Hasman (205). Fomální záps výpočtu: Vstupní data sou popsán matcí udávaící počt zástupců učtých supn, (sloupce) v egonech (řád). Nepve e po všechn supn a egon vpočtena matce loalzačních vocentů LQ (vz výše). Na záladě stanovené meze LQ (defaultně,0) e stanoveno, zda se daná supna oncentue v egonu (t. zda LQ > ) nebo ne. Po výpočet ndátoů postoové příbuznost mez supnam a e pa poovnávána množna egonů, ve teých se tto supn oncentuí fomálně označueme tto množn egonů ao {: LQ, > } a {: LQ, > }. Upavený Jaccadův ndex postoové příbuznost pa vpočteme ao: J, : LQ, : LQ, : LQ, : LQ, Po výpočet upaveného Dceho ndexu e třeba nedříve vpočíst eho nesmetcé vaant. Pvní nesmetcý Dceho ndex postoové příbuznost dvou supn a vpočteme ao podmíněnou pavděpodobnost, že supna e oncentována v egonu, el v daném egonu oncentována taé supna : D P LQ, LQ, : LQ, : LQ, : LQ, Duhý nesmetcý Dceho ndex pa analogc zachcue podmíněnou pavděpodobnost, že supna e oncentována v egonu, e-l v daném egonu oncentována taé supna : 9
D 2 P LQ, LQ, : LQ, : LQ, : LQ, Upavený smetcý Dceho ndex postoové příbuznost odpovídá menší z eho výše uvedených asmetcých vaant: D, mn D ; D 2 4. Použtá lteatua NETRDOVÁ, P., NOSEK, V. (205): Spatal pattens of unemploment n Cental Euope: emegng development axes beond the blue banana, Jounal of Maps, přato publac. NOSEK, V., NETRDOVÁ, P. (204): Measung spatal aspects of vaablt. Compang spatal autocoelaton wth egonal decomposton n ntenatonal unemploment eseach. Hstocal Socal Reseach, 39, 2, 292-34. NOVOTNÝ, J. (2007): On the measuement of egonal nequalt: does spatal dmenson of ncome nequalt matte? The Annals of Regonal Scence, 4, 3, 563-580. NOVOTNÝ, J., HASMAN, J. (205): The emegence of egonal mmgant concentatons n USA and Austala: a spatal elatedness appoach. PLoS ONE, 0(5): e026793. NOVOTNÝ, J., CHESHIRE, J. (202): The suname space of the Czech Republc: examnng populaton stuctue b netwo analss of spatal co-occuence of sunames. PLoS ONE, 7(0), e48568. NOVOTNÝ, J., NOSEK, V. (202): Compason of egonal nequalt n unemploment among fou Cental Euopean countes: an nfeental appoach. Lettes n Spatal and Resouce Scences, 5, 2, 95-0. 0