ROZDĚLENÍ PŘÍJMŮ A JEHO MODELY Jitka Batošová Kateda managementu infomací, Fakulta managementu, Vysoká škola ekonomická Paha, Jaošovská 1117/II, 377 01 Jindřichův Hadec batosov@fm.vse.cz Abstakt: Poces tansfomace ekonomiky, kteý byl v České epublice zahájen po oce 1990, významně ovlivnil mj. také platy a příjmy obyvatelstva. Různost zdojů, ze kteých příjmy pocházejí, a současný poces difeenciace mezd, kteý pobíhá v někteých společenských skupinách velmi bouřlivě, má za následek vzůst neshody empiického ozdělení příjmů s pavděpodobnostním modelem především na jeho okajích. Vznikají velmi vysoké hodnoty příjmů, kteé mohou být považovány za odlehlé a mohou způsobovat naušení (kontaminaci) zvoleného modelu. V někteých sociálních skupinách odpovídá empiické ozdělení příjmů směsi a nelze ho poto dobře vystihnout jednovcholovým pavděpodobnostním modelem atp. Tento příspěvek je zaměřen na ozklad příjmových souboů, kteé se vyznačují dvouvcholovým empiickým ozdělením četností. Klíčová slova: pavděpodobnostní model, ozdělení příjmů, třídění směsi. 1. Úvod Příjmy domácností jsou objektem zkoumání ekonomů všech vyspělých zemí světa, neboť v sobě odážejí životní úoveň obyvatelstva. Znalost ozdělení příjmů obyvatelstva a možnost jeho poovnávání z ůzných sociálně-ekonomických a časově-postoových hledisek je podmínkou posouzení životní úovně, úovně sociálního zabezpečení a sociální spavedlnosti v ozdělování mateiálních hodnot, vytvořených společností. Statistická analýza ozdělení příjmů obyvatelstva by měla být také východiskem po ozhodování v oblasti ozpočtu a sociální politiky. Přímá souvislost příjmů s kupní silou obyvatelstva staví sledování úovně, stuktuy a vývoje ozdělení příjmů na přední místo také při zjišťování odbytových možností po výobky dlouhodobé i kátkodobé spotřeby. Můžeme je ovněž využít při úvahách o úovni daňového zatížení apod. Životní úoveň, kteá je v šiším smyslu dána souhnem všech životních podmínek hmotných i společenských, nelze v tomto obecném pojetí zcela uspokojivě kvantifikovat. Poto se při statistické analýze životní úovně zaměřujeme pouze na měřitelné složky životní úovně. Po spávnou kvantifikaci té složky životní úovně obyvatelstva, kteá je přímo závislá na příjmech, je potřeba vystihnout úoveň a stuktuu příjmů obyvatelstva komplexně a nalézt vhodné pavděpodobnostní modely příjmových ozdělení po jednotlivé sociální skupiny i po obyvatelstvo jako celek, bez ohledu na sociální skupinu. Znalost pavděpodobnostního modelu, kteý představuje jednoduchou apoximaci mnohdy složitého empiického ozdělení, a znalost tendu vývoje jeho paametů by měly tvořit základ po konstukci odhadu spotřeby v budoucnosti i po pedikci dopadu ůzných sociálních a ekonomických opatření. Často používaný typ pavděpodobnostního modelu ozdělení příjmů (logaitmicko-nomální ozdělení) je odvozen z chaakteu sledovaného znaku a vychází z dlouhodobé zkušenosti s jeho chováním před zahájením tansfomačního pocesu. Dřívější plánovaná foma ekonomiky, kteá se vyznačovala vysokou homogenitou příjmů obyvatelstva ve všech sociálních skupinách, se v současné době mění na fomu tžní a tato změna sebou přináší i někteé změny ve stuktuře příjmů obyvatelstva.
Poces tansfomace ekonomiky, kteý byl v České epublice zahájen po oce 1990, významně ovlivnil mj. také platy a příjmy obyvatelstva. Různost zdojů, ze kteých příjmy pocházejí, a současný poces difeenciace mezd, kteý pobíhá v někteých společenských skupinách velmi bouřlivě, má za následek vzůst neshody empiického ozdělení příjmů s pavděpodobnostním modelem především na jeho okajích. Vznikají velmi vysoké hodnoty příjmů, kteé mohou být považovány za odlehlé a mohou způsobovat naušení (kontaminaci) zvoleného modelu (viz [4], [5], [6]). V někteých sociálních skupinách odpovídá empiické ozdělení příjmů směsi a nelze ho poto dobře vystihnout jednovcholovým pavděpodobnostním modelem atp. Tyto změny se v půběhu tansfomačního pocesu stále pohlubují a s ozdílnou intenzitou a setvačností se postupně pojevují v ozdělení příjmů všech obyvatel i v někteých sociální skupinách.. Datové souboy Setvačnost příjmů domácností způsobuje zpoždění jejich eakce na poces tansfomace. Nelze tedy předpokládat, že hospodářské změny se pojeví v ozdělení příjmů bezpostředně po oce 1990. Poto byly k analýze ozdělení příjmů domácnostní po oce 1990 použity výběové souboy, pocházejí z Mikocensu 1996, kteé monitoují příjmy českých domácností po uplynutí šesti let od počátku tansfomačního pocesu a můžeme poto očekávat, že v jejich ozdělení se budou ekonomické změny zřetelně odážet..1 Mikocensus 1996 V oce 1996 se výběové šetření Mikocensus povádělo na přibližně 1% domácností, což činilo v té době asi 8 tis. bytů. K účelům zkoumání ozdělení očních příjmů obyvatelstva byly od Českého statistického úřadu získány následující údaje: sociální skupina učená podle typu zaměstnání osoby v čele domácnosti 1 dělníci, samostatně činní (mimo zemědělství), 3 zaměstnanci, 4 samostatně hospodařící olníci, 5 dužstevní olníci, 6 důchodci v domácnosti s ekonomicky aktivními členy, 7 důchodci v domácnosti bez ekonomicky aktivních členů, 8 nezaměstnaní, 0 ostatní, počet členů domácnosti, čistý oční peněžní příjem domácnosti (v Kč za ok). Neagegované datové souboy příjmů mají tu výhodu, že umožňují získat kvalitní odhady chaakteistik jejich empiického ozdělení i paametů zvoleného teoetického modelu. Tyto souboy ovněž dovolují povádět detekci odlehlých hodnot příjmů a odhad kontaminace vybaného modelu. Infomace o uvedených zvláštnostech ozdělení příjmů by nebylo možné získat z agegovaných souboů, publikovaných na intenetových stánkách Českého statistického úřadu a ve statistických očenkách. Údaje, publikované ČSÚ, například neobsahují bližší infomace o kajích ozdělení příjmů oba kajní intevaly jsou zde ponechány otevřené. To způsobuje velké poblémy především v pavém kajním intevalu, kde hodnoty příjmů nejsou koncentovány v okolí jeho dolní hanice. Navíc podíl těchto hodnot tvale oste. V posledním
mikocensním šetření, povedeném v. 00, přesahoval podíl hodnot, ponechaných v obou kajních intevalech, v někteých sociálních skupinách 5%.. Volba statistické jednotky a statistického znaku Vzhledem k tomu, že při modelování příjmových ozdělení nejsou ozhodující vztahy příbuzenské, ale vztahy hospodářské, představuje zde statistickou jednotku hospodařící domácnost. Po koupěschopnost domácností většinou není ozhodující jejich celkový příjem, ale ukazatel z něj odvozený příjem na hlavu, tj. na jednoho člena domácnosti. Jedním ze zkoumaných statistických znaků tedy bývá čistý oční peněžní příjem na hlavu. Výjimku tvoří zboží dlouhodobé a kolektivní spotřeby, kde má po koupěschopnost domácností ozhodující význam jejich celkový příjem. Dalším zkoumaným znakem je poto celkový čistý oční peněžní příjem na domácnost. 3. Směsové souboy a jejich třídění Při analýze empiického ozdělení celkových příjmů domácností, pocházejících z Mikocensu 1996, lze ve dvou případech (příjmy domácností důchodců bez ekonomicky aktivních členů a příjmy všech domácností) pozoovat dvouvcholovost ozdělení (viz gafy 1 a ). Takže empiické ozdělení v těchto dvou případech signalizuje směs, kteou nelze namodelovat unimodálním teoetickým ozdělením. Nejpve je potřeba povést vhodný ozklad směsi na dvě jednovcholové složky, kteé jsou pak modelovány samostatně. V obou případech se zřejmě jedná o směs dvou posunutých jednoduchých unimodálních křivek. Navíc v případě všech domácností, bez ohledu na sociální skupinu, se bude jednat pavděpodobně o směs více křivek. V tomto soubou jsou zahnuty domácnosti všech velikostí i všech sociálních skupin, takže příjmy na domácnost zde závisí jednak na sociální skupině a jednak na počtu členů domácnosti. Situace je tedy v tomto případě velmi komplikovaná (viz gaf ). Gaf 1. Jádový odhad ozdělení příjmů domácností důchodců bez ekonomicky aktivních členů a jeho třípaametický logaitmicko-nomální model (příjmy na domácnost)
Gaf. Jádový odhad ozdělení příjmů všech domácností a jeho třípaametický logaitmicko-nomální model (příjmy na domácnost) V uvedených gafech 1, jsou zobazeny jednak jádové odhady hustoty ) f E ( x) = 1 n h n i= 1 X i x K h (1) s kosinovým jádem 1 X x cos i po h X i x K = h 0 jinak X i x h π () a jednak hustoty příslušných třípaametických logaitmicko-nomálních modelů ( ln( x γ ) µ ) 1 1 σ e σ π ( x γ ) po x ( γ, ) f ( ;, σ T x µ, γ ) = (3) 0 jinak, kde µ, σ, γ jsou paamety logaitmicko-nomálního modelu a paamet h ovlivňuje stupeň vyhlazení křivky jádového odhadu. 3.1 Třídění směsových souboů Při třídění směsí můžeme postupovat dvěma ůznými způsoby:
logickým, datově oientovaným. Přednost mají vždy logické metody třídění. K tomu je ovšem nezbytná znalost dalších doplňkových infomací o datových souboech. Logický přístup má především tu výhodu, že umožňuje nalézt skutečné příčiny vzniku směsí. Další výhodou je ovněž možnost zpacování vzniklých podskupin příjmů podle odlišných pavděpodobnostních modelů. Tepve v případě, kdy nejsou k dispozici vhodná logická kitéia, používají se ke třídění ůzné datově oientované statistické postupy. Přitom je nezbytné bát v úvahu i to, že ozdělení příjmů v jednotlivých podskupinách se mohou lišit jak hodnotami někteých ukazatelů (např. polohou nebo ozptylem), tak funkčním tvaem. Pokud jsou náhodné veličiny X 1,..., X n nezávislé, lze při znalosti funkčních tvaů ozdělení v podskupinách J 1 a J použít k oztřídění pvků metodu maximální věohodnosti. Tato metoda spočívá v maximalizaci logaitmické věohodnostní funkce kde ( θ θ ) ( θ l x) l ( x) l 1, x = 1 1 + θ, (4) ( θ x) = ln f ( x θ ) l, 1 1 1 i ; xi J1 ( θ x) = ln f ( x ; θ ) l, xi J θ1 a θ jsou vektoy paametů hustot ozdělení f 1( x; θ1) a f ( x; θ ) v jednotlivých podskupinách. Maximalizací funkce l ( θ 1,θ x) vzhledem k vektoům paametů θ1 a θ i vzhledem k pvkům v podskupinách J 1 a J lze nalézt optimální oztřídění datového soubou. Tento ozklad je nutné povádět iteačně (viz [1]). 3. Třídění souboů příjmů domácností bez EA členů a všech domácností Rozklad směsových souboů příjmů domácností lze tedy povádět dvěma způsoby logicky nebo vhodnou datově oientovanou statistickou metodou. K logickému ozkladu souboů s dvouvcholovými (bimodálními) gafy jádových odhadů hustot do dvou podskupin lze použít pouze jedinou doplňkovou infomaci, kteou máme k dispozici, tj. počet členů domácnosti. Tento fakto může mít vliv na ozdělení četností pouze v případě příjmů na domácnost jako celek. Pokud by byla směs identifikována také u ozdělení příjmů na hlavu, bylo by nutné použít k ozkladu příjmových souboů do podskupin jinou metodu než logickou. V takovém případě by bylo nezbytné použít někteou vhodnou statistickou metodu ozkladu, např. metodu maximální věohodnosti. Logické třídění směsi by v tomto případě nebylo možné povést, neboť souboy příjmů domácností, získané z Mikocensu 1996, neobsahovaly žádné další doplňkové infomace. K ozkladu dvouvcholových ozdělení zde byla nejpve použita iteační pocedua, založená na pincipu maximální věohodnosti. Popis iteační poceduy lze nalézt v páci (viz [1]). Tato pocedua byla ealizována v pogamu MatLab. Za počáteční odhad dělícího bodu byla v této poceduře zvolena hodnota příjmů, v níž jádový odhad empiické hustoty dosahuje minima mezi oběma vcholy. Potože v půběhu iteační poceduy pakticky nedocházelo k dalšímu přeskupení dat, je výsledek shodný se zvoleným počátečním dělením soubou. To znamená, že pvní složka směsi je tvořena pvky menšími než toto minimum a duhá složka pvky většími. Vzhledem k tomu, že tento způsob ozkladu vychází pouze i 1 (5)
z empiického ozdělení četností a nezkoumá příčiny vzniku směsi, bylo nutné použít jiný způsob třídění logický. Jak bylo uvedeno, datové souboy, získané z Mikocensu 1996, obsahují komě infomace o sociální skupině a o hodnotě čistého očního příjmu ovněž infomaci o počtu členů domácnosti. Potože se jedná o celkové příjmy domácností, jsou v obou případech splněny předpoklady po aplikaci logického ozkladu a uvedené doplňkové kitéium může být použito k ozkladu obou směsových souboů. 4. Výsledky logického třídění směsových souboů 4.1 Souboy celkových příjmů domácností bez EA členů Gaf 3. Jádový odhad ozdělení příjmů domácností důchodců bez ekonomicky aktivních členů a jeho logaitmicko-nomální model (jednočlenné domácnosti) Gaf 4. Jádový odhad ozdělení příjmů domácností důchodců bez ekonomicky aktivních členů a jeho logaitmicko-nomální model (vícečlenné domácnosti)
Zvolená metoda ozkladu ve skupině důchodců bez ekonomicky aktivních členů tedy vycházela z hypotézy, že počet členů by v této skupině mohl mít dominantní vliv na celkový příjem domácnosti. Lze očekávat, že jednočlenné domácnosti důchodců bez ekonomicky aktivních členů budou mít významně nižší oční příjmy než domácnosti vícečlenné. Povedený ozklad tuto hypotézu potvdil směs se ozdělila na dvě složky s unimodálními ozděleními. Jádové odhady obou složek s unimodálním empiickým ozdělením jsou zobazeny v gafech 3 a 4. Ve všech případech je do gafu zakeslen ovněž třípaametický logaitmicko-nomální model. K oběma složkám směsi, vzniklým logickým ozkladem, byly zkonstuovány příslušné logaitmicko-nomální modely. Odhady paametů modelů byly povedeny iteačně metodou maximální věohodnosti. Navžená iteační pocedua je uvedena v pacích [1], [6]. Po ilustaci výsledků jsou logaitmicko-nomální modely obou složek zobazeny společně do gafu 5. Gaf 5. Překývání logaitmicko-nomálních modelů složek směsi ozdělení příjmů domácností důchodců bez ekonomicky aktivních členů (příjmy na domácnost) Logaitmicko-nomální modely složek směsi (důchodci bez ekonomicky aktivních členů) osa x. příjmy na domácnost jednočlenné domácnosti osa y. hustota třípaametických logaitmicko-nomálních modelů vícečlenné domácnosti 4. Souboy celkových příjmů všech domácností Dalším směsovým souboem příjmů na domácnost jako celek je soubo příjmů všech domácností, bez ohledu na sociální skupinu. Zde je situace zkomplikována značnou složitostí stuktuy tohoto příjmového soubou, kteá se pojevuje mj. i tím, že oba vcholy empiického ozdělení četností jsou zde méně výazné zastíněné jinými vlivy. Důvod dvouvcholovosti empiického ozdělení není v tomto případě tak zřejmý, jako tomu bylo v předchozím případě. K počáteční oientaci v této složité situaci přispělo učení vlivných skupin, tj. skupin s velkým ozsahem, kteé mají zásadní vliv na chaakte ozdělení celého výběového soubou. Z tabulky 1 a gafu 1 vyplývá, že nejvlivnějšími skupinami byly v. 1996 domácnosti dělníků a domácnosti důchodců bez ekonomicky aktivních členů, kteé tvořily dohomady dvě třetiny všech domácností. Další velkou skupinu tvořily domácnosti zaměstnanců (téměř jedna čtvtina všech domácností v České epublice.) Všechny další
sociální skupiny tvořily dohomady pouhých 13,% všech pošetřených domácností, takže nemohly mít na výsledné empiické ozdělení četností zásadní vliv. Důvod podobného chování ozdělení příjmů všech domácností a ozdělení příjmů domácností důchodců bez ekonomicky aktivních členů lze spatřovat ve velikosti této sociální skupiny, kteá tvoří téměř třetinu všech celého výběového soubou, získaného z Mikocensu 1996 (viz páce [1], [], [3]). Hledaná příčina dvouvcholovosti empiického ozdělení příjmů všech domácností je tedy obsažena buď přímo v ozdělení někteé z těchto vlivných složek, nebo vzniká jejich smísením. Z uvedených vlivných skupin má výazně dvouvcholové ozdělení pouze skupina domácností důchodců bez ekonomicky aktivních členů. Vzhledem k tomu, že tyto domácnosti tvoří celou jednu třetinu všech domácností v České epublice, mohla by zapříčiňovat dvouvcholovost empiického ozdělení i zde. Gaf 6. Jádový odhad ozdělení příjmů všech domácností a jeho logaitmicko-nomální model (jednočlenné domácnosti) Gaf 7. Jádový odhad ozdělení příjmů všech domácností a jeho logaitmicko-nomální model (vícečlenné domácnosti)
Poto zde byla k ozkladu použita stejná hypotéza jako v předchozím případě a celý soubo byl ozložen na jednočlenné a vícečlenné domácnosti. Z gafů obou vzniklých složek (viz gafy 6 a 7) je vidět, že i v tomto případě byly získány složky s unimodálním ozdělením četností. Dvouvcholové ozdělení četností příjmů všech domácností, bez ohledu na sociální skupinu, lze tedy považovat za směs ozdělení příjmů jednočlenných a vícečlenných domácností. K jednotlivým složkám byly opět zkonstuovány příslušné logaitmicko-nomální modely, kteé jsou po ilustaci zobazeny společně do gafu 8. Z tohoto gafu je vidět, že ozdělení vícečlenných domácností má ovněž směsový chaakte, neboť ozdělení duhé složky je výazně zploštělé, takže bude tvořeno směsí dalších jednoduchých posunutých křivek, kteé mohou mít záoveň i ůzné ozptyly. Gaf 8. Překývání logaitmicko-nomálních modelů složek směsi ozdělení příjmů všech domácností (příjmy na domácnost) Logaitmicko-nomální modely složek směsi (všechny domácnosti) osa x. příjmy na domácnost (všichni) jednočlenné domácnosti osa y. hustota třípaametických logaitmicko-nomálních modelů vícečlenné domácnosti 5. Závě Rozhodování o metodě, kteá bude použita ke třídění směsových souboů příjmů domácností po oce 1990, bylo založeno na logickém pincipu. Volba vycházela ze znalosti typů metod a jejich použitelnosti v dané situaci. Na základě získaných infomací byly použity oba dopoučované postupy logický i datově oientovaný. Důvodem použití méně vhodné datově oientované metody byl malý počet doplňkových infomací, kteé byly obsaženy v analyzovaném soubou příjmů domácností z. 1996. Tento datový soubo obsahoval komě infomací o příjmech a sociální příslušnosti pouze jednu další (doplňkovou) infomaci počet členů domácnosti. Poto byl k ozkladu použit nejpve datově oientovaný postup, založený na pincipu maximální věohodnosti. Potože tento způsob ozkladu, jak známo, vychází pouze z empiického ozdělení četností příjmů, byl poveden také ozklad logický, kteý vycházel ze znalosti doplňkové infomace. K logickému ozkladu byla použita hypotéza: Dvouvcholová ozdělení četností jsou směsí dvou jednovcholových složek ozdělení příjmů jednočlenných a vícečlenných domácností. Výsledek empiického ověřování zvolené metody logického ozkladu potvdil v obou uvedených případech (tj. v případě domácností důchodců bez ekonomicky aktivních
členů a všech domácností) platnost použité hypotézy. Obě dvouvcholová ozdělení četností se ozdělila na dvě jednovcholové složky, kde pvní složka byla tvořena ozdělením příjmů jednočlenných domácností a duhá ozdělením příjmů vícečlenných domácností. Výsledky logického ozkladu záoveň ukazují, že v případě příjmů všech domácností, bez ohledu na sociální skupinu, odpovídá chaakte ozdělení četností duhé složky opět směsi několika jednovcholových složek. Obě zvolené metody ozkladu směsových souboů příjmů domácností tedy vedly k vytčenému cíli získání dvou složek s jednovcholovým ozdělením četností. Výsledkům logického ozkladu je však dána přednost před datově oientovaným. Komě uvedeného způsobu pavděpodobnostního modelování ozdělení příjmů mohou být použity také techniky, kteé vycházejí ze setříděných datových souboů tzv. kvantilové modelování (viz např. páce [7], [8], [9]). Oby přístupy mají své výhody a nevýhody. Hlavní výhodou modelování, založeného na distibuční funkci či hustotě, kteé bylo použito zde, je možnost využití nezávislosti náhodných veličin při odhadech paametů vybaného pavděpodobnostního modelu. 6. Liteatua: [1] BARTOŠOVÁ, J.: Volba a aplikace metod analýzy stavu ozdělení příjmů v České epublice po oce 1990. Doktoská dizetační páce. Fakulta infomatiky a statistiky VŠE v Paze, Paha, 006. [] BARTOŠOVÁ, J.: Logaithmic-nomal model of income distibution in the Czech Republic, Austian Jounal of Statistics, Special Issue devoted to the Wokshop Pespectives in Moden Statistical Infeence III, Mikulov, July 17-, 005, Wien, 006 (přijato). [3] BARTOŠOVÁ, J.: Income Distibution in the Czech Republic afte Velvet Revolution. In (eds.) 5 th Intenational Confeence APLIMAT 006, STU, Batislava, 006, s. 417-43, ISBN 80-96964--X. [4] BARTOŠOVÁ, J.: Statistic Model of Households Annual Income Distibution in the Czech Republic. In Antoch, J. (ed.) COMPSTAT 004, 16 th Symposium of IASC, Paque, August 3-17, 004, Books of Postes and Abstacts, [CD-ROM], Czech Statistical Society, fo IASC, Paha, 004, s. 1-8, ISBN 80-39-3459-8. [5] BARTOŠOVÁ, J.: Příspěvek k analýze ozdělení příjmů domácností v ČR, In Antoch, J., Dohnal, G. (eds.) Robust 004, Sboník pací 13. letní školy JČMF ROBUST 004 uspořádané Jednotou českých matematiků a fyziků za podpoy KPMS MFF UK a České statistické společnosti ve dnech 7.-11. čevna v Třešti, JČMF, Paha, 004, s. 451-458, ISBN 80-7015-97-3. [6] BARTOŠOVÁ, J.: Statistický model příjmových ozdělení, Acta Univesitatis Bohemiae Meidionales, vědecký časopis po ekonomiku, řízení a obchod, 7(), JU, České Budějovice, 004, s. 39-46, ISSN 11-385. [7] BARTOŠOVÁ, J.: Contamination Level Estimate of Household Income Distibution by Distant Obsevations in the Czech Republic, Foum Meticum Slovacum, 8, SŠDS, Batislava, 004, s. 74-78, ISBN 80-88946-3-9. [8] PACÁKOVÁ, V., SIPKOVÁ, L., SODOMOVÁ, E.: Štatistické modelovanie píjmov domácností v Slovenskej epublike. Ekonomický časopis 53, 005, s. 47-439, ISSN. [9] SIPKOVÁ, L.: Štatistická analýza ozdělení píjmov domácností v Slovenskej epublike. Doktoká disetačná páca. Fakulta hospodáskej infomatiky, Ekonomická univezita v Batislave, 004.