Odhady polohy mzdového rozdělení pomocí vybraných robustních odhadových funkcí



Podobné dokumenty
Uni- and multi-dimensional parametric tests for comparison of sample results

Karta předmětu prezenční studium

TEPELNÁ ZÁTĚŽ, TEPLOTNÍ REKORDY A SDĚLOVACÍ PROSTŘEDKY

ACTA UNIVERSITATIS AGRICULTURAE ET SILVICULTURAE MENDELIANAE BRUNENSIS SBORNÍK MENDELOVY ZEMĚDĚLSKÉ A LESNICKÉ UNIVERZITY V BRNĚ

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

ANALÝZA STRUKTURY A DIFERENCIACE MEZD ZAMĚSTNANCŮ EMPLOEE STRUCTURE ANALYSIS AND WAGE DIFFERENTIATION ANALYSIS

Zápočtová práce STATISTIKA I

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

Klasifikační metody pro genetická data: regularizace a robustnost

HODNOCENÍ INOVAČNÍCH VÝSTUPŮ NA REGIONÁLNÍ ÚROVNI

Návrh a implementace algoritmů pro adaptivní řízení průmyslových robotů

Vybrané mzdové charakteristiky v krajích ČR členěné podle věku a pohlaví v roce 2008

METODIKA ANALÝZY ODMĚŇOVÁNÍ ZAMĚSTNANCŮ ZPRACOVATELSKÉHO PODNIKU METHODOLOGY OF EMPLOYEE REWARDING ANALYSIS IN A PRODUCER ENTERPRISE

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

Semestrální projekt. do předmětu Statistika. Vypracoval: Adam Mlejnek Oponenti: Patrik Novotný Jakub Nováček Click here to buy 2

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Přednáška 5. Výběrová šetření, Exploratorní analýza

EFFECT OF MALTING BARLEY STEEPING TECHNOLOGY ON WATER CONTENT

Stabilita v procesním průmyslu

ÚKOL ,77 5,00 5 2,531,003,056 -,869,113

Metodologie pro Informační studia a knihovnictví 2

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

4. MZDY Úplné náklady práce Výkaznictví ČSÚ Strukturální mzdová statistika

Vliv barometrického tlaku na úroveň hladiny vody v pozorovacích vrtech

Klasická a robustní ortogonální regrese mezi složkami kompozice

V praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více

Hledání závislostí technologických a nákladových charakteristik při tavení oceli na elektrických obloukových pecích

Metodologie pro Informační studia a knihovnictví 2

Testy nezávislosti kardinálních veličin

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

FJFJ Cvičení 1. Lukáš Frýd

Evropské výběrové šetření o zdravotním stavu v ČR - EHIS CR Index tělesné hmotnosti, fyzická aktivita, spotřeba ovoce a zeleniny

Zefektivnění zadávání znaků na mobilním telefonu bez T9

Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze

Metodologie pro ISK II

Radiova meteoricka detekc nı stanice RMDS01A

STATISTICKÉ CHARAKTERISTIKY

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

KOMBINATORIKA, PRAVDĚPODOBNOST, STATISTIKA. Charakteristiky variability. Mgr. Jakub Němec. VY_32_INOVACE_M4r0120

Organizační pokyny k přednášce. Matematická statistika. Přehled témat. Co je statistika?

Klepnutím lze upravit styl předlohy. nadpisů. nadpisů.

Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných)

III. Sociální stratifikace rodin respondentů ve věku let a jejich dětí do 15 let

Vyhodnocení cenového vývoje drahých kovů na světových burzách v období let

Charakteristika datového souboru

MATEMATIKA III V PŘÍKLADECH

MODELOVÁNÍ CENOVÉ ELASTICITY POPTÁVKY PO VJEZDU NA AUTOBUSOVÉ NÁDRAŽÍ MODELLING OF PRICE DEMAND ELASTICITY FOR ENTRY TO BUS TERMINAL

Právní formy podnikání v ČR

2D A 3D SNÍMACÍ SYSTÉMY PRŮMĚRU A DÉLKY KULATINY ROZDÍLY VE VLASTNOSTECH A VÝSLEDCÍCH MĚŘENÍ

Vliv přímořské léčby na atopický ekzém

SYSTÉM TECHNICKO-EKONOMICKÉ ANALÝZY VÝROBY TEKUTÉHO KOVU - CESTA KE SNIŽOVÁNÍ NÁKLADŮ

5EN306 Aplikované kvantitativní metody I

Regresní a korelační analýza

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

Matematická statistika

ANALÝZA VYUŢÍVÁNÍ SLUŢEB PRACOVNÍ REHABILITACE U OSOB S DUŠEVNÍM ONEMOCNĚNÍM

Porovnání předpovídané zátěže se zátěží skutečnou (podle modelu III-C BMP ČHMÚ) Martin Novák 1,2

Metody zpracování fyzikálních měření

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

Evropské výběrové šetření o zdravotním stavu v ČR - EHIS CR Náklady na zdravotní péči

Foster Bohemia s.r.o. Laboratoř měření imisí Immission Measurement Laboratory. Mezi Rolemi 54/10, Praha 5, Jinonice, Česká republika

4 TABULKY ZÁKLADNÍCH STATISTICKÝCH CHARAKTE- RISTIK TÌLESNÝCH ROZMÌRÙ TABLES OF BASIC STATISTICAL CHARACTERISTICS OF BODY PARAMETERS

Analýza dat na PC I.

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

Eva Fišerová a Karel Hron. Katedra matematické analýzy a aplikací matematiky Přírodovědecká fakulta Univerzity Palackého v Olomouci.

Gymnázium, Brno. Matice. Závěrečná maturitní práce. Jakub Juránek 4.A Školní rok 2010/11

Analýza výsledků testu čtenářské gramotnosti v PRO /11

MSI LS 2006/2007 Ing. Pavla Hošková, Ph.D., 2. test

TECHNICKÁ NORMALIZACE V OBLASTI PROSTOROVÝCH INFORMACÍ

The target was to verify hypothesis that different types of seeding machines, tires and tire pressure affect density and reduced bulk density.

Monitorování vývoje meteo situace nad ČR pomocí GPS meteorologie

ZNALOSTI A DOVEDNOSTI ČESKÝCH ŽEN V OBLASTI INFORMAČNÍ BEZPEČNOSTI - VÝSLEDKY STATISTICKÉ ANALÝZY

PRŮCHOD POVODNĚ V ČERVNU 2013 VLTAVSKOU KASKÁDOU

Využití a zneužití statistických metod v medicíně

ACOUSTIC EMISSION SIGNAL USED FOR EVALUATION OF FAILURES FROM SCRATCH INDENTATION

Foster Bohemia s.r.o. Laboratoř měření imisí Immission Measurement Laboratory. Mezi Rolemi 54/10, Praha 5, Jinonice, Česká republika

Statistika. Program R. popisná (deskriptivní) statistika popis konkrétních dat. induktivní (konfirmatorní) statistika. popisná statistika

VŠB Technická univerzita Ostrava

Gymnázium, Brno, Slovanské nám. 7 WORKBOOK. Mathematics. Teacher: Student:

Obsah. Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku

Foster Bohemia s.r.o. Laboratoř měření imisí Immission Measurement Laboratory. Mezi Rolemi 54/10, Praha 5, Jinonice, Česká republika

ÚJMA NA ŽIVOTNÍM PROSTŘEDÍ POŠKOZENÍM LESA

ENVItech Bohemia s.r.o. Vyhodnocení kvality ovzduší v Otrokovicích v roce 2015

Robust ledna 5. února 2010, Králíky

Analýza vývoje příjmů a výdajů domácností ČR v roce 2015 a predikce na další období. (textová část)

internetový recenzovaný časopis 2010 Vol. 2 No. 3 ISSN Internetový recenzovaný časopis vydává Univerzita Karlova v Praze,

ZVÝŠENÍ KONKURENCESCHOPNOSTI SPALOVACÍHO MOTORU NA STLAČENÝ ZEMNÍ PLYN COMPETITIVENESS INCREASE OF THE CNG ENGINE

Číselné charakteristiky

Metodika. Zájmová území

Fixed management model s mûfienou heterogenitou

Pro bodový odhad při základním krigování by soustava rovnic v maticovém tvaru vypadala následovně:

Just write down your most recent and important education. Remember that sometimes less is more some people may be considered overqualified.

ČESKÁ TECHNICKÁ NORMA

The Over-Head Cam (OHC) Valve Train Computer Model

Analýza a vyhodnocení. zdravotního stavu. obyvatel. města TŘEBÍČ. Zdravá Vysočina, o.s. ve spolupráci se Státním zdravotním ústavem

Prof. Ing. Miloš Konečný, DrSc. Nedostatky ve výzkumu a vývoji. Klíčové problémy. Tyto nedostatky vznikají v následujících podmínkách:

N_MF_B Mezinárodní finance_a Devizový kurs. zákon jedné ceny parita kupní síly, parita úrokové míry, Fisherovy vztahy.

Transkript:

Odhady polohy mzdového rozdělení pomocí vybraných robustních odhadových funkcí 1. Úvod Odhady polohy rozdělení náhodné proměnné patří k základním statistickým otázkám. Aritmetický v mnoha případech není zcela vhodnou volbou k odhadu polohy, protože není příliš odolný vůči působení odlehlých pozorování náhodné proměnné. Pro správné řešení tohoto problému za podmínek nesplnění předpokladu normality rozdělení náhodné proměnné je výhodné použití tzv. robustních estimátorů polohy. Mzdy a jejich rozdělení představují důležitý ekonomický fenomén, který se bezprostředně dotýká veškerého ekonomicky aktivního obyvatelstva. Proto je správné stanovení polohy mzdového rozdělení velmi důležitý statistický a zároveň i citlivý společenský problém. Obecná úroveň mzdy je častým argumentem různých ekonomických komentářů, které vysvětlují příjmy domácností resp. zaměstnanecké populace. Na nou mzdu se často obracíme v diskusích o příjmech a životní úrovni obyvatelstva. Srovnáváme také její velikost mezi jednotlivými státy. Od obecné mzdové hladiny odvozujeme rovněž né náklady práce a další důležité ekonomické veličiny, jako je např. životní minimum, minimální mzda apod. Jaké jsou zdroje informací o mzdách zaměstnanců? Ke zkoumání mzdové úrovně jsou k dispozici údaje pocházející z Českého statistického úřadu jde o tzv. statistické výkaznictví a šetření diferenciace mezd zaměstnanců a z Informačního systému o ném výdělku (dále ISPV) jako rezortního zjišťování pod gescí MPSV. Uvedeným zdrojům také odpovídá různé pojetí obecné mzdové úrovně. Zatímco ve statistickém výkaznictví se jako obecná úroveň mzdy považuje mzda počítaná jako aritmetický, v šetření diferenciace mezd zaměstnanců a v rezortním zjišťování MPSV, (tj. ISPV) je uznávána jako reprezentativní úroveň mzda mediánová, tedy mzda prostřední. V článku je provedeno posouzení vybraných odhadových funkcí, které se používají k odhadu polohy rozdělení. Jedná se o funkce odhadu více či méně odolné (robustní) vůči extrémním, resp. odlehlým hodnotám. Hlavním kriteriem pro výběr funkcí odhadu byla jejich praktická použitelnost a rozumná interpretovatelnost. Do příspěvku byl tedy vybrán výběrový medián jako nejrobustnější funkce odhadu mzdového rozdělení, aritmetický jako funkce nejméně odolná vůči odlehlým hodnotám a různé varianty funkcí odhadu mezi uvedenými extrémními případy. Pro posuzované funkce odhadu však obecně platí, že se jedná o lineární formy s koeficienty představujícími systém vah. Při odhadování polohy rozdělení mezd se jako váhové systémy nejčastěji uplatňují pouze takové systémy, které potlačují význam krajních hodnot mezd (zejména nejvyšších). Proto systémy vah, které jsou rozebírány v tomto příspěvku, buď zcela nebo částečně omezují vliv krajních pozorování a relativně zvyšují význam skupiny střední příjmové skupiny. Uvedený teoretický rozbor je náplní kapitoly 2. V kapitole 3 jsou zaznamenány výsledky experimentálních odhadů polohy reálného mzdového rozdělení za použití výše uvedených odhadových funkcí. Jedná se o rozdělení nesymetrické, kde skupina mezd vysokopříjmových zaměstnanců způsobuje vysokou variabilitu výsledné né mzdy. Pro účely tohoto příspěvky byly použity údaje o mzdách z Informačního systému o ném výdělku. 1

2. Vybrané funkce odhadu polohy rozdělení mezd 2.1. Problém robustnosti odhadu polohy rozdělení Problém citlivosti odhadové funkce na přítomnost odlehlých, resp. extrémních hodnot, tj. datových bodů, které se odchylují od rozložení hlavní části datové množiny [1], vedl k zavedení robustních měr polohy. Robustnost funkce odhadu je měřena jako hodnota bodu zvratu odhadu. Bod zvratu odhadu [2] informuje o tom, jak velký podíl pozorování v souboru lze libovolně zaměnit, aniž by došlo k úplnému selhání odhadu. Například aritmetický má hodnotu bodu zvratu asymptoticky rovnou 0 %, zatímco medián jako odhad polohy je velmi robustní s hodnotou bodu zvratu odpovídající 50 % [1]. 2.2. Robustní míry odhadu polohy Podle [1] se odhady parametrů polohy rozdělení obecně dělí do několika rozdílných tříd odhadů, a to na třídu maximálně věrohodných odhadů, tzv. M-odhady, na třídu R-odhadů, které jsou založeny na odhadech z pořadových testů, a na třídu L-odhadů, které představují lineární funkce pořádkových statistik. V oblasti mzdových rozdělení jsou nejpoužívanějšími odhadovými funkcemi jsou lineární kombinace pořádkových statistik, tedy třída L-odhadů. Podle [2] se L-odhady parametru rozdělení se nazývá libovolná statistika ve tvaru n (), (1) ˆL = w X n i i i=1 kde X (1) X (2) X (n) jsou pořádkové statistiky odpovídající náhodnému výběru X 1,, X n a w i, i = 1, 2,, n; je funkce vah, pro kterou platí: n wi = 1. (2) i=1 Hodnoty váhové funkce jsou téměř vždy nezáporné a volí se zpravidla tak, aby se omezil nebo potlačil vliv odlehlých nebo extrémních pozorování na odhadovanou hodnotu. V praxi se pro krajní pořádkové statistiky používají menší hodnoty vah než pro pořádkové statistiky ležící uprostřed uspořádané množiny dat. Mezi hlavní výhody L-odhadů podle [2] patří jednoduchost výpočtu a rozumná interpretovatelnost výsledných odhadů. Vhodnou volbou váhové funkce (2) ve statistice (1) lze konstruovat odhadové funkce, které se vyznačují různou robustností vůči odlehlým pozorováním. K typickým zástupcům odhadové funkce ve tvaru (1) patří zejména aritmetický, medián, useknutý, winsorizovaný a nově navržené míry polohy - useknutý L-[4] a tanh [5]. Systémy vah u vybraných funkcí odhadu polohy jsou znázorněny v Grafu 1. 2.3. Aritmetický Aritmetický je nejrozšířenější statistickou mírou a nejznámější odhadovou funkcí parametru polohy pro mzdová rozdělení. Hodnoty váhové funkce (2) jsou pro všechny vybrané prvky stejné tj. pro všechny w i platí, že 1 w i = = konst. (3) n Dosazením váhové funkce (3) do (1) vzniká odhadová funkce aritmetického u ve tvaru 2

1 ˆL = A n X() i n. (4) i=1 Aritmetický nepatří k robustním funkcím odhadu, neboť i jeden odlehlý bod v datech může způsobit odhad polohy nekonečně malý nebo nekonečně velký. Hodnota bodu zvratu je rovna 0 %. 2.4. Výběrový medián náleží do třídy L-odhadů parametru polohy rozdělení (1). Odhadová funkce výběrového mediánu však není založena na všech pořádkových statistikách výběrového souboru, nýbrž pouze na několika vybraných pořádkových statistikách. Tomu odpovídají hodnoty váhové funkce (2), které jsou nenulové pouze pro vybrané pořádkové statistiky tj. pro které platí, že w = 1, je-li velikost výběrového souboru n liché číslo a (5) n+1 2 w = w = 0.5, je-li velikost výběrového souboru n sudé číslo. (6) n n + 1 2 2 Výběrový medián náleží k velmi robustním funkcím odhadu, neboť ani jedno odlehlé nebo extrémní pozorování nemůže ovlivnit medián jako odhad polohy. Nevýhoda výběrového mediánu jako míry polohy spočívá v jeho přílišné robustnosti, neboť se při odhadu neuvažuje velká část vzorku dat. Hodnota bodu zvratu je rovna 50 %. 2.5. Useknutý Useknutý opět náleží do třídy L-odhadů parametru polohy rozdělení (1) a odpovídá aritmetickému u hodnot datového vzorku, z něhož bylo odstraněno p nejvyšších a p nejnižších pozorování. Příslušná odhadová funkce useknutého u není lineární kombinací všech pořádkových statistikách výběrového souboru, nýbrž pouze n-2p vybraných pořádkových statistik (n je rozsah výběrového souboru a p je počet odstraněných pozorování). Odpovídající hodnoty váhové funkce (2), které jsou (podobně jako u mediánu) nenulové pouze pro vybrané pořádkové statistiky, jsou 1 pro p+1 i n-p w i = n-2 p. (7) 0 jinak Aplikace useknutých ů snižuje vliv extrémních datových hodnot na výsledek odhadování polohy. Na rozdíl od mediánu však tato odhadová funkce do míry polohy zahrnuje podstatnou část napozorovaných dat. Hodnota bodu zvratu je rovna p %. 2.6. Winsorizovaný Winsorizovaný opět náleží do třídy L-odhadů parametru polohy rozdělení (1) a je podobný useknutému u. Na rozdíl od useknutého u, kdy jsou data na obou koncích rozdělení jednoduše uřezána, winsorizovaný tyto uřezaná data nahrazuje k nim nejbližším pozorováním. Odhadová funkce (2) winsorizovaného u odpovídá váhové funkci useknutého u s výjimkou toho, že každé odřezané pozorování je 3

nahrazeno nejbližším neodřezaným. Odpovídající hodnoty váhové funkce, které jsou (stejně jako u useknutého u) nenulové pouze pro vybrané pořádkové statistiky, jsou 0 pro i p nebo i n-( p-1) p+1 w i = i = p + 1 nebo i = n - p. (8) n 1 pro p+2 i n-( p+1) n Použití winsorizovaných ů snižuje ztrátu informace v důsledku zanedbání odlehlých datových hodnot na výsledek odhadu nahrazením odstraněných pozorování. Stejně jako useknutý tato odhadová funkce do míry polohy zahrnuje podstatnou část napozorovaných dat. Stupeň useknutí se volí na základě tvaru rozdělení. Hodnota bodu zvratu je rovna p %. 2.7. Useknutý L- Zobecněním L-momentů [3] byly v [4] navrženy useknuté L-momenty. Useknuté L- momenty mohou být odhadnuty z výběrového souboru jako lineární kombinace pořádkových statistik ve tvaru ( i - 1 ) ( n - i p p ) w i = n ( 2 p+1) 0 jinak pro p+1 i n-p i i! p p! i-p!. (9), kde ( ) = ( ) Stejně jako v případě useknutých ů zanedbáním konců mzdového rozdělení se snižuje vliv extrémních a odlehlých pozorování na výsledný odhad polohy rozdělení. Hlavním rozdílem odlišujícím funkci odhadu useknutého u (7) od funkce odhadu useknutého L- u (9) je skutečnost, že useknutý L- využívá nerovnoměrný systém vah s nejvyššími vahami pro pozorování blízko mediánu. Hodnota bodu zvratu je rovna p %. 2.8. Tanh Nově navrženou[5] mírou pro odhad polohy rozdělení je tanh (tangens hyperbolický). Váhový systém je počítán s využitím funkce tangens hyperbolický následujícím způsobem n n+1 tanh[ k i] - s pro i, resp. i, je-li n sudé, resp. liché w 2 2 i = (10) n n+1 -tanh k ( i - n - 1) - s pro i >, resp. i >, je-li n sudé, resp. liché 2 2 kde k je faktor řídící sklon váhové funkce pro extrémní a odlehlá pozorování a s determinuje vertikální zdvih. Oba parametry váhového systému faktor sklonu k a faktor vertikálního posuvu s jsou zpravidla optimalizovány [5] k dosažení nejlepší možné hodnoty vybraného měřitelného ukazatele u zjišťovaných veličin, např. minimalizace vychýlení odhadovaného parametru nebo minimalizace jeho rozptylu. Po dosazení váhového systému (10) do funkce L-odhadu (1) získáme funkci odhadu polohy rozdělení ve tvaru tanh (tangens hyperbolický). Tanh je počítán s využitím funkce tangens hyperbolický následujícím způsobem 4

n n+1, resp. 2 2 X () ( ) tanh k i - s + i n n+1 i= +1, resp. + 1 i=1 2 2 TH n n+1 n, resp. 2 2 ˆL = ( ) tanh k i - s n n+1 i= +1, resp. + 1 i=1 2 2 n { } X -tanh k i - n - 1 - s () i ( ) {-tanh k ( i - n - 1) - s}. (11) Podobně jako u useknutého L-u se jedná o symetrický váhový systém, kdy je nejvyšších vah dosahováno v oblasti prostředních pozorování. Míru robustnosti lze nastavovat parametry sklonu a vertikálního posunu. Limitní hodnota bodu zvratu je rovna 0 %. 3. Výsledky praktického experimentu odhadování polohy rozdělení mezd 3.1. Popis základního souboru Základní soubor vybraný k provedení praktického odhadování polohy mzdového rozdělení obsahuje reálné hodnoty zaměstnaneckých výdělků. Jedná se o soubor velmi nesymetrický vyznačující se těžkým koncem v oblasti vyšších výdělků. Toto je způsobeno početně nevelkou skupinou vysokopříjmových zaměstnanců, která však má velký vliv na tvar celého rozdělení mezd a jeho základní charakteristiky. Vykazovaný vysoký koeficient špičatosti mzdového rozdělení je důsledkem nesymetrie rozdělení mezd, protože více než 60 % napozorovaných výdělků má hodnotu menší, než je ná hrubá měsíční mzda. Nejdůležitější charakteristiky základního souboru jsou uvedeny v příloze (viz Tabulka 1 - Charakteristiky základního souboru). Empirické rozdělení relativních četností hrubých měsíčních mezd je znázorněno v příloze (viz Graf 2 Empirické rozdělení relativní četnosti měsíčních mezd v základním souboru). 3.2. Experimentální odhadování polohy mzdového rozdělení Pro experimentální odhadování polohy mzdového rozdělení byly vybrány odhadové funkce s váhovými systémy, o kterých bylo pojednáno v kap. 2. Vybrané funkce odhadu polohy rozdělení mezd. V prováděných výběrech byla zjišťovány výběrová rozdělení charakteristik, které se využívají k odhadu polohy rozdělení. Jedná se tedy o aritmetický a y vážené výše uvedenými váhovými systémy, včetně výběrového mediánu. Ke srovnání vlivu velikosti výběru (tzv. malé do 30 hodnot a velké - při 30 a více vybíraných hodnotách), byly velikosti výběrových souborů stanoveny na 10 a 50. Velikost výběrového souboru pro velké výběry tj. 50 vybíraných prvků byla zvolena z ohledem na překonání vlivu velmi nesymetrického základního rozdělení výdělků. Při praktickém odhadování polohy mzdového rozdělení bylo provedeno 5 000 náhodných výběrů. Robustnost vážených ů byla sledována pomocí aplikovaných váhových systémů. Useknutí, resp. winsorizace u useknutých, resp. winsorizovaných odhadových funkcí byla nastavena na podíl 10 % a 25 % relativně vzhledem k celkové velikosti výběrových souborů. Jako estimátor nejodolnější vůči odlehlým, resp. extrémním mzdovým hodnotám se použil výběrový medián. Hlavním zástupcem nerobustních funkcí odhadu polohy s velkou citlivostí na odchylky v datech byl aritmetický s rovnoměrným váhovým systémem. Pro získání názornější představy o váhových systémech aplikovaných u výše uvedených odhadových funkcí je znázorněn jejich průběh v příloze graficky (viz Graf 1 Systémy vah u funkcí odhadu polohy rozdělení). Volba parametrů sklonu a vertikálního posunu u tanh u vychází ze [5], přičemž jejich hodnota se experimentálně zvolila tak, aby se snížil vliv 10 %, resp. 25 % 5

krajních hodnot výběrového souboru. V realizaci tohoto experimentu byl vertikální posun tanh u nastaven na nulu a jeho robustnost byla řízena parametrem sklonu. Výsledkem každého uskutečněného náhodného výběru je tabulka v příloze (viz Tabulka 2. až Tabulka 5), která obsahuje údaje o počtu provedených výběrů, velikosti výběrových souborů a nejdůležitějších výběrových statistikách za odhady polohy mzdového rozdělení. Tyto výběrové charakteristiky jsou vyčísleny samostatně za příslušnou odhadovou funkci. K doplnění informací o výběrovém rozdělení jednotlivých odhadů jsou v příloze připojeny i grafické průběhy výběrových rozdělení sledovaných odhadů (viz Graf 3, 4, 5 a 6). Vliv změny useknutí na výběrové rozdělení odhadovaného je zaznamenán v Grafu 7 pro výběrové soubory o velikosti 50 pozorování. V Grafu 7 je zachyceno průběh výběrového rozdělení odhadu polohy odhadované pomocí winsorizovaného u, kdy míra winsorizace činí 10 % a 25 %. Podobný obsah vyjadřuje Graf 8. Rozdíl spočívá s předchozím grafem spočívá pouze v tom, že jde o odhady z výběrových souborů o velikosti 10 pozorování a odhady polohy mzdového rozdělení jsou založeny na useknutém u. Míra useknutí je stejná jako v případě Grafu 7. 4. Vyhodnocení a závěr Na závěr tohoto příspěvku o odhadech polohy mzdového rozdělení pomocí vybraných robustních odhadových funkcí bude provedeno stručné vyhodnocení. Hodnocení výše popsaných odhadových funkcí bude vycházet z výsledků realizovaného výběrového experimentu. Kriteriem ke vzájemnému porovnání kvality jednotlivých funkcí odhadu je tzv. relativní efektivita. Podle [6] se relativní efektivitou dvou nevychýlených odhadů rozumí poměr jejich rozptylů, tj. var ( θˆ 1) η =, kde θ ˆ 1, θ ˆ 2 (12) var ( θˆ 2 ) jsou nevychýlené odhady. Poměr (12) vychází [6] z Cramerova-Raova pravidla o nejnižší hranici rozptylu. Vztah (12) vyjadřuje velikost rozptylu jednoho odhadu relativně vzhledem k velikosti rozptylu odhadu druhého. Ke správnému posouzení výběrových rozdělení vzniklých použitím vybraných odhadových funkcí dobře poslouží Tabulka 7 Celkové srovnání odhadů polohy a jejich relativní efektivita vzhledem k funkci odhadu aritmetického u (rozptyl aritmetického u je referenční hodnotou, tj. rovná se 100) uvedená v příloze příspěvku. V této tabulce jsou soustředěny veškeré údaje pro jednotlivé systémy odhadu polohy mzdového rozdělení. Jak již vyplývá z názvu dotčené tabulky, rozptyly jednotlivých středních hodnot odhadnutých ů jsou vztaženy k rozptylu střední hodnoty aritmetického u. Jako další pomocné kriterium kvality lze brát do úvahy také variační koeficienty středních hodnot jednotlivých odhadů. Při vzájemném srovnání příslušných odhadových funkcí je třeba mít také na paměti, že se prováděly výběry malé, tj. s výběrovými soubory o 10 pozorováních a výběry velké, kde velikost jednotlivých výběrových souborů dosahovala 50 napozorovaných mzdových hodnot. Ve skupině výběrů s velikostí výběrových souborů 50 prvků na základě kriteria (12) dosáhla nejlepších výsledků funkce odhadu pro tanh. Relativní efektivita tohoto odhadu byla zjištěna na úrovni 57,4 % při uřezání krajních hodnot o 10 % a 52,1 % při uřezání krajních hodnot o 25 %. Podobné výsledky byly zaznamenány u odhadu useknutého u. Relativní efektivita uřezaného u se dostala na hodnotu 52,2 % při uřezání 6

krajních hodnot o 10% a na 54,4 % při uřezání krajních hodnot o 25 %. Naopak nejhorší výsledek v relativní efektivitě odhadu byl dosažen odhadovou funkcí mediánovou, přičemž tato relativní efektivita se pohybovala v rozmezí 65,7 % až 67,9 % vzhledem k variabilitě aritmetického u. Obdobné tendence v hodnocené kvalitě odhadových funkcí se projevily i z hlediska velikosti variačních koeficientů. I na základě tohoto měřítka nejhůře dopadl odhad polohy zjišťovaný mediánovou funkcí odhadu. Nejlépe obstály odhadové funkce useknutého u a tangens hyperbolického u. Hodnotí-li se skupina výběrů malých, tj., kde velikost výběrových souborů činila toliko 10 pozorování, je třeba si uvědomit, že výběrová rozdělení budou do značné míry ovlivněna vlastnostmi základního rozdělení. Ve srovnání s předchozími výběry se u nich limitní vlastnosti projevují méně. V této skupině výběrů s velikostí výběrových souborů 10 prvků na základě kriteria (12) byly nejlepší výsledky zaznamenány u funkce odhadu pro useknutý L-. Relativní efektivita tohoto odhadu byla zjištěna na úrovni 55,6 % při uřezání krajních hodnot o 10% a 59,5 % při uřezání krajních hodnot o 25 %. Podobné výsledky byly vykázány u odhadu useknutého u. Relativní efektivita useknutého u se dostala na hodnotu 58,1 % při uřezání krajních hodnot o 10% a na 58,5 % při uřezání krajních hodnot o 25 %. Naopak nejhorší výsledek v relativní efektivitě odhadu byl dosažen odhadovou funkcí tangens hyperbolického u, přičemž tato relativní efektivita se pohybovala ve výši 71,9 % při 10 % uřezání krajních hodnot a 63,9 % při 25 % uřezání krajních hodnot. Nízkou relativní efektivitu vykázal mediánový odhad, a to až 67,7 % vzhledem k variabilitě aritmetického u. Velikosti variačních koeficientů v hodnocené kvalitě odhadových funkcí zaujaly podobné poměry. I na základě tohoto měřítka nejhůře dopadly odhady polohy zjišťované mediánovou funkcí odhadu a tangens hyperbolického u. Nejlépe obstály odhadové funkce useknutého u a useknutého L-u. V uskutečněných experimentálních výběrech byly zjištěny následující skutečnosti. V případě malých výběrů jsou nejvhodnějšími funkcemi odhadu polohy rozdělení funkce useknutého u a useknutého L-u, a to i v případě mzdového rozdělení s vysokou špičatostí a těžkým koncem. V případě realizace velkých výběrů se jeví nejvhodnějšími odhadovými funkcemi hyperbolický a useknutý. ová funkce odhadu byla vyhodnocena jako relativně nejméně efektivní, což bylo potvrzeno i nejvyššími hodnotami variačních koeficientů odhadů výběrových mediánů. Rozdělení mezd je zcela reálně vykazováno jako nesymetrické, silně špičaté, protože v něm převažují mzdy podné. Šikmost mzdového rozdělení je zvyšována i přítomností malé skupiny výdělků, u kterých jsou zjišťovány extrémní hodnoty (jedná se o mzdy manažerů a špičkových zaměstnanců). Za takových podmínek není určení polohy mzdového rozdělení jednoduchým úkolem. Velmi také záleží na vhodné volbě odhadové funkce. Na základě zjištění, které byly získány při tvorbě tohoto příspěvku se jako nejvhodnější funkcí odhadu polohy jeví tangens hyperbolický a useknuté y u velkých výběrů a useknutý L- u výběrů malých. Odhadování ů neváženým aritmetickým em není vzhledem k vysoké variabilitě a tvaru mzdového rozdělení vhodným řešením. Naopak ani použití mediánu jako nejrobustnější funkce odhadu polohy neposkytuje dobré odhady. Přílišná robustnost mediánu způsobuje příliš velké useknutí mzdových hodnot ve výběru, při současné vysoké variabilitě odhadů. Tyto vlastnosti mediánového u se byly vykázány nejen vysokými hodnotami rozptylu, ale i variačního koeficientu. Pro zvýšení kvality odhadů je možné použít např. useknuté y s nesymetrickým useknutím, odhadové funkce s adaptivní robustností a tak podobně. 7

5. Literatura [1] HAMPEL, F.-R. - RONCHETTI, E. M. - ROUSSEEUW, P. J. - STAHEL, W.: Robastnost v statistike: Podchod na osnove funkcii vlijanija. Moskva, Mir 1989. ISBN 5-03-001003-3 [2] BARTOŠOVÁ, J.: Robustní metody odhadů. In: Vědecký seminář doktorandů FIS, únor 2003. ISBN 80-245-0518-5 [3] HOSKING J. L-moments: Analysis and estimation of distributions using linear combinations of order statistics. Journal of Royal Statistical Society B52, 105-124, 1990. [4] ELAMIR, E. SEHEULT A. - H: Trimmed L-moments. In: Computational Statistics & Data Analysis 43, 299 314, 2003 [5] LEONOVICZ, Z. - KARVANEN, J. - SHISHKIN, S. - L.: Trimmed estimators for robust averaging of event-related potentials. Journal of Neuroscience Methods, Volume 142, Issue 1, pages 17-26, 2005 [6] LEBANON, G.: Relative Effciency, Efficiency, and the Fisher Information. Purdue University. Dept of Statistics, 2006. www.stat.purdue.edu/~lebanon/notes /efficiency.pdf Summary The Wage Distribution Location Estimating with the Assistance of Some Choosen Robust Estimating Functions The article points out some estimates of sample chracteristics. It refers to the fact that the good location estimates may do only with the good estimating fuctions. This article deals with some choosen location estimation function with or without a certain robustness. There are illustrated robust characteristics of several commonly used L-estimates. It describes some types of symmetrical estimators, namely arithmetic mean, median, α-trimmed mean, α- winsored mean, α-trimmed L-mean and tanh mean. This article was written for wage distribution location estimating. Every reviewed estimator was subjugated some theoretical analysis and it was determined a breakdown point for each reviwed robust estimator. Finally it was accomplished a sample experiment, which offered some practical comparing estimator s performances. This random sampling went off with for 5 000 times on samples of the lenght 10 and/or 50. The α-trimming for trimmed means reached the trim level 10 % and/or 25 %. Adjusted results of this random sampling finger on the using a too robustless location estimator (arithmetic mean) or too robustness location estimator (median). An optimal loaction estimator is a fuction with some weight system, which a shape of own curve correspond the wage distribution shape. It may be some trimmed mean with non-sysmmetrical trimming, some estimating function with a sofisticated weighted systém (e. g. with a shape has the normal curve form) a may be some adaptive robust estimator. The estimator s quality was compared with a relative efficiency criterion. The best of the analysed group of estimators as resulting from the practical random sample experiment was won the α-trimmed mean and the tanh mean in the large-sample case and the α-trimmed mean and the α-trimmed L-mean. 8

6. Příloha Základní statistika Hrubá měsíční mzda Počet pozorování 321 277 Průměr 8 311 Rozptyl 17 084 912 Směrodatná odchylka 4 133 Variační koeficient 0,497 Koeficient šikmosti 6,421 Koeficient špičatosti 119,224 Rozpětí 185 479 Minimální hodnota 2 076 1. decil 4 879 1. kvartil 5 963 medián 7 500 3. kvartil 9 691 9. decil 12 314 Maximální hodnota 187 555 Tabulka 1. Charakteristiky základního souboru Počet provedených výběrů 5 000 Velikost výběrového souboru 50 Funkce odhadu polohy Aritmetický Useknutý 10% Winsorizovaný 10% Useknutý L- 10% Tanh 10% Průměr 8 325 7 536 7 834 7 976 7 611 7 982 Rozptyl 343 590 233 240 179 378 191 377 191 945 197 316 Směrodatná odchylka 586 483 424 437 438 444 Variační koeficient 0,070 0,064 0,054 0,055 0,058 0,056 Koeficient šikmosti 0,911 0,292 0,176 0,209 0,191 0,255 Koeficient špičatosti 5,178 3,087 3,032 3,025 2,989 3,112 Rozpětí 5 558 3 503 3 142 3 139 3 097 3 206 Minimální hodnota 6 776 6 069 6 590 6 641 6 327 6 673 1. decil 7 656 6 924 7 290 7 422 7 058 7 428 1. kvartil 7 922 7 197 7 547 7 681 7 304 7 678 medián 8 256 7 517 7 822 7 956 7 601 7 959 3. kvartil 8 643 7 851 8 111 8 257 7 901 8 269 9. decil 9 068 8 161 8 382 8 549 8 179 8 565 Maximální hodnota 12 334 9 572 9 732 9 780 9 424 9 879 Tabulka 2. Odhady polohy (5 000 výběrů, velikost výběrových souborů 50) 9

Počet provedených výběrů 5 000 Velikost výběrového souboru 10 Funkce odhadu polohy Aritmetický Useknutý 10% Winsorizovaný 10% Useknutý L- 10% Tanh 10% Průměr 8 292 7 595 7 882 7 971 7 796 8 084 Rozptyl 1 613 640 1 015 839 936 827 1 026 126 896 805 1 160 032 Směrodatná odchylka 1 270 1 008 968 1 013 947 1 077 Variační koeficient 0,153 0,133 0,123 0,127 0,121 0,133 Koeficient šikmosti 2,013 0,512 0,598 0,893 0,479 1,068 Koeficient špičatosti 18,968 3,430 4,142 6,674 3,446 8,006 Rozpětí 23 256 7 327 9 306 12 958 7 275 15 347 Minimální hodnota 5 133 4 775 5 083 5 095 5 076 5 108 1. decil 6 927 6 385 6 716 6 768 6 656 6 846 1. kvartil 7 463 6 877 7 202 7 268 7 123 7 347 medián 8 130 7 505 7 817 7 891 7 736 7 987 3. kvartil 8 886 8 224 8 474 8 571 8 389 8 693 9. decil 9 786 8 947 9 122 9 240 9 042 9 425 Maximální hodnota 28 389 12 101 14 388 18 052 12 351 20 455 Tabulka 3. Odhady polohy (5 000 výběrů, velikost výběrových souborů 10) Počet provedených výběrů 5 000 Velikost výběrového souboru 50 Funkce odhadu polohy Aritmetický Useknutý 25% Winsorizovaný 25% Useknutý L- 25% Tanh 25% Průměr 8 319 7 530 7 643 7 743 7 552 7 810 Rozptyl 346 235 227 314 188 477 189 983 205 444 180 379 Směrodatná odchylka 588 477 434 436 453 425 Variační koeficient 0,071 0,063 0,057 0,056 0,060 0,054 Koeficient šikmosti 0,897 0,386 0,293 0,250 0,360 0,177 Koeficient špičatosti 5,335 3,335 3,179 3,118 3,289 2,989 Rozpětí 6 487 3 479 3 192 3 405 3 262 2 898 Minimální hodnota 6 429 6 100 6 230 6 201 6 107 6 538 1. decil 7 628 6 954 7 095 7 190 6 997 7 279 1. kvartil 7 921 7 191 7 344 7 440 7 232 7 509 medián 8 255 7 501 7 627 7 732 7 527 7 806 3. kvartil 8 646 7 824 7 918 8 024 7 837 8 085 9. decil 9 053 8 150 8 208 8 304 8 143 8 363 Maximální hodnota 12 916 9 579 9 422 9 606 9 369 9 436 Tabulka 4. Odhady polohy (5 000 výběrů, velikost výběrových souborů 50) 10

Počet provedených výběrů 5 000 Velikost výběrového souboru 10 Funkce odhadu polohy Aritmetický Useknutý 25% Winsorizovaný 25% Useknutý L- 25% Tanh 25% Průměr 8 294 7 618 7 747 7 811 7 702 7 950 Rozptyl 1 597 715 1 080 906 935 195 957 391 950 485 1 021 141 Směrodatná odchylka 1 264 1 040 967 978 975 1 011 Variační koeficient 0,152 0,136 0,125 0,125 0,127 0,127 Koeficient šikmosti 1,729 0,585 0,555 0,562 0,560 0,697 Koeficient špičatosti 11,647 4,022 4,170 4,226 4,115 4,617 Rozpětí 17 697 9 706 9 728 9 848 9 731 9 533 Minimální hodnota 5 282 4 492 5 067 5 184 4 880 5 119 1. decil 6 941 6 370 6 577 6 636 6 530 6 755 1. kvartil 7 487 6 870 7 068 7 126 7 011 7 257 medián 8 122 7 525 7 690 7 746 7 635 7 862 3. kvartil 8 911 8 257 8 336 8 398 8 296 8 539 9. decil 9 758 8 993 9 016 9 093 8 991 9 248 Maximální hodnota 22 979 14 198 14 795 15 032 14 611 14 651 Tabulka 5. Odhady polohy (5 000 výběrů, velikost výběrových souborů 10) Počet provedených výběrů 5 000 Velikost výběrového souboru 50 Funkce odhadu polohy Useknutý 10% Useknutý 25% Winsorizovaný 10% Winsorizovaný 25% Useknutý L- 10% Useknutý L- 25% Průměr 7 882 7 643 7 976 7 743 7 611 7 552 Rozptyl 936 827 188 477 191 377 189 983 191 945 205 444 Směrodatná odchylka 968 434 437 436 438 453 Variační koeficient 0,123 0,057 0,055 0,056 0,058 0,060 Koeficient šikmosti 0,598 0,293 0,209 0,250 0,191 0,360 Koeficient špičatosti 4,142 3,179 3,025 3,118 2,989 3,289 Rozpětí 9 306 3 192 3 139 3 405 3 097 3 262 Minimální hodnota 5 083 6 230 6 641 6 201 6 327 6 107 1. decil 6 716 7 095 7 422 7 190 7 058 6 997 1. kvartil 7 202 7 344 7 681 7 440 7 304 7 232 medián 7 817 7 627 7 956 7 732 7 601 7 527 3. kvartil 8 474 7 918 8 257 8 024 7 901 7 837 9. decil 9 122 8 208 8 549 8 304 8 179 8 143 Maximální hodnota 14 388 9 422 9 780 9 606 9 424 9 369 Tabulka 6. Srovnání odhadů polohy (5 000 výběrů, velikost výběrových souborů 50) 11

Aritmetický Useknutý Winsorizovaný Useknutý L- Tanh Velikost výběrového souboru 10 10 10 10 10 10 Useknutí (winsorizace) v % 0 50 10 10 10 10 Průměr 8 292 7 595 7 882 7 971 7 796 8 084 Rozptyl 1 613 640 1 015 839 936 827 1 026 126 896 805 1 160 032 Variační koeficient 0,153 0,133 0,123 0,127 0,121 0,133 Relativní efektivita odhadu 100,0 63,0 58,1 63,6 55,6 71,9 Velikost výběrového souboru 50 50 50 50 50 50 Useknutí (winsorizace) v % 0 50 10 10 10 10 Průměr 8 325 7 536 7 834 7 976 7 611 7 982 Rozptyl 343 590 233 240 179 378 191 377 191 945 197 316 Variační koeficient 0,070 0,064 0,054 0,055 0,058 0,056 Relativní efektivita odhadu 100,0 67,9 52,2 55,7 55,9 57,4 Velikost výběrového souboru 10 10 10 10 10 10 Useknutí (winsorizace) v % 0 50 25 25 25 25 Průměr 8 294 7 618 7 747 7 811 7 702 7 950 Rozptyl 1 597 715 1 080 906 935 195 957 391 950 485 1 021 141 Variační koeficient 0,152 0,136 0,125 0,125 0,127 0,127 Relativní efektivita odhadu 100,0 67,7 58,5 59,9 59,5 63,9 Velikost výběrového souboru 50 50 50 50 50 50 Useknutí (winsorizace) v % 0 50 25 25 25 25 Průměr 8 319 7 530 7 643 7 743 7 552 7 810 Rozptyl 346 235 227 314 188 477 189 983 205 444 180 379 Variační koeficient 0,071 0,063 0,057 0,056 0,060 0,054 Relativní efektivita odhadu 100,0 65,7 54,4 54,9 59,3 52,1 Tabulka 7. Celkové srovnání odhadů polohy a jejich relativní efektivita vzhledem k funkci odhadu aritmetického u (rozptyl aritmetického u = 100) 12

0,50 Váha Systém vah u funkcí odhadu polohy rozdělení 0,40 0,30 Aritmetický Useknutý Winsorizovaný Useknutý L- Tanh 0,20 0,10 0,00 0 5 10 15 20 25 30 35 40 45 50 Graf 1 Systémy vah u funkcí odhadu polohy rozdělení 0,30 Relativní četnost 0,25 Rozdělení relativní četnosti mezd v základním souboru 0,20 0,15 0,10 0,05 Hrubá měsíční mzda [Kč/měs] 0,00 0 20 000 40 000 60 000 80 000 100 000 120 000 140 000 160 000 180 000 200 000 Graf 2 Empirické rozdělení relativní četnosti měsíčních mezd v základním souboru 13

0,055 0,050 0,045 0,040 0,035 0,030 Relativní četnost Rozdělení relativních četností hrubé měsíční mzdy (5 000 výběrů o velikosti n = 50) Aritmetický Useknutý 25 % Winsorizovaný 25 % Useknutý L- 25 % Tanh 25 % 0,025 0,020 0,015 0,010 0,005 Mzda [Kč/měs] 0,000 5 000 6 000 7 000 8 000 9 000 10 000 11 000 12 000 13 000 14 000 Graf 3 Empirické rozdělení relativní četnosti měsíčních mezd (výběrový soubor 50 vzorků) 0,050 0,045 0,040 0,035 0,030 0,025 Relativní četnost Rozdělení relativních četností hrubé měsíční mzdy (5 000 výběrů o velikosti n = 50) Aritmetický Useknutý 10 % Winsorizovaný 10 % Useknutý L- 10 % Tanh 10 % 0,020 0,015 0,010 0,005 Mzda [Kč/měs] 0,000 5 000 6 000 7 000 8 000 9 000 10 000 11 000 12 000 13 000 Graf 4 Empirické rozdělení relativní četnosti měsíčních mezd (výběrový soubor 50 vzorků) 14

0,10 0,09 0,08 0,07 0,06 0,05 Relativní četnost Rozdělení relativních četností hrubé měsíční mzdy (5 000 výběrů o velikosti n = 10) Aritmetický Useknutý 10 % Winsorizovaný 10 % Useknutý L- 10 % Tanh 0,04 0,03 0,02 0,01 0,00 Mzda [Kč/měs] 0 2 500 5 000 7 500 10 000 12 500 15 000 17 500 20 000 22 500 25 000 27 500 30 000 Graf 5 Empirické rozdělení relativní četnosti měsíčních mezd (výběrový soubor 10 vzorků) 0,08 0,07 0,06 0,05 0,04 Relativní četnost Rozdělení relativních četností hrubé měsíční mzdy (5 000 výběrů o velikosti n = 10) Aritmetický Useknutý 25 % Winsorizovaný 25 % Useknutý L- 25 % Tanh Průměr 25 % 0,03 0,02 0,01 Mzda [Kč/měs] 0,00 0 2 500 5 000 7 500 10 000 12 500 15 000 17 500 20 000 22 500 25 000 Graf 6 Empirické rozdělení relativní četnosti měsíčních mezd (výběrový soubor 10 vzorků) 15

0,040 0,035 Relativní četnost Rozdělení relativních četností hrubé měsíční mzdy (odhady polohy winsorizovaným em) 0,030 Winsorizovaný 10 % Winsorizovaný 25 % 0,025 0,020 0,015 0,010 0,005 Mzda [Kč/měs] 0,000 5 000 5 500 6 000 6 500 7 000 7 500 8 000 8 500 9 000 9 500 10 000 10 500 Graf 7 Změny v rozdělení relativní četnosti měsíčních mezd při změně useknutí (50 vzorků) 0,035 0,030 0,025 Relativní četnost Rozdělení relativních četností hrubé měsíční mzdy (odhady polohy useknutým em) Useknutý 10 % Useknutý 25 % 0,020 0,015 0,010 0,005 Mzda [Kč/měs] 0,000 5 000 5 500 6 000 6 500 7 000 7 500 8 000 8 500 9 000 9 500 10 000 10 500 Graf 8 Změny v rozdělení relativní četnosti měsíčních mezd při změně useknutí (10 vzorků) 16