Analýza obalu dat úvod

Analýza obalu dat úvod Jana Klicnarová Katedra aplikované matematiky a informatiky Jihočeská Univerzita v Českých Budějovicích, Ekonomická fakulta 2010

Analýza obalu dat (DEA) Analýza obalu dat (Data envelopement analysis) se používá pro hodnocení technické efektivity produkčních jednotek, které (obecně) mají několik vstupů a několik výstupů. Hodnocenými jednotkami mohou být pobočky potravinářských řetězců, pobočky bank, nemocnice, školy, úřady atd. Jsou jednotky opravdu porovnatelné?

DEA a lineární programování literatura Modely DEA analýzy vedou na úlohy lineárního programování. Problematika lineárního programování není náplní těchto lekcí a více o této problematice lze nastudovat z jakékoliv publikace zabývající se operačním výzkumem: Jablonský, J.: Operační výzkum (skripta VŠE nebo kniha (Professional Publishing)), Friebelová, J.: Kapitoly z operační analýzy (skripta EF JU), a mnoho jiných.

DEA a lineární programování software Řešení úloh lineárního programování je implementováno v mnoha softwarech, připomeňme: doplněk MS Excelu Řešitel (Solver) (součást standartní instalace MS Excel), výukový program POM-QM for Windows, řeší pouze jednoduché příklady, ale ilustrativně (modul pro LP je ve free verzi http://weisssoftware.com/), profesionální software pro řešení úloh LP Lindo i free verze řeší relativně velké úlohy (možnost využití free verze, jednoduchá syntaxe www.lindo.com).

DEA základní pojmy Efektivita jednotek Základním pojem v analýze obalu dat je míra technické efektivity jednotky, což vlastně není nic jiného než poměr váženého součtu výstupů a váženého součtu vstupů. Efektivitou rozumíme zlomek e = y x, (1) kde x jsou vstupy (v případě více vstupů je to vážený součet vstupů) a y výstupy (resp. vážený součet výstupů).

DEA základní pojmy efektivita Poznámka Všimněme si, že zlomek dává velmi dobrý smysl. Naším cílem je maximalizovat efektivitu a protože efektivita je poměrem výstupu ku vstupu, potom jejích maximálních hodnot dosáhneme maximalizací výstupů a minimalizací vstupů.

DEA princip Efektivní hranice Rozhodovací jednotky s největší hodnotou efektivity jsou tzv. efektivní a určují efektivní hranici. Efektivní hranice vymezuje tzv. množinu produkčních možností. Množina produkčních možností Efektivní jednotky leží na efektivní hranici, neefektivní uvnitř množiny produkčních možností.

DEA princip Pro DEA analýzu potřebujeme znát jednotlivé vstupy a výstupy všech analyzovaných jednotek. A na základě těchto znalostí nám tato analýza poskytne informaci, které jednotky jsou efektivní a které neefektivní. Za efektivní se považuje taková jednotka, pro kterou existují takové váhy vstupů a váhy výstupů, pro něž je míra technické efektivity zkoumané jednotky větší nebo rovna míře technické efektivity (při těchto vahách) všech ostatních jednotek.

DEA post optimalizační analýza Z výsledků DEA analýzy lze navíc vyčíst, jakým způsobem je možné z neefektivní jednotky udělat jednotku efektivní. Tedy, jakým způsobem má neefektivní jednotka upravit (snížit) své vstupy nebo naopak jakým způsobem má tato jednotka upravit (zvýšit) své výstupy, aby se stala efektivní. (Aby vyrovnala svou míru technické efektivity s nějakou jinou, v tomto případě pro ni vzorovou (peer) jednotkou.)

DEA příklad Pro lepší ilustraci problematiky, kterou se DEA zabývá, uveďme zadání typického příkladu na DEA. Řešení zatím neuvádíme. Příklad Obchodní řetězec má patnáct poboček, přičemž každá z těchto poboček je charakterizována počtem zaměstnanců, režijními náklady, celkovými náklady, prodejní plochou, počtem obsloužených zákazníků a denními tržbami. Které z patnácti poboček jsou a které nejsou efektivní? Které vstupy a do jaké míry je nutné u neefektivních jednotek redukovat, popřípadě které výstupy navyšovat?

DEA jeden vstup a jeden výstup Poznámka Pokud si představíme nejjednodušší příklad, jednotky, které hodnotíme jen podle jednoho vstupu a jednoho výstupu, potom je zřejmé, že žádné váhy nemá smysl uvažovat, neboť pokud přenásobíme všechny vstupy stejnou vahou a všechny výstupy obecně jinou, ale též stejnou vahou, potom výsledný poměr vážený výstup ku váženému vstupu je pouze násobkem poměru zadaných vah a poměru výstupu ku vstupu bez vah. A tedy na výsledné efektivitě se nic změnit nemohlo.

DEA volba vstupních proměnných Počet hodnocených jednotek Má-li mít DEA analýza smysl, je zapotřebí mít dostatečný počet hodnocených jednotek (vůči počtu vstupů a výstupů dle nichž se hodnotí). Pokud bychom měli málo jednotek, potom bychom mohli všechny jednotky považovat za efektivní. Korelace jednotlivých vstupů a výstupů Také je zapotřebí vhodně zvolit kritéria, podle nichž budeme jednotky hodnotit. Obecně platí, že bychom měli použít, pouze kritéria, která jsou skutečně zásadní a jejichž hodnoty známe u všech uvažovaných jednotek. Zároveň bychom se měli vyhnout výběru příliš korelovaných kritérií. (Představme si, že si vybereme dvě kritéria, jejichž korelace je 1. Potom ve skutečnosti máme v hodnocení jedno kritérium dvakrát.)

Původ metody DEA Farrell Modely DEA analýzy vycházejí z Farrellova modelu (Farrell, 1957. The measurement of productive efficiency. Journal of the Royal Statistical Society Series A 120 (3), 253290.) Charnes, Cooper a Rhodes Tento model později rozšířili Charnes, Cooper a Rhodes (Charnes, Cooper a Rhodes, 1978. Measuring the efficiency of decision making units.) CCR model a Banker, Charnes a Cooper BCC model (R. D. Banker, A. Charnes, W. W. Cooper, 1984. Some Models for Estimating Technical and Scale Inefficiencies in Data Envelopment Analysis. MANAGEMENT SCIENCE Vol. 30, No. 9, September 1984, pp. 1078-1092.).

Podstata analýzy obalu dat DEA modely jsou založeny na představě, že pro dané jednotky existuje množina produkčních možností, ve které jsou všechny přípustné kombinace vstupů a výstupů jednotlivých jednotek. Množina produkčních možností je ohraničena efektivní hranicí. Pokud kombinace vstupů a výstupů hodnocené jednotky leží na efektivní hranici, potom říkáme, že se jedná o efektivní jednotku. Jednotka je efektivní, pokud spotřebovává malé množství vstupů a produkuje velké množství výstupů. V případě, že jednotka efektivní není (neleží na hranici produkčních možností), DEA analýza nám dává návod, jak upravit velikost jejích vstupů, popřípadě výstupů, aby se tato jednotka stala efektivní.

Hodnocení jednotek s jedním vstupem a jedním výstupem V případě, že uvažujeme pouze jeden vstup a jeden výstup, efektivita jednotek, která je dána vztahem (1), je pouze poměrem mezi velikostí výstupů a vstupů. Tedy efektivita nám udává, velikost výstupu na jednotku vstupu. Je zřejmé, že za efektivní se bude považovat ta jednotka, jejíž výstup na jednotkový vstup bude maximální (uvažujeme konstantní výnosy z rozsahu).

Hodnocení jednotek s jedním vstupem a jedním výstupem Příklad Obchodní řetězec má osm poboček, přičemž každá z těchto poboček je charakterizována počtem zaměstnanců a denními tržbami v 10 tis. Kč, viz tabulka. A B C D E F G H Zam. (x) 2 2 3 4 5 5 6 8 Tržby (y) 1 4 2 3 4 2 3 5 y/x 0.5 2 0.67 0.75 0.8 0.4 0.5 0.63 Podíl y/x udává denní tržby (v 10 tis. Kč) pobočky na jednoho zaměstnance. Čím je podíl y/x větší, tím je pobočka efektivnější (větší objem tržeb na zaměstnance).

Hodnocení jednotek s jedním vstupem a jedním výstupem Příklad závěr Jak je vidět, pobočky obchodního řetězce mají produkční možnosti dosáhnout podílu y/x ve výši 2. Efektivní je tedy pobočka B, která jako jediná tohoto poměru dosahuje. Ostatní pobočky jsou neefektivní, v tomto jednoduchém příkladu, chceme-li zjistit, z kolika procent jsou jednotlivé pobočky efektivní, stačí podělit dosaženou efektivitu zkoumané jednotky maximální dosaženou efektivitou.

Hodnocení jednotek s jedním vstupem a jedním výstupem Příklad závěr postoptimalizační analýza Spočítejme tedy, z kolika procent je efektivní jednotka A. Jednotka A dosahuje efektivity 0, 5 a efektivní jednotka B efektivity 2. A tedy míra efektivity jednotky A je 0, 5/2 = 0, 25. Dospěli jsme tedy k závěru, že jednotka A je efektivní pouze z 25%. V tomto případě jsme tedy zjistili, že jednotka A by musela snížit své vstupy na 25% původních vstupů, aby se stala efektivní. A nebo naopak navýšit své výstupy čtyřikrát oproti původním výstupům. (V tuto chvíli jsou výstupy jednotky A pouze 25% možných (z hlediska produkčních možností) výstupů této jednotky.)

Normalizace efektivity Pro porovnávání efektivnosti jednotlivých jednotek se ukazuje jako praktické, aby maximální dosažitelná efektivita byla 1. Úprava maximální efektivity na hodnotu 1 Toho se docílí znormováním efektivit získaných podle vzorce (1). Stačí každou efektivitu získanou dle tohoto vzorce podělit maximální dosaženou efektivitou, tedy e i = e i max j {1,...,n} e j, (2) kde e i je znormovaná efektivita i. jednotky, e j je efektivita j. jednotky vypočtená podle vzorce (1) a n je počet hodnocených jednotek.

Maximální efektivita rovna jedné Používáme-li pro analýzu znormovanou efektivitu, docílíme toho, že efektivní jednotka (resp. jednotky) bude mít míru efektivity 1 a neefektivní jednotky budou mít míru efektivity ostře menší než 1. Tato míra neefektivity bude v podstatě udávat, z kolika procent je jednotka efektivní. Tato míra bude také udávat na kolik procent (ze současných) by musela jednotka snížit své vstupy, aby se stala efektivní. Pokud by jednotka nechtěla (či nemohla) upravovat jednotky vstupů, potom by jí toto číslo udávalo, kolika procent výstupů v této době dosahuje a k tomu, aby se stala efektivní by musela tato jednotka dosáhnout 100% svého výstupu.

Ilustrace normované efektivity na příkladu Příklad Uvažujme předchozí příklad, a spočtěme normovanou efektivitu podle vzorce (2) (maximální dosažená efektivita je 2, tedy každou efektivitu vydělíme 2): A B C D E F G H Zam. (x) 2 2 3 4 5 5 6 8 Tržby (y) 1 4 2 3 4 2 3 5 y/x 0.5 2 0.67 0.75 0.8 0.4 0.5 0.63 e 0.25 1 0.33 0.375 0.4 0.2 0.25 0.315

Ilustrace normované efektivity na příkladu postoptimalizační analýza Závěr příkladu Podle hodnot normované efektivity zjistíme, že efektivní je jednotka B. Za touto jednotkou všechny ostatní velmi zaostávají. Nejlepší z ostatních jednotek je jednotka E, která je efektivní na 40%. Tedy, pokud by se tato jednotka chtěla stát efektivní, buď by musela snížit své vstupy na 40% současné hodnoty, tj. dosahovat těchto tržeb při 0, 4 5 = 2 zaměstnanci nebo by při stávajícím počtu zaměstnanců musela dosáhnout tržeb 4 : 0, 4 = 10.