Ekonomtrcká analýza panlových dat s aplkací na vybavnost domácností Ekonomtrcká analýza panlových dat s aplkací na vybavnost domácností # Zuzana Fíglová Úvod Panlová data přdstavují spcfcký typ pozorování, ktrá kombnují průřzová a časově uspořádaná data Znamná to, ž několk subjktů, např domácnost, frmy nbo státy, jsou pozorovány v několka časových obdobích Průřzová složka j označována ndxm =,,, a časová složka j rovna t =,,, Panlová data tak umožňují zvětš datový soubor, snžují kolnaru mz vysvětlujícím proměnným a umožňují tstovat složější konomtrcké modly Ekonomtrcký modl, v ktrém j ndognní proměnná dskrétního charaktru (katgorální nbo kvalatvní vlčnou), nazývám modlm dskrétní volby (Hušk, 003) Často jd o dchotomckou ndognní proměnnou nabývající pouz hodnot nbo 0, ktré odpovídají výsldkům bnární volby, kdy rozhodující s ndvduální subjkt můž vol pouz mz dvěma altrnatvam Uvažujm modl bnární volby panlových dat y = X β + µ + ν =,,,, t =,,,, () kd y přdstavuj ndx užčnost -tého ndvduálního subjktu v čas t př nějaké akc, například př nákupu automoblu, volbě povolání, apod, X K vktor xognních proměnných, µ fkt ndvduálního subjktu, ν náhodná složka s normálním rozdělním áhodná složka ν zachytává vlv vynchaných proměnných v modlu, ktré mohou zodpovídat různým faktorům: faktorům, ktré jsou typcké jnom pro jdnotlvá časová období, faktorům, ktré zachytávají rozdíly mz jdnotlvým subjkty, al nmění s v čas, faktorům, ktré jsou typcké jak pro jdnotlvé subjkty, tak pro různá časová období # Článk byl zpracován jako jdn z výstupů výzkumného projktu Ekonomtrcká analýza mkrokonomckých procsů pomocí modlů panlových dat, aplkac v konomckém prostřdí ČR rgstrovaného u Grantové agntury Čské rpublky pod vdnčním číslm 40/04/0756 Ing Zuzana Fíglová asstntka; Katdra konomtr, Fakulta nformatky a statstky, VŠE v Praz, zuzanafglova@hotmalcom 3
Acta Oconomca Pragnsa, roč 5, č, 007 Hodnota µ přdstavuj ndvduální fkt subjktu, což znamná, ž dvě pozorování určého subjktu v různém období s budou víc podobná nž dvě pozorování o různých subjktch v stjném období Když j tnto ndvduální fkt µ korlován s X jdná s o modl s fxním fkty panlových dat, s ktrým budm dál pracovat V případě nkorlovanost µ s X jd o modl s náhodným fkty panlových dat Brusch a Pagan (Grn, 003) navrhl tst, ktrý slouží k urční, zda datový soubor vyhovuj spíš modlům s fxním č náhodným fkty nto tst j založný na rzduích získaných pomocí mtody njmnších čtvrců stovaná hypotéza o tom, ž mzskupnový rozptyl komponnt j nulový, j v tvaru H H 0 : : σ σ = 0 0 stovací statstka založná na Lagrangově multplkátoru má tvar = t= LM = () ( ) = t= stovací statstka LM má χ rozdělní s jdním stupněm volnost V případě nzamítnutí nulové hypotézy s jdná o modl s fxním fkty, v opačném případě jd o modl s náhodným fkty Pro ndognní proměnnou y platí = y když y > 0 a y = 0 když y 0 (3) U modlu bnární dskrétní volby s fxním fkty tdy platí, ž výběrová pravděpodobnost Y nabývá hodnoty a p j opačná pravděpodobnost, ž Y má hodnotu 0 P( y = ) = p( y > 0) = P( ν > X β µ ) = F( X β + µ ), (4) kd F() j dstrbuční funkc U logového modlu bnární dskrétní volby přdpokládám logstckou dstrbuční funkc a označím j jako Λ, u probového modlu uvažujm normální dstrbuční funkc s označním Φ Logový modl bnární dskrétní volby s fxním fkty má tvar P( y X β + µ + ν = X ) = (5) X β + µ + ν + 4
Ekonomtrcká analýza panlových dat s aplkací na vybavnost domácností Mtody odhadu modlů bnární volby panlových dat Jdnou z mtod odhadu modlu bnární volby s fxním fkty j mtoda npodmíněné maxmální věrohodnost pro logový modl dfnovaná v tvaru L Y Y = Λ( X + µ ) [ Λ( X + µ )] (6) = t= Odhadová funkc modlu bnární volby s fxním fkty j mtodou podmíněné maxmální věrohodnost (Chambrlan, 980) v tvaru P L = P,,, Y = y Y = y Y = y Y (7) = t= Pro případ, kdy datový soubor obsahuj vlký počt pozorování a =, můžou nastat tyto čtyř možnost (Y,Y ) = (0,0), (0,), (,0) a (,), a tdy pro P( Y = 0 a Y = 0 Y = 0) =, P( Y = a Y = Y = ) =, takž v případě, když s hodnoty těchto pozorování zlogarmují, jsou rovny nul Avšak pro další dvě možnost platí P(0,) P( Y = 0 a Y = Y = ) =, (8) P(0,) + P(,0) z čhož vyplývá, ž podmíněná pravděpodobnost pro tyto dvě pozorování j po nálžé úpravě rovna podílu X β X β X β + Podobně to platí pro případ, kdy Y = a Y = 0 Mz další mtody odhadu modlu bnární dskrétní volby patří mtoda tzv maxmálního skór (Mansk, 975), v níž maxmalzujm počt správných přdpovědí pomocí funkc MS( β ) = (y ){X β 0} (9) = Další nparamtrckou mtodou odhadu j tzv Krnlova odhadová funkc, kd j funkční hodnota F vypočítaná podl 5
Acta Oconomca Pragnsa, roč 5, č, 007 kd w ( ) = z y F ( z), (0) w ( z) y = w (z) = K[(z z )/(λs)], K(r ) = P(r )[ P(r )], P(r) = [ + xp( cr)] Konstanta c = ( π / 3) 0, 553 s používá k standardzac logstckého rozdělní Paramtr λ j vyrovnávající paramtr Problmatku odhadování modlů bnární dskrétní volby panlových dat j třba chápat jako otvřní problému a článk j przntován přdvším jako mtodcký Podobně jako u lnárního rgrsního modlu panlových dat, tak u nlnárních modlů j potřba tstovat přítomnost htrogny v datovém souboru Hausmanův tst spcfkac (978) v případě nzamítnutí nulové hypotézy o homogně j odhad mtodou npodmíněné podmíněné maxmální věrohodnost (MV) konzstntní, al nfktvní u mtody podmíněné MV V případě nzamítnutí altrnatvní hypotézy o htrogně j odhad mtodou npodmíněné MV nkonzstntní a odhad mtodou podmíněné MV j konzstntní a fktvní stovací statstka Husmanova tstu spcfkac j rovna ˆ ˆ χ = ( β ) ( [PMV] [MV]) ( ˆ ˆ PMV β MV Var Var β PMV β MV ) () stovací statstka má χ rozdělní s počtm stupňů volnost odpovídajícímu počtu odhadnutých paramtrů v modlu 3 Aplkac modlů dskrétní volby panlových dat K lustrac modlů panlových dat byla použa data Čského statstckého úřadu z Statstky rodnných účtů za roky 000 004 z 3 70 domácností yto údaj byly roztříděny do dst skupn s stjnou čtností podl výš ročního hrubého pněžního příjmu v korunách na jdnoho člna domácnost, tj datový soubor tvořlo 50 pozorování V všch dst příjmových skupnách byla zjštěna vybavnost domácností přdměty dlouhodobé spotřby Endognní proměnnou v modlu byla vybavnost domácností osobním počítačm a xognní proměnné přdstavovaly čstý příjm (Příjm) na osobu a jdnotlvé pozorované roky (Rok 000 až Rok 004) Časovou proměnnou Rok 000 př spcfkac všch modlů vynchám, abychom zabránl vznku prfktní multkolnary Pro porovnání bylo použo násldujících statckých modlů panlových dat: lnární pravděpodobnostní modl panlových dat s fxním fkty (LPMPDFE), nazývaný modl njmnších čtvrců s bnární závslou proměnnou anbo modl založný na analýz rozptylu a základě přdpokladu o náhodní složc 6
Ekonomtrcká analýza panlových dat s aplkací na vybavnost domácností ν vím, ž mtoda njmnších čtvrců ( odhadová funkc v rámc skupn ) dává njlpší lnární nvychýlný odhad nznámých paramtrů tohoto modlu Podl tstu Brusch a Pagana j hodnota LM statstky rovna 53,68, což vdlo k zamítnutí nulové hypotézy o modlu s náhodným fkty logový modl bnární dskrétní volby panlových dat s fxním fkty (LOGPDFE), odhadnutý mtodou npodmíněné maxmální věrohodnost (5), probový modl bnární dskrétní volby panlových dat s fxním fkty (PROBPDFE) odhadnutý mtodou npodmíněné maxmální věrohodnost (5) Výsldky odhadnutých paramtrů spolu s hodnotam t-statstky (χ -statstky) všch modlů jsou uvdny v tabulc č Uvdné odhadové mtody jsou součástí softwarového produktu Lmdp, s jhož pomocí byly provdny tyto odhady Odhady paramtrů modlů bnární dskrétní volby panlových dat Konstanta 0,660 (7,889) LPMPDFE LOGPDFE PROBPDFE F x n í f k t y Příjm 0,45670 5 (3,308) 0,3970 5 (0,056) 0,760 5 (0,05) Rok 00 0,0343 (,586) 0,08 (0,33) 0,44 (0,35) Rok 00 0,065 (3,009) 0,79 (0,) 0,594 (0,06) Rok 003 0,95 (5,497) 0,670 (0,47) 0,3685 (0,43) Rok 004 0,75 (7,905) 0,8389 (0,608) 0,5055 (0,66) M a r g n á l n í f k t y Příjm 0,45670 5 (3,308) 0,4340 5 (0,06) 0,30600 5 (0,07) Rok 00 0,0343 (,586) 0,597 (0,03) 0,034 (0,9) Rok 00 0,065 (3,009) 0,85 (0,08) 0,0387 (0,08) Rok 003 0,95 (5,497) 0,4790 (0,357) 0,0 (0,38) Rok 004 0,75 (7,905) 0,696 (0,373) 0,477 (0,567) U modlu LPMPDFE kofcnt vícnásobné dtrmnac dosáhl poměrně vysokou hodnotu R = 0,6977 a na základě F-tstu (F (5,44) = 0,3) zamítám nulovou hypotézu o statstcké nvýznamnost R Všchny odhadnuté paramtry tohoto modlu kromě proměnné Rok 00 jsou statstcky významné na pětprocntní hladně významnost J splněn přdpoklad o kladných znaménkách odhadnutých paramtrů, například, zvýšní příjmu o jdnu příjmovou skupnu zvyšuj pravděpodobnost, ž tato domácnost bud vybavna osobním počítačm Podobně lz ntrprtovat další odhadnuté paramtry V modlu LPMPDFE zamítám hypotézu o homoskdastcě pomocí Whova tstu, kd tstovací statstka χ (6) = 7,07 s p-hodnotou rovnou 0,009 a F (6,37) = 3,8 p-hodnotou rovnou 0,03 Rovněž nzamítám hypotézu 7
Acta Oconomca Pragnsa, roč 5, č, 007 o autokorlac prostřdnctvím tstu Lagrangova multplkátoru s tstovací statstkou χ () = 3,580 s p-hodnotou rovnou 0,000 a F (,43) = 38,376 s p-hodnotou 0,000 U modlů LOGPDFE a PROBPDFE j splněn přdpoklad o kladných znaménkách odhadnutých paramtrů, avšak všchny odhadnuté paramtry jsou statstcky nvýznamné Porovnání všch modlů navzájm lz přnásobním vhodnou hodnotou (Grn, 003) V další část tabulky jsou uvdny hodnoty margnálních fktů modlů bnární volby V případě LPMPDFE jsou tyto hodnoty rovny přímo hodnotám odhadnutých paramtrů U modlů LOGPDFE a PROBPDFE jsou hodnoty margnálních fktů vypočítány vždy pro jdnotlvou umělou nula-jdnotkovou proměnnou za podmínky, ž za hodnoty ostatních umělých nula-jdnotkových proměnných dosadím jjch průměry Suma margnálních fktů každé proměnné j vždy rovna jdné a změna přdstavuj rozdíl mz zahrnutím a nzahrnutím dané proměnné do modlu 4 Závěr ato prác obsahuj přhld mtod odhadu nlnárních modlů bnární volby panlových dat, a to zjména logového a probového modlu Byly uvdny čtyř základní mtody odhadu pro případ modlu panlových dat s fxním fkty Část těchto mtod byla aplkovaná na konkrétní data z oblast vybavnost domácností přdměty dlouhodobé spotřby v závslost na xognních proměnných příjm a čas, ktré byly statstcky významné jnom u lnárního pravděpodobnostního modlu bnární dskrétní volby panlových dat Odhady byly provdny pomocí softwaru Lmdp Lratura [] CHAMBERLAI, G, 980: Analyss of Covaranc wh Qualatv Data h Rvw of Economc Studs 47/, Economtrcs Issu, str 5 38, 980 [] GREEE, W H, 003: Economtrc Analyss w Jrsy, Prntc Hall, 003 [3] HSIAO, C, 003: Analyss of Panl Data Cambrdg Unvrsy Prss, 003 [4] HUŠEK, R, 003: Aplkovaná konomtr: tor a prax Praha: Profssonal Publshng, 003 [5] MADDALA, G S, 987: Lmd Dpndnt Varabl Modls Usng Panl Data h Journal of Human Rsourcs /3, 987, str 307 338 [6] MASKI, C F, 975: Maxmum Scor Estmaton of th Stochastc Utly Modl of Choc Journal of Economtrcs 3, 975, str 05 8 [7] WOOLDRIDGE, J 00: Economtrc Analyss of Cross Scton and Panl Data MI Prss, 00 8
Ekonomtrcká analýza panlových dat s aplkací na vybavnost domácností Ekonomtrcká analýza panlových dat s aplkací na vybavnost domácností Zuzana Fíglová Abstrakt Panlová data můžm dfnovat jako spcfcký typ dat, ktré kombnují časové řady a průřzová data, tj víc subjktů j pozorováno v několka časových obdobích Použí této kombnac př analýz dat přnáší mnoho výhod v podobě zvětšného datového souboru, snížní kolnary mz vysvětlujícím proměnným a umožňuj tstovat složější konomtrcké modly K lustrac modlů panlových dat byla použa data Čského statstckého úřadu z Statstky rodnných účtů za roky 000 004 Data o domácnostch obsahovala dmografcké charaktrstky, údaj o domácnost, čstý příjm, hodnocní vlastní socokonomcké suac Endognní proměnnou v modlu byla vybavnost domácnost osobním počítačm a jjí vývoj běhm dané prody pomocí tří konomtrckých modlů Klíčová slova: modl bnární volby; panlová data; statstka rodnných účtů; přdměty dlouhodobé spotřby Economtrc analyss of panl data appld to houshold charactrstcs Abstract Panl data ar spcfc data whr cass ar obsrvd at two or mor tm prods hs approach brngs many advantags: largr datast, dcrasng collnary btwn xognous varabls and usng advancd conomtrc modls h panl data modls wr appld to data from th Houshold Budgt Survys 000 004 carrd out by th Czch Statstcal Offc n ordr to analyz choc bhavor of housholds h data on housholds ncludd dmographc charactrstcs of ndvduals, housng, houshold amns, nt ncom, and opnons of housholds about thr own sococonomc suaton W analyzd th rol of ncom as a dtrmnant of PC ownrshp and s dvlopmnt through th obsrvd prod by usng thr statc conomtrc modls wh panl data Ky words: bnary choc modl; panl data; houshold budgt survy; durabl goods JEL classfcaton: C3, C5 9