Masarykova univerzita Ekonomicko-správní fakulta Studijní obor: Matematické a statistické metody v ekonomii REGRESNÍ ANALÝZA TRANSAKCÍ S BYTOVÝM FONDEM Regression Analysis of the Housing Transactions Diplomová práce Vedoucí diplomové práce: RNDr. Dalibor Moravanský, CSc. Autor: Mgr. Michaela Bartuňková Brno, duben 2010
Masarykova univerzita Ekonomicko-správní fakulta Katedra ekonomie Akademický rok 2008/2009 ZÁDANÍ DIPLOMOVÉ PRÁCE Pro: BARTUŇKOVÁ Michaela Obor: Matematické a statistické metody v ekonomii Název tématu: REGRESNÍ ANALÝZA TRANSAKCÍ S BYTOVÝM FONDEM Regression Analysis of the Housing Transactions Zásady pro vypracování Cíl práce, problémová oblast, postup a použité metody: Postup práce a použité metody: Seznámení se s tématem prostřednictvím doporučené podpůrné literatury. Vyšetření základních vlastností SUR-modelu(soustavy zdánlivě nezávislých regresníchrovnic)voblastitrhusbyty. Sestavení 3-4 rovnicového ekonometrického modelu představujícího analýzu poptávky po nájmech a koupích bytů a vícebytových objektů se zahrnutím vysvětlujících proměnných dostupných v získaných databázích realitních kanceláří(s případným doplněním informací z nabídkových periodik realitních kanceláří). Kvantitativní analýza vytvořeného vícerovnicového modelu pomocí analytických prostředků dostupných v programovém produktu GRETL včetně alternativních (vůči OLS, WLS) kvantifikačních technik. Interpretace získaných výsledků, vyvození závěrů o chování segmentu bytovéh trhu v současné době, úvahu o případném dalším vývoji v závislosti na očekávaném vývoji vysvětlujících proměnných(měřitelných i kategoriálních).
Zhodnocení možnosti racionálního uplatnění zvolené metodologie na získaných datech ČR. Porovnání výsledků se známými obdobným zahraničními výzkumy. Rozsah grafických prací: předpoklad cca 10 tabulek a grafů Rozsah práce bez příloh: 60 70 stran Seznam odborné literatury: Greene, William H.: Econometric Analysis. 4ed Prentice Hall 1993, 1997, 2000. 1004 s. Deaton, A., Muellbauer, J.: Economics and Consumer Behaviour. Cambridge U.P. 1986. 450s. Barten A, Böhm, V.: Consumer Theory. kap.7 in: Handbook of Mathematical Economics. North-Holland 1984. Moravanský, D.: Expenditure systems and their applicability in the COICOP- classification Framework. Příspěvek na konferenci MME Ostrava 2006. Gujarati, N. Damodar: Basic Econometrics. 2ed McGraw-Hill Inc. 1988. 704 s. Hayashi, Fumio: Econometrics. 2ed Princeton University Press. 2000. 683 s. Vedoucí diplomové práce: RNDr. Dalibor Moravanský, CSc. Datum zadání diplomové práce: 6. 3. 2009 Termín odevzdání diplomové práce a vložení do IS je uveden v platném harmonogramu akademického roku. vedoucí katedry děkan VBrnědne6.3.2009
Jméno a příjmení autora: Mgr. Michaela Bartuňková Název diplomové práce: Regresní analýza transakcí s bytovým fondem Název práce v angličtině: Regression Analysis of the Housing Transactions Katedra: Ekonomie Vedoucí diplomové práce: RNDr. Dalibor Moravanského, CSc. Rok obhajoby: 2010 Anotace Tato diplomová práce zkoumá vztahy mezi proměnnými relevantními pro odhad ceny bytu, resp. jeho pronájmu. Za tímto účelem je v práci provedena regresní analýza. Při analýze jsou použity různé odhadové metody. Annotation This thesis deals with relations among variables relevant for appraisement of flat or apartment rentals. For this purpose is carried out the regression analysis. In analysis are used different methods of estimation. Klíčová slova regresní analýza, OLS, WLS, 2SLS, LIML, Logit model, Probit model, bytový fond Keywords regression analysis, OLS, WLS, 2SLS, LIML, Logit model, Probit model, housing fund
Prohlášení Prohlašuji, že jsem diplomovou práci Regresní analýza transakcí s bytovým fondem vypracovala samostatně pod vedením RNDr. Dalibora Moravanského, CSc. a uvedla v ní všechny použité literární a jiné odborné zdroje v souladu s právními předpisy, vnitřními předpisy Masarykovy univerzity a vnitřními akty řízení Masarykovy univerzity a Ekonomicko-správní fakulty Masarykovy univerzity. V Brně dne 2. 5. 2010 Michaela Bartuňková
Poděkování Chtěla bych poděkovat RNDr. Daliboru Moravanskému, CSc. za vedení diplomové práce, cenné rady a připomínky při zpracování daného tématu. Zároveň bych chtěla poděkovat společnosti Gaute, a. s., která poskytla data k této analýze.
OBSAH Obsah Úvod 11 1 Metodika práce 15 1.1 RealitníspolečnostGaute,a.s..... 15 1.2 Zpracovánídat............. 16 1.2.1 AplikaceIntrapoint... 16 1.2.2 Úpravadat........... 17 1.2.3 VýpočtovýprogramGretl... 22 2 Metoda nejmenších čtverců 23 2.1 Teoretickáčást............. 23 2.1.1 Lineárníregresnímodel..... 23 2.1.2 Odhadparametrů βmetodounejmenšíchčtverců.......... 24 2.1.3 Kontingenčnítabulky...... 25 2.1.4 Korelačnímatice........ 25 2.1.5 Koeficientdeterminace..... 25 2.1.6 RESETtest........... 26 2.1.7 Testyheteroskedasticity.... 27 2.2 Prodejbytů.... 28 2.2.1 Odhadparametrů βmetodounejmenšíchčtverců.......... 30 2.2.2 Odhadparametrů βváženoumetodounejmenšíchčtverců..... 32 2.2.3 Zúženýregresnímodel..... 35 2.3 Pronájembytů............. 36 2.3.1 Odhadparametrů βmetodounejmenšíchčtverců.......... 37 2.3.2 Odhadparamatru βváženoumetodounejmenšíchčtverců..... 38 2.3.3 Zúženýregresnímodel..... 41 3 Instrumentální proměnné 43 3.1 Teoretickáčást............. 43 9
OBSAH 3.1.1 Odhadparametrů βpomocíinstrumentálníchproměnných..... 44 3.1.2 Určeníinstrumentálníchproměnných... 44 3.1.3 Hausmanůvtest.... 45 3.2 Prodejbytů.......... 46 3.2.1 Odhadparametrů βpomocíinstrumentálníchproměnných..... 46 3.3 Pronájembytů........ 49 3.3.1 Odhadparametrů βpomocíinstrumentálníchproměnných..... 49 4 Modely binární volby 53 4.1 Teoretickáčást........ 53 4.1.1 Modelybinárnívolby............ 53 4.1.2 Odhadparametrů βvmodelechbinárnívolby......... 55 4.2 Prodejbytů.......... 56 4.2.1 ModelyprozávisleproměnnouBalkon............. 56 4.2.2 ModelyprozávisleproměnnouTerasa... 58 4.2.3 ModelyprozávisleproměnnouLodžie... 59 4.2.4 ModelyprozávisleproměnnouSklep... 60 4.3 Pronájembytů........ 61 4.3.1 ModelyprozávisleproměnnouBalkon............. 61 4.3.2 ModelyprozávisleproměnnouTerasa... 62 4.3.3 ModelyprozávisleproměnnouLodžie... 62 4.3.4 ModelyprozávisleproměnnouSklep... 63 Závěr 65 Literatura 68 Seznam obrázků 71 Seznam tabulek 74 Přílohy i 10
ÚVOD Úvod V našem životě existuje série událostí, které dříve či později potkají prakticky každého. Hledání práce, založení rodiny, hledání vhodného bydlení, zabezpečení budoucnosti. A bez nejmenších pochyb můžeme říct, že jsou tyto události spojeny s ekonomickou stránkounašehoživota,aťužsnákladyčipříjmy,atonezrovnamalouměrou. Trhu práce či penzijnímu připojištění a jiným formám zabezpečení naší budoucnosti je obecně věnována velká pozornost. Jsou to problémy, které s námi souvisí tak říkajíc přímo. Hledání vhodného místa k životu je problém s poněkud širším záběrem. Je nutné se rozhodnout, zda bydlet v pronájmu nebo si koupit vlastní byt či rodinný dům, jak bydlení financovat, kolik pokojů z dlouhodobého hlediska budeme využívat, zda nám vyhovuje spíšekuchyněnebokuchyňskýkout,zdachcemegarážnebosklep,...dřívečipozději najdeme odpovědi na všechny tyto otázky. Poté nás čeká další úkol, a to hledání vhodné realitní kanceláře, která nám zprostředkuje pronájem či koupi našeho vysněného bydlení. Pro běžného občana tu ale vyvstávají zcela nové a zásadní otázky. Není daná cena bytu nadhodnocená? Jaká by měla být skutečná cena bytu? Jak se naše požadavky promítají do výsledné ceny bytu? V této diplomové práci se zaměříme na bytový fond, konkrétně tedy na nekomerční prostory, byty. Snahou je vytvořit regresní model bytového fondu, který bude schopen nazákladědatzískanýchzjednézrealitníchkancelářízaroky2007až2009určitcenu bytu, popř. cenu pronájmu bytu v daném období. Podobné analýzy se v České republice nevyskytují v takové míře, v jaké bychom při důležitosti daného tématu čekali. Tento nedostatek má hned několik důvodů. Za nejdůležitější můžeme považovat vysokou proměnlivost trhu s nemovitostmi, která způsobuje menší míru využití pro daný model v delším časovém úseku. Trh s nemovitostmi v České republice představuje vysoce konkurenční prostředí. Provozování realitní kanceláře není vázaná živnost, proto na trhu působí vysoký počet kanceláří. Sběr dat v takto vysoce konkurenčním prostředí je poněkud problematický.můžemesledovatcenyvinzertnímtiskuanawebu,aleskutečnácenaseoproti nabízené může velmi lišit. Přesně můžeme postihnout pouze developerské projekty, a to pouze z hlediska výstavby, nikoli prodeje bytů. V době psaní této diplomové práce se svět stále vyrovnává s důsledky finanční krize. 11
ÚVOD Krize trh s nemovistostmi těžce zasáhla, globálně i lokálně můžeme sledovat trend poklesu cen. Důsledky můžeme pozorovat i přímo na bytové výstavbě. Pokud se podíváme na analýzy vytvářené Českým statistickým úřadem[11], zjistíme, že v roce 2007 byla výstavba bytovýchdomůnavrcholu 1,vdalšímroceužbylalezaznamenánmírnýpokles.Vroce 2009 došlo k razantnímu poklesu zahájené výstavby bytů o 20%. Z tohoto důvodu jsou data využívaná v této diplomové práci odrazem značných proměn trhu s nemovitostmi. Kromě poklesu výstavby nových bytových domů došlo k poklesu objemu prodeje bytů. Negativní vliv na tyto události má i trend v poskytování služeb finančních institucí, které v obavě z dopadů finanční krize zpřísnily pravidla pro poskytování hypoték, čímž došlo k omezení jejich poskytování a tím i k omezení finančních zdrojů pro potenciální kupce. Všechny tyto faktory ovlivní i vytvořený regresní model. Pro tuto práci byla data o prodeji a pronájmu bytů poskytnuta realitní společností Gaute, a. s. Společnost existuje již od roku 1996 a je jednou z předních realitních kanceláří na trhu s nemovitostmi v České republice. Společnost Gaute, a. s., mi umožnila přístup doaplikaceintrapoint 2 shormažďujícíinformaceozrealizovanýchzakázkáchiprávěnabízených nemovitostech. Ze zrealizovaných zakázek bylo vybráno 318 prodejů a 97 pronájmů bytů v Jihomoravském kraji, na kterých bude tato analýza založena. První kapitola této diplomové práce se věnuje stručné historii společnosti Gaute, a. s., a jejím obchodním aktivitám. Dále je popsána funkce aplikace Intrapoint, její možnosti využití a úskalí této aplikace. Zároveň se čtenář seznámí s provedenou úpravou dat nutnou pro zařazení jednotlivých proměnných do regresního modelu. Krátce je představen i program Gretl, ve kterém byly provedeny výpočty nutné pro tuto analýzu. Druhá kapitola této diplomové práce se věnuje nejjednodušší formě regresního modelu, tj. lineárnímu regresnímu modelu, a jeho odhadu za pomoci metody nejmenších čtverců. Tato kapitola je rozdělena na dvě části. První část se věnuje prodeji bytů, druhá pak pronájmu bytů. Obě části mají stejnou strukturu, věnujeme se tedy odhadu parametrů modelu, korelacím, testům heteroskedasticity, atd. Třetí kapitola se věnuje odhadu parametrů zkoumaného modelu pomocí instrumentálních proměnných. Zde využijeme dvoustupňovou metodu nejmenších čtverců a metodu maximální věrohodnosti s omezenou informací. Opět je kapitola rozdělena na dvě části, první část je věnována prodeji bytů, druhá pronájmu bytů. V další, v pořadí čtvrté, kapitole se blíže seznámíme s Logit modelem a Probit modelem a s jejich možným využitím při analýze bytového fondu. Na rozdíl od předchozích kapitol zde nebudeme zkoumat cenu a její případné změny závislé na ostatních proměnných, ale budeme hledat pravděpodobnost toho, zda se v bytě určité typy vybavení nacházejí či 1 Vtomtorocesepostavilonejvícebytůodroku1993. 2 AplikaceIntrapointbudepopsánablíževKapitole1. 12
ÚVOD nikoli. V Závěru jsou shrnuty dílčí výsledky jednotlivých kapitol. Prostor je dále věnován srovnání jednotlivých metod a návrhům na možné rozšíření. Pro bližší seznámení s problematikou jsou k této diplomové práci přiloženy přílohy obsahující tabulky s výsledky jednotlivých odhadů. 13
ÚVOD 14
KAPITOLA 1. METODIKA PRÁCE Kapitola 1 Metodika práce Při analýze bytového fondu je vždy nutné začít u samotných dat. Ta byla poskytnuta realitní společností Gaute, a. s. 1.1 Realitní společnost Gaute, a. s. SpolečnostGaute,a.s.,vzniklavBrněvroce1996jakorealitníspolečnost.Vroce1998 byla zapsána v obchodním rejstříku jako akciová společnost. Následně se Gaute, a. s., stala v roce 2004 franšízovým partnerem Realitní společnosti České spořitelny pro Jižní Moravu. Společnost se zabývá zprostředkováním prodeje, nákupu či pronájmu v oblasti nemovitostí. V tomto okamžiku nabízí služby i v oblasti dražeb a výběrových řízení. Kromě klasických objektů, jako jsou rodinné domy, byty nebo bytové domy, věnuje společnost Gaute, a. s., pozornost i nebytovým prostorům(tj. kaceláře, obchodní prostory, garáže), dále pak pozemkům, zemědělským objektům, historickým budovám a rekreačním zařízením. Mezi další, okrajové aktivity společnosti patří obchod s pohledávkami, dluhopisy a cennými papíry. Právě kvůli širokému záběru činností realitní kanceláře Gaute, a. s., bylo založeno několik samostatných společností, které se nyní specializují na jednotlivé segmenty trhu. Patří mezi ně Gaute Corp. věnující se průmyslovým objektům ve vlastní správě, Gaute Investment zaměřená na developerské projekty, Gaute Centrum, obchodní a administrativní centrum, RealitkaCS zdůrazňující partnerství Gaute, a. s., a Realitní společnosti České spořitelny a Naxos Brno Aukční síň, která provádí dražby a výběrová řízení v rámci celé České republiky. V rámci spolupráce s Realitní společností České spořitelny přešla společnost Gaute, a. s., k využívání internetové aplikace Intrapoint, která umožňuje jednoduché vkládání dat a jejich úpravu. Nespornou výhodou daného systému je právě fakt, že k aplikaci je možný přístup odkudkoli, kde je k dispozici připojení k internetu. Jde tedy o krok zkvalitňující, 15
KAPITOLA 1. METODIKA PRÁCE resp. zrychlující práci realitních makléřů. Další výhodou je pak jednotnost dat. 1.2 Zpracování dat 1.2.1 Aplikace Intrapoint Intrapoint je internetová aplikace umožňující přístup k datům o nákupu či prodeji. Jedná se o aplikaci Realitní společnosti České spořitelny, danou aplikaci tedy využívají i franšízovéspolečnosti(gaute,a.s.,relias.r.o.,...).datajsoujednotnáalzesevnich snadno orientovat. Náhled na aplikaci Intrapoint je zobrazen na obrázku 1.1 a 1.2. Obrázek 1.1: Aplikace Intrapoint, stručný náhled na nabídku bytu Obrázek 1.2: Aplikace Intrapoint, podrobný náhled na nabídku bytu Aplikace samotná má mnoho skupin a podskupin, co se týče vybavení, dostupnosti služeb, podlahové plochy a jiných. U každé zakázky můžeme zjistit typ nemovistosti, její stav, umístění, počet podlaží, podlahovou plochu, způsob vytápění, vybavení, celé znění inzerátu, atd. Intrapoint tak umožňuje získat komplexní přehled o nabízených nemovitostech. 16
KAPITOLA 1. METODIKA PRÁCE Aplikace je informačně velmi obsažná, má však dvě slabá místa. Prvním je neexistence možnosti exportu dat, data nelze z aplikace hromadně převést do běžně využívaných datových formátů(např. tabulkový program MS Excel). Tím druhým je pak lidský faktor, tedy samotný realitní makléř, který může nedopatřením snadno udělat chybu. Např. nemusí do této aplikace zapsat všechna relevantní data. Některé byty tak mohou mít neúplné údaje, ať už se jedná o maličkosti, např. velikost balkonu, nebo podstatné faktory jako je způsob vytápění. 1.2.2 Úprava dat Na základě dostupných údajů realitní společnosti Gaute, a. s., byla použita data o prodeji a pronájmu bytů na území Jihomoravského kraje za roky 2007 až 2009 včetně. Pro prodej bytů bylo poskytnuto 318 zrealizovaných zakázek, pro pronájem bytů pak 97 zrealizovaných zakázek pro dané období. Výsledky této analýzy budou značně záviset na samotném složení dat. Přesněji řečeno, velká část dat týkajících se prodeje bytů vychází z developerských projektů nacházejících se spíše v okrajových částech Brna, popř. v okrese Brno-venkov. Stejně tak úzký časový rámec, který je v této diplomové práci analyzován, podporuje teorii, že data o pronájmech bytů jsou zkreslená v tom smyslu, že spíše nepostihují dlouhodobé pronájmy. Předpokládámetedy,žeupronájmůbytůsevevětšiněpřípadůjednáokrátkodobýpronájem,kdy nájemníky jsou např. studenti, přátelé, atd. Pro regresní analýzu bytového fondu byla zvolena kritéria cena bytu, Podlahová plocha bytu, Počet pokojů v bytě, Typ vlastnictví, Typ zdiva, Celkový stav bytu, přítomnost Balkonu, Terasy, Lodžie nebo Sklepu, možnost parkování v garáži či před domem, Umístění bytu v domě(tj. podlaží), Dostupnost městské hromadné dopravy a celkové Vybavení bytu, přičemž většina z nich bude v modelu figurovat jako umělá proměnná. Tato kritéria byla zvolena kvůli jejich relevanci vůči této analýze. Mohli bychom je doplnit o způsob vytápěníbytunebodispozicekoupelny(tj.zdajespolečnáswcnebojezvlášť),aletato data nejsou v aplikaci Intrapoint dostupná v dostatečné míře pro tuto analýzu. Vzhledem k tomu, že tato diplomová práce se věnuje pouze prodeji a pronájmu bytů, můžeme zanedbat velikost pozemku(resp. zahrady), počet podlaží apod. Navíc omezením analýzy pouze na byty je možné použít stejná kritéria, byť se jejich hodnoty budou drobně lišit. Cena bytu Cena bytu je v dalších dvou kapitolách zvolena jako závisle proměnná. Její hodnota je objektivní, jelikož je to cena, za kterou byl daný byt ve skutečnosti prodán nebo pronajat. 17
KAPITOLA 1. METODIKA PRÁCE Vmnohapřípadechsetedynejednáocenu,zakteroubyldanýbytnabízen,aleocenu nižší, která vznikla postupným vyjednáváním s realitní kanceláří. Podlahová plocha bytu Narozdíl od ceny Podlahová plocha bytu není jednoznačně vymezená veličina. Opět narážíme na problém zmíněný výše. Při zadávání dat do aplikace Intrapoint se zadává podlahová plocha a dále velikost balkonu, terasy, lodžie a sklepu. Někteří realitní makléři však zadávají jen celkovou plochu a je proto obtížné určit, jaká je ve skutečnosti velikost bytu samotného. Proto využíváme velikost bytu, kterou aplikace Intrapoint považuje za skutečnou. Počet pokojů v bytě Je zbytečné do modelu zahrnovat kuchyň či kuchyňský kout, neboť ty se nachází v každém bytě. Proto počítáme pouze počet pokojů. Můžeme narazit na problém, jak vyčíslit počet pokojů v bytech, kde je místo kuchyně kuchyňský kout. Ten je samozřejmě v každém bytě jiný, resp. má jinou velikost. Proto byl zvolen společný koeficient 0, 5, který od počtu pokojů v bytě odečítáme. Hodnoty kritéria Počet pokojů v bytě tedy vypadají následovně: Podtypbytu Hodnota 1+kk 0,5 1+1 1 2+kk 1,5 2+1 2 3+kk 2,5 3+1 3 4+kk 3,5 4+1 4 5+kk 4,5 5+1 5 Tabulka 1.1: Počet pokojů v bytě Typ vlastnictví Vlastnictví bytu se dá rozdělit do tří kategorií. Jedná se buď o osobní vlastnictví, družstevní vlastnictví nebo o nájemní byt. Druh vlastnictví ohodnotíme stupni 1, 2 a 3 tak, že 18
KAPITOLA 1. METODIKA PRÁCE pro kupce nejlepší možnost bude ohodnocena nejvyšším stupněm. Tento postup využijeme i u dalších kritérií. Hodnoty kritéria Typ vlastnictví vypadají takto: Typvlastnictví Hodnota nájemní 1 družstevní 2 osobní 3 Tabulka 1.2: Typ vlastnictví Typ zdiva Každýdůmjepostavenbuďzcihelnebozpanelu.Totokritériumohodnotímestupni1 nebo 2 následujícím způsobem: Typzdiva Hodnota panel 1 cihla 2 Tabulka 1.3: Typ zdiva Celkový stav bytu Tento parametr mohou realitní makléři ohodnotit hned čtyřmi stupni, a to dobrý, po rekonstrukci, velmi dobrý a novostavba. Toto kritérium ale není zcela objektivní, neboť záleží na profesionálním úsudku makléře, jak daný byt ohodnotí. Hodnocení tohoto kritéria vypadá následovně: Celkový stav Hodnota dobrý 1 po rekonstrukci 2 velmi dobrý 3 novostavba 4 Tabulka 1.4: Celkový stav bytu 19
KAPITOLA 1. METODIKA PRÁCE Balkon, Terasa, Lodžie, Sklep KritériaBalkon,Terasa,LodžieaSklepjsouohodnocenabuď0nebo1podletoho,zda k bytu náleží či ne. Toto zjednodušení je způsobené opět nedostatkem dat. Vzhledem k tomu, že u většiny prodejů či nájmů není velikost těchto kritérií určena, musíme se omezit na existenci a neexistenci balkonů atd. Hodnocení tedy vypadá takto: Balkon, Terasa, Lodžie, Sklep Hodnota nenáleží k bytu 0 náleží k bytu 1 Tabulka 1.5: Balkon, Terasa, Lodžie, Sklep Parkování Parkovat lze buď v garáži nebo na parkovacím místě před bytovým domem. Opět tato skutečnost není v datech vždy jednoznačně uvedena, proto předpokládáme, že pokud není uvedeno jinak, garáž, resp. parkovací místo není majiteli/nájemci bytu k dispozici. Hodnocení parkování vypadá stejně jako v předchozím případě, tedy: Garáž, Parkovací místo Hodnota nenáleží k bytu 0 náleží k bytu 1 Tabulka 1.6: Parkování Umístění bytu v domě Umístěnímbytuvdoměserozumípatro,vekterémsebytnachází.Zdejsouhodnotytohoto kritéria zcela zřejmé. Upřesníme jen, že přízemí je dáno hodnotou 0, zvýšené přízemí hodnotou 0,5 a snížené přízemí hodnotou 0,5. Dostupnost městské hromadné dopravy Jedním z obvyklých kritérií při hledání bytu je i dostupnost městské hromadné dopravy. V tomto případě tomu nebude jinak. 20
KAPITOLA 1. METODIKA PRÁCE Vzhledem k ochraně osobních údajů lze v aplikaci Intrapoint vyčíst město a ulici, kde se daný byt nachází, přesnější umístění tam však najít nelze. Z tohoto důvodu bylo toto kritérium určeno následujícím způsobem: a) každé ulici byla přiřazena průměrná vzdálenost od nejbližší zastávky městské hromadné dopravy, ať už od tramvaje, autobusu či trolejbusu, v případě mimobrněnských bytů pak vzdálenost od vlakového nádraží, b) daná vzdálenost byla přepočítána na čas nutný pro její zdolání; pro výpočet posloužila průměrná rychlost chůze 4 km/h, c) tento čas byl opět ohodnocen dle následující tabulky: Dostupnost městské hromadné dopravy Hodnota 20avíceminut 1 10 20minut 2 5 10minut 3 0 5minut 4 Tabulka 1.7: Dostupnost městské hromadné dopravy Vybavení bytu Vybaveníbytujevšeobecnéoznačeníprovše,cokbytunáleží.Tímjemyšlenonapř.zateplení, plastová okna, kuchyňská linka, spotřebiče,... Každý takový bonus náležející kbytumáhodnotu1.nerozlišujemetedy,zdajevbytějedenspotřebičnebospotřebičů více apod., jelikož dané informace k dispozici nejsou. Hodnota tohoto kritéria je pak tvořena součtem všech bonusů. Je nutné doplnit, že u starších bytů je zdůrazňována výměna oken za plastová nebo zateplení, což je u novostaveb samozřejmostí. Proto každá novostavba automaticky získává 2 bonusy k hodnotě Vybavení bytu. Dále předpoládáme, že když jsou v bytě spotřebiče, musí zde být i kuchyňská linka(nikoli opačně). Totojejedinékritérium,kteréseuprodejeanájmubytůliší.Jetoprávěkvůlikuchyňskýmlinkám.Přinájmubytuneníuvedeno,zdasejednáonovoučistaršíkuchyňskou linku, proto je ohodnocena v obou případech 1. U prodeje bytu tato skutečnost uvedena je, proto rozlišujeme novou kuchyňskou linku(resp. nové spotřebiče) hodnotou 1 a starší kuchyňskou linku(resp. starší spotřebiče) hodnotou 0,5. 21
KAPITOLA 1. METODIKA PRÁCE Dalším rozdílem je zařízení bytu, tj. nábytek, který náleží k bytu. U prodeje bytu je to velmi neobvyklé, zatímco u nájmu bytu běžné. Zařízení bytu je opět ohodnoceno hodnotou 1. 1.2.3 Výpočtový program Gretl Veškeré výpočty pro tuto diplomovou práci byly provedeny pomocí programu Gretl. Obrázek 1.3: Gretl, náhled na nabídku odhadových metod Gretl je software určený pro ekonometrickou analýzu. Možnosti jeho využití jsou velmi široké. Nabízí totiž mnoho odhadových metod- metoda nejmenších čtverců, vážená metoda nejmenších čtverců, metoda maximální věrohodnosti s omezenou nebo úplnou informací a další. Samozřejmostí jsou také testy heteroskedasticity, multikolinearity, normality reziduí, atd. Nabízí také široké možnosti grafického zpracování výsledků. Kromě těchto výpočetních záležitostí má Gretl jednu nepopiratelnou výhodu, a tou je přímézpracovánídatdojazykal A TEX. 22
KAPITOLA 2. METODA NEJMENŠÍCH ČTVERCŮ Kapitola 2 Metoda nejmenších čtverců V této kapitole vytvoříme jednoduchý model, který budeme odhadovat pomocí metody nejmenšíchčtverců 3. 2.1 Teoretická část 2.1.1 Lineární regresní model Mějme lineární regresní model ve tvaru y= Xβ+ ε, resp. y t = k X tj β j + ε t, j=1 kde yjevektorpozorovánízávisleproměnnéorozměrech[t 1],vnašempřípadětedy prodejní cena bytu, X je matice pozorování k nezávisle proměnných neboli matice plánu orozměrech[t k], βjevektorregresníchkoeficientůorozměrech[k 1]aεjevektor náhodnýchsložekmodeluorozměrech[t 1],přičemž t {1,2,..., T }.Předpokládáme, žemodelsplňujepodmínku k < T. Proměnné lineárního regresního modelu splňují následující vlastnosti: a) náhodné složky musí být centrované, platí tedy, že E(ε)=0, 3 Teorieklineárnímuregresnímumodelupatříkzákladůmekonometrieapokrývájiveškeráliteratura vztahující se k této problematice. 23
KAPITOLA 2. METODA NEJMENŠÍCH ČTVERCŮ b) kovarianční matice náhodných složek je diagonální, tj. D(ε)=σ 2 I T, náhodné složky jsou tedy homoskedastické a nekorelované, c) náhodné složky nekorelují s nezávisle proměnnými, tedy E(X ε)=0, d) matice plánu musí mít plnou hodnost, tzn. h(x)=k. 2.1.2 Odhad parametrů β metodou nejmenších čtverců Při splnění předchozích předpokladů lineárního regresního modelu můžeme parametry tohoto modelu odhadnout pomocí metody nejmenších čtverců. Obecně pro odhady parametrů v lineárním regresním modelu platí následující vztahy: a) b=ˆβ(y, X), b) ŷ= Xb, c) e=ˆε=y ŷ. Jednou z odhadových metod v lineárním regresním modelu je metoda nejmenších čtverců. Minimalizačním kritériem u této metody je součet čtverců reziduí, min(e e)=min(y Xb) (y Xb). Samotný odhad parametrů β má pak tvar ˆβ OLS =(X X) 1 X y aplatíproněj,žeˆβ OLS jenestranný,konzistentní,lineárníanejlepšívesmyslunejmenší kovarianční matice. Tyto vlastnosti shrnuje následující věta. Věta2.1(Gauss-Markovova).Odhadregresníchkoeficientůˆβ OLS pořízenýmetodounejmenších čtverců je nejlepším nestranným lineárním odhadem vektoru parametrů β. Důkaz.vizDhrymes[4],s.204 24
KAPITOLA 2. METODA NEJMENŠÍCH ČTVERCŮ 2.1.3 Kontingenční tabulky Kontingenčnítabulkyjsoutabulkyorozměrech m n,kde m, n {1,2,... }amje počet realizací první proměnné a n je počet realizací druhé proměnné, vyjadřují absolutní (resp. relativní) četnosti daného jevu mezi dvěma nezávisle proměnnými. Přesněji řečeno, ukazují vzájemný vztah dvou nezávisle proměnných skrze absolutní(resp. relativní) četnost realizací těchto nezávisle proměnných. V případě, že některá z hodnot nezávisle proměnné je vzácná, pak je možné některé hodnoty sloučit do jedné. 2.1.4 Korelační matice Korelační matice nám udává korelace mezi jednotlivými nezávisle proměnnými. Tato matice má následující vlastnosti: a) Na diagonále korelační matice jsou samé jedničky. To je dáno definicí, na diagonále se ukazuje korelace nezávisle proměnné samé se sebou. b)korelačnímaticejesymetrická,tj.korelacemezinezávisleproměnnými x 1 a x 2 je stejnájakokorelacemezi x 2 a x 1 atd. Pokud se tedy podíváme např. na první řádek korelační matice, uvidíme párové korelačníkoeficientymezinezávisleproměnnou x 1 aostatníminezávisleproměnnými. Ke korelační matici se váže problém multikolinearity. Multikolinearita nastává, pokud jsou některé nezávisle proměnné na sobě silně závislé. Tím by nebyl splněn požadavek na maximální hodnost matice plánu v lineárním regresním modelu. 2.1.5 Koeficient determinace Koeficientdeterminace,označovaný R 2,sepoužívákvyjádřenímíryshodytestovaného modelu s analyzovanými daty. Můžeme jej vyjádřit pomocí vztahu R 2 =1 e e nȳ2=ŷ ŷ y y y y. Hodnota koeficientu determinace se pohybuje v intervalu < 0, 1 >, přičemž nulové hodnoty koeficient nabývá v případě, kdy vybrané nezávisle proměnné nevystihují nic z variability závisle proměnné. Druhým extrémem je pak úplné vysvětlení celkového součtu čtverců. Nicméně samotný koeficient determinace je ovlivněn počtem nezávisle proměnných, proto by nám přidání další vysvětlující proměnné zkreslilo srovnání jednotlivých modelů. 25
KAPITOLA 2. METODA NEJMENŠÍCH ČTVERCŮ Z toho důvodu se spíše používá korigovaný koeficient determinace, ve kterém je tento problém zohledněn. Ten má tvar 2.1.6 RESET test R 2 = R 2 k 1 n k (1 R2 )=1 (1 R 2 ) n 1 n k. RamseyhospecifikačníRESETtest 4 jeobecnýmtestemsprávnostispecifikacemodelové rovnice. Mějme výchozí lineární regresní rovnici ve tvaru y t = λ 1 + λ 2 X t + ε t, kde Xjematiceplánuorozměrech[T k]. Ikdyžjsouvýrazy T t=1 e ta T t=1 e tŷ t nulové,středníhodnotasesystematickyzvyšováním ŷ t mění.tentoúkazbydávalpodnětktomu,žepokudzavedeme ŷ t doregresní rovnicejakonezávisleproměnnou,mělobydojítkezvýšeníkoeficientudeterminace R 2. Kdyby toto zvýšení koeficientu determinace bylo statisticky významné, vedlo by nás to k tezi, že lineární funkce je chybně specifikovaná. RESET test sestává z následujících kroků: a) Kvantifikování výchozí regresní rovnice, ze které získáme vektor vyrovnaných hodnot závisleproměnné ŷ t. b)výpočetpůvodníregresnírovnice,dokteréjevloženanovánezávisleproměnná ŷ t. Samozřejmě,že ŷ t doregresnírovnicesohledemnapřesnoumultikolinearituvložit nelze,nicméněmůžemevyužítrůznýchmocnin ŷ t (vgretluvyužívámemožnost druhých a třetích mocnin). Upravená regresní rovnice má tvar y t = β 1 + β 2 X t + β 3 ŷ t 2 + β 4 ŷ t 3 + ν t. c)koeficientdeterminaceztétoupravenéregreseoznačíme R 2 new.potévypočteme hodnotu F-statistiky vyjádřené jako (R 2 new R2 )/q r (1 R 2 new )(T k new), kde q r jepočetnověpřidanýchnezávisleproměnných, Tjedélkadatovéhovzorku a k new jecelkovýpočetparametrůvrozšířenémmodelu. F-statistikanámurčí,zda je přírůstek koeficientu determinace statisticky významný. 4 Ramsey,J.B.:Testsforspecificationerrorsinclassicallinearleastsquaresregressionanalysis.Journal of the Royal Statistical Society, series B, Vol. 31/1969, s. 350-371. 26
KAPITOLA 2. METODA NEJMENŠÍCH ČTVERCŮ d) V případě, že je F-statistika statisticky významná, pak můžeme říct, že výchozí model je na dané hladině významnosti chybně specifikovaný. 2.1.7 Testy heteroskedasticity Heteroskedasticita je problém týkající se kovarianční matice vektoru náhodných složek ε t vjednorovnicovémekonometrickémmodelu.konkrétněsetentoproblémtýkáprvků kovarianční matice na její diagonále. Existuje tu rozpor s homoskedasticitou požadovanou v předpokladech lineárního regresního modelu, kdy rozptyl náhodných složek má být konečný a konstantní. K tomu dochází často u tzv. průřezových dat, kdy se hodnoty vysvětlujících proměnných mění ve velké míře. Tento jev má důsledky na vlastnosti odhadu metodou nejmenších čtverců. Odhad je sice stále nestranný, ale ztrácí jinou vlastnost, a to vydatnost odhadu. V našem případě budeme heteroskedasticitu zkoumat pomocí Whiteova a Breusch- Paganova testu. Whiteův test Whiteův test je obecným testem heteroskedasticity založený na principu Lagrangeových multiplikátorů, u kterého nemusíme pracovat s žádnými speciálními předpoklady o tvaru heteroskedasticity. Lze jej použít tam, kde nelze předem určit, která z nezávisle proměnnýchovlivňujezměnyrozptylunáhodnésložkymodelu 5. Mějme tradiční odhad ˆσ 2 =(T k) 1 ( T t=1 e 2 t) 1. Pokudvmodeluneníheteroskedasticita,tentovzorecnámdá σ 2.Vopačnémpřípaděse odhad bude lišit. Whiteův test je založen na počtu pozorování, pro správnou indikaci heteroskedasticity jenutné,abypočetpozorováníbylvyššínež30.použitítestujemožnéipřesdrobné odchylky od normálního rozdělení. Jednoducháverzetohototestuseprovádíregresí e 2 i nakonstantuavšechnyprvní momenty, druhé momenty a křížové součiny původních nezávislých proměnných. Test máasymptotické χ 2 -rozdělenísqstupnivolnosti,kde qjepočetnezávisleproměnných v pomocné regresi, tedy q= k(k+1) 2 5 ObecnějevtakovémpřípaděvhodnépoužíttestyzaloženénaLagrangeověmultiplikátorujakojsou Whiteův test a Breusch-Paganův test. 1. 27
KAPITOLA 2. METODA NEJMENŠÍCH ČTVERCŮ Vlastní testování pak probíhá na hladině významnosti α = 0, 05, kdy porovnáváme kritickouhodnotu χ 2 crit(q)aspočtenoutestovacístatistiku nr 2 e,přičemžpro χ 2 crit(q) > nr 2 e platí nulová hypotéza o homoskedasticitě. Whiteův test je obdobou Breusch-Paganova testu(viz dále), který taktéž zahrnuje pomocnou regresi čtverců reziduí vyjma jakýchkoli vyšších řádů. Následkem toho může Whiteův test nalézt více obecných forem heteroskedasticity než Breusch-Paganův test. Ve skutečnosti je Whiteův test velmi obecný, což je i jeho nedostatek. Whiteův test může odhalit heteroskedasticitu, ale stejně tak může identifikovat nějaké další chyby specifikace(např. nesprávný tvar funkce) nebo korelaci mezi X a e. Breusch-Paganův test Breusch-Paganův test je méně specifický a taktéž méně obecný test založený na principu Lagrangeových multiplikátorů. Jeho předností oproti Whiteovu testu je značná jednoduchost, na druhou stranu ale vyžaduje normalitu náhodných složek lineárního regresního modelu. Předpokládejme heteroskedasticitu v podobě σi= 2 h(z iα), kde z ijevektorpozorování pproměnnýchobsahujícíchněkteréznezávislýchproměnných testovaného modelu nebo jejich funkce, α je vektor neznámých koeficientů a h je neznámá, spojitědiferencovatelnáfunkce,kteránezávisína i,taková,že h(.) >0ah(0)=1. Testujeme hypotézu H 0 : α=0 H 1 : α 0, přičemž nulová hypotéza potvrdí homoskedasticitu. Breusch-Paganův test spočívá v odhadu lineárního regresního modelu metodou nejmenšíchčtvercůaspočtenímreziduí e i,následnýmodhadempomocnéregresečtvercůreziduí e 2 i na z i metodounejmenšíchčtvercůavyčíslenímtestovacístatistiky nre 2.Testovásta- tistika nre 2mápronulovouhypotézuasymptotické χ2 -rozdělenís(p 1)stupnivolnosti. Prozamítnutínulovéhypotézytedyopětplatí χ 2 crit (p 1) < nr2 e. 2.2 Prodej bytů Zkoumání vztahů mezi jednotlivými nezávisle proměnnými začneme u kontingenčních tabulek a korelační matice. Výsledné vztahy odvozené z kontingenčních tabulek a korelační 28
KAPITOLA 2. METODA NEJMENŠÍCH ČTVERCŮ Poté bude následovat samotný odhad parametrů β metodou nejmenších čtverců. matice jsou společné všem odhadům, proto se tato část v dalších kapitolách nebude opakovat. Kontingenční tabulky V Příloze A, tabulka A.1, se nacházejí kontingenční tabulky příslušné datovému souboru. Opět se podíváme, které nezávisle proměnné spolu nějakým způsobem souvisí, popř. zda nám kontingenční tabulky odhalí nějaký vztah přímo mezi danými hodnotami nezávisle proměnných. ZačněmePočtempokojůvbytě.VprvnítabulcevidímePočetpokojůvbytěvzávislosti na Typu vlastnictví. Lze vyčíst, že většina čtyřpokojových bytů je v družstevním vlastnictví, což jsou převážně panelové bytové domy. Dále si můžeme všimnout, že byty s kuchyňským koutem jsou doménou osobního vlastnictví, což je odrazem současného trendu. Po prolistování realitních novin narazíte na mnoho bytů v osobním vlastnictví (speciálně pak u novostaveb), kde je tato varianta kuchyně zvolena pro větší prostornost a propojenost kuchyně se zbylou částí bytu. UsrovnáníPočtupokojůvbytěaTypuzdivanarazímenastejnýtrend.Bytyskuchyňským koutem jsou téměř výhradně u osobního vlastnictví, potažmo novostaveb, budou tedy spíše v cihlových bytových domech. Tento fakt nám shrnuje další tabulka, která poukazuje na souvislost mezi Typem vlastnictvím a Typem zdiva. Nepřekvapí nás zřejmě ani výsledek tabulky zkoumající vztah mezi Typem vlastnictví a Celkovým stavem bytu. Z tabulky totiž vyplývá, že přes 80% bytů v osobním vlastnictví jsou novostavby. Zároveň tabulka naznačuje, že většina družstevních bytů je ve velmi dobrém stavu. Na to zde poukazujeme kvůli další tabulce zobrazující vztah mezi Typem zdivaacelkovýmstavembytu,kterábytyvevelmidobrémstavudávádovztahuspanelovým zdivem a novostavby pak s cihlou. Stav bytů v panelových domech je pokládán převážně za velmi dobrý. Několik dalších tabulek sledujících souvislosti spojené s Balkonem naznačuje, že balkony se nacházejí ve větší míře v cihlových domech, tedy i v osobním vlastnictví. Podobný výsledek, jen v menším zastoupení v datovém souboru, naznačují další tabulky spojené s Terasou. Oproti tomu tabulky věnující se Lodžii ukazují, že Lodžie se téměř výhradně vyskytují u bytů v panelových domech. Další tabulky se věnují Sklepu. Pokud se podíváme na souvislost mezi Sklepem a Lodžií, zjístíme, že velmi pravděpodobně se obě položky vyskytují pohromadě nebo k bytu nenáležíanijednaznich. Další tabulky přejdeme bez komentáře. Nenaznačují žádné přímé vztahy, příp. kvůli četnosti dané proměnné je sporné o nějakém vztahu mezi proměnnými mluvit. 29
KAPITOLA 2. METODA NEJMENŠÍCH ČTVERCŮ Korelační matice Pokusme se nyní odhalit vzájemný vztah, ať už pozitivní či negativní, jednotlivých nezávisle proměnných. Náhlednutím do korelační matice regresního modelu(viz Příloha A, tabulka A.2) uvidíme hned v druhém sloupci pozitivní souvislost mezi Počtem pokojů vbytěapodlahovouplochoubytu.tentofaktvycházíopětzlogikyvěci,neboťvětší množství pokojů znamená větší počet metrů čtverečních. Další proměnné, které spolu souvisí, ale jejichž souvislost se neprojevuje tak markantním způsobem, jsou Typ zdiva a Celkový stav bytu a dále Podlahová plocha bytu aterasa. Spojitost mezi Typem zdiva a Celkovým stavem bytu je více méně zřejmá. Pokud vezmemevúvahunapř.novostavby,pakprávětysestavíjižpřevážnězcihel.oproti tomu starší bytové domy se stavěly převážně z panelu. Pokud půjdeme ještě dál do historie, dostaneme se zpět k cihlám. VztahPodlahovéplochybytuaTerasymůžebýtspojenaisfaktem,žedatajsou zadávána nejednotně. Z některých záznamů tedy nelze poznat, zda je terasa započítána doplochybytučine. 2.2.1 Odhad parametrů β metodou nejmenších čtverců Začneme odhadem parametrů β metodou nejmenších čtverců(viz tabulka 2.1). Kvalitu modelu a shodu se zkoumanými daty posoudíme dle korigovaného koeficientu determinace R 2.Dáleprovedemeněkoliktestů,zdajetentolineárníregresnímodelodhadnutkorektně, tzn. provedeme testy indikující heteroskedasticitu v lineárním regresním modelu, dále prozkoumáme, zda je v modelu multikolinearita. Pokud je model odhadnut korektně, budeme se věnovat samotným parametrům β. Je na místě upozornit, že nulové hodnoty ve sloupci p-value nejsou reálně nulové, nicméně jsou tak malé, že jejich skutečnou velikost tabulka nepostihuje. Koeficient determinace Protentomodelmákoeficientdeterminacehodnotu R 2 =0,712(vizPříloha A,tabulka A.3). RESET test Spočtená F-statistika pro lineární regresní model(viz Příloha A, tabulka A.4) nabývá hodnoty F = 8, 538, je tedy statisticky významná a daný model je chybně specifikovaný. 30
KAPITOLA 2. METODA NEJMENŠÍCH ČTVERCŮ Coefficient Std. Error t-ratio p-value const 2.58197e+006 391582. 6.5937 0.0000 m2 27676.4 2806.81 9.8605 0.0000 Pokoj 10187.5 78301.7 0.1301 0.8966 Vlastnictvi 679306. 101901. 6.6663 0.0000 Zdivo 81851.9 124621. 0.6568 0.5118 Stav 143641. 55338.3 2.5957 0.0099 Balkon 16853.9 80087.0 0.2104 0.8335 Terasa 150141. 99356.4 1.5111 0.1318 Lodzie 89600.9 121139. 0.7397 0.4601 Sklep 594300. 79248.4 7.4992 0.0000 Garaz 162045. 161752. 1.0018 0.3172 Parking 27642.6 129075. 0.2142 0.8306 Vybaveni 105155. 35612.3 2.9528 0.0034 Patro 103868. 19989.4 5.1961 0.0000 MHD 105554. 53178.7 1.9849 0.0481 Tabulka 2.1: Odhad metodou OLS pro prodej bytů Multikolinearita Jelikož pouze hodnoty vyšší než 10(viz Příloha A, tabulka A.5) by ukazovaly na problém v tomto modelu, test multikolinearitu neprokázal. Whiteův test Výsledky Whiteova testu(viz Příloha A, tabulka A.6) nás vedou k závěru, že nulovou hypotézu o homoskedasticitě musíme zamítnout. Whiteův test tedy poukazuje na heteroskedasticitu v modelu. Breusch-Paganův test Stejně tak Breusch-Paganův(viz Příloha A, tabulka A.7) test vede k zamítnutí nulové hypotézy o homoskedasticitě. Nedostatkem tohoto modelu, který identifikovaly oba předchozí testy, je heteroskedasticita. Je tedy nutné aplikovat na tento model jinou metodu odhadu parametrů. Touto metodou bude vážená metoda nejmenších čtverců. 31
KAPITOLA 2. METODA NEJMENŠÍCH ČTVERCŮ 2.2.2 Odhad parametrů β váženou metodou nejmenších čtverců Model postižený heteroskedasticitou můžeme odhadnout váženou metodou nejmenších čtverců, která nám dává nestranné a vydatné odhady parametrů. Odhadová funkce bude mít narozdíl od klasické metody nejmenších čtverců tvar ˆβ WLS =(X Σ 1 X) 1 X Σ 1 y, kde Σ je diagonální matice, jejíž prvky jsou převrácené hodnoty původních rozptylů. Pokudneznámerozptyly σt 2,můžemezvolitváhysubjektivně.Najejichvolběvšak závisí kvalita získaných odhadů. Vtomtopřípaděbylyjakováhyzvolenypřevrácenéhodnotyreziduí 6 vabsolutníhodnotě. Odhad parametrů β váženou metodou nejmenších čtverců zobrazuje tabulka 2.2. Coefficient Std. Error t-ratio p-value const 2.55083e+006 158702. 16.0731 0.0000 m2 26092.5 1400.69 18.6284 0.0000 Pokoj 17573.1 33553.9 0.5237 0.6009 Vlastnictvi 680975. 44992.3 15.1354 0.0000 Zdivo 103178. 50759.7 2.0327 0.0430 Stav 145789. 30528.5 4.7755 0.0000 Balkon 33781.3 35782.6 0.9441 0.3459 Terasa 118324. 34684.3 3.4114 0.0007 Lodzie 62131.1 53695.6 1.1571 0.2481 Sklep 619951. 32750.3 18.9296 0.0000 Garaz 228096. 99244.0 2.2983 0.0222 Parking 28349.6 39576.0 0.7163 0.4743 Vybaveni 94585.9 16465.4 5.7445 0.0000 Patro 99387.6 9807.78 10.1336 0.0000 MHD 119063. 25726.5 4.6280 0.0000 Tabulka 2.2: Odhad metodou WLS pro prodej bytů Odhadem, který byl proveden pomocí vážené metody nejmenších čtverců, jsme vyřešiliproblémheteroskedasticity.korigovanýkoeficientdeterminaceje R 2 =0,953,má tedy hodnotu velmi blízkou jedné. Můžeme přistoupit k hodnocení samotného odhadu lineárního regresního modelu. 6 Reziduabylazískánazodhaduparamatru βzkoumanéhomodelumetodounejmenšíchčtverců. 32
KAPITOLA 2. METODA NEJMENŠÍCH ČTVERCŮ Prozačáteksezaměřmena t-statistiku.tanámurčí,kteráazdavůbecnějakáznezávisle proměnných je pro daný model statisticky významná. Jakostatistickyvýznamné 7 sevmodelujevínezávisleproměnnépodlahováplocha bytu, Typ vlastnictví, Typ zdiva, Celkový stav bytu, přítomnost Terasy, Sklepa, Garáže, stejně jako Vybavení bytu, Umístění bytu v domě a Dostupnost městské hromadné dopravy. Z těchto nezávisle proměnných budeme vycházet při vytváření druhého, zúženého modelu. Pokud se podíváme blíže, nejvíce signifikantní jsou nezávisle proměnné Podlahová plocha bytu, Typ vlastnictví, Sklep a Umístění bytu v domě. Už teď tedy můžeme odhadnout podobu zúženého modelu, kterému se ale budeme věnovat později. Nyní se zaměřme na odhad parametrů β. Začněme skupinou základních vlastností bytu.jezřejmé,žepodlahováplochabytubudemítkladnývlivnacenubytu.jeden m 2 obytné plochy je takto modelem oceněn hodnotou 26 092 Kč. Následující obrázek 2.1 ilustruje vztah mezi Podlahovou plochou bytu a cenou bytu, resp. skutečnou a predikovanou cenou bytu dle daného lineárního regresního modelu. 8e+006 7e+006 fitted actual Actual and fitted Cena versus m2 6e+006 5e+006 Cena 4e+006 3e+006 2e+006 1e+006 0 20 40 60 80 100 120 140 160 180 200 m2 Obrázek 2.1: Skutečná vs. predikovaná cena bytu ve vztahu k Podlahové ploše bytu 7 t-statistikatěchtoproměnnýchpřizvolenéhladiněvýznamnosti α=0,05jevabsolutníhodnotě většínežkritickáhodnota,tedy t > t crit. 33
KAPITOLA 2. METODA NEJMENŠÍCH ČTVERCŮ Kladnývlivnacenu 8 seprojevujeiupočtupokojůvbytě.statistickounevýznamnosttétoproměnnélzevysvětlittak,ževdnešnídoběsedlenabídkynatrhubytůvíce staví a prodávají byty s nižším počtem pokojů, jedná se především o tzv. startovací byty vyhledávané mladými páry a rodinami. Vícepokojové byty mají spíše podobu luxusních bytů, proto je jejich počet na trhu značně omezen. Tento efekt je kompenzován výstavbou rodinných domů, u kterých je přítomnost 3 a více pokojů běžnou záležitostí. Zároveň u prostorných bytů s menším počtem pokojů jsou možné dodatečné stavební úpravy. StejnějakoPodlahováplochabytumákladnývlivnacenuiUmístěníbytuvdomě, tj.patro,vekterémsebytnachází.tentofaktorsedocenypromítáčástkou99387kč. Tato skutečnost je snadno zdůvodnitelná, neboť málo kdo je spokojen s bydlením v přízemí.kroměhlukuavětšíhoprovozuzaoknyjetotižnutnépočítatisbezpečnostní stránkou polohy bytu. U bytů situovaných do nižších pater je nutné počítat s větší mírourizikanežjetomuubytůvevyššíchpatrech.jdenapř.omožnouhrozbuvloupání do bytu či možnost vytopení. Rovněž je nutné počítat s nepohodlím, jehož zdrojem může být např. hluk způsobený sousedy obývajícími byt o patro výše. Nyní se podívejme na další trojici nezávislých proměnných, a to na Typ vlastnictví bytu, Typ zdiva a Celkový stav bytu. Jak je uvedeno výše, vlastnictví existuje osobní, družstevní nebo nájemní. Pokud bereme v úvahu předem definovanou škálu Typu vlastnictví, pak každý posun na vyšší úroveň vlastnictví zvyšuje cenu bytu velmi výrazně, konkrétněo680975kč. Překvapivě mohou na druhou stranu působit výsledky ohledně Typu zdiva. Tento faktor se ukázal statisticky nevýznamný. Každá úroveň(tj. panel, cihla) cenu zvyšuje o103178kč.tentovýsledekjezajímavýpředevšímztohodůvodu,žebydlenívpanelovém domě přináší mnohem více záporů než bydlení v cihlovém domě. Celkový stav bytu je statisticky významná nezávisle proměnná, jejíž každá úroveň navyšuje cenu o 145 789 Kč. Tento ukazatel je ale jednoznačný pouze u novostaveb, kde je snadné stav bytu posoudit. U dalších bytů je tato proměnná závislá na profesionálním odhadu makléře. Další skupinou nezávisle proměnných jsou náležitosti bytu, tedy Balkon, Terasa, Lodžie, Sklep, Garáž, Parkovací místo a Vybavení bytu. Všechny tyto proměnné(kromě Vybavení bytu) nabývají pouze hodnot 0 a 1. Pouze jejich přítomnost tedy ovlivňuje cenu. Začněme s Balkonem. Ten nepatří mezi statisticky významné ukazatele, jeho existence navýší cenu pouze o 33 781 Kč. Terasa cenu snižuje o118324kč,přítomnostlodžiecenuopětsnižuje,tentokrátohodnotu62131kč. Sklep je statisticky významná nezávisle proměnná, která cenu bytu zvyšuje o nezane- 8 Tentoukazatelseneprojevujejakostatistickyvýznamnýajetomutakiudopadunacenu.Každý dalšípokojzvýšícenubytujen17573kč. 34
KAPITOLA 2. METODA NEJMENŠÍCH ČTVERCŮ dbatelných 619 951 Kč. Sklep je překvapivě žádaná složka bytu, pokud tak můžeme soudit z t-statistiky a přírůstku ceny. Mezi další nezávisle proměnné patří Garáž a Parkovací místo. Obě proměnné ovlivňují cenunegativně.garážsnižujecenubytuo228096kč,parkovacímístoo28349kč. Parkovací místo postihuje cenu méně, můžeme tedy říct, že Parkovací místo je žádanější. Garáže jsou však spíše součástí novějších bytových domů nebo jsou umístěny zvlášť, mimo dům. Význam této proměnné je tedy sporný. Odpovídá tomu i hodnota t-statistiky. Poslední proměnnou ze skupiny náležitostí bytu je Vybavení bytu. Hodnocení této proměnné je uvedeno výše. Tato statisticky významná nezávisle proměnná zvyšuje při každém navýšeníhodnotyojedenbodcenubytuo94585kč.tojepochopitelné,neboťvtéto proměnné jsou zahrnuta plastová okna, zateplení bytového domu, nová kuchyňská linka apod. Poslední nezávisle proměnnou v tomto modelu je Dostupnost městské hromadné dopravy. Tato proměnná se projevila jako statisticky významná, ale s negativním dopadem nacenubytu,atohodnotou119063kč.negativnívlivnacenubytumůžebýtzpůsoben především současným trendem v bydlení. Lidé se stěhují za prací do větších měst, žádané je však bydlení v okrajových částech měst, které poskytuje dostatečný komfort, především klid a pohodlí. V těchto podmínkách převládá doprava osobními automobily. Cena bytu tak s větší dostupností městské hromadné dopravy klesá. 2.2.3 Zúžený regresní model Vyjděme z tabulky 2.2 a vytvořme zúžený lineární regresní model ceny bytu pro prodej. Jak je napsáno výše, závisle proměnná je stále cena bytu, nezávisle proměnnými jsou Podlahová plocha bytu, Typ vlastnictví, Typ zdiva, Celkový stav bytu, Terasa, Sklep, Garáž, Vybavení bytu, Umístění bytu v domě a Dostupnost městské hromadné dopravy. Odhad parametrů β vytvoříme opět váženou metodou nejmenších čtverců, abychom se tak vyhnuli heteroskedasticitě. Při výběru vah budeme postupovat obdobně jako u lineárního regresního modelu, z nějž vycházíme. Výsledky jsou uvedeny v následující tabulce. V tomto zúženém modelu jsou již všechny nezávisle proměnné statisticky významné. Zároveň, pokud se podíváme na jednotlivé hodnoty koeficientů daných příslušným nezávisle proměnným a srovnáme je s jejich předchozími ekvivalenty, zjistíme, že šlo spíše o kosmetické úpravy. 35
KAPITOLA 2. METODA NEJMENŠÍCH ČTVERCŮ Coefficient Std. Error t-ratio p-value const 2.60023e+006 182937. 14.2138 0.0000 m2 26824.9 548.349 48.9194 0.0000 Vlastnictvi 689017. 52429.3 13.1418 0.0000 Zdivo 115218. 49549.9 2.3253 0.0207 Stav 146996. 31146.3 4.7196 0.0000 Terasa 124365. 31329.7 3.9696 0.0001 Sklep 616922. 36941.8 16.6998 0.0000 Garaz 222331. 96559.1 2.3025 0.0220 Vybaveni 89643.6 17964.0 4.9902 0.0000 Patro 94493.1 9391.73 10.0613 0.0000 MHD 113704. 24727.3 4.5983 0.0000 Tabulka 2.3: Odhad metodou WLS pro prodej bytů, zúžený model 2.3 Pronájem bytů Nejdříve si projdeme kontingenční tabulky a korelační matici popisující vztahy mezi jednotlivými nezávisle proměnnými. Tyto výsledky budou opět společné pro všechny kapitoly. Kontingenční tabulky Příloha B, tabulka B.1, obsahuje kontingenční tabulky daného regresního modelu. První tabulka vyjadřující vztah mezi Počtem pokojů v bytě a Typem vlastnictví nám opět potvrdí, že byty s kuchyňským koutem jsou spíše doménou osobního vlastnictví. Tyto byty jsou zároveň v cihlových bytových domech. Několik následujících tabulek zcela jasně naznačuje vztah Typu zdiva a Typu vlastnictví. Další zřejmou slutečnost odhalí tabulka věnující se vztahu mezi Typem vlastnictví a Garáží. Tabulka ukazuje, že v daném datovém souboru garáž není obvyklý doplněk bytu. Stejný výsledek opět nabízí srovnání Typu zdiva a Garáže. Pokud půjdeme ještě dál, pak zjistíme, že v případě pronájmu bytů se garáže nacházejí spíše u novostaveb. Následující tabulky se věnují Dostupnosti městské hromadné dopravy. Je patrné, že dostupnost je většinou větší u bytů v osobním vlastnictví, tedy u cihlových bytových domů. V souvislosti s dostupností městské hromadné dopravy není nijak překvapující fakt, že se u bytů, které se nacházejí nejblíže městské hromadné dopravě, nevyskytuje mnoho míst k parkování. S tímto problémem ostatně bojuje každé větší město v České republice. Další tabulky přejdeme bez komentáře, neboť nenaznačují žádné přímé vztahy, pří- 36
KAPITOLA 2. METODA NEJMENŠÍCH ČTVERCŮ padně kvůli četnosti dané nezávislé proměnné je sporné o nějakém vztahu mezi proměnnými mluvit. Korelační matice Korelační matice příslušející danému regresnímu modelu, kterou nalezneme v Příloze B, tabulka B.2, nám ukáže, zda některé nezávisle proměnné mezi sebou nějakým způsobem korelují. Opět, stejně jako u lineárního regresního modelu pro prodej bytů, vidíme pozitivní závislost mezi Podlahovou plochou bytu a Počtem pokojů v bytě. Můžeme konstatovat, že tento fakt je očekávatelný, neboť větší počet pokojů pravděpodobně znamená větší podlahovou plochu a naopak. Další korelace je zřejmá mezi Podlahovou plochou bytu a Terasou. I tady se může jednat pouze o chybu způsobenou nejednotným stylem zadávání Podlahové plochy bytu do systému Intrapoint. 2.3.1 Odhad parametrů β metodou nejmenších čtverců Lineární regresní model pro cenu pronájmu bytů odhadneme metodou nejmenších čtverců. Následně spočítáme korigovaný koeficient determinace, provedeme RESET test a test multikolinearity, Whiteův a Breusch-Paganův test heteroskedasticity, které nám řeknou, zda je v modelu přítomná heteroskedasticita. Pokud tyto testy ukáží, že byl daný model odhadnut správným způsobem, přejdeme k analýze získaných výsledků. Koeficient determinace Protentomodelmákorigovanýkoeficientdeterminacehodnotu R 2 =0,556(vizPříloha B, tabulka B.3). RESET test Pro lineární regresní model zkoumající závislost ceny pronájmu bytu na nezávisle proměnnýchmá F-statistikahodnotu F =80,803(vizPříloha B,tabulka B.4).Lzetedy přijmout hypotézu, že výchozí model je chybně specifikovaný. Multikolinearita Test v případě lineárního regresního modelu pro cenu pronájmu bytu multikolinearitu neukázal(viz Příloha B, tabulka B.5). 37