Masarykova univerzita Přírodovědecká fakulta Studijní obor: Matematika - Ekonomie EKONOMETRICKÝ MODEL DETERMINANT CEN NEMOVITOSTÍ V HRADCI KRÁLOVÉ Econometric Model of Home Prices in Hradec Králové Diplomová práce Vedoucí diplomové práce: Ing. Michal Kvasnička, Ph.D. Autor: Lenka Pešková Brno, květen 2011 1
Jméno a příjmení autora: Lenka Pešková Název bakalářské práce: Ekonometrický model determinant cen nemovitostí v Hradci Králové Název práce v angličtině: Econometric model of home prices in Hradec Králové Ústav: matematiky a statistiky Vedoucí bakalářské práce: Ing. Michal Kvasnička, Ph.D. Rok obhajoby: 2011 Anotace Předmětem diplomové práce Ekonometrický model determinant cen nemovitostí v Hradci Králové je vytvoření ekonometrického modelu na základě reálných dat z prodejů nemovitostí. První část práce definuje proměnné, které budou použity pro regresi, a také zkoumá vztahy mezi nimi na základě kontingenčních tabulek a korelační matice. Druhá část práce se věnuje sestavení modelu, transformaci proměnných, interpretaci konečného modelu a sestavení cenové mapy. Annotation The goal of the thesis Econometric Model of Home Prices in Hradec Králové is to create econometric model on the basis of real data of sales prices from retailing estates. The first part defines variables, which will be used for regression and explores relations between them on the basis of contingent tables and correlation matrix. The second part attends to creation of model, transformation of variables, interpret of final model and creation of price map. Klíčová slova nemovitosti, Hradec Králové, ekonometrie, lineární regresní model, cenová mapa Keywords real estate, Hradec Králové, econometrics, linear regression model, price map
Prohlášení Prohlašuji, že jsem diplomovou práci Ekonometrický model determinant cen nemovitostí v Hradci Králové vypracovala samostatně pod vedením Ing. Michala Kvasničky, Ph.D. a uvedla v ní všechny použité literární a jiné odborné zdroje v souladu s právními předpisy, vnitřními předpisy Masarykovy univerzity a vnitřními akty řízení Masarykovy univerzity a Přírodovědecké fakulty MU. V Brně dne 1. května 2011 vlastnoruční podpis autora
Poděkování Na tomto místě bych ráda poděkovala Ing. Michalu Kvasničkovi, Ph.D. za cenné připomínky a odborné rady, kterými přispěl k vypracování této diplomové práce.
Obsah Úvod... 7 1. Datový soubor a proměnné... 9 1.1. Proměnné... 10 Plocha bytu... 10 Počet pokojů + Kuchyně... 12 Patro... 13 Výtah... 15 Zdivo... 15 Balkon, Lodžie, Terasa (B/L/T)... 16 Sklep, Komora... 17 Vlastnictví bytu... 17 Stav bytu... 19 Stav domu... 21 Dostupnost do centra... 22 1.2. Kontingenční tabulky... 25 1.3. Korelační matice... 30 2. Modely... 32 2.1. Model I... 34 2.2. Model II... 37 2.3. Model III... 40 2.4. Model IV... 42 2.5. Model V... 45 2.6. Model VI... 49 5
2.7. Model VII... 52 Interpretace modelu... 55 Theilův koeficient beta... 58 Typové byty... 59 Cenová mapa... 59 Závěr... 63 Seznam použité literatury... 65 Seznam tabulek... 67 Seznam grafů... 68 Seznam obrázků... 68 Přílohy... ii 6
Úvod Nákup nemovitosti je zásadní událostí v životě jednotlivce (či rodiny), protože výrazným způsobem (vzhledem k obvyklé splatnosti hypoték okolo 25 let) ovlivňuje většinu produktivního života. V současné době je na trhu nemovitostí převis nabídky nad poptávkou a také ceny zaznamenaly výrazný pokles. Nicméně i tak není jednoduché najít byt, který splňuje nejen finanční, ale i prostorové, dispoziční a jiné požadavky zájemce. Počet realitních kanceláří (RK) na trhu je poměrně velký podle [4] působilo v roce 2010 na realitním trhu 18838 RK. Ani při takto vysokém počtu firem zabývajících se prodejem (a pronájmem) nemovitostí není k dispozici studia, která by odpovídala na otázku: Které veličiny ovlivňují cenu bytu? Cílem práce je nalezení a vysvětlení vlivu různých veličin na cenu nemovitostí (bytů) v Hradci Králové. Jak již bylo řečeno, studie na toto téma se u nás nevyskytují a informace dostupné např. na internetu nejsou přímo podloženy žádnými daty. Jedná se často o hypotézy makléřů jednotlivých RK, kteří vycházejí pouze ze svých zkušeností a nemají potřebné znalosti pro vytvoření formálního modelu. Práce bude zpracovávána na základě základní ekonometrické metody, metody nejmenších čtverců. Tato metoda přináší výsledky, které se dají velmi jednoduše interpretovat a tak jsou srozumitelné i pro osobu nepříliš zběhlou v ekonometrii. Data získaná z realitní kanceláře 4Real s.r.o. budou upravena do datového souboru, který bude dále zpracováván v softwaru Gretl a STATISTICA. 7
V první části práce budou definovány proměnné, které mají potenciál ovlivňovat cenu bytu. Tyto proměnné budou detailně popsány, budou jim přiřazeny hodnoty, které budou v modelu zastupovat jednotlivé varianty proměnných, a také bude uvedeno procentuální zastoupení těchto variant v datovém souboru. Na základě datového souboru bude poté provedena prvotní analýza pomocí kontingenčních tabulek a korelační matice. Kontingenční tabulky mohou nalézt některé skryté souvislosti, případně potvrdí obecně známá tvrzení. Korelační matice ještě dále prohloubí a upřesní vazby mezi proměnnými zjištěné v kontingenčních tabulkách. Druhá část práce se bude věnovat tvorbě ekonometrického modelu a jeho odladění tak, aby splňoval všechny nutné předpoklady a mohl být použit pro vysvětlení ceny nemovitosti. Po dosažení konečného modelu bude tento model interpretován a na jeho základě bude sestavena cenová mapa Hradce Králové, která odhalí rozdíly mezi jednotlivými částmi města. 8
1. Datový soubor a proměnné Datový soubor se skládá ze 74 případů a je uveden v Příloze A. Jedná se o byty prodané realitní kanceláří 4Real za rok 2010. Data byla přebrána přímo z interního systému realitní kanceláře (RK), jedná se tedy o prodejní, nikoliv nabídkové ceny bytů. RK 4Real je středně velká realitní kancelář působící v královéhradeckém a pardubickém kraji. Jejím zájmem tedy nejsou pouze byty v Hradci Králové, ale i nemovitosti mimo toto město. V systému RK je každý byt označen specifickým označením, v datovém souboru bylo toto označení nahrazeno čísly 1 74, aby bylo možno datový soubor zveřejnit. Není zde samozřejmě zahrnut celý trh s nemovitostmi v Hradci Králové. Nicméně po prostudování nabídek nemovitostí na realitních serverech (Sreality.cz, Nemovitosti.cz, Netrealit.cz) lze říci, že v souboru jsou zahrnuty všechny hlavní lokality, kde se byty prodávají. Není ovšem pokryto celé území Hradce Králové, protože v některých lokalitách se bytové domy nenacházejí (např. velká část Nového Hradce Králové) a v některých lokalitách dochází k prodeji bytů zřídka (Hradec Králové - Březhrad). Dalším specifikem datového souboru je zahrnutí pouze bytů ve starší zástavbě. Počet bytů v novostavbách je na trhu v Hradci Králové velmi malý. V loňském roce nebyl danou RK prodán žádný byt v novostavbě a dá se také říci, že RK se specializuje na byty ve starší zástavbě. Neméně důležité je říci, že panelové byty v datovém souboru mají minimálně 9 pater (maximálně 12) a cihlové domy mají maximálně (a také v drtivé většině) 4 patra. Toto je nutné vzít v úvahu při aplikaci modelu, který bude odhadnut. 9
1.1. Proměnné Výběr proměnných do modelu probíhal pomocí informací dostupných v interním systému RK. Pro výběr regresorů byly použity pouze informace, které objektivně ovlivňují cenu bytu a nejsou zatíženy subjektivním pocitem zájemce. Je třeba zmínit, že informace dostupné v databázi realitní kanceláře jsou podrobné, ale některé, pro zájemce zcela zásadní, skutečnosti se projeví pouze při prohlídce daného bytu. Plocha bytu Plocha bytu má zcela zásadní význam pro cenu bytu. V informacích o bytu se většinou uvádí podlahová a užitná plocha bytu. Podle zákona č. 72/1994 Sb., o vlastnictví bytů (ZoVB) 2 písmeno i) je podlahová plocha definována jako plocha všech místností, včetně místností, které tvoří příslušenství bytu (koupelna, WC). Vyhláška č. 85/197 2 odstavec 1 definuje užitkovou (užitnou) plochu jako plochu všech místností včetně místností vedlejších a sklepů. Užitná plocha zahrnuje také plochu případné balkonu, lodžie nebo terasy. V modelu je použita pouze podlahová plocha bytu, protože případný benefit další plochy je uveden v samostatné proměnné (B/L/T). Následující histogram (Graf 1) ukazuje, že v daném datovém souboru jsou nejvíce zastoupeny byty rozloze mezi 60 75 m 2, takových bytů je 20, o něco méně je bytů o rozloze 45-60 m 2 (19 bytů). Stejnou měrou jsou zastoupeny byty o rozloze 30 45 m 2 a 75 90 m 2 (těch je v každé kategorii 14), výrazně méně je bytů o rozloze 90 105 m 2 (5 bytů) a nejméně je bytů o rozloze 120 135 m 2 (2 byty). V grafu 2 je znázorněn izolovaný vztah mezi cenou bytu a jeho plochou. 10
22 Histogram z Plocha 20 18 16 Počet pozorování 14 12 10 8 6 4 2 0 30 45 60 75 90 105 120 135 Plocha Graf 1: Histogram - Plocha 4E6 Bodový graf z cena proti plocha 3,5E6 3E6 Cena 2,5E6 2E6 1,5E6 1E6 5E5 20 40 60 80 100 120 140 Plocha Graf 2: Cena Plocha 11
Počet pokojů + Kuchyně Počet pokojů je další důležitou proměnnou. V nabídkách RK jsou byty označeny klasickým značením 1+kk, 2+1 atd. Pro potřeby modelu bylo zvoleno přiřazení hodnot k bytům dle počtu pokojů (bez kuchyně). Odděleně je posuzována přítomnost kuchyně, pro kterou je zavedena samostatná proměnná Kuchyně. Tato proměnná nabývá hodnoty 0, jestliže je v bytě pouze kuchyňský kout (kk), nebo 1, jestliže je v bytě samostatná místnost pro kuchyň. V tabulce 1 jsou obsaženy počty bytů v jednotlivých kategoriích a také jejich procentuální zastoupení. Je vidět, že 50 % bytů je typu 3+1. Dne 31. 3. 2011 bylo realitním serverem Reality.cz nabízeno k prodeji 267 bytů v Hradci Králové a z toho bylo 81 bytů typu 3+1, tj. přibližně 30 %. Na serveru Sreality.cz bylo dne 31. 3. 2010 nabízeno 813 bytů a z toho 231 bytů typu 3+1, tj. přibližně 28,5 %. V daném vzorku je tedy zastoupení bytů typu 3+1 výrazně nadprůměrné. Počet pokojů Počet bytů % 1 6 8 1+1 7 9 2+kk 3 4 2+1 17 23 3+kk 1 1 3+1 37 50 4+kk 2 3 4+1 1 1 Tabulka 1: Zastoupení bytů dle charakteristiky RK Počet pokojů Počet bytů % 1 14 19 2 20 27 3 37 50 4 3 4 Tabulka 2: Počet pokojů 12
Z tabulky 3 je jasně vidět, že většina bytů má samostatnou kuchyň. Toto může být dáno tím, že dříve nebylo zvykem mít kuchyň propojenou s jinou obytnou místností. Typ kuchyně Hodnota Počet bytů % Kuchyňský kout (kk) 0 12 16 Samostatná kuchyně 1 62 84 Tabulka 3: Kuchyně V datech poskytnutých RK se nenachází žádný byty typu x+0, tedy byt, kde je kuchyňský kout přímo integrován do jednoho z pokojů. Dále se zde nenachází byty větší než 4+1, tyto byty v nabídce některých RK jsou, ale je jich velmi málo. Sreality.cz jich dne 31. 3. 2011 nabízí 14 (z 813 bytů) a Reality.cz pouze 2 (z 267) takové byty. Patro Patro, ve kterém se byt v domě nachází, je dalším důležitým atributem. V této souvislosti se především hovoří o bytech v přízemí (zvýšeném přízemí, 1. patře - záleží na konstrukci domu) a o bytech v posledním patře a půdních bytech. Tyto byty jsou diskutovány pro některé negativní jevy, které je provázejí. U bytů, které jsou v domě nejníže, se často projevují problémy se špatnou vytopitelností bytu. Pod těmito byty jsou většinou nevytápěné sklepy, které ochlazují podlahy a tak snižují teplotu v bytě. Dalším problémem, zvláště u bytů v přízemí, může být jejich snadná dostupnost pro zloděje. Nicméně i tyto byty mají svůj velký klad a to je jejich dostupnost pro hůře pohyblivé osoby. Byty v posledním patře a především půdní byty se potýkají s vysokými teplotami v letním období. Vysoké venkovní teploty byt ohřívají často až nad únosnou míru. Problém u těchto bytů se také může projevit při poškození střechy domu, kdy dopad tohoto poškození pocítí 13
většinou pouze obyvatelé bytů pod střechou. Pro byty může být důležité také přímo patro, kde se nacházejí. Např. máme-li dům u rušné silnice, budou mít obyvatelé vyšších pater klidnější bydlení než obyvatelé nižších pater. Nicméně při případné poruše výtahu budou naopak zvýhodněni obyvatelé nižších pater. Z výše uvedených důvodů je proměnná patro rozdělena na 3 umělé (dummy) proměnné Patro1, Patro2 a Patro3. Patro1 nabývá hodnoty 1, je-li byt v přízemí, zvýšeném přízemí nebo v 1. patře a 0 jinak. Patro2 nabývá hodnoty 1, je-li byt v posledním patře a 0 jinak. Proměnná Patro3 byla vytvořena pro odlišení bytů v nižších a vyšších patrech. Jako referenční dům byl vybrán dům s nejvyšším počtem pater (tj. 12) a ten byl rozdělen na 2 poloviny. Patro3 tedy rozděluje byty do dvou kategorií podle patra, ve kterém se nacházejí. Byty od přízemí do 6. patra mají přiřazenu hodnotu 0 a byty ve vyšších patrech (7.- 12. patro) mají přiřazenu hodnotu 1. Z tabulky 4 je vidět, že 13 bytů (tj. 18 %) se nachází v přízemí (1. patře). Z tabulky 5 plyne, že bytů v posledním patře je 16, tj. 22 %. Je tedy možné říci, že bytů v posledním patře je ve vzorku nepatrně více. Také lze vypočítat, že bytů, které se nacházejí mezi krajními patry je 45, tj. 60 %. Přízemí/1.patro Hodnota Počet bytů % Ano 1 13 18 Ne 0 61 82 Tabulka 4: Patro1 byty v přízemí, nebo v 1. patře Poslední patro Hodnota Počet bytů % Ano 1 16 22 Ne 0 58 78 Tabulka 5: Patro2 byty v posledním patře 14
Z tabulky 6 je vidět, že ve vzorku výrazně převyšují byty do 6. patra (včetně), kterých je 60, tj. 81 %. Patro Hodnota Počet bytů % Přízemí 6 0 60 81 7 12 1 14 19 Tabulka 6: Patro3 rozdělení bytů podle patra, kde se nacházejí Výtah Podle vyhlášky 268/2009 Sb., 28 odstavec 2 musí být výtah v domě minimálně u bytů v úrovni pátého a vyššího podlaží (včetně podkroví). Toto nařízení platí pro novostavby, ale je možné vysledovat, že domy bez výtahu mají pouze 4 podlaží. Byt, který není dosažitelný výtahem, má zcela zřejmé nevýhody (abstrahujeme od bytů přízemních a bytů ve zvýšeném přízemí). Je hůře dostupný pro starší osoby a osoby s omezenou pohyblivostí. Nicméně i pro mladé a zdravé lidi může mít takový byt řadu nevýhod především při neexistenci kolárny (kočárkárny, sklepa) v domě. Proměnná výtah nabývá hodnot 0 nepřítomnost výtahu a 1 přítomnost výtahu. Z tabulky 7 je vidět, že ve zkoumaném vzorku mírně převyšují byty dostupné výtahem. Výtah Hodnota Počet % Ano 1 39 53 Ne 0 35 47 Tabulka 7: Výtah Zdivo Na stavbu bývají nejčastěji použity dva druhy zdiva cihly, panely. Ve zkoumaném vzorku mají cihlové domy maximálně 4 patra, vyšší domy jsou výhradně panelové. Panelové domy mají minimálně 6 pater, maximálně 13 pater. Cihlové a panelové domy jsou tedy výškově disjunktní. V poskytnutých datech se jiný typ zdiva nevyskytuje. Všeobecně je cihlový 15
dům považován za žádanější vzhledem výhodám oproti domu panelovému. Z tohoto důvodu bylo u této proměnné nastaveno toto ohodnocení: cihla 1, panel 0. Z následujícího grafu je patrné, že u sledovaného vzorku nepatrně převyšují panelové domy (55 %). Sreality.cz nabízejí ke dni 31. 3. 2011 282 panelových bytů (z celkových 813 nabízených bytů), tj. přibližně 33 %. Cihlových bytů je nabízeno 483, tj. přibližně 60 %. Zbytek bytů (tedy 48) má jiný typ zdiva (smíšený, montovaná konstrukce, dřevěná konstrukce). Server Netrealit.cz nabízí k prodeji 228 bytů a z toho 111 panelových, tj. 48 %, a 112 cihlových, tj. 49 %. Server Nemovitosti.cz nabízí celkem 147 bytů a z toho 51 panelových, tj. 35 %, a 83 cihlových, tj. 56 %. Vzhledem k tomu, že v datech se nevyskytují jiné typy zdiva než cihla a panel, je vzorek částečně vychýlený. Z těchto dat je vidět, že v inzerovaných nemovitostech převažují domy cihlové. Vyšší počet prodaných panelových bytů může být způsoben jejich nižší cenou. Tato hypotéza bude potvrzena nebo vyvrácena modelem. Typ zdiva Hodnota Počet % Cihla 1 33 45 Panel 0 41 55 Tabulka 8: Zdivo rozdělení bytů podle typu zdiva Balkon, Lodžie, Terasa (B/L/T) Balkon, lodžie, terasa je parametr, který je velmi příjemným a žádaným benefitem bytu. Lodžie se od balkonu liší svojí konstrukcí. Dle [12] se jedná o zastřešený prostor s postranními zdmi, který nevystupuje z obvodu budovy. Balkon naopak vystupuje z obvodu budovy a není zastřešený. U většiny bytových domů (panelových i cihlových) je dnes právě lodžie. Žádný z bytů ve vzorku nemá více než jeden tento prvek. Při přítomnosti je u proměnné hodnota 1, při nepřítomnosti hodnota 0. Ve vzorku výrazně převyšují byty s tímto prvkem, více než 2/3 bytů mají balkon, lodžii, nebo terasu. 16
B/L/T Hodnota Počet % Ano 1 56 76 Ne 0 18 24 Tabulka 9: B/L/T přítomnost balkonu, lodžie, nebo terasy Sklep, Komora Jedním z údajů uváděných v nabídkách bytů je i existence sklepa, nebo komory. Většina domů má v přízemí, nebo v 1. podzemním podlaží sklepy, příp. sklepní kóje. Novější domy mívají místo sklepů komoru, která bývá na stejném patře jako byt. Existence takového prostoru je velmi příjemným benefitem, protože se jedná o plochu navíc, kam lze umístit v danou chvíli nepotřebné (např. sezónní) věci a tak uvolnit místo v bytě. Z následující tabulky je vidět, že většina bytů má sklep, či komoru. Sklep/komora Hodnota Počet % Ano 1 70 95 Ne 0 4 5 Tabulka 10: Sklep/komora Vlastnictví bytu V současnosti je možné se setkat se dvěma, resp. třemi, typy vlastnictví. Jedná se o družstevní (DB), nebo osobní vlastnictví (OV), přičemž byty v družstevním vlastnictví je možno ještě rozdělit na převoditelné a nepřevoditelné. Vzhledem k tomu, že typ vlastnictví ovlivňuje nejen cenu bytu, ale i možnost získání hypotéky, kterou je drtivá většina bytů dnes financována, budou v následujícím textu všechny typy vlastnictví představeny. Trendem poslední doby je nákup bytu v osobním vlastnictví, především jako investici do budoucna. Nakládání s bytem v osobním vlastnictví je velmi jednoduché. Vlastník může v bytě provádět jakékoliv úpravy (i pronajímat byt) prakticky bez omezení. Je ovšem nutné zmínit, že byt v osobním vlastnictví 17
je stále součástí domu a je nutné přispívat do tzv. fondu oprav, ze kterého jsou financovány opravy společných prostor domu (sklepy, schodiště) a také opravy vnějšího pláště domu (lodžie, fasáda). Správa bytového domu je zajišťována pomocí Společenství vlastníků jednotek (SVJ, obdoba družstva) a vlastník bytu v OV je povinen řídit se jeho rozhodnutími [17]. Při prodeji bytu v OV platí prodávající daň z nemovitosti, jejíž výše se určuje podle zákona č. 357/1992 Sb., o dani dědické, dani darovací a dani z převodu nemovitostí. V případě bytu v družstevním vlastnictví si zájemce nekupuje byt, ale pouze právo k užívání bytu (v katastru nemovitostí je jako majitel bytu uvedeno družstvo). Toto je jedna z hlavních nevýhod družstevního bytu, protože z tohoto důvodu nelze byt použít jako zástavu pro získání hypotečního úvěru. Financování družstevního bytu pomocí hypotečního úvěru je možné jedině se zástavou jiné nemovitosti. Za užívání bytu je družstvu, jako správci bytového domu, placen nájem (nižší než tržní nájem) a pomocí tohoto nájmu je postupně splácena tzv. anuita. Po splacení anuity může být družstevní byt převeden do osobního vlastnictví. O převodu bytu do osobního vlastnictví rozhoduje členská schůze družstva a je nutné, aby se pro možnost převodu vyslovili všichni členové. Na převod bytu při nesouhlasu členské schůze neexistuje právní nárok. Byty se splacenou anuitou, které mají umožněn převod do osobního vlastnictví, mohou být financovány tzv. předhypotečním úvěrem, který vyžaduje převod nemovitosti do OV v průběhu 1 roku. Družstevní byt, který je možné převést do OV, by tedy měl být na stejné cenové úrovni jako byt v OV [16]. Tato hypotéza bude testována později. Při převodu družstevního bytu do OV je placena darovací daň, která se nevztahuje na byt, ale pouze na poměrnou část pozemku patřícího k bytovému domu. Pozemek podléhá darovací dani, protože se (narozdíl od bytu) nejedná o darování ve smyslu 18
zákona č. 357/1992 Sb., o dani dědické, dani darovací a dani z převodu nemovitostí 6 odstavec 4 písmeno a). Tato proměnná byla pro účely modelu rozdělena do dvou umělých proměnných Vlastnictví1 a Vlastnictví2. Proměnná Vlastnictví1 nabývá hodnoty 1, je-li byt DB převoditelný a 0 jinak. Proměnná Vlastnictví2 nabývá hodnoty 1, je-li byt v OV a 0 jinak. Z tabulky 11 je vidět, že převyšují byty v OV a z družstevních bytů pak lehce převyšují byty převoditelné do OV. Vlastnictví Hodnota Vlastnictví1 Hodnota Vlastnictví2 Počet % DB nepřevoditelný 0 0 10 14 DB převoditelný 1 0 15 20 OV 0 1 49 66 Tabulka 11: Vlastnictví Stav bytu Neméně důležitou proměnnou je stav, ve kterém se byt nachází. Je-li byt výrazně levnější než podobné byty v lokalitě, je častou příčinou právě jeho stav. Nicméně v literatuře, která se zabývá determinanty ceny bytu, se vyskytují dva protichůdné názory. Prvním je, že rekonstruovaný byt je automaticky dražší, protože se projeví jeho výhody (popsané níže). Nicméně také se vyskytuje názor, že nezrekonstruované byty jsou vhodnější, protože budoucí majitel si je může zcela přizpůsobit svému vkusu. V následujícím textu budou krátce představeny oba názory. V nabídkách od RK se píše o bytech v původním, ale udržovaném stavu. Jedná se o byty, které neprošly žádnou rekonstrukcí, a tedy po jejich koupi bude potřeba tuto rekonstrukci provést. Náklady na nutnou rekonstrukci se promítají do nižší ceny bytu, ale je třeba vzít v potaz čas nutný pro provedení rekonstrukce. Většina zájemců o koupi bytu chce v novém bytě začít bydlet 19
v co nejkratším čase, což vylučuje často zdlouhavé shánění firem a řemeslníků [14]. Opačný názor prezentuje nezrekonstruovaný byt jako lepší variantu ke koupi. Hlavní výhodou takových bytů je možnost provést rekonstrukci přesně podle vlastního vkusu. Jedná se především o stavební úpravy v bytě (přesunutí příček), kuchyňskou linku a koupelnu. Tyto úpravy podléhají subjektivnímu vkusu a je tedy pravděpodobné, že nový majitel nebude mít stejný vkus jako původní majitel [10]. U rekonstrukcí jsou důležité především tyto části bytu: podlahy, bytová jádra (umakartová jádra se předělávají na zděná), elektroinstalace a okna. Okna jsou záležitostí, kterou je možno zahrnout i do proměnné, která se zabývá stavem domu, protože výměna oken často probíhá na celém domě současně. Nicméně není to pravidlem, a proto byla okna zařazena ke stavu bytu. Částečně zrekonstruované byty jsou zde definovány, jako byty, kde je provedena rekonstrukce alespoň dvou částí bytu (např. podlahy a okna). Celkově zrekonstruované byty jsou zde definovány jako byty, kde je provedena rekonstrukce všech důležitých částí bytu (tj. podlah, oken, bytového jádra i elektroinstalace). Proměnná stav bytu je rozdělena na 2 umělé proměnné. Stav bytu1 a Stav bytu2. Stav bytu1 nabývá hodnoty 1, jestliže je byt částečně zrekonstruován a 0 jinak. Stav bytu2 nabývá hodnoty 1, je-li byt zcela zrekonstruován a 0 jinak. Rekonstrukce Hodnota Stav bytu1 Hodnota Stav bytu2 Počet % Neproběhla 0 0 29 39 Částečná 1 0 21 28 Celková 0 1 24 32 Tabulka 12: Stav bytu rozdělení bytů podle typu rekonstrukce 20
Stav domu Další proměnnou je stav domu. Při koupi bytu je nutné také posoudit stav daného objektu, kde se byt nachází. Není-li dům v přijatelném stavu a rekonstrukce není plánována, klesá tím hodnota celého bytu. Může to být způsobeno např. špatným hospodařením družstva (SVJ). Proto je dobré si zjistit stav fondu oprav (lze odhadnout z výšky příspěvku do fondu oprav). Není-li ve fondu dostatek peněžních prostředků, rekonstrukce musí být financována prostřednictvím úvěru a jeho splácení může výrazně zvýšit odvody do fondu oprav a tím se zdražuje i provoz celého bytu [10]. U domů se posuzuje, zda dům prošel revitalizací (tedy komplexní opravou a rekonstrukcí pláště budovy, společných prostor a vnitřního zařízení domu). Jedná se tedy o novou fasádu a zateplení budovy, rekonstrukci výtahů, sklepů a dalších společných prostor (kočárkárna, sušárna) a také renovaci balkonů a lodžií. Částečně zrekonstruovaný dům je zde definován jako dům, kde byla provedena rekonstrukce jeho vnitřní (společné části domu), nebo vnější části domu (zateplení domu, renovace balkonů). Celkově zrekonstruovaný dům je definován jako dům, kde proběhla rekonstrukce vnitřní i vnější části domu. Stejně jako u proměnné Stav bytu jsou zde vytvořeny 2 umělé proměnné Stav domu1 a Stav domu2. Proměnná Stav domu1 nabývá hodnoty 1, je-li dům částečně zrekonstruován, 0 jinak. Proměnná Stav domu2 nabývá hodnoty 1, je-li dům zcela zrekonstruován, 0 jinak. Z tabulky 13 je vidět, že většina domů prošla alespoň částečnou rekonstrukcí. Rekonstrukce Hodnota Stav domu1 Hodnota Stav domu2 Počet % Neproběhla 0 0 9 12 Částečná 1 0 45 61 Celková 0 1 20 27 Tabulka 13: Stav domu rozdělení bytů podle rekonstrukce domu 21
Dostupnost do centra Poslední proměnnou je dostupnost do centra. Tato proměnná udává, kolik minut trvá přesun od daného bytu do centra Hradce Králové. Jedná se o součet doby nutné k dosažení nejbližší zastávky a doby, kterou trvá prostředku MHD dosažení centra. Jako centrum Hradce Králové byla zvolena jedna z nejrušnějších ulic, třída Československé armády (třída ČSA). Jedná se o rušnou ulici v bezprostřední blízkosti Velkého náměstí považovaného za centrum města. V blízkém okolí této ulice jsou kulturní zařízení (Klicperovo divadlo, Adalbertinum, Muzeum východních Čech), historické památky (Bílá věž, Chrám svatého Ducha), vzdělávací instituce (střední školy, Univerzita Hradec Králové, Karlova univerzita, Univerzita obrany, vědecká knihovna) další hojně navštěvovaná místa (zimní stadion, nábřeží u Labe). Měření vzdálenosti od domu k zastávce bylo prováděno pomocí Vyhledávání trasy v Google maps. Protože zde není implementován plán královéhradecké MHD (narozdíl od např. Brna a Pardubic) byla zastávka aproximována nejbližší domem. Dojezdnost MHD do centra byla zjišťována pomocí Vyhledávání spojení na webových stránkách Dopravního podniku Hradec Králové. Bylo-li možno dosáhnout centra z jednoho místa více linkami s různým časem, byla vybrána nejčastější možnost. Jako cíl byla uvedena zastávka MHD Adalbertinum, nebo Muzeum. Tyto dvě zastávky jsou v těsném sousedství, ale jsou částečně obsluhovány různými linkami MHD. Údaje o pěší chůzi a času stráveném v MHD budou posuzovány odděleně, a proto je Dostupnost do centra rozdělena na dvě proměnné Dostupnost1 a Dostupnost2. Dostupnost1 udává počet minut, za které je možné se dostat chůzí od bytu k nejbližší zastávce MHD. Dostupnost2 udává počet minut, za které dorazí spoj MHD na zastávku Adalbertinum (příp. Muzeum). Graf 3 ukazuje, že celkem 40 bytů má nejbližší zastávku MHD vzdálenou pouze 1 minutu chůze, jedná se o byty, které mají zastávku v bezprostřední blízkosti (před domem). 19 bytů 22
má zastávku také velmi blízko (2 3 minuty), ze 7 bytů trvá cesta na zastávku pouze 3-4 minuty. Déle než 4 minuty trvá cesta pouze z 8 bytů (3 byty 4-5 min, 3 byty 6-7 min, 2 byty 7 8 min). Je tedy vidět, že většina bytů má zastávku dostupnou do 5 minut chůze. Nicméně je třeba říci, že Google maps nebere v potaz různé chodníčky mezi domy a další zkratky, které mohou cestu na zastávku MHD často významně zkrátit. Histogram proměnné Dostupnost2 ukazuje, že nejkratší doba jízdy MHD do centra jsou 3 minuty. Jedná se o byty na Gočárově třídě a v jejím okolí, které jsou přímo v centru. Do 16 minut se lze do centra dostat z nejbližší zastávky od 64 bytů. Tedy pouze 10 bytů má vyšší dojezdnost, z toho 7 bytů má dojezdnost od 19 do 22 minut. Jedná se o byty v městské části Malšovice (ulice Čajkovského). Tato čtvrť není výrazně vzdálena od centra, ale linka MHD, která obsluhuje tuto část Malšovic, nejede přímo přes centrum a proto je nutný přestup, který prodlužuje cestu. 45 Histogram z Dostupnost 1 40 35 Počet pozorování 30 25 20 15 10 5 0 1 2 3 4 5 6 7 8 Dostupnost 1 Graf 3: Histogram Dostupnost1 23
22 Histogram z Dostupnost2 20 18 16 Počet pozorování 14 12 10 8 6 4 2 0 3,0000 6,1429 9,2857 12,4286 15,5714 18,7143 21,8571 25,0000 Dostupnost2 Graf 4: Histogram Dostupnost2 Třetí histogram vyhází z celkové doby potřebné pro dosažení centra, jsou zde tedy sečteny doby chůze a cesty MHD. Je vidět, že ze 34 bytů je možné se dostat do centra za 14 17 minut. Do 21 minut se lze do centra dostat z 62 bytů. Nejdéle trvá cesta do centra 27 minut. 22 Histogram z Dostupnost do centra 20 18 16 Počet pozorování 14 12 10 8 6 4 2 0 4,0000 7,2857 10,5714 13,8571 17,1429 20,4286 23,7143 27,0000 Dostupnost do centra Graf 5: Histogram - Dostupnost do centra 24
1.2. Kontingenční tabulky S pomocí kontingenčních tabulek je možné najít vazby mezi proměnnými, které nejsou na první pohled zřejmé. Ne všechny kontingenční tabulky však nějakou takovou vazbu odhalují, a proto jsou vybrány jen ty, které poskytují nové informace. Pro účely této analýzy byly některé proměnné spojeny do jedné. Jedná se o proměnné Vlastnictví1 a Vlastnictví2, Stav bytu1 a Stav bytu2, Stav domu1 a Stav domu2. V příslušných kontingenčních tabulkách proto nejsou hodnoty 0 a 1, ale je zde slovně vyjádřeno o jaký druh vlastnictví se jedná (DB nepřevoditelný, DB převoditelný, OV) anebo o jaký typ rekonstrukce se jedná (Neproběhla, Celková, Částečná). Také proměnná Zdivo byla nahrazena slovním hodnocením cihla, panel. Z tabulky 14 lze vidět, že zatímco u malých jednopokojových bytů je zastoupení obou typů kuchyní skoro rovnoměrné, tak v dvou a třípokojových bytech výrazně převládá samostatná kuchyně. Toto může být způsobeno tím, že dříve nebylo zvykem stavět kuchyň spojenou s jiným pokojem. Lze tedy říci, že větší byty mívají samostatnou kuchyň. Pokoje - Kuchyně Kuchyně Počet pokojů 0 1 Celkový součet 1 6 8 14 2 3 17 20 3 1 36 37 4 2 1 3 Celkový součet 12 62 74 Tabulka 14: Typ kuchyně v závislosti na Počtu pokojů Tabulka 15 ukazuje vztah mezi počtem pokojů a typem zdiva, ze kterého je dům postaven. Je vidět, že zatímco jednopokojové byty jsou (kromě jednoho) výhradně v panelových domech, tak u dvoupokojových bytů převažují cihlové 25
domy (2/3 bytů). U třípokojových bytů mírně převažují byty v panelových domech (21 bytů oproti 16 bytům). Pokoje - Zdivo Zdivo Počet pokojů 0 1 Celkový součet 1 13 1 14 2 5 15 20 3 21 16 37 4 2 1 3 Celkový součet 41 33 74 Tabulka 15: Typ zdiva v závislosti na Počtu pokojů Další tabulka (tabulka 16) ukazuje, že u jednopokojových bytů se pravděpodobnost výskytu B/L/T blíží 50 %. Dvou a třípokojové byty mají B/L/T v drtivé většině případů. Pokoje B/L/T B/L/T Počet pokojů 0 1 Celkový součet 1 8 6 14 2 7 13 20 3 2 35 37 4 1 2 3 Celkový součet 18 56 74 Tabulka 16: Přítomnost B/L/T v závislosti na Počtu pokojů Také v tabulce 17 je ukázán vztah B/L/T, ale tentokrát s proměnnou Sklep/Komora. Tato tabulka ukazuje, že většina bytů má k dispozici jak nějakou plochu k venkovní relaxaci (B/L/T), tak nějakou plochu k uskladnění věcí (Sklep/Komora). Má-li byt k dispozici pouze jeden z těchto benefitů jedná se častěji o Sklep/Komoru. Žádný z těchto benefitů nepatří pouze ke dvěma bytům. 26
B/L/T Sklep/Komora Sklep/Komora B/L/T 0 1 Celkový součet 0 2 16 18 1 2 54 56 Celkový součet 4 70 74 Tabulka 17: Přítomnost B/L/T v závislosti na přítomnosti Sklepa Další skupinou tabulek budou tabulky zkoumající vztahy s proměnnou Zdivo. První z nich, tabulka 18, ukazuje, že nezrekonstruované byty jsou rozděleny rovnoměrně mezi domy panelové a cihlové. Naopak u částečně a zcela zrekonstruovaných bytů převažují byty v panelových domech. Toto může být způsobeno tím, že v panelových domech je často nutnost předělat alespoň původní umakartové jádro. Zdivo Stav bytu Zdivo Stav bytu Panel Cihla Celkový součet Neproběhla 14 15 29 Částečná 12 9 21 Celková 15 9 24 Celkový součet 41 33 74 Tabulka 18: Stav bytu v závislosti na typu Zdiva Další tabulkou z této skupiny je tabulka 19. Zde je vidět, že většina domů bez ohledu na druh konstrukce je částečně zrekonstruována. U zcela zrekonstruovaných domů převažují domy panelové. Toto může být způsobeno tím, že životnost panelových domů je nyní na své hranici a je tedy prodlužována celkovou revitalizací (např. program Zelená úsporám). 27
Zdivo Stav domu Stav domu Zdivo Neproběhla Částečná Celková Celkový součet Panel 6 22 13 41 Cihla 3 23 7 33 Celkový součet 9 45 20 74 Tabulka 19: Stav domu v závislosti na typu Zdiva Tabulka 20 ukazuje, že většina bytů v cihlových i panelových domech je v OV. Z typů družstevního vlastnictví převažuje u panelových domů DB převoditelné, u cihlových bytů je rozdělení rovnoměrné. Zdivo - Vlastnictví Vlastnictví Zdivo DB - nepřevoditelný DB - převoditelný Celkový OV součet Panel 4 10 27 41 Cihla 6 5 22 33 Celkový součet 10 15 49 74 Tabulka 20: Typ Vlastnictví v závislosti na typu Zdiva Poslední ze skupiny tabulek zabývajících se proměnnou Zdivo je tabulka 21. Zde je jasně vidět, že u panelových bytů v drtivé většině převažují byty dosažitelné výtahem. Naopak u bytů cihlových je většina výtahem nedosažitelná. Tento rozdíl je způsobem rozdílným počtem pater v panelových a cihlových domech. Drtivá většina panelových domů v datovém souboru má více než 8 pater, zatímco maximální počet pater v cihlovém domě je 5. Zdivo Výtah Výtah Zdivo Ne Ano Celkový součet Panel 8 33 41 Cihla 27 6 33 Celkový součet 35 39 74 Tabulka 21: Přítomnost Výtahu v závislosti na typu Zdiva 28
Poslední dvě tabulky se zabývají proměnnou Stav bytu. První z nich, tabulka 22, ukazuje, že u všech typů vlastnictví jsou byty v různých fázích rekonstrukce zhruba rovnoměrně zastoupené. Nelze tedy říci, že byty v OV jsou v lepším stavu než byty družstevní. Stav bytu Vlastnictví Stav bytu Vlastnictví Neproběhla Částečná Celková Celkový součet DB nepřevoditelný 5 2 3 10 DB převoditelný 6 5 4 15 OV 18 14 17 49 Celkový součet 29 21 24 74 Tabulka 22: Stav bytu v závislosti na typu Vlastnictví Poslední tabulkou je tabulka 23, která ukazuje vliv stavu bytu na stav domu. U nezrekonstruovaných domů jsou stejně zastoupeny byty nezrekonstruované i zcela rekonstruované. U částečně zrekonstruovaných domů jsou byty rozloženy rovnoměrně mezi jednotlivé fáze rekonstrukce. Z domů zcela zrekonstruovaných převažují byty nezrekonstruované. Toto může být způsobeno tím, že je-li rekonstrukce domu financována úvěrem, pak se jeho splácení promítne ve vyšších příspěvcích do fondu oprav a tak obyvatelům bytů nezbývají finanční prostředky na rekonstrukci bytů. Stav bytu Stav domu Stav domu Stav bytu Neproběhla Částečná Celková Celkový součet Neproběhla 4 14 11 29 Částečná 1 16 4 21 Celková 4 15 5 24 Celkový součet 9 45 20 74 Tabulka 23: Stav bytu v závislosti a Stavu domu 29
1.3. Korelační matice Dalším zdrojem, který ukazuje vztahy mezi proměnnými je korelační matice. Vysoké míry korelace mohou signalizovat problémy s multikolinearitou v modelu. Podle [9] se problém multikolinearity může projevit, je-li korelace (v absolutní hodnotě) mezi dvěma proměnnými větší než 0,9. V tabulce 24 jsou červeně vyznačeny statisticky významné korelace (na hladině významnost 0,05). Vynechány jsou korelace mezi umělými proměnnými, které nepřinášejí žádné informace. Nevyšší korelaci (0,79) lze nalézt mezi proměnnými Plocha a Počet pokojů. Korelace je kladná (a také statisticky významná) a je tedy zřejmé, že s rostoucí plochou roste také počet pokojů v bytě. Také proměnná Kuchyně je statisticky významně korelována s množstvím proměnných. S proměnnými Plocha, Počet pokojů, Dostupnost2 a B/L/T je korelována kladně, tedy např. přítomnost samostatné kuchyně indikuje větší plochu bytu a více pokojů. S proměnnou Stav domu2 je proměnná Kuchyně korelována negativně a lze tedy říci, že byty se samostatnou kuchyní nebývají ve zcela zrekonstruovaných domech. Vysokou (zápornou) míru korelace mezi sebou mají proměnné Zdivo a Patro3, resp. Zdivo a Výtah. Z toho plyne závěr, že cihlové byty nebývají ve vyšších patrech a zároveň nebývají dostupné výtahem. Tento závěr zcela koresponduje např. se zjištěním z kontingenčních tabulek. S kontingenčními tabulkami také koresponduje korelace mezi proměnnými Výtah a Patro3, ze které plyne, že byty ve vyšších patrech bývají dostupné výtahem. Korelace 0,31 (resp. 0,42) mezi proměnnými B/L/T a Plocha (resp. B/L/T a Počet pokojů) ukazuje, že větší plocha bytu (resp. více pokojů) indikují větší pravděpodobnost B/L/T v bytě. Proměnná Dostupnost1 je s proměnnými Patro2, Patro3 a Výtah korelována negativně. Byty v posledním patře, byty ve vyšších patrech a byty dostupné výtahem tedy bývají dále od zastávky MHD. 30
Plocha Počet pokojů Kuchyně Patro 1 Patro2 Patro3 Výtah Zdivo B/L/T Sklep Komora 1 0,79 0,24-0,09 0,13-0,08-0,16 0,22 0,31 0,06-0,04 0,08-0,14 0,25 0,18-0,21-0,07 0,09 Plocha 1 0,25-0,05 0,03-0,14-0,14 0,13 0,42 0,11-0,16 0,16-0,19 0,23 0,08-0,1 0,05 0,14 Vlastnictví1 1 0,01-0,04 0,03 0,02 0,03 0,26 0,22 0,04-0,16 0,11-0,24 0,25-0,31-0,02 0,29 Kuchyně Stav bytu1 Stav bytu2 Stav domu1 Stav domu2 1 -------- -0,22-0,2 0,09 0,01 0,11-0,14 0,1 0,02-0,02-0,07-0,04-0,04-0,03 Patro1 Počet pokojů 1 -------- -0,03 0,06-0,01-0,16 0,06-0,04 0,11-0,08-0,05 0,12-0,24-0,1 Patro2 1 0,46-0,43-0,05-0,19 0,1-0,09 0,08-0,19-0,04 0,09-0,26 0,03 Patro3 1-0,62 0,03-0,11 0,07 0,07 0,12-0,15 0,13-0,03-0,24 0 Výtah 1 0 0,09-0,11 0,01-0,02-0,1 0,16-0,12-0,14-0,03 Zdivo 1 0,14-0,03-0,07 0,22-0,01 0,13-0,08 0,18 0,2 B/L/T 1-0,03 0,08 0,15-0,22-0,07 0,01 0,14 0,18 Tabulka 24: Korelační matice 1 -------- 0,06-0,06-0,01 0,07-0,13 0,04 1 0,01 0,07-0,05-0,08 0,09-0,04 1 ------- 0,2-0,11-0,08 0,08 1 0,02-0,1 0,22-0,19 1 -------- -0,05 0,02 1-0,07-0,15 1-0,06 1 Vlastnictví2 Dostupnost1 Dostupnost2 Sklep/ Komora Vlastnictví1 Vlastnictví2 Stav bytu1 Stav bytu2 Stav domu1 Stav domu2 Dostupnost1 Dostupnost2 31
2. Modely Tato kapitola se bude zabývat vytvořením modelu pro vysvětlovanou proměnnou Cena. Modely budou za sebou následovat tak, aby bylo možné sledovat jednotlivé úpravy až ke konečnému modelu, který bude použit pro analýzu ceny bytu. V textu práce budou použity pouze některé výstupy z Gretlu, ostatní výstupy jsou uvedeny v Příloze B. Všechny modely budou popisovány dle jednotné struktury. Nejprve bude model představen z hlediska úprav základních proměnných (např. jsou-li proměnné v modelu nějak transformovány). Poté bude následovat odhad parametrů modelu a určení statisticky významných proměnných. Statistická významnost bude značena pomocí hvězdiček s následujícím výkladem: * = 0,1 (10 %), ** = 0,05 (5 %) a *** = 0,01 (1 %). Čím větší počet hvězdiček, tím vyšší hladina významnosti. Po odhadu parametrů bude následovat koeficient determinace (R 2 ), který ukazuje kvalitu modelu a udává kolik procent rozptylu vysvětlované proměnné je modelem vysvětleno. Pro hodnocení modelu bude využíván modifikovaný (adjustovaný) koeficient determinace, který odstraňuje problém s rostoucí hodnotou R 2 na základě většího počtu proměnných. Pro kvalitu modelu je také důležitá hodnota informačního kritéria. Modely budou hodnoceny dle Akaikeho informačního kritéria. Po zhodnocení modelu budou následovat testy předpokladů lineárního regresního modelu (homoskedasticita, normalita reziduí, multikolinearita). Testování bude prováděno pomocí p-hodnoty. Přítomnost heteroskedasticity, která není žádoucí, bude testována dvojicí testů: Whiteovým testem a také Breusch-Paganovým testem. Pro oba testy platí H0: Není zde heteroskedasticita proti H1: Je zde heteroskedasticita. Testujeme-li vhodný model, musí oba testy 32
nezamítnout H0, tj. p-hodnota musí být vyšší než stanovená hladina významnosti. Breusch-Paganův test je použitelný pouze pro model, kde jsou normálně rozdělená rezidua. V Gretlu je pro test normality reziduí implementován χ 2 -test dobré shody, kde je testována H0: Rezidua jsou normálně rozdělena proti H1: Rezidua nejsou normálně rozdělena. Testování multikolinearity probíhá pomocí metody Variance Inflation Factor (VFI), což je metoda založená na vícenásobných koeficientech determinace. Problém s multikolinearitou indikují hodnoty VIF (pro jednotlivé parametry) větší než 10. Nebude-li nalezen model, který vyhovuje předpokladům, tj. bude porušen jeden (či více) předpokladů, budou aplikovány metody, které danou problematiku řeší. Tyto metody budou popsány u modelu, kde (případně) budou aplikovány. Konečný model bude ještě testován pomocí F-testu a Ramsayova RESET testu. F-test testuje H0: β1 = β2 =...= βk = 0 proti alternativě. Testujeme tedy hypotézu, že vysvětlovaná proměnná je závislá na lineární kombinaci vysvětlujících proměnných. Při nezamítnutí H0 by bylo nutné hledat nové vysvětlující proměnné a model by byl špatně specifikován. Správnou specifikaci modelu také testuje RESET test. Tento test testuje H0: Specifikace modelu je lineární proti alternativě. 33
2.1. Model I Model I je základním modelem, který lze z datového souboru vytvořit. Vysvětlovanou proměnnou je Cena a ostatní proměnné jsou zahrnuty jako vysvětlující. Vysvětlující proměnné nejsou nijak transformovány. Koeficient Směr. chyba t-podíl p-hodnota Const 2411,42 222542 0,0108 0,99139 Plocha 18606,7 2113,15 8,8052 <0,00001 *** Počet_pokojů 32954,9 55241,2 0,5966 0,55325 Kuchyně 34174,9 82990,7 0,4118 0,68209 Patro1-15498 73891,6-0,2097 0,83465 Patro2-102714 68979,4-1,4891 0,14219 Patro3 29461,4 81960,5 0,3595 0,72063 Výtah 39680,2 83979 0,4725 0,63844 Zdivo 274975 84458,5 3,2557 0,00194 *** B_L_T 44582,6 73550,2 0,6062 0,54691 Sklep_Komora 12949,3 122438 0,1058 0,91616 Vlastnictví1-1313,3 91893-0,0143 0,98865 Vlastnictví2 25169,4 82862,6 0,3037 0,76247 Stav_bytu1 159379 68504,6 2,3265 0,02370 ** Stav_bytu2 322901 72287,1 4,4669 0,00004 *** Stav_domu1-31532,8 86718,2-0,3636 0,71753 Stav_domu2 8905,69 95351,3 0,0934 0,92593 Dostupnost1 7185,84 20040,6 0,3586 0,72129 Dostupnost2 8985,46 5416,16 1,6590 0,10281 Střední hodnota 1756082 Sm. odchylka závisle 539100,9 závisle proměnné proměnné Součet čtverců 2,45e+12 Sm. chyba regrese 210995,0 reziduí Koeficient determinace 0,884590 Adjustovaný koef. 0,846819 determinace F(18, 55) 23,42006 P-hodnota(F) 1,69e-19 Log. věrohodnosti -1001,232 Akaikovo kritérium 2040,464 Schwarzovo kritérium 2084,241 Hannan-Quinnovo kritétium 2057,927 Tabulka 25: Model I 34
Z tabulky 25 je vidět, že proměnná Stav bytu1 je statisticky významná hladině významnosti 0,05, zatímco proměnné Plocha, Zdivo a Stav bytu jsou statisticky významné také na hladině 0,01. Ostatní proměnné jsou statisticky nevýznamné. Modifikovaný R 2 pro Model I je 0,846819, tzn. model vysvětluje cca 85 % variability dat. Hodnota Akaikeho informačního kritéria je 2040,464. P-hodnota Whiteova testu je 0,022321, tedy na hladině významnosti 0,01 H0 nezamítáme. Breusch-Paganův test ukazuje p-hodnotu 0,0161986 a přináší tedy stejný výsledek jako Whiteův test. Test normality reziduí nezamítá normálně rozložené rezidua (p-hodnota testu 0,2123). Toto je také reprezentováno následujícím histogramem. 3e-006 Testovací statistika pro normalitu: Chí-kvadrát(2) = 3,100 [0,2123] uhat1 N(-8,8098e-011 2,11e+005) 2,5e-006 2e-006 Hustota 1,5e-006 1e-006 5e-007 0-600000 -400000-200000 0 200000 400000 600000 uhat1 Graf 6: Histogram Model I Normalita reziduí 35
Další testovatelnou vlastností je multikolinearita. Z následující tabulky je vidět, že žádná taková hodnota se v proměnných nevyskytuje. Plocha 3,364 Sklep_Komora 1,274 Počet_pokojů 3,539 Vlastnictví1 2,268 Kuchyně 1,555 Vlastnictví2 2,553 Patro1 1,314 Stav_bytu1 1,585 Patro2 1,34 Stav_bytu2 1,903 Patro3 1,713 Stav_domu1 2,979 Výtah 2,922 Stav_domu2 2,981 Zdivo 2,93 Dostupnost1 1,821 B_L_T 1,655 Dostupnost2 1,275 Tabulka 26: Model I Multikolinearita Dalšími testy, které mohou pomoci k lepší specifikaci modelu, jsou testy nelinearity. První test ukazuje, zda v modelu nejsou proměnné, které vykazují chování křivky kvadratické (nebo jiné konvexní) funkce. P-hodnota tohoto testu je 0,0860976, tedy proměnné v modelu jsou lineární na hladinách významnosti 0,01 a 0,05. Test nelinearity pro logaritmy nelze provést, protože umělé proměnné nabývají hodnoty 0, pro kterou logaritmus není definován. Pro vhodné proměnné lze provést transformaci do logaritmovaného tvaru samostatně. 36
2.2. Model II Tento model vychází z [8] a je zde použit semilogaritmický tvar modelu. V modelu jsou tedy všechny kardinální proměnné (Cena, Plocha, Počet pokojů, Dostupnost1, Dostupnost2) transformovány do tvaru ln (proměnná). Koeficient Směr. chyba t-podíl p-hodnota Const 11,2794 0,289202 39,0016 <0,00001 *** Kuchyne 0,0508837 0,0438141 1,1614 0,25051 Patro1 0,00149505 0,037172 0,0402 0,96806 Patro2-0,0653745 0,0349701-1,8694 0,06689 * Patro3 0,0255578 0,0428071 0,5970 0,55293 Vytah 0,0298875 0,0428042 0,6982 0,48797 Zdivo 0,148027 0,0437743 3,3816 0,00133 *** B_L_T 0,00283589 0,038751 0,0732 0,94193 Sklep_Komora -0,0424921 0,0633896-0,6703 0,50545 Vlastnictvi1 0,00138393 0,0475584 0,0291 0,97689 Vlastnictvi2 0,0195598 0,0422178 0,4633 0,64497 Stav_bytu1 0,101078 0,0353422 2,8600 0,00598 *** Stav_bytu2 0,185373 0,0378466 4,8980 <0,00001 *** Stav_domu1-0,0224553 0,0443028-0,5069 0,61428 Stav_domu2-0,00670772 0,0483245-0,1388 0,89011 l_pocet_pokoju 0,0687557 0,0633784 1,0848 0,28272 l_dostupnost1 0,0118312 0,0300481 0,3937 0,69529 l_dostupnost2 0,0400623 0,0281931 1,4210 0,16096 l_plocha 0,663967 0,076755 8,6505 <0,00001 *** Střední hodnota závisle proměnné 14,33253 Sm. odchylka závisle 0,309606 proměnné Součet čtverců 0,639585 Sm. chyba regrese 0,107837 reziduí Koeficient 0,908598 Adjustovaný koef. 0,878684 determinace determinace F(18, 55) 30,37415 P-hodnota(F) 3,41e-22 Log. věrohodnosti 70,78561 Akaikovo kritérium -103,5712 Schwarzovo -59,79398 Hannan-Quinnovo -86,10793 kritérium kritétium Tabulka 27: Model II 37
Ukazuje se (viz tabulka 27), že v tomto modelu se nachází 5 statisticky významných proměnných (a konstanta). Kromě proměnné Patro2, která je statisticky významná pouze na hladině významnost 0,1, jsou ostatní proměnné významné pro všechny hladiny významnosti. Modifikovaný koeficient determinace je 0,878684, tj. je vysvětleno cca 88 % variability dat. Akaikeho kritérium je -103,5712. Testy heteroskedasticity nezamítají H0 na všech hladinách významnosti, protože p-hodnota pro Whiteův test je 0,431091 a pro Breusch-Paganův test je p-hodnota 0,687215. Test normality reziduí nezamítá normálně rozdělená rezidua (viz graf 8) s p-hodnotou 0,316534. Multikolinearita v datech nebyla zjistěna (tabulka 28). 5,5 5 Testovací statistika pro normalitu: Chí-kvadrát(2) = 2,301 [0,3165] uhat4 N(2,5685e-015 0,10784) 4,5 4 3,5 Hustota 3 2,5 2 1,5 1 0,5 0-0,3-0,2-0,1 0 0,1 0,2 0,3 uhat4 Graf 7: Histogram Model II Normalita reziduí 38
Kuchyně 1,660 Vlastnictví2 2,537 B_L_T 1,759 Patro1 1,273 Stav_bytu1 1,616 Sklep_Komora 1,307 Patro2 1,319 Stav_bytu2 1,997 Vlastnictví1 2,326 Patro3 1,789 Stav_domu1 2,977 l_dostupnost1 1,887 Výtah 2,906 Stav_domu2 2,931 l_dostupnost2 1,340 Zdivo 3,013 l_počet_pokojů 4,668 l_plocha 4,343 Tabulka 28: Model II Multikolinearita Test nelinearity pro mocniny nezamítá lineární vztah, ale v detailním výstupu Gretlu se ukazuje možnost, že proměnná Dostupnost2 vykazuje určité nelineární chování. Proto bude v dalším modelu místo nahrazena proměnnou sq(dostupnost2), tedy druhou mocninou. 39
2.3. Model III Tento model navazuje na předchozí Model II a reaguje na možnost nelineárního chování proměnné Dostupnost2. Tato proměnná je tedy nahrazena svojí druhou mocninou, ostatní kardinální proměnné zůstávají v logaritmovaném tvaru. Koeficient Směr. chyba t-podíl p-hodnota Const 11,3945 0,275915 41,2970 <0,00001 *** Kuchyně 0,0504453 0,0433192 1,1645 0,24925 Patro1 0,000391979 0,0365725 0,0107 0,99149 Patro2-0,0606898 0,0348701-1,7405 0,08737 * Patro3 0,0211906 0,0423089 0,5009 0,61847 Výtah 0,029746 0,0421832 0,7052 0,48369 Zdivo 0,137574 0,0420801 3,2693 0,00186 *** B_L_T -0,00102388 0,0385348-0,0266 0,97890 Sklep_Komora -0,0366021 0,062293-0,5876 0,55922 Vlastnictví1 0,00147425 0,0470815 0,0313 0,97513 Vlastnictví2 0,0176602 0,0418038 0,4225 0,67434 Stav_bytu1 0,104252 0,0350476 2,9746 0,00435 *** Stav_bytu2 0,180611 0,0366228 4,9317 <0,00001 *** Stav_domu1-0,0180957 0,0440514-0,4108 0,68283 Stav_domu2 0,000981965 0,04837 0,0203 0,98388 l_počet_pokojů 0,0821825 0,0629577 1,3054 0,19720 l_dostupnost1 0,0141274 0,0298064 0,4740 0,63740 l_plocha 0,648455 0,0763334 8,4950 <0,00001 *** sq_dostupnost2 0,000183645 0,000102978 1,7833 0,08005 * Střední hodnota 14,33253 Sm. odchylka závisle 0,309606 závisle proměnné proměnné Součet čtverců 0,626821 Sm. chyba regrese 0,106756 reziduí Koeficient determinace 0,910422 Adjustovaný koef. 0,881105 determinace F(18, 55) 31,05487 P-hodnota(F) 1,99e-22 Log. věrohodnosti 71,53146 Akaikovo kritérium -105,0629 Schwarzovo kritérium -61,28568 Hannan-Quinnovo kritétium -87,59964 Tabulka 29: Model III 40
Zde se ukazuje, že oproti minulému modelu přibyla nová významná proměnná a to sq_dostupnost2 (významná na hladině 0,1). Adjustovaný koeficient determinace je 0,881105, tj. je vysvětleno cca 88 % variability dat. Akaikeho kritérium je -105,0629, model je tedy lepší než Model II. Oba testy heteroskedasticity nezamítají H0 (White: p-hodnota 0,26311, Breusch-Pagan: p-hodnota 0,728046). Test normality reziduí nezamítá normálně rozdělená rezidua s p-hodnotou 0,32373 (graf 9). 5,5 5 Testovací statistika pro normalitu: Chí-kvadrát(2) = 2,301 [0,3165] uhat4 N(2,5685e-015 0,10784) 4,5 4 3,5 Hustota 3 2,5 2 1,5 1 0,5 0-0,3-0,2-0,1 0 0,1 0,2 0,3 uhat4 Graf 8: Histogram Model III Normalita reziduí Test nelinearity nezamítá lineární vztah (p-hodnota 0,225078). Také hodnoty kolinearity (tabulka 30) neukazují žádný problém. Kuchyně 1,655 Vlastnictví2 2,538 B_L_T 1,775 Patro1 1,258 Stav_bytu1 1,621 Sklep_Komora 1,228 Patro2 1,338 Stav_bytu2 1,908 Vlastnictví1 2,326 Patro3 1,783 Stav_domu1 3,003 l_dostupnost1 1,859 Výtah 2,88 Stav_domu2 2,996 l_plocha 4,383 Zdivo 2,841 l_počet_pokojů 4,7 sq_dostupnost2 1,229 Tabulka 30: Model III Multikolinearita 41
2.4. Model IV Model IV je vytvořen sekvenční eliminací statisticky nevýznamných proměnných z Modelu III. Sekvenční eliminace odebírá nevýznamné proměnné od nejvíce nevýznamné do hladiny významnosti, která je zadána. V tomto modelu je hladina významnosti stanovena na 0,1 (10 %) a sekvenční eliminace tedy odstraní proměnné s p-hodnotou větší než 0,1. Patro1 p-hodnota 0,991 Stav_domu1 p-hodnota 0,535 Stav_domu2 p-hodnota 0,985 Sklep_Komora p-hodnota 0,584 B_L_T p-hodnota 0,980 Výtah p-hodnota 0,521 Vlastnictví1 p-hodnota 0,974 Vlastnictví2 p-hodnota 0,461 Patro3 p-hodnota 0,603 Kuchyně p-hodnota 0,336 l_dostupnost1 p-hodnota 0,678 l_počet_pokojů p-hodnota 0,116 Tabulka 31: Model IV Sekvenční eliminace Je vidět, že jako první byla odstraněna proměnná Patro1 a jako poslední proměnná l_počet_pokojů. Poslední odstraněná proměnná je velmi blízko statistické významnosti 0,1, zatímco ostatní proměnné jsou výrazně statisticky nevýznamné. Model IV (tedy vlastně redukovaný Model III) má tedy jen 6 proměnných (plus konstantu). Koeficient Směr. chyba t-podíl p-hodnota Const 11,102 0,150073 73,9777 <0,00001 *** Patro2-0,0648748 0,0293144-2,2131 0,03030 ** Zdivo 0,102909 0,0246335 4,1776 0,00009 *** Stav_bytu1 0,0929963 0,0291409 3,1913 0,00216 *** Stav_bytu2 0,161004 0,0292129 5,5114 <0,00001 *** l_plocha 0,751288 0,0380477 19,7460 <0,00001 *** sq_dostupnost2 0,000182426 9,18209e-05 1,9868 0,05104 * 42