Hledání optimální polohy stanic a zastávek na tratích regionálního významu

Podobné dokumenty
Úvodem Dříve les než stromy 3 Operace s maticemi

Vícerozměrné statistické metody

Metodika SUMP fáze B Analytická část MD Praha

vzorek vzorek

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

Lineární regrese. Komentované řešení pomocí MS Excel

Kristýna Rybová Univerzita J.E.Purkyně v Ústí nad Labem Viktor Květoň Univerzita Karlova. Správa železniční dopravní cesty, Praha,

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Časová dostupnost krajských měst České republiky

Rozbor udržitelného rozvoje území obce Velké Březno

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

A/ URBANISTICKÉ VSTUPY A PŘEDPOKLADY

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy

10. Předpovídání - aplikace regresní úlohy

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Rozbor udržitelného rozvoje území obce Habrovany

Jak moc VYSOKOrychlostní železnice v ČR?

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA Sylabus pro předmět STATISTIKA Pomůcky... 7

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

Statistická analýza jednorozměrných dat

Univerzita Karlova v Praze Centrum pro otázky životního prostředí U Kříže Praha 5 ředitel: prof. RNDr. Bedřich Moldan, CSc.

Regresní a korelační analýza

ZÁKLADY DOPRAVNÍHO INŽENÝRSTVÍ

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Rozbor udržitelného rozvoje území obce Zubrnice

Rozbor udržitelného rozvoje území obce Chuderov

ZX510 Pokročilé statistické metody geografického výzkumu. Téma: Měření síly asociace mezi proměnnými (korelační analýza)

6. Lineární regresní modely

Regresní a korelační analýza

1. Vlastnosti diskretních a číslicových metod zpracování signálů... 15

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

Územně analytické podklady Jihomoravského kraje 2017

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Vysokorychlostní železnice větší kvalita života

Požadavky cestujících na železniční dopravu v současnosti a v roce 2030

Algoritmy pro shlukování prostorových dat

Železnice v Pardubickém kraji - výhody

Vyhodnocení průměrných denních analýz kalcinátu ananasového typu. ( Metoda hlavních komponent )

Základní informace (Zdroj: Český statistický úřad)

Statistika (KMI/PSTAT)

Korelační a regresní analýza

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

STATISTICKÉ METODY; ZÍSKÁVÁNÍ INFORMACÍ Z DRUHOVÝCH A ENVIRONMENTÁLNÍCH DAT

Základní informace (Zdroj: Český statistický úřad)

Role autobusu a vlaku v mobilitě obyvatelstva

Základní informace (Zdroj: Český statistický úřad)

Ekonomické aspekty trvale udržitelného územního

Pravděpodobnost a matematická statistika

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Dopravní průzkum - Analytická část

Základní informace (Zdroj: Český statistický úřad)

2.5 Frekvence vyjížďky, denní vyjížďka podle času stráveného na cestě

MĚŘENÍ STATISTICKÝCH ZÁVISLOSTÍ

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group

You created this PDF from an application that is not licensed to print to novapdf printer (

AVDAT Nelineární regresní model

Tomáš Karel LS 2012/2013

Popisná statistika. Komentované řešení pomocí MS Excel

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Vícerozměrné statistické metody

Základní informace (Zdroj: Český statistický úřad)

Měření závislosti statistických dat

Srovnání principů dopravní obslužnosti ve Spolkové republice Německo a v Rakousku Tomáš Nigrin Jiří Dujka

Základní informace (Zdroj: Český statistický úřad)

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Rozbor udržitelného rozvoje území obce Chabařovice

Základní informace (Zdroj: Český statistický úřad, dotazník obce)

Rozbor udržitelného rozvoje území obce Petrovice

Predikční modely nehodovosti a jejich využití při hodnocení efektivity investic do infrastruktury Petr Šenk

POLYNOMICKÁ REGRESE. Jedná se o regresní model, který je lineární v parametrech, ale popisuje nelineární závislost mezi proměnnými.

veřejnou dopravu mezi sídly v Ústeckém kraji

Korelace. Komentované řešení pomocí MS Excel

Cvičná bakalářská zkouška, 1. varianta

Vícerozměrné statistické metody

Základní informace (Zdroj: Český statistický úřad)

KGG/STG Statistika pro geografy

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

Vícerozměrné metody. PSY117/454 Statistická analýza dat v psychologii Přednáška 12. Schematický úvod

PRAHA LETIŠTĚ KLADNO STUDIE PROVEDITELNOSTI AKTUALIZACE STUDIE PROVEDITELNOSTI 2015

TECHNOLOGICKÁ PLATFORMA SILNIČNÍ DOPRAVA

RNDr. Tomáš Pavlík, PhD. RNDr. Jiří Jarkovský, PhD. Doc. RNDr. Ladislav Dušek, PhD. Ústav zdravotnických informací a statistiky České republiky

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

Obsah. Předmluva 13. O autorovi 15. Poděkování 16. O odborných korektorech 17. Úvod 19

Ing. Michael Rost, Ph.D.

AVDAT Mnohorozměrné metody, metody klasifikace

ZX510 Pokročilé statistické metody geografického výzkumu

Příklad 2: Obsah PCB v játrech zemřelých lidí. Zadání: Data: Program:

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

Základní informace (Zdroj: Český statistický úřad)

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

Integrované systémy HD

Regresní analýza 1. Regresní analýza

Základní informace (Zdroj: Český statistický úřad, dotazník obce)

Transkript:

Hledání optimální polohy stanic a zastávek na tratích regionálního významu Václav Novotný 31. 10. 2018

Anotace 1. Dopravní obsluha území tratěmi regionálního významu 2. Cíle výzkumu a algoritmus práce 3. Zdroje dat a databáze relevantních obcí 4. Shluková analýza 5. Regresní analýza a expertní analýza 6. Závěrečná doporučení 0 Anotace 1 / 23

Problematika dopravní obsluhy území Školy, zaměstnání, úřady, zdravotnictví, kultura Fungující dopravní síť elementární prvek Nízká dynamika změn rozsahu sítě Udržitelný rozvoj a mobilita Drážní doprava součástí Snaha o ovlivňování mobility Finanční udržitelnost => optimální síť Zastávka/stanice vstupní branou do systému 1 Dopravní obsluha území tratěmi regionálního významu 2 / 23

Vymezení řešených železničních tratí Páteřní tratě Tratě regionálního významu 72% všech tratí Mimo síť TEN-T Regionální a některé celostátní tratě Obsluha menších sídel (bez MHD) Krajské / lokální / napájecí relace Historicky primárně pro přepravu komodit 1 Dopravní obsluha území tratěmi regionálního významu 3 / 23

Cíle výzkumu Systémový nástroj pro optimální polohu žst. / zast. pro maximální využití cestujícími Hypotéza o ovlivnění volby dopravní módu polohou žst./zast. Posouzení skutečného potenciálu pro cestující Důležité předpoklady: Vhodné traťové poměry Stěžejní relace: bydliště vzdělání pracoviště služby Záleží na poloze místa zastavení vlaku v sídle Sídlo má rozčlenitelnou strukturu dle funkčního využití ploch SLDB: železnice se využívá v obci uvedené obyvatelem 2 Cíle výzkumu a algoritmus práce 4 / 23

Metodika hledání optimální polohy žst. / zast. 2 Cíle výzkumu a algoritmus práce 5 / 23

Zdroje dat Systémové zdroje dat za celou ČR Sčítání lidu, domů a bytů 2011 Územně analytické podklady ČR 2014 Seznam tarifních bodů dle SŽDC SR 70 Mapové služby Seznam Google WMS ČÚZK 3 Zdroje dat a databáze relevantních obcí 6 / 23

Databáze relevantních obcí Seznam tarifních bodů z 20. 2. 2011 dle SŽDC SR 70 Bez TEN-T, krajských měst, MS Excel SVYHLEDAT a ruční dotřídění 1 řádek = 1 obec = 1 ID Přiřazení znaků ze SLDB, ÚAP a mapových podkladů Demografické charakteristiky Územní charakteristiky Charakteristiky dojížďky a vyjížďky Výsledná matice 1350 x 109 Příliš velký počet znaků Nulové hodnoty znaků => nutná redukce 3 Zdroje dat a databáze relevantních obcí 7 / 23

Databáze relevantních obcí redukce znaků t-sne Pearsonův korelační koeficient (109 x 109, standardizovaná data) Silná až velmi silná korelace ve znacích obsahující počet obyvatel a dojížďku s vyjížďkou =>vybrat reprezentanty korelovaných skupin, volit poměrové znaky Expertní posouzení Zachování 3 oblastí Zohlednění nulových hodnot ve sloupcích Výsledná matice 1350 x 16 3 Zdroje dat a databáze relevantních obcí 8 / 23 r = n i= 1 n i= 1 ( x x)( y y) i ( x x) ( y y) i i n 2 2 i i= 1

Databáze relevantních obcí popisná statistika Pro lepší pochopení struktury a potenciálu dat Hodnoty základních statistických veličin Bodové grafy a histogramy četnosti Rozptyl zvláště patrný u znaků Hustota osídlení pouze v zastavěných částech Vyjížďka Rizikové znaky s binárními daty Testováno na SVD a PCA 3 Zdroje dat a databáze relevantních obcí 9 / 23

Shluková analýza Vícerozměrná statistická metoda pro klasifikaci objektů na základě podobnosti t-sne, odhad statické směsi komponent, DBSCAN, K-means Předpoklad: Obce tvoří shluky na základě svého dojížďkového a vyjížďkového potenciálu Míru obsluhy lze optimalizovat (interval, kapacita vozidla) Systémový nástroj nižší složitost úlohy při respektování rozdílů v potenciálu Problematické nulové hodnoty některých znaků Shluk => statistický výběr 4 Shluková analýza 10 / 23

t-sne Základní vhled do dat a odhad počtu shluků (matice 1350 x 14/16) t-distributed stochastic neighbor embedding Nelineární redukce dimenzionality Podobné objekty jsou modelovány blízkými body v 2-3 rozměrném prostoru (Kullback-Leiblerova divergence) Využívá Euklidovskou vzdálenost 4 Shluková analýza 11 / 23

Odhad statické směsi komponent Transparentní klasifikace naměřených dat (odhad jízdního módu jedoucího automobilu z dat o jízdě) Shluk = komponenta Model tvořen množinou n c komponent a diskrétní veličinou c t Využívá Bayesovské statistiky (vazba na apriorní data) a Gaussova rozdělení hustot pravděpodobnosti vektoru vah jednotlivých komponent Hledání center 5 komponent pro disjunktní dvojice znaků ve 3 iteracích Klasifikace objektů (obcí) ve 14-ti rozměrném prostoru Počet apriorních dat ni = 10 4 Shluková analýza 12 / 23

Odhad statické směsi komponent Výsledky počet obcí ve shlucích: 856, 271, 147, 55, 21 4 Shluková analýza 13 / 23

DBSCAN Density-based spatial clustering of applications with noise Shluky jsou oblasti v prostoru s větší hustotou objektů Každý objekt má definované své vlastní sousedství ϵ Počáteční podmínky MinPts = 5, zkoušeny i hodnoty větší Hodnoty ϵ testovány pro počet shluků 5 Testován také počet znaků 8 pro vyšší rovnoměrnost ve shlucích Výsledky počet obcí ve shlucích: 183, 1139, 16, 14, 5 4 Shluková analýza 14 / 23

K - means Metoda k-průměrů (k-centroidů s euklidovskou vzdáleností) Iterativní optimalizační metoda založená na Euklidovské vzdálenosti a určení počátečních centroidů Počáteční podmínky Počet shluků = 5, testováno také 3, 5, 6, 7 a 10 shluků Testován také počet znaků 8 pro vyšší rovnoměrnost ve shlucích Průběžná kontrola pomocí datových pruhů MS Excel Výsledky počet obcí ve shlucích: 69, 477, 253, 28, 523 4 Shluková analýza 15 / 23

Shluky obcí Porovnání metod pomocí datových pruhů a hodnot statistických veličin 200 8 znaků s nestandardizovanými daty Reálná interpretace shluků 150 100 50 0 0 1 2 3 4 Nejlépe vyhodnocena metoda K-means pro 8 znaků Datově konzistentní Nejrovnoměrnější rozložení objektů ve shlucích Metody založené na hustotě nejsou vzhledem k tvaru dat zřejmě vhodné Nutná optimalizace odhadu statické směsi komponent 4 Shluková analýza 16 / 23

Zobrazení shluků obcí na mapě ČR 4 Shluková analýza 17 / 23

Shluky reprezentativních obcí a doplnění dat Shluky reprezentativních obcí Dostupná data o dojížďce a vyjížďce vlakem Pouze 1 stanice či zastávka na území Výsledný počet 272 reprezentativních obcí ve shlucích: 19, 117, 88, 10, 38 Doplnění dat z mapových podkladů pro reprezentativní obce Poloha stanice / zastávky v území Typ funkční plochy do 500m a 1000m od zastávky Kvantifikace dat (10 znaků) pro regresní analýzu 5 Regresní analýza a expertní analýza 18 / 23

Regresní analýza Vícenásobná lineární regrese se zohledněním náhodné chyby E Testovány i nelineární spojnice trendu dat Regresor = podíl vyjíždějících a dojíždějících vlakem Regresandy = data o funkčním využití území a poloze stanice / zastávky Pro porovnání testovány také tzv. demografické regresandy Testován koeficient determinance a p-hodnota F-testu Shluk č. 3 vzhledem k nedostatku dat netestován 5 Regresní analýza a expertní analýza 19 / 23

Regresní analýza - výsledky 40 35 30 25 20 15 10 5 40 35 30 25 20 15 10 5 0 0 5 10 15 20 0 0 5 10 15 20 Predikce Skutečné hodnoty Predikce Skutečné hodnoty 5 Regresní analýza a expertní analýza 20 / 23

Expertní analýza Vzhledem ke slabé odezvě regresní analýzy a nutné analýze shluku č. 3 Sledování jízdních dob různými módy do LLC Polohy stanic a zastávek vlaku a autobusů Vybavenost obce Poloha velkých zaměstnavatelů (shluk č.3) Nezanedbatelný vliv na volbu dopravního prostředku Cestovní doba Konkurenceschopnost vlakové dopravy Možnosti parkování v cíli Navázání na začátky a konce směn (shluk č.3) Dostatek zastávek u zdrojů (shluk č. 3) 5 Regresní analýza a expertní analýza 21 / 23

Závěrečná doporučení 6 Závěrečná doporučení 22 / 23

Závěrečná doporučení Poloha stanice či zastávky není sama o sobě dominantním prvkem v rozhodování Komplexní problém Pro optimalizaci polohy stanice či zastávky konkurenceschopné vlakové dopravy platí: Doplnit data ve SLDB a zjemnit data o členění obcí 6 Závěrečná doporučení 23 / 23

D ě k u j i z a p o z o r n o s t Ing. Václav Novotný, Ph.D. Institut plánování a rozvoje hl. m. Prahy Sekce infrastruktury Vyšehradská 57 128 00 Praha 2 E) novotny.v@ipr.praha.eu T) +420 236 005 651