Identifikace kritických nehodových lokalit pomocí GIS analýzy polohy dopravních nehod METODIKA Michal Bíl, Richard Andrášik, Zbyněk Janoška, Jiří Sedoník a Veronika Valentová Centrum dopravního výzkumu, v. v. i. 2014
Výstup řešení projektu: Zpracovatel: Autoři: Oponovali: Metodika je výsledkem řešení projektu Technologické agentury ČR č. TA01031303:GIROSAF Metodika identifikace kritických úseků pozemních komunikací v ČR pomocí GIS analýz dopravních nehod. Centrum dopravního výzkumu, v. v. i. (CDV), RNDr. Michal Bíl, Ph.D., Mgr. Richard Andrášik, Mgr. Zbyněk Janoška, Mgr. Jiří Sedoník, Ing. Veronika Valentová Doc. Ing. Pavel Hrubeš, Ph.D., ČVUT v Praze, Fakulta dopravní, Ústav dopravní telematiky email: hrubes@k620.fd.cvut.cz Ing. Vlasta Michková referent veřejné správy Ředitelství silnic a dálnic ČR email: Vlasta.Michkova@rsd.cz Metodika certifikována: 29. 9. 2014 Certifikoval: Odbor kosmických aktivit a ITS, Ministerstvo dopravy ČR ISBN 978-80-86502-76-2
Tato metodika vznikla jako jeden z výstupů projektu Technologické agentury, programu Alfa (č. TA01031581) GIROSAF Metodika identifikace kritických úseků pozemních komunikací v ČR pomocí GIS analýz dopravních nehod. Na webových stránkách girosaf.cdvinfo.cz jsou dále k dispozici další výstupy tohoto projektu.
OBSAH PŘEDMLUVA... 5 CÍL METODIKY... 6 1. IDENTIFIKACE NEHODOVÝCH LOKALIT... 7 1.1 Metody založené na numerické definici nehodové lokality... 7 1.2 Programy hodnocení silnic... 9 1.3 Predikční modelování nehodovosti... 10 1.4 Identifikace nehodových lokalit v rámci sítě... 10 1.5 Zaznamenávání dat... 10 1.6 Zpracování dat v GIS... 13 2. METODA KDE+... 14 2.1 Metoda KDE pro aplikaci na linii... 14 2.2 Metoda Monte Carlo... 19 2.3 Statistická významnost shluku... 19 2.4 Síla shluku... 21 2.5 Stabilita shluku... 24 2.6 Tendence ke shlukování...26 2.7 Omezení a modifikace metody...27 4. APLIKACE NA DOPRAVNÍ NEHODY V JIHOMORAVSKÉM KRAJI.... 29 3.1 Analýza lokalit se shluky DN... 29 4. APLIKACE NA DOPRAVNÍ NEHODY V ČR - SHRNUTÍ VÝSLEDKŮ... 31 5. SOFTWAROVÁ REALIZACE... 33 6. ZÁVĚR... 34 7. SROVNÁNÍ NOVOSTI POSTUPŮ... 35 7.1 Přínos metody KDE+ v porovnání s přístupy existujícími v ČR... 35 7.2 Srovnání mezi metodami KDE+, IDEKO a INFOBESI na území Jihomoravského kraje... 37 7.3 Srovnání metody v mezinárodním měřítku... 39 8. POPIS UPLATNĚNÍ CERTIFIKOVANÉ METODIKY... 40 9. EKONOMICKÉ ASPEKTY... 41 10. SEZNAM LITERATURY... 42 11. SEZNAM PUBLIKACÍ, KTERÉ PŘEDCHÁZELY METODICE... 44
PŘEDMLUVA Dopravní nehody (DN) na silnicích, dálnicích, ale i ve městech jsou běžným jevem v každé společnosti. Jsou důsledkem provozu na pozemních komunikacích, který vychází z potřeby mobility osob (např. dojížďky do zaměstnání, cestami za nákupy, dovolenými apod.) nebo zboží. Jsou však také jevem nežádoucím a mělo by být ambicí každé vyspělé společnosti DN předcházet, resp. se snažit minimalizovat jejich výskyt nebo následky. 5
CÍL METODIKY Pro identifikaci nehodových lokalit existuje celá řada postupů. Naším cílem je představit nově vyvinutou metodu, která objektivně lokalizuje místa DN na mezikřižovatkových úsecích silnic. Metoda, kterou označujeme jako KDE+, vychází z existence přesných údajů o polohách DN a standardní metody KDE (Kernel Density Estimation), kterou rozšiřuje. Věříme, že použití tohoto postupu přispěje k identifikaci potenciálně nebezpečných míst v síti pozemních komunikací a efektivnějšímu vynakládání prostředků na sanace skutečně nehodových lokalit. 6
1. IDENTIFIKACE NEHODOVÝCH LOKALIT Z pohledu inženýra dopravních staveb a z pohledu správce pozemních komunikací je potřeba rozlišovat několik druhů lokalit: Riziková lokalita - místo nebo úsek pozemní komunikace, kde je vyšší pravděpodobnost vzniku dopravních nehod (které se ale zatím nemusely stát). Nehodová lokalita - místo nebo úsek pozemní komunikace splňující kritéria nehodové lokality. Místo/úsek pozemní komunikace s koncentrací nehod se stejnou příčinou za určité časové období - ČSN 73 6100-2. Kritická lokalita - kritickými lokalitami dopravního systému jsou z pohledu bezpečnosti riziková a nehodová místa. Místo/úsek s rizikovým či nehodovým potenciálem, ke změně stavu systému (vzniku rizikové či nehodové lokality) stačí pouze nepatrná změna stávajícího stavu. Již desítky let v závislosti na dostupných datech o DN a jejich poloze jsou vyvíjeny a využívány různé metody identifikace nehodových lokalit. Rozvoj souvisí se zaváděním GIS do dopravního výzkumu, ale také s možnostmi přesné lokalizace místa DN pomocí GPS. Policejní databáze již obsahují přesné polohové informace o každé DN a ne pouze hrubé staničení s přesností na stovky metrů nebo nižší. V České republice je postup se zaměřením GPS souřadnic využíván od roku 2006 (od roku 2007 obsahují GPS souřadnice všechny záznamy dopravních nehod evidovaných Policií ČR) a rostoucí množství dat umožňuje využití statistických metod. Existence GIS navíc umožňuje mezikřižovatkové úseky silnic rozdělit na podúseky stejné délky a k nim opět přiřadit absolutní počty nehod. Výsledkem je potom množina úseků stejné délky s údaji o DN. Data o dopravních nehodách poskytují po předzpracování agregované údaje o absolutním počtu DN pro každý úsek komunikace. Dále jsou uvedeny různé metody identifikace nehodových lokalit ve světě a v ČR, které byly používány dříve, či jsou používány doposud. 1.1 Metody založené na numerické definici nehodové lokality U těchto metod je důležité stanovení hranice počtu dopravních nehod za určité časové období. Hranice se u jednotlivých zemí liší s ohledem na počet dopravních nehod a způsob sběru dat o dopravní nehodovosti příslušným orgánem (Policií ČR). V České republice se může jednat např. o stanovení finanční hranice, kdy je nutné k dopravní nehodě přivolat Policii ČR. Tato hranice se naposledy měnila v letech 2007 a 2009, kdy vzrostla na 100 000 Kč. Tato metoda je v ČR používána již celou řadu let, před rokem 2001, kdy byla CDV aktualizována, bylo za místo častých dopravních nehod na silniční síti ČR považováno takové místo, kde došlo za období 2 let na úseku 0,5 km dlouhém minimálně: k 10 nehodám na silnici I. třídy, k 7 nehodám na silnici II. třídy. 7
V roce 2001 bylo kritérium pracovníky Centra dopravního výzkumu, v. v. i. aktualizováno v Metodice identifikace a řešení míst častých dopravních nehod (Andres a kol., 2001). V uvedené metodice jsou nehody rozděleny na 10 hlavních skupin a na 107 typů nehod. Křižovatky nebo úseky do 250 metrů se posuzují jako místa častých dopravních nehod, jestliže se na nich staly: nejméně 3 nehody s osobními následky za 1 rok, nejméně 3 nehody stejného typu s osobními následky za 3 roky nebo nejméně 5 nehod stejného typu za 1 rok. V roce 2006 byl v ČR zaveden systém INFOBESI, ve kterém jsou dostupná data Policie ČR o dopravních nehodách včetně jejich GPS lokalizace (viz Obrázek 1). V tomto systému je rovněž možné identifikovat nehodové lokality na základě numerické definice, která je shodná s výše uvedenou definicí z metodiky z roku 2001, ovšem využívá typologii dopravních nehod Policie ČR a dochází tak k rozdílným výsledkům. Obrázek 1: Ukázka nehodových míst ze systému INFOBESI (dostupné z http://infobesi.dopravniinfo.cz/app/main). V současné době je platné další numerické kritérium nehodové lokality. Týká se pouze transevropské silniční sítě TEN-T a vychází z požadavků směrnice Evropského parlamentu a Rady 2008/96/ES o řízení bezpečnosti silniční infrastruktury ze dne 19. listopadu 2008. Tato směrnice byla přijata v roce 2011 a v souvislosti s ní došlo ke změně zákona č. 13/1997 Sb. o pozemních komunikacích, ve znění pozdějších předpisů. Doplněno bylo: V Centrální evidenci pozemních komunikací se evidují a aktualizují následující údaje (( 29a odstavec 1 písm. d)e)): informace o úsecích pozemních komunikací zařazených do transevropské silniční sítě, jež jsou v provozu déle než 3 roky, s vysokým počtem dopravních nehod, při nichž došlo k usmrcení osoby, v poměru k intenzitě provozu na pozemních komunikacích 8
informace o úsecích pozemních komunikací zařazených do transevropské silniční sítě, u nichž by odstranění nebo snížení rizik plynoucí z vlastností pozemní komunikace pro účastníky provozu vedlo k výraznému snížení nákladů vynakládaných v důsledku dopravních nehod, při současném zohlednění nákladů na odstranění nebo snížení těchto rizik. Všechny numerické metody jsou v podstatě založeny na metodě plovoucího okna, kdy dochází k postupnému přesouvání dané délky po komunikaci a k vyhledání lokalit, kdy je počet nehod vyšší než stanovený hraniční limit, viz Obrázek 2. Obrázek 2: Příklad použití posuvného okna. 1.2 Programy hodnocení silnic Mezi metody vycházející z expertního posouzení komunikace vychází metodiky programů EuroRAP (European Road Assessment Programme), irap (International Road Assessment Programme), usrap (U.S. Road Assessment Program) apod. Všechny tyto programy jsou založeny na vyhodnocení údajů o komunikaci sbíraných při pasportizaci komunikace, z dat o dopravní intenzitě a nehodovosti. Metodika sběru dat se stále vyvíjí a je rozšiřována o nové vlastnosti komunikací, které je možné zjistit při průjezdu vozidla. Sbíraná data se liší v závislosti na typu zkoumané komunikace. Na základě kombinace sbíraných dat je vypočteno riziko daného úseku komunikace. Komunikace se rozdělují podle vyhodnoceného rizika do pěti typů, které se v mapách, jež jsou výstupem, odlišují barevně a liší se počtem hvězdiček. Vyhodnocuje se tzv. individuální riziko, které je zobrazeno pro každého jednotlivého účastníka provozu, a proto pracuje s relativní nehodovostí. Dále se vyhodnocuje tzv. společenské riziko, což jsou výstupy 9
pro správce silniční sítě a jsou určeny pro identifikaci nehodových lokalit. Programy jsou zaměřeny zejména na snižování počtu a následků statisticky nejnebezpečnějších dopravních nehod. Jedná se o: Čelní srážky Střety s pevnou překážkou mimo vozovku Nehody v křižovatkách Nehody s účastí chodce nebo cyklisty 1.3 Predikční modelování nehodovosti Predikční modely nehodovosti jsou moderním přístupem používaným ve vyspělých zemích světa včetně států, kde je nehodovost dlouhodobě na velmi nízké úrovni (Švédsko, Velká Británie). Jedná se o přístup, kdy je pomocí statistických modelů vypočten očekávaný počet nehod na dané komunikaci v závislosti na jejích parametrech a dopravním zatížení. Tento postup je použitelný pro jakýkoli druh komunikací či křižovatek v případě, že lze získat potřebná data. Výhodou predikčních modelů je, že pracují s regresí k průměru, regulaci náhodné složky potom umožňuje empirický bayesovský přístup. Blíže je tento postup popsán v metodice Identifikace kritických míst na pozemních komunikacích v extravilánu (Striegler a kol., 2012). 1.4 Identifikace nehodových lokalit v rámci sítě Je možné se zabývat hledáním nehodových lokalit v rámci sítě (Yamada & Thill, 2004) nebo jejich částí s konstantní délkou (Flahaut a kol., 2003; Li a kol., 2007; Gundoglu, 2010). S přesnou lokalizací DN se můžeme zaměřit přímo na nehodová místa, kde dochází k nahloučení DN, která jsou lokalizovaná v rámci jednotlivých úseků komunikací. Z polohy DN vymezujeme délku nehodové lokality. Tento postup je velmi pružný a praktický. Nejsme svázáni žádnou předpřípravou dat, která obvykle spočívá v rozsekání silniční sítě na úseky konstantní délky. 1.5 Zaznamenávání dat Od listopadu roku 2006 jsou v České republice k dispozici data o poloze dopravních nehod zaznamenaných pomocí GPS. Od zmíněného data lze tedy uvažovat přesnější analýzu DN v závislosti na jejich poloze. Při zaznamenávání polohy byl před listopadem 2006 využíván systém lineárního referencování (LRS), který se též označuje jako staničení. Každý bod na linii lze přesně lokalizovat nejenom pomocí geografických souřadnic, ale mnohdy mnohem přesněji, pomocí jeho absolutní vzdálenosti od nějakého referenčního bodu dané linie, obvykle počátku kilometráže. 10
Staničení tedy může mít podobu např. km 10,1 silnice II/437, což znamená, že polohu DN známe s přesností na 100 m dané komunikace. Tento systém je, pokud jsou polohy objektů na liniích známy s dostatečnou přesností, velmi efektivní, protože odpadá přiřazování objektů dopravních nehod k nejbližší linii (viz Obrázek 3). Obrázek 3: Příklady možných chyb při přiřazování (snapování) DN zaměřených pomocí GPS k nejbližšímu úseku komunikace V případě databáze Policie ČR byly DN lokalizovány po 100 m, což je pro účely přesnějších analýz polohy, zejména na kratších úsecích, nedostatečné. Mimoto jsme analýzou původních dat a nových lokalizací zjistili, že se policisté mnohdy dopouštěli systematických chyb při určování polohy. Lineární referenční systém má totiž mimo svých kladných stránek (snadnost lokalizace bodu na linii bez nutnosti následného snapování), také nevýhody jako zejména naprostá nutnost znát historii staničení každé komunikace. Pokud se totiž z nějakého důvodu změní staničení, například dojde ke stavbě obchvatu obce trasy, potom se všechny vzdálenosti zvětší o rozdíl ve stavu před a po změně délky úseku (viz obrázek 4). 11
Obrázek 4: Rozdíl v hodnotách staničení komunikace po a před výstavbou obchvatu Další častou chybou je špatné přiřazení staničení u nehod, které se staly na křižovatkách. Nehodě je mnohdy přiřazeno číslo komunikace hlavní, ale staničení odpovídá komunikaci křižující (viz obrázek 5). Tato chyba může vzniknout při následném zpracování dat. Obrázek 5: Příklad vzniku systematické chyby staničení na křižovatce Poslední typ chyb, který zde uvedeme, přímo souvisí s přesností dat o dopravní infrastruktuře. GIS data o silniční síti vznikají digitalizací v určitém měřítku, což vede ke ztrátě detailů a nepatrnému zjednodušení vedení komunikací. Zatímco v rámci každého jednotlivého úseku jsou tyto odchylky od skutečnosti minimální v rámci metrů v součtu může rozdíl mezi skutečnou délkou a délkou digitalizované sítě 12
dosáhnout desítek i stovek metrů, což ukazuje obrázek 6, na kterém se absolutní chyba rozdílného staničení silnice I/50 zvyšuje od Slavkova u Brna směrem ke státní hranici se Slovenskem. Zaznamenané a skutečné staničení nehod se liší tím více, čím dále od počátku staničení se nehoda stala. Obrázek 6: Ukázka nárůstu absolutní chyby rozdílného staničení DN na silnici I/50 1.6 Zpracování dat v GIS Bez existence Geografických informačních systémů (GIS) by bylo velmi nesnadné pracovat s prostorovými daty. GIS jsou využívány Silniční databankou Ostrava při správě dat o silniční infrastruktuře. Základní představu o tom, jaké je využití GIS nejenom v dopravě přináší obecné práce o tomto systému (např. Longley a kol., 2010, Voženílek a kol., 2009 nebo Tuček, 1998). My se omezíme pouze na konstatování faktu, že data pro dopravní využití se od ostatních dat liší v několika ohledech. Obvykle obsahují nějakou formu lineárního referenčního systému a také dodržují tzv. topologická pravidla, což znamená, že dopravní sítě navazují na sebe, tvoří graf. Data se buď přímo analyzují v GIS, nebo častěji jsou z GIS ve vhodném formátu vyexportována do některého z výpočetních systémů pro modelování dopravy (např. TransCAD, PTV, MATSim). V našem případě jsme GIS využili jen jako prostředí pro správu a přípravu primárních dat, která následně vstupovala do výpočetních systémů Scilab a R, kde se prováděly geostatistické analýzy. 13
2. METODA KDE+ Identifikace nehodových lokalit spočívá v určení úseků komunikací, na kterých dochází k lokálnímu zvýšení počtu dopravních nehod (Elvik, 2008). Z hlediska metodologického třídění se tedy jedná o shlukovací úlohu. Shluková analýza je soubor algoritmů pro určení významných koncentrací bodových jevů v prostoru. Tyto algoritmy mohou být rozděleny dle měřítka na globální a lokální. Globální metody mají za cíl zhodnotit, zda daný prostorový vzor odpovídá náhodnému rozdělení nebo se jedná o statisticky významné shlukování. Mezi tyto metody patří například Moranovo I (Moran, 1950) a K-funkce (Ripley, 1976). Lokální metody se snaží identifikovat lokální shluky v geografickém prostoru. Příklady těchto metod jsou Geographical analysis machine (Openshaw a kol., 1987), Density Based Spatial Clustering (Ester a kol., 1996) a Scan Statistics (Kulldorf a kol., 1998). Ve vztahu k identifikaci shluků dopravních nehod však tyto metody narážejí na základní limitaci jejich restrikci na dvojrozměrný prostor, kdežto dopravní nehody jsou vázány na dopravní síť, tedy na jednorozměrný prostor. Některé z dvojrozměrných geografických metod byly redefinovány pro jednorozměrný prostor (Yamada a Thill, 2004; Xie a Yan, 2008), v současné době ovšem neexistuje state-of-the-art metoda pro identifikaci shluků dopravních nehod na základě jejich geografické polohy. To je jedním z důvodů, proč jsme se zaměřili na vývoj metody, kterou popíšeme v další kapitole. Mezi nejpoužívanější metody v rámci shlukové analýzy patří Jádrový odhad hustoty (Kernel Density Estimation; KDE, Geurts, 2003). Nejistota přesné polohy bodu, ke kterému se analýza vztahuje, je v metodě KDE vyjádřena pomocí tzv. okna. Z tohoto důvodu je metoda KDE někdy označována jako metoda Parzenových oken. Metody KDE nebo jim podobné byly aplikovány na linii (eg. Chung a kol., 2011) a posléze také v rovině (Sabel a kol., 2005; Erdogan a kol., 2008; Anderson, 2009; Plug a kol., 2011). V současných GIS jsou implementovány převážně metody planární, což s sebou nese riziko pro jejich chybnou aplikaci na sítě. 2.1 Metoda KDE pro aplikaci na linii Pro identifikace shluků na linii použijeme metodu KDE. Tato metoda, pokud se jedná o aplikaci v rámci standardních GIS software, však musí být upravena pro použití na liniích (viz Obrázek 7). 14
Obrázek 7: Schematická ukázka, jak může být planární KDE zavádějící na každé ze dvou paralelních cest se vyskytuje jedna nehoda. V planární verzi KDE je použita euklidovská metrika, což ovšem na síti není vhodné, neboť skutečnou vzdálenost mezi objekty je potřeba měřit vzhledem k síti, na které se mohou dané objekty vyskytovat. Vzdálenost zakreslených DN tudíž nelze měřit vzdušnou čarou, jak je znázorněno pro metodu KDE planární, ale je ji potřeba měřit po silnici, jak ukazuje metoda KDE síťová. Je dán silniční úsek délky L, na kterém se vyskytují dopravní nehody ve vzdálenostech X 1, X 2,, X n od počátku úseku (viz Obrázek 8). Úkolem je zjistit, zda se dopravní nehody na úseku shlukují, a určit, kde se případné shluky na úseku nacházejí. Pro účely analýzy jsou vyřazeny DN na křižovatkách, neboť charakter dopravy na křižovatkách je zcela odlišný od charakteru dopravy na přímých úsecích a DN v křižovatkách by ovlivňovaly nalezení shluku uvnitř úseku (viz kapitola 2.4 Síla shluku). Obrázek 8: Silniční úsek délky L s dopravními nehodami v místech X 1, X 2,, X n. Symbolem X označme náhodnou veličinu, že se v daném bodě x ϵ 0;L stane nehoda. Hodnoty X 1, X 2,, X n lze považovat za nezávislý náhodný výběr ze stejného rozdělení, jako má veličina X. Předpokládejme, že dopravní nehody mají náhodné rovnoměrné rozdělení na intervalu 0;L. V případě, že by byl tento předpoklad platný, znamenalo by to, že se DN na daném silničním úseku neshlukují. Tento předpoklad označíme jako hypotézu H 0. Budeme testovat platnost hypotézy H 0 proti alternativě, že se dopravní nehody shlukují, pomocí metody KDE. Na počátku je nutné zvolit typ jádrové funkce K(x) a velikost okna d > 0. Za jádrovou funkci se často volí Gaussova křivka nebo její aproximace. 15
Velikost a tvar okna by měly vyjadřovat rozsah nejistoty polohy DN. V případě Gaussovy funkce však jádro zasahuje celou reálnou osu. To by znamenalo, že DN jsou ovlivněny, i když v některých místech velmi málo, celým úsekem a ne jen svým okolím. Z tohoto důvodu byla pro analýzu namísto Gaussovy křivky zvolena tzv. Epanechnikova kvadratická funkce, která je nenulová pouze do vzdálenosti d od svého středu (viz Obrázek 9). Tuto funkci lze vyjádřit předpisem ( ) = 3 ( )( ) kde l (-d; d) (x) je indikátorová funkce intervalu (-d; d), to znamená ( )( ) ( ) ( ) Metoda KDE pracuje tím způsobem, že do každého bodu X i, ve kterém se stala DN, je umístěna jádrová funkce, poté jsou všechny tyto jádrové funkce sečteny a výsledek je vydělen počtem nehod. Tedy jádrový odhad hustoty pravděpodobnosti náhodné veličiny X je dán předpisem ( ) = 1 ) Poněvadž se jedná o hustotu, platí, že plocha pod grafem funkce ( ) je rovna jedné. Obrázek 9: Rozdíl mezi Epanechnikovým a Gaussovým jádrem. Zatímco Epanechnikovo jádro končí přímo na hranici okna, Gaussovo z definice této funkce nemá průsečík s osou x. 16
Výběr jádra nemá na výsledky takový vliv jako volba velikosti okna (Bailey a Gatrell, 1995). V literatuře se uvádí doporučená hodnota velikost okna od 50 metrů pro prostředí měst (Steenberghen a kol., 2010) po 500 metrů na dálnicích (Erdogan a kol., 2007). Použití pro oba případy je logické, protože s vyšší průměrnou rychlostí na dálnicích se také zvětšuje nejistota v přesném určení místa, kde došlo k počátku nehodového děje. Ve městech jsou oba body (počátek i konec nehodového děje, pokud budeme pro jednoduchost uvažovat ztrátu kontroly nad vozidlem a náraz do pevné překážky), mnohem blíže k sobě. Volby menší velikosti okna mají za následek výraznější lokální shlukování. Na druhou stranu při zvětšování velikosti okna dochází k většímu shlazení. Je zřejmé, že existuje určitá míra nejistoty, co se přesné lokalizace DN týká. Důvody jsou dva. Prvním je vlastní přesnost určení polohy. Druhým faktorem, který má vliv na lokalizaci nebezpečného úseku, je místo skutečné příčiny DN. I v případech, kdy dojde k nárazu vozidla např. do stromu, což je zřejmý bodový objekt s jasnou lokalizací, tak vlastní chyba řidiče nebo počátek DN např. smykem apod. nastane před tímto jednoznačně definovaným bodem (viz Obrázek 10). Z uvedeného tedy plyne, že všechny shluky by z principu měly být kratšími nebo delšími úseky. Pro účely analýzy jsme zvolili šířku okna 100 m, nicméně tuto hodnotu lze kdykoliv libovolně upravit. Obrázek 10: Schematické znázornění faktu, že místo skutečné DN, např. místo střetu vozidel, je obvykle vzdáleno od bodu, kde dojde ke ztrátě kontroly řidiče nad vozidlem. Tato vzdálenost se případ od případu liší, je závislá na rychlosti vozidla a představuje zdroj nejistoty, se kterým je třeba počítat. 17
Obrázek 11: Pokud se na úseku nachází více nehod, jejichž jádra se ovlivňují (překrývají), potom tato jádra sečteme. Výsledkem je například tento tvar funkce hustoty. Z Obrázku 11 je zřejmé, že se nám podařilo vymezit shluky jedná se o lokální maxima funkce hustoty. Tato lokální maxima jsou však různě vysoká, tj. liší se odhadem hustoty a je tedy jasné, že čím bude zmíněný vrchol vyšší, tím bude také významnější, než jeho nižší sousedé. Jedná se o obecný problém, jak srovnat dvě a více hodnot mezi sebou. Pokud chceme mít jistotu, že se nějaké dvě hodnoty skutečné významně liší a nejedná se o rozdíl v rámci nějaké očekávané chyby, musíme provést statistické testování významnosti. V tomto případě by se jednalo o stanovení meze h> 1/L, nad kterou budeme považovat lokální maxima za významné a hodné zájmu pro další zkoumání. O těch ostatních prohlásíme, že se jedná o fluktuace v rámci očekávané náhodné chyby a nepředstavují tedy případy, které by byly ze statistického pohledu důležité. Zmíněná mez h se obvykle nazývá hladina významnosti. Pro její stanovení jsou k dispozici různé postupy. Od zcela subjektivních, expertních, kdy povolaný odborník stanoví, kde má mez ležet, až po postupy zcela nezávislé na hodnotiteli. V našem postupu jsme použili objektivní stanovení hladiny významnosti. K získání objektivní hladiny významnosti používáme metodu Monte Carlo. 18
2.2 Metoda Monte Carlo Metoda Monte Carlo byla vyvinuta již ve 40. letech 20. století Johnem von Neumannem a Stanisławem Ulamem v Los Alamos a sloužila k matematickým výpočtům, které by standardní, deterministickou, cestou nebylo možno provést. Původně měla být metoda udržena v tajnosti, a tak dostala své krycí jméno Monte Carlo. V 50. letech však začala tato metoda nacházet uplatnění i v dalších oblastech přírodních věd (např. fyzika, chemie) a postupně se tak rozšířila a zpopularizovalo se její použití. Poněvadž je v dnešní době metoda Monte Carlo široce využívána a často modifikována na míru různým problémům, neexistuje její jednotná definice. Zjednodušeně řečeno se jedná o postup využívající opakovaných náhodných simulací za účelem určit vlastnosti či průběh nějakého jevu. Pro lepší představu, jak metoda Monte Carlo funguje, uvažujme následující jednoduchý příklad použití. Máme minci, o které chceme zjistit, zda je falešná či nikoliv. Falešnou mincí rozumíme takovou minci, u které padá při házení častěji jedna strana než druhá. Pokud mince falešná není, je pravděpodobnost padnutí panny stejná jako padnutí orla 0,5. Stanovíme tedy nulovou hypotézu: S pravděpodobností 0,5 padne při hodu mincí panna. a budeme ji testovat metodou Monte Carlo. Jedna náhodná simulace spočívá v několika (např. dvaceti) hodech mincí. Výsledkem této jedné simulace je odhad pravděpodobnosti padnutí panny. Pokud padne panna osmkrát, je tento odhad roven 8/20. Provedeme dostatečný počet náhodných simulací (např. sto) a z obdržených hodnot určíme 2,5% a 97,5% kvantily. Tyto kvantily tvoří hranice konfidenčního intervalu, přičemž pokud hodnota 0,5 v tomto konfidenčním intervalu neleží, zamítáme naši nulovou hypotézu, a tudíž je mince falešná. Podobně budeme postupovat při hledání shluků dopravních nehod. 2.3 Statistická významnost shluku Naší snahou je určit konstantu h, což je sledovaná vlastnost náhodného jevu rozmístění DN na úseku komunikace. Náhodnou simulací v tomto případě je náhodné rozmístění DN na úseku, které vychází z předem daného teoretického rozdělení. Tím je, v souladu s hypotézou H 0, náhodné rovnoměrné rozdělení. Máme-li pevně zadanou délku úseku L, počet nehod na úseku n a hladinu významnosti testu (zpravidla se volí hladina významnosti α = 5%), můžeme konstantu h odhadnout pomocí metody Monte Carlo následovně: 1. Vygenerujeme n bodů z náhodného rovnoměrného rozdělení na intervalu 0;L. 2. Pro takto vygenerované body následně vypočteme jádrový odhad hustoty. Provedeme dostatečný počet opakování bodů 1. a 2. (simulace) a jádrové odhady hustoty označíme g 1 (x), g 2 (x),...,g M (x), kde M je počet simulací. 19
1. Pro každé x o ϵ 0;L vypočteme 1 α kvantil z čísel g 1 (x 0 ), g 2 (x 0 ),...,g M (x 0 ). Tento kvantil označíme v(x 0 ). 2. Hladinu významnosti h určíme jako střední hodnotu funkce v(x) na intervalu 0;L. Pokud pomocí výše popsané metody KDE zjistíme, že v některé části úseku vystoupí jádrový odhad hustoty nad hladinu významnosti, lokalizujeme tuto část jako významný shluk. Uvedeným postupem je tedy možné určit, které shluky jsou v rámci úseku významné a které nikoliv. Obrázek 12: Ukázka určení hladiny významnosti. Modrá linie ukazuje jádrový odhad hustoty pro původní rozložení DN. Šedě jsou jádrové odhady hustoty pro jednotlivé simulace. Červenou linií je vykreslena hladina významnosti na úrovni 95. percentilu. V místech, kde modrá linie vystoupí nad hladinu významnosti, je identifikován významný shluk. Druhý shluk na tomto úseku není statisticky významný. Pro naše účely využijeme metodu Monte Carlo k vygenerování bodů z náhodného rovnoměrného rozdělení a pokaždé určíme jádrový odhad hustoty. Tento bod opakujeme například stokrát (viz Obrázek 12). Náhodné rovnoměrné rozdělení používáme proto, že předpokládáme náhodné rozmístění dopravních nehod na úseku podle hypotézy H 0. Tento předpoklad je oprávněný, protože o analyzovaném úseku skutečně nemáme vůbec žádné informace, pouze víme, jak je dlouhý a kde na něm jsou dopravní nehody. 1 1 Pro vysvětlení ještě dodejme, že bychom byli například schopni úsek rozdělit na místa s oblouky a na přímé úseky. Nicméně platí, že nemáme vůbec představu, zda je možné očekávat více nehod v obloucích nebo na přímých úsecích. Z toho důvodu je tento jednoduchý předpoklad také jediný oprávněný. Jeho falzifikací, tj. identifikací shluku, potom najdeme přesné místo a můžeme se dále zamýšlet nad příčinami významně vyššího výskytu nehod. 20
Za hladinu významnosti jsme zvolili α = 5%, což znamená, že pro každý bod na úseku bude zvolena hladina, pod níž se bude nacházet 95 dalších křivek 2 generovaných metodou Monte Carlo. Nyní srovnáme výsledek s nulovou hypotézou a rozhodneme o její platnosti pro daný úsek. Uvedeným postupem je tedy možné určit, které shluky jsou v rámci úseku významné a které nikoliv, resp. které jsou významnější než jiné. Obrázek 13: Ukázka dvou shluků, jeden je významný, druhý nikoliv. 2.4 Síla shluku Význam shluku lze kvantifikovat jako poměr výšky lokálního maxima jádrové funkce nad hladinou významnosti k celé výšce v daném bodě. Tuto kvantifikaci významu shluku nazýváme silou shluku. Hodnota síly shluku se pohybuje v intervalu od nuly do jedné. Síla shluku udává, nakolik je v daném místě porušen předpoklad náhodného rovnoměrného rozdělení dopravních nehod a umožňuje nám porovnávat významné shluky mezi sebou. V množině všech statisticky významných shluků je tedy možné sestavit pořadí podle síly shluku, jež je graficky reprezentována převýšením vrcholu shluku nad hladinou významnosti (viz Obrázek 15). Lze si představit situaci, kdy skupina DN bude tvořit významný shluk na jednom úseku, ale v rámci jiného již významná nebude, protože bude existovat nakupení většího množství DN opodál (viz Obrázky 2 To v případě, že budeme provádět 100 opakování. Jinak budeme volit křivku, jejíž pořadí bude 0,95 N, kde N zastupuje počet opakování Monte Carlo. 21
13 a 14). Tímto rovněž vysvětlíme, proč při identifikaci shluků v rámci úseku nebereme do úvahy DN, které se staly na křižovatkách (viz Obrázek 14). Obrázek 14: Ukázka vlivu nehod na křižovatce na výsledek analýzy. Prostřední dva shluky jsou stejné jako na Obrázku 13. Je zřejmé, že pokud bychom nevyřadili nehody na křižovatkách, bude docházet k podhodnocení výskytu shluků na ostatních částech úseků. Obrázek 15: Síla shluku. 22
Síla shluku je závislá na následujících čtyřech faktorech (viz Obrázek 16): počet nehod ve shluku délka shluku (rozmístění DN ve shluku) počet nehod na úseku, které nejsou ve shluku délka úseku Z pohledu pravděpodobnosti je výskyt silnějších shluků méně pravděpodobný než existence statisticky méně významných shluků. Jinými slovy, situace, ve které jsou DN těsně u sebe je vzácná (podle hypotézy H 0 ), tudíž je síla tohoto shluku vysoká lokální maximum jádrového odhadu hustoty je vysoko nad hladinou významnosti. Obrázek 16: Ukázka závislosti síly shluku na počtu DN ve shluku a celkovém počtu DN pro čtyři dvojice délky shluku a délky úseku. Z podstaty metody dále plyne, že místa se stejným uspořádáním DN budou mít různou sílu, pokud se budou nacházet na různě dlouhých úsecích (viz Obrázek 16). Vycházíme opět z teorie pravděpodobnosti, kdy pravděpodobnost, že se např. dvě nehody budou vyskytovat na úseku dlouhém 500 m ve vzdálenosti 50 m, je téměř dva krát větší, než na úseku dlouhém 1 000 m (viz Obrázek 17). Důležitý je rovněž absolutní počet ostatních DN v rámci úseku. Jejich počet ovlivňuje výšku hladiny významnosti a tedy i sílu daného shluku DN. Kombinace síly shluku s dalšími údaji, jako jsou délka shluku a počet nehod ve shluku, může poskytnout podstatné informace pro správce komunikací a organizace působící v oblasti silniční bezpečnosti. Například pro účely investic do infrastruktury je jistě důležité najít taková místa, kde dochází k významnému shlukování, děje se zde velké množství nehod (a tedy existuje největší předpoklad snížení nehodovosti) a zároveň se jedná o co nejkratší úseky, tedy investice budou nižší, než pro delší úseky. 23
Obrázek 17: Pravděpodobnost, že dvě nehody budou 50 m od sebe na 500 m a 1000 m úseku. 2.5 Stabilita shluku Jednak lze diskutovat časovou stabilitu shluku a také stabilitu v závislosti na vstupních datech a jejich vzájemnou souvislost. Je přirozené se zamyslet nad aplikací metody KDE+ také v čase, nejenom v prostoru na liniích. Musíme však nejprve zmínit skutečnost, že aplikací na linii nahrazuje simulace Monte Carlo s daným počtem nehod intenzitu dopravy. To znamená, že pro celý úsek považujeme intenzitu dopravy za konstantní. Vzhledem k tomu, že se jedná o mezikřižovatkové úseky v extravilánu, je takový předpoklad oprávněný. V případě analýzy podle času však již musíme znát, jaké jsou intenzity dopravy, což není dost dobře možné. Hodnoty RPDI, které se zjišťují během pravidelných sčítání, by sice bylo možné použít, ale není znám vztah mezi počtem nehod a intenzitou dopravy. Jednalo by se tedy o další komplikaci a parametr do vztahu. Je ale možné sledovat změnu vzoru DN v jednotlivých obdobích, kdy se díváme na změny v rámci jednoho úseku. Může nastat několik situací: Vzor je stabilní, shluky zůstávají na svých pozicích, nestabilní, shluky mizí, nestabilní, shluky vznikají Než začneme zkoumat příčiny nárůstu nebo poklesu nehod v čase, musíme si uvědomit, že od roku 2009 se významně zvýšil finanční limit, kdy jsou dopravní nehody v databázi DN Policie ČR registrovány 3. Pokud srovnáme dostupná data o DN pro období před rokem 2009 a po tomto datu, je zřejmý rozdíl 3 Podle novely zákona č. 274/2008 Sb. byl tento limit zvýšen na 100 000 Kč. Dopravní nehoda se však do DB Policie může dostat, i pokud je celková škoda nižší, než uvedená částka. Jestliže dojde ke zranění nebo poškození majetku třetí strany, DN se rovněž šetří Policií. 24
v počtu záznamů (viz Obrázek 18). Vzhledem k tomu, že v prvním plánu hodnotíme kritická místa výhradně podle polohy DN a nezabýváme se typem a následky, může být pro obě období rozdílný počet a lokalizace shluků. Obrázek 18: Pokles celkového počtu DN a nárůst podílu DN s následky na životě nebo zdraví Mimoto je zřejmě, že pokud dojde k sanaci nebezpečného místa a DN se tam již nebudou stávat, sníží se jeho relativní význam v časové řadě DN. Totéž platí i naopak. V závislosti na délce časové řady se může i nově vzniklé velmi nebezpečné místo jevit jako nevýznamné, pokud je časová řada dostatečně dlouhá. Na problematiku optimální délky časové řady pro výzkum nebezpečných míst upozorňuje např. Elvik (2008), který doporučuje časové období mezi 3 5 lety. Jedním z důvodů je právě možnost podobných vlivů a rovněž změny dopravy. Seřadíme-li si významné shluky podle síly shluku, získáme přehled o tom, ve kterých shlucích je nejvíce porušen předpoklad náhodného rovnoměrného rozdělení dopravních nehod. Pro praktické aplikace je navíc důležité, abychom určili shluky, které jsou nejen významné, ale také obsahují vysoký počet DN (za účelem největšího snížení nehodovosti). Z tohoto důvodu zavedeme pojem stability shluku. Mějme dán nějaký významný shluk o síle s 0. Budeme postupně odebírat a přidávat jednu, respektive dvě nehody. Nejprve z našeho shluku postupně odebíráme jednu nehodu a určujeme sílu nového shluku. Získáme tak stejný počet čísel jako je počet nehod ve shluku. Z těchto čísel vypočítáme průměrnou hodnotu a označíme ji s -1. Analogicky odebíráme dvě nehody a získáme hodnotu s -2. Ve druhém kroku přidáme doprostřed našeho shluku jednu nehodu a opět vypočteme sílu shluku. Toto číslo označíme s 1. Podobně přidáme dvě nehody a získáme číslo s 2. 25
Na základě pětice čísel (s -2, s -1, s 0, s 1, s 2 ) nyní rozhodneme o stabilitě shluku. Vypočteme směrodatnou odchylku těchto čísel a tu porovnáme s hodnotou 0,065 (0,05 pro povolenou změnu síly shluku + 0,015 za směrodatnou odchylku chyby metody Monte Carlo zjištěnou pomocí náhodných simulací). Jestliže je naše směrodatná odchylka menší než 0,065, hovoříme o stabilním shluku. Stabilní shluky jsou takové významné shluky, které mají vysokou sílu a zároveň obsahují dostatečný počet nehod. Vysoká síla a dostatečný počet DN znamená, že pokud budeme ze shluku odebírat nebo do shluku přidávat jednu či dvě nehody, stále bude tento nový shluk významný a také se nebude příliš měnit jeho síla. V praxi nás zajímají stabilní shluky, tedy shluky s vysokou silou a velkým počtem DN. Navíc je důležité eliminovat chyby v databázi DN (např. DN je zaznamenána dvakrát, DN je přiřazena ke špatnému silničnímu úseku, lokalizace DN je špatně zaznamenána apod.). 2.6 Tendence ke shlukování Existuje předpoklad, že různé typy dopravních nehod mají různou tendenci ke shlukování. Například nehody, které se stanou na železničních přejezdech, nehody, které jsou důsledky nárazů do mostních konstrukcí, propustků apod. jsou úzce prostorově vázány a tendence ke shlukování zde bude velmi vysoká. Naopak nehody, které se stanou jako důsledek technické závady, nehody, ke kterým dochází v důsledku oslnění řidiče světlomety jiného vozidla apod., zřejmě nejsou vázány na konkrétní místa v dopravní síti a jejich tendence ke shlukování bude minimální. Kromě těchto zdánlivě jednoznačných případů pak existuje celá řada typů dopravních nehod, u nichž není jisté, k jakému stupni prostorového shlukování dochází. Patří sem například nehody se zraněním nebo nehody končící smrtí. Pokud by u těchto nehod docházelo ke shlukování a tedy vazbě na určitá místa dopravní sítě, byla by to přívětivá zpráva pro případné opatření cílící na snížení závažnosti a počtu těchto nehod. (Elvik 2010) uvádí několik skupin dopravních problémů, které se dlouhodobě nedaří zlepšovat podíl nehod mladých řidičů, závažnost následků nehod se zranitelnými účastníky silničního provozu, zranitelnost u nehod, kdy dojde ke srážce vozidel s diametrálně rozdílným objemem a zvyšující se podíl nehod vzniklých jako důsledek nedodržení rychlosti. Jedno z možných vysvětlení, proč se tyto typy nehod nedaří redukovat, může být v prostorové disperzi, respektive v nedostatku shlukování, což uvádí i Elvik jako jednu z dimenzí problémů dopravní bezpečnosti (Elvik 2008). Proto, pokud cílíme na snížení počtu těchto nehod, musíme aplikovat bezpečnostní opatření po celé délce sítě (nebo alespoň na její velké části), což je vysoce nákladné. Naproti tomu snížení počtu nehod například v tunelech (silné shlukování) vyžaduje mnohem menší investice, protože úpravy se týkají jen zlomku délky komunikací. Při požadavku na vyjádření tendence shlukování určitého typu DN se jako první přiblížení nabízí použít poměr DN ve shluku a celkového počtu DN. 26
Uvedeme si nyní dva důvody, proč toto není vhodný přístup. Uvažujme dvě kategorie DN se stejným počtem DN a rovněž stejným počtem DN ve shlucích (nebo aspoň přibližně stejným). Tendence ke shlukování by měla vyjadřovat nejen to, jaký je podíl DN ve shluku, ale i jak moc jsou DN ve shluku u sebe (čím blíže, tím větší shlukování) a také jak početné jsou shluky (více se shlukuje ta kategorie, která má v každém shluku 2, 3, 4 DN nebo kategorie, která má sice shluků méně, ale každý čítá 8, 10, 12 DN?). Jestliže se DN ve shluku k sobě přibližují, pak roste síla tohoto shluku. Toto se děje rovněž v případě, že zvyšujeme počet DN ve shluku. Na základě této úvahy se ukazuje vhodné použít k hodnocení tendence ke shlukování právě sílu shluku. Ke každé DN ve shluku přiřadíme sílu shluku, ve kterém se nachází. Pokud se DN nenachází v žádném shluku, přiřadíme jí číslo nula. Všechny tyto hodnoty přiřazené k DN sečteme a vydělíme jejich počtem. Výsledné číslo budeme používat ke kvantifikaci tendence ke shlukování. 2.7 Omezení a modifikace metody Metoda KDE+ obsahuje omezení, které je důsledkem principu metody. Plyne ze skutečnosti, že se zabýváme sledováním rozdělení dopravních nehod, jako bodových jevů na linii, ale nikoliv jejich celkovým (agregovaným) počtem. Tato metoda tedy není z principu schopna určit, že daný úsek je nebezpečný jako celek, že se jedná o nehodový úsek. Pokud budou na takovém úseku dopravní nehody rozmístěny navíc rovnoměrně, potom se nebude detekovat ani jeden shluk, resp. nebudou případné shluky významné (viz Obrázek 19). Toto omezení však není chybou metody, neboť existuje mnoho dalších postupů, které tento problém, hledání celých nebezpečných úseků, řeší. Obrázek 19: Příklad úseků, kdy vysoký počet DN netvoří shluk a naopak, kdy na úseku se třemi DN je významný shluk. Vzhledem k matematické definici jádrové funkce se pro velmi dlouhé úseky mohou vyskytnout shluky obsahující pouze jednu DN, což ale nemá oporu v realitě. Upravili jsme proto minimální úroveň hladiny významnosti tak, aby výška jádra pro jednu DN představovala minimum, pod které nelze klesnout (viz Obrázek 20). Jedná se o korekci v případech nízkého počtu DN na úseku(malý statistický výběr). 27
Obrázek 20: Ukázka poklesu hladiny významnosti s délkou úseku. Jednotlivé barevné linie odpovídají počtu DN na úseku. Plné linie jsou od míst, kde výška jádra odpovídá jedné DN, již konstantní. Čárkovaná linie ukazuje další průběh hladiny významnosti, bez zavedení zmíněného omezení. 28
3. APLIKACE NA DOPRAVNÍ NEHODY V JIHOMORAVSKÉM KRAJI Metoda KDE+ byla aplikována na síť komunikací II. třídy Jihomoravského kraje, k identifikaci shluků byly použity dopravní nehody v extravilánu z let 2007 2011. Výběr území i dopravních nehod byl zvolen tak, aby bylo možné výsledky porovnat s metodou IDEKO (viz kapitola 7. Srovnání novosti postupů), jež byla již dříve na stejném území použita (Valentová a kol., 2013). Z důvodu změny zaznamenávání dopravních nehod v roce 2009 byly vybrány jen nehody, při nichž byly zaznamenány osobní následky (zranění či smrt). Analýza byla provedena pro tři tříletá období (2007 09, 2008 10, 2009 11), stejně jako ve výše zmíněném článku. Použitá silniční síť (extravilánové komunikace II. třídy v Jihomoravském kraji) má délku 974 km. Počet analyzovaných nehod v období 2007 2011 je 1 254. Metodou KDE+ bylo identifikováno 149 shluků, které mají souhrnnou délku 12 km (1,2 % celkové délky sítě, 16 % délky úseků, na nichž se stala alespoň jedna nehoda) a obsahují 387 nehod (30,8 % všech nehod). Po odstranění shluků, které obsahují pouze 2 nehody, mají zbývající shluky souhrnnou délku 6,7 km (0,7 % celkové délky sítě) a obsahují 183 (14,6 % všech nehod). Nejvyšší počet nehod v jednom shluku je 10, nejvyšší význam shluku je 0,74. 3.1 Analýza lokalit se shluky DN Pro ukázku jsme vybrali místo, které bylo popsáno autorizovaným inženýrem a certifikovanými auditory bezpečnosti pozemních komunikací, aby bylo zřejmé, že se jedná o skutečně nebezpečnou lokalitu (viz Obrázky 21 a 22). Za popis lokality, který byl zpracován v rámci projektu Identifikace a řešení kritických míst a úseků v síti pozemních komunikací, které svým uspořádáním stimulují nezákonné a nepřiměřené chování účastníků silničního provozu (IDEKO), děkujeme našim kolegům Ing. Havránkovi a Ing. Simonové z Centra dopravního výzkumu, v. v. i. 29
Obrázek 21: Nehodová lokalita, shluk DN a lokalizace dopravních nehod u obce Křtiny (podklad: WMS - Ortofoto ČUZK) Obrázek 22: Kolizní diagram nehod ve shluku obce Křtiny (podklad: WMS - Ortofoto ČUZK) 30
4. APLIKACE NA DOPRAVNÍ NEHODY V ČR - SHRNUTÍ VÝSLEDKŮ Metoda KDE+ byla aplikována na síť extravilánových komunikací III. a vyšší třídy mimo dálnice v celé ČR (viz Obrázek 23). Celková délka silniční sítě použité pro analýzu byla 38 675 km. Byly použity nehody z let 2009 až 2011 včetně. Bylo nalezeno 5 647 shluků obsahujících přibližně 40 % ze všech DN. Z těchto shluků bylo pouze 175 (3,1 %) stabilních se silou nad 0,5. Nejvíce se DN shlukují v Libereckém kraji (45,95 %), ovšem pouze necelých 9 % z těchto DN se nachází ve shlucích se silou nad 0,5. Oproti tomu minimální část DN ve shlucích je v Jihočeském kraji a na Vysočině. Omezíme-li se pouze na shluky se silou vyšší než 0,5, zjišťujeme, že zároveň k nejsilnějšímu a největšímu shlukování dochází v Plzeňském kraji. Tabulka 1: Statistické srovnání DN a shluků DN podle krajů ČR Délka Kraj DN Shluky shluků DN ve shlucích Shluky DN ve shlucích (síla 0,5) (síla 0,5) Stabilní shluky m abs. % abs. % abs. % abs. % JCK 3071 386 32865 1067 34,74 43 11,14 225 7,33 12 3,11 JMK 3058 433 40638 1259 41,17 40 9,24 193 6,31 9 2,08 KHK 3014 357 32667 1100 36,50 18 5,04 118 3,92 7 1,96 KVK 1452 184 18699 573 39,46 19 10,33 134 9,23 6 3,26 LIB 3208 367 35906 1474 45,95 35 9,54 285 8,88 15 4,09 MSK 3457 441 44283 1421 41,11 29 6,58 208 6,02 11 2,49 OLK 3654 445 45609 1480 40,50 54 12,13 290 7,94 14 3,15 PAR 3086 387 35350 1200 38,89 26 6,72 146 4,73 11 2,84 PLZ 2651 319 28548 996 37,57 50 15,67 305 11,51 22 6,90 STC 9831 1197 120551 4051 41,21 113 9,44 801 8,15 38 3,17 UNL 4823 595 60166 2016 41,80 52 8,74 341 7,07 15 2,52 VYS 2666 337 29268 927 34,77 35 10,39 167 6,26 9 2,67 ZLK 1455 199 20456 604 41,51 19 9,55 137 9,42 6 3,02 Celkem 45426 5647 545006 18168 39,99 533 9,44 3350 7,37 175 3,10 31
Obrázek 23: Přehled stabilních shluků DN v ČR. 32
5. SOFTWAROVÁ REALIZACE Jak bylo uvedeno, tato metodika vznikla v rámci projektu GIROSAF. Na webových stránkách projektu http://girosaf.cdvinfo.cz/projekt/ je k dispozici jednoduchá aplikace, která pro předem připravený formát dat spočítá lokalizaci shluků bodových objektů na linii a zároveň stanoví jejich význam. Pro výpočet lokalizace shluků pomocí metody KDE+ je potřeba vložit textový soubor, jenž na prvním řádku obsahuje pouze číslo udávající délku úseku. Na následujících řádcích jsou zapsány polohy DN na úseku, přičemž jeden řádek odpovídá jednomu číslu (jedné poloze DN). Zadává-li tedy uživatel DN, budou jejich polohy postupně na řádcích číslo dvě až n + 1. Před zpracováním každého souboru je jeho struktura zkontrolována. V případě nalezení chyby v zadání souboru je o této skutečnosti uživatel informován e-mailovou zprávou. Uživatel obdrží výstupní soubor na jím uvedenou e-mailovou adresu. Každý řádek tohoto souboru reprezentuje jeden nalezený shluk a obsahuje čtyři údaje počátek shluku, konec shluku, počet nehod ve shluku a sílu shluku. Pokud není nalezen žádný shluk, výsledný soubor tuto informaci uživateli sdělí. Ukázkové soubory vstupní i výstupní si lze stáhnout na výše uvedených webových stránkách projektu. Druhou možností je využít software KDE+, který byl vyvinut pro tyto účely. Software lze po registraci stáhnout z webové stránky www.kdeplus.cz. UŽIVATEL Přístup do aplikace na webových stránkách projektu http://girosaf.cdvinfo.cz - zadání emailové adresy pro zaslání výsledků - nahrání souboru s daty Kontrola a import dat Výpočet lokalizace shluků dle metody KDE+ SERVER SE R VE Zaslání emailu s výsledky Export výsledků Obrázek 24: Schéma postupu zpracování dat pro zájemce o aplikaci metody na jednotlivé úseky. 33
6. ZÁVĚR Dopravní nehody jsou závažným negativním jevem moderní společnosti. Naší snahou bylo nabídnout další postup, který doplní slabá místa stávajících metod. Rozvoj systémů GPS umožnil pracovat s přesnými polohami dopravních nehod a proto je námi vyvinutá metoda přesná, co se týká místa lokalizace kritické nehodové lokality. Metoda vhodně doplňuje existující metody, protože je snadno uplatnitelná tam, kde jsou velmi omezené zdroje dat, a jiné sofistikované metody nelze použít. Jedná se například o silnice nižších tříd, kde nejsou zjišťovány intenzity dopravy (RPDI) apod. Přestože jsme se snažili být co nejvíce konkrétní v popisu postupů vymezení a hodnocení významu shluků dopravních nehod, není převedení těchto myšlenek do praxe snadnou záležitostí. Proto jsme na stránkách girosaf.cdvinfo.cz připravili aplikaci, kde si zájemci mohou vyzkoušet uvedenou metodu. Rovněž nabízíme pomoc a spolupráci všem zájemcům o testování a aplikaci této metody na jejich datech. 34
7. SROVNÁNÍ NOVOSTI POSTUPŮ Metoda KDE+ je originálním postupem, který byl prvně publikován v práci Bíl a kol. (2013) v časopise Accident Analysis and Prevention. Základem metody jsou známé algoritmy KDE, které však mají omezení, jež KDE+ překonává. Tradičně, kritériem pro identifikaci nebezpečných míst na komunikacích byl zaznamenaný počet dopravních nehod. Na základě tohoto ukazatele jsou definovány tzv. nehodové lokality (Andres a kol., 2001). Tento postup však nedokáže zachytit náhodné fluktuace v počtech dopravních nehod, které jsou známé jako tzv. regrese k průměru. Namísto zaznamenaných počtů nehod se tedy jako kritérium pro identifikaci nebezpečných míst bere očekávaný počet nehod, jež je zpravidla vypočítán procedurou známou jako Empirický Bayesův odhad (Hauer, 2002). Očekávaný počet nehod je stanoven pomocí bezpečnostní funkce, která popisuje vztah mezi počtem nehod a charakteristikami komunikací. Tento postup byl nedávno použit k identifikaci nebezpečných míst na síti komunikací II. třídy v Jihomoravském kraji (Striegler a kol., 2012). 7.1 Přínos metody KDE+ v porovnání s přístupy existujícími v ČR Z metodického hlediska je způsob identifikace nehodových lokalit dle Andrese a kol. (2001) nevhodný hned z několika důvodů: využívá absolutních počtů dopravních nehod, které jsou ovlivněny náhodnými fluktuacemi, a používá plovoucího okna, což je kritizováno například Elvikem (2008). Podle stejného zdroje je optimální identifikovat nehodová místa na základě tří až pětileté řady, což tato metodika splňuje. Nevýhodou je i nekvalitní definice kritérií, což je demonstrováno výše na příkladu, kdy dvě smrtelné, dvě těžké a dvě lehké zranění nemusí být vyhodnoceny jako nehodová lokalita, pokud se staly ve třech po sobě jdoucích letech. Výhodou metody je, že je možné ji aplikovat jak na křižovatky, tak na mezikřižovatkové úseky, nevýhodou ovšem je, že kritéria pro určení nehodových lokalit na křižovatce prvních tříd, silnici III. třídy i dálnici jsou totožná, což zdaleka nereflektuje charakter provozu či jeho intenzitu. Metodika IDEKO obchází nevýhody nehodových lokalit tím, že stanovuje očekávaný počet nehod namísto absolutního a tím bere v potaz specifika jednotlivých posuzovaných lokalit. Valentová a kol. (2013) ukazují, že lokality identifikované pomocí metodiky IDEKO jsou časově stabilnější než nehodové lokality identifikované v témže období (tzn., stejná místa jsou identifikovaná jako riziková v po sobě jdoucích letech). Nevýhodou metodiky IDEKO je náročnost konstrukce modelů nehodovosti. Metodika IDEKO je použitelná pro všechny typy komunikací i pro křižovatky v extravilánu. Její použitelnost ovšem limituje nedostatek dat pro tvorbu statistických modelů, např. pro komunikace III. třídy je téměř nemožná, protože na těchto komunikacích nejsou známé intenzity dopravy, které jsou hlavním vysvětlujícím parametrem modelů bezpečnosti. Některé další informace vhodné jako proměnné modelu nejsou v současné době dostupné v digitální podobě a pro projekt IDEKO musely být zpracovány ručně, což zvyšuje náročnost přípravy dat. Ačkoli je tedy metoda dobře teoreticky zakotvena, její přenositelnost je omezená zejména z důvodu náročnosti přípravy dat. 35
Druhou nevýhodou je, že metodika IDEKO pracuje s předem definovanými úseky komunikací, ke kterým jsou vztaženy počty nehod. Pokud dojde ke změně infrastruktury například vinou stavebních úprav se délka komunikace v určitém úseku zvýší o 100 m dojde ke změně všech úseků, nutnosti opětovně jim přiřadit všechny informace, a znovu vypočíst očekávané počty nehod. Rovněž existuje nejistota v poloze zaznamenaných nehod, což se může projevit nesprávným přiřazením nehody k danému úseku. Zároveň metoda IDEKO předpokládá prostorovou nezávislost, tedy že počet nehod na určitém úseku je nezávislý na počtech nehod na úsecích sousedních. Tento předpoklad však není realistický (Flahaut a kol., 2003). Metoda KDE+ je přímo na předpokladu prostorové autokorelace založena, a proto změna staničení (například prodloužení komunikace) má jen minimální vliv na identifikaci shluků dopravních nehod, neboť shluky jsou identifikovány pouze na základě vzájemné polohy nehod. To zároveň odstraňuje problém s pořizováním dat, poněvadž není nutné znát intenzity dopravy ani další charakteristiky dopravní infrastruktury, aby bylo možné metodu použít. Proto metoda snadno může být použita jak v intravilánech, tak i v extravilánech, a rovněž na libovolné třídě komunikací. Musí být pouze zaručeno, že intenzita dopravy v rámci analyzovaných úseků je totožná, metodu je tedy vhodné použít pro mezikřižovatkové úseky. Výhodou metody KDE+ oproti definici nehodových lokalit z INFOBESI je její objektivita (shluky dopravních nehod jsou identifikovány na základě objektivního statistického zhodnocení, nikoli subjektivní definice), oproti metodě IDEKO pak ve snadné přenositelnosti a datové nenáročnosti jediné údaje nutné k identifikaci shluků jsou délka úseku a pozice nehod. Nevýhoda metody KDE+ spočívá v nemožnosti použít tuto metodu pro identifikaci nebezpečných křižovatek a dále nemožnosti ohodnotit celé úseky jako bezpečné/nebezpečné. Zatímco metoda IDEKO je schopná zhodnotit, zda daný úsek komunikace je celkově nebezpečný, ale nedokáže již dále identifikovat, kde přesně se toto rizikové místo nachází, metoda KDE+ není schopná ohodnotit celý úsek, ale umožňuje i v rámci bezpečného úseku najít místo, kde se nehody shlukují. Obě metody (IDEKO a KDE+) jsou založeny na rozdílném přístupu k nehodovosti (dopravně inženýrský geografický) a obě poskytují rozdílné informace. Zatímco shluky dopravních nehod, identifikované metodou KDE+, jsou lokálními místy koncentrace nehod nezávislé na intenzitě dopravy či dalších parametrech silniční infrastruktury, kritické úseky identifikované metodou IDEKO jsou segmenty silniční sítě s vyšší než očekávanou nehodovostí, kdy nezávisí na vzájemné poloze nehod, ale jen na jejich očekávaných počtech. Metoda IDEKO detailně popisuje vztah mezi počtem dopravních nehod a atributy komunikací, a tudíž umožňuje provádět odhady zmírňování nehodovosti při aplikaci určitých bezpečnostních opatření, je však málo robustní a nepřenosná do jiných geografických regionů či na jiný typ komunikací. Metoda KDE+ sice neposkytuje vysvětlení koncentrace dopravních metod, ale díky své robustnosti, snadnosti výpočtu a datové nenáročnosti může být automatizována a nasazena například jako webová služba, dynamicky pracující s kontinuálně pořizovanými daty. 36
7.2 Srovnání mezi metodami KDE+, IDEKO a INFOBESI na území Jihomoravského kraje Metoda KDE+ identifikovala největší počet shluků, který zároveň dosahuje nejmenší souhrnné délky. Metoda IDEKO identifikovala méně než poloviční počet rizikových lokalit a metodika nehodových lokalit INFOBESI vedla k identifikaci srovnatelného počtu nehodových lokalit, ovšem s více než trojnásobnou délkou. Shluky identifikované metodou KDE+ vykazují nejnižší temporální stabilitu, tedy pokud je shluk identifikován v jednom období, má menší šanci, že bude identifikován i v období následujícím, než nehodové lokality nebo riziková místa, identifikovaná metodikou IDEKO. Tabulka 2: Srovnání nehodových lokalit (shluků) metod KDE+, IDEKO a INFOBESI. KDE+ IDEKO INFOBESI Asolutní počty nehodových lokalit (shluků) 149 65 125 Celková délka nehodových lokalit (shluků) [km] 11,937 21,706 36,963 Metoda IDEKO je založena na očekávaném počtu DN, a pokud ten je malý, tak i lokalita s pouze jednou nehodou může být vyhodnocena jako nebezpečná, což je případ šesti lokalit, identifikovaných jako rizikové (viz obrázek 25B). Shluky dopravních nehod identifikované metodou KDE+ obsahují vždy nejméně 2 nehody a pomocí ukazatelů stability a významu je lze dále filtrovat a řadit tak, aby byly vybrány ty skutečně důležité. Rizikové lokality IDEKO obsahují 172 nehod, tedy poloviční počet než shluky KDE+, ovšem na dvojnásobné délce komunikací. Z uvedených srovnání plyne, že metoda KDE+ má díky své podstatě nejvyšší schopnost zaostřit nebezpečné místo v rámci úseku komunikace, čehož ostatní dvě metody nejsou z definice schopny, protože pracují s předem danou délkou úseku (viz obrázek 25A, 25C, 25D). Predikční metoda IDEKO taktéž identifikuje nebezpečná místa tam, kde nebyly zaznamenány žádné nehody. Proto je nejvyšší prostorová shoda mezi metodou KDE+ a INFOBESI. Z našeho pohledu je optimální použít nejprve metodu KDE+ a poté IDEKO. Oba postupy se mohou vhodně doplňovat. 37
Obrázek 25: Srovnání metod KDE+, IDEKO a INFOBESI. 38