GEODEMOGRAFICKÁ DATA PRO CHYTŘEJŠÍ MĚSTA Ing. Lukáš Kovárník
BIG DATA A GEODEMOGRAFIE Big data v pojetí T-Mobile jsou data z různých datových zdrojů o poloze mobilních telefonních čísel či vozidel v reálném čase. Znalost polohy telefonního čísla v reálném čase je základním předpokladem pro fungování GSM sítě mobilního operátora. Tato signalizační data ze sítě operátora se dále zpracovávají. 2
GEODEMOGRAFICKé úlohy Signalizační data mobilního operátora umožňují anonymně online analyzovat: aktuální rozložení obyvatelstva mobilitu obyvatel v prostoru mobilitu obyvatel v čase 3
JE TO bezpečné A AnOnYMnÍ? Anonymizace Veškeré datové zdroje jsou sofistikovanými algoritmy anonymizovány. Ochrana proti zneužití Tyto algoritmy se pravidelně mění, aby nemohlo dojít ke zneužití dat a spojení s konkrétním subjektem. Agregace Veškeré datové zdroje se po zpracování mažou a výstupem jsou pouze agregované hodnoty měření zadaných úloh. 4
GEODEMOGRAFICKÁ DATA SE zpracovávají JIž DlOuHO, AlE Stávající možnosti měření pohybu obyvatel jsou do jisté míry omezené, neboť metody měření jsou převážně založeny na sběru informací na relativně malém vzorku populace v jeden časový okamžik. Sběr těchto informací bývá obvykle relativně náročný ať už z pohledu nákladů, času popřípadě kapacit určených pro sběr informací. 5
KDE vám velká DATA MOHOu POMOCI? Využití pro státní správu a samosprávu INFORMOVANĚJŠÍ KRIZOVÉ ŘÍZENÍ OPTIMALIZACE VEŘEJNÉ DOPRAVY KOORDINACE ROZVOJE MĚST A KRAJŮ VE VAZBE NA VYŠŠÍ SAMOSPRÁVNÍ CELEK EFEKTIVNÍ ŘÍZENÍ V OBLASTI CESTOVNÍHO RUCHU PŘÍPRAVA KVALITNÍHO ÚZEMNÍHO PLÁNU 6
DATA SE nafukují! umíme SI S TÍM PORADIT? ISSS 7.-8.4. 2014 7
JAK SE DATA zpracovávají? proces a metodika Online sběr anonymizovaných signalizačních dat Spojení s dalšími zdroji dat (mapy, ČSÚ, ) Statistické metody pro přepočet na populaci 8
PŘÍPADOvé STuDIE MODEl SPÁDOvOSTI čr v PRACOvnÍ DEn 9
PŘÍPADOvé STuDIE MODEl SPÁDOvOSTI čr v PRACOvnÍ DEn 10
PŘÍPADOvé STuDIE - POHYb ObYvATElSTvA praha pracovní den noční Hodiny 2,0 1,8 1,6 1,4 1,2 1,0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
PŘÍPADOvé STuDIE - POHYb ObYvATElSTvA praha pracovní den denní Hodiny 2,0 1,8 1,6 1,4 1,2 1,0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
PŘÍPADOvé STuDIE - KRIzOvé ŘÍzEnÍ dopad povodní 2013 na mobilitu V karlíně modrá běžné pondělí červená povodňové pondělí 13
PŘÍPADOvé STuDIE OPTIMAlIzACE veř. DOPRAvY Vyjížďka Z černého mostu V pracovní den 14
45% PŘÍPADOvé STuDIE CESTOvnÍ RuCH kolik nocí přespí návštěvníci na lipně 40% 35% 30% 25% 20% 15% 10% 5% 0% 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 9 10 1 2 3 4 5 6 7 9 1 2 3 4 5 6 7 Czech Republic Germany Netherlands Russian Federation Lipno 15
PŘÍPADOvé STuDIE - CESTOvnÍ RuCH kam jezdí návštěvníci lipna na Výlety? 16
PŘÍPADOvé STuDIE CESTOvnÍ RuCH jaká je průměrná délka návštěvy Ve dnech podle Země původu na lipně? 2,5 2,25 2 2,04 1,57 1,5 1,44 1,36 1,33 1,19 1,19 1,09 1,06 1 0,92 0,85 0,82 0,5 0,53 0,48 0,45 0,25 0,23 0,17 0,11 0 17
PŘÍPADOvé STuDIE CESTOvnÍ RuCH rozložení obyvatel prahy během Víkendu Běžný víkend Prodloužený Velikonoční víkend 18
1087 1482 700 739 975 1560 793 827 1071 926 1350 1659 1248 908 1035 1069 1136 1625 1451 801 2023 2078 2041 2033 2366 2624 2647 1061 1547 1828 2041 PŘÍPADOvé STuDIE CESTOvnÍ RuCH počet návštěvníků po jednotlivých dnech V mikulově pracovní den svátek víkend 3000 2500 2000 1500 1000 500 0 19
PŘÍPADOvé STuDIE CESTOvnÍ RuCH kolik lidí navštívilo Více šumavských oblastí ZároVeň Kvilda Modrava Prášilsko Stožecko datum od datum do křížová návštěva x x 27.6.2014 29.6.2014 1926 x x 27.6.2014 29.6.2014 231 x x 27.6.2014 29.6.2014 145 x x x 27.6.2014 29.6.2014 135 x x 27.6.2014 29.6.2014 51 x x 27.6.2014 29.6.2014 28 x x x 27.6.2014 29.6.2014 27 20
DEnnÍ vs. noční POPulACE kde je Více lidí přes den a kde přes noc? všední den Poměr mezi denní a noční populací (noční populace = 100) noční populace obyvetelstvo v 03:00 hod. denní populace obyvatelstvo v 11:00 hod.
DISTRIbuCE v PROSTORu PRO vybrané SKuPInY Výskyt cizinců na území prahy PRAHA 24h workday RUSSIAN GERMAN ITALIAN 30000 25000 20000 15000 10000 5000 Průměrné rozložení cizinců přes den (24 hodin) 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 Italian Russian German
zdroje zahraničních návštěvníků čr Other Germany Hungary UK Austria Italy Russia Slovakia Poland
DISTRIbuCE v PROSTORu kde je nejvíce lidí přes den Ve Frýdku-místku? 24
DISTRIbuCE v PROSTORu kde je nejvíce lidí přes den Ve Zlíně? 25
MOTOGP AnAlýzA návštěvnosti AKCE 100000 80000 60000 40000 20000 0 Počet návštěvníků MotoGP 2014 v jednotlivé dny 42144 60204 78432 pátek sobota neděle 60000 50000 40000 30000 20000 10000 0 Počty osob v průběhu MotoGP 2014 Součet z přítomní Součet z nově příchozí 4 6 8 10 12 14 16 18 20 22 4 6 8 10 12 14 16 18 20 22 4 6 8 10 12 14 16 18 20 22 pátek sobota neděle Počty návštěvníků podle počtu návštěv Příspěvek návštěvníků (osobodny) podle počtu návštěv 1 2 3 3333 0 1854 2 5849 4 55626 66660 58494 1 2 3
PŘÍPADOvé STuDIE průměrný čas strávený V praze ISSS 7.-8.4. 2014 27
PŘÍPADOvé STuDIE integrovaný systém středisek a metropolitní areál prahy ISSS 7.-8.4. 2014 28
next-generation bigdata PlATFORMA Geomapy: GPS + objekty (např. google mapy, restaurace, bankomaty atd..) Live info počasí, kalendář, kulturní akce,atd. Packet inspection: chování na síti při využiti dat (aplikace, služby atd.) Koncové technologie: typ zařízení, využití 3G, LTE atd. Tržní vstupy: market sharena zařízení, podíl na trhu ČR,v rámci DTAG atd. CRM:Identifikace zákazníka věk, segment, platební morálka, spend, tarify, pohlaví, atd.. Socio-vstupy: (např. ČSÚ) obyvatelstvo, staří, kraje, okresy atd. Síťová Data:CDR, geolokacesim, data traffic, signalizační data Procesing: umožňuje parametrizaci výstupů (např. oblast, čas, míra obohacení daty). Vstupy 3tích stran: partner/zákazník dodá vstupy (data) pro korelaci AnOnYMIzACE ISSS 7.-8.4. 2014 29
nové MOžnOSTI budoucího využití DAT Takto obohacená data umožní detailnější analýzy vybraných oblastí a konkrétních sociologických skupin Korelace zdrojů třetích stran umožňující extrapolaci vybraného vzorku dat dodaných příjemcem analýzy Cílené predikce pro skupiny obyvatel a oblasti vázané na živé a očekávané události ISSS 7.-8.4. 2014 30
DĚKuJI za POzORnOST. OTÁzKY?