DETEKCE ANOMÁLNÍHO CHOVÁNÍ UŽIVATELŮ KATASTRÁLNÍCH MAPOVÝCH SLUŽEB

Podobné dokumenty
Porovnání rychlosti mapového serveru GeoServer při přístupu k různým datovým skladům

Sdílení a poskytování dat KN. Jiří Poláček

Otevřený katastr (OK)

INSPIRE a katastr nemovitostí ČR. Jiří Poláček

Petr Souček Český úřad zeměměřický a katastrální

SRSW4IT Inventarizační SW. Prezentace aplikace. Vedoucí DP: ing. Lukáš Macura Autor: Bc. Petr Mrůzek

Vedoucí práce: Ing. Petr Soukup, Ph.D. Fakulta stavební Katedra mapování a kartografie Obor Geoinformatika

Publikování map na webu - WMS

Možnosti a podmínky využití prostorových dat Zeměměřického úřadu

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9

TESTOVÁNÍ STAHOVACÍCH SLUŽEB ČUZK TÉMATU BUDOVY. Jan RŮŽIČKA, Jiří HORÁK, Tomáš INSPEKTOR

Ohlédnutí do minulosti Jak to funguje Právní předpisy Výstupy z ISKN Výstupy z RÚIAN. Český úřad zeměměřický a katastrální

2 Téma CP (parcely) Prohlížecí služby Stahovací služby ONLINE (WFS) Stahovací služby (předpřipravené soubory GML) Závěr

Výstupy z ISKN Aplikace Dálkový přístup Nahlížení do KN Webové služby Výstupy dle INSPIRE Výměnný formát. Petr Souček, Martin Šmejkal

Nové služby nad údaji KN. JiříPoláček

GeoportálČÚZK webová služba transformace souřadnic

1 Webový server, instalace PHP a MySQL 13

Manuál pro implementaci aplikace Na poštu

FoxStat. Change the Net.Work. Nástroj pro záznam a analýzu datového provozu

Celoměstská geografická data a mapové služby

VÝKONOVÉ A ZÁTĚŽOVÉ TESTY STAHOVACÍCH SLUŽEB ČUZK DLE POŽADAVKŮ INSPIRE

Archivace relačních databází

ArcGIS Server 10.1/10.2

Marketingová komunikace. 2. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK1aPH/N9KMK1bPH (um1a1ph/um1b1ph)

Služby katastru nemovitostí. JiříPoláček

Poskytovaní dat a služeb z katastru nemovitostí

PŘEHLED A MOŽNOSTI VYUŽITÍ WEBOVÝCH MAPOVÝCH SLUŽEB

Load Balancer. RNDr. Václav Petříček. Lukáš Hlůže Václav Nidrle Přemysl Volf Stanislav Živný

Úvod do databázových systémů

INSPIRE SLUŽBY Téma PARCELY (CP) Téma ADRESY (AD) Téma SPRÁVNÍ JEDNOTKY (AU) Témata ve správě Zeměměřického úřadu. Vyhledávací a transformační služba

Měření teploty, tlaku a vlhkosti vzduchu s přenosem dat přes internet a zobrazování na WEB stránce

ÚVOD DO DATABÁZÍ. Metodické listy pro předmět

Georeferencované mapové podklady z WMS služeb

ÚKM, její vedení viskn, poskytování údajů ÚKM

Zajištění dostupnosti vybraných IT služeb

Současný svět Projekt č. CZ.2.17/3.1.00/32038, podpořený Evropským sociálním fondem v rámci Operačního programu Praha adaptabilita

INSPIRE SLUŽBY Téma PARCELY (CP) Téma ADRESY (AD) Téma SPRÁVNÍ JEDNOTKY (AU) NÁRODNÍ SLUŽBY Téma KATASTRÁLNÍ MAPA (KM) Téma ROZŠÍŘENÉ JEDNOTKY (UX) Vy

Propojení GIS a on-line mapových nástrojů a služeb - MapInfo a Google Earth WMS / WFS služby

Školení v rámci zemědělské a lesnické činnosti 2014

Aplikační podpora národní inventarizace kontaminovaných míst

FlowMon ADS 3. Nová generace řešení pro analýzu provozu datové sítě. Pavel Minařík

1. Webový server, instalace PHP a MySQL 13

ROZŠIŘOVÁNÍ MOŽNOSTÍ PUBLIKACE DAT ZEMĚMĚŘICKÉHO ÚŘADU

MÜLLEROVY MAPY ČECH A MORAVY NA INTERNETU

Uživatelská dokumentace

DOKUMENTACE MTJ SERVICE S.R.O.

Jádrem systému je modul GSFrameWork, který je poskytovatelem zejména těchto služeb:

Instalace a konfigurace

Poskytování údajů ČÚZK. Jiří Poláček

Zpřístupnění Müllerových map Čech a Moravy na internetu

Advanced IT infrastructure control: Do it better, safer, easier and cheaper. FlowMon ADS 3. Nová generace řešení pro analýzu provozu datové sítě

Technologický pasport Masarykovy univerzity

Spark SQL, Spark Streaming. Jan Hučín

Strategie ochrany před negativními dopady povodní a erozními jevy přírodě blízkými opatřeními v České republice

Otevřená data a služby ČÚZK. JiříPoláček

KMA/PDB. Karel Janečka. Tvorba materiálů byla podpořena z prostředků projektu FRVŠ č. F0584/2011/F1d

Michal Krátký. Tvorba informačních systémů, 2008/2009. Katedra informatiky VŠB Technická univerzita Ostrava. Tvorba informačních systémů

Přehled poskytovaných dat a služeb ČÚZK. Jiří Poláček Český úřad zeměměřický a katastrální

Monitoring SQL Server, Resource Governor, Tracing SQL Server

Proč je potřeba řešit autorské právo?

Dobývání znalostí z webu web mining

Svět mapových služeb. Vladimír Špaček, Sr. consultant Intergraph ČR

Diagnostika webových aplikací v Azure

Microsoft Azure Workshop

Hlavní rysy produktu MapInfo Professional

Návod na použití mapového portálu MAP SQUARE

Spark SQL, Spark Streaming. Jan Hučín

, ČVUT v Praze Připravil: Ing. Zdeněk Patočka Letecké laserové skenování a jeho využití v inventarizaci lesa

Operační program podnikání a inovace pro konkurenceschopnost

Platební systém XPAY [

Úvodem 9. Zpětná vazba od čtenářů 10 Zdrojové kódy ke knize 10 Errata 10. Než začneme 11

Petr Souček Český úřad zeměměřický a katastrální

TRANSPORTY výbušnin (TranV)

Informační systémy 2006/2007

O Apache Derby detailněji. Hynek Mlnařík

Využití OOP v praxi -- Knihovna PHP -- Interval.cz

Aplikace je program určený pro uživatele. Aplikaci je možné rozdělit na části:

SYLABUS IT V. Jiří Kubica. Ostrava 2011

M Administrace Microsoft SQL Server Popis: Absolvent kurzu bude umět: Požadavky pro absolvování kurzu: Kurz určen pro: Literatura:

Výzva k podání nabídek, na kterou se nevztahuje postup pro zadávací řízení dle zákona č. 134/2016., o zadávání veřejných zakázek 1

MONITORING EROZE ZEMĚDĚLSKÉ PŮDY. Mgr. Daniel Žížala Ing. Jiří Kapička Školení 2016

17. července :51 z moravec@yahoo.com

Ukládání a vyhledávání XML dat

VDP Veřejný dálkový přístup kdatům RÚIAN

Digitální mapa veřejné správy. Portál DMVS a ÚKM

Služby informačního systému katastru nemovitostí ČR. Jiří Poláček

Technologie. Osnovy kurzu: Školení správců systému. 1. den, dopolední blok

Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová. 5. Statistica

Webové služby pro prostorová data

Srážky se zvěří Aplikace geoinformatiky v dopravním výzkumu BRNOSAFETY RNDr. Michal Bíl, Ph.D Brno

Advanced IT infrastructure control: do it better, safer, easier and cheaper. FlowMon ADS Moderní řešení detekce průniků a anomálií

ESRI v národním kroji

Informace o zaměstnancích v insolvenčním řízení v aplikaci KS mzdy

GIS v montérkách. Dalkia implementuje ArcGIS for Smartphone. Mgr. Ivana Niedobová Ing. Stanislav Šplíchal 21/11/2013

GIS a nemapové služby

Sr. consultant Intergraph ČR

RELAČNÍ DATABÁZE. Cíl:

Sledování výkonu aplikací?

Nasazení CA Role & Compliance Manager

Transkript:

DETEKCE ANOMÁLNÍHO CHOVÁNÍ UŽIVATELŮ KATASTRÁLNÍCH MAPOVÝCH SLUŽEB VYSOKÁ ŠKOLA BÁŇSKÁ - TECHNICKÁ UNIVERZITA OSTRAVA Hornicko-geologická fakulta Institut geoinformatiky Ostrava 2014 Autorka: Bc. Radka MATOLÁKOVÁ Vedoucí diplomové práce: Ing. Jan RŮŽIČKA, Ph.D.

OSNOVA 1. Cíle 7. Analýza chování uživatelů 2. Postup zpracování 8. Identifikace a kategorizace vzorů 3. Vstupní data 9. Anomální chování 4. Ukázka požadavku 10. Návrh detekce anomálního chování 5. Implementace databáze 11. Praktické využití 6. Průzkumová analýza dat 12. Literatura a zdroje 14. 5. 2014 Bc. Radka Matoláková 2

CÍLE Návrh datové struktury pro ukládání a zpracování logů webových služeb WMS Implementace databáze Průzkumová analýza dat logů Analýza chování uživatelů WMS Identifikace a kategorizace vzorů činností u služeb WMS Návrh detekce anomálního chování uživatelů 14. 5. 2014 Bc. Radka Matoláková 3

POSTUP ZPRACOVÁNÍ VZORKU DAT Získání vzorku dat logů z WMS služby KN ČUZK Průzkum vzorku, Statgraphics, volba databázového systému Návrh databázového schématu, CASE studio Implementace databáze PostgreSQL Import vzorku dat do relační databáze PostgreSQL Kontrola a optimalizace databáze pomocí SQL dotazování, Průzkumová analýza vzorku dat 14. 5. 2014 Bc. Radka Matoláková 4

POSTUP ZPRACOVÁNÍ ROZSÁHLÝCH DAT Získání rozsáhlých dat, import do databáze SQL dotazování a manipulace s daty Průzkumová analýza logů, analýza chování uživatelů Data mining, algoritmus suffix tree, jazyk Python, identifikace a kategorizace vzorů činností u služeb WMS Specifikace anomálního chování, návrh detekce anomálního chování 14. 5. 2014 Bc. Radka Matoláková 5

LOG SOUBORY Rozsáhlé logy webových služeb Období od 3. března 2014 do neděle 9. března 2014 2,5 mil záznamů za den Datum akce Čas akce Cíl akce Požadavek Otisk IP adresy HTTP status kód Počet byte, které server odeslal Počet byte, které server přijal Délka trvání akce [ms] Anonymizovaná IP adresa - zakódování md5 funkcí Otisk IP adresy Cb0447e9c75448bbaee0ecd300e47ea8 14. 5. 2014 Bc. Radka Matoláková 6

UKÁZKA POŽADAVKU GetMap &REQUEST = GetMap (nebo GetCapabilities) &SERVICE=WMS &VERSION=1.1.1 &LAYERS=RST_KN_I,RST_KMD_I,parcelni_cisla_i,hranice_parcel_i,omp &STYLES=&FORMAT=image/png &BGCOLOR=0xFFFFFF &TRANSPARENT=TRUE &SRS=EPSG:4326 &BBOX=14.3701171875,50.10648772767332,14.39208984375,50.120578 09796007 &WIDTH=256&HEIGHT=256 14. 5. 2014 Bc. Radka Matoláková 7

IMPLEMENTACE DATABÁZE Návrh schématu - software CASE STUDIO Export schématu do jazyka SQL Kontrola, korekce a začištění skriptu Vytvoření databáze Import dat pomocí skriptu v jazyce Python ošetření výjimek a rozdělení dle mezer a znaku & Vytvoření zálohy schématu i dat funkcí pg_dump 14. 5. 2014 Bc. Radka Matoláková 8

PRŮZKUMOVÁ ANALÝZA DAT 1/2 Denně v průměru: 5 975 uživatelů 2,4 mil. požadavků na mapu, tj. 108,6 tisíc požadavků za hodinu Průměrný počet požadavků z 1 IP adresy je 229 Průměrná délka vyřízení požadavku 661 ms Maximální serverová zátěž mezi 10. a 11. hodinou SEČ 64,2 dotazů za sekundu, tj. 231 tis. dotazů za hodinu Minimální zátěž mezi 2 a 6 hodinou SEČ méně než 15 tis. dotazů za hodinu 14. 5. 2014 Bc. Radka Matoláková 9

PRŮZKUMOVÁ ANALÝZA DAT 2/2 Pomocí metody neparametrické analýzy rozptylu prokázána závislost mezi: průměrným počtem dotazů (uživatelů) za hodinu a denní dobou průměrným počtem dotazů (uživatelů) za hodinu a délkou vyřízení dotazu Neprokázána závislost mezi průměrným počtem dotazů (uživatelů) za hodinu a dnem v týdnu Pomocí Spearmanova korelačního koeficientu prokázána pozitivní korelace počtu dotazů a délkou vyřízení požadavku 14. 5. 2014 Bc. Radka Matoláková 10

ČETNOST VÝSKYTŮ ANALÝZA CHOVÁNÍ UŽIVATELŮ 12 000 10 000 8 000 6 000 4 000 2 000 0 1 až 9 10 až 99 100 až 999 1 000 až 9 999 POČET POŽADAVKŮ V SEKVENCI Pohyb na mapě Pohyb pouze směrem na východ 9,5 % požadavků pohyb pouze ve směru na západ 6,4 % kombinace pohybu severozápadně a oddálení 5,9 % jen přiblížení, nebo jen oddálení (bez posunu) << 0,1 % 14. 5. 2014 Bc. Radka Matoláková 11

IDENTIFIKACE A KATEGORIZACE VZORŮ ČINNOSTÍ Každý pohyb po mapě nahrazen alfanumerickým kódem Kódy jednotlivých uživatelů zřetězeny v sekvenci Pomocí algoritmu suffix tree nalezeny vzory činností Méně než 5 kroků Více než 10 kroků Testováno 5-9 kroků Vhodná délka posloupnosti je 6 kroků Nejčastější vzory činností (nad 200 výskytů) : Posun v ose X oběma směry Opětovné zobrazení výsledku předchozího požadavku 14. 5. 2014 Bc. Radka Matoláková 12

ANOMÁLNÍ CHOVÁNÍ UŽIVATELŮ Jakékoli záměrné i neúmyslné chování vymykající se očekávanému chování Nejčastěji nalezené anomální chování Dotaz mimo rozsah ČR 203 tis. ze 20mil. Extrémní délka vyřízení dotazu Příklady nežádoucího chování záměrného Snaha o narušení funkce serveru např. vykrádání dat pomocí robotů 14. 5. 2014 Bc. Radka Matoláková 13

NÁVRH DETEKCE ANOMÁLNÍHO CHOVÁNÍ Detekce na základě odlišnosti od nalezených vzorů činností není možná vzory vykazují přílišnou variabilitu a nízkou četnost výskytů Detekce na základě obecných poznatků: například algoritmem spuštěném na PROXY serveru testující zda je požadována oblast uvnitř ČR a zda netrvá nepřiměřeně dlouhou dobu 14. 5. 2014 Bc. Radka Matoláková 14

PRAKTICKÉ VYUŽITÍ Možnost využít vzory chování pro simulaci běžných uživatelů při testování služeb Možnost posílit logiku aplikace předvídáním požadavků uživatele Možnost detekce práce robotů a vykrádání dat 14. 5. 2014 Radka Matoláková 15

LITERATURA A ZDROJE J. SRIVASTAVA, Web Usage Mining: Discovery and Applications of Usage Patterns from Web Data University of Minnesota. 2000 RŮŽIČKA, J., CIBULKA, et al. : Web Map Service Performance Testing based on Extents Generated Randomly or by Algorithm Simulating General User Behaviour SOMAP 2012 Vídeň HORÁK, J. a ARDIELLI, J.: Dostupnost a výkonové parametry nového WMS serveru čuzk z pohledu klienta GIS Ostrava 2011 14. 5. 2014 Radka Matoláková 16

DĚKUJI ZA POZORNOST