Zpracování dat v AVG backendech. Antonín Karásek Jarek Jarcec Čecho

Podobné dokumenty
CYCLOPE PRINT MANAGEMENT SOFTWARE- UŽIVATELSKÁ PŘÍRUČKA

Není cloud jako cloud, rozhodujte se podle bezpečnosti

CS monitorovací jednotky. Edice: Vytvořil: Luboš Fistr

Demoprojekt Damocles 2404

FlowMon ADS 3. Nová generace řešení pro analýzu provozu datové sítě. Pavel Minařík

VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA STROJNÍ DATABÁZOVÉ SYSTÉMY ARCHITEKTURA DATABÁZOVÝCH SYSTÉMŮ. Ing. Lukáš OTTE, Ph.D.

CS monitorovací jednotky. Edice: Vytvořil: Luboš Fistr

Monitorování datových sítí: Dnes

Maturitní otázky z předmětu PROGRAMOVÁNÍ

Projekt JetConf REST API pro vzdálenou správu

Projekt Turris. Proč a jak? Ondřej Filip ondrej.filip@nic.cz Bedřich Košata bedrich.kosata@nic.cz / IT13.2

Koncept centrálního monitoringu a IP správy sítě

Archivace relačních databází

FoxStat. Change the Net.Work. Nástroj pro záznam a analýzu datového provozu

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

Statistica, kdo je kdo?

Koncept. Centrálního monitoringu a IP správy sítě

Versiondog Co je nového

Wonderware Historian 2017

Příloha č. 3: Technické zadání zakázky Instalace a služby pro technologické centrum MÚ Pohořelice

Novinky ve FlowMon 6.x/FlowMon ADS 6.x

Souborové systémy Mgr. Josef Horálek

Patrol Management System 2.0

Internetový obchod ES Pohoda Web Revolution

Vývoj SW pro mobilní zařízení s ios. Petr Hruška, Skymia s.r.o. Teorie a praxe IP telefonie,

Propojení Pohoda a Virtuemart 2. popis funkcí, instalace a nastavení. (verze ) MICHAL KOPECKÝ, MILAN PASTOR

Databáze II. 1. přednáška. Helena Palovská

O Apache Derby detailněji. Hynek Mlnařík

Jak se ztrácí citlivá data a jak tato data ochránit?:

Software pro analýzu dat VERZE 8 NOVINKY. Buďte lepším auditorem. Vy máte znalosti. My máme nástroje.

Kybernetické hrozby - existuje komplexní řešení?

Nastavení programu pro práci v síti

INFORMAČNÍ SYSTÉM VIDIUM A VYUŽITÍ MODERNÍCH TECHNOLOGIÍ

Představení Kerio Control

Aplikovaná informatika

Integrace datových služeb vědecko-výukové skupiny

Bakalářská práce, FEL ČVUT Praha. Michal Turek. červenec 2007

ABRA POS PRINT SERVER

Použití programu WinProxy

Tovek Tools. Tovek Tools jsou standardně dodávány ve dvou variantách: Tovek Tools Search Pack Tovek Tools Analyst Pack. Připojené informační zdroje

Opensource antispamová ochrana

Přechod na síťovou verzi programu

PB169 Operační systémy a sítě

Implementácia bezpečnostného dohľadu v organizáciách štátnej a verejnej správy. Martin Senčák, Beset, Bratislava Vladimír Sedláček, Greycortex, Brno

STUDIJNÍ MATERIÁL PRO TECHNICKOU CERTIFIKACI ESET Business Edition, ESET Remote Administrator

Představení společnosti a produktů ESET ESET software, spol. s r.o. Petr Heřman

Flow Monitoring & NBA. Pavel Minařík

Uživatelská příručka. Internet Map Server verze 1.5.4

w w w. u l t i m u m t e c h n o l o g i e s. c z Infrastructure-as-a-Service na platformě OpenStack

Maturitní témata Školní rok: 2015/2016

Vzdálené ovládání flotily strojů/zařízení z jednoho místa. Zabezpečená platforma a připojení. Automatická synchronizace času a lokalizace na mapě

Healtcheck. databáze ORCL běžící na serveru db.tomas-solar.com pro

Manuscriptorium - 10 let

ProjectWise V8 XM Edition

Technická dokumentace a specifikace

Setkání uživatelů programu SSB2000, Skalský dvůr, SSB2000 bez hranic

Instalace programu ProGEO

JUMO LOGOSCREEN 600. Dotyková budoucnost záznamu: Obrazovkový zapisovač

DBGen v.1.0. Uživatelská příručka v. 1.0

Bc. David Gešvindr MSP MCSA MCTS MCITP MCPD

Fiber To The Office. naturally connected. Nadčasová síťová infrastruktura pro moderní podnikové prostředí

Jak efektivně ochránit Informix?

Wonderware Historian. Příklady vícevrstvých architektur. Jiří Nikl, Tomáš Mandys Pantek (CS) s.r.o.

OptimiDoc dokáže takové dokumenty zpracovat a distribuovat napříč firmou.

FlowMon 8.0. Představení novinek v řešení FlowMon. Petr Špringl, Jan Pazdera {springl pazdera}@invea.com

Použití databází na Webu

Příručka nastavení funkcí snímání

Firewall, IDS a jak dále?

IDS systémy a honeypoty. Jan Mach CESNET, z. s. p. o.

Internet Information Services (IIS) 6.0

ezkouška požadavky na IT

Firewall, IDS a jak dále? Flow monitoring a NBA, případové studie. Jiří Tobola INVEA-TECH

Bezpečnostní monitoring v praxi. Watson solution market

Experimentální systém pro WEB IR

CSPUG 2011-květen. GridSQL a pg-pool II. Vratislav Beneš benes@optisolutions.cz

Střední odborná škola a Střední odborné učiliště, Hořovice

3. Software Bakaláři Kompletní školení

8.2 Používání a tvorba databází

Koncept BYOD. Jak řešit systémově? Petr Špringl

Struktura pamětí a procesů v DB Oracle. Radek Strnad

MARIE PACS S PACSem hezky od podlahy když se data sypou!

Firewall, IDS a jak dále?

Crouzet em4. Products Elektrické stroje Automatizační moduly

Operační systémy 1. Přednáška číslo Souborové systémy

IW3 MS SQL SERVER 2014

Instalace a konfigurace

Spark SQL, Spark Streaming. Jan Hučín

STRUČNÝ NÁVOD K POUŽITÍ

ešení pro správu klientských počítač a mobilní tisk Číslo dokumentu:

Wonderware Information Server 4.0 Co je nového

POZVÁNKA NA KURZY. Literatura Ke všem kurzům jsou poskytovány metodické příručky pro školství v elektronické podobě.

Jak ochráníte svoji síť v roce 2015? Michal Motyčka

Xirrus Zajímavé funkce. Jiří Zelenka

LEAD-CRM. Přehled vybraných typů implementace systému

Yeastar S100, IP PBX, až 16 portů, 100 uživatelů, 30 hovorů, rack

MYBIZ - Řešení pro zpřístupnění dat ze stávajících aplikací na mobilních zařízeních (Mobilize your business!) Požadavky zákazníka.

Pohledem managementu firmy.

Bezpečnost v ICT Anotace V souboru typu pdf uzpůsobenému k promítání jsou uvedeny informace o. Jazyk Autor. Firewall, záloha dat, antivir, zcizení dat

SINEMA Server V13 Pro plně transparentní sítě Siemens, s.r.o Všechna práva vyhrazena. siemens.cz/sinema

Advanced IT infrastructure control: Do it better, safer, easier and cheaper. FlowMon ADS 3. Nová generace řešení pro analýzu provozu datové sítě

Transkript:

Zpracování dat v AVG backendech Antonín Karásek <antonin.karasek@avg.com> Jarek Jarcec Čecho <jaroslav.cecho@avg.com>

Backend systémy Co je od nás vyžadováno zpracování uživatelských dat vytváření reportů pro management generování životně důležitých dat pro samotné klienty Dva hlavní projekty IDP Firewall Nejsme sami: PrevCar Aktivní diplomové a dizertační práce

IDP Váš ochránce identity Behavior detekce na straně klienta heuristické identifikování podezřelého chování velké množství false alarmů IDP Backend naše práce možnost klienta zkontrolovat si validitu detekce snižuje false alarmy generuje krásné flashové grafy vhodné pro management

IDP Backend Rozdělen na dvě hlavní části: web facing servery zautomativoné zpracování vzorků Web facing servery umožnují verifikovat klientskou detekci Tati je to dobře? v případě nového nálezu umožnují posílat vzorky Nevím, pošli mi to nezbytná služba pro IDP klienta

IDP Backend II Zautomatizované zpracování vzorků přijímá dosud neznámé nálezy od klientů provádí na nich automatizované analýzy rozhoduje zda-li se opravdu jedná o malware či nikoliv automatizace není dokonalá Některé klasifikace provádí až člověk

Firewall Další komponenta AVG (stejně jako IDP) Vyžaduje pozornost uživatele Přejete si aplikaci skype.exe povolit přístup na Internet? Velice nežádoucí Sbírá a sumarizuje statistiky provozu: jaká aplikace z jakého lokálního portu na jaký vzdálený port anonymní, žádné IP Posílá tyto informace backendu Backend: sumarizuje data přes všechny uživatele pracovníci firewall teamu na jeho základě generují whitelisty opět generuje krásné flashové grafy

Provozování backend systémů Konečně ta zajímavá část Naše praktické zkušenosti AVG má 100 000 000 uživatelů world wide všichni pořád něco chtějí vysoká zátež nezbytnost udržet systémy v high availability běhu celý svět najednou nikdy nespí

Ext3 i-node problém Problém: klient posílá sumarizované XML s daty Přímočará implementace 250 000 souborů za hodinu: Potřeba uložit a následně zpracovat Kam s tím mkfs.ext3 vyhrazuje bloky pro i-nody vnitřní fragmentace Výsledek: opticky 50% volného místa nemožnost vytvořit nový soubor

Ext3 i-node problém Řešením je jiný filesystém Zajimavé XFS, raiserfs (řeší vnitřní fragmentaci) XFS je úděsné pomalé pro práci s malými soubory cca 3x zpomalení v našich testech Skončili jsme na raiserfs Stále neřeší probém s velkými a pomalými adresáři Konečné řešení: balit soubory na vstupu do tarů 100 XML na jeden tar archív výrazné zlepšení výkonu

Sumarizace statistik Jaká aplikace je mezi uživateli nejvíce reportovaná...patří na whitelist Přímočará implementace: data ukládat do MySQL Za den cca 500 000 000 řádků odpověd na úvodní otázku zabere více než 24 hodin generování statistik na denní bází navíc ani nestíhá ukládat všechna příchozí data těch otázek je krapánek více

Sumarizace statistik Naivní řešení: ukládat do CSV souborů UNIX utility: sort, uniq výsledek na všechny otázky za 3 hodiny Problémy: CSV neukládá sémantiku, problematické změny není schopno odpovídat na nově vzniklé dotazy Budoucí postup: Hadoop

Fronta úloh Potřeba distribuovat úlohy pro workery Analyzuj tento soubor Hloupá implementace: by MIT fronta úloh v MySQL databázi 10 000 úloh za hodinu Vytvořit (insert), zabrat (update), dokončit (update) 30 000 DB operací za hodinu MySQL nemá rádo velké tabulky (snižuje se výkon) nulová možnost distribuovatelnosti Fronta úloh byla součástí centrální databáze ještě nižší výkon

Fronta úloh Řešení: Použít specializované a optimalizované nástroje Gearman plně distribuované řešení úlohy v paměti (volitelně i trvalejší uložiště) Problémy úlohy v paměti nemáme turingovy stroje, paměť může dojít možnost řešit ještě více gearman servery (distribuovat)

Konec Omlouváme se mnoho textu pro tuto pokročilou hodinu Dotazy? Náměty? Připomínky? Žádosti o zaměstnání?