B0M33BDT 7. přednáška Architektury a bezpečnost. Marek Sušický Milan Kratochvíl

Podobné dokumenty
B0M33BDT Stream processing. Milan Kratochvíl

BigData. Marek Sušický

Analytické systémy nad Hadoopom. Lukáš Antalov, Vedoucí týmu vývoje

Spark Jan Hučín 15. listopadu 2017

MetaCentrum. datové služby. Miroslav Ruda, Zdeněk Šustr

Spark Jan Hučín 5. dubna 2017

Softwarový proces. Bohumír Zoubek, Tomáš Krátký

Big Data Business snídaně

Spark SQL, Spark Streaming. Jan Hučín

Hadoop a HDFS. Bc. Milan Nikl

Open Source projekty pro Big Data

BIG DATA je oveľa viac ako Hadoop. Martin Pavlík

Spark SQL, Spark Streaming. Jan Hučín

B0M33BDT Technologie pro velká data. Storage

Instalace a konfigurace

B0M33BDT Technologie pro velká data. Supercvičení SQL, Python, Linux

Řešení ochrany databázových dat

Infor Performance management. Jakub Urbášek

Jednotlivé hovory lze ukládat nekomprimované ve formátu wav. Dále pak lze ukládat hovory ve formátu mp3 s libovolným bitrate a také jako text.

Komponentově orientované webové frameworky. Jiří Stránský twitter.com/jistr

Big Data od velkých očekávání k praktickému využití. DSW, Praha,

FUJITSU PRIMEFLEX. Human Centric Innovation in Action. Integrované systémy pro Vaše řešení. 30. května 2017 Pavel Čáslavský. 0 Copyright 2017 FUJITSU

27/11/2017. Business analýza a sběr požadavků. Dotazy na event #G865

MetaCentrum. Miroslav Ruda CESNET

Informatika pro 8. ročník. Hardware

A4M33BDT Technologie pro velká data

Efektívne riadenie financií v ISS Facility Services Prípadová štúdia BI

manažerského řízení HW a SW požadavky pro sw ATTIS

Publikujeme web. "Kam s ním?!"

BIG DATA. Nové úlohy pro nástroje v oblasti BI. 27. listopadu 2012


LOGmanager a soulad s požadavky GDPR

2.10 Vnější paměti. Střední průmyslová škola strojnická Vsetín. Ing. Martin Baričák. Název šablony Název DUMu. Předmět Druh učebního materiálu

České Budějovice. 2. dubna 2014

Návrh architektury škálovatelné cloudové služby aneb nespalte se v cloudu. Mgr. David Gešvindr MCSE: Data Platform MCT MSP

Nová generace analytik mění zažité způsoby BI

Ondřej Bothe, Richard Dobiš

Praha, Martin Beran

Datová úložiště. Zdroj: IBM

GDPR: příležitosti k úsporám. Martin Hladík 30. listopadu 2017

Formy komunikace s knihovnami

Řídicí systém vozidla ve veřejné dopravě

Softwarový proces Martin Hlavatý 4. říjen 2018

UAI/612 - Cloudová Řešení. Technologie

w w w. u l t i m u m t e c h n o l o g i e s. c z Infrastructure-as-a-Service na platformě OpenStack

Maintenance. Tomáš Krátký, Bohumír Zoubek

I C T P L Á N Stávající stav Počet žáků ICT vzdělávání pedagogických pracovníků

SEMINÁŘ PRAKTICKÉ DOPADY GDPR NA ŽIVOT INTERNÍHO IT Ing. Jiří Slabý, Ph.D.

4K Android Smart TV Box S Fly Mouse

ICT plán školy. Organizační směrnice č. 10/2016

B0M33BDT Technologie pro velká data. Storage

Datová kvalita základ úspěšného BI. RNDr. Ondřej Zýka, Profinit

CENÍK REKLAMY. Kontaktujte nás buď em na: nebo telefonicky:

Jan Slezák, Zdeněk Dutý Oracle Day. Využití SW a HW technologií Oracle v projektu ISZR a potenciál pro egoverment

DataDomain pod drobnohledem

IBM Watson Data Platform Plan

Data management vs GDPR

Brno. 30. května 2014

IBM Cloud computing. Petr Leština Client IT Architect. Jak postavit enterprise cloud na klíč IBM Corporation

Cloud. historie, definice, modely a praktické využití Ing. Karel Stýblo K2 atmitec s.r.o.

Řešení integrace Profinit ESB. Michal Bureš

Národní archiv v Praze PRŮZKUM SPISOVÉ SLUŽBY Pouze pro interní potřebu Národního archivu a příslušné organizace!

Novinky v Microsoft SQL Serveru RNDr. David Gešvindr MVP: Data Platform MCSE: Data Platform MCSD: Windows Store MCT

Jakub Šesták. ESEJ DO PŘEDMĚTU DIGITÁLNÍ KNIHOVNY

Aktuální otázky provozu datových skladů PAVEL HNÍK

Radim Dolák Gymnázium a Obchodní akademie Orlová

Použití Single Sign On (SSO) v IBM Informix Serveru

4K DVB-T2 / DVB-S2 Android Smart TV Box S Fly Mouse

Jak správně navrhnout moderní a efektivní řešení pro ukládání dat

PREZENTACE ŘEŠENÍ CSX

VAKCÍNA PROTI RANSOMWARE & ŘEŠENÍ PROTI ANTIVIROVÝM BOUŘÍM. René Pospíšil IS4 Technologies Country Partner CZ/SK

Red Hat Enterprise Virtualization

4K DVB-T2 / DVB-S2 Android Smart TV Box S Fly Mouse

SW ATTIS nástroje. HW a SW požadavky pro sw ATTIS. manažerského řízení. Verze manuálu: 3.5 Datum:

WINDOWS Nastavení GPO - ukázky

METACENTRUM. Miroslav Ruda CESNET. Konference CESNET, Praha

Mgr. Jakub Polešenský, ICT koordinátor Mgr. Martina Michalíková, ředitelka školy

GDPR co nastane po květnovém dni D? Martin Hladík 8. března 2018

Technická specifikace soutěžených služeb

Technologie Java Enterprise Edition. Přemek Brada, KIV ZČU

Fujitsu Day Prague 2017

Autodesk AutoCAD LT 2019

Ceník inzerce na HyperInzerce.cz

Řešení Oracle pro správní centra místních samospráv. Michal Zbořil Solution Specialist Oracle Corporation

2N NetStar SW. Co je 2N NetStar SW? IP pobočková ústředna. Virtuální ústředna. Interkom server

Porovnání rychlosti mapového serveru GeoServer při přístupu k různým datovým skladům

Řešení pro šíření informací ve výrobě

Název prezentace 1. Poskytovatel garantovaných služeb NDC včetně kybernetické bezpečnosti ve státní správě

Středoškolská technika Encryption Protection System

Platforma Juniper QFabric

Netezza. Martin Pavlík. 2. Února to pravé řešení pro analytický datový sklad

Závěrečná zpráva o výsledcích řešení projektu v rámci rozvojových program MŠMT na rok 2006

Mgr. Jakub Polešenský, ICT koordinátor Mgr. Martina Michalíková, ředitelka školy

CO OBCE MOHOU UDĚLAT PRO GDPR UŽ NYNÍ?

Petr Vlk KPCS CZ. WUG Days října 2016

DODATEČNÉ INFORMACE K PODMÍNKÁM VÝBĚROVÉHO ŘÍZENÍ Č. I

PRODUKTY DIGITÁLNÍ REKLAMY

Komunity a sociální sítě: Jak na nich efektivně inzerovat? Daniel Kafka První multimediální Fragile media dan@multimedia.cz


Co obce mohou udělat pro GDPR už nyní. Medlov, Mgr. Miroslava Sobková

Transkript:

B0M33BDT 7. přednáška Architektury a bezpečnost Marek Sušický Milan Kratochvíl 5. prosinec 2018

Osnova Něco ze života Architektury Hadoop Lambda Kappa Zetta Security a dopady do architektury 2

Jak vypadá Hadoop? Yahoo 3

Jak vypadá Hadoop? Facebook 4

Jak vypadá Hadoop? Google 5

Jak vypadá Hadoop? 6

Několik otázek Jaká je rychlost světla v optickém kabelu? Jaká je akceptovatelná latence pro telefonní hovor? Kolik událostí za sekundu zvládnou konvenční velké databáze? Kolik stojí malý clusteřík? (5x 2x 10core, 256GB RAM, 10x2TB HDD) 7

Několik otázek Jaká je rychlost světla v optickém kabelu? 200 000km/s Jaká je akceptovatelná latence pro telefonní hovor? 50ms Kolik událostí za sekundu zvládnou konvenční velké databáze? Cca 10 000 Kolik stojí malý clusteřík? (5x 2x 10core, 256GB RAM, 10x2TB HDD) Pod 5 M 8

Architektury

Hadoop 10

Hadoop 11

Lambda Z Apache Storm Nathan Marz, 2011 http://nathanmarz.com/blog/how-to-beat-the-cap-theorem.html Yahoo, Netflix 12

Lambda 4 vrstvy 13

Lambda Konkrétní technologie 14

Kappa 2014 Jay Kreps Linkedin https://www.oreilly.com/ideas/questioning-the-lambda-architecture 15

Kappa 3 vrstvy odstranění batch vrstvy Lze použít dlouhou retenci Problém se stavem microbatche? 16

Kappa Konkrétní technologie 17

Kappa Tooly Log data store Kafka Streaming computation systems Samza Storm Kafka Streams Flink 18

Zetta Jim Scott - MapR (Zetta je 6 číslo řecké abecedy), data-centric 19

Zetta Google Zetta 20

Zetta Co to znamená? Všechno na Mesos Dynamická alokace zdrojů Omezení přesunů dat Zatím spíš okrajová 21

Několik ukázek ze života Sběr logů Reklamní platforma DWH Offloading Analytické pískoviště 22

Sběr logů Web server tvoří logy Ty se ukládají na disk rotace Pak se posílají na jiné servery Logy se zpracovávají 23

Reklamní platforma Web logy a informace o zobrazování reklamy Logy Flumem do HDFS Pak počítáme a vracíme zpět na znovuzpracování 24

DWH offloading Aktivní archiv Levnější úložiště dat Typicky Sqoop Flume ETL řešené v Hive, Sparku, nebo přes nástroje třetích stran 25

DWH offloading Je možné dělat vrstvy jako v normálním DWH Tzn. L0, L1, L2 ETL řízené např. pomocí Oozie Často ale komerční nástroje Talend ETL, Informatica BDM, Oracle ODI Ne vždy to je ale výhra 26

Analytické pískoviště Data nahrávána většinou ad-hoc Standardní přísun dat přes Flume/Sqoop/scp Velkou roli má R, python a Spark (pyspark) Využití toolů jako Zeppelin, Jupyter, Hue Notebook, či Cloudera Workbench Většinou se moc neřeší bezpečnost 27

Security a vliv na architekturu

Kerberos Lze rozdělit na tři části KDC Kerberos Distribution Center Server poskytuje služby Klienti uživatelé, počítače, služby KDC nabízí AS Autentizační server TGS - Ticket Granting Service Pojmy TGT Ticket Granting Ticket Service Server 29

Kerberos https://en.wikipedia.org/wiki/kerberos_(protocol) 30

Kerberos Jak to funguje 31

Security HDFS encryption End to end encryption Security komponenty Sentry Ranger 32

Security Data locality Data privacy Data labeling Expirace dat GDPR Anonymizace Pseudonymizace 33

Data masking Jak získat data pro testovací prostředí? Syntetická data? Jak zajistit byznys relevantnost těchto dat? Jak to udělat výkonné a škálovatelné? 34

35

Díky za pozornost Profinit, s.r.o. Tychonova 2, 160 00 Praha 6 Telefon + 420 224 316 016 Web www.profinit.eu LinkedIn linkedin.com/company/profinit Twitter twitter.com/profinit_eu