Archivace s jistotou Aleš Koreček, BRS SE EMC 1
Archivace jako doplněk zálohy Záloha Kopie informace Archiv Primární informace Používá se pro obnovu produkce Dostupná pro opětovné využití Zvyšuje dostupnost dat Zvyšuje provozní efektivitu Typicky krátkodobá Data jsou přepisována pravidelně Typicky dlouhodobý Data jsou uchována pro analýzy nebo compliance 2
Archiv 3
Obvyklí podezřelí Veřejná a státní správa, zdravotnictví všude Banky, pojišťovny, telekomunikace smlouvy, pojišťovací a škodní protokoly ostatní (zaměstnanecká agenda, ekonomika, výroční zprávy) Výroba, prodej ISO, EDI, ostatní (zaměstnanecká agenda, ekonomika, výroční zprávy) Ostatní všude, kde hrozí potenciální postih či škoda 4
Co je (hlavně) za archivací Organizace směrnice oprávnění metodiky Aplikace univerzální datová sběrnice časová razítka, el. podpis Infrastruktura HSM garantovaný archiv 5
Druhy archivace Provozní odlehčení primárního úložiště zmenšení objemu zálohy rozšíření zálohovacího okna Compliance legislativní požadavky interní směrnice oborové normy 6
Compliance archiv Pravidla, principy 7
Legislativa Zákony o archivnictví a spisové službě stanovuje povinnost a způsob vedení spisové služby Zákon o elektronických úkonech a autorizované konverzi dokumentů upravuje el. úkony státu a samosprávy vůči fyzickým a právnickým osobám, autorizovanou konverzi dokumentů 8
Legislativa (pokračování) Národní standard pro elektronické systémy spisové služby definuje sjednocující parametry a základní podmínky pro výkon el. spisové služby Další standardy MOREQ2 SOX zákon o zdravotních službách zákon o krizovém řízení krizový zákon zákon o integrovaném záchranném systému zákon o ochraně osobních údajů 9
Co se vlastně archivuje? Různý původ obsahu spisová služba emaily agendové systémy kancelářské balíky Různé typy obsahu textové soubory (txt, doc, ppt, xls, ods, odp,...) speciální archivní soubory (pdf/a, pdf/s, archivační balíček podle OAIS,...) obrazky (tiff, jpeg, png, bmp,...) speciální formáty (CAD/CAM aplikace, mapové podklady GIS,...) Různé stupně oprávnění vlastník recenzent administrátor a další 10
Požadavky na compliance archivaci Prokazatelnost Dohledatelnost Konzistence Autenticita Spolehlivost Auditovatelnost 11
Provozní archivace 12
Předmět archivace Blokové úložiště Databáze MS Exchange MS SharePoint Vlastní aplikace Souborové úložiště Souborové systémy Emailové systémy Vlastní aplikace 13
Požadavky na provozní archivaci a zálohu Univerzalita Transparentnost Integrace Dostupnost Multitenancy Škálovatelnost Cena Private Clouds Public Clouds 14
Portfolio archivních úložišť EMC Centera Atmos Data Domain Isilon VNX 15
EMC Centera Základní přehled 16
EMC Centera řešení pro archiv Autenticita obsahu Snadná správa Nízké TCO Zajištění autenticity obsahu Interní úložiště chyby obsahu/dat jsou automaticky detekovány a odstraněny Síťový provoz chyby síťového přenosu jsou automaticky detekovány a přenos je opakován Snadná správa Správci mohou zvládnou násobně větší objem dat Spolupracuje s jakoukoliv aplikací a platformou Centralizace archivu z mnoha zdrojů dat Sdílení jediného úložiště mnoha aplikací pro tisíce uživatelů Umožňuje dosažení shody se zákonnými normami a podnikovými směrnicemi 17
Centera: nízké TCO Bez složité správy komplexní SAN nebo LAN infrstruktury Bez správy souborových systémů Bez konfigurací LUN/RAID Group Ochrana investic podpora různých generací HW Jeden adresovatelný prostor speciální nástroje pro obsah Nepřetržité ověřování obsahu a struktury 18
Redundant Array of Independent Nodes (RAIN) Centera node Storage nodes/access nodes 2.8 GHz P4 processor 1024 MB DDR RAM 4x 1 TB nebo 2 TB SATA-II 2x 1 Gbit network-interfaces 1x 1 Gbit pro vnější LAN (copper/optical) Čtyř node 16-node cube 2 cubes/ cabinet Node může být v jedné ze 3 rolí Access node Storage node Access/storage node Síť Centery Dual 24-port cube switches Připojení Gigabit Ethernet pro další cubes Redundantní připojení pro každý node Více cubes v jednom cluster Vysoká škálovatelnost Masivní paralelní výkon Přidání úložiště: výkon, paměť, bandwidth 19
Základní konfigurace Hardware Základní systém (4TB, 8TB nebo 12TB nody) Minimum počet nodů = 4 Max počet nodů v kabinetě = 32 Max kabinetů v klastru = 4 Rozšiřování po 2 nodech Software CentraStar SW instalovaný na každém nodu Volitelné add on moduly Compliance: Governance (GE) Compliance Edition Plus (CE+) Advanced Retention Management (ARM) Replication Centera Virtual Archive (CVA) 20
Generační srovnání Gen 2 Node Gen 3 Node Gen 4 Node Gen 4 LPII Node G4LPII vs. G2 1 TB per node 1.2 TB per node 2 TB per node 8 TB per node 800% více úložiště 117 Watts per TB 117 Watts per TB 125 Watts per TB 15.7 Watts per TB 87% méně energie 48 nodes = 48 TB 32 TB per rack 40 nodes = 48 TB 38 TB per rack 24 nodes = 48 TB 64 TB per rack 6 nodes = 48 TB 256 TB per rack 88% méně nodů 88% menší footprint 21
Centera pracuje s objekty Objekt má metadata <My_Archiving_Application> <MagazineCover name= Time photo= Annan date= Sep 4, 2000 /> <Reviewer name= Jones, Ted /> </ My_Archiving_Application > datum jméno fotografie Aplikace vytváří metadata přidružená k jednomu nebo více objektům Objekty jsou uloženy nezávisle na adresářových informacích 22
Centera nepotřebuje zálohu Centera Snižuje příležitost poškození dat (přístup nebo autenticitu) chybou V případě chyby umožní rychlé odhalení a odstranění Jakým způsobem Pevný obsah chrání data před přepsáním aplikací Autenticita obsahu, nezávislé kopie, self-monitoring, selfhealing Detekce a uzdravení vadných bloků disku Regenerace obsahu při ztrátě celého disku Detekce a uzdravení chyb filesystémů Regenerace obsahu při ztrátě celého filesystému Omezená konfigurace Lidská chyba nemá dopad na archiv samotný Neexistuje možnost aktivní správy disků nebo FS 23
Model chyby a samoopravení Chyba Detekce Náprava Chyba nodu Chyba celého disku Chyba databáze Chyba bloku Chyba filesystému Chyba sítě Chyba SW Přítomnost nodu Přítomnost disku Zdraví databáze Read/write chyby Poškrábání disku Bloby Metadata Bloky Připojení SW heartbeats Regenerace nodu Regenerace disku Regenerace databáze Regenerace blobu Regenerace FS Obnova dat Zpráva do EMC 24
Jak Centera pracuje Content Address Aplikace vytvoří objekt 10001010 Content Address algorithm Digital fingerprint Globally unique Centera spočítá CA a odešle ji jzpět 10111011 Content Address algorithm Locationindependent CA LAN Aplikační server pošle objekt CA Aplikace uloží CA jako referenci 25
Ochrana dat MIRORRING Network switch Redundant power Storage nodes Storage nodes Cube-switch Cube-switch Access/storage nodes Access/storage nodes Dual, self-managed private LAN 26
Ochrana dat PARITY Network switch Storage nodes Storage nodes Cube-switch Cube-switch Access/storage nodes Access/storage nodes Dual, self-managed private LAN Redundant power 27
Ochrana dat SAMOZOTAVENÍ Network switch Storage nodes Storage nodes Cube-switch Cube-switch Dual, self-managed private LAN Access/storage nodes Access/storage nodes Redundant power 28
Škálovatelnost Automatické rozpoznání HW Automatické zapojení Různé typy HW Různé generace Upper cube Root switches Lower cube IP Address 4-node Centera Rack 1 Rack 2 29
Virtual pools multitenancy Logická separace dat Single Instancing Oddělená správa Pool 2 Pool 1 Default Pool Pool 3 Aplikační Pool 1 Aplikační Pool 2 Aplikační Pool 3 Různé politiky Default Pool Blob CDF 30
Replikace vybraných objektů Pool 1 Pool 2 Pool 3 Zdroj Cíl 31
Topologie replikace Asynchronní přeš IP Neomezená vzdálenost Jednosměrná, obousměrná, řetěz nebo hvězda Možnost pauzování replikace LAN Router Router LAN Bez nutnosti externí správy Není třeba duplikovat optické disky nebo worm pásky Ta samá CA existuje v obou klastrech Application server Application server 32
33
Compliance základní vlastnosti Basic Objektové úložiště Bez vlastností pro vynucení retence Bez pokročilého mazání Governance Edition (GE) Obsahuje vlastnosti pro vynucení retence Vlastnost Privilege delete option pro mazání obsahu pod retencí Compliance Edition Plus (CE+) Omezené vlastnosti GE Specifická SEC Advanced Retention (ARM) Dostupná pouze pro verze GE nebo CE+ Event Based Retention (EBR) Litigation Hold (LH) MIN/MAX Governor per Pool 34
Pokročilé vlastnosti compliance C0 fixed retention povolen výmaz C1 fixed retention event not specified event-based retention povolen výmaz C2 fixed retention event not specified event-based retention povolen výmaz C3 event not specified fixed retention event-based retention povolen výmaz Čas C-Clip vytvořen Událost Nastavení litigation hold Odstranění litigation hold 35