VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA STROJNÍ

Podobné dokumenty
Organizace a zpracování dat I (NDBI007) RNDr. Michal Žemlička, Ph.D.

Zabezpečení dat. Literatura: Pavel Roubal: Informatika a výpočetní technika pro střední školy str

Kapitola 10: Diskové a souborové struktury. Klasifikace fyzických médií. Fyzická média

Disková pole (RAID) 1

Disková pole (RAID) 1

BrightStor ARCserve Backup r Michal Opatřil - Consultant - michal.opatril@ca.com

VÝZVA K PODÁNÍ NABÍDKY NA VEŘEJNOU ZAKÁZKU MALÉHO ROZSAHU. JAMU Doplnění a rozšíření SW vybavení "

Disková pole (RAID) 1

UNIVERZITA PALACKÉHO V OLOMOUCI

Externí paměti 1 Feromagnetické

ZÁLOHOVÁNÍ DAT A DATOVÁ ÚLOŽIŠTĚ

Relační databáze a povaha dat

INTEGRACE IS DO STÁVAJÍCÍ HW A SW ARCHITEKTURY

Datová úložiště. Zdroj: IBM

Příloha č.2 - Technická specifikace předmětu veřejné zakázky

Autorem materiálu a všech jeho částí, není-li uvedeno jinak, je Bohuslava Čežíková.

OZD. 2. ledna Logický (Objekty, atributy,...) objekty stejného typu.

PA152: Efektivní využívání DB 2. Datová úložiště. Vlastislav Dohnal

USNESENÍ VLÁDY ČESKÉ REPUBLIKY č. 624/2001

Kapitola 13: Transakce. Koncept transakce. ACID vlastnosti

Server je v informatice obecné označení pro počítač, který poskytuje nějaké služby nebo počítačový program, který tyto služby realizuje.

Tabulka splnění technických požadavků

Obsah. Úschova dat v síti čtvrtletní práce. Jméno: Michal Tydrych Třída: 4.B Datum:

BankKlient. FAQs. verze 9.50

pole Princip 1. Zvýšení rychlosti. 2. Zvýšení bezpečnosti uložených dat (proti ztrátě).

Projekt: 1.5, Registrační číslo: CZ.1.07/1.5.00/ Komprese videa

RAID. Uživatelská příručka

Projekt: Inovace oboru Mechatronik pro Zlínský kraj Registrační číslo: CZ.1.07/1.1.08/

VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA STROJNÍ DATABÁZOVÉ SYSTÉMY ARCHITEKTURA DATABÁZOVÝCH SYSTÉMŮ. Ing. Lukáš OTTE, Ph.D.

ZÁLOHOVÁNÍ DAT A DATOVÁ ÚLOŽIŠTĚ

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ TECHNOLOGIE VYSOKÉ DOSTUPNOSTI MS SQL SERVERU

TÉMATICKÝ OKRUH TZD, DIS a TIS

Výzva k podání nabídek

I. POČTY A STAVY. počet uživatelů - studentů: studentů. počet uživatelů - zaměstnanců: (fyzický stav) - 88 (uživatelů s přístupem k PC)

Mgr. Radko Martínek, hejtman Pardubického kraje

Zakázka Vnitřní integrace úřadu v rámci PROJEKTU Rozvoj služeb egovernmentu ve správním obvodu ORP Rosice

Organizace a zpracování dat I

2.17 Archivace a komprimace dat

Data Protection Delivery Center, s. r. o. JEDNODUCHOST, SPOLEHLIVOST a VÝKONNOST. DPDC Protection. zálohování dat

Příloha č. 1 Servisní smlouvy. Katalog služeb. S2_P1_Katalog služeb

Přednáška. Úložiště dat: HDD, SDD, RAID, DAS, NAS, SAN. Katedra počítačových systémů FIT, České vysoké učení technické v Praze Jan Trdlička, 2012

Dlouhodobá archivace digitálních dat

PROFIL BUDOUCÍHO ABSOLVENTA OBORU INFORMATIKA

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ OPTIMALIZACE DATOVÝCH ÚLOŽIŠŤ BAKALÁŘSKÁ PRÁCE FAKULTA PODNIKATELSKÁ ÚSTAV INFORMATIKY BRNO UNIVERSITY OF TECHNOLOGY

Úvod Používané konvence Seznámení s Outlookem...17

Jako příklady typicky ch hrozeb pro IT lze uvést: Útok

NAS 352 Online RAID Level Migration a Capacity Expansion

Instalujeme a zakládáme databázi Oracle Database 11g

Realizace datového centra kraje Vysočina Regionální SAN kraje Vysočina

HP Backup and Recovery Manager

Malá měřicí drezína MMD pro měření geometrie tratě

TSM for Virtual Environments Data Protection for VMware v6.3. Ondřej Bláha CEE+R Tivoli Storage Team Leader. TSM architektura IBM Corporation

ÚSTAVNÍ SOUD. Knihovní řád

Technická zpráva. Obsah: a modernizace povodňového varovného systému 3A Y01. Pracoviště na VHD Ostrava

DIGITÁLNÍ POVODŇOVÉ PLÁNY. M. Banseth

Zřízení technologického centra ORP Dobruška

Zvýhodněné ceny: 3.999, * (6x 1TB SATA) nebo , * (12x 2TB SATA) Pouze do 30. dubna 2011!

Deduplikační technologie zálohování dat

Inovace výuky prostřednictvím ICT v SPŠ Zlín, CZ.1.07/1.5.00/ Vzdělávání v informačních a komunikačních technologií

IP kamerové systémy a jejich skladba

11. Strukturovaná kabeláž

GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY 6

Jako zadavatel Vám tímto oznamujeme, že zahajujeme výběrové řízení v níže uvedené věci a vyzýváme Vás k podání nabídky.

RAID. Uživatelská příručka

POKROČILÝ SYSTÉM UMOŽŇUJÍCÍ ZÁLOHOVÁNÍ POČÍTAČOVÝCH DAT

Zálohování a rychlá obnova dat Konsolidace serverů a diskových polí Archivace elektronické pošty

RÁMCOVÁ POJISTNÁ SMLOUVA / Pojistka č. HPEEW 1/2010

Informační a komunikační technologie

Růst datových potřeb Pojem velkokapacitní se mění v čase Dříve několik MB, dnes stovky GB až TB

Odborná zpráva o postupu prací a dosažených výsledcích za rok 2013

Vmware / XEN / Hyper-V. DR Lokalita. Full repliky. Snapshoty

MARIE PACS S PACSem hezky od podlahy když se data sypou!

Storage Management Workload Management Backup and Recovery Management

TECHNICKÉ PODMÍNKY. Článek 2. Podmínky pro službu MojeBanka, MojeBanka Business, MojePlatba,Expresní linka Plus a TF OnLine

Technická specifikace vymezené části 1 SERVER

EKONOMICKÉ A INFORMAČNÍ SUBSYSTÉMY PRO VODÁRENSKÉ SPOLEČNOSTI

Klienti a agenti softwaru Symantec NetBackup 7

Tabulka splnění technických požadavků

mpos mobilní aplikace Průvodce pro použití s Lenovo A2010

IT 3. Projekt centrálního zálohovacího systému v ČSOB Pojišťovně. Michal Mikulík. špička v každém směru

Zadávací podmínky soutěže: Dodávka HW a SW vybavení pro střediska SIM na území ČR. Zadavatel:

Migrace virtuálního prostředí VI3 na vsphere. Lukáš Radil, konzultant

QuarkXPress soubor ReadMe

NAS 251 Seznámení s RAID

INFORMAČNÍ TECHNOLOGIE

Předmět směrnice. Čl. 2 Základní pojmy, technické pojmy a zkratky

Průvodce Bosch IP síťovými video produkty. Představení IP technologie a budoucnosti průmyslové televize.

Zálohování a archivace dat

InTouch 8.0 Subsystém distribuovaných alarmů

Zálohování nefunguje... Ondřej Vlach Channel Manager CZ.SK.HU řešte dostupnost!

Standardní operační postup (SOP) ČNRDD/M02/verze 02. Elektronické záznamy

SÁM O SOBĚ DOKÁŽE POČÍTAČ DĚLAT JEN O MÁLO VÍC NEŽ TO, ŽE PO ZAPNUTÍ, PODOBNĚ JAKO KOJENEC PO PROBUZENÍ, CHCE JÍST.

STRATEGIE A ŘÍZENÍ INFORMAČNÍCH SYSTÉMŮ

Acronis. Lukáš Valenta

Název školy: Základní škola a Mateřská škola Žalany

STŘEDNÍ ŠKOLA PELHŘIMOV Friedova 1469, Pelhřimov ICT PLÁN ŠKOLY

Maturitní témata. pro obor vzdělávání M/01 Informační technologie

Stavba operačního systému

Počítačové síťě (computer network) Realizují propojení mezi PC z důvodu sdílení SW (informací, programů) a HW(disky, tiskárny..)

Transkript:

VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA STROJNÍ DATABÁZOVÉ SYSTÉMY ZÁLOHOVÁNÍ DAT V DATABÁZI Ing. Lukáš OTTE, Ph.D. Ostrava 2013 Tento studijní materiál vznikl za finanční podpory Evropského sociálního fondu (ESF) a rozpočtu České republiky v rámci řešení projektu:, MODERNIZACE VÝUKOVÝCH MATERIÁLŮ A DIDAKTICKÝCH METOD

2 OBSAH 1 ZÁLOHOVÁNÍ DAT V DATABÁZI...3 1.1 Text přednášky...4 1.2 Technologie zálohování...5 1.2.1 DAS technologie (Direct Attach Storage)...5 1.2.2 SAN technologie (Storage Area Network)...5 1.2.3 On-line zálohování...6 1.3 Metody zálohování...6 1.3.1 Žurnálování...6 1.3.2 Stínování...7 1.3.3 Zrcadlení...7 1.3.4 Pole RAID (Redundant Array of Inexpensive Disks)...7 1.4 Zálohovací strategie...7 1.4.1 Individuální pracovní stanice...7 1.4.2 Malá síť...8 1.4.3 Velká síť...8 2 ZKUŠEBNÍ OTÁZKY:...9 3 DOPLŇUJÍCÍ ZDROJE INFORMACÍ:... 10 4 POUŽITÁ LITERATURA:... 11

3 1 ZÁLOHOVÁNÍ DAT V DATABÁZI OBSAH KAPITOLY: Principy zálohování dat v databázi MOTIVACE: Po prostudování této přednášky se budete orientovat v základních principech zálohování dat v databázích. Budete schopni vyjmenovat a osvětlit důvody a problémy spojené se zálohováním. CÍL: Cílem je seznámit se se základními principy zálohování dat v databázích.

4 1.1 TEXT PŘEDNÁŠKY Když se řekne záloha dat, řadě lidí se vybaví disketa nebo CD či DVD a zkopírování nejdůležitějších souborů. Toto řešení je vhodné pouze v případě, že zálohujeme malou lokální databázi nějakého podniku. V případě, že se jedná o větší společnost, kde data v mnohém narůstají a jsou uložena na serveru, pak je samotné zálohování mnohem složitější. Lze však říci, že všechny techniky zálohování mají společný základ. Nejde totiž vůbec o to, aby data byla někde zkopírovaná. Důležité je mít data k dispozici a to zejména v případě poruchy. Informace obsažené ve firemní databázi jsou pro chod každé organizace životně důležité. Zálohování je tedy životně důležité pro minimalizaci rizika ztráty dat v případě katastrofálního výpadku. Zálohováním se rozumí denní, týdenní nebo měsíční uchování dat, informací a vědomostí za účelem jejich obnovy (Restore) v případě nějaké technologické poruchy zařízení. Záloha je prováděna na přepisovatelné médium. Je prováděna každý den, týden nebo měsíc na to samé médium a data jsou vždy přemazána a nahrazena novými. Jako médium jsou používány pásky, magneto-optický disk nebo CD medium. I při sebevětší péči o technický stav databázového serveru může dojít k selhání tohoto počítače a následné destrukci dat na jeho pevných discích. Ale nejen to, také při bezchybném provozu databázového serveru může nastat havarijní situace např. díky omylu administrátora při manipulaci s databází, nebo při hrubém omylu uživatelů (např. mazání dat, která smazána být neměla, apod.). Nejčastější problémy, které mohou vést k výpadku serveru, nebo k jeho neregulérnímu ukončení jsou např. - výpadek elektrického proudu; - chybně fungující nebo špatně nastavený záložní zdroj; - neregulérní chování jiného programu běžícího na serveru; - nějaká vadná součást počítače (paměť, pevný disk, nestabilní OS); - chyba v aplikaci, která se projeví např. při nějaké velmi netypické konstelaci dat, se kterou vývojáři nepočítali apod. To vše a ještě řada dalších potenciálních problémů je důvodem pro velmi pečlivé zálohování databázových souborů. Pro zálohování by mělo platit, že - zálohování je prováděno dostatečně často - obvykle jedenkrát za den; - zálohování probíhá v době nejmenšího provozu - obvykle v hlubokých nočních hodinách; - záloha se vytváří na jiném počítači (externím disku), než na kterém je provozován databázový server; - zálohy databáze jsou uchovávány po určitou dobu a to podle následujícího scénáře: v rámci posledního týdne jsou uchovávány zálohy každého dne. v rámci posledního měsíce je uchovávána jedna záloha z každého týdne; v rámci posledního roku je uchovávána jedna záloha z každého měsíce. Zálohování databázových serverů je specifickou oblastí a lze jej rozdělit na dva základní způsoby. První z nich je zálohování on-line pomocí zálohovacích agentů a druhým způsobem je pak zálohování databází off-line při zastaveném databázovém serveru na vhodné datové médium.

5 1.2 TECHNOLOGIE ZÁLOHOVÁNÍ 1.2.1 DAS technologie (Direct Attach Storage) Zálohování probíhá přímo na samotném serveru, nebo za pomocí sdíleného zálohovacího serveru umístěného v síti, jejichž součástí jsou všechny disky či zálohovací zařízení, nejčastěji připojené pomocí SCSI řadiče či interního RAID řadiče. DAS koncept má samozřejmě řadu nevýhod: - není možné fyzicky oddělit data a datové zdroje od samotného serveru a mnohdy se stává, že komplikovanější havárie serveru, či živelná pohroma (požár, povodeň a jiné) způsobí ztrátu dat; - mohou nastat obtíže při migraci dat na jiný server, servery mají omezenou diskovou kapacitu a není prakticky možné mít tzv. "no single point of failure" architekturu. To znamená, že nelze zajistit takovou architekturu, aby systém neobsahoval žádný kritický subsystém, jehož závada by měla vliv na normální funkci systému. Obrázek 1 - Zálohování na serveru pomocí technologie DAS 1.2.2 SAN technologie (Storage Area Network) Nebo je také možno využít síťové metodiky SAN (Storage Area Network), což je oddělená datová síť, která slouží pro připojení externích zařízení k serverům (disková pole, páskové knihovny a jiná zálohovací zařízení). SAN koncept nabízí následující výhody: - fyzické oddělení dat a serverů, kdy jednotlivé prvky mohou být od sebe vzdáleny až desítky kilometrů; - sdílení zdrojů (diskových zařízení, zálohovacích zařízení) mezi jednotlivými servery (velmi omezeně toto umí i koncepce technologie DAS); - vyšší propustnost; - definici redundantních cest ke zdrojům (velmi omezeně toto umí i koncepce technologie DAS);

6 - podporu pro architekturu no single point of failure. Obrázek 2 - Zálohování databází metodikou SAN 1.2.3 On-line zálohování Zálohování databází na serverech provádějí tzv. zálohovací agenti, kteří umožňují zálohování za provozu, tedy on-line a to u všech populárních databází jako jsou Oracle, Microsoft SQL, Informix, Sybase, Ingres a SAP R/3 a zajišťují tak rychlou obnovu dat v případě havárie. Databázoví zálohovací agenti zajišťují integritu dat tím, že zálohují logické a žurnálové soubory spolu s daty. Zálohovat a obnovovat je možné vybrané databázové objekty. Uživatelé pak mohou obnovit poškozené nebo smazané databáze nebo databázové objekty bez zastavení databázového serveru. On-line zálohy jsou trojího typu: - Úplná záloha zálohují se všechny bloky databázového souboru; - Inkrementální záloha zálohují se jen bloky, které byly změněny od poslední zálohy libovolného typu; - Kumulativní inkrementální záloha zálohují se všechny bloky, které byly změněny od poslední úplné zálohy. Ze způsobu jednotlivých záloh pak vycházejí různé postupy pro obnovení databáze. 1.3 METODY ZÁLOHOVÁNÍ 1.3.1 Žurnálování Žurnálování změn v databázi je jedním ze způsobů, jak zajistit integritu databáze v případě nepředvídatelné události. Avšak samo o sobě nezajistí integritu dat, k tomu je totiž nutné použít spolu se žurnálováním ještě další techniky. Žurnálování je však velmi důležité pro zajištění logické integrity databáze. V případě používání transakcí v aplikaci je to právě žurnál, z něhož se obnoví počáteční stav před provedením transakce v případě, že tato selže. Žurnálový soubor je tedy binární soubor, ve kterém se ukládají informace o transakcích (např. zápis a čtení na disku, ukládání, aktualizace a vymazávání informací z databáze apod.) a je nutný kvůli chybám, které mohou nastat během výše zmiňovaných procesů (např. výpadek proudu, multitasking, aj.). Multitasking může být realizován mnoha způsoby. Základní dělení je na skutečný multitasking, kdy je hardware počítače opravdu schopen v každém okamžiku zpracovávat více úloh současně, a na zdánlivý multitasking, kdy se dojmu současného běhu více programů

7 dosahuje tím, že se tyto programy velice rychle v běhu střídají, ale v každý jednotlivý okamžik běží pouze jediná úloha. Např. při zápisu dat by tento proces mohl vyvolat nekonzistenci dat anebo použití nesprávných údajů vlivem toho, že dva procesy přistupují ke stejným datům a vzájemně si tato data přepisují. Problémem je také to, že čtení i zápis nejsou elementární operace, ale skládají se z množství dílčích operací, které je nutné vykonat. Všechny tyto podoperace je nutné zaznamenat a při výpadku je využít k obnovení stavu konzistence databáze. 1.3.2 Stínování Jednou z možných metod zálohování dat v databázi je tzv. stínování, které umožňuje zálohování změn databáze na stejném nebo dokonce na jiném serveru. Stínování aktualizuje kopii databáze po každém zakončení transakce. Pokud dojde k výpadku hlavního serveru, je možné přepnout se na databázi na záložním (tzv. stínovacím) serveru a pokračovat v práci dokud nebude problém na hlavním serveru vyřešen. Stínování je tedy jedním ze způsobů, jak softwarově zajistit vyšší odolnost systému proti katastrofickému výpadku. Tento způsob však nepracuje v realtime režimu a data se na stínovaný server dostávají s jistým, byť minimálním, zpožděním. Navíc stínování nezajistí integritu dat v případě výpadku. V případě velmi transakčně vytížených aplikací je tento způsob vhodný k odlehčení hlavnímu serveru a přenesení např. dotazů na stínový server. Je však nutno vzít v potaz již zmíněný časový posun mezi okamžikem vzniku dat na primárním serveru a jejich zkopírováním na stínovací server. 1.3.3 Zrcadlení Metoda zrcadlení disků je založena na zastupitelnosti disků - tzn. na udržování dvou identických kopií dat na dvou či více discích. V případě výpadku jednoho z nich pak bez problému počítač pracuje dál se zbývající kopií. Doba, po kterou jsou data nedostupná, je prakticky nulová. V případě výpadku jednoho z disků stačí vadný disk vyměnit za nový a po opětovném zapojení dojde k automatické synchronizaci a obnově dat ze zbylého disku na nový prázdný disk. Výhoda: rychlejší čtení (řadič může střídat požadavky mezi disky, rozdávat práci ). Nevýhoda: pomalejší zápis (zapisuje se 2x). 1.3.4 Pole RAID (Redundant Array of Inexpensive Disks) Při velkých objemech dat je lepší využít technologie RAID - skupina 3 a více disků. Zjednodušeně lze říci, že data jsou v tomto případě rovnoměrně rozdělena mezi všechny disky. Jejich kapacita je tedy využita efektivněji než při pouhém zrcadlení. Tím klesají i náklady na reálnou diskovou kapacitu. Výpadek jednoho disku pak opět neznamená nedostupnost dat. Další vlastností RAID je větší rychlost zápisu dat oproti zrcadlení. 1.4 ZÁLOHOVACÍ STRATEGIE Charakteristikou dobré zálohovací strategie je jednoduchost použití, maximální využití času a jednoduchost obnovy dat. 1.4.1 Individuální pracovní stanice Celý systém se zálohuje jednou za měsíc nebo před instalací většího softwarového produktu. Tato strategie nevyužívá inkrementální zálohy. Pokud se inkrementální zálohy provádějí, tak je dobré využít rotace pásek. To jsou dvě pásky, na každou se vytvoří úplná záloha. Každý

8 další den se provádí inkrementální zálohy, střídavě na obě pásky. Každý soubor je tak zálohovaný na dvou páskách. 1.4.2 Malá síť Malá síť je zde představována jedním serverem a několika stanicemi. Zde se doporučuje provádět měsíční zálohy celého systému a týdenní kumulativní inkrementální zálohy. Je doporučeno měsíční zálohy uchovávat po celý rok. Týdenní zálohy uchovávat měsíc. 1.4.3 Velká síť Řada větších firem především bank má požadavky na minimalizaci času odstavení v případě havárie. Proto jsou zde nutné aktuální a úplné zálohy, které je možno okamžitě použít. Proto se zde používá síť a speciální disky. Zápisy na každý disk by se tedy měly zrcadlit, tak aby havárie jednoho disku neměla dopad na uživatele. Každý večer by se měl obsah celého disku zrcadlit na vzdálené disky na jiném místě. Kdyby došlo k výpadku hlavního systému, může naběhnout systém vzdálený.

Zkušební otázky: 9 2 ZKUŠEBNÍ OTÁZKY: 1) Jakými technologiemi lze zálohovat? 2) Popište princip zálohování metodou zrcadlení.

Doplňující zdroje informací: 10 3 DOPLŇUJÍCÍ ZDROJE INFORMACÍ: [1] KUTÁČ, D. Caché Studio 8: Administrace systému, databáze, sítě, škálovatelnost. InterSystems CZ [online]. 2003 [cit. 2012-06-29]. Dostupné z: <http://www.intersystems.cz>

Použitá Literatura: 11 4 POUŽITÁ LITERATURA: [1] KUTÁČ, D. Caché Studio 8: Administrace systému, databáze, sítě, škálovatelnost. InterSystems CZ [online]. 2003 [cit. 2012-06-29]. Dostupné z: <http://www.intersystems.cz>