Vysoká škola ekonomická v Praze Fakulta informatiky a statistiky Vyšší odborná škola informačních služeb v Praze Jan Drábek Návrh a realizace řešení zálohování dat ve firmě HP Exstream Bakalářská práce 2010
Prohlašuji, že bakalářskou práci na téma Návrh a realizace řešení zálohování dat ve firmě HP Exstream jsem vypracoval samostatně. Zdroje, z kterých jsem při psaní této práce čerpal, uvádím v seznamu použité literatury. V Praze dne Jan Drábek
Poděkování Na tomto místě bych rád poděkoval Ing. Davidovi Klimánkovi, Ph.D., vedoucímu mé bakalářské práce, za jeho cenné rady a podnětné připomínky. Také bych chtěl poděkovat mým rodičům a všem blízkým, kteří mě po celou dobu studia plně podporovali.
OBSAH ÚVOD...9 I TEORETICKÁ ČÁST... 11 1 POJEM ZÁLOHOVÁNÍ OBECNĚ... 12 2 VÝZNAM ZÁLOHOVÁNÍ... 13 3 ASPEKTY ZÁLOHOVÁNÍ... 15 3.1 DŮVODY ZÁLOHOVÁNÍ... 15 3.2 PŘEDMĚT ZÁLOHOVÁNÍ... 16 3.3 KDY ZÁLOHOVAT... 18 3.4 KDO PROVÁDÍ ZÁLOHU... 18 3.5 JAKÝ HARDWARE POUŽIJEME... 20 3.5.1 CD A DVD... 20 3.5.2 BLU-RAY A HD-DVD... 21 3.5.3 UDO A PDD... 22 3.5.4 FLASH DISKY... 23 3.5.5 LOKÁLNÍ PEVNÉ DISKY... 24 3.5.6 EXTERNÍ / SÍŤOVÉ DISKY... 24 3.5.7 PÁSKOVÉ MECHANIKY... 26 3.6 SOFTWARE PRO ZÁLOHOVÁNÍ... 28 3.7 KDE JSOU ZÁLOHY ULOŽENY... 29 4 DATOVÁ ÚLOŽIŠTĚ... 30 4.1 ZÁKLADNÍ ARCHITEKTURY SYSTÉMŮ... 33 5 METODY ZÁLOHOVÁNÍ... 36 5.1 ZÁLOHOVACÍ STRATEGIE... 41 5.2 DLOUHODOBÉ ZÁLOHOVÁNÍ... 44 I PRAKTICKÁ ČÁST... 46 6. PŘEDSTAVENÍ SPOLEČNOSTI HP EXSTREAM... 47 6.1 ANALÝZA PROSTŘEDÍ FIRMY HP EXSTREAM... 49 6.1.1 ANALÝZA HARDWAROVÉHO VYBAVENÍ... 50 6.1.2 ANALÝZA SOFTWAROVÉHO VYBAVENÍ... 51 5
6.2 ANALÝZA POTŘEB ZÁLOHOVÁNÍ... 52 7 NÁVRH ŘEŠENÍ... 53 7.1 ZÁLOHOVÁNÍ DAT... 53 7.2 ZÁLOHOVÁNÍ OPERAČNÍCH SYSTÉMŮ... 56 7.3 OBNOVENÍ ZÁLOHY... 56 8 REALIZACE NAVRHNUTÉHO ŘEŠENÍ... 57 ZÁVĚR... 68 SEZNAM POUŽITÝCH ZDROJŮ:... 69 6
ANOTACE Tato bakalářská práce se zabývá problematikou zálohování. V teoretické části vysvětluji důvody, kvůli kterým je nutné data zálohovat a význam zálohování. Dále popisuji jaká data je potřeba zálohovat, jaký hardware a software můžeme použít a kdy bychom měli zálohovat. Představuji také metody, používané k zálohování, datová úložiště a přístupy k zálohování. Praktická část mé práce je věnována návrhu a realizaci řešení zálohování a obnovy dat ve společnosti HP Exstream. 7
ANNOTATION This bachelor work deals with the questions of backup. In the theoretical part I explain the reasons and the meaning of backup. Further I describe which data have to be backed up, what kind of hardware and software is allowed to use and last but not least when the backup should be made. I also represent backup methods, data storages and the various approaches to backup questions. My practical part is devoted to a concrete solution. I present the proposal and the realization of data backup and recovery in the company HP Exstream. 8
ÚVOD Předložená bakalářská práce se zabývá problematikou zálohování dat a jejich obnovy. Cílem této bakalářské práce je návrh optimálního procesu zálohování a obnovy dat ve společnosti HP Exstream. Pro splnění vytyčeného cíle jsem stanovil tyto dílčí úkoly: vysvětlit termín zálohování a jeho význam, definovat, jaká data chceme zálohovat a kdy zálohovat, vybrat vhodná datová úložiště a zálohovací software, vysvětlit zálohovací metody a přístupy, představit politiku zálohování, v praktické části práce navrhnout a realizovat řešení zálohování a obnovy dat ve společnosti HP Exstream. Zálohování a obnova dat přestavují velice rozsáhlou oblast, ve které se používá spousta technologií a přístupů. Lidská společnost a informace byly od pradávna nedílnou součástí. Bez informací by se člověk jistě nikam nedostal, obzvlášť ne do současné etapy vývoje. Je paradoxní, že od doby dávno minulé, kdy jsme trpěli nedostatkem informací, jsme se posunuli do období, kdy nás informace z celého světa doslova zaplavují. Informace začínají být tím nejcennějším aktivem. Počítače se staly součástí našich životů a jejich smyslem je zpracovávat data. Ta potřebují ke své existenci. Mezi námi je ale bohužel stále spousta uživatelů, kteří si neuvědomují cenu vlastních dat a nepřipouští si možnost, že by o svá data mohli přijít. Nezabývají se otázkou bezpečného zpracování, uložení a ochranou dat před ztrátou nebo zničením. Nejhorší však je, že tento způsob uvažování je rozšířený i v řadě menších firem. Ale právě pro ně může mít ztráta dat nepředstavitelně katastrofické následky. Mnohdy je v sázce i existence takové společnosti. 9
Povědomí o zálohování vlastních dat se ale postupně rozšiřuje jak mezi firmami a institucemi, tak i mezi domácími uživateli počítačů. Často je k tomu dohnala právě vlastní zkušenost se ztrátou cenných dat. O důležitosti zálohování svědčí i neustále rostoucí nabídka hardwarových zařízení a softwarových nástrojů určených speciálně pro tyto účely. Zálohování dat je základním prostředkem ochrany dat. Přináší jistotu, že při havárii o svá data nepřijdeme a budeme schopni je kdykoli obnovit. Potřeby uživatelů se liší, proto existuje velké množství metod pro zálohování. Volba správného technického vybavení i strategie není jednoduchá a záleží na objemu zálohovaných dat, na rychlosti, s jakou je požadována jejich obnova i na riziku, které při ztrátě dat hrozí. Jsou situace, ve kterých stačí jednoduché zálohování. Naopak v jiné, na první pohled velmi podobné situaci, je zapotřebí rozsáhlý zálohovací systém. Další otázkou je úschova záložních médií. Při zálohování je nutné rozlišovat nejen techniku zálohování, ale zohlednit i to, jaká data se zálohují. 10
I TEORETICKÁ ČÁST 11
1 POJEM ZÁLOHOVÁNÍ OBECNĚ V oblasti informačních technologií se zálohou nebo procesem zálohování rozumí pořizování kopií dat. Tyto kopie se vytváří za účelem obnovení původních dat v případě, kdy nastane nějaká nenadálá událost, při které bychom o data mohli přijít. Při vytváření kopií se musí dbát také na způsob, jakým se kopie provádí. Vždy musíme kopírovat data takovým způsobem, abychom je byli schopni obnovit do jejich původní podoby. Dodatečné kopie jsou typicky pojmenovány zálohy. Užitečnost záloh Zálohy jsou užitečné především ve dvou případech. Prvním případem je již zmiňovaná situace, kdy chceme obnovit data, o která jsme přišli při nějaké katastrofě (tzv. disaster recovery). Druhým případem je situace, kdy chceme obnovit pouze malý počet souborů poté, co byly omylem odstraněny nebo poškozeny. Tyto menší ztráty dat jsou také velmi časté. Ze statistických průzkumů vyplynulo, že 66 % uživatelů internetu již utrpělo ve svém životě podobnou ztrátu dat.[2] Systém zálohování Vzhledem k tomu, že záložní systém musí obsahovat alespoň jednu kopii všech dat, které stojí za záchranu, jsou požadavky na záložní prostor vysoké. U velkých firem je zorganizování úložného prostoru a řízení zálohování velice složitý proces. Pro představu složitosti celého systému a stanovení jasné struktury pro zálohování dat lze využít modelu datového úložiště. V moderní počítačové éře existuje mnoho různých typů zařízení pro ukládání dat, které jsou užitečné pro vytváření záloh. Existuje také mnoho způsobů, jak mohou být tato zařízení nastavena a uspořádána. Především se dbá na to, aby zajišťovaly nepřetržité zálohování, bezpečné uložení a přenosnost dat.[23] Proces zálohování Než jsou data odeslána do svého úložiště, jsou vybrána, extrahována a utříděna. Bylo vyvinuto mnoho různých technik pro optimalizaci procesu zálohování. Mezi ně patří mimo jiné optimalizace pro nakládání s otevřenými soubory a s živými zdroji dat, stejně 12
tak i komprese, šifrování, a de-duplikace. Mnoho organizací i jednotlivých uživatelů se snaží mít jistotu, že proces funguje tak, jak se očekávalo a zabývá se popisováním, měřením a kontrolou techniky. Je velice důležité znát veškerá omezení, která mohou při zálohování nastat. V neposlední řadě musíme vzít na vědomí všechny lidské faktory, podílející se na každém zálohovacím procesu.[26] 2 VÝZNAM ZÁLOHOVÁNÍ Všechny firmy jsou v dnešním světě svědky rapidního a neutuchajícího nárůstu objemu dat, která drží. Důsledkem internetu, e-mailu nebo stále složitějšího a náročnějšího aplikačního softwaru je masivní nárůst objemu dat všude kolem nás. Společnost IDC (International Data Corporation) provedla v říjnu roku 2002 konzervativní odhad nárůstu dat ve výši přibližně 80 % ročně. Data jsou stále více uznávána jako součást nemovitého majetku společnosti a ztráta těchto dat by mohla zapříčinit vážné poškození jakékoli organizace. Ztráta dat může být velmi nákladná, zejména pro malé a středně velké organizace, kde rozdíl mezi přežitím a bankrotem závisí na schopnosti zotavit se z katastrofy.[25] Přinejmenším, kritické ztráty dat budou mít finanční dopad na podniky všech velikostí. V prvních šesti měsících roku 2001 ztratily americké firmy více než 8 miliard dolarů v důsledku počítačových virů. Finanční dopad na společnost je kombinací ztráty podnikání, nízké produktivity, právních akcí a nákladů na opětovné vytvoření dat. V roce 2002 studie společnosti Ontrack, která poskytuje služby obnovení dat, ukázaly, že náklady na vytvoření 20 MB ztracených dat mohou být dosti značné:[31] Datový typ Čas potřebný k vytvoření 20MB ztracených dat Náklady Prodej a marketing 19 dní 17.000 $ Účetnictví 21 dní 19.000 $ Inženýrství 42 dní 98.000 $ V nejhorším případě může mít kritická ztráta dat za následek kolaps podnikání. Studie ukázaly, že 80 % společností bez dobře koncipované ochrany údajů a záložní strategie ukončí podnikatelské činnosti do dvou let od ztráty dat. Často se stává, že i když se společnost postihnutá takovou ztrátou dat dokáže se situací vyrovnat a udrží se na trhu, je natolik snížena důvěryhodnost firmy, že se od ní klienti či zákazníci odvracejí. Narušení 13
klíčových, primárních nebo podpůrných operací společnosti může způsobit krizi v jakémkoliv podnikání. Nemusí to být takové katastrofické selhání, jako v případě svržené bomby, ale následky budou kritické. Leckdy stačí, když dojde k výpadku jediného oddělení. Například toho, které zpracovává záznamy o pacientech, nebo mzdového oddělení. Všechna počítačová data jsou v nebezpečí hrozby virového napadení nebo poškození. Dokonce i s nejspolehlivějším zařízením a v nejbezpečnějším operačním prostředí je vždy možnost, že se něco pokazí. Typickými příklady problémů mohou být fyzická selhání pevných disků, zhroucení operačního systému, špatná rozhodnutí lidské obsluhy, důsledky činnosti škodlivého počítačového viru nebo i vlivy přírodních živlů, jako jsou požár, povodeň či zásah blesku. Průzkum společnosti Ontrack v roce 2002 změřil nejčastější příčiny ztráty dat:[25] Poškození hardware 44 % Živelná pohroma 3 % Počítačový virus 7 % Poškození software 14 % Lidská chyba 32 % Pro většinu lidí představuje zálohování dat složité a zbytečné zdržování, jež je dobré pro složité firemní či bankovní systémy. Neuvědomují si, že s pronikáním počítačů do našeho 14
života se stále více stupňuje závislost nejen na nich, ale zejména na datech. V případě firem a organizací mají data nezpochybnitelně větší hodnotu než samotné počítačové vybavení. 3 ASPEKTY ZÁLOHOVÁNÍ Při řešení problematiky zálohování dat musíme vzít v potaz celou řadu aspektů. Na jejich základě si položíme otázky, na které bychom si měli umět odpovědět. 3.1 DŮVODY ZÁLOHOVÁNÍ Které důvody nás přivedli k myšlence, že bychom měli naše data zálohovat? Proč se začít zabývat zálohou dat? Podstata celé problematiky zálohování dat se skrývá v této otázce. Odpověď na ni je ale stejně jednoduchá jako otázka samotná: Existuje totiž reálné nebezpečí, že o tyto data přijdeme. Osobní zodpovědnost V dnešní době čím dál tím více zaměstnanců nejrůznějších firem využívá počítače. Ty velmi usnadňují a zrychlují naši práci, bohužel s sebou ale přinášejí také určitá rizika. A ne každý si tyto rizika uvědomuje. Denně ukládáme do počítače nejrůznější data, která potřebujeme ke své práci. Mnohdy to jsou data, která ve finále nepoužíváme jenom my, ale i ostatní zaměstnanci. V tomto případě jsme také zodpovědní za to, že jsou tato data patřičně zabezpečena proti ztrátě. Nemůžeme dovolit, aby ztráta takových dat ohrozila výsledky celých týmů, nebo dokonce zapříčinila kolaps celého informačního systému.[1] Zabezpečení dat proti ztrátě však není jenom otázkou malých či velkých společností. Každý uživatel, který ukládá jakákoli data do svého počítače, o ně nechce určitě přijít. Ať už jde o naší práci, projekty, hudbu, fotky nebo video. O data můžeme přijít a může i nemusí to být naše vina. Musíme se však postarat o to, abychom byli v případě, kdy k takové ztrátě dat dojde, ovlivněni touto událostí co nejmenší mírou.[1] I když se nám 15
může leckdy na první pohled zdát, že na svém osobním počítači nemáme žádná důležitá data, budeme zajisté více postrádat naše neopakovatelné snímky dětí a rodiny, než fotoaparát, který na rozdíl od těchto fotografií, ztrácí časem svou hodnotu. 3.2 PŘEDMĚT ZÁLOHOVÁNÍ Jaká data tedy chceme zálohovat? Pokaždé, než se pustíme do zálohování, musíme mít jasno, jaká data chceme zálohovat. Ze své praxe vím, že bychom měli zálohovat všechna data, která jsme sami vytvořili. Termín data představuje široký pojem a zahrnuje v sobě položky, jako jsou například dokumenty textového editoru, tabulky tabulkového editoru, obrázky, prezentace, aplikace nebo databáze. Nechceme zálohovat vše Mezi všemi daty, která máme v našem systému uložena, se vyskytují jistě i taková data, která lze snadno nahradit z externího disku, kompaktního disku nebo ze sítě. Měli bychom si uvědomit, která to jsou. Tyto data můžeme z našeho procesu zálohování vynechat. Důvod je prostý. Důležitým faktorem pro zálohování i obnovu dat je čas. V naprosté většině společností je doba pro zálohování omezena. Data nemohou být používána a zálohována současně. Žádný systém nepovolí kopírovat data, se kterými někdo pracuje. Zpravidla se tak zálohy provádí mimo pracovní dobu. Doba obnovy dat ze záložních systémů, jako jsou například páskové knihovny, také nebývá nejrychlejší. Rychlejší je obnovit data z externího či kompaktního disku nebo ze sítě. Výhodou je také, že obnova dat z nějakého přenosného média a z pásky může probíhat současně. Proto bychom si měli vybrat pouze důležitá a nenahraditelná data, která zálohujeme. Data, která můžeme získat jiným způsobem, než obnovou z naší zálohy, nebudeme zbytečně zálohovat a plýtvat záložní kapacitou.[16] Důležitá data Dále se musíme podívat, kde se data, která chceme zálohovat, nacházejí. Důležitá data se mohou nacházet jak na serveru, tak na jednotlivých stanicích uživatelů. Jestliže se data 16
nacházejí na uživatelské stanici, je nutné určit, zda budeme muset zálohovat celou stanici, nebo jenom vybrané adresáře. Ve většině případů stačí zálohovat pouze domovské adresáře. Data uložená v těchto adresářích pravděpodobně nebudeme schopni znovu vytvořit. Naproti tomu operační systém a aplikace uživatele můžeme obvykle obnovit z jiných zdrojů než ze zálohy. Velice výhodné je, když jsou domovské adresáře na každé pracovní stanici uloženy na stejném místě. Konfigurace záložních serverů je poté mnohem snazší a rychlejší. Další variantou je umístění domovských adresářů uživatelů pouze na serveru. Docílíme tak toho, že uživatelské stanice budou mít nainstalovány pouze operační systém a některé aplikace. Tím nám odpadá potřeba zálohovat všechny uživatelské stanice, protože jsme je schopni kdykoli obnovit z přenosných médií, nebo po síti. V případě, že se ale rozhodneme pouze pro zálohování domovských adresářů, musíme zdokumentovat všechny aplikace v systému a určit, kam tyto aplikace ukládají důležitá data. Tento proces může být v některých případech dosti dlouhý, ale určitě se nám vyplatí. Pokud si tedy nejsme jisti, kam které aplikace ukládají data, je nutné věnovat tomuto procesu čas a pozornost.[3] Záložní klienti Musíme si také udělat představu o množství dat, která budeme chtít zálohovat. Začneme tím, že si spočítáme, kolik máme v našem systému záložních klientů. Záložními klienty se rozumí každá pracovní stanice a server určený k zálohování. Jsou to tedy systémy obsahující důležitá data, která jsou nereprodukovatelná jinými prostředky. Pokud se v našem systému důležitá data nenacházejí na pracovních stanicích, zužuje se náš počet záložních klientů pouze na servery. Jestliže nejsme schopni tyto klienty spočítat, vytvoříme alespoň odborný odhad. Celkový počet záložních klientů bychom pro účely plánování měli navýšit přibližně o 10 až 25 %. Je totiž možné, že nám objem dat během doby našeho plánování vzroste. Jelikož v podnicích jen zřídka kdy dochází ke snižování množství dat, nemusíme se bát reálný počet záložních klientů navýšit až o 25 %. Tito klienti nám poskytnou prostor v záložní kapacitě pro budoucí růst našeho systému.[10] Objem dat 17
Nyní, když známe počet záložních klientů, můžeme určit množství dat určených k zálohování. Množství všech dat v našem systému lze spočítat na základě detailního průzkumu všech záložních klientů. Tato metoda je ovšem vhodná jenom v malých podnicích. Ve středně velkých a velkých společnostech určíme množství všech dat určit odhadem. Vytvoříme ho tak, že prohlédneme určitý vzorek našich záložních klientů. Na základě prohlédnutého vzorku vypočítáme průměrné množství dat a to vynásobíme počtem záložních klientů stejného typu. Například můžeme prohlédnout 10 pracovních stanic a spočítat, že průměrné množství dat určených k zálohování je 2 GB. V případě, že náš systém čítá šedesát pracovních stanic, bude náš odhad pro zálohování pracovních stanic 120 GB.[3] 3.3 KDY ZÁLOHOVAT Úspěšnost a efektivita našeho zálohování závisí na vhodně zvolených periodách záloh. Existuje několik typů záloh. Tyto typy se liší velikostí konečných záloh a v čase potřebném pro vytvoření i obnovu zálohy. Můžeme je rozdělit do tří základních kategorií: úplné, inkrementální a diferenciální zálohování. Obvykle se volí perioda úplné zálohy v rozmezí týdne a měsíce. Inkrementální (přírůstkové) a diferenciální (rozdílové) zálohy by se měli vytvářet každý den. Jednotlivé typy podrobněji popíši v kapitole pět metody zálohování. Abychom náš rozvrh záloh vhodně sestavili, je potřeba znát druh dat, která chceme zálohovat a rychlost, s jakou se tato data proměňují.[2] 3.4 KDO PROVÁDÍ ZÁLOHU Proces zálohování dat musí vždy obsluhovat nějaká osoba. V případě domácnosti je to samotný uživatel. V malých podnicích to mohou být rovněž všichni uživatelé počítačů. Ve středně velkých a velkých podnicích se pro tento proces určí zodpovědná osoba, jako je IT administrátor nebo dokonce celý operační tým. V domácnosti tedy zodpovídá za uložení dat sám uživatel. V podnicích, kde je za zálohování zodpovědná konkrétní osoba 18
nebo operační tým, by ale povinnost osobních záloh neměla být z uživatelů úplně sňata. Ti by měli pravidelně ukládat svá data na předem domluvená a jasně stanovená místa, ze kterých budou následně zálohována. Této povinnosti by mohli být uživatelé zproštěni v případě, že by ponechávali své pracovní stanice připojené do sítě a spuštěné celou noc. Přes noc by se tak mohla provést automatická záloha všech dat z těchto záložních klientů. Toto řešení je ale značně neekonomické. S povinností provádět své osobní zálohy by měli být uživatelé seznámeni tak, aby chápali její důležitost a význam. Tato povinnost může být ještě stvrzena legislativním předpisem. V něm bude jasně formulováno, která data se mají ukládat, jak často a kam. Úložištěm pro vybraná data by měl být zálohovaný síťový disk. V případě dostačující kapacity záložního prostoru můžeme uživatelům nabídnout i omezený prostor pro jejich soukromá data a přispět tak ke zlepšení jejich pracovního komfortu.[10] Spolupráce týmů V prostředí velkých systémů, kdy máme pro obsluhu zálohování speciálně určen operační personál, je nutné zajistit spolupráci tohoto týmu s týmem určeným pro správu systému. Je velice důležité, aby mezi sebou oba týmy komunikovaly během každé fáze zálohování. Operační personál je zodpovědný za každodenní zálohy a správní personál zase zodpovídá za chod všech svěřených počítačů. Když nastane situace, ve které je třeba obnovit systém po zhroucení pevného disku, je správce závislý na správném provedení zálohování. Jestliže operační personál nezajistí úspěšnost zálohování, ovlivní tato chyba i možnost správce provést požadovanou obnovu.[3] 19
3.5 JAKÝ HARDWARE POUŽIJEME Veškerá data, která zálohujeme, se ukládají na záložní média. Těch je v dnešní době několik typů a bylo by dobré si tyto média představit. 3.5.1 CD A DVD Jako první medium vhodné pro zálohování uvádím CD (Compact Disc) a DVD (Digital Video Disc / Digital Versatile Disc) nosiče z kategorie optických disků, protože se jedná o finančně nejdostupnější hardware. Díky své nízké ceně, ale zároveň také nízké rychlosti zápisu, jsou tyto nosiče vhodné především pro domácnosti a malé podniky. CD je optický disk určený pro ukládání digitálních dat. Data jsou ukládána ve stopách na jedné dlouhé spirále začínající ve středu media. Tato spirála se postupně rozvíjí až k okraji disku. Délka celé spirály je zhruba 6 km a hustota dat v ní uložených je konstantní. Pro čtení se používá laserové světlo s vlnovou délkou 785 nm. Nejběžnější kapacita CD je 700 MB, přičemž výrobci uvádí maximální datovou kapacitu až 870 MB (dle typu uložených dat).[33] U DVD se data ukládají pod povrch do jedné nebo dvou vrstev opět ve stopě tvaru spirály. Pro čtení dat se používá laserové světlo s vlnovou délkou 660 nm. Kratší vlnová délka je jeden z důvodů jejich vyšší kapacity. Příčný odstup stop je rovněž menší 0,74 μm oproti 1,6 μm u CD. Kapacita závisí na počtu vrstev a stop. Minimální kapacita představuje 4,7 GB. To odpovídá jednovrstvému zápisu na jednu stranu disku. Nejvyšší kapacita může být v případě dvouvrstvého zápisu na obě strany disku 17,1 GB.[34] Rychlost zápisu je u CD 8 MB/s a u DVD 22 MB/s. Přístupová doba činí u obou médií 120 ms. Zapisovatelné disky CD a DVD jsou vhodné pouze pro nestrukturované jednorázové zálohování nebo archivaci. Média CD-RW a DVD-RW umožnily opakovaný zápis na jedno médium a staly se tak použitelné i pro periodické zálohy. Další technologický pokrok přinesl DVD-RAM umožňující práci se soubory způsobem, na 20
jaký jsme zvyklí z pevných disků. Rychlost zápisu u DVD-RAM se pohybuje od 2 do 7 MB/s podle formátu média a přístupová doba je 180 ms. Bohužel ani jedno z těchto médií není vhodné pro dlouhodobé zálohování nebo archivaci dat. Životnost těchto médií není jednoznačně dána. I když výrobci uvádí životnost okolo sto let, existuje mnoho faktorů, které tuto dobu výrazně snižují a toto odvážné tvrzení se tak stává pouze laciným reklamním tahákem. Každé použití média zkracuje jeho životnost, stejně tak jako vystavení prachu, kouři, slunečnímu světlu atd. Největší vliv na stárnutí má zejména způsob zacházení s médiem při přehrávání dat. Nejde tak tedy o bezpečné a sofistikované médium pro zálohování dat. CD a DVD bych doporučil pouze jako doplňující záložní média, pro menší objemy dat.[33, 34, 37] 3.5.2 BLU-RAY A HD-DVD Blu-ray je optický disk třetí generace sloužící k ukládání digitálních dat. Data se ukládají také ve stopě tvaru spirály, jako tomu bylo u CD a DVD, ale 0,1 mm pod povrch disku. Příčný odstup stop je 0,35 μm. Pro čtení disků Blu-ray se používá laserové světlo s vlnovou délkou 405 nm. Díky modrofialové barvě tohoto světla dostal disk jméno Bluray. Varianta s minimální záznamovou kapacitou dat je 25 GB. Jde o jednovrstvý zápis. Dvouvrstvý zápis nabízí kapacitu 50 GB a maximální kapacita Blu-ray může být až 80 GB. V tomto případě se jedná o oboustranný dvouvrstvý zápis. Díky umístění záznamu 0,1 mm pod povrch je možné vyrobit hybridní disk s DVD i Blu-ray záznamem na jedné straně disku. Čtecí zařízení pro disky Blu-ray jsou vyvíjeny s ohledem na kompatibilitu s CD a DVD. Rychlost zápisu pro Blu-ray je 18 MB/s a přístupová doba činí 180 ms.[35] HD-DVD je konkurenční formát vyvíjený firmou Toshiba, který je rovněž založený na modrofialovém laseru. Jeho kapacita se pohybuje od 15 GB až po 45 GB u starších typů HD DVD. V případě 45 GB disku jde ale o třívrstvý zápis. Nověji vyráběná HD DVD mají kapacitu od 17 GB (jednovrstvý zápis) po 51 GB (třívrstvý zápis). Rychlost zápisu je 16 MB/s a přístupová doba činí u HD DVD 180 ms. V roce 2008 bylo ale oznámeno ukončení dalšího vývoje. Životnost těchto médií je podobná jako u CD a DVD a také 21
platí, že každé jejich použití tuto dobu zkracuje. Opět bych je doporučil pouze jako doplňující záložní média.[36] 3.5.3 UDO A PDD Ultra Density Optical (UDO) a Professional Disc for Data (PDD) jsou optické disky určené pro zálohování a archivaci dat, které se na rozdíl od Blu-ray a HD-DVD již dlouho používají v profesionální sféře. Obě zmíněné technologie využívají pro čtení i zápis laserové světlo s vlnovou délkou 405 nm. Všechna média jsou uzavřena a chráněna v standardizovaném cartridge obalu. Protože se jedná o bezkontaktní práci s vlastním médiem, které je chráněno v cartridge, data čtením či zápisem nedegradují, média jsou odolná vůči změnám teplot či vlhkosti a díky plné optice není záznam ovlivnitelný ani působením magnetického pole. Obrázek 1 UDO a PDD [42, 43] Životnost UDO média se ve standardních podmínkách archivace v kancelářském prostředí uvádí více než padesát let. Díky zaměření na profesionální komunity jsou na jeho provoz vyšší nároky, a proto bylo použito kvalitnějších médií a komponent pro mechaniky, což je samozřejmě patrné i na konečné ceně produktu. Co se týče kapacity, 22
první generace UDO nabízí až 30 GB, PDD 23 GB. Druhá generace UDO 60 GB a PDD 50 GB a v třetí generaci UDO a PDD disků se pomyslná miska vah převažuje také ve prospěch UDO se 120 GB, zatímco PDD nabídne 100 GB. Jelikož se jedná o méně známé typy médií zaměřené na profesionální použití, uvedu zde také přenosové rychlosti. Rychlost čtení má UDO 8 MB/s a zápisu 4 MB/s. U PDD se tyto hodnoty pohybují na 11 MB/s při čtení a 4,5 MB/s při zápisu. Přístupová doba je 27 ms u UDO, zatímco 110 ms u PDD. Díky zmíněné vyšší životnosti médií je možné tyto disky použít pro dlouhodobější zálohování či archivaci. Ovšem díky vyšší ceně se tyto média prosadí spíše ve větších společnostech.[38, 39] TABULKA POROVNÁNÍ OPTICKÝCH MÉDIÍ: Médium Průměrná přítupová doba (ms) Maximální kapacita (GB) Rychlost zápisu (MB/s) Životnost (roky) CD 120 0.87 8 100* DVD 120 17.1 22 100* DVD- RAM 180 9.4 4.5 100* BLU-RAY 180 80 18 100* HD-DVD 180 51 16 100* UDO 27 120 4 50 PDD 110 100 4.5 50 * Životnost v optimálním prostředí. Díky velké náchylnosti na vnější vlivy nelze životnost stanovit v kancelářském prostředí. 3.5.4 FLASH DISKY Solid State neboli USB Flash Disk je ideálním datovým úložištěm pro soukromé domácí zálohy. Jedná se o plnohodnotný disk s možností opakovaného zápisu i přepisu jednotlivých souborů. Rychlost zápisu u Flash disků je až 20 MB/s a přístupová doba činí 23
pouhých 0,6 ms. Tyto disky jsou však primárně určeny pro přenos dat. Nebezpečí pro tato zařízení jsou skryta v blízkosti silných elektromagnetických polí a při připojování a odpojování PC. Hrozí zde také větší možnost mechanického zničení. Data mohou být také velice rychle smazána lidskou chybou nebo chybou v softwaru. Rozšíření do profesionálních zálohovacích řešení zatím brání relativně malé kapacity a nízké přenosové rychlosti. [40] 3.5.5 LOKÁLNÍ PEVNÉ DISKY Pevné disky poskytují největší komfort pro potřeby zálohování. Jsou také snadno dostupné a jejich ceny stále klesají. Zároveň přicházejí na trh disky nové s rostoucí kapacitou. Rychlost zálohy či obnovy dat z pevného disku je bezkonkurenčně nejlepší. Data se ukládají na tzv. plotny. Plotny běžných pevných disků dosahují rychlosti až 7 200 otáček za minutu. Přístupová doba u těchto disků je 7 8 ms. Starší disky používaly komunikační rozhraní ATA známé též jako IDE, které dosahovalo maximální přenosové rychlosti 130 MB/s při použití standardu UltraATA-133. V současné době se převážně používají pouze dva standardy disků. SATA/150, který má přenosovou rychlost dat 150 MB/s anebo SATA/300 s přenosovou rychlostí 300 MB/s. Bohužel pevné disky jsou velmi jemná (a stále složitější) mechanická zařízení vybavená miniaturní elektronikou, která pracuje rychlostí tisíců otáček za minutu. Nemůže být divu, že mohou selhat častěji než jiná zařízení. Ztrátě dat z důvodu mechanického selhání můžeme předejít zapojením více disků do pole RAID (viz kapitola Metody zálohování) a rozdělením dat. Lokálně umístěný disk je náchylný na některé formy bezpečnostních incidentů, nejhorším řešením je záloha na stejný disk, kde máme data uložena. Nepatrně lepším řešením se jeví statické umístění disku na jiný počítač.[24] 3.5.6 EXTERNÍ / SÍŤOVÉ DISKY Disk umístěný na jiném počítači, nebo externí disk je oproti lokálnímu disku dobrou volbou. Disky určené pro síťové ukládání dat jsou také odlišné od běžně používaných 24
disků v osobních počítačích. Oproti nim jsou takové disky mnohem rychlejší a z důvodu použití kvalitnějších technologií a komunikačních rozhraní také spolehlivější a mají větší životnost. Jsou rovněž vhodné pro nepřetržitý 24 hodinový provoz. Tyto aspekty se ale odrážejí na jejich ceně. Plotny těchto disků dosahují rychlosti 10 000 15 000 otáček za minutu. Díky vyšším otáčkám mají oproti běžným diskům také vyšší přístupovou rychlost a to 3 4 ms. Díky použitým komunikačním rozhraním SCSI, SAS a FC jsou tyto disky vhodné zejména pro serverové použití. Dávají nám totiž možnost zapojit více disků zároveň. Rychlost přenosu dat se pohybuje od 300 MB/s do 600 MB/s. Bohužel umístění dat na externí nebo síťový disk stále neřeší ztráty dat způsobené přírodními katastrofami nebo krádeží. Uvedeným hrozbám můžeme předejít uložením dat na vzdálený síťový disk. Zálohovaná data tak budou uložena mimo lokalitu originálních dat. V tomto případě musíme zajistit bezpečné šifrování. Nevýhodou bude ale nižší přenosová rychlost a s tím spojené pomalé obnovení dat. V případě pevných disků je z důvodu rychlejší zálohy a obnovy dat lepší ukládat data na lokální síťový disk a současně je šifrovat a ukládat na vzdálené úložiště. Obrázek 2 Externí disky [44] 25
3.5.7 PÁSKOVÉ MECHANIKY Tato zařízení používají magnetooptickou technologii pro zaznamenávání dat na kazetu. Kazeta má v sobě pásku, jakožto magnetický nosič dat. Tyto pásky jsou v současné době stále velice hojně používány a zapisování dat na ně pomocí páskových mechanik je velice oblíbené. To je dáno především jejich cenou, snadným zaváděním, možností jednoduše fyzicky uchovávat pásky, nízkými provozními náklady a automatizací výměny pomocí robotických páskových mechanik. I když je tato technologie již dosti zastaralá, od doby, kdy byla poprvé použita, navrhují odborníci neustále rychlejší a spolehlivější páskové jednotky a stejně tak magnetické pásky s větší kapacitou a delší životností. Stejně jako celý počítačový průmysl se i tato technologie neustále zlepšuje. Díky své dlouhé životnosti nejsou magnetické pásky vhodné pouze pro zálohování, ale i pro archivaci dat. Bezpečné uložení dat na pásce podporuje také technologie WORM, která nám umožňuje nastavit pro jednotlivé pásky ochranu dat proti přepisu či samotnému smazání. Co se týče přístupu k uloženým datům, zaostávají tyto mechaniky za pevnými disky. Data jsou zde ukládána sekvenčně. To znamená, že pokud chceme z pásky obnovit konkrétní soubor, musíme počkat, než se páska přetočí na místo, kde je soubor zapsán. Tato přístupová metoda není nejrychlejší. V praxi se ale se zálohou na konkrétní místo na pásce setkáme jen zřídka. Většinou zálohujeme předem definovaný objem dat, mechanika načítá jednotlivé kazety a zapisuje na ně od začátku pásky. Nedochází tak k prodlevě při převíjení pásky na konkrétní segment. Přenosová rychlost dat je již srovnatelná s pevnými disky, záleží na konkrétní pásce.[3] Formáty magnetických pásek Formátů magnetických pásek existuje v dnešní době celá řada a rozboru těchto formátů by mohla být věnována další takováto práce. Proto jenom stručně shrnu možnosti dnešních formátů. Jedny z nejpoužívanějších formátů pásek jsou LTO, SDLT, AIT, které se používají v malých a středních podnicích. Důvodem je jejich velká kapacita a nižší pořizovací cena obslužných mechanik přibližně 30 000 Kč až 120 000 Kč. Tyto pásky nabízejí kapacitu od 300 GB do 1600 GB na jednu kazetu. Přenosová rychlost dat je od 26