ŠKODA AUTO a.s. Vysoká škola Studijní program: N6208 Ekonomika a management Studijní obor: 6208T088 Podniková ekonomika a management provozu A N A L Ý Z A Ú P L N O S T I Z Á Z N A M U D A T N A O P T I C K Ý C H M É D I Í CH Vladislava HÝBLOVÁ Vedoucí práce: doc. Ing. Eva Jarošová, CSc.
ANOTAČNÍ ZÁZNAM AUTOR Vladislava Hýblová STUDIJNÍ OBOR 6208T088 Podniková ekonomika a management provozu NÁZEV PRÁCE Analýza úplnosti záznamu dat na optických médiích VEDOUCÍ PRÁCE doc. Ing. Eva Jarošová, CSc. INSTITUT Institut ekonomiky provozu a technických věd ROK ODEVZDÁNÍ 2010 POČET STRAN 74 POČET OBRÁZKŮ 31 POČET TABULEK 37 POČET PŘÍLOH 4 STRUČNÝ POPIS Předmětem diplomové práce je analýza záznamu dat na optických médiích u vybraných značek disků v různých experimentálních podmínkách. Cílem je prověřit existenci rozdílu v kvalitě, resp. chybovosti vybraných značek optických disků. Vyhodnocení tohoto experimentu je provedeno pomocí analýzy rozptylu a Kruskal-Wallisova testu. Práce zároveň zahrnuje popis jednotlivých druhů nosičů a technologie záznamu dat na optických médiích. Součástí práce je také vyhodnocení výběrového dotazníkového šetření o rozsahu 150 respondentů zabývajícího se otázkami využití, kvality a znalosti problematiky optických disků. KLÍČOVÁ SLOVA ANOVA, dotazníkové šetření, Kruskalův-Wallisův test, specifikace optických disků, záloha dat.
ANNOTATION AUTHOR Vladislava Hýblová FIELD 6208T088 Business Management and Administration THESIS TITLE The analysis of recording data integrity on optical media SUPERVISOR doc. Ing. Eva Jarošová, CSc. INSTITUTE IPT YEAR 2010 NUMBER OF PAGES 74 NUMBER OF PICTURES 31 NUMBER OF TABLES 37 NUMBER OF APPENDICES 4 SUMMARY The object of this graduation thesis is in particular the analysis of recording data on optical medias of selected brands in different experimental conditions. The aim is to recognise whether differences in quality or error rates between selected brands of optical disc exist. Experiment is evaluated by means of analysis of variance and Kruskal-Wallis test. The thesis contains the description of various kinds of optical discs and technology of data recording on these medias. In addition, a part of the thesis is an evaluation of questionnaire inquiry, which deals with utilisation, quality and knowledge of optical disc problem. KEY WORDS ANOVA, back up, questionnaire survey, Kruskal-Wallis test, optical discs specification.
Prohlašuji, že jsem diplomovou práci vypracovala samostatně s použitím uvedené literatury pod odborným vedením vedoucího práce. Prohlašuji, že citace použitých pramenů je úplná a v práci jsem neporušila autorská práva (ve smyslu zákona č. 121/2000 Sb. o právu autorském a o právech souvisejících s právem autorským). V Mladé Boleslavi, dne 15.1.2010 Vladislava Hýblová 3
Touto cestou bych ráda poděkovala paní doc. Ing. Evě Jarošové, CSc. za odborné vedení diplomové práce, poskytování rad a informačních podkladů. 4
Obsah 1 Úvod... 9 2 Historie kompaktního disku... 11 3 Princip záznamu dat na optických discích... 14 3.1 Konstrukce kompaktního disku... 14 3.1.1 Barviva záznamových vrstev... 15 3.2 Záznam a čtení dat na kompaktním disku... 16 3.3 Specifikace kompaktních disků... 18 3.3.1 Červená kniha... 18 3.3.2 Žlutá kniha... 20 3.3.3 Další specifikace kompaktních disků... 21 3.4 DVD... 23 3.5 Oprava chyb... 24 3.5.1 CIRC... 24 3.5.2 Interpretace chyb c1 a c2... 24 3.5.3 Interpretace chyb PIE a PIF... 25 4 Životnost optických disků... 26 4.1 Faktory ovlivňující životnost... 26 4.1.1 Manipulace s disky... 26 4.1.2 Skladování... 27 4.1.3 Rychlost vypalování... 27 5 Další možnosti zálohování dat... 28 6 Experiment s optickými médii... 31 6.1 Příprava experimentu... 32 6.2 Testování optických disků... 33 6.2.1 Výstupy z programu... 33 6.3 Statistické metody vyhodnocení... 34 6.3.1 Analýza rozptylu... 34 6.3.2 Kruskalův-Wallisův test... 35 6.4 Vyhodnocení záznamu dat bezprostředně po vypálení... 36 6.5 Vyhodnocení po provedení zkoušek... 42 6.5.1 Škrábání ze spodní stany disku... 42 6.5.2 Ohýbání... 44 5
6.5.3 Nízká teplota... 47 6.5.4 Světlo a UV záření... 49 6.5.5 Vyhodnocení disků nepodrobovaných experimentálním zkouškám.. 51 7 Souhrnné vyhodnocení... 54 8 Dotazníkové šetření... 60 8.1 Využití optických médií... 60 8.2 Problémy s kvalitou optických disků... 62 8.3 Rychlost vypalování... 63 8.4 Vnímání kvality vybraných značek... 63 8.5 Životnost... 65 8.6 Faktory poškozující optické disky... 66 8.7 Nákup a skladování optických disků... 66 8.8 Oblíbenost značek optických médií... 67 8.9 Současné využití Blu-ray technologie... 68 9 Závěr... 70 10 Seznam literatury... 72 11 Seznam příloh... 74 6
Seznam zkratek ANOVA Analysis of variance (analýza rozptylu) CIRC Cross-Interleave Reed-Solomon Code CD Compact Disc (kompaktní disk) CD-I Compact Disc-Interactive CD-MO Compact Disc CD-ROM/XA Compact Disc Read-Only Memory Extended Architecture CD-R Compact Disk Recordable CD-ROM Compact Disc Read-Only Memory CD-RW Compact Disk Rewritable CD-WO Compact Disc Write Once CRC Cyclic redundancy check DVD Digital Versatile Disk DVD-R Digital Versatile Disk - Recordable DVD-ROM Digital Versatile Disk Read-Only Memory DVD-RW Digital Versatile Disk Rewritable EDC Extended detection and correction ECC Error Correction Code EF eight-to-fourteen (osm na čtrnáct) GB gigabyte HD High Definition IT informační technologie kb kilobyte kbps kilobyte per second (kilobajt za vteřinu) LAN Local Area Network MB megabyte MBps megabyte per second NAS Network Attached Storage nm nanometr UV Ultraviolet (ultrafialový) PCM Pulse Code Modulation (pulzní kódová modulace) PI Parity Inner PIE Parity Inner Error 7
PIF PO TOC Parity Inner Failure Parity Outer Table of content 8
1 Úvod Uchovávání informací je velice diskutovanou problematikou. Samotné informace a dobře vybudovaný informační systém jsou základem konkurenční výhody. Všechny oblasti podnikatelské sféry jsou nezbytně spojeny s mnoha informačními toky, které generují obrovské množství dat. S novými technologiemi a digitalizací dat se projevuje rostoucí trend potřeby zálohy dat, spojený s nárůstem objemu těchto dat. Kromě toho na nezbytnost zálohy poukazuje také zákonná povinnost archivace některých dat. Existuje mnoho rizik ztráty či poškození dat, které mohou mít velmi negativní dopady. Ztráta dat bývá mnohdy značně nepříjemná a následné dohledávání ztracených nebo poškozených dat je náročné na čas i peníze. V horším případě se jedná o ztrátu jedinečných dat, která se nedají nijak obnovit a podnik či jednotlivec může být touto skutečností oslaben. Negativní dopady nepředstavuje pouze ztráta dat v důsledku špatné zálohy. Postačí, když podnik použije k distribuci dat, např. pro reklamní účely, nespolehlivé nosiče. Zákazník nebo obchodní partner, místo aby byl ohromen nabídkou podniku, nemůže nosič otevřít a k žádným informacím se nedostane. Reklama společnosti je v takových případech nejen zbytečná, ale tato skutečnost také negativně ovlivňuje mínění o podniku. Současné způsoby uchování informací se neustále zdokonalují a stále se hledají nové způsoby zálohy dat. Tato práce se zaměřuje především na záznam a uchování dat na optických médiích. Pojednává však také o dalších možnostech archivace dat. Začátek diplomové práce je zaměřen na samotné optické disky a na technologii záznamu dat na těchto médiích. Popisuje vznik této technologie záznamu, jednotlivé druhy nosičů, dále způsob záznamu a korekce dat, jejichž základní znalost je nezbytná pro pochopení měření chybovosti disků. Práce zároveň dává doporučení, jak zacházet s optickými disky a jak minimalizovat riziko poškození nosiče a ztráty informace. 9
Hlavním cílem práce je provést analýzu záznamu dat vybraných značek optických médií a porovnat jejich kvalitu, resp. chybovost v různých experimentálních podmínkách. Z tohoto důvodu další část práce zahrnuje popis experimentu s optickými médii a jeho následné vyhodnocení za pomocí analýzy rozptylu a Kruskal-Wallisova testu. Součástí práce je také vyhodnocení vlastního dotazníkového šetření, jehož cílem byl průzkum současného využití optických disků a stupeň základních znalostí o těchto médiích u dotazovaných respondentů. 10
2 Historie kompaktního disku Historie kompaktního disku sahá do poloviny 19. století. Souvisí s vynalézáním způsobů ukládání lidského hlasu či jiných zvuků pro pozdější přehrání. Na začátku šlo pouze o záznam zvuku, nikoliv o současně mnohem rozšířenější ukládání dat. To dokazuje existence prostředků pro záznam zvuku mnohem dříve, než byl vynalezen počítač. V roce 1855 byly vynalezeny fonografy s voskovými válečky a o 60 let později vznikly zvukové desky. Významný pokrok nastal v roce 1937, kdy byl vynalezen postup, který se používá pro ukládání dat na kompaktní disky, tzv. pulzní kódová modulace 1 (dále PCM) [4]. V roce 1970 vývojáři společnosti Philips vytvořili prototyp kompaktního disku (z angl. compact disc dále CD) ze skla. Společnost Philips si toto technologické prvenství ochránila řadou patentů a v pozdějších letech se stala uznávaným vynálezcem tohoto média. Od roku 1973 japonské společnosti začaly vyvíjet zařízení pro digitální záznam zvuku. Technické společnosti představovaly mnoho prototypů zařízení pro digitální záznam zvuku. Prvenství však obhájila rovněž společnost Philips, která také dala základ pro budoucí standardy. Původní skleněný materiál byl nahrazen polykarbonátem, který se díky svým vlastnostem jevil pro masovou výrobu jako daleko vhodnější. Rovněž Philips ustanovil, že bude čten opačně, než tomu bylo u gramofonových desek, tzn. ze středu ven. Rozhodlo se také o velikosti disku, jehož průměr byl z původních 115 mm zvětšen na 120 mm [4]. Proč nakonec došlo ke změně rozměru je popsáno v následujícím příběhu. Vysoký představitel společnosti Sony, který se rovněž podílel na koncipování kompaktních disků, patřil mezi vášnivé znalce vážné hudby. Podotknul, že se na tehdejší 115 mm nevejdou některé skladby klasické hudby, což by mohl být problém. Nemělo by význam vyvinout hudební médium, na které by se nevešly skladby významných skladatelů. Jakmile je u CD jednou stanovena délka, nelze ji měnit, tedy zhušťovat spirálu, jako tomu bylo u vinylových desek a proto bylo 1 pulzní kódová modulace základní (starší) typ modulace audio signálu do digitálního tvaru, používaný též pro dekódování a pro převod digitálního signálu na CD a opět do analogového audia pro poslech 11
zvětšeno. Nakonec o velikosti disku rozhodla Beethovenova Devátá symfonie, jejíž nejdelší záznam má právě 74 minut. S tehdejší technologií nebylo možné uchovat tak dlouhý záznam na původní velikost. Nicméně vývoj disků nebyl zdaleka tak náročný, jako vývoj čtecích mechanik [4]. V roce 1983 byl výsledek výše zmíněného vývoje uveden na trh a již v průběhu prvního roku byl zaznamenán rychlý nástup, což dokazuje prodej 30.000 mechanik a 800.000 disků v USA. Během tří let komerčního prodeje hudebních disků se tato čísla v USA vyšplhala na 53 miliónů CD a až na tři miliony přehrávačů [2]. Doposud se disky vyráběly průmyslově za pomoci lisování. Vývoj v této oblasti se neustále zlepšoval a již v roce 1988 bylo představeno datové CD, označované jako CD-ROM. Tento pokrok umožnil záznam dat na disk přímo na stolním počítači. Tato stolní technologie je založena na postupném vyškrabování. Podrobnější princip vypalování, je popsán později. Počátkem 90. let 19. století byly tyto stolní CD rekordéry, neboli vypalovačky uvedeny na trh [4]. Rok 1996 přinesl významnou novinku v podobě DVD technologie a již o rok později byl na světě první DVD disk, který je chápán jako vylepšené CD se sedmkrát větší kapacitou. Zkratka DVD vznikla z původního oficiálního pojmenování digital video disk. Později se přišlo na to, že video je značně omezující výraz, jelikož tento disk má mnoho jiných použití. Byla snaha tento disk zpětně pojmenovat a vytvořil se název digital versatile disk [4]. Počátkem 90. let 20. století společnost Sony uvedla novinku nazvanou MiniDisc, která disponuje kapacitou podobnou CD diskům, ale na rozdíl od nich je uložen v plastovém pouzdře, které jej chrání před mechanickým poškozením. Díky této odlišnosti a kvůli své velikosti (70x67,5x5 mm) se nejvíce používal jako médium přenosných přehrávačů. Tento disk se však nestihl masově rozšířit z důvodu příchodu paměťových karet a přehrávačů s pevným diskem a toto médium se začalo postupně vytrácet [12]. Příchod videa vysokého rozlišení (HD z angl. High Definition) na počátku 21. století si žádal vývoj nového média s větší kapacitou a vyšší rychlostí čtení 12
dat. Začal souboj dvou nových standardů Blu-ray a HD-DVD. Prototyp Blu-ray byl poprvé představen v roce 2000 na veletrhu CEATEC v Japonsku společností Philips a Sony. Standard HD-DVD je prosazován společnostmi Toshiba, NEC, Microsoft a Intel. Tyto standardy jsou navzájem nekompatibilní, tedy disk vytvořený pro jeden standard, nelze číst v mechanice určené pro druhý standard a naopak [4,15]. Formát Blu-ray je chápán jako pokročilejší, disponující vyšší kapacitou a rychlostí zapisování a vyžaduje úplně novou technologii, která je výrazně dražší. Formát HD-DVD je spíše vylepšení stávajícího DVD disku, proto se taky nazývá High Density DVD. Přesto tyto formáty mají něco společného. Užívání těchto formátů vyžaduje nákup nových mechanik, které nejsou zároveň schopny zapisovat na klasické DVD [4]. Po tříletém soupeření firma Toshiba svůj boj vzdala a v únoru roku 2008 oznámila, že přestane vyvíjet, vyrábět a prodávat přehrávače a rekordéry HD DVD. Koncern se však zaručil, že zajistí podporu již prodaným přístrojům, které ve světě vlastní zhruba milion spotřebitelů. Příčinou tohoto kroku bylo rozhodnutí významné filmové společnosti Warner Bros. Entertainment, která oznámila, že bude své filmy vydávat pouze na discích Blu-ray [16]. Blu-ray disky jsou teprve rozšiřujícím se médiem na světovém trhu. Masové rozšíření těchto technologií do domácností a kanceláří ještě nějaký ten rok potrvá. Důvodem je především vysoká cena jak mechanik, tak disků, i když výrobci se stále snaží posunovat cenovou hranici této technologie směrem dolů. Dalším důvodem vysoké ceny Blu-ray médií je v porovnání se starší generací optických disků stále malá konkurence. Investice na přechod výroby Blu-ray disků jsou vysoké a některé výrobci s tímto krokem stále vyčkávají až do doby, kdy se zvýší odbyt těchto médií. 13
3 Princip záznamu dat na optických discích Informace jsou na disku zaznamenány formou binárních dat, která jsou pomocí laserového paprsku snímána a převáděna do počítače. Toto je nejjednodušší odpověď na otázku, jak jsou data na kompaktním disku uložena. Pro pochopení principu záznamu dat na optických médiích je však nutno blíže vysvětlit z čeho jsou optické disky vyrobeny a proč, dále jak funguje disková mechanika a popsat způsoby a metody zápisu a čtení. Základní principy jsou vysvětleny na formátu kompaktního disku. U dalších disků jsou zmíněny pouze odlišnosti. 3.1 Konstrukce kompaktního disku Základem konstrukce kompaktního disku je kotouček z polykarbonátu o průměru 120 mm. Vnitřní část disku až po průměr 46 mm neobsahuje žádná data a rovněž je prázdná i vnější část disku od průměru 117 mm. Mezi těmito prázdnými oblastmi se nachází mezikruží, ve kterém se ukládají data, přičemž mezi 46. až 50. milimetrem a 116. až 117. se nachází speciální prostor pro zaváděcí stopu (lead-in) a ukončovací stopu (lead-out). Tyto termíny budou vysvětleny blíže v podkapitole 3.3.1 Červená kniha. Výše popsané rozložení disku je znázorněno na obrázku 1 [2,4]. zdroj: Velká kniha vypalování CD a DVD., str. 25 Obr. 1 Formát CD Na polykarbonátovém kotoučku je nanesena vrstva z organického barviva, do které se zaznamenávají data. Na barvivu se nachází kovová odrazová vrstva pokrytá lakem, který slouží pro popis, polep a případně potisk. Média určená pro 14
potisk mají navíc speciální vrstvu, která je schopna absorbovat inkousty z tiskárny. Speciální úpravou může disponovat i samotný polykarbonátový kotouček, který stále častěji bývá vylepšen o ochranu proti poškrábání. Řez diskem je znázorněn na obrázku 2. V případě přepisovatelných disků se organické barvivo umisťuje mezi dvě vrstvy dielektrik 2. Tím se zamezí vzájemnému spojování vrstev a přechodu elektrického náboje, ke kterému dochází při fázové změně mimo vrstvu s barvivem [2]. zdroj: [17] Obr. 2 Řez diskem CD-R 3.1.1 Barviva záznamových vrstev Vlnová délka laserových paprsků pro CD je 780 nanometrů, která patří do infračerveného spektra a je pro člověka neviditelná. Barviva používaná pro záznamovou vrstvu musí absorbovat právě v této oblasti spektra, tedy kolem 780 nanometr [citace 2, str. 48]. Barva disku závisí na barvě specifického barviva, které bylo použito v záznamové vrstvě. Výsledného odstínu je docíleno přidáním odrazové reflexní vrstvy. Například zelená a zelenomodrá média, která bývají nejlevnější, vznikají kombinací modrého barviva záznamové vrstvy cyaninu a odrazové vrstvy ze slitin zlata a stříbra. Tato média mají menší odrazivost a životnost těchto disků se odhaduje na deset let. Nejnovější cyaninová barviva, do kterých se přidávají kovové částice, vykazují již větší životnost, a to 20 až 50 let [2]. 2 Dielektrikum látka, která není schopná vést elektrický proud. 15
Další možností je použití barviva transparentního ftalocyanin a odrazové fólie ze zlata nebo slitin zlata. Výsledkem je tedy zlatá barva. V porovnání s ostatními médii mají tyto disky největší odrazivost a při dodržení pokynů výrobce by životnost měla dosahovat až 100 let [2]. Poslední kategorii barviv zastupují tzv. azová barviva, která patří mezi kovokomplexní 3 barviva obsahující kovové částice již v základu. Používají se v kombinaci s odrazovou vrstvou z hliníku nebo stříbra a diskům dává modrou až tmavě modrou barvu. Trvanlivostí se tyto disky vyrovnají ftalocyaninovým médiím se zlatou odrazovou vrstvou [2]. 3.2 Záznam a čtení dat na kompaktním disku Data na kompaktních discích jsou zaznamenána v jedné souvislé spirálovité stopě, na níž leží stejně velké sektory uspořádané těsně vedle sebe. Stopa je tvořena miliony na sebe navazujících prohlubní, které se nazývají pits (jámy) a mezi nimi jsou výstupky lands (plošiny). Takto jsou na disku zaznamenána binární data, která jsou pak následně snímána laserovým paprskem mechaniky [10]. Paprsek má přesně definovanou vlnovou délku 780 nanometrů, tedy patří do infračerveného spektra a je těsně pod hranicí viditelnosti. Toto je vlnová délka ve vzduchu. Pro úplnost, v plastu je tato vlnová délka nižší a to 500 nanometrů. Toto číslo se neuvádí jen pro zajímavost, ale má veliký význam. Hloubka prohlubní je přesně stanovena tak, aby činila jednu čtvrtinu vlnové délky záření. Světlo, které se odrazí od prohlubní, tedy putuje o půl vlnové délky větší dráhu než světlo, které se odrazí od výčnělku. V délkových jednotkách to činí zhruba 0,11 až 0,13 mikrometru [4]. Dopadne-li světelný paprsek na prohlubeň, rozptýlí se a jen část se ho vrátí zpět. Dopadne-li však paprsek na výstupek, odrazí se s výrazně vyšší intenzitou. Paprsek se odrazí do fotodiody, která mění intenzitu světla na elektrické napětí. 3 Kovokomplexní - komplex je tvořen dvěma molekulami barviva vázanými na jeden atom kovu. Proto se tato barviva označují jako komplexy 1:2. Kovem, jež obsahují tyto komplexy, je nejčastěji chrom nebo kobalt. 16
Změna toho to elektrického napětí způsobená změnou intenzity světla pak představuje 1, zatímco konstantní napětí představuje 0. Rozhodující není tedy samotná existence prohlubní a výčnělků, ale jejich přechod. Následují-li po sobě dva výčnělky, jedná se o nulu, stejně jako když po sobě následují dvě prohlubně. Tento způsob interpretace výčnělků a prohlubní se nazývá pulsní kódová modulace. Čtecí senzor, fotodetektor, tedy zaznamenává světlo nebo tmu, respektive odraz a téměř žádný odraz a tyto informace si pak jednoduše přeloží do podoby 1 a 0. Grafické znázornění je na obrázku 3 [4,9]. zdroj:[13] Obr. 3 Výstupky a prohlubně zdroj: CD-ROM Příručka pro začínající uživatele Obr. 4 Čtení CD-ROM laserovým paprskem mechaniky Jak již bylo řečeno, disk je rozdělen na několik stejných sektorů. Aby byla zaručena stejná rychlost čtení dat napříč sektory, je nezbytné, aby se disk při 17
snímání u vnitřního okraje otáčel rychleji, než při snímání na vnějším okraji. Synchronizace je tedy nezbytná [10]. 3.3 Specifikace kompaktních disků Následující specifikace určují formáty dat, ve kterých mohou být ukládána na média. K uživatelským datům se přidávají další údaje, například hlavičky (dodatečné informace o daném rámci), synchronizační data a data pro kontrolu chyb. Jednotlivé standardy jsou rozděleny do několika barevně rozlišených knih. 3.3.1 Červená kniha Červená kniha (Red Book) je pojmenování pro původní standard popisující kompaktní disk s analogovým zvukovým záznamem. Jedná se vůbec o první specifikaci kompaktního disku. Název červená byl zvolen, protože vytištěná specifikace byla vložena do červených desek přesný normativní název zní IEC 908 [4]. Protože rychlost čtení není konstantní, nemusela by být data v případě delších úseků prohlubní nebo výčnělků správně vyhodnocena a paprsek by měl bez pomocných opatření problém rozpoznat, přes kolik nul již prošel. Data tedy musí být sestavena do takové struktury, která zajišťuje, že nedojde k vytvoření žádného nečitelného shluku nul. Také příliš časté střídání mezi 0 a 1 může zapříčinit špatné vyhodnocení čtecím laserem, proto i pro tento případ existují opatření [10]. Ke splnění těchto podmínek se používá EF modulace, eight-to-fourteen (osm na čtrnáct), která překóduje osmibitové slovo do 14-bitové formy, aby byly splněny následující podmínky: 1. Logická jednička může opět přijít po dvou logických nulách. 2. Nejpozději po jedenácti nulách musí být opět zapsána jednička. Při čtení dat z disku je 14-bitové slovo opět překódované do osmibitového. Tento postup má tu výhodu, že je možno používat obvyklé systémy detekce chyb. Přes výše uvedené opatření mohou stále nastat případy, kdy dojde k nežádoucímu sledu bitů, proto se mezi každé slovo vkládají ještě tři samostatné 18
bity, tzv. spojovací bity, které mohou mí podobu jedniček nebo nul a při čtení jsou automaticky odděleny [10]. Doposud jsme opomíjeli synchronizaci systému. Aby bylo docíleno systému, který se bude schopen sám synchronizovat, je nutno sestavit uživatelská data do bloků o 24 informačních posloupnostech. Sečteme-li všechny tyto bity, dostaneme základní stavební kámen pro záznam na audio CD rámec (frame), který se vždy skládá z 588 bitů [4]. Tab. 1 Uspořádání bitů do datového rámce Synchronizační slovo 24 Bitů Kontrolní a zobrazovací bity 14 Bitů Datové bity 336 Bitů Bity pro korekci chyb 112 Bitů Spojovací bity 102 Bitů Rámec 588 Bitů zdroj: zpracováno dle Velká kniha vypalování CD a DVD, str. 42 Abychom na jednu stopu disku zapsali 24 osmibitových slov, tedy 192 bitů nesoucích skutečnou informaci, potřebujeme celkem 588 bitů. U datových disků je tento rozdíl výraznější a to vlivem třetí korekční vrstvy [4,10]. Na začátku stopy se nachází lead-in, neboli zaváděcí stopa, která informuje o začátku záznamu. Skládá se ze samých nul a na konci je dvouvteřinový interval ze samých jedniček. Navíc obsahuje tabulku TOC 4, která obsahuje informace o druhu CD, obsahu a délce stopy [4,10]. Lead-out, ukončovací stopa se nachází na vnějším okraji disku. Před jejím začátkem se nachází dvou až tří vteřinový interval složený ze samých jedniček a po něm následuje střídající se sekvence jedniček a nul v půl vteřinovém intervalu až po konec záznamového prostoru. Mechanika nečte celý prostor lead-out. Obvykle se zastaví v okamžiku identifikace ukončovací stopy [4]. 4 TOC Table of Content 19
Na této Červené knize byl vybudován standard pro ukládání dat, který byl zanesen do tzv. Žluté knihy (Yellow Book). 3.3.2 Žlutá kniha Standard pro datový disk CD-ROM, neboli compact disc - read-only memory, přinesl možnost zaznamenávat na kompaktní disky počítačová data. Kromě toho udává, v jaké formě se na disk ukládá digitalizovaný zvuk, který však není kompatibilní se zvukovými CD a nelze ho tedy přehrát v klasickém CD přehrávači [2,10]. Po fyzické stránce není mezi Audio CD a CD-ROM žádná odlišnost. Po stránce logické, tedy jakým způsobem jsou data na disku uložena, nastává výrazný rozdíl, a to zejména z důvodu existence požadavku na naprostou bezchybnost. U audio CD dochází k mnoha desítkám čtecích chyb, které však mohou být interpolací 5 dopočteny, aniž by posluchač cokoliv poznal. V opačném případě dojde nanejvýš ke slyšitelnému pazvuku. Vyskytne-li se však taková chyba na datovém disku např. v zapsaném programu, potom jsou přinejmenším některé části tohoto programu nepoužitelné. Z tohoto důvodu je ve Žluté knize definována druhá úroveň korekce chyb, dodatečná rutina detekce (EDC) a odstraňování chyb (ECC) pro Mode 1, viz podkapitola 3.3.2.2 Detekce a korekce: EDC a ECC [4]. Uspořádání dat oproti Audio CD se u CD-ROMu podstatně liší. Nejsou zde jednotlivé rámce, ale větší jednotky zvané sektory, které se skládají z 98 rámců. 3.3.2.1 Mode 1 a Mode 2 Žlutá kniha představuje dodatečné normy, které definují dva režimy: Mode 1 pro počítačová data a mode 2 pro komprimovaná zvuková data nebo obrazová či grafická data. Mode 1 je základní formát pro ukládání dat. Obsahuje sektory o velikosti 2352 bytů, ovšem pouze z toho 2048 bytů je určeno pro uživatele. Zbytek 5 Interpolace [lat.] matematický způsob, jak nalézt přibližnou hodnotu funkce v bodě intervalu, v němž několik hodnot této funkce známe. 20
zaujímají data pro rozšířenou detekci a korekci chyb. Obsahuje korekční mechanismus první vrstvy, tzv. Cross-Interleave Reed-Solomonův kód (CIRC), převzatý z Audio CD (viz kapitola 3.5.1). Pomocí redundantních dat a interpolací načtených hodnot chyby opraví. Tím dochází ke snížení chybovosti v průměru ze stovky tisíc chyb na disku na pouhou jednu chybu na deset až sto tisíc bitů informací. Jako pojistka pro odfiltrování zbývajících chyb slouží EDC a ECC [4]. Formát Mode 2 je určený rovněž pro ukládání dat, tentokrát hudebních nebo video dat. Nejsou zde požadavky na stoprocentní bezchybnost, proto neobsahuje dodatečný korekční systém. Výsledný prostor pro uživatelská data je tedy o něco větší, tedy 2336 bytů. Standard se ve své prvotní podobě vůbec nepoužívá. Slouží pouze jako podklad pro jiný formát, CD-ROM/XA (viz podkapitola 3.3.3 Další specifikace kompaktních disků) [4]. 3.3.2.2 Detekce a korekce: EDC a ECC EDC a ECC (Extended detection and correction) zastupuje druhou korekční vrstvu. Provádí dvě činnosti, detekci a korekci chyb. Detekce spočívá v provedení kontrolního součtu (CRC cyclic redundancy check) všech přečtených dat za pomocí pouhých 4 bytů jednoho kontrolního čísla. Pro korekci je použito 276 bytů zabírající data, s jejíž pomocí lze chyby opravit. Využívá se stejného mechanismu jako při první úrovni korekce, tedy kódu CIRC [4]. 3.3.3 Další specifikace kompaktních disků Výše popsané CD Audio a CD-ROM vytvořily základ pro vznik dalších modifikací těchto disků. Rodina kompaktních disků je velice rozsáhlá a jednotlivé druhy popisují rovněž specifikace popsané v barevných knihách, viz obrázek 5. CD-Recorable jsou média určená pro jednorázový záznam na magnetooptických discích (CD-MO), kompaktních discích (CD-WO), které po prvotním zápisu umožňují pouze čtení a na přepisovatelných médiích (CD-RW) [4]. CD-I (interaktivní) představuje zastaralý standard, který vyžaduje speciální stolní přehrávač, jelikož mechanika CD-ROMu není schopna interpretovat tento 21
formát dat. Specifikaci tohoto formátu charakterizuje Zelená kniha (Green Book) [4]. CD-ROM/XA umožňují ň na jedné stopě ě zapisovat jak data, tak hudbu. Tento duplicitní záznam však přináší nevýhody v podobě horší kvality zaznamenané hudby a je určeno pouze pro mechaniky CD-ROM [4]. zdroj: zpracováno dle: Velká kniha vypalování, str. 56 Obr. 5 Schéma rodiny kompaktních disků Rozšířené hudební CD je charakterizované Modrou knihou, která kombinuje standardy Červené Č a Zelené knihy. Je určeno pro záznam hudby a dat, která jsou na disk výhradně vylisována [4]. CD-i Bridge vychází z formátu CD-ROM/XA a přidává k němu další kód pro čitelnost v přehrávači ř pro standard CD-I. Je využíván především formátem Photo CD,, který se používal pro ukládání fotografií ve vysokém rozlišení zejména při skenování. Video CD také využívá technologie CD-i Bridge, ale je určen výlučně č ě pro ukládání videa [4]. Kompaktní disky se využívají především pro záznam hudby, marketingové účely a distribuce dat. Archivace dat na těchto médiích se používá jen zřídka, ř díky existenci formátu DVD s několika ě násobně ě vyšší kapacitou. Další zaznamenávání pro tyto účely se stává neefektivní. 22
3.4 DVD Pod zkratkou DVD se rozumí technologie optického záznamu dat. Nejedná se v podstatě o nic jiného než o vylepšené CD. Protože DVD vychází ze standardů CD a odlišnosti jsou spíše kvantitativního, než kvalitativního charakteru, uvedeme v této kapitole pouze odlišnosti od kompaktních disků [4]. Hlavní rozdíl je v záznamové vrstvě. Drážky pro záznam jsou uspořádány blíže u sebe a velikost výstupků a prohlubní je menší, čímž se dosáhne většího množství uložených dat na stejném místě. Aby mohla mechanika tuto větší hustotu dat přečíst, využívá se zde paprsek laseru o kratší vlnové délce 650 a 635 nm. Větší úspory dat je také docíleno použitím efektivnějšího systému korekce dat [4]. Kompaktní disky jsou výlučně jednostranné a jednovrstvé. DVD jsou charakterizována jako média, na kterých se mohou vyskytovat dvě vrstvy, a to z jedné strany nebo z obou stran. V praxi se však používá pouze disk s jednovrstvým záznamem z jedné strany, jelikož výroba ostatních modifikací je nákladná. Je výhodnější vyrobit dvě jednovrstvá DVD místo jednoho dvouvrstvého či oboustranného DVD [4]. Jednotlivé specifikace DVD disků jsou ustanoveny v knihách označené písmeny abecedy, na rozdíl od CD, kde byly jednotlivé standardy ukotveny v barevných knihách: Kniha A (Book A) základní specifikace pro DVD-ROM, tj. disku určeného jen pro čtení. Kniha B (Book B) specifikace standardu pro DVD-Video, dnes nejpoužívanější u průmyslově vyráběných disků. Kniha C (Book C) specifikace pro DVD-Audio, pro vysoce kvalitní multikanálový zvuk, může obsahovat i video nebo obrázky, ale spíše jako doplněk hudebního záznamu. Kniha D (Book D) specifikace pro zapisovací disky DVD-R a mechaniky. Kniha E (Book E) specifikace pro přepisovací disky DVD-RW a mechaniky [2]. 23
3.5 Oprava chyb Samotné médium chyby neobsahuje. Jedná se o chyby vzniklé v procesu čtení. V tomto pojetí chybou rozumíme špatné prvotní přečtení dat z disku. Existují různé typy chyb, z nichž nejčastější jsou označovány jako c1 a c2 u kompaktních disků a PI a PIF u DVD disků. Tyto chyby se vyskytují jak na vypalovaném, tak vylisovaném disku [2]. 3.5.1 CIRC CIRC, Cross Interleaved Reed solomon Code, představuje základní opravu chyb na optických discích. Skládá se ze tří vrstev zlepšujících integritu dat. První vrstvou je tzv. Data Interleaving, prokládání dat, pomocí nichž jsou bity uživatelských dat promíchány dle předem definovaného algoritmu. Tento proces zabraňuje ztrátě souvislého bloku dat. V případě poškození disku, např. nějakého souvislého bloku informací, zpětné přemístění způsobí rozložení poškozených bitů do menších intervalů. Tímto způsobem dochází k ulehčení interpretace dat [6,7]. Dalším vrstvami jsou tzv. c1 a c2 chyby. Jak již bylo řečeno, k uživatelským bytům jsou přidávány bity paritní. Výskyt rozdílu mezi těmito byty znamená chybu. Paritní byty představují součet jedniček ve 14-bitovém slově. Lichý výskyt těchto jedniček tvoří nulu a sudý jedničku [4,6,7]. 3.5.2 Interpretace chyb c1 a c2 Chyby c1 se vyskytují téměř na všech discích. Jedná se o opravy v mechanice a tyto chyby nezpůsobují vážnější problémy. Také zde platí, že čím méně chyb se vyskytne, tím lépe. Rychlost čtení disku se tolik nezpomaluje. Nicméně ani velké počty těchto chyb nemusejí ještě znamenat vážné problémy. Jedná se o rozdíl bytů uživatelských dat a řádkového paritního součtu. V případě, že nedojde k opravě dat v této vrstvě, nastupuje korekce ve vrstvě c2 [6,7]. Chyby c2 ukazují na ohrožení integrity dat. Záleží na tom, kolik bitů je v jednom slově chybně přečteno. Samoopravné algoritmy mohou opravit až 4 chybné bity, ale to jen v případě, že je známo, na které pozici ve slově se 24
vyskytují. V opačném případě se dají opravit pouze dva nesprávně interpretované bity. Pokud je počet chyb vyšší, dochází k ztrátě části informace [6,7]. Některé mechaniky umožňují chyby typu c1 a c2 detekovat a informace o jejich výskytu na optickém disku může být dále softwarově zpracována. Takovéto výstupy se dají použít k určení kvality a životnosti dat zapsaných na optických discích. Jejich interpretace není vysloveně exaktní, protože takováto detekce je ovlivněna několika faktory, jako například čtecí rychlostí mechaniky nebo kvalitou čtecího laseru [6,7]. 3.5.3 Interpretace chyb PIE a PIF Chyby PIE a PIF jsou podobné chybám c1 a c2. Data na DVD jsou uspořádána v sektorech, které jsou kvůli protichybovému zabezpečení rozděleny na 12 řádků po 172 bytech. Ke každému řádku se přidává 10 bytů zabezpečovacího kódu Parity Inner (PI). Šestnáct takto uspořádaných sektorů tvoří ECC blok (Error Correction Code) o 192 řádcích a 182 sloupcích. K řádkům je přidáno 16 řádků kódu Parity Outer (PO), které jsou také zabezpečeny desetibitovým kódem PI [6,7,11]. 182 bytů 172 bytů 10 bytů 208 řádků 192 řádků 16 řádků DATA PO PI PI Obr. 6 ECC blok Data jsou zabezpečena pomocí obou kódů, ale Parity Outer pouze kódem PI. Chyby při čtení se nejprve detekují a opravují pomocí kódu PI (chyby se označují Parity Inner Error, zkratka PIE nebo PI). Pokud je počet poškozených bitů vyšší a chyba se nedá takto opravit, nastupuje stav PIF (Parity Inner Failure, dříve také PO) a oprava pomocí kódu PO [6,7]. 25
4 Životnost optických disků Životnost optických disků je velmi diskutovaným tématem. Jednotlivé názory se značně liší. Zatímco někteří tvrdí, že média vydrží desítky až stovky let, najde se i mnoho nedůvěřivců, kteří říkají, že zmíněná desítka let je maximum a média, která vydrží déle, se vyskytují spíše ojediněle. Společnost Verbatim prováděla několik testů životnosti v klimatizovaných místnostech a došla k závěrům, že životnost optických médií je až 100 let. Také však uvádí, že významnou roli hraje kvalita vypálení (v tomto ohledu se preferují spíše kombinace vypalovačka/médium) a způsob uskladnění [20]. 4.1 Faktory ovlivňující životnost Životnosti disků uváděné výrobci je dosaženo za tzv. ideálních podmínek. Ve skutečnosti existuje mnoho aspektů, kterými se uváděná životnost snižuje, a některá data na disku se mohou stát nečitelná. Nejčastěji dochází k poškození disku v důsledku neopatrné manipulace uživatelem. Při fyzické manipulaci s médiem vznikají škrábance a další vady. Dalším důvodem poškození je nesprávné skladování, například ve vysokých teplotách či na světle, přičemž dochází k poškození záznamové vrstvy. Posledními faktory jsou kvalita (rychlost) vypálení a kvalita samotného prázdného média. 4.1.1 Manipulace s disky Největší riziko nevratného poškození dat tkví v neopatrné manipulaci. Zejména škrábance z horní strany disku způsobují narušení odrazové vrstvy a disk je tak nenávratně poškozen a stává se nečitelným. Mnohdy k prvotnímu poškození odrazové vrstvy dochází již při popisování disku v důsledku použití nevhodného popisovače. Ze spodní strany je riziko nenávratného poškození mnohem nižší. Často obávané otisky prstu diskům výrazně neškodí. Otisky jsou sice zřetelně vidět, ale průchodu světla nebrání a látky, které otisk obsahuje, nejsou natolik agresivní, aby disk poškodily. Poškození vzniká až v důsledku neopatrného čištění [4]. 26
Disky by se neměly polepovat žádnými štítky, protože mění vyvážení disku a způsobují nepravidelnou rotaci a kmitání. Navíc se mohou polepy v mechanice odloupnout a zničit ji [4,20]. 4.1.2 Skladování Výrobci se shodují, že disky by se měly skladovat v temnu, chladu a suchu. Disky čtené laserovým paprskem nejvíce ohrožuje sluneční světlo. Ultrafialové záření je značně agresivní a poškozuje záznamovou vrstvu. Disky by se tedy neměly, především ze spodní strany, tomuto světlu vystavovat. Taktéž vysoké teploty mohou ohrozit stabilitu ochranné a záznamové vrstvy. Teplo způsobuje deformaci disků, které v důsledku způsobí chyby při čtení. Konečně vlhkost spolu s vysokými teplotami může způsobit korozi záznamové vrstvy [20,21]. Nejbezpečnější způsob skladování disku je v plastikové krabičce, kde se disk o nic svou plochou nedotýká. Uchovávání disků je také velice bezpečné v tzv. peněžence, která obsahuje tenká pouzdérka na zastrčení disků. Při vyjímání a zasunování však dochází ke tření a disk je náchylnější k poškrábání. Skladování na spindlu, tedy středové tyčce není vhodné, protože disky nejsou nijak fixovány a při tření dochází ke škrábání z obou stran [4]. 4.1.3 Rychlost vypalování Rychlost vypalování má významný vliv nejen na kvalitu vypálených dat, ale také na životnost mechaniky. Mechanika disponuje určitou životností. Při zvyšování rychlosti vypalování roste i potřebný výkon laseru a tím se životnost snižuje. Ve výsledku sice vypálíme více disků za kratší časový úsek, ale celkový počet vypálených disků bude menší. Taktéž kvalita vypálených dat není při rychlejším vypalování stoprocentní. Při rychlém vypalování dochází ke snížení počtu redundantních dat potřebných pro rekonstrukci případných poškozených částí [21]. 27
5 Další možnosti zálohování dat Existuje mnoho rizik, které způsobují ztrátu dat, od chyb způsobených uživatelem až po selhání systému, externí napadení s úmyslem data poškodit nebo působení fyzikálních a přírodních vlivů. Z těchto důvodů je záloha dat nezbytná především ve firemní sféře, ale neměla by se opomíjet ani u běžných uživatelů. Při ztrátě dat ve firmě se podnik vystavuje nebezpečí pokut za nedodržení archivační povinnosti, nebo zneužití konkurencí apod. Ztráta soukromých dat je také velice citlivá, ale uživatel není vystaven riziku právních sporů. V dnešní době existuje mnoho možností zálohy dat. K zálohování se používají vedle zmiňovaných optických disků, také dodatečné pevné disky nebo je možné využít služeb nabízených prostřednictvím internetu. Volba konkrétního způsobu závisí na mnoha aspektech, jako např. povaha, důležitost, objem dat atd. Nemalou úlohu při rozhodování hrají také požadavky na přístupnost (rychlost obnovy) dat a také jejich bezpečnost. Podle způsobu spouštění se zálohy dají členit na automatické, které se spouští v konkrétních předem stanovených časových okamžicích, dále poloautomatické, které se spustí prostřednictvím ikony na ploše, nebo manuální. Automatické zálohování lze dále rozdělit na průběžné zálohování, kdy systém zálohuje data po každé, když dojde ke změně. Dále trvalou archivaci, při které se pokaždé v pravidelných intervalech zálohují data na nová média, která jsou posléze vhodně archivována. Častým důvodem těchto záloh bývají zákony a předpisy, které ukládají povinnost určitá data uchovávat po stanovenou dobu. Další podskupinou automatického zálohování je zálohování cyklické, u kterého se data v pravidelných intervalech ukládají na několik médií, která se cyklicky střídají. Nevýhodou tohoto způsobu může být ztráta dat předcházejícího cyklu, při nové záloze. Na druhou stranu výhodou této metody je úspora objemu dat např. oproti trvalé archivaci. Objem dat narůstá pouze v závislosti na zvětšení zálohujících dat [13]. K zálohování existuje velké množství jak placených, tak freewarových aplikací. Výběr je skutečně široký a tak si každý může zvolit vhodný software. 28
Záloha dat nepředstavuje jen kopii dat na jiném nosiči nebo místě. Nejedná se tedy pouze o to data někam zkopírovat, ale především mít je k dispozici v případě potřeby. Od konkrétního typu dat se odvíjí volba způsobu archivace a také časový interval, ve kterých k zálohám dochází. Například pro uchování účetní evidence starších období či pro jiné zákonem povinně archivované dokumenty, které není třeba mít bezprostředně po ruce, zvolíme pravděpodobně optická média. Naopak pro zálohu dat, která vyžadují přístup více uživatelů, nebo podléhají častým úpravám, zvolíme síťové disky nebo servery [13]. V následující části jsou popsány výhody a nevýhody výše zmíněných a dalších možností zálohování dat vedle optických disků. Pevný disk Pevný disk slouží jako úložiště všech dat v počítači. Bez pevného disku by počítač nemohl existovat. Vedle tohoto hlavního disku je možné použít další interní či externí pevné disky pro rozšíření kapacity Výhodou je možnost uložení velkého množství dat poměrně spolehlivým a rychlým způsobem za přijatelnou cenu. Pevné disky jsou však náchylné na poškození v důsledku nešetrného zacházení jako pád, náraz apod. Nevýhodou také může být relativně vysoká hmotnost [19]. Flashdisk Tento disk je velmi populární především kvůli své mobilitě. Rychlost zápisu a čtení závisí na konkrétním typu. Díky USB konektoru se je flashdisk univerzální nosič, který se dá navíc pořídit za nízkou cenu. Nevýhodou tohoto nosiče je omezený počet zápisů. Také ztráta dat z flash paměti je jednoduchá. Postačí statická elektřina [19]. NAS (Network Attached Storage) Způsob ukládání dat využívající speciální zálohovací zařízení, která jsou připojená přímo do počítačové sítě. Tato zařízení mají přiřazenou IP adresu a mohou tedy být dostupná klientům skrz jiný server. Tento způsob zálohy dat je využíván především v podnikových sítích a umožňuje přístup mnoha uživatelů. Hlavní výhodou toho způsobu ukládání dat je jeho rozšiřitelnost. V případě potřeby 29
zvýšení kapacity se připojí další NAS zařízení do počítačové sítě. Klientovi se celé NAS zařízení jeví jako jeden fyzický disk. Další výhodou je ochrana dat v případě výpadku serveru [18]. Nevýhodou může být cena těchto zařízení, jelikož se zde nejedná pouze o diskové pole, ale o kompletní řešení, které disponuje vlastním procesorem, pamětí, operačním systémem, atd. Ve srovnání s tradičními souborovými servery je však cena stále nižší [19]. Jelikož jsou tato zařízení připojena přímo do LAN sítě, kde dochází především při backupu k průchodu velkého objemu dat, snižuje se také výkonnost sítě [18]. Online zálohování Další možností je záloha dat na vzdáleném serveru prostřednictvím internetu. Rychlost zálohy a obnovy dat vždy závisí na rychlosti konkrétního připojení počítače. Tuto službu nabízí mnoho poskytovatelů, kteří dokonce nabízejí v rámci lákání nových klientů určitý prostor pro ukládání dat zdarma (až 5 GB, říjen 2009). Aplikace jsou jednoduché na ovládání a výhodou je šifrování dat. Tento typ zálohy mnohdy doprovází nedůvěra, zda data nejsou zneužívána. Pravděpodobnost zneužití je však minimální. Data jsou zašifrována tak, že mnohdy ani poskytovatelé k nim nemají přístup. Navíc zneužití dat na tomto rozšiřujícím trhu s poskytováním online záloh si provozovatelé nemohou dovolit a data chrání spolehlivými bezpečnostními systémy. V budoucnosti bude online záloha běžnou součástí života většiny obyvatelstva [19]. 30
6 Experiment s optickými médii Cílem experimentu bylo porovnat kvalitu několika značek optických disků vystavených různým experimentálním podmínkám na základě pozorování četnosti výskytu chyb na těchto médiích. Princip experimentování spočívá v cílené změně různých hodnot veličin (faktorů) a v následném pozorování změn odpovídající veličiny, tzv. odezvy. Jedná se tedy o systematické plánování a uspořádání zkoušek s ohledem na jejich statistické vyhodnocení [5]. Pro tento experiment jsem zvolila optická média čtyř značek, vždy 30 CD-R disků a DVD-R disků od jedné značky. Jedná se o značky Fujifilm, Memorex, Sony a Verbatim, viz obrázek 7. Tyto značky byly vybrány s ohledem na jejich dostupnost v obou kategoriích zkoumaných optických disků a s ohledem na jejich cenu tak, aby v experimentu bylo zastoupeno více cenových kategorií. Obr. 7 Testovaná CD-R a DVD-R Je třeba zdůraznit, že jednotlivé značky nemusejí být nutně vyrobeny stejným výrobcem. Média mají sice stejný obal, vypadají stejně a lidským okem jsou většinou nerozeznatelná, nicméně výrobce se může lišit a s tím i kvalita vybraných médií. Konkrétní výrobce se dá zjistit podle ATIPu, kódu obsahujícího základní informace o disku, který je uložen v zaváděcí stopě. Kód je možné zjistit 31
pomocí vypalovacího či č testovacího programu. V experimentu tedy neporovnáváme výrobce, ale jednotlivé značky [2]. 6.1 Příprava experimentu Před návrhem experimentu je nutná analýza problému. Je nutné zvolit vhodnou odezvu, pokud možno veličinu měřitelnou, podle níž se bude vyhodnocovat jakost. V tomto případě ě byla odezvou zvolena četnost chyb na disku. Následně ě se identifikují všechny potenciální vlivy, které by mohly působit na danou odezvu. K identifikaci příčin č je možné využít například ř Ishikawův diagram příčin a následků, viz obrázek 8. Obr. 8 Ishikawův diagram Chybovost disků ů ovlivňuje ň mnoho aspektů. ů Testovat všechny potenciální vlivy by bylo značně č ě časově náročné č a v provozních domácích podmínkách nemožné. Proto byly pro experiment vybrány pouze některé možné příčiny č a to světlo ě a UV záření, nízká teplota, škrábance ze spodní strany disku a ohyb. Velice důležitá je také volba rozsahu testovaného souboru tak, aby získaná data měla požadovanou vypovídací schopnost. Čím je rozsah souboru větší, tím více informací máme a minimalizuje se riziko, že nepoznáme existenci vlivu faktoru. Vzhledem k časové náročnosti testování chybovosti disků jsem zvolila počet 6-ti kusů v každé testované skupině. Celkový počet 240 disků byl náhodně 32
rozdělen do 5 skupin, které pak byly vystaveny různým experimentálním podmínkám: 1. Disky poškozované škrábáním. 2. Disky namáhané ohybem. 3. Disky vystavené nízké teplotě. 4. Disky vystavené světlu a UV záření. 5. Disky uchovávané dle doporučení výrobce. Na všechna média byla vypálena stejná data sestavená z různých typů souborů, jako textové soubory, databáze, fotografie, hudba, prezentace. Na DVD byla přidána ještě videa. Data dosahovala celkové velikosti 698 MB u CD-R a 4,3 GB u DVD-R. Rychlost vypalování pro CD-R byla 24x a pro DVD 8x 6. 6.2 Testování optických disků Odezva byla měřena pomocí programu Nero CD-DVD Speed (verze 4.7.7.16). Tento program poskytuje mnoho užitečných informací jak o disku, tak o mechanice. Diagnostikuje např. rychlost, zátěž procesoru v různých rychlostech čtení, čas vyhledání dat na disku apod. Provádí test přeplňování, to znamená, že zjišťuje, o kolik dat více je možné na disk uložit oproti kapacitě udané výrobcem. Pro tento experiment byla využita především část programu zabývající se testy kvality disku. 6.2.1 Výstupy z programu Používané výstupy z programu jsou vyobrazeny na obrázku 8. V horní části obrázku 9 jsou znázorněny chyby c1 u CD-R, respektive chyby PIE u DVD-R (modrá barva). Žlutá křivka ukazuje okamžitou rychlost čtení disku během testu. V dolní části obrázku jsou vyobrazeny chyby c2 (u DVD-R chyby PIF). 6 CD: 1x = 150 KBps, DVD: 1x = 1.35 MBps (1,350KBps). 33
zdroj: výstup z programu Nero CD-DVD Speed Obr. 9 Kvalita disku testovaná programem Nero CD/DVD speed 6.3 Statistické metody vyhodnocení 6.3.1 Analýza rozptylu Při vyhodnocení experimentálních dat se nejčastěji používá analýza rozptylu (ANOVA). Tato metoda vychází z představy, že celková variabilita, se kterou kolísají hodnoty sledované náhodné veličiny kolem její střední hodnoty, pochází z několika zdrojů. Celkovou variabilitu lze tedy rozdělit na složky odpovídající jednotlivým faktorům a na nevysvětlenou (náhodnou) část. Hodnoty zkoumaného faktoru se během experimentu mění, což může způsobit zvýšenou variabilitu měřených hodnot. Porovnáním složky variability odpovídající změnám hodnot faktoru a náhodné složky lze posoudit, které z uvažovaných faktorů mají vliv na úroveň sledované veličiny. Pro účely této práce postačí jednofaktorová analýza rozptylu. Testujeme rovnost středních hodnot u I nezávislých výběrů, tzv. nulovou hypotézu H 0 : µ 1 =... = µ I. Pokud dojde k zamítnutí nulové hypotézy, znamená to, že alespoň jedna střední hodnota se liší od ostatních. Následně se zjišťuje, které konkrétní skupiny se od sebe významně liší. Pro použití analýzy rozptylu by měly být splněny dva základní předpoklady: normalita a shoda rozptylů v různých skupinách. V případě porušení těchto předpokladů je vhodné buď provést transformaci na data blízká normálním nebo 34
zvolit neparametrickou obdobu testu, tj. Kruskalův-Wallisův test v případě jednoho zkoumaného faktoru. Při výběru vhodné transformace je výhodné použít Box-Coxovu transformaci, více [3]. Tato transformace je například součástí procedury General Lineral Model (GLM) statistického paketu Statgraphics, který byl k výpočtům použit. U velkých rozsahů skupin nebývají důsledky porušení normality příliš vážné, jelikož platí centrální limitní věta, která vyjadřuje konvergenci pravděpodobnostních rozdělení k normálnímu rozdělení při dostatečně velkém rozsahu souboru. Takže se často ANOVA používá i v případě ne zcela splněných předpokladů. 6.3.2 Kruskalův-Wallisův test Test předpokládá k nezávislých výběrů o rozsahu n i. Každý výběr pochází z nějakého rozdělení se spojitou distribuční funkcí. Cílem Kruskalova-Wallisova testu je ověřit hypotézu, že všechny výběry pocházejí ze stejného rozdělení. Princip testu spočívá v seřazení hodnot sledované veličiny do rostoucí posloupnosti a určení pořadí všech prvků. Součet pořadí prvků patřící do i -tého výběru ( i = 1,2,..., k ) se označí T i. Ke kontrole, zda jsou jednotlivá Ti vypočtena správně, lze využít vztah T + T +... + Tk = n ( n 1) / 2. Kruskalova-Wallisova statistika je dána vztahem [1] 1 2 + = 12 k Ti Q n ( n + 1) n i= 1 2 i 3 ( n + 1), (1) kde n = n + n +... + n. Tato veličina má při platnosti nulové hypotézy 1 2 k přibližně rozdělení 2 χ s 1 2 k stupni volnosti. V případě Q χ 1 ( α ) zamítáme k hypotézu na hladině významnosti, která je asymptoticky rovna α. Výše uvedený vzorec je platný za předpokladu, že jednotlivé naměřené hodnoty se liší. V případě výskytu stejných hodnot se používá vzorec s opravou na spojitost, obecně ve tvaru 35