Dlouhodobá ochrana digitálních dat: co může vaše instituce udělat již dnes?



Podobné dokumenty
Dlouhodobá ochrana digitálních dokumentů a projekt NDK

Česká digitální knihovna agregace digitálního obsahu českých knihoven

České digitalizační projekty, jejich výsledky a agregace

Open source nástroje pro dlouhodobou ochranu digitálních dat. Mgr. Andrea Fojtu. Odbor digitální ochrany Národní knihovna ČR

Rosetta nástroj pro dlouhodobé uložení digitálních objektů

Digitalizace a digitální knihovny v České republice

Koncepce rozvoje knihoven ČR na léta Priorita 2: Trvalé uchování digitálních dokumentů

Dlouhodobá ochrana digitální dokumentů. Mgr. Jaroslav Kvasnica

Certifikace Národní digitální knihovny podle ISO normy Jan Mottl AiP Safe s.r.o.

Digitalizace knihovních dokumentů. Jiří Polišenský

Využití nástrojů z projektu Česká digitální knihovna při digitalizaci a zpřístupnění digitálních dokumentů

DIGITÁLNÍ UNIVERZITNÍ REPOZITÁŘ. Andrea Fojtů Ústav výpočetní techniky UK v Praze

NDK a LTP naše požadavky a skutečnost. Jan Hutař

Z papíru na web a ke čtenáři aneb Digitalizace není jen skenování. Mgr. Monika Oravová Moravskoslezská vědecká knihovna v Ostravě

Zpráva ze služební cesty

ProArc. open source řešení pro produkci a archivaci digitálních dokumentů. Martina NEZBEDOVÁ Knihovna AV ČR, v. v. i., Praha nezbedova@knav.

Lenka Maixnerová, Filip Kříž, Ondřej Horsák, Helena Bouzková

Karel Škrle, ICZ a. s DOKUMENT Certifikace důvěryhodných úložišť

Projekt CDArcha: kooperativní zpracování datových CD disků. Zdeněk Hruška, Petr Žabička Moravská zemská knihovna v Brně AKM 2018

Národní digitální knihovna

Digitální archiv: standardy, koncepce, postupy

Lenka Maixnerová, Filip Kříž, Ondřej Horsák, Helena Bouzková

DŮVĚRYHODNÁ ELEKTRONICKÁ SPISOVNA

RD.CZ EVIDENCE DIGITALIZOVANÝCH DOKUMENTŮ A SLEDOVÁNÍ PROCESU ZPRACOVÁNÍ

Řešení pro střednědobé a dlouhodobé ukládání dokumentů ve veřejné správě

Projekt Digitalizace a ukládání ve Zlínském kraji zkušenosti, postřehy

Návrh opatření pro prodloužení životnosti obsahu CD a DVD disků ve sbírkách NK

Archivace digitálních dokumentů. Elektronická spisovna

NOVÉ MOŽNOSTI PŘÍSTUPU K DIGITÁLNÍ ARCHIV NLK PLNOTEXTOVÝM INFORMACÍM : Filip Kříž, Lenka Maixnerová, Ondřej Horsák, Helena Bouzková

Digitalizace a zveřejnění sbírkových fondů paměťových institucí Zlínského kraje

ICZ DESA střednědobé a dlouhodobé ukládání dokumentů

Odevzdávání a příjem e-publikací

Dlouhodobé a důvěryhodné uchovávání elektronických dokumentů

Lenka Maixnerová, Filip Kříž, Helena Bouzková, Ondřej Horsák, Adéla Jarolímková, Eva Lesenková

Digitalizace, popis pomocí metadat a jejich formáty. Digitization, metadata description and metadata formats

Koncepce Národní digitální knihovny a dlouhodobé ochrany digitálních dokumentů

Zpráva ze zahraniční služební cesty

Linked Heritage. Koordinace standardů a technologií za účelem obohacení Europeany. Alena Součková

Velká data v knihovnách Open source tools and their use in Czech libraries

Národní digitální knihovna

Editor umožní tvorbu a editaci metadat digitálních objektů, včetně importů a exportů a práci s primárními daty.

Kramerius - zpřístupnění digitálních kopií v ČR

Portál ebadatelna Zlínského kraje a zpřístupnění map. Prezentace historických map z fondu paměťových institucí Zlínského kraje

Systémy pro tvorbu digitálních knihoven

Řešení oblasti LTP v projektu NDK aneb zúročení 20 let zkušeností


Národní digitální archiv a egovernment

Silný portál. Jindřiška Pospíšilová. Pracovní skupina pro silný portál. Národní knihovna ČR

Zpřístupnění kulturního dědictví v digitální podobě v ČR prostřednictvím knihoven

DIGITALIZOVANÉ FONDY VĚDECKÉ KNIHOVNY V OLOMOUCI A KDE JE HLEDAT. Miloš Korhoň, Jan Houserek

Tzv. životní cyklus dokumentů u původce (Tematický blok č. 4) 1. Správa podnikového obsahu 2. Spisová služba

Nové směry v dlouhodobém uchovávání digitálních dokumentů v mezinárodním kontextu

NÁRODNÍ DIGITÁLNÍ ARCHIV

Sluţba Karlovarského kraje pro ukládání dokumentů a dat na území kraje

ProArc open source řešení pro produkci a archivaci digitálních dokumentů

Autorský zákon a knihovny - možnosti pro budoucnost. Vít Richter vit.richter@nkp.cz Praha, UISK, FFUK

The bridge to knowledge 28/05/09

Koncepce řešení dlouhodobého ukládání dokumentů v souvislosti s budováním Technologických center krajů

Formáty a dlouhodobé uložení: Identifikace, extrakce a validace

Projekt NAKI e-deposit

Evropská digitální knihovna. < Prezentace k eseji pro předmět PV070 Digitální knihovny. Tomáš Drusa

Ředitel odboru archivní správy a spisové služby PhDr. Jiří ÚLOVEC v. r.

Národní digitální knihovna v cílové rovince

Projekt HISPRA aneb Jak využít digitalizaci MKP v dalších knihovnách. 12. Května 2011, Jelení Hora

DATA ULOŽENÁ NA VĚČNÉ ČASY. (ICZ DESA / Microsoft Azure) Mikulov Michal Matoušek (ICZ) / Václav Koudele (Microsoft)

NÁRODNÍ KONCEPCE DLOUHODOBÉ OCHRANY DIGITÁLNÍCH DAT V KNIHOVNÁCH

ZPŘÍSTUPNĚNÍ A ARCHIVACE PLNÝCH

Projekt digitalizace a ukládání v regionech. Petr Pavlinec, KrÚ kraje Vysočina Březen 2010

Digitální konkordance a Registr digitalizace v Manuscriptoriu,

Národní digitální archiv

Nové nástroje pro staré mapy

Od zpřístupnění rukopisů přes komerční archivy k LTP, aneb 20 let praxe s dlouhodobým uložením dat.

Koncepce rozvoje Na rodnı knihovny C eske republiky jako vy zkumne organizace na le ta

Strategie budování sbírky Webarchiv u

Příprava legislativy povinného výtisku elektronických publikací v České republice (e-depozit)

Implementace formátu METS v Systému Kramerius

Koncepce rozvoje Národní knihovny České republiky jako výzkumné organizace na léta

Stav implementace perzistentních identifikátorů v NK ČR a výhled do budoucna. Jan Hutař Marek Melichar Ladislav Cubr

#Cesko2016. Česko : Jak jsme na tom?

Technologie digitálních knihoven

KRAJSKÉ DIGITÁLNÍ ÚLOŽIŠTĚ

Každý písemný, obrazový, zvukový, elektronický nebo jiný záznam, ať již v podobě analogové či digitální, který vznikl z činnosti původce.

Elektronický archiv jako nadstavba DMS

Šedá literatura case study v ČR

Digitalizace. Co je to digitalizace Proč digitalizovat a přínosy digitalizace Popis procesu digitalizace Příklady digitalizačních projektů

Ukládání dokumentů v návaznosti na datové schránky

Osiřelá díla a díla nedostupná na trhu a novela autorského zákona

Digitalizace v ČR a její podchycení v registru digitalizace. Helena Dvořáková Národní knihovna ČR

Seminář pro vedoucí knihoven a SVI ústavů AV ČR. Aleph

RD.CZ : EVIDENCE DIGITALIZOVANÝCH DOKUMENTŮ A SLEDOVÁNÍ PROCESU ZPRACOVÁNÍ

Technologická centra krajů Digitalizace a ukládání

Datové centrum a Regionální SAN kraje Vysočina. Projekt digitalizace a. Petr Pavlinec, KrÚ kraje Vysočina. Září 2009

Budování virtuální depozitní knihovny. Tomáš Foltýn

Perspektivy důvěryhodného digitálního úložiště v rámci Národní digitální knihovny

Národní digitální knihovna a digitalizace v muzeích a galeriích

ELEKTRONIZACE Z POHLEDU ŘEŠENÍ NEDOSTATKU FINANČNÍCH PROSTŘEDKŮ VE ZDRAVOTNICTVÍ. MUDr. Marek Zeman, MBA ředitel FN Královské Vinohrady

Dlouhodobé uchování a zpřístupnění digitálních dokumentů v Evropě: výsledky dotazníkového průzkumu

Digitalizace pražské židovské literatury v Městské knihovně v Praze

Národní digitální archiv

Data management plan (DMP)

Transkript:

Dlouhodobá ochrana digitálních dat: co může vaše instituce udělat již dnes? Mgr. Jan Hutař Odbor digitální ochrany NK ČR AKM 2.12.2010

Témata co řeší dlouhodobá ochrana digitálních dat a nač ji potřebujeme? v čem dlouhodobá ochrana digitálních dat spočívá? na co se soustředit? volně dostupné nástroje pro dlouhodobou ochranu dlouhodobá ochrana digitálních dat a projekt NDK VISK7 a nové postupy tvorby metadat a dat přehled dostupných nástrojů AKM 2.12.2010 2

UNESCO o digitálních datech Listina o ochraně digitálního dědictví, 15. říjen 2003 článek 1: Digitální dědictví sestává z unikátních zdrojů lidského vědění. Mnohé z těchto zdrojů mají trvalou hodnotu a podstatu, čímž tvoří odkaz, který musí být opatrován a ochráněn pro současné i budoucí generace. AKM 2.12.2010 3

Co řeší dlouhodobá ochrana digitálních dat? ochranu dat? ochranu vložených financí? ochranu vědění? ochranu děl lidského umu? dostupnost, použitelnost, srozumitelnost v budoucnu jak dlouhá je budoucnost? dokud budou mít uchovávané digitální objekty význam pro uživatele 5 let nebo déle x časový úsek, ve kterém dojde k podstatné změně technologií (podpora medií a formátů) Pokud mluvíme o ochraně digitálních zdrojů, termín dlouhodobá neznamená garantované uchování na 5 nebo 50 let, jako spíše odpovědný vývoj strategií, které se dokáží vyrovnat s neustálými změnami, které přináší informační trh. Ute Schwens / Hans Liegmann (DNB/nestor) AKM 2.12.2010 4

Co má dlouhodobá ochrana dat zajistit? základní ochrana dat nyní i v budoucnu (ochrana bit streamu) ochrana použitelnosti dat v budoucnu (ochrana logická) logická ochrana = procesy zajišťující, aby digitální objekty zůstaly v budoucnosti: vyhledatelné, přístupné (zobrazitelné), využitelné znovu a znovu a pochopitelné (obsah a smysl) autentické OAIS (ISO 14721:2003 Open Archival Information System) s jednotlivými digitálními objekty musí být uchován nejen informační obsah uchovávaných objektů, ale také další informace o původu a historii změn dokumentu, o jeho kontextu a zdrojích potřebných k porozumění AKM 2.12.2010 5

V čem ochrana spočívá? digitalizace vytváříme to co chceme? jsou formáty standardní máme kompletní dokument? máme kompletní metadata? máme kontrolní součty? přesuny dat kontrolní součty, kompletnost, plán uložení kontrola HW, kontrola integrity, přehled co kde je (data a metadata), přehled o změnách, práva přístupu, opatření dlouhodobé ochrany opravy dat a metadat kdo, co, kdy, proč a s jakým výsledkem; úpravy metadat zpřístupnění autenticita, použitelnost, vyhledávání AKM 2.12.2010 6

Digitalizace co promyslet? strategická příprava standardy + jasná strategie projektu/instituce víme opravdu co a proč budeme skenovat? kvalita předlohy, existence metadat víme jak to budeme uchovávat a zpřístupňovat? kolik to bude stát? máme kapacity na uložení dat? zkušenosti a lidi pro manipulaci s daty? NEZAČÍNAT bez plánu - MÁME NA TO (TEĎ) PENÍZE raději naopak dělat kontroly integrity (kontrolní součty) validace metadat formáty, kompletnost co hrozí? zdržení, hromadění nehotových dat, ztráty dat, vícepráce/náklady AKM 2.12.2010 7

Jak pomohou metadata? většina metadat vzniká během digitalizace x bezprostředně po ní mohou uchovat vše důležité pro budoucnost pokud to podstatné do nich dáme metadata popisná (MARC, MODS, DC, EAD) popis intelektuální entity ideálně použít bibl. záznam z katalogu (konzistence katalog a dig. knihovna) obohacení popis vnitřních částí nejsou v katalogu apod. administrativní metadata (PREMIS, MIX, METS) technická m. údaje o formátech, validacích, skeneru, SW, identifikátory metadata práv údaje o copyrightu, licencích aj. metadata o provenienci vztahy mezi objekty, události, agenti strukturální metadata (METS) logická a fyzická struktura dokumentu volné nástroje PRONOM, JHOVE aj. AKM 2.12.2010 8

Přesuny dat a metadat do repozitáře; do aplikace zpřístupnění; na nový HW jakýkoliv přesun je riskantní rizika přesunů ztráty existujících vazeb, narušení zaběhaných procesů, časově náročný proces, ztráta integrity nutno provádět kontroly integrity a kompletnosti dat antivirová kontrola validace struktury balíku dat a metadat identifikace/ validace formátů před a po AKM 2.12.2010 9

Metadata a data v repozitáři monitorování základních vlastností a metadat vkládaného materiálu > hodnocení risků obohacení metadat doplnění metadat dokumentujících životní cyklus v archivu (použití, exporty, ochranné operace, atd.) neustálá kontrola integrity dat preservation planning jednoduché vyhledávání, filtrování víme co kde je konzistence metadat mezi archivem, zpřístupněním a katalogem? ano x ne AKM 2.12.2010 10

S čím můžete začít již dnes? za všech okolností následovat aktuální standardy mít strategii ochrany digitálních dokumentů pro vaši instituci dokumentace procesů mít spolehlivý systém na správu repozitáře a dat provádět kontroly při jakémkoliv přenosu dat i metadat využívat volně dostupné nástroje lze využívat okamžitě zvláště pokud máte velké objemy dat, často s nimi manipulujete výrazně zlepší vyhlídky do budoucna není třeba čekat na nějaké řešení shůry připravit se již během digitalizace (metadata) AKM 2.12.2010 11

Strategie ochrany aneb víme co děláme obecná strategie institucionální > strategie ochrany dlouhodobá > střednědobá > projektová co chceme ochraňovat? a proč? všechno stejně? máme kapacity? personál? znalosti? víme kolik bude stát uložení? dlouhodobé uložení? spolupráce/koordinace = sdílení financí > sdílení technologií > sdílení znalostí sdílení NENÍ využívání a spoléhání se na druhého AKM 2.12.2010 12

Volně dostupné nástroje identifikace, validace a charakterizace formátů - PRONOM, UDFR metadata extraktory - JHOVE, NZME aj. nástroje na vytváření metadat, migrace, validace metadat open source SW na repozitáře správa dat a metadat, událostí, práv (přístup i copyright) aj. vyhledávání + hromadné operace s daty/metadaty zajištění integrity preservation planning ano x ne preservation planning PLATO nebo PLANETS testbed AKM 2.12.2010 13

Externí služby využití externích služeb je klíčovou vlastností SW repozitáře z nich čerpají podstatné informace např. o formátech dokumentů (identifikace, charakterizace) validují je oproti těmto službám získávají z nich informace o doporučovaných možnostech migrací i stavu zastarání formátů registry formátů - PRONOM (DROID), UDFR extraktory/validároty Jhove2, New Zealand Metadata Extractor a open source i komerční SW repozitáře s nimi musí pracovat AKM 2.12.2010 14

Registry formátů use case Identifikace mám digitální objekt, co je to za formát? Validace mám objekt, který říká, že je to formát F je to opravdu ono? Transformace mám objekt ve formátu F, ale potřebuji formát G - jak ho mohu vytvořit? Charakterizace mám objekt ve formátu F, jaké má vlastnosti? Odhad risků mám objekt ve formátu F, je s ním spojen risk? např. zastarávání? Zobrazení mám objekt ve formátu F, jak a čím ho mohu zobrazit? (Abrams, Seaman: Towards a global digital format registry. IFLA 2003) AKM 2.12.2010 15

Dlouhodobá ochrana digitálních dat a projekt NDK jeden ze tří hlavních cílů projektu ochrana pro stávající data, nová zdigitalizovaná i digital born návrh nových procesů a standardů digitalizace východisko pro VISK7, krajské digitalizace pořízení SW na kompletní workflow digitalizace pořízení komerčního LTP systému (Rosetta x SDB) strategie ochrany velké objemy dat z digitalizace nelze uchovávat ve file systému trend ve světě (NZ, Austrálie, Německo, Holandsko, Finsko, Norsko, Polsko, Maďarsko) důvod ochrana dat, investic AKM 2.12.2010 16

VISK7 a plánované změny nové standardy dat i metadat návaznost na NDK využití standardů běžných v okolních zemích VISK7 v roce 2011 = 2 možnosti tvorby dat 1. stávající formáty dat i metadat (DTD monografie a periodika) 2. nové formáty dat (JPEG2000 a ALTO XML) VISK7 v roce 2012 stávající postup? nové metadatové formáty dle NDK (METS, PREMIS, MIX, MODS) nové formáty dat JPEG2000, ALTO XML nová struktura balíků co je smyslem změn? interoperabilita, flexibilita, komunitní podpora namísto vlastního vývoje AKM 2.12.2010 17

Dlouhodobá ochrana digitálních dat ve světě řešena převážně v knihovnách a archivech Nový Zéland (NK a NA) Německo (NK) Velká Británie (NK, NA a další knihovny a nadace) Nizozemí (NK a NA) USA (NK, NA, univerzitní knihovny, nadace aj.) přidávají se ostatní evropské a světové knihovny (Finsko, Norsko, Singapur, Austrálie, Francie, Estonsko, Polsko, SK, Maďarsko atd. atd) probíhající tendry projektová podpora EU DigitalPreservationEurope CASPAR PLANETS SHAMAN KEEP aj. AKM 2.12.2010 18

Dostupné produkty komerční Safety Deposit Box (fa Tessella UK) Rosetta (fa ExLibris, Izrael) DIAS (fa IBM) systém nemá další vývoj v oblasti knihoven open source Fedora a její nadstavby XENA (NA Austrálie) http://xena.sourceforge.net/ RODA (Portugalsko, Uni of Minho) http://tinyurl.com/3ynyzs6 CRIB (Portugalsko, předchůdce RODA) ARCHIVEMATICA http://archivematica.org/ (Unesco + Kanada); tool pack MOPSEUS založeno na Fedoře, Řecko HOPPLA vývoj TUW Vídeň, pro malé instituce nebo domácnosti eprints Univerzita Southampton nástroje na preservation planning PLANETS testbed, PLATO aj. AKM 2.12.2010 19

Děkuji za pozornost Otázky? jan.hutar@nkp.cz www.ndk.cz AKM 2.12.2010 20