Dlouhodobá ochrana digitálních dokumentů a projekt NDK



Podobné dokumenty
Dlouhodobá ochrana digitálních dat: co může vaše instituce udělat již dnes?

Open source nástroje pro dlouhodobou ochranu digitálních dat. Mgr. Andrea Fojtu. Odbor digitální ochrany Národní knihovna ČR

Certifikace Národní digitální knihovny podle ISO normy Jan Mottl AiP Safe s.r.o.

NDK a LTP naše požadavky a skutečnost. Jan Hutař

Digitalizace a digitální knihovny v České republice

České digitalizační projekty, jejich výsledky a agregace

Koncepce rozvoje knihoven ČR na léta Priorita 2: Trvalé uchování digitálních dokumentů

Dlouhodobé a důvěryhodné uchovávání elektronických dokumentů

Využití nástrojů z projektu Česká digitální knihovna při digitalizaci a zpřístupnění digitálních dokumentů

Česká digitální knihovna agregace digitálního obsahu českých knihoven

Rosetta nástroj pro dlouhodobé uložení digitálních objektů

Systémy pro tvorbu digitálních knihoven

Karel Škrle, ICZ a. s DOKUMENT Certifikace důvěryhodných úložišť

Dlouhodobá ochrana digitální dokumentů. Mgr. Jaroslav Kvasnica

NÁRODNÍ DIGITÁLNÍ ARCHIV

Řešení oblasti LTP v projektu NDK aneb zúročení 20 let zkušeností

Digitalizace knihovních dokumentů. Jiří Polišenský

Národní digitální knihovna

Digitalizace, popis pomocí metadat a jejich formáty. Digitization, metadata description and metadata formats

Koncepce Národní digitální knihovny a dlouhodobé ochrany digitálních dokumentů

O Národní digitální knihovně. Jan Mottl AiP Safe s.r.o.

Lenka Maixnerová, Filip Kříž, Ondřej Horsák, Helena Bouzková

Elektronický archiv jako nadstavba DMS

Řešení pro střednědobé a dlouhodobé ukládání dokumentů ve veřejné správě

Národní digitální archiv

Koncepce řešení dlouhodobého ukládání dokumentů v souvislosti s budováním Technologických center krajů

Národní digitální archiv a egovernment

Lenka Maixnerová, Filip Kříž, Ondřej Horsák, Helena Bouzková

Projekt ArcLib budování systému pro dlouhodobou archivaci digitálních dat v českých knihovnách

Tzv. životní cyklus dokumentů u původce (Tematický blok č. 4) 1. Správa podnikového obsahu 2. Spisová služba

PLATTER - Průvodce plánováním důvěryhodného digitálního repozitáře. Jan Hutař

NÁRODNÍ KONCEPCE DLOUHODOBÉ OCHRANY DIGITÁLNÍCH DAT V KNIHOVNÁCH

Národní digitální knihovna a digitalizace v muzeích a galeriích

Dlouhodobé uchování a zpřístupnění digitálních dokumentů v Evropě: výsledky dotazníkového průzkumu

DŮVĚRYHODNÁ ELEKTRONICKÁ SPISOVNA

Od zpřístupnění rukopisů přes komerční archivy k LTP, aneb 20 let praxe s dlouhodobým uložením dat.

Odevzdávání a příjem e-publikací

Digitální archiv: standardy, koncepce, postupy

Národní digitální archiv po roce zkušebního provozu

Zpráva ze zahraniční služební cesty

Sluţba Karlovarského kraje pro ukládání dokumentů a dat na území kraje

Koncepce rozvoje Na rodnı knihovny C eske republiky jako vy zkumne organizace na le ta

Nové směry v dlouhodobém uchovávání digitálních dokumentů v mezinárodním kontextu

DIGITÁLNÍ UNIVERZITNÍ REPOZITÁŘ. Andrea Fojtů Ústav výpočetní techniky UK v Praze

Archivace digitálních dokumentů. Elektronická spisovna

Národní digitální knihovna v cílové rovince

ProArc. open source řešení pro produkci a archivaci digitálních dokumentů. Martina NEZBEDOVÁ Knihovna AV ČR, v. v. i., Praha nezbedova@knav.


Projekt digitalizace a ukládání v regionech. Petr Pavlinec, KrÚ kraje Vysočina Březen 2010

Národní digitální knihovna

Zpřístupnění kulturního dědictví v digitální podobě v ČR prostřednictvím knihoven

Projekt CDArcha: kooperativní zpracování datových CD disků. Zdeněk Hruška, Petr Žabička Moravská zemská knihovna v Brně AKM 2018

Velká data v knihovnách Open source tools and their use in Czech libraries

Jak dál a jak lépe? Budoucnost softwarových řešení digitalizace a dlouhodobého uložení v kontextu zkušeností z projektu NDK.

Možnosti využití metodiky konsorcia NESTOR k certifikaci důvěryhodných digitálních archivů v paměťových institucích

Projekt Digitalizace a ukládání ve Zlínském kraji zkušenosti, postřehy

Projekt Digitální knihovna pro šedou literaturu po prvním roce řešení

Národní digitální archiv

NOVÉ MOŽNOSTI PŘÍSTUPU K DIGITÁLNÍ ARCHIV NLK PLNOTEXTOVÝM INFORMACÍM : Filip Kříž, Lenka Maixnerová, Ondřej Horsák, Helena Bouzková

Implementace formátu METS v Systému Kramerius

Lenka Maixnerová, Filip Kříž, Helena Bouzková, Ondřej Horsák, Adéla Jarolímková, Eva Lesenková

Kramerius - zpřístupnění digitálních kopií v ČR

Každý písemný, obrazový, zvukový, elektronický nebo jiný záznam, ať již v podobě analogové či digitální, který vznikl z činnosti původce.

ICZ DESA střednědobé a dlouhodobé ukládání dokumentů

Seznámení s přípravou platformy pro zajištění služeb dodávaní dokumentů včetně MVS: ZÍSKEJ - I

DIGITALIZOVANÉ FONDY VĚDECKÉ KNIHOVNY V OLOMOUCI A KDE JE HLEDAT. Miloš Korhoň, Jan Houserek

DIGITÁLNÍ KURÁTORSTVÍ ESEJ DO PŘEDMĚTU PV070 DIGITÁLNÍ KNIHOVNY

Zpráva ze služební cesty

DATOVÁ ÚLOŽIŠTĚ CESNET

Z papíru na web a ke čtenáři aneb Digitalizace není jen skenování. Mgr. Monika Oravová Moravskoslezská vědecká knihovna v Ostravě

Lenka Maixnerová, Filip Kříž, Ondřej Horsák, Helena Bouzková

KRAJSKÉ DIGITÁLNÍ ÚLOŽIŠTĚ

Technologická centra krajů Digitalizace a ukládání

Technologie digitálních knihoven

INFORUM 2012: 18. konference o profesionálních informačních zdrojích

Stav implementace perzistentních identifikátorů v NK ČR a výhled do budoucna. Jan Hutař Marek Melichar Ladislav Cubr

DATOVÁ ÚLOŽIŠTĚ. David Antoš CESNET

Datová úložiště CESNET

Projekt NAKI e-deposit

Bohdana Stoklasová. Národní knihovna ČR

KONCEPCE TRVALÉHO UCHOVÁNÍ KNIHOVNÍCH DOKUMENTŮ STÁLE JEN NA PAPÍŘE

Návrh opatření pro prodloužení životnosti obsahu CD a DVD disků ve sbírkách NK

Digitální knihovny možnosti využití DSpace a EPrints. Daniela Tkačíková Ústřední knihovna VŠB-TU Ostrava

RDF DSPS ROZVOJ PORTÁLU

Práce s datovými úložišti (egon)

Dlouhodobá archivace digitálních dat od teoretických úvah k praktické realizaci?

Archivematica open source systém pro digitální archivaci

Úvod do problematiky dlouhodobé ochrany digitálních dokumentů - díl 4.

Datová úložiště CESNET. David Antoš

Digitalizace a zveřejnění sbírkových fondů paměťových institucí Zlínského kraje

ANL+ a AMGK+ aneb malé indexy v obrazech. Martin Vojnar

The bridge to knowledge 28/05/09

Výzva k podání nabídky na uzavření smlouvy o dílo a licenční smlouvy na Zpracování studie proveditelnosti Digitálního archivu Univerzity Karlovy

Datové centrum a Regionální SAN kraje Vysočina. Projekt digitalizace a. Petr Pavlinec, KrÚ kraje Vysočina. Září 2009

Okruhy ke SZZK nmgr. studium knihovnické zaměření

Zpráva o plnění cílů projektu VISK3. WebArchiv - vytvoření podmínek pro zpřístupnění českých webových zdrojů

Evropská digitální knihovna. < Prezentace k eseji pro předmět PV070 Digitální knihovny. Tomáš Drusa

Centrální portál knihoven a knihovní systémy. Petr Žabička, Moravská zemská knihovna v Brně

ARCHIVY ZDRAVOTNICKÉ DOKUMENTACE NEMOCNIC A TECHNOLOGICKÁ CENTRA KRAJŮ

RD.CZ EVIDENCE DIGITALIZOVANÝCH DOKUMENTŮ A SLEDOVÁNÍ PROCESU ZPRACOVÁNÍ

Transkript:

www.ndk.cz Dlouhodobá ochrana digitálních dokumentů a projekt NDK Jan Hutař Andrea Fojtů Marek Melichar Knihovny současnosti 14.9.2011 České Budějovice

Obsah prezentace problematika dlouhodobé ochrany digitálních dat (DD) LTP v NK a v projektu NDK nové standardy metadat 2

Dlouhodobá ochrana DD základní ochrana dat nyní i v budoucnu (ochrana bit-streamu) ochrana použitelnosti dat v budoucnu (ochrana logická) logická ochrana = procesy zajišťující, aby digitální objekty zůstaly v budoucnosti: vyhledatelné přístupné (zobrazitelné) využitelné znovu a znovu pochopitelné (obsah a smysl) autentické 3

Dlouhodobá ochrana DD archivní dokument není navždy neměnná entita uložená v archivu cílem dlouhodobé ochrany není jen zachování bitů ale HLAVNĚ zajištění použitelnosti digit. dokumentů to žádná sebelepší záloha nezařídí to je podstata dlouhodobé ochrany digit. dat záloha není dlouhodobá ochrana zachování bit-streamu je pouze nutný předpoklad pro uchování obsahu a použitelnosti dokumentů v budoucnu 4

Dlouhodobá ochrana DD tj. dokumenty v archivu (LTP) musí být stále živé reagovat na změny technologií, komunity, způsobů zpřístupnění doplňování metadat, reprezentací dokumentů migrace změny logické struktury zápis o všem do metadat je potřeba mít digitální repozitář se SW aplikací - s moduly a funkcionalitou odpovídající OAIS LTP systém produkovat odpovídající metadata 5

6 OAIS OAIS (ISO 14721:2003 Open Archival Information System) s jednotlivými digitálními objekty musí být uchován nejen informační obsah uchovávaných objektů, ale také další informace o původu a historii změn dokumentu, o jeho kontextu a zdrojích potřebných k porozumění

Situace ve světě výraz digital preservation již v 90.tých letech 20. století spíše ochrana fyzických předloh pomocí digitalizace na přelomu 2000 posun ochrana samotných dig. objektů první aktivity v Austrálii (PADI projekt a web), USA, NL, UK reálná snaha o vytvoření LTP systému od 2002 NK Nizozemí spolupráce s IBM, systém e-depot Německá NK využití LTP systému DIAS (IBM) od 2006 NK Nového Zélandu systém KRONOS > Rosetta (ExLibris) 2008 dosud - velký rozvoj open source nástroje/služby, komerční LTP systémy, nově i open source LTP systémy 7

Situace ve světě - projekty národní projekty NDIIPP (USA) od 2000, PADI (Austrálie), NESTOR (Německo) organizace - DCC, DPC, JISC aj. konference Archiving, ipres zájem EU na řešení logické dlouhodobé ochrany DD projekty FP5 (2003) Erpanet; FP6 (2006) - Planets, DPE, Caspar, Keep, Shaman, Scape aj. LTP systém dnes řeší většina vyspělých knihoven a archivů světa (UK, DE, USA, NL, FIN, NOR, AUS, FR, PL, HU, SK, EST aj.) 8

Poučení [pro NK/NDK] NK ČR od roku 2006 součástí DP komunity komunita získala spoustu zkušeností > na nich je třeba stavět vývoj okolo LTP spěje k vytváření politik, nástrojů, znalostí jedinou cestou k úspěchu na poli LTP je znalosti, služby a nástroje sdílet! poučení z vývoje 1. generace LTP (NK NL) základním požadavkem na LTP je otevřenost systému (integrace externích nástrojů a služeb) flexibilita datového modelu a nastavení workflow veřejná dokumentace funkčnost, specifikace metadat 9

Současná situace v NK konečně stabilizovaná ochrana bit-streamu archiv dat na filesystému HSM + několikeré zálohy (2x páska na 2 lokacích) žádný systém pro správu dat/metadat archivní balíček = data + metadata (DTD, MASTER+, nověji i technická a administrativní) dokumenty jsou od okamžiku uložení zamrzlé na úložišti v případě úpravy metadat nebo struktury dat > úprava jen v aplikaci zpřístupnění 10

Současná situace v NK 2. logická dlouhodobá ochrana DD jako taková v NK neexistuje nemáme systém pro správu dokumentů, tj. ani pro dlouhodobou ochranu minimální možnosti správy obsahu, analýzy obsahu úložiště, kontroly integrity žádné filtrování, hledání apod. snaha o implementaci procesů ochrany do NK metadata, kontrolní součty, DP strategie, PID, využívání externích služeb > NDK 11

LTP v NDK dlouhodobá ochrana dig. dokumentů (logická i bitstreamu) je jeden ze tří základních cílů NDK NK a MZK by měly získat odpovídající řešení pro správu archivních dig. dokumentů a jejich logickou dlouhodobou ochranu řešení musí odpovídat světovým trendům a standardům 12

Nároky na LTP systém NDK musí odpovídat referenčnímu rámci OAIS schopen uložit jakákoliv data (archivní, nová; externí) uložení a práce s desítkami milionů digitálních objektů funkční a někde běžící systém (knihovna, archiv) s podobným objemem dat okamžitě dostupný komerční systém, žádný vývoj ani bastlení z různých částí jiných systémů musí jít o LTP systém ne jiný typ systému (CMS) aktivita producenta systému na poli dlouhodobé ochrany 13

Nároky na LTP systém NDK 2. systém s relevantní roadmapou systém s relevantní uživatelskou komunitou (v oblasti LTP), která určuje jeho další rozvoj modularita škálovatelnost dle objemů i typů dat systém musí využívat standardy, postupy a služby běžně využívané v oblasti LTP i služby budoucí; v různých modulech rule-based workflow nastavení procesů (vstup, správa, zpřístupnění) 14

Co máme za sebou 2 kola RFI (2008-2009) návštěvy knihoven s nasazeným LTP systémem (2009-2010) studii proveditelnosti (leden 2010) testování komerčních systémů Rosetta 2.1 a SDB 4 (2010) k dispozici dokumentace, školení správce i technika (SDK) vytvořeny základní ingest aplikace pro testovací data (PSP-SIP) cíl vidět zblízka funkcionalitu, zjistit zda jsme v NK schopni takový systém provozovat zadávací dokumentace na LTP systém (únor 2011) funkční a nefunkční požadavky 15

Testování LTP systémů odpovídají OAIS všechny moduly včetně Preservation planning oba v max. míře využívají open source nástrojů a služeb oba systémy umožňují efektivní práci s daty/metadaty v archivu doplňování metadat (ingest, archiv; po celý životní cyklus) doplňování nových reprezentací digitálních dokumentů nastavitelné reporty logické přeskupování dokumentů nebo jejich struktury automatické rozeznání formátů a jejich migrace případná identifikaci formátových rizik plánování ochrany (monitorování >risk>hodnocení risků>test set>testy>vyhodnocení>ostrá migrace) atd. atd. 16

Nové standardy metadata pro digitalizaci (i archivaci) v NDK METS (úroveň čísla a svazku) MODS, DC PREMIS Object, Event, Agent MIX ALTO XML strukturální metadata METS metadata z nové digitalizace, archivu, externích zdrojů (Google, e-pv aj.) transformační modul digitalizace historických dokumentů zůstane netknutá je mimo projekt NDK ovlivní i jiné projekty VISK7, ANL+ 17

NDK (LTP) a jeho přínos systém na správu obsahu úložiště pro NK nutnost předpoklad řešení logické ochrany DD změna pohledu na ochranu digitálních dokumentů v knihovní (nejen) komunitě v ČR standardní metadata dopad na celou NK nový vítr pro NK ovlivní většinu úseků změna stylu práce (nutno vše dokumentovat, vytváření strategických dokumentů) 18

Dostupné systémy / služby komerční Safety Deposit Box (fa Tessella UK) Rosetta (fa ExLibris, Izrael) open source Fedora a její nadstavby XENA (NA Austrálie) http://xena.sourceforge.net/ RODA (Portugalsko, Uni of Minho) http://tinyurl.com/3ynyzs6 CRIB (Portugalsko, předchůdce RODA) ARCHIVEMATICA http://archivematica.org/ (Unesco + Kanada); tool pack MOPSEUS založeno na Fedoře, Řecko HOPPLA vývoj TUW Vídeň, pro malé instituce nebo domácnosti eprints Univerzita Southampton nástroje na preservation planning PLANETS testbed, PLATO aj. 19

20 Statisíce knih a periodik online! jan.hutar@nkp.cz