Dlouhodobá ochrana digitální dokumentů. Mgr. Jaroslav Kvasnica

Podobné dokumenty
Dlouhodobá ochrana digitálních dat: co může vaše instituce udělat již dnes?

Z papíru na web a ke čtenáři aneb Digitalizace není jen skenování. Mgr. Monika Oravová Moravskoslezská vědecká knihovna v Ostravě

MODS a další metadatová schémata v oblasti digitalizace dokumentů. Pavla Švástová Moravská zemská knihovna

Projekt NUŠL a další projekty v ČR

Metodika budování sbírky Webarchivu

Strategie budování sbírky Webarchiv u

DŮVĚRYHODNÁ ELEKTRONICKÁ SPISOVNA

Archivace digitálních dokumentů. Elektronická spisovna

Digitalizace knihovních dokumentů. Jiří Polišenský

České digitalizační projekty, jejich výsledky a agregace

Ukládání a archivace dat

Národní digitální knihovna

2008 Dostupný z Licence Creative Commons Uveďte autora-zachovejte licenci 3.0 Česko

Řešení pro střednědobé a dlouhodobé ukládání dokumentů ve veřejné správě

Koncepce Národní digitální knihovny a dlouhodobé ochrany digitálních dokumentů

Digitalizace a digitální knihovny v České republice

Přístup k národnímu webovému archivu. Tomáš Síbek a Lukáš Gruber

Česká digitální knihovna agregace digitálního obsahu českých knihoven

Digitální archiv: standardy, koncepce, postupy

Dlouhodobá ochrana digitálních dokumentů a projekt NDK

Odevzdávání a příjem e-publikací

NOVÉ MOŽNOSTI PŘÍSTUPU K DIGITÁLNÍ ARCHIV NLK PLNOTEXTOVÝM INFORMACÍM : Filip Kříž, Lenka Maixnerová, Ondřej Horsák, Helena Bouzková

Perspektivy důvěryhodného digitálního úložiště v rámci Národní digitální knihovny

NÁRODNÍ DIGITÁLNÍ ARCHIV

Formáty WWW zdrojů. Mgr. Filip Vojtášek.

ICZ DESA střednědobé a dlouhodobé ukládání dokumentů

Zpřístupnění kulturního dědictví v digitální podobě v ČR prostřednictvím knihoven

Dlouhodobé a důvěryhodné uchovávání elektronických dokumentů

Rosetta nástroj pro dlouhodobé uložení digitálních objektů

Muzea a digitalizace Zvukové a filmové záznamy Národní technické muzeum 24./

Budoucnost českého webového archivu

DIGITÁLNÍ UNIVERZITNÍ REPOZITÁŘ. Andrea Fojtů Ústav výpočetní techniky UK v Praze

Projekt digitalizace a ukládání v regionech. Petr Pavlinec, KrÚ kraje Vysočina Březen 2010

Národní digitální archiv a egovernment

Tzv. životní cyklus dokumentů u původce (Tematický blok č. 4) 1. Správa podnikového obsahu 2. Spisová služba

Projekt HISPRA aneb Jak využít digitalizaci MKP v dalších knihovnách. 12. Května 2011, Jelení Hora

Dlouhodobé a důvěryhodné ukládání elektronických dokumentů. Oskar Macek

Ukládání dokumentů v návaznosti na datové schránky

WEBARCHIV ÚVOD, CÍLE, PODMÍNKY, REALITA. Katalogizace v knize Národní knihovna České republiky

Univerzální vyhledávací portál jako integrační řešení pro digitální knihovny

Digitalizace a zveřejnění sbírkových fondů paměťových institucí Zlínského kraje

Ředitel odboru archivní správy a spisové služby PhDr. Jiří ÚLOVEC v. r.

Digitalizace, popis pomocí metadat a jejich formáty. Digitization, metadata description and metadata formats

Příprava legislativy povinného výtisku elektronických publikací v České republice (e-depozit)

Velká data v knihovnách Open source tools and their use in Czech libraries

Datové centrum a Regionální SAN kraje Vysočina. Projekt digitalizace a. Petr Pavlinec, KrÚ kraje Vysočina. Září 2009

DŮVĚRYHODNÁ ELEKTRONICKÁ ARCHIVACE. Jan Tejchman Electronic Archiving Consultant

Lenka Maixnerová, Filip Kříž, Ondřej Horsák, Helena Bouzková

Technologická centra krajů Digitalizace a ukládání

ZPŘÍSTUPNĚNÍ A ARCHIVACE PLNÝCH

Využití nástrojů z projektu Česká digitální knihovna při digitalizaci a zpřístupnění digitálních dokumentů

KRAJSKÉ DIGITÁLNÍ ÚLOŽIŠTĚ

Projekt NAKI e-deposit

Technologie digitálních knihoven

Evropská digitální knihovna. < Prezentace k eseji pro předmět PV070 Digitální knihovny. Tomáš Drusa

Kramerius - zpřístupnění digitálních kopií v ČR

Univerzita Karlova Filozofická fakulta. Katedra pomocných věd historických a archivního studia BAKALÁŘSKÁ PRÁCE

Projekt Digitální knihovna pro šedou literaturu po prvním roce řešení

Diplomová práce. Dlouhodobé uchování webového obsahu. Univerzita Karlova v Praze. Filozofická fakulta. Bc. Jaroslav Kvasnica

DigiDepot: JPEG 2000 jako ukládací formát

Projekt záchranné digitalizace Ad fontes v Archivu hlavního města Prahy

Portál ebadatelna Zlínského kraje a zpřístupnění map. Prezentace historických map z fondu paměťových institucí Zlínského kraje

Účast NK ČR v projektu Norské fondy - digitalizace bohemikálních monografií ohrožených degradací papíru. Jiří Polišenský

Jinonické informační pondělky. Filip Šír

NOVÝ FONOGRAF MARTIN MEJZR DOMINIKA MORAVČÍKOVÁ FILIP ŠÍR

Archivace Elektronických Dokumentů

Řešení oblasti LTP v projektu NDK aneb zúročení 20 let zkušeností

Elektronické publikace v NK ČR. Mgr. Martin Žížala Národní knihovna ČR

Autorský zákon a knihovny - možnosti pro budoucnost. Vít Richter vit.richter@nkp.cz Praha, UISK, FFUK

Zpráva o plnění cílů projektu VISK3. WebArchiv - vytvoření podmínek pro zpřístupnění českých webových zdrojů

On-line katalog On-line digitální knihovna

Cesta ke zpřístupnění a archivaci dokumentů. Jan Pokorný, MULTIDATA Praha s.r.o. INFORUM 2008, VŠE Praha

Národní úložiště šedé literatury v roce Mgr. Petr Novák Státní technická knihovna Praha

Národní digitální knihovna

Silný portál. Jindřiška Pospíšilová. Pracovní skupina pro silný portál. Národní knihovna ČR

Máte to? Summon jako základní vyhledávací nástroj NTK

DŮVĚRYHODNÁ ELEKTRONICKÁ ARCHIVACE. Petr Dolejší Senior Solution Consultant

Budování virtuální depozitní knihovny. Tomáš Foltýn

The bridge to knowledge 28/05/09

Vysokoškolské kvalifikační práce na AMU:

MANUSCRIPTORIUM Digitalizace rukopisů VKOL. Miloš Korhoň Vědecká knihovna v Olomouci

Data management plan (DMP)

Certifikace Národní digitální knihovny podle ISO normy Jan Mottl AiP Safe s.r.o.

Technologická centra krajů a ORP

ARCHIVY ZDRAVOTNICKÉ DOKUMENTACE NEMOCNIC A TECHNOLOGICKÁ CENTRA KRAJŮ

Zpráva ze služební cesty

Online přístupné odborné knihy neztrácejí na půvabu

Tomáš HEBELKA, MSc. Skepse vůči cloudu. 21. června 2011 VI. Konference ČIMIB, Hotel Continental, Brno

Model nákladů na digitální archiv. Verse XI.07

Národní digitální knihovna a digitalizace v muzeích a galeriích

Lenka Maixnerová, Filip Kříž, Ondřej Horsák, Helena Bouzková

Systémy pro tvorbu digitálních knihoven

ECM. Enterprise Content Management. čt 9:15 Petr Bouška (xboup00) Zbyněk Hostaš Lukáš Maršíček Martin Nikl (xnikm00)

Archivace relačních databází

Karel Koucký. Státní oblastní archiv v Praze Národní archiv AKM 2013,

Projekt CDArcha: kooperativní zpracování datových CD disků. Zdeněk Hruška, Petr Žabička Moravská zemská knihovna v Brně AKM 2018

Důvěryhodná dlouhodobá a garantovaná archivace (požadavky z pohledu legislativy).

Nové nástroje pro staré mapy

dodavatele rekonstrukce prostor záložního pracoviště NDA [2], tak nacházet by se mělo pravděpodobně v okolí Hluboké nad Vltavou.

Transkript:

Dlouhodobá ochrana digitální dokumentů Mgr. Jaroslav Kvasnica

Obsah přednášky 1. Digitální dokument a metadata 2. Dlouhodobá ochrana digitálních dokumentů 3. Webová archivace

Digitální dokument Digitální dokument je dokument kódovaný v binární soustavě a přesně interpretovaný pouze pomocí výpočetní techniky.

Vlastnosti digitálního dokumentu kopie = originál nosič a informace nejsou na sobě závislé používáním se neopotřebovává informace není přístupná přímo instantní zničení

Vznik digitálních dokumentů digitalizace (konverze z analogové formy) born-digital statické x dynamické

Metadata data o datech popis (čehokoli)

data title author date description

Data nebo metadata???

Typy metadat popisné (co je to za objekt, jak jej nalézt) administrativní (jak objekt spravovat) technické (technický popis objektu) strukturální (vnitřní uspořádaní objektu)

MARC http://marc-must-die.info/

XML! Dublin Core, MODS, PREMIS, MIX, METS a jiné MARC21 245 $b 600 MODS <subtitle> <name> 534 $c, 760 762, 765, 767, 770, 772, 773, 774, 775, 776, 777, 780, 785, 786, 787 $d <publisher> 020 $a <identifier type= isbn >

Dlouhodobá digitálních dokumentů Digital preservation is a formal endeavor to ensure that digital information of continuing value remains accessible and usable.

Cíle dlouhodobé ochrany digitálních dokumentů uchování; zpřístupnitelnost; srozumitelnost

Technická rizika degradace nosiče zastarávání nosiče poškození (přirodní katastrofy, viry, zálohovací procesy)

Logická rizika zejména formátová rizika zastarávání souborových formátů vlastnictví formátu specifikace formátu dokumentace srozumitelnost, rozpoznatelnost

Systémová rizika financování! integrita -> dostanu nezměněný dokument? Falšování, poškození, cenzura autenticita > dostanu opravdu dokument, který jsem žádal? Má takto dokument vypadat? důvěryhodnost repozitáře

Technologická dlouhodobá ochrana výběr vhodného nosiče bitová ochrana zálohování

Logická dlouhodobá ochrana Enkapsulace Migrace Emulace Technické muzeum

Migrace výměna zastarávajícího formátu za nový výběr formátu: signifikantní vlastnosti dokumentu dokumentace formátu + uživatelé pracují se svým systémem, široká aplikace - chybovost, nutnost pravidelného opakování, fin. náročnost

Emulace simulace hardwarového nebo softwarového prostředí na jiném systému + uživatel pracuje v původním systému, nezasahuje se do sekvence bitů - uživatel pracuje v původním systému, uživatel musí používat speciální sw, nové platformy = nové emulátory, http://oldweb.today

Webová archivace Web archiving is the process of collecting portions of the World Wide Web to ensure the information is preserved in an archive for future researchers, historians, and the public.

Proč archivovat web? Je snazší nalézt exemplář filmu z roku 1924, než webové stránky z roku 1994. M.S. Ankerson. Writing web histories with an eye on the analog past. 2012. http://nms.sagepub.com/content/14/3/384.full.pdf+html

Proč archivovat web? proč archivovat zrovna web? ochrana netištěné kulturní, umělecké a historické produkce pro další generace přesun publikační činnosti na internet prchavost elektronických zdrojů

Typy webu Surface web - běžně přístupná část webu Deep web (invisible, hidden) - dynamický obsah, kontextuální, privátní, skriptovaný atd. Dark web (darknet) - obvykle nelegální obsah, těžko dosažitelný (P2P)

Typy archivace Personální pro osobní potřebu firemní archivace neřeší rozdíly mezi surface x deep Institucionální za účelem uchování kulturního dědictví knihovny, univerzity často web-scale archiving

Web scale archiving webové archivy se snaží archivovat tak velkou část internetu, že není možné kontrolovat akvizici, ochranu, zpřístupnění ani kontrolu kvality jednotlivých webových stránek pouze lidskými silami. Internet Archive, národní knihovny, univerzity

Webarchiv www.webarchiv.cz digitální archiv českých webových zdrojů český web = všechny bohemikální zdroje

Webarchiv stáří archivu: 3. 9. 2001 > 250 TB webarchiv.cz přes 1 300 000 domén.cz

Zpřístupnění Wayback Machine (zobrazování) Vyhledávání: primárně WWW katalog Aleph Wayback Machine

méně než 1 % zdrojů zpřístupněných online celý archiv dostupný pouze v Klementinu Bude to lepší v budoucnu? Ne. terminály v dalších knihovnách? metadata

Děkuji za pozornost! Jaroslav Kvasnica jaroslav.kvasnica@nkp.cz w w w w w w