Formáty a dlouhodobé uložení: Identifikace, extrakce a validace

Podobné dokumenty
Národní archivní portál: prezentace, výběr, postupy

K PROBLEMATICE SPISOVÉ SLUŽBY v elektronické podobě

K PROBLEMATICE SPISOVÉ SLUŽBY v elektronické podobě

Doručování analogových dokumentů. Doručování digitálních dokumentů

VYHLÁŠKA ze dne 23. června 2009 o stanovení podrobností užívání a provozování informačního systému datových schránek

Co je to spisová služba

Informace o provozu podatelny a o podmínkách přijímání dokumentů na Krajském úřadu Ústeckého kraje

MAGISTRÁT MĚSTA MOSTU ZVEŘEJŇUJE 1 ADRESA PRO DORUČOVÁNÍ DOKUMENTŮ NA MAGISTRÁT MĚSTA MOSTU A STATUTÁRNÍ MĚSTO MOST

Univerzita Karlova. Opatření rektora č. 72/2017

Opatření rektora č. 72/2017

Univerzita Karlova. Opatření rektora č. 23/2016

194/2009 Sb. VYHLÁKA

Univerzita Karlova. Opatření rektora č. 13/2017

MAGISTRÁT MĚSTA MOSTU ZVEŘEJŇUJE 1 ADRESA PRO DORUČOVÁNÍ DOKUMENTŮ NA MAGISTRÁT MĚSTA MOSTU A STATUTÁRNÍ MĚSTO MOST

Práce s elektronickými dokumenty a jejich dlouhodobé ukládání

Práce s elektronickými dokumenty a jejich dlouhodobé ukládání (egon)

Stavovský předpis. Prezidia Exekutorské komory České republiky. ze dne , o předkládání exekučních spisů soudům

Povinně zveřejňované údaje dle vyhlášky č. 259/2012 Sb., o podrobnostech výkonu spisové služby

SPISOVÝ ŘÁD. Účinnost od Mgr. René Havlík ředitel krajského úřadu. Krajský úřad Libereckého kraje. Krajský úřad Libereckého kraje

Typový postup implementace zákona č. 300/2008 Sb. (ve znění zákona č. 190/2009 Sb.)

Národní standard pro elektronické systémy spisové služby. Miroslav Kunt, Národní archiv

Univerzita Karlova. Opatření rektora č. 23/2016

Nová archivní legislativa

Práce s dokumenty v digitální podobě doručenými původcům vedoucím spisovou službu v listinné podobě a jejich odesílání

Projekt Datové schránky

259/2012 Sb. VYHLÁKA

Digitální dokumenty a elektronické systémy spisových služeb

Inovace výuky prostřednictvím ICT v SPŠ Zlín, CZ.1.07/1.5.00/ Vzdělávání v informačních a komunikačních technologií

NÁRODNÍ DIGITÁLNÍ ARCHIV

Příprava dokumentů pro archivaci v souladu s platnou legislativou. Vladimír Střálka Adobe Systems Praha

Návrh. Čl. I. 2. V příloze č. 3 písm. k) se text doc nahrazuje textem doc/docx.

Digitální archiv: standardy, koncepce, postupy

Převody datových formátů

Obraz jako data. Biofyzikální ústav Lékařské fakulty Masarykovy univerzity Brno. prezentace je součástí projektu FRVŠ č.2487/2011

ze dne 20. července 2012 o podrobnostech výkonu spisové služby původce, u něhož to neumožňuje zvláštní povaha jeho působnosti.

Závěrečné práce - vzor opatření děkana od

VYHLÁŠKA ze dne 20. července 2012 o podrobnostech výkonu spisové služby

INFORMACE O ELEKTRONICKÉ AUKCI POKYNY PRO UCHAZEČE

Počítačová grafika a vizualizace I

259/2012 Sb. VYHLÁŠKA

259/2012 Sb. VYHLÁŠKA Ministerstva vnitra ze dne 20. července 2012 o podrobnostech výkonu spisové služby ve znění vyhlášky č. 283/2014 Sb.

Částka 65. VYHLÁŠKA ze dne 12. května 2016 o uveřejňování formulářů pro účely zákona o zadávání veřejných zakázek a náležitostech profilu zadavatele

Archivní formáty a nástroje datové konverze

DŮVĚRYHODNÁ ELEKTRONICKÁ SPISOVNA

METODIKA DLOUHODOBÉHO UKLÁDÁNÍ A ARCHIVACE DIGITÁLNÍCH DOKUMENTŮ. kolektiv autorů. Masarykova univerzita Fakulta informatiky

Projekt CDArcha: kooperativní zpracování datových CD disků. Zdeněk Hruška, Petr Žabička Moravská zemská knihovna v Brně AKM 2018

Tzv. životní cyklus dokumentů u původce (Tematický blok č. 4) 1. Správa podnikového obsahu 2. Spisová služba

Ředitel odboru archivní správy a spisové služby PhDr. Jiří ÚLOVEC v. r.

Opatření děkana č. 13/2018. Pravidla pro evidenci, odevzdávání a zveřejňování závěrečných prací

Archivní formáty a nástroje datové konverze

Dlouhodobé a důvěryhodné ukládání elektronických dokumentů. Oskar Macek

Archivační řád Českého sociálněvědního datového archivu (ČSDA)

Konverze grafických rastrových formátů

PRACOVIŠTĚ PRO DLOUHODOBÉ UCHOVÁVÁNÍ A ZPŘÍSTUPŇOVÁNÍ DOKUMENTŮ V DIGITÁLNÍ PODOBĚ NÁRODNÍ DIGITÁLNÍ ARCHIV

Extrakce metadat z dokument. Ond ej Vodá ek. ƒeské vysoké u ení technické v Praze Fakulta elektrotechnická Katedra po íta.

Práce s obrazovým materiálem CENTRUM MEDIÁLNÍHO VZDĚLÁVÁNÍ. Akreditované středisko dalšího vzdělávání pedagogických pracovníků

Národní digitální archiv a egovernment

Ukládání dokumentů ve spisovně a skartační řízení. Lukáš Čoupek Státní okresní archiv Uherské Hradiště

JPEG Formát pro archivaci a zpřístupnění.

Řízení dokumentů a záznamů

Počítačová grafika a vizualizace volné 3D modelování. Maxon CINEMA 4D. Mgr. David Frýbert, 2012

Národní archivní portál - brána k digitálnímu archivu

Digitální audio zde se vysvětluje princip digitalizace zvukového záznamu, způsoby komprese uložení ztrátové a bezztrátové, obvyklé formáty atd.

VIDEO DATOVÉ FORMÁTY, JEJICH SPECIFIKACE A MOŽNOSTI VYUŽITÍ SMOLOVÁ BÁRA

Národní digitální archiv výsledky, postupy, plány

DigiDepot: JPEG 2000 jako ukládací formát

Národní digitální archiv

Multimediální systémy. 10 Komprese videa, formáty

Ukládání dokumentů v digitální podobě v systémech elektronické spisové služby. Martina Macek

Videoformáty na internetu Ing. Jakub Vaněk KIT digital Czech a.s. Situation: Q4 09 and 2010 Budget

Muzea a digitalizace Zvukové a filmové záznamy Národní technické muzeum 24./

Národní digitální archiv

191/2009 Sb. VYHLÁŠKA ze dne 23. června 2009

418/2001 Sb. VYHLÁŠKA. Ministerstva spravedlnosti. ze dne 19. listopadu o postupech při výkonu exekuční a další činnosti

Vyhláška č. 191/2009 Sb. o podrobnostech výkonu spisové služby

Elektronický systém spisové služby UK

Archivace digitálních dokumentů. Elektronická spisovna

Škola: Gymnázium, Brno, Slovanské náměstí 7 III/2 Inovace a zkvalitnění výuky prostřednictvím ICT Název projektu: Inovace výuky na GSN

Návrh opatření pro prodloužení životnosti obsahu CD a DVD disků ve sbírkách NK

Číslo a název šablony III/2 Inovace a zkvalitnění výuky prostřednictvím ICT. Popis výukového materiálu Soubory, typy souborů, komprimace

Doporučení pro pořizování datových souborů při digitalizaci analogových originálů

III/ 2 Inovace a zkvalitnění výuky prostřednictvím ICT

IVT. Grafické formáty. 8. ročník

Spisový a skartační řád

Využití ICT techniky především v uměleckém vzdělávání. Akademie - VOŠ, Gymn. a SOŠUP Světlá nad Sázavou

Informace potřebné k doručování datových zpráv

DS-450dvrGPS Displej s navigací a kamerou (černou skříňkou) ve zpětném zrcátku

418/2001 Sb. VYHLÁŠKA. Ministerstva spravedlnosti ČÁST PRVNÍ OBECNÁ USTANOVENÍ

Reprodukce obrazových předloh

Elektronické skartační řízení

Věstník vlády. pro orgány krajů a orgány obcí. Ročník 6 Vydán dne 12. prosince 2008 Částka 6 OBSAH

Elektronické skartační řízení

Informace potřebné k doručování datových zpráv

Zásady prezentace CENTRUM MEDIÁLNÍHO VZDĚLÁVÁNÍ. Akreditované středisko dalšího vzdělávání pedagogických pracovníků

Multimediální systémy. 08 Zvuk

Spisová služba a její další rozvoj v souvislosti se zavedením datových schránek

Elektronická podatelna. Nabídky školení a nabídky od firem zasílejte na . adresu:

Grafické formáty. Grafika

Multimediální formáty

VMV čá. 57/2017 (část II)

Transkript:

Formáty a dlouhodobé uložení: Identifikace, extrakce a validace Zbyšek Stodůlka Brno, 2. 5. 2017

Informační balíčky

Funkční celky digitálního archivu

Příjem služby a funkce k balíčkům SIP (od tvůrců, tj. původců nebo od vnitřních prvků) zajišťuje: a) příjem balíčku SIP b) příprava obsahu na uložení a správu v archivu c) provedení kontroly kvality balíčku SIP d) vytváření archivního informačního balíčku AIP e) výběr popisných informací z balíčku AIP f) sladění aktualizací funkčních celků archivní uložení a správa dat

Výstupní datové formáty dokumentů v digitální podobě 23 vyhlášky č. 259/2012 Sb. (1) Výstupním datovým formátem dokumentů v digitální podobě se rozumí a) datový formát výstupu z elektronického systému spisové služby, b) datový formát dokumentu ukládaného ve spisovně, která je součástí elektronického systému spisové služby, c) datový formát pro předávání do digitálního archivu. (2) Výstupním datovým formátem statických textových dokumentů a statických kombinovaných textových a obrazových dokumentů je datový formát Portable Document Format for the Long-term Archiving (PDF/A, ISO 19005). (3) Výstupním datovým formátem statických obrazových dokumentů je a) datový formát Portable Network Graphics (PNG, ISO/IEC 15948), b) datový formát Tagged Image File Format (TIF/TIFF, revize 6 nekomprimovaný), c) datový formát Joint Photographic Experts Group File Interchange Format (JPEG/JFIF, ISO/IEC 10918).

Výstupní datové formáty dokumentů v digitální podobě (4) Výstupním datovým formátem dynamických obrazových dokumentů je a) datový formát umožňující uložení komprimovaných dat kódovaných podle standardu Moving Picture Experts Group Phase2(MPEG-2, ISO/IEC 13818), b) datový formát umožňující uložení komprimovaných dat kódovaných podle standardu Moving Picture Experts Group Phase 1 (MPEG-1, ISO/IEC 11172), c) datový formát Graphics Interchange Format (GIF). (5) Výstupním datovým formátem zvukových dokumentů je a) datový formát umožňující uložení komprimovaných dat kódovaných podle standardu MPEG-1 Audio Layer II nebo MPEG-2 Audio Layer II (MP2), b) datový formát umožňující uložení komprimovaných dat kódovaných podle standardu MPEG-1 Audio Layer III nebo MPEG-2 Audio Layer III (MP3), c) datový formát Waveform audio format (WAV), modulace Pulse-code modulation (PCM). (6) Výstupním datovým formátem pro databáze je datový formát Extensible Markup Language Document (XML), kde součástí předávaného dokumentu v datovém formátu XML je popis jeho struktury pomocí schématu XML nebo Document Type Definition (DTD), o kterém veřejnoprávní původce vede dokumentaci. (7) Výstupním datovým formátem metadat, jimiž jsou opatřovány dokumenty v elektronickém systému spisové služby, je datový formát Extensible Markup Language Document (XML) podle schématu XML pro výměnu dokumentů a jejich metadat mezi elektronickým systémem spisové služby stanoveného národním standardem nebo datový formát Extensible Markup Language Document (XML) podle schématu XML pro vytvoření datového balíčku SIP stanoveného národním standardem, který obsahuje metadata podle schématu XML pro zaznamenánípopisných metadat uvnitřdatového balíčku SIP stanoveného národním standardem.

SIP (NSESSS)

Identifikace formátů k rozpoznání formátů datových souborů při příjmu (ingestu) do digitálního archivu předpoklad pro další úkony: a) extrakci metadat b) migraci do formátu 1) pro dlouhodobé uložení (dle uchovávací strategie) nebo 2) při vytváření objektů v rámci modulu pro přístup (datové balíčky DIP v jiném formátu např. TIFF -> JPG) využití i předchozích částech životního cyklu dokumentu např. v essl (příjem na podatelně, převod do výstupního formátu při vyřízení/uzavření atd.)

Identifikace formátů Metody: dle přípony (extension) dle obsahu (signatures)

PRONOM

PRONOM vyvíjí Národní archiv Velké Británie od roku 2002 v současnosti 1493 formátů celosvětová akceptace https://www.nationalarchives.gov.uk/pronom/default.htm využívají programy: DROID, FIDO, Sigfried aj.

DROID Digital Record Object Identification vyvíjí Národní archiv Velké Británie identifikace pomocí : 1) přípony (extension) 2) obsahu (signature) pomocí tzv. magického čísla

Magické číslo hodnota typická pro daný souborový formát

Magické číslo

Extrakce metadat pro strojové zpracování nejen technická, ale i obsahová (např. u fotografií) dle ukládací strategie se při zpracování vytěžuje do správy dat a/nebo ukládá do datové balíčku AIP další informace pro zpřístupnění podporují nástroje: JHOVE, Apache Tika, ExifTool, MediaInfo atd.

Apache Tika pro formát PDF zobrazuje: metadata oprávnění text https://tika.apache.org

ExifTool výborný pro obrazové soubory (metadata standardu EXIF) u textových souborů mj: autor datum vytvoření poslední změna statistika atd. export možný i do TXT https://sourceforge.net/projects/exiftool/

MediaInfo pro multimediální formáty: video: MPEG-1/2 Video, H.263, MPEG-4, H.264/AVC, H.265/HEVC aj. audio: MPEG Audio (i MP3), AC3, DTS, AAC, Dolby E, AES3, FLAC aj. kontejnery: MPEG-4, QuickTime, Matroska, AVI, MPEG-PS (DVD), MPEG-TS (Blu-ray), MXF, GXF, LXF, WMV, FLV aj. https://mediaarea.net/cs/mediainfo

Validace formátů ověření souladu se stanovenou normou standardizace zpracování odhalení chyb např. nemožnost zobrazit v budoucnu pro různé formáty specializované programy

PDF/A formát vhodný pro dlouhodobé uložení (zejm. textu) oproti PDF omezena možnost změnit zobrazení (zakázány skripty, šifrování atd.) 2 úrovně požadavků úroveň A: součástí je vždy textová vrstva, struktura aj. úroveň B: bez textové vrstvy, pouze ztvárnění Formát Odvozeno z Změny PDF/A-1 ISO 19005:2005 PDF 1.4 - výchozí verze PDF/A-2 ISO 19005:2011 PDF/A-3 ISO 19005:2012 PDF 1.7 - podpora JPEG 2000 - fonty OpenType - podpora elektronického podpisu PAdES PDF 1.7 - vložení jiného souboru (XML, DOC, XLS aj.)

PDF/A různé validátory odlišné výsledky (http://digi.nacr.cz)

JHOVE JSTOR/Harvard Object Validation Environment umožňuje jak extrakci určitých metadat, tak jejich validaci podpora více formátů: AIFF, ASCII, Bytestream, GIF, HTML, JPEG, JPEG 2000, PDF, TIFF, UTF-8, WAV a XML pro některé formáty méně vhodný (např. PDF/A-1) http://jhove.sourceforge.net

zbysek.stodulka@nacr.cz http://digi.nacr.cz