Archivace relačních databází

Podobné dokumenty
Digitální dokumenty mimo elektronické systémy spisové služby aneb i databáze je dokument

Stručný obsah. K2118.indd :15:27

DigiDepot: JPEG 2000 jako ukládací formát

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Kapitola 4. Úvod 11. Stručný úvod do relačních databází 13. Platforma 10g 23

MBI - technologická realizace modelu

Ukládání a archivace dat

Marketingová komunikace. 2. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK1aPH/N9KMK1bPH (um1a1ph/um1b1ph)

Kurz je rozdělen do čtyř bloků, které je možné absolvovat i samostatně. Podmínkou pro vstup do kurzu je znalost problematiky kurzů předešlých.

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

Národní archiv v Praze PRŮZKUM SPISOVÉ SLUŽBY Pouze pro interní potřebu Národního archivu a příslušné organizace!

Použití databází na Webu

Programování a implementace Microsoft SQL Server 2014 databází

Ukládání a vyhledávání XML dat

GTL GENERATOR NÁSTROJ PRO GENEROVÁNÍ OBJEKTŮ OBJEKTY PRO INFORMATICA POWERCENTER. váš partner na cestě od dat k informacím

Marketingová komunikace. 2. a 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3aph)

Tzv. životní cyklus dokumentů u původce (Tematický blok č. 4) 1. Správa podnikového obsahu 2. Spisová služba

SRSW4IT Inventarizační SW. Prezentace aplikace. Vedoucí DP: ing. Lukáš Macura Autor: Bc. Petr Mrůzek

O Apache Derby detailněji. Hynek Mlnařík

8.2 Používání a tvorba databází

Kapitola 1: Úvod. Systém pro správu databáze (Database Management Systém DBMS) Účel databázových systémů

Obsah. Kapitola 1. Kapitola 2. Kapitola 3. Úvod 9

K PROBLEMATICE SPISOVÉ SLUŽBY v elektronické podobě

POKROČILÉ POUŽITÍ DATABÁZÍ

HRUBÝ NÁVRH SYSTÉM NA KONTROLU STAVU POHYBOVÝCH PLOCH LETIŠŤ V ČESKÉ REPUBLICE PRO PŘIPRAVOVANOU AGENDU ÚCL (etapa I)

Databázové systémy. Doc.Ing.Miloš Koch,CSc.

TECHNICKÁ SPECIFIKACE 1. FORMULÁŘOVÉ ŘEŠENÍ PRO OBĚH ELEKTRONICKÝCH DOKUMENTŮ ÚŘADU

ELEKTRONICKÝ ARCHIV ZDRAVOTNICKÉ DOKUMENTACE A VIDITELNÝ

VYSOKÁ ŠKOLA BÁŇSKÁ TECHNICKÁ UNIVERZITA OSTRAVA FAKULTA STROJNÍ DATABÁZOVÉ SYSTÉMY ARCHITEKTURA DATABÁZOVÝCH SYSTÉMŮ. Ing. Lukáš OTTE, Ph.D.

Obsah. Úvod 9. Úvod do Office Seznámení s Office Vylepšení programu Access XML 13 Inteligentní značky 14

Excel a externí data KAPITOLA 2

K PROBLEMATICE SPISOVÉ SLUŽBY v elektronické podobě


Modely datové. Další úrovní je logická úroveň Databázové modely Relační, Síťový, Hierarchický. Na fyzické úrovni se jedná o množinu souborů.

Střední průmyslová škola elektrotechnická Praha 10, V Úžlabině 320

Jakub Šesták. ESEJ DO PŘEDMĚTU DIGITÁLNÍ KNIHOVNY

Digitalizace a Digitální archiv Státního oblastního archivu v Třeboni po čtyřech letech. Výsledky a perspektivy dalšího vývoje

B Organizace databáze na fyzické úrovni u serveru Oracle

Manipulace a restrukturalizace dat

Vzdělávací obsah vyučovacího předmětu

předměty: ukončení: Zápočet + Zkouška / 5kb např. jméno, název, destinace, město např. student Jan Novák, narozen

Popis produktu IDFU. Řešení součinnosti s oprávněnými osobami verze 2. Aegis s.r.o.

Materiál byl vytvořen v rámci projektu Nové výzvy, nové příležitosti, nová škola

Databázový systém označuje soubor programových prostředků, které umožňují přístup k datům uloženým v databázi.

k národnímu standardu pro elektronické systémy spisové služby (NSESSS) Místo konání: Národní archiv ČR, Archivní 4/2257, Praha 4

Technická dokumentace

Inovace a zkvalitnění výuky prostřednictvím ICT Databázové systémy MS Access složitější konverze dat Ing. Kotásek Jaroslav

ODBORNÁ KNIHOVNA ČESKÉ POJIŠŤOVNY ONLINE SW ŘEŠENÍ AIP SAFE

ELEKTRONICKÝ ARCHIV ZDRAVOTNICKÉ DOKUMENTACE

Střední průmyslová škola elektrotechnická Praha 10, V Úžlabině 320 M A T U R I T N Í T É M A T A P Ř E D M Ě T U

VYUŽITÍ REGISTRU CITES V MEZINÁRODNÍ OCHRANĚ BIODIVERZITY

4IT218 Databáze. 4IT218 Databáze

Formáty WWW zdrojů. Mgr. Filip Vojtášek.

PŘÍRUČKA SYSTÉMOVÉHO ADMINISTRÁTORA PRO HOMEBANKING PPF banky a.s.

Databáze II. 1. přednáška. Helena Palovská

Archivace digitálních dokumentů. Elektronická spisovna

VYUŽITÍ REGIONÁLNÍCH FUNKCÍ A WWW ROZHRANÍ V INTEGROVANÉM KNIHOVNÍM SYSTÉMU KPWINSQL

Michal Krátký. Tvorba informačních systémů, 2008/2009. Katedra informatiky VŠB Technická univerzita Ostrava. Tvorba informačních systémů

DATOVÁ ARCHIVACE. Principy datové archivace a její výhody při migraci na SAP HANA. Štěpán Bouda Business Consultant

KMA/PDB. Karel Janečka. Tvorba materiálů byla podpořena z prostředků projektu FRVŠ č. F0584/2011/F1d

Databáze Bc. Veronika Tomsová

Skartační řízení z elektronických evidencí dokumentů jako obraz elektronizace veřejné správy. Ing. Miroslav Kunt, Mgr. Pavlína Nimrichtrová

Úvod do MS Access. Modelování v řízení. Ing. Petr Kalčev

Národní standard pro elektronické systémy spisové služby

37. Indexování a optimalizace dotazů v relačních databázích, datové struktury, jejich výhody a nevýhody

DŮVĚRYHODNÁ ELEKTRONICKÁ SPISOVNA

Databázový systém Matylda

Maturitní témata Školní rok: 2015/2016

Národní standard pro elektronické systémy spisové služby. Miroslav Kunt, Národní archiv

ADMINISTRACE POČÍTAČOVÝCH SÍTÍ. OPC Server

Databázové a informační systémy

Elektronické skartační řízení

Setkání uživatelů programu SSB2000, Skalský dvůr, SSB2000 bez hranic

Úvod do databázových systémů. Ing. Jan Šudřich

InterSystems Caché Post-Relational Database

BALISTICKÝ MĚŘICÍ SYSTÉM

Internetový obchod ES Pohoda Web Revolution

Microsoft Access tvorba databáze jednoduše

Datový sklad KGI/APGPS. RNDr. Vilém Pechanec, Ph.D. Univerzita Palackého v Olomouci

Marketingová komunikace. 3. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK3PH (vm3bph)

KRAJSKÉ DIGITÁLNÍ ÚLOŽIŠTĚ

Elektronická komunikace s CSÚIS. Jak to řeší Fenix

A5M33IZS Informační a znalostní systémy. O čem předmět bude? Úvod do problematiky databázových systémů

Doporučeno pro předpokládané využití serveru pro zpracování 2000 dokumentů měsíčně. HW: 3GHz procesor, 2 jádra, 8GB RAM

1. Webový server, instalace PHP a MySQL 13

CYCLOPE PRINT MANAGEMENT SOFTWARE- UŽIVATELSKÁ PŘÍRUČKA

AUTOMATIZACE PROCESU. Ing. Jan Vorlíček konzultant HSI, spol. s r. o. Ing. et Ing. Luděk Drápal konzultant Státní pozemkový Úřad

Business Intelligence

ESRI v národním kroji

Propojení elektronických systémů spravujících dokumenty. Tomáš Lechner Vysoká škola ekonomická v Praze Národohospodářská fakulta Katedra práva

Import a export dat EU peníze středním školám Didaktický učební materiál

Automatické generování zkouškových testů

Vznik a vývoj DDI. Struktura DDI. NESSTAR Systém pro publikování, prezentaci a analýzu dat. PhDr. Martin Vávra, Mgr. Tomáš Čížek

Základy databází. O autorech 17 PRVNÍ ČÁST. KAPITOLA 1 Začínáme 19

PRODUKTY. Tovek Tools

Evidence a správa kanalizace v GIS Kompas 3.2

Evidence městského mobiliáře v GIS Kompas 3.2

Transkript:

Archivace relačních databází Možnosti, formát SIARD, nástroje, tvorba, prohlížení, datové výstupy Martin Rechtorik 30.11.2018

Archivace relačních databází 1. Možnosti archivace relačních databází 2. Formát SIARD» Specifikace, verze a použití» Praktické fungování a možné využití» Aplikace pro práci s archivem SIARD» Datové výstupy 3. Výhody, nevýhody, shrnutí 30.11.2018 www.nacr.cz 2

Možnosti archivace relačních databází» Chronos» XML DeepArc SIARD 30.11.2018 www.nacr.cz 3

Formát SIARD» Vznik na základě požadavku na programově nezávislé archivování relačních databází» SIARD (Software Independent Archiving of Relational Databases) otevřený formát pro dlouhodobé archivování relačních databází» Cílem je trvale uložit data uložená v databázi» Verze SIARD 1.0, SIARD DK, SIARD 2.0, SIARD 2.1 30.11.2018 www.nacr.cz 4

Verze formátu SIARD SIARD 1.0» neoperační časový snímek databáze» Metadata vyžadovaná standardem SIARD slouží především k popisu originálního řídícího databázového systému, k popisu relací, tabulek, pohledů atd.» Primární data relační databáze (tabulky) jsou uložena v datové části archivního souboru SIARD DK» Je založen na pevné adresářové struktuře» Metadata jsou rozložena do 4 popisných souborů a to: tableindex, archiveindex, fileindex, docindex» Umožňuje archivovat velké objekty mimo tabulková data 30.11.2018 www.nacr.cz 5

Verze formátu SIARD SIARD 2.0» Oproti SIARD 1.0 je rozšířen o možnost ukládat velké datové objekty uložené v databázi do samostatných souborů, a to uvnitř i vně archivačního souboru siard.» Struktura obsahuje všechna metadata uložená v jediném souboru metadata.xml, implementace standardu SQL:2008 SIARD 2.1» Zavádí nové atributy, které omezují chybovost konverze SQL jazyka do podoby XML popisu 30.11.2018 www.nacr.cz 6

Použití formátu SIARD» Tvorba archivů je možná přes příkazovou řádku nebo v příslušné grafické podobě aplikace» Aplikace Database Preservation Toolkit a umožňuje archivaci do formátu SIARD V1.0, V2.0 a SIARD DK (uživatelská grafická podoba, tzv GUI je dostupná jen pro operační systémy Linux nebo OS X)» Pro SIARD 2.1 vyvinut (stále ve vývoji) SIARD Suite, uživatelsky příjemná aplikace s grafickou podobou» Pro databáze většího datového rozsahu je doporučeno používat příkazovou řádku 30.11.2018 www.nacr.cz 7

Schéma fungování a využití Využití formátu SIARD Oracle MS SQL MySQL DB2 MS Acces Oracle MS SQL MySQL DB2 MS Acces SIARD 2.1 SIARD 2.1 30.11.2018 www.nacr.cz 8

Nástroje prohlížení archivu SIARD SIARD 1.0»SIARD suite, SIARD Excerpt SIARD 2.0»Database Visualization Toolkit»SIARD Excerpt»Předpokládá se přenos do živého databázového prostředí» SIARD DK»SOFIA search and find in archives, nelze získat» SIARD 2.1»SIARD suite, SIARD Excerpt»Předpokládá se přenos do živého databázového prostředí 30.11.2018 www.nacr.cz 9

Archiv SIARD = hierarchicky strukturovaný systém dat v souborech XML s příslušným schématem XSD, dále obsahuje soubory velkých datových objektů, veškerá metadata se ukládají do jediného souboru metadata.xml (neplatí do SIARD DK) Výstupem může být:» celý archiv databáze» tabulka» datový záznam» datový objekt» metadata Datové výstupy 30.11.2018 www.nacr.cz 10

Výhody formátu SIARD» Archiv SIARD = neoperační časový snímek databáze» data jsou ukládána ve stejné struktuře jako v jiných zemích, formát SIARD se používá po celém světě» Dokumentace k formátu a aplikaci bude dostupná v českém jazyce» Komunita, která se podílí na dalším vývoji (GitHub)» Archiv SIARD = zip, lze procházet i bez aplikace» V podstatě jediná možnost trvalé archivace dat z informačních systémů bez datového výstupu» Archivace do strukturované sestavy souborů XML je v souladu s vyhláškou č. 259/2012 sb. o spisové službě, XML je výstupní formátem dle 23 odst. (6) a (7) 30.11.2018 www.nacr.cz 11

Nevýhody formátu SIARD» Archiv SIARD = neoperační časový snímek databáze» IMPORT a EXPORT databázi závisí na kvalitě a dostupnosti ovladačů k uvedenému systému a vzhledem ke značným rozdílům mezi jednotlivými databázovými systémy (implementace standardu jazyka SQL, dotazy v proprietární podobě), není běžně možné migrovat data a popisy mezi jednotlivými databázovými systémy.» Vývoj aplikace pro práci se SIARD archivem zaostává za rychlostí vývoje SQL serverů a standardů pro komunikaci s SQL servery. SQL standard je z roku 2016 a SIARD 2.1 implementuje standard z roku 2008. 30.11.2018 www.nacr.cz 12

Nevýhody formátu SIARD» Není zpětná kompatibilita verzí formátu a novějšími aplikacemi s výjimkou aplikace SIARD Excerpt» Databáze (IS) a tabulková data jsou normalizována adresářové struktury s jednotlivými tabulkami a jejich definičními schématy, normalizací dojde ke zmrzačení databáze» Procházení adresářové struktury se soubory XML a XSD je bez aplikace prakticky nevyužitelné» Verze SIARD 1.0 umožnuje ukládat velké objekty pouze v polích tabulky» Samostatné uložení velkých objektů snižuje využitelnost aplikace SIARD Excerpt 30.11.2018 www.nacr.cz 13

Závěrečné shrnutí» Databáze (IS) jsou z hlediska archivního zákona dokument (nahrazují různé dříve vedené úřední knihy) a není pochyb o nutnosti jejich archivace» Formát SIARD prošel vývojem v Evropě, přes SIARD 1.0 (Švýcarsko), SIARD-DK (Dánsko), SIARD 2.0 (Nizozemí, Německo, Portugalsko aj.), nejnověji SIARD 2.1 (Švýcarsko). Z hlediska způsobu ukládání dat je vhodný k archivaci relační databáze na konci životnosti» Základní podmínkou je podpora prostředí» NAČR na formát SIARD nahlíží jako nouzovou možnost archivace dat databáze, pokud informační systém nemá možnost strojově čitelného výstupu (SIP, xml, csv) 30.11.2018 www.nacr.cz 14

Děkuji za pozornost martin.rechtorik@nacr.cz 30.11.2018