Projekt. Převod záznamů starých tisků rodové Chotkovské knihovny do systému Clavius. Vypracovali:

Podobné dokumenty
Migrace databáze odborných praxí a závěrečných prací z proprietární aplikace do open source prostředí

Digitální repozitář Pražské skupiny školní etnografie

Databázové systémy. Doc.Ing.Miloš Koch,CSc.

OBSAH. Word. První spuštění a hlavní obrazovka Wordu 3 Základní nastavení Wordu 6 Kontrola pravopisu a mluvnice 8 Nastavení ukládání dokumentu 12

Databázové systémy Cvičení 5.2

1 Administrace systému Moduly Skupiny atributů Atributy Hodnoty atributů... 4

Informační systémy ve zdravotnictví. 6. cvičení

17. července :51 z moravec@yahoo.com

POUŽITÍ DATABÁZÍ. Po ukončení tohoto kurzu budete schopni

1 Přesun síťového serveru

Maturitní projekt do IVT Pavel Doleček

SRSW4IT Inventarizační SW. Prezentace aplikace. Vedoucí DP: ing. Lukáš Macura Autor: Bc. Petr Mrůzek

RD.CZ : EVIDENCE DIGITALIZOVANÝCH DOKUMENTŮ A SLEDOVÁNÍ PROCESU ZPRACOVÁNÍ

Import a export dat EU peníze středním školám Didaktický učební materiál

Informace k e-learningu

Importy a exporty KLIENTSKÝ DOPLNĚK PRO PODPORU IMPORTŮ VERZE 3.2.0

Přechod na Firebird 3. Popis migrační utility

8.2 Používání a tvorba databází

1 Webový server, instalace PHP a MySQL 13

Návrh a tvorba WWW stránek 1/14. PHP a databáze

Databáze pro evidenci výměny a prodeje publikací Knihovny Kabinetu hudební historie EÚ AV ČR (Dokumentace k projektu)

Inovace a zkvalitnění výuky prostřednictvím ICT Databázové systémy MS Access složitější konverze dat Ing. Kotásek Jaroslav

Jan Forman Manuál CLASSIFICATIO N: public / veřejný dokument IDE NTIFICATIO N N U MBER: AUTH OR:

Modul. Univerzální tabulkový export

Marketingová komunikace. 2. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK1aPH/N9KMK1bPH (um1a1ph/um1b1ph)

Data x Informace x Znalosti

Tabulkové kalkulátory, (MS Excel, OpenOfiice)

Databáze. Velmi stručný a zjednodušený úvod do problematiky databází pro programátory v Pythonu. Bedřich Košata

Databáze prodejců. Tlačítka. Vytvoří kartu nového prodejce (Alt+N); Změní vybraného prodejce Uloží nového prodejce nebo změnu (Alt+U);

Databáze MS-Access. Obsah. Co je to databáze? Doc. Ing. Radim Farana, CSc. Ing. Jolana Škutová

HELIOS - Zálohování BüroKomplet, s.r.o.

Řazení tabulky, dotazu nebo formuláře

Databázové systémy. Cvičení 6: SQL

WNC::WebNucleatCreator

Lotus Quickr - ECM Integrace s LD/LN aplikacemi. Ing. Josef Homolka VUMS Legend

Technická specifikace

EPLAN Electric P8 2.7 s databázemi na SQL serveru

Internetový obchod ES Pohoda Web Revolution

VYSOK ŠKOLA EKONOMICKÁ V PRAZE VYŠŠÍ ODBORNÁ ŠKOLA INFORMAČNÍCH SLUŽEB. Projekt

ANOTACE vytvořených/inovovaných materiálů

Marketingová komunikace. 2. a 3. soustředění. Mgr. Pavel Vávra 9103@mail.vsfs.cz. Kombinované studium Skupina N9KMK3PH (vm3aph)

WORKWATCH ON-LINE EVIDENCE PRÁCE A ZAKÁZEK

Inovace a zkvalitnění výuky prostřednictvím ICT Databázové systémy MySQL základní pojmy, motivace Ing. Kotásek Jaroslav

STŘEDNÍ ŠKOLA INFORMAČNÍCH TECHNOLOGIÍ A SOCIÁLNÍ PÉČE

Úvodem 9. Zpětná vazba od čtenářů 10 Zdrojové kódy ke knize 10 Errata 10. Než začneme 11

Postup přechodu na podporované prostředí. Přechod aplikace BankKlient na nový operační systém formou reinstalace ze zálohy

Zpětná vazba od čtenářů 11 Dotazy 11 Zdrojové kódy ke knize 11 Errata 11 Typografické konvence použité v knize 12

Stručný obsah. K2118.indd :15:27

Word Lekce III. a IV.

Maturitní otázky z předmětu PROGRAMOVÁNÍ

Souborný katalog ČR a Městská knihovna Jaroměř. Marta Valešová

1. Terminálová aplikace. 2. Instalace. 3. Nastavení. HARRACHOV CARD Instalace, nastavení a používání terminálové aplikace

Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová. 5. Statistica

Microsoft Access tvorba databáze jednoduše

Tlačítka a další prvky vestavěných panelů nástrojů a nabídek (CommandBar) a jejich Control ID ve verzi Excel 2010

BPC 10.1 on HANA Classic. Ondra Klouček

Využití OOP v praxi -- Knihovna PHP -- Interval.cz

Obrázek 1: Struktura programu z hlediska zapojení

1. Témata maturitních prací. 2. Termín závazného zadání maturitní práce. 3. Termín odevzdání maturitní práce. 4. Kritéria hodnocení maturitní práce

Marketingová komunikace. 3. soustředění. Mgr. Pavel Vávra Kombinované studium Skupina N9KMK3PH (vm3bph)

1. Webový server, instalace PHP a MySQL 13

Střední odborná škola stavební Karlovy Vary Sabinovo náměstí 16, Karlovy Vary Autor: Ing. Hana Šmídová Název materiálu:

Manuál pro implementaci aplikace Na poštu

Kurz je rozdělen do čtyř bloků, které je možné absolvovat i samostatně. Podmínkou pro vstup do kurzu je znalost problematiky kurzů předešlých.

Vyhledávací techniky a editace v klientovi ARL

Databox CONTACT 6. Při konfiguraci systému řešíme jednoduchost, praktičnost, automatizaci a kontrolu.

Měřící systém se vzdáleným přístupem. Databáze

INFORMATIKA WORD 2007

5. POČÍTAČOVÉ CVIČENÍ

Bibliografických manažerů je celá řada. Tento materiál popisuje práci s nástrojem zvaným EndNote Basic.

ZÁKLADNÍ POPIS INFORMAČNÍHO SYSTÉMU KAJOT EASY-K

Dokumentace k projektu pro vybrané sbírky Židovského muzea v Praze

Marek Laurenčík. Excel. práce s databázemi a kontingenčními tabulkami

Obsah. 1) Rozšířené zadání 2) Teorie zásuvných modulů a) Druhy aplikací používajících zásuvné moduly b) Knihovny c) Architektura aplikace d) Výhody

4. Nastavení programu

Praha 4 Otipka Jakub Soboleva Alena 2005/2006 Srnková Lucie Stankovič Aleksandar Jiří Wallenfels

PHOTO-ON Profesionální on-line správa fotografií

Program Sharpdesk Sharpdesk řešení pro správu dokumentů

POPIS TECHNICKÉHO ŘEŠENÍ INFORMAČNÍHO SYSTÉMU PRO SBĚR DAT V PROJEKTU SLEDOVÁNÍ DEKUBITŮ JAKO INDIKÁTORU KVALITY OŠETŘOVATELSKÉ PÉČE NA NÁRODNÍ ÚROVNI

Základní popis Toolboxu MPSV nástroje

Pokyny pro uživatele programu SKLAD Odpadů 8

2015 GEOVAP, spol. s r. o. Všechna práva vyhrazena.

PR04 - PŘÍPRAVA REALIZACE PŘIJÍMACÍCH ZKOUŠEK

Metadata. MI-DSP 2013/14 RNDr. Ondřej Zýka,

Kontingenční tabulky v MS Excel 2010

Digitální stavební deník

Export dat Evidence smluv (KEO ---> KEO-X)

Google Apps. kontakty. verze 2011

Jak využít kancelářské aplikace ve výuce MS Office Gymnázium a SOŠ Orlová Ing. Marta Slawinská

Návod - katalog. ANTEE s.r.o. - tel.: , fax: , helpdesk: ,

Základní informace: vysoce komfortnímu prostředí je možné se systémem CP Recorder efektivně pracovat prakticky okamžitě po krátké zaškolení.

X33RIP Oponentura pro skupinu B

Uživatelská příručka pro ředitele škol

STRUKTURA MATURITNÍ PRÁCE

RELAČNÍ DATABÁZE ACCESS

Uživatelský manuál služby edrivesoft společnosti Audit Alliance spol. s r.o. - Vložení nového dokumentu

Karina Makarova. Oleksandra Sharnova. Anastasiya Romanyuta. Alexandra Plischenko. Jana Burchavskaya. Asel Doschanova

CRM - manuál. Vypracovala: Monika Balažovičová [1] Softapp s.r.o., Kouty 1419, Valašské Meziříčí, tel.:

Transkript:

Projekt Převod záznamů starých tisků rodové Chotkovské knihovny do systému Clavius Vypracovali: Thomas Ignatyev Klára Husáková Natasha Goncharova Matyáš Málek Martin Hadrava

Projekt: Převod záznamů starých tisků rodové Chotkovské knihovny do systému Clavius 1.1 Cíl projektu Hlavním cílem našeho projektu je převod starých tisků rodové Chotkovské knihovny pro Knihovnu Národního zemědělského muzea na zámku Kačina do elektronického systému Clavius. Naším zadavatelem je paní Alena Štecherová z knihovny NZM. Pracovištěm nám bude Knihovna Národního zemědělského muzea na zámku Kačina Tisky jsou uchovány v papírové formě, ale máme je také k dispozici v jednoduché tabulkové formě v MS Excel a MS Word. Rádi bychom tento převod zpracovali pomocí importu a exportu dat do programu Clavius. (http://www.lanius.cz/) Pokud by se tato prvotní myšlenka nezdála být tou pravou, máme v záloze řešení přes SQL databázi a vkládání dat a uživatelské rozhraní v PHP. 2

1.2 Plánovaný harmonogram řešení projektu Podle zjištěných skutečností a podle zvážení náročnosti řešení jsme se rozhodli rozložit si práci v těchto termínech: Datum Popis práce Počet hodin 4.3.11 Zadání práce a schůzka se zadavatelem 2 9.3.11 Shrnutí, rozdělení a upřesnění práce 2 16.3.11 Týmová porada a sjednocení nápadů, podkladů 2 23.3.11 Technická dokumentace řešení projektu 4 30.3.11 Miniseminář k problematice řešeného projektu 1,5 6.4.11 Úpravy, redesign projektu a řešení případných problémů 2 13.4.11 Prezentace projektu 1,5 1.5.11 Odevzdání konečné verze knihovně NZM 1 1.3 Use case diagram otevřit doc v exelu spustit exel Připojit se servru SQL spustit SQL klient Export dat z Exelu do SQL Vytvořit přikaz v SQL V přikazu SQL odkazat na zdrojový doc Student Knihovna import dat do systému CLAVIUS instalace a spuštění syst Clavius <<include>> Zpracování dat Předání vysledku prace 3

1.4 Technické řešení projektu 1.4.1 Postup Knihovna Národního zemědělského muzea na zámku Kačina má katalogizované záznamy ve formě tisku a také ve formě jednoduchého přepisu v MS Excel a MS Word. Jelikož nelze jen exportovat data do systému Clavius, je nutná konverze formátu. Jako první se budeme zabývat zjevně viditelnějším postupem a to konvertovat databázi ve formátu MS Excel do jednoduchého SQL rozhraní. K tomu je potřeba vytvořit základní uživatelské rozhraní pro vyhledávání. Toto rozhraní bude sloužit pro kontrolu všech procesů katalogu. Díky tomu je možná pozdější modifikace rozhraní. To se samozřejmě musí stále zdokonalovat, aby nedocházelo k různým chybám. Musíme přenést pouze ta data, která nesou podstatnou informaci, je tedy nutná selekce dat na důležitá a nedůležitá. A jelikož je dat bezmála 20000, budeme postupovat pomocí příkazů z SQL. Výhodou je snadná modularita, tedy sestavení jednotlivých částí k sobě, tak aby byly standardizovány mezinárodními normami. V první verzi našeho řešení bychom rádi zkusili přesunout data z MS Excel do databáze v MySQL. Pro možnost manipulace s databází je nutnost mít nainstalovaný MS SQL Server. Do tohoto serveru postupně překlopíme všechna data tak, abychom s nimi mohli dále operovat. Dále je nutná instalace konvertovacího programu, který nám pomůže přesunout data z MS Excel do SQL Serveru. My jsme se na základě týmové porady rozhodli pro program SQL Convertor, který nám přišel nejvíce vhodný pro danou operaci. V SQL Convertoru se data přeskupila do našeho SQL Serveru. Tento bod překlopení byl poměrně jednoduchý. Nyní máme k dispozici data z MS Excel v požadovaném rozhraní. Dále jsme pokračovali tím, že jsme se snažili upravit data v databázi do požadované normy. Prvním úkolem v SQL je rozdělit data ve sloupci Autor. Momentální data ve sloupci autor jsou jméno a příjmení v jedné kolonce. My dané jméno a příjmení rozdělím do dvou kolonek. A to z důvodu přehlednějšího a rychlejšího vyhledávání a také abychom předešli případné duplikaci jmen či příjmení. Tato operace se provede pomocí tohoto skriptu: Select substring (F3, 0, charindex (,, F3)) as Příjmení, Substring (F3, charindex (,F3), len (F3)) as Jméno From dbo.chotkárna 4

Tímto postupem jsme rozdělili danou buňku na dvě a v každé se objeví buď slovo před čárkou, nebo za čárkou ta je tzv. rozdělovač. Dále jsme přejmenovali názvy sloupců, tak aby odpovídaly původním údajům z databáze v MS Excel. Tohoto řešení jsme dosáhli pomocí SQL skriptů: select F1 as S1,, F2 as Alig, substring (F3, 0, charindex (',', F3) as Příjmení, P substring (F3, charindex (' ', F3), len (F3)) as Jméno, F4 as Titul, F5 as Mesto, TRIAL_COLUMN6 as Rok, TRIAL_COLUMN7 as PocetStranek, TRIAL_COLUMN5 as PocetSvazku, TRIAL_COLUMN11 as Vazba, TRIAL_COLUMN12 as ExLibris, TRIAL_COLUMN13 as Poznamka from dbo.chotkárna Skript 1 Skript 2 5

1.4.2 Překlopení SQL databáze do systému Clavius Hlavním cílem naší práce bylo překlopení dat do systému Clavius. Tento problém se nám však nepovedlo vyřešit. Nepodařilo se nám zjistit, jakým způsobem databázi z SQL zpracovat do podporovaných formátů systému Clavius. Knihovní systém Clavius podporuje pro nahrání dat tyto formáty: *.ISO,*.UNI,*.TAG. Tyto formáty jsou standardizované verze pro knihovní systémy. Ačkoliv jsme se pustili do podrobného vyhledávání, neuspěli jsme. Zkoušeli jsme konvertovat data do textové formy, ale ani tento jednoduchý formát jsme nedokázali nahrát do systému Clavius. ISO 2709 ČSN ISO 2709 je mezinárodní norma, která specifikuje požadavky na obecný formát výměny dat. Je to tedy formát pro výměnu informací. Jeho struktura je návěstí, adresář, pole s údaji a oddělovač záznamů. Každé pole je definováno jako samostatný prvek. Tagy mají čísla pouze od 002 do 999 nebo znaky od 00A do ZZZ. Bibliografické Pole jsou v rozmezí 010-999 a 0AA-ZZZ. Tato bibliografická pole obsahují data a oddělovač. Marc 21 Je také standard pro výměn bibliografických informací ve strojem čitelné podobě. Originální název je MAchine Readable Cataloguing, což znamená Strojově čitelnou katalogizaci. Marc 21 je kombinace kanadských formatů Marc používaných ve Spojených státech Amerických. Využívá znakové sady jako MARC-8, Unicode, UTF-8. MARC21 má strukturu záznamu danou standardy ANSI Z39.2 a ISO 2709. V praxi to znamená, že se data člení do polí a podpolí, označených tagy. Jednomu poli odpovídají dva indikátory, které upřesňují význam jeho obsahu. Každé pole začíná na novém řádku. V MARC21 je kladen důraz na interpunkci. 6

Dalším bodem v našem projektu je řešení souvislé řady přírůstkových čísel = signatur. Data v MS Excel jsou číslována až od čísla 6542 do čísla 19 780. Data v MS Word jsou rozdělena do šesti souborů. Číslování je rozděleno takto: Číslování Od Do *.doc.1 1 151 *.doc.2 151 1200 *.doc.3 1201 3540 *.doc.4 3541 5489 *.doc.5 3541 4926 *.doc.6 4927 7002 Toto rozdělení do souborů je velice nešťastné a to z důvodu, že se daná přírůstková čísla překrývají již v této formě. Navíc je v jednom MS Word dokumentu uvedeno více záznamů, než je uvedeno v číslování. Například v prvním souboru je obsaženo 7933 záznamů a pro nás jich je platných pouze 151. Takhle je to i v ostatních souborech jen s tím rozdílem, že nezačínají od začátku, ale od daného čísla jak je vidíte v tabulce. Zde bych právě proto stanovila náš první zásadní problém. Je nutné ručně vytřídit nepotřebná data a ponechat pouze jeden soubor, ve kterém bude uloženo 6541 záznamů, tak aby doplňovali původní databázi v MS Excel (nyní v SQL). Jako druhou variantu řešení tohoto problému jsme zvolili kontaktování osoby, která tento výpis databáze v MS Word, měla původně spravovat. Data jsme z původních pěti souborů vytřídili do jednoho souboru ve formátu MS Word. S tou to platformou se dále špatně pracuje, a proto jsme se rozhodli převést data do manipulačně příjemnějšího rozhraní. A to do MS Excel. Bohužel ani toto rozhodnutí se nezdálo být správné. Protože přetvořit bezmála sedm tisíc řádků je pro nás nemožné ručně. A opět jsme nebyli vybaveni programem či systémem, který by nám tento problém převedl do požadovaného formátu. Postup v bodech: - Chotkovska_databaze.xls přesunuta do MySQL Serveru pomocí konvertovacího programu SQL Convertor - Třídění dat v souborech ve formátu MS Word do jednoho souboru - Rozdělení sloupce Autor na sloupce Jméno a Příjmení pomocí SQL příkazů - Překlopení dat z SQL databáze do systému Clavius 7

1.5 Reálný harmonogram řešení projektu Datum Popis práce Počet hodin 4.3.11 Zadání práce a schůzka se zadavatelem 3 9.3.11 Shrnutí, rozdělení a upřesnění práce 4 16.3.11 Týmová porada a sjednocení nápadů, podkladů 2 23.3.11 Technická dokumentace řešení projektu 3 30.3.11 Miniseminář k problematice řešeného projektu 1,5 8.4.11 Týmová porada a konverze MS Excel do SQL 2 4.5.11 Kontrolní den projektu + konzultace s vedoucím 1,5 4.5.11 Technická dokumentace řešení projektu 2 4.5.11 Převod dat MS Word do SQL / neúspěšný pokus 2,5 11.5.11 Odevzdání konečné verze 1,5 Průběžně Individuální řešení problémů každý člen 3 1.6 Jmenovitý podíl jednotlivých členů týmu na řešení projektu Thomas Ignatyev - Analýza projektu, rozdělení úkolů, vymezení problémů, dohled a komunikace v týmu, kontrola práce. Martin Hadrava - Technické řešení projektu, manipulace a přepracování dat v SQL. Matyáš Málek - Překlopení dat do SQL, řešení vzniklých problémů Natasha Goncharova - UseCase diagram, překlopení dat do SQL a vyhledávání dat, formátů Klára Husáková - Zpracování technické dokumentace, plánování - harmonogram, podpora vedoucího týmu. 1.7 Problémy, s nimiž se tým setkal při řešení projektu - Nefunkční SQL Server - Data v MS Word jsou rozdělena do 6 částí, potřebná data v MS Word jsou doplněna o tisíce zbytečných záznamů, nutnost ručního vytřídění důležitých dat velká časová ztráta. - Seskupení data z MS Excel a MS Word (nelze konvertovat z jednoho do druhého) momentálně hledáme řešení. - Nekompatibilní formáty dat z SQL k překlopení do systému Clavius 8

1.8 Přínos projektu pro členy týmu V tomto projektu byl zásadní problém překlopení dat, ten jsme bohužel nesplnili. Ale jako kladnou stránku projektu bych uvedla zkušenost v hledání dat, shromažďování a třídění podstatných údajů. Dále bych zmínila jako velmi příjemnou zkušenost práci v týmu. Komunikace ze začátku vázla, ale po jednom sezení nebyl žádný problém mezi sebou komunikovat, předávat si vytvořené úkoly a dále s nimi pracovat. Jako zajímavost bych uvedla návštěvu zámku Kačina, ve kterém působí Knihovna národního zemědělského muzea. Tato návštěva byla pro nás zdrojem informací, příjemného pobytu a ukázkou toho, jak vše v knihovnictví funguje. Jako negativní část bych ještě jednou zmínila naši technickou neznalost, při překlápění dat do systému. Chyběly nám zásadní potřebné informace o systému Clavius a o jeho podporovaných formátech. Pro příště bychom se snažili si sestavit harmonogram projektu více reálněji. Jak je vidět v dokumentaci, náš původní harmonogram se podstatně liší od harmonogramu reálného. A proto bychom si vyhradili na dané úkoly více času, abychom měli více možností řešení, pokud by jedna selhala. 9