Kooperační systém článkové bibliografie a aplikace pro upload, zpracování a export dat z aplikace. Import dat do ANL/Aleph Server anl. nkp.cz (http://anl.nkp.cz:2100/r/skk/p210/p10init) slouží pro upload dat od spolupracujících institucí v rámci Kooperačního systému článkové bibliografie, pro jejich zpracování, správu a export z báze ANL/SKA. Exportovaná data se importují do ANL/Aleph mimo server anl.nkp.cz. Výsledkem kooperace je báze ANL - http://aleph.nkp.cz/f/?func=file&file_name=findb&local_base=anl, která obsahuje články a statě z dohodnutých titulů v rámci kooperace (viz též níže). Některé knihovny zasílají do ANL veškerou zpracovanou článkovou produkci, některé zpracovávají pro vlastní potřebu ještě další tituly. Záznamy z těchto titulů jsou obsaženy v příslušných katalozích a databázích. Měsíčně vycházejí NOVINKY České národní bibliografie - Články v novinách, časopisech a sbornících - http://www.nkp.cz/pages/page.php3?page=fond_novcnb_uvod.htm. 1
2
Hodnocení báze ANL knihovnickou veřejností a dalšími je na adrese 3
ANL, kooperace hodnocení http://www.nkp.cz/pages/oazp_anl_hodnoceni.pdf ANL, kooperace hodnocení. Pokračování 1 http://www.nkp.cz/pages/oazp_anl_hodnoceni_pokrac1.pdf ANL, kooperace hodnocení. Pokračování 2 http://www.nkp.cz/pages/oazp_anl_hodnoceni_pokrac2.pdf A. Historie do r. 2007/2008 Server byl vyvinut v rámci programového projektu Souborná databáze Kooperačního systému článkové bibliografie - optimalizace integrace a správy heterogenních dat (2000-2004) - http://www.nkp.cz/pages/page.php3?page=oazp_granty.htm http://www.isvav.cz/projectdetail.do?rowid=kz00p02olk011 a výzkumného záměru Projekt propojení analytických záznamů s plnými texty a optimalizace zpřístupnění k plným textům (1999-2003) - http://www.nkp.cz/pages/page.php3?page=oazp_granty.htm http://www.isvav.cz/researchplandetail.do?rowid=mk0cez99f2003. Interface pro Management kooperačního systému je též na serveru full.nkp.cz. Zahrnuje kromě aplikace na serveru anl.nkp. cz (která je popsána níže) i linky zpracování bibliografických záznam z plných textů (lokální a internetová verze) na serveru full.nkp.cz, ve kterých byly zpracovávány bibliografické záznamy pro bázi ANL a zároveň semistrukturované plné texty pro bázi ANL FULL. Schéma Managementu kooperačního systému kooperace kocem r. 2004 4
Interface pro MNG kooperačního systému na serveru http://full.nkp.cz je v Příloze 2. 2. Vývoj serveru od r. 2005 je na http://full.nkp.cz/nkdb/docs/anl_sprav.htm. 3. Kooperační systém článkové bibliografie KOSABI. Skupina ANL, seminář, Praha, NKČR, 17.12.2007, aktualizace květen 2008 - ppt verze http://full.nkp.cz/nkdb/docs/anl_07.ppt. Kooperační systém článkové bibliografie stručný vývoj, stav v r 2008 a perspektivy - html verze http://www.ikaros.cz/kooperacni-system-clankove-bibliografie-strucny-vyvoj-stav-v-r-2008-aperspektivy. 4. Materiály o kooperaci jsou vystaveny na adrese http://www.nkp.cz/pages/page.php3?page=oazp_kooperace.htm. 5. Stanovisko vedoucí oddělení analytického zpracování ke zrušení oddělení je vystaveno v materiálu Oddělené analytického zpracování a jeho perspektivy v NKČR http://www.nkp.cz/pages/page.php3?page=oazp_anl_ruseni.htm. 6. Poznámka k uploadu/importu (do pomocné báze ANL/SKA ) Jak spolupracovat v rámci Kooperačního systému článkové bibliografie (KOSABI) http://anl.nkp.cz:2100/docanl/pozn_upl.htm. 5
B. HW a SW - stav serveru anl.nkp.cz v r. 2011 HW a SW vybavení serveru v současné době: HW V současné době je server anl.nkp.cz převeden do jednotného serverového prostředí NK Vmware vsphere 4. Konfigurace dohledového systému - https://dohled.nkp.cz. Dle zprávy z 10.2. 2010 se kontroluje: - stroj: 195.113.132.82 - protokol: HTTP - port: 2100 - cílové URL: /r/skk/p210/p10init - řetězec na cílovém URL: KOSABI SW Operační systém: CentOs 4.3 Database: Oracle Express Edition Aplikační server: Apache-tomcat-6.0.16 Programovací jazyky: C, Java, Oracle PL/SQL Veškerý software je zdarma bez jakýchkoliv licenčních poplatků. O správu stávající databáze uploadovaných záznamů a aplikace pro management Kooperačního systému článkové bibliografie se stará externí pracovník. C. Jak kooperovat, standardy a jiné konvence, stručný přehled příjmu, zpracování dat v aplikaci, export dat z aplikace a import do ANL/Aleph (materiál) Podrobněji viz bod D. Materiál je vystaven pod názvem Poznámka k uploadu/importu (do pomocné báze ANL/SKA ) Jak spolupracovat v rámci Kooperačního systému článkové bibliografie (KOSABI) http://anl.nkp.cz:2100/docanl/pozn_upl.htm Přistupující knihovny kontaktují koordinátorku kooperačního systému (Ivana Anděrová, NKČR, ivana.anderova@nkp.cz ) Následuje dohoda o titulech, které je třeba v rámci kooperace zpracovávat. 6
Titulová základna viz materiály: Aktuálně zpracovávané tituly (cca aktuální rok): Statistika zpracovávaných titulů v Kooperačním systému článkové bibliografie - stav k 1.10.2010 a navazující aktualizace (v mezidobí, než jsou tituly zanesené do aktuálního seznamu titulů) http://full.nkp.cz/nkdb/docs/titstat.htm Aktuální seznam titulů analyticky zpracovávaných v Národní knihovně ČR v rámci kooperace (s kategoriemi titulů) http://www.nkp.cz/pages/page.php3?page=oazp_seznam_oaz.htm Aktuální seznam titulů analyticky zpracovávaných v kooperujících institucích (kromě NKČR) (s kategoriemi titulů) http://www.nkp.cz/pages/page.php3?page=oazp_kooper_svk.htm Tituly zpracovávané od r. 1991: Seznam zpracovávaných titulů (kompletní) a titulů zpracovaných v minulosti (cca) v NKČR od r. zpracování 1991 http://full.nkp.cz/nkdb/docs/oazp_nk1.htm Seznam zpracovávaných titulů a titulů zpracovaných v minulosti v kooperujících institucích - krajské knihovny a MZK v Brně (od r. zpracování cca 1992) http://full.nkp.cz/nkdb/docs/regio_uplnost.htm Seznam zpracovávaných titulů a titulů zpracovaných v minulosti v odborných institucích (od r. zpracování cca 1992) http://full.nkp.cz/nkdb/docs/odb_uplnost.htm Poznámka ke zpracovávaným titulům, aktualizaci excerpční základny, vývoji Kooperačního sytému článkové bibliografie a stavu kooperace Zaslání zkušebního souboru nejprve mailem koordinátorce kooperačního systému. Ta soubor prověří a uploaduje data zkušebně sama. Pokud soubor projde, přidělí programátor příslušné instituci heslo, jméno. Pokud ne, je třeba zjišťovat proč. Jméno a heslo - přidělení hesla spolupracujícím institucím dle kódu a formátu dat, ve kterém budou posílat záznamy (jméno tvoří sigla velkými písmeny bez mezer). V případě potřeby může příslušná knihovna operativně nastavit potřebný kód a formát dat z nabídky sama. Podporované knihovnické formáty a standardy v aplikaci: 7
Hlavní formáty: MARC 21 a UNIMARC, další (VF aj.) AACR2 ISBD MDT / Konspekt Minimální záznam pro soubornou databázi FRBR v budoucnu Národní autority. Nejdůležitější standardy na WWW: Záznam pro soubornou databázi : VF. Fyzicky nesamostatné části dokumentu. Tištěné monografie a seriály. 1999 http://www.nkp.cz/pages/page.php3?page=fond_ann_vf_opr.htm Záznam pro soubornou databázi : UNIMARC. Fyzicky nesamostatné části dokumentu. Tištěné monografie a seriály. 1999 http://www.nkp.cz/pages/page.php3?page=fond_anal_unim_opr.htm Záznam pro soubornou databázi : MARC 21. Fyzicky nesamostatné části dokumentu. Tištěné monografie a seriály. 2004. Schválený materiál skupinou pro analytické zpracování http://full.nkp.cz/nkdb/docs/mini2_anl_m21.htm Záznam pro soubornou databázi : MARC 21. Fyzicky nesamostatné části dokumentu. Tištěné monografie a seriály. 2005. Graficky upravený materiál z r. 2004, opravy, doplňky k přílohám http://www.nkp.cz/pages/page.php3?page=oazp_marc_tist_anl.htm Metodika pro popis článků ve formátu MARC 21 http://www.nkp.cz/pages/page.php3?page=oazp_metodika21.htm Metodika popisu článků ve formátu UNIMARC http://www.nkp.cz/pages/page.php3?page=oazp_popis1.htm Národní autority - portál http://autority.nkp.cz/ Předmětové selekční jazyky - kódovník - formát - UNIMARC/MARC 21 http://www.nkp.cz/pages/page.php3?page=fond_kodovnik.htm MDT http://aip.nkp.cz/mdt/ Konspekt http://www.nkp.cz/pages/page.php3?page=fond_predmetovekategorie_10.htm Příjem, zpracování a export data z aplikace na anl.nkp.cz. 8
Upload předávání dat do kooperačního systému Nápověda http://anl.nkp.cz:2100/docanl/odeslani_souboru_koo.htm Vstup do aplikace pro upload pod loginem a heslem je na Upload předávání dat do kooperačního systému Registrace http://anl.nkp.cz:2100/r/skk/p210/p10init Přejmenování uploadovaných záznamů Spolupracující knihovna nemusí pojmenovat soubor ve stanovené struktuře pro souborný katalog. Systém sám přejmenuje uploadované soubory do jednotné struktury dle příslušného formátu a kódu. Pokud, po dohodě se správcem, instituce uploaduje opravený soubor, je třeba připojit k původně značenému souboru řetezec opr a číslo opravy, pokud je opravovaný soubor několikrát, např. h703opr2. Doporučujeme značit soubory krátkými názvy tak, aby s případnou opravou měly délku na 10 pozic. Zkušebni soubory je možno nazvat pokus, zkouska. Následuji ladění dat tak, aby bylo možno je naimportovat do báze ANL a/nebo je zpřístupnit v JIB. Po vzájemné dohodě je možno záznamy uploadovat pravidelně. Statistiky záznamů a chyb pro jednotlivé knihovny Počet uploadovaných záznamů, počet chyb - chybové hlášky jsou přístupné pro každou knihovnu pod příslušným login a heslem a pro administrátora u příslušných dávek na Import - statistiky Registrace http://anl.nkp.cz:2100/r/skk/p210/p10init.. Statistiky se třeba doladit (z 97 procent hotovy). V mnohých případech jsou však dány možnostmi SW a možnostmi zápisu, nikoli chybou katalogizátora. BOA001 pracuje přímo v souborné databázi ANL. U každé dávky je statistika chyb: Identifikace chyby po kliknutí na siglu: 9
po výrazu Test: následuje označení pole (TAG), označení podpole (SUB), indikátoru apod. s příslušným výrazem vysvětlující chybu. Kritické chyby (tj. absence údajů minimálního záznamu) jsou označeny hláškou crerr. Opravy dat Méně závažné chyby nebo naopak chyby, které jsou "způsobené" příslušným SW jsou opravovány správcem aplikace před exportem z aplikace a importem do ANL. Pokud jsou chyby systematické nebo závažnější, jsou opraveny po dohodě s příslušnou institucí, která opravený soubor zašle znovu (pojmenování souborů viz dříve). Další opravy chyby a validace oproti souborům autorit je prováděna pracovníky oddělení přímo v bázi ANL. Některé chyby, na které si je třeba dát pozor (analogie jako pro Souborný katalog ČR viz http://:www.caslin.cz ): Povolená pole, podpole Numerická pole MARC 21/UNIMARC národní pole 9XX jediné písmenné pole - návěští LDR (resp. 000 nebo lab). a) Numerická pole UNIMARC 0 - Blok identifikačních čísel 10
http://www.nkp.cz/pages/oazp_popis1.htm#0 - BLOK IDENTIFIKAČNÍCH MARC 21 4. 1 Pole 0XX http://www.nkp.cz/pages/page.php3?page=oazp_metodika210xx.htm Identifikační čísla a čísla ČNB Identifikační čísla záznamů by měl být jedinečná (pole 001). DB ANL musí být v tomto směru přečíslována. V bázi zatím nejsou čísla ČNB (pole 015). UNIMARC Viz 0 - Blok identifikačních čísel http://www.nkp.cz/pages/oazp_popis1.htm#0 - BLOK IDENTIFIKAČNÍCH MARC 21 Viz 4. 1 Pole 0XX http://www.nkp.cz/pages/page.php3?page=oazp_metodika210xx.htm b) Národní pole 9XX UNIMARC/MARC 21 4.7 Pole 9XX http://www.nkp.cz/pages/page.php3?page=oazp_metodika219xx.htm http://www.nkp.cz/pages/page.php3?page=fond_inf.htm Poznámka: v materiálech jsou nadefinovány pro anl. popis pomocná pole 9XX i pro různé typy názvů, používají se hlavně v NKCR. Perspektivně se pravděpodobně se z 9XX budou používat jen pole pro autory, pro všechny názvy se budou používat standardní pole. c) Písmenná pole Návěští (leader/label) V řádkovém formátu označeno jako pole LDR, lab nebo 000. Před importem se sjednocuje na LDR. UNIMARC Viz 0 - Blok identifikačních čísel http://www.nkp.cz/pages/oazp_popis1.htm#0 - BLOK IDENTIFIKAČNÍCH MARC 21 Viz 4. 1 Pole 0XX http://www.nkp.cz/pages/page.php3?page=oazp_metodika210xx.htm Př: UNIMARC: LDR -----naa^^22-----^^^450^ MARC21: LDR -----naa-a22--------4500 4.8. Písmenná pole v NKČR http://www.nkp.cz/pages/page.php3?page=oazp_metodika21pismenna.htm Vzhledem k integraci elektronických zdrojů je v NKČR zavedeno pole PSP s kódy ON a OF (pro online a offline zdroje) - 11
MARC 21 Příloha 6 - Analytický popis elektronických zdrojů http://www.nkp.cz/pages/page.php3?page=oazp_metodika21_elz.htm. d) Neobsazené pozice a výplňové znaky UNIMARC Pro neobsazené pozice přípustné používání mezery, "stříšky" pro pevnou mezeru i spojovníku (nikoli však znaku #, který je v manuálech z typografických důvodů symbolem pro mezeru). Při konverzi do MARC21 jsou uvedené znaky převáděny na spojovník. V poli 100 musí být vyplněny minimálně : datum založení záznamu, kód data (publikační status), datum/data vydání, jazyk katalogizace, kód modifikace záznamu, kódy pro znakové sady. Viz 1-- Blok kódovaných informací http://www.nkp.cz/pages/oazp_popis1.htm#1-- BLOK KÓDOVANÝCH MARC 21 Pro neobsazené pozice se používá spojovník. Přípustná je i mezera, která je před importem nahrazena spojovníkem. V poli 008 musí být vyplněny minimálně údaje: datum založení záznamu, kód data (publikační status), datum/data vydání, kód země vydání, kód jazyka vydání, kód modifikace záznamu. Viz 4. 1 Pole 0XX http://www.nkp.cz/pages/page.php3?page=oazp_metodika210xx.htm Výplňový znak Jako skutečný "výplňový znak" v kódovaných údajích - na příslušných nepovinných pozicích dle manuálů UNIMARC i MARC21 - má být použit znak. Pokud knihovna tyto údaje nevyplňuje, je přípustný též spojovník. Př: UNIMARC 100 20030217d2003^^^^u^^y0czey0103^^^^ba 100 $a20040106j20030526u^^y0czey0103^^^^ba MARC 21 008 070703s2007----xr------------------cze-- 008 070703e20070405xr------------------cze-- e) Nová pole zavedená v ANL pro elektronické zdroje Použití pole 006 v analytickém popisu bude specifikováno tak, jak bude prakticky odzkoušeno Zatím stanoveno pole 007 pro popis textových článků z online a ofline zdrojů MARC 21 12
006 m f d??????? 006 m----f---d--------?????? 007 co g pro offline popisované články 007 co--g- pro offline popisované články 007 cr cn pro online popisované články 007 cr-cn- pro online popisované články Viz 4. 1 Pole 0XX http://www.nkp.cz/pages/page.php3?page=oazp_metodika210xx.htm Viz Příloha 6 - Analytický popis elektronických zdrojů http://www.nkp.cz/pages/page.php3?page=oazp_metodika21_elz.htm UNIMARC??? bude doplněno f) Elektronické zdroje Pole 856 pro propojení na elektronické zdroje/elektronické verze tištěných dokumentů Pro elektronické zdroje byla též vypracována typologie údajů pro možné použití v poli 856 viz Pole 856 - typologie http://www.nkp.cz/pages/page.php3?page=oazp_metodika21856.htm UNIMARC Viz 8-- Blok zdrojových informací http://www.nkp.cz/pages/oazp_popis1.htm#8-- BLOK ZDROJOVÝCH MARC 21 Viz 4.6 Pole 8XX http://www.nkp.cz/pages/page.php3?page=oazp_metodika218xx.htm Viz Příloha 6 - Analytický popis elektronických zdrojů http://www.nkp.cz/pages/page.php3?page=oazp_metodika21_elz.htm g) Označování znaků vyřazených z řazení Z řazení jsou vylučovány gramatické členy u selekčních prvků. tedy neužívat např. u podnázvu, poznámkách. UNIMARC Používají se dvojité špičaté závorky << >>, v nichž by měl být obsažen člen i případná mezera za ním. Jsou přípustné i standardní oddělovače - ł, ë. Pokud systém používá jiné znaky, je třeba je na exportu převést na << >>. Viz 3. Pravidla popisu http://www.nkp.cz/pages/oazp_popis1.htm#3. PRAVIDLA POPISU 13
Viz Dotazy ke katalogizaci: 511 http://katdotaz.nkp.cz/zobraz.phtml?id=511 478 http://katdotaz.nkp.cz/zobraz.phtml?id=478 MARC 21 Používá se 2. indikátor, kde se uvádí počet znaků vyloučených z řazení (245). V polích, kde není tato možnost, se výjimečně použije zápis jako v UNIMARCu - dvojité špičaté závorky << >> (např. <<ze >>Žerotína). U unifikovaných názvů se úvodní mluvnický člen vynechává (pole 130, 240,243, 730, 830) viz AACR2R 25.2C1. Dále se člen nepoužívá a pole 243, 246 dále pak u všech polí, kde se název uvádí v podpoli t. Pole, kde se používá 2. indikátor k vyřazení mluvnických členů z řazení: 245. Viz Dotazy ke katalogizaci: 511 http://katdotaz.nkp.cz/zobraz.phtml?id=511 478 http://katdotaz.nkp.cz/zobraz.phtml?id=478 h) Zápis iniciál V selekčních údajích a/nebo autoritních tvarech se zapisují iniciály s mezerami. V popisných údajích, např. údajích o odpovědnosti se zapisují bez mezer. 514 - http://katdotaz.nkp.cz/zobraz.phtml?id=514 11 - http://katdotaz.nkp.cz/zobraz.phtml?id=11 49 - http://katdotaz.nkp.cz/zobraz.phtml?id=49 ch) Číselné údaje, číslice, číslovky Zápis bez mezer: 11.1.1996-22.3.1996 Zápis s mezerami: 21. ledna 1996-22. března 1996 (číslovky v kombinaci se slovními výrazy) Římské číslovky se nahrazují arabskými v těchto oblastech/údajích popisu: označení vydání, datum vydání, v oblasti údajů o číslování, v oblasti fyzického popisu. Pokud by náhradou římských číslic utrpěla srozumitelnost, užívají se římské číslovky. MARC 21/UNIMARC Př.: Roč. 10, č. 11, s. vii-viii Př.: 14
Roč. 10, č. 11, s. ii, VII (jeden článek se vyskytuje na takto označených stranách) i) Údaje o číslování a datum vydání v podpoli 773$q, $9 Podpole Marc 21 773 $q, $9 byla zavedena pro řazení zdrojového dokumentu v rejstříkách, pro vyhledávání dle těchto údajů eventuelně pro propojování přes tyto údaje - 4.5. Pole 7XX http://www.nkp.cz/pages/page.php3?page=oazp_metodika217xx.htm j) Autoritní záhlaví, čísla autority, kódy czenas Záznamy pro soubornou DB ANL nemají obsahovat čísla lokální autority. Měla by být příslušnými knihovnami odstraněna a nahrazena čísly národních autorit, pokud existují, v opačném případě lokální čísla odstranit. Podpole pro číslo národní (Marc 21 podpole 7, UNIMARC podpole 3) jsou součástí národních autorit personálních a korporativních. U názvových autorit (autor-název, unifikovaný název) číslo autority neobsahují. Věcná hesla (předmět, geografické heslo, formální deskriptor) se uvádí v MARCu v podpoli 2 a v UNIMARCu v podpoli 9 kód czenas. k) Propojování analytických záznamů na jednotky/jiné záznamy V NKČR přes interní pole Aleph LKR - 4.8. Písmenná pole http://www.nkp.cz/pages/page.php3?page=oazp_metodika21pismenna.htm. Sytém Clavius - pole 993. Elektronické zdroje - viz výše. V budoucnu hypoteticky možné propojení přes pole 7XX - 4.5. Pole 7XX http://www.nkp.cz/pages/page.php3?page=oazp_metodika217xx.htm. Vážení záznamů v současné době se váhy v ANL neužívají Dle kvality věcného popisu jsou nastaveny "váhy" v konverzi (je třeba je odstranit). (Protože záznamy většinou splňují podmínky minimálního záznamu, byly záznamy odlišeny na základě kvality věcného popisu). VAH 12 - pouze minimální záznam 15
VAH 14 - klíčová slova, předmětová hesla ne dle národních autorit ani jiných odborných heslářů VAH 16 - klíčová slova, předmětová hesla částečně dle národních autorit VAH 18 - klíčová slova, předmětová hesla dle národních autorit, event. anglické ekvivalenty, event. oborové hesláře, event. resumé česky, anglicky VAH 20 - jako VAH 18 plus předmětová hesla dle oborových heslářů a jejich ekvivalenty). Volně přístupné statistiky uploadovaných záznamů - statistiky všech uploadu a importů do báze ANL/SKA - Upload/import dat - statistiky - http://anl.nkp.cz:2100/r/skk/p270/pstatska?ctx_outenc=utf&ctx_inenc=utf&ctx_jvm=int &ctx_connid=2109244304&ctx_outlang=cz&ctx_gz=no Tabulka je dynamicky generovaná a zohledňuje všechny akce týkající se uploadu a importů do báze ANL/SKA. Tato tabulka vypovídá o počtech záznamů, které se "pohybovaly" v aplikaci a bázi ANL/SKA za různým účelem (jeden soubor se mohl vzhledem např. k jeho opravám uploadovat několikrát). Podrobně viz bod D. Následuje export dat do adresáře anl (k opravám aj. účelům) nebo do adresáře OA500 pro soubornou bibliografickou bázi ANL/Aleph viz Export statistiky volně přístupné - v současné době mimo provoz http://anl.nkp.cz:2100/r/skk/p270/pstatexport?ctx_outenc=utf&ctx_inenc=utf& ctx_jvm=int&ctx_connid=2133010602&ctx_outlang=cz&ctx_gz=no Export je ve dvou formátech: UNIMARC, MARC 21. 16
Import do ANL/Aleph vně serveru anl.nkp.cz Mimo aplikaci anl.nkp.cz probíhá u záznamů v UNIMARCu do MARCu 21 přes program MarcMan. Záznamy v MARC 21 se importují rovnou. Statistiky importů do báze ANL vede koordinátorka k.s. viz Statistiky importů do báze ANL http://anl.nkp.cz:2100/docanl/stat_imp.htm. Zpřístupňování záznamů vzniklých v rámci kooperačního systému článků: přes bázi ANL http://anl.nkp.cz:2100/docanl/stat_imp.htm NOVINKY České národní bibliografie - Články v novinách, časopisech a sbornících - http://www.nkp.cz/pages/page.php3?page=fond_novcnb_uvod.htm lokální databáze spolupracujících institucí JIB http://www.jib.cz/v?rn=462900171 Oborové brány http://info.jib.cz/ Stahování záznamů by mělo být možné i přes JIB a Z39.50 http://sigma.nkp.cz/web/z39_nk_cze.htm. D. Aplikace na serveru anl. nkp.cz v r. 2011 a navazující aplikace podrobně, perspektivy I. Stav aplikací běžících na serveru anl.nkp.cz v r. 2011 a navazující aplikace Upload, zpracování a export záznamů na serveru anl.nkp.cz před importem do Alephu probíhá ve dvou dílčích částech na na sebe navazujících 1. Aplikace na serveru anl.nkp.cz 2. Aplikace vytvořená pro import do ANL/Aleph vně aplikace 1. Aplikace na serveru anl.nkp.cz 17
Podrobně popsáno níže v bodě D 1. Aplikace na severu anl.nkp.cz v bodech: 1.2.1 Upload 1.2.2 Import do db ANL/SKA Oracle, globální úpravy I, konverze, testy statistiky 1.2.3 Export, globální úpravy II. 1.2.4 Administrace 1.2.5 Dávky na LeechFTP. Opravy na PC 1.2.6 Odeslání mailu pro spuštění importu do ALEPHu 2. Aplikace vytvořená pro import do ANL/Aleph vně aplikace Navazuje na předchozí aplikaci. 18
a) Soubory UNIMARC (označené aiu ) procházejí konverzí do MARC 21 (konvertor MarcMan) b) Soubory MARC 21 se importují rovnou (označené aim ) c) Import do ANL/Aleph 2.1 Soubory označené aiu (v UNIMARCu) 1. Aplikace na serveru anl.nkp.cz 1.1 Aplikace pro bázi titulů v současné době se nepoužívá (na další vývoj nejsou finance) Báze Titulů zobrazení (stará verze - t. 2004) Báze Titulů zobrazení (nová verze, experiment, ladí se a je postupně plněna - r. 2007) Báze Titulů statistiky (nová verze, experiment, ladí se - r. 2007) 1.2 Aplikace pro příjem (upload) dat, import do báze ANL/SKA, zpracování dat před importem do Alephu, kontrolu a modifikaci dat, statistiky Nabídky: 1.2.1 Upload Upload předávání dat do kooperačního systému - nápověda - http://anl.nkp.cz:2100/docanl/odeslani_souboru_koo.htm Upload předávání dat do kooperačního systému. Registrace (jméno, heslo) http://anl.nkp.cz:2100/r/skk/p210/p10init Uživatelské jméno je sigla instituce (velká písmena, bez mezer). Každé knihovně je přiděleno heslo, dle kterého je defaultně nastaven formát i kód. Knihovny si také dle momentální potřeby mohou zvolit formát i kód. 19
K dispozici jsou v současné době tyto formáty: K dispozici jsou v současné době tyto kódy: 20
1.2.2 Import do báze ANL/SKA (Oracle) Pro import do báze ANL/SKA je třeba se zaregistrovat. Při zpracování vstupních dat aplikací při importu do báze ANL/SKA (Oracle) probíhají následující procesy: Konverze struktury dat (do formátu Aleph) Import statistiky. Registrace (jméno, heslo, statistiky uploadů pro každou knihovnu celkem i jednotlivé dávky detailně) http://anl.nkp.cz:2100/r/skk/p210/p10init Přípustné přijímané kódy a formáty - viz bod 1.2.1 Konvence značení souborů: uživatelé nemusí užívat předepsanou složitou konvenci (viz Minimální záznamy). Aplikace sama soubory přejmenuje. Knihovny přispívají jednou do měsíce (uzus, který lze změnit dle potřeby). Zpracování vstupních dat aplikací při importu do báze ANL/SKA Konverze struktury dat (do formátu Aleph) Globální úpravy I.: Nahrazení znaku pro "tvrdé mezery" znakem SPACE Úprava Sigla ( malá->velká písmena, vynecháni mezer) 21
Úprava Label Úprava indikátorů (písmeno O/o -> num 0, písmeno l -> num 1) Test UNIMARC (kontrola polí, indikátorů, závislostí) Test MARC 21 (kontrola polí, indikátorů, závislostí) Test na kritické chyby crerr (testuje přítomnost povinných polí) Přidělení váhy záznamu Překódování do UTF-8 Kontrola na duplicity dle klíčů v rámci báze ANL/SKA Uložení dat do báze ANL/SKA Výsledky zpracování uloženy do tabulky pro statistiky Import statistiky. Registrace (jméno, heslo, statistiky uploadů pro každou knihovnu celkem i jednotlivé dávky detailně) Statistiky uploadů pro každou knihovnu celkem Pozn.: koordinátorka k.s. má přístup ke všem dávkám 22
Jednotlivé dávky detailně LST seznam zpracovaných článků hypertextově aktivních, po kliknutí se zobrazí záznam, modře zvýrazněn název článku, v jehož záznamu je chyba 23
3795 (číslo dávky) 24
Po kliknutí na siglu se objeví názvy chybných záznamů, které jsou propojeny se záznamy Pozn.: některé hlášky je třeba odladit (vzniklé částečně např. změnami v zápise apod. zde např. hláška o 773 g záznam je z tohoto pohledu pořádku), chyba je správně určena jen v 1. hlášce Pozn: některé chyby edituje v souborech koordinátorka k.s. mimo aplikaci (odstranění nadbytečných údajů v poli 773 d, některé nové chyby vyplývající ze nového zápisu a z hlášek o chybách). Spolupracující knihovny si mohou chyby opravit ve svých databázích dle příslušných hlášek. Pokud, po dohodě se správcem, instituce uploaduje opravený soubor, je třeba připojit k původně značenému souboru řetezec opr a číslo opravy, pokud je opravovaný soubor několikrát, např. h703opr2. Doporučujeme značit soubory krátkými názvy tak, aby s případnou opravou měly délku na 10 pozic. Zkušebni soubory je možno nazvat pokus, zkouska. Upload/import dat statistiky volně přístupné (přehled počtu uploadů ) 25
http://anl.nkp.cz:2100/r/skk/p270/pstatska?ctx_outenc=utf&ctx_inenc=utf&ctx_jvm=int &ctx_connid=2094807964&ctx_outlang=cz&ctx_gz=no Tabulka je dynamicky generovaná a zohledňuje všechny akce týkající se uploadu a importů do báze ANL/SKA. Tato tabulka vypovídá o počtech záznamů, které se "pohybovaly" v aplikaci a bázi ANL/SKA za různým účelem (jeden soubor se mohl vzhledem např. k jeho opravám uploadovat několikrát). V tabulce jsou uvedeny uploady za aktuální rok. Počet dávek zahrnuje všechny dávky do báze ANL/SKA úspěšné i neúspěšné, tj. které neprošly. Počet zaslaných záznamů uploadem zahrnuje všechny uploadované záznamy i ty, které nemohly být naimportovány, tj. byly narušeny. Počet importovaných záznamů celkem do báze ANL/SKA nezahrnuje chybné záznamy, které neprošly uploadem a byly narušeny (špatný znak aj.), zahrnuje však chybné záznamy, které prošly. Počet chybných záznamů 1.2.3 Export dat Export provádí pouze koordinátorka k.s. 26
Export je možno provádět do dvou adresářů: Adresář pro soubory určené pro import do Alephu (OA500) nebo adresář (ANL) pro soubory určené k např. opravám (podadresář export, import) a k publikování dokumentů na www (podadresář doc) a další podadresáře určené k pracovním účelům. Tyto adresáře jsou přístupné přes administraci a též přes LeechFTP. Export se provádí ve dvou formátech: UNIMARC a MARC 21 27
Názvová konvence exportních souborů z aplikace na anl.nkp.cz V názvech souborů je automaticky zohledněno datum a zda se jedná o UNIMARC nebo MARC 21. Př: aim20110309_5281 Př: aiu20110310_5295 Globální opravy II. Na výstupu dochází ještě k vytváření polí FMT, LBL (dříve i ZAR, ZAZ) a k úpravě nebo potlačení některých polí, generování pomocného pole pro datum zdrojového dokumentu 461/463$9 v UNIMARCu, doplnění pole 856 o podpole y a 2. indikátor, doplnění PSP s kódu ON, OFF. Export statistiky volně přístupné (přehled exportů do adresáře k opravám a pro import do Alepnu) momentálně mimo funkci http://anl.nkp.cz:2100/r/skk/p210/p10init 1.2.4 Administrace Přístup pouze pro koordinátoku k.s. Z aplikací, které jsou v administraci, se v současné době používá aplikace: Klíče (každý záznam v pomocné bázi ANL/SKA má klíč, podle kterého lze zjistit duplicitu záznamu v bázi ANL/SKA) cca rok nazpět. 28
Podrobný popis klíčů - viz Příloha 1. Z adresářů se nejčastěji používají adresáře: OA500 - kde jsou soubory připravené pro import do Alephu. 29
KOSABI Admin. Registrace pouze Admin. http://anl.nkp.cz:2100/r/skk/p210/p10init Zobrazení exportovaných dat - dávek v adresáři pro Aleph OA500 pouze v administraci pro koordinátoru k.s. na serveru anl.nkp.cz Zobrazení jedné dávky 30
1.2.5 Zobrazení stejných dávek přes LeechFTP Stažení souborů k opravám z LeechFTP, opravy záznamů Soubory k opravám si může koordinátora k.s. stáhnout pomocí LeechFTP. Opravené soubory opět pomocí LeechFTP nandat. Podle výpisu u jednotlivých dávek může koordinátora k.s. opravit záznamy v příslušném editoru vně aplikace. 1.2.6 Odeslání mailu pro spuštění importu do ALEPHu Na základě mailu se stanovenou strukturou, který odešle koordinátora k.s. systému proběhne import souborů do ANL/ALEPH. 2. Konverze UNIMARCu do MARCu 21 Import do báze ANL/ALEPH (aplikace vyvinutá v NKČR) 2.1 Před importem do Alephu probíhá ještě konverze dat, které jsou v UNIMARCu, z UNIMARcu do M21, vně aplikace (momentálně jedna knihovna) přes program MarcMan na základě označeného souboru jako UNIMARC (aiu ). 31
2.2 Data, která jsou v MARC 21 pokračují bez konverze (označená aim ). 2.3 Import ANL/Aleph. O provedeném importu do ANL je zaslána správci mailem hláška. 3. Evidenci proběhlých importů u jednotlivých knihoven provádí koordinátorka k.s. sama (statistiky jsou od r. 1992). http://anl.nkp.cz:2100/docanl/stat_imp.htm. 32
4. Spolupracující instituce v Kooperačním systému článkové bibliografie V současné době přispívá pravidelně do báze ANL včetně NKČR: Národní knihovna ČR, odd. analytického zpracování - http://www.nkp.cz/pages/page.php3?nazev=clanky&submenu2=106 Národní knihovna ČR, Knihovnický institut - http://www.nkp.cz/pages/page.php3?nazev=clanky&submenu2=106 Ústav zemědělských a ekonomických informací - http://www.agronavigator.cz/ Národní pedagogická knihovna - http://www.uiv.cz/ Národní technická knihovna - http://www.techlib.cz/cs/ AVČR Archeologický ústav - http://www.arup.cas.cz/ Národní filmový archiv - http://www.nfa.cz/ Divadelní ústav - http://www.divadlo.cz/ Moravská zemská knihovna 33
Jihočeská vědecká knihovna v Českých Budějovicích - http://www.cbvk.cz/index1.html Studijní a vědecká knihovna v Hradci Králové - http://www.svkhk.cz/knihovna/ Středočeská vědecká krajská knihovna v Kladně - http://www.svkkl.cz/ Krajská knihovna Karlovy Vary - http://www.knihovna.kvary.cz/ Krajská vědecká knihovna v Liberci - http://www.kvkli.cz/ Vědecká knihovna v Olomouci - http://www.vkol.cz/ Moravskoslezská knihovna v Ostravě - http://www.svkos.cz/ Krajská knihovna v Pardubicích - http://www.knihovna-pardubice.cz/ Studijní a vědecká knihovna Plzeňského kraje - http://www.svkpl.cz/ Západočeská univerzita v Plzni - http://www.knihovna.zcu.cz/ Studijní a vědecká knihovna v Ústí nad Labem - http://www.svkul.cz/ Krajská knihovna F. Bartoše ve Zlíně - http://www.kfbz.cz/index.htm Stručný vývoj kooperace a přehledná tabulka kooperace dle institucí, stav kooperace Širší kooperace zahrnuje i Národní lékařskou knihovnu, která do báze ANL nepřispívá. Kooperace je založena na delimitaci zpracovávaných titulů r. 1992 - ověřovací kooperace (NK a některé regionální knihovny) r. 1993 - provoz systému, NK a postupně regionální knihovny r. 1994 - postupně přistupují specializované instituce Do r. 2004 se importovaly záznamy do ALEPHu ručně, v letech 2000-2004 vyvíjena aplikace pro upload záznamů, koncem r. 2004 ověřovací provoz aplikace upload, od r. 2005 provoz aplikace upload pro import záznamů do pomocné báze ANL/SKA, z ní se exportují záznamy do adresáře určeného pro import do ANL/ALEPH. Tabulka 1. Instituce, které přispívají do ANL, kontakty (P- provoz, OP- ověřovací provoz,t - oveřovací provoz na malém vzorku záznamů (test/experiment), J - jednání, PR - příprava, M - metodická spolupráce, K - kontakty) 34
Sigla Instituce Kooperace v Koopera. 2005 ce v r. ABA001 ABA003 ABA009 ABA012 ABA013 Národní knihovna ČR, odd. analytického zpracování Národní knihovna ČR, Knihovnický institut Ústav zemědělských a potravinářských informací Národní pedagogická knihovna Národní technická knihovna ABB001 AVČR Archeologický ústav P pouze 1. pololetí, 2. pololetí T, OP až P 2006 Kooperace v r. 2007, 2008 Kooperace v r. 2009 Kooperace v r. 2011 Poznámka upload do ANL SKA (a následný import do ANL) P P P M 21 ukládá do ANL/ALEPH, M21 P P P M 21 přímý import do ANL/ALEPH, M21 P P P M 21 ALEPH, upload do ANL/SKA, M21 T P P, přechod na MARC 21 P P P, přechod na MARC 21 P M 21 P M 21 KP Sys, upload do ANL/SKA, M21 ALEPH, upload do ANL/SKA, M21 P P M 21 ALEPH, upload do ANL/SKA..., malé dávky, M 21 ABB036 AVČR Historický ústav K K ISIS, nepřispívá ABC023 Knihovna ČGS PR K Clavius, zatím ABC135 ABC016 ABD003 Národní filmový archiv Ústav mezinárodních vztahů UK, Právnická fakulta OP až P nepřispívá P P P UNIMARC ARL. Upload do ANL/SKA... K, T K M21 Clavius, nepřispívá K K ALEPH, nepřispívá UK, Knihovna K K ALEPH, 35
TGM v Jinonicích ABE304 Divadelní ústav OP P UNIMARC/M 21 BOA001 Moravská zemská knihovna BOD031 CBA001 HBG001 HKA001 JIG001 KLG001 KVG001 MU Fakulta sociálních studií Jihočeská vědecká knihovna v Českých Budějovicích Krajská knihovna Vysočiny Studijní a vědecká knihovna v Hradci Králové Městská knihovna Jihlava Ministerstvo životního prostředí Středočeská vědecká krajská knihovna v Kladně Krajská knihovna Karlovy Vary KMG001 Knihovna Kroměřížska LIA001 OLA001 OSA001 Krajská vědecká knihovna v Liberci Vědecká knihovna v Olomouci Moravskoslezská knihovna v Ostravě nepřispívá KP Sys, upload do ANL/SKA P P P P M21 ukládá do ANL/ALEPH P P P, přechod na MARC 21 T OP ALEPH, upload do ANL/SKA poslední v r. 2007, M21 P M21 ARL, upload do ANL/SKA T až OP OP P P UNIMARC Clavius, upload do ANL/SKA. M21 P P P, přechod na MARC 21 K P M 21 ALEPH, upload do ANL/SKA, M21 Clavius nepřispívá T M 21 bude testování P P P, přechod P M21 ARL, upload na M21 do ANL/SKA, M21 P ALEPH, upload do ANL/SKA, M21 T T Clavius, odzkoušen upload P P P, přechod na M21 P M21 ARL, upload do ANL/SKA, M21 P P P P M21 ALEPH, upload do ANL/SKA P P P P UNIMARC Tinlib, resp. T-Series, přechod na M21 v r. 36
PAG001 PNA001 PND003 ULG001 ZLG001 Krajská knihovna v Pardubicích Studijní a vědecká knihovna Plzeňského kraje Západočeská univerzita v Plzni Studijní a vědecká knihovna v Ústí nad Labem Krajská knihovna F. Bartoše ve Zlíně 2009, upload do ANL/SKA, M21 T OP OP M21 ALEPH, upload do ANL/SKA, P P P, přechod na MARC 21 P M21 M21 ALEPH, upload do ANL/SKA, M21 M M ALEPH, upload do ANL/SKA, nepřispívá P P T, P Clavius T až OP OP T, OP MARC 21, přechod na M21 P M21 P M21 Clavius, upload do ANL/SKA, M21 KP WIN SQL, upload do ANL/SKA, M21 Anopress K jednání Ministerstvo životního prostředí T test (bude) SKAT K jednání Státní okresní K archiv Liberec Clavius, Vademekum nepřispívá Tabulka 2. Instituce, které jsou součástí kooperačního sytému článků, ale nepřispívají a nebudou přispívat (PP provoz) ABA008 Národní lékařská knihovna PP PP ALEPH/Medvik Tabulka 3. Instituce, které přebírají záznamy z ANL v rámci projektu ABD063 UK, Přírodovědecká projekt ALEPH 37
fakulta, Geografická knihovna Další, nově navázané kontakty na přelomu 2010/2011 na Kooperační systém článkové bibliografie - možnosti budoucí kooperace, upřesnění stávající kooperace. 1 - http://www.nkp.cz/pages/page.php3?page=oazp_anl_budouci_koop.htm V materiálu jsou zjištěny možnosti budoucí kooperace. V r. 2011 zahájila koordinátorka k.s. jednání o spolupráci se SKAT a Anopress. České články v JIB - http://www.jib.cz/v/5t4vksrl1imm9myr5tge1yun1n61milnhm83des9g2iafckh17-11075?func=find-db-1 Oborové brány - http://info.jib.cz/ 5. Excerpční základna: Kooperační systém článkové bibliografie a excerpční základna kooperačního systému - http://www.nkp.cz/pages/page.php3?page=oazp_kooperace.htm Aktuálně zpracovávané tituly (cca aktuální rok): Statistika zpracovávaných titulů v Kooperačním systému článkové bibliografie - stav k 1.10.2010 a navazující aktualizace (v mezidobí, než jsou tituly zanesené do aktuálního seznamu titulů) http://full.nkp.cz/nkdb/docs/titstat.htm Aktuální seznam titulů analyticky zpracovávaných v Národní knihovně ČR v rámci kooperace (s kategoriemi titulů) http://www.nkp.cz/pages/page.php3?page=oazp_seznam_oaz.htm Aktuální seznam titulů analyticky zpracovávaných v kooperujících institucích (kromě NKČR) (s kategoriemi titulů) http://www.nkp.cz/pages/page.php3?page=oazp_kooper_svk.htm Tituly zpracovávané od r. 1991: 38
Seznam zpracovávaných titulů (kompletní) a titulů zpracovaných v minulosti (cca) v NKČR od r. zpracování 1991 http://full.nkp.cz/nkdb/docs/oazp_nk1.htm Seznam zpracovávaných titulů a titulů zpracovaných v minulosti v kooperujících institucích - krajské knihovny a MZK v Brně (od r. zpracování cca 1992) http://full.nkp.cz/nkdb/docs/regio_uplnost.htm Seznam zpracovávaných titulů a titulů zpracovaných v minulosti v odborných institucích (od r. zpracování cca 1992) http://full.nkp.cz/nkdb/docs/odb_uplnost.htm II. Perspektivy 1. Je třeba vyladit chybové hlášky v UNIMARCu a MARCu 21 (z 97 % jsou hotovy). 2. Koordinátora k.s. vypracovala zadání pro eliminaci nadbytečných údajů z nakladatelských údajů v poli 773, které se v některých systémech stahují spolu s názvem periodika. Program je připraven, na ostrý provoz třeba otestovat. 3. Odstranit program pro přidělování VAH 4. Se zrušením Odd. analytického zpracování zadáno koordinátorce k.s. předat server anl.nkp.cz do UIT (Útvar informačních technologií NKČR). 5. Aplikace dle rozhodnutí ZONF (Zpracování a ochrana novodobých fondů) má být převedena pravděpodobně pod Souborný katalog. 6. V r. 2011 zmapovala koordinátora kooperačního systému situaci v r. 2011 a budoucí možnou spolupráci na: Oddělení analytického zpracování a jeho perspektivy http://www.nkp.cz/pages/page.php3?page=oazp_anl_ruseni.htm Kooperační systém článkové bibliografie - možnosti budoucí kooperace, upřesnění stávající kooperace. 1 http://www.nkp.cz/pages/page.php3?page=oazp_anl_budouci_koop.htm Minidotazník, porovnání titulů NKČR, krajských knihoven a MZK v rámci stávající kooperace se SKAT, Anopress. Porovnání NKČR a odborných knihoven v rámci stávající kooperace, odborných knihoven a Anopress. Návrhy na některé přesuny titulů http://www.nkp.cz/pages/page.php3?page=oazp_porovnani.htm 39
V r. 2011 zahájila koordinátorka k.s. jednání o spolupráci se SKAT, Anopress. III. Financování aplikace, která na serveru anl. nkp.cz běží V letech 2000-2004 byl vývoj a provoz serveru financován z projektů jmenovaných v bodě A. Po ukončení projektů t byly propláceny objednávky nejdříve z projektu JIB, cca poslední čtyři roky z prostředků OIT, resp. ÚIT NKČR. Naposledy byla vystavena objednávka v r. 2010 v hodnotě 6 000 Kč na celý rok. O aplikaci se stará dosud (březen 2011) extení programátor. Za tuto dobu je třeba pana programátora zaplatit. Pokud se mají některé věci ještě v této aplikaci dotáhnout, je třeba vystavit objednávku na r. 2011. Pokud se bude aplikace převádět pod Souborný katalog, mohou vyplynout eventuelní požadavky na programátora serveru anl. nkp.cz z jednání o převodu serveru pod Souborný katalog. Příloha 1: Klíče pro kontrolu duplicit Zdrojový MARC21 UNIMARc Poznámka dokument Název 773$t 461/463 $1200 $a Kde jsou vazební pole nebo nebo 461/463 $t Datum vydání 773$9 461/463 $9 nebo 461/463 $1210 $d nebo 461/463 $d Svazek/ročník 773$q 461/463 $q Kde nejsou vazební pole Lokace 773$g 461/463 $1200 $v 40
ISSN 773 $x 461/463 $1011$a nebo 461/463 x ISBN 773 $z 461/463 $1010$a nebo 461/463 y Kde jsou vazební pole nebo Kde nejsou vazební pole Kde jsou vazební pole nebo Kde nejsou vazební pole Příloha 2: Interface pro MNG kooperačního systému na serveru full.nkp.cz Kooperační systém článkové bibliografie KOSABI Management KOSABI (správa a údržba systému) http://full.nkp.cz/nkdb/docs/vstup.htm Management KOSABI - charakteristika. Vstup Management KOSABI - architektura. Vstup (Linka zpracování bibliografických záznamů z plných textů r. 2001-2004 v současné době se neaplikuje) Schéma je v bodě A. TamTam Data Extraktor - TTDE. Vstup (Linka zpracování bibliografických záznamů z plných textů r. 2001-2004 v současné době se neaplikuje) 41
42