Definice metadatových formátů pro digitalizaci monografií Vychází z obecné specifikace metadat v projektu NDK Verze 0.4 Autor: Jan Hutař Úpravy: Pavla Švástová
Historie verzí jméno datum verze dokumentu provedenézměny PavlaŠvástová 16.3.2012 0.4 Změnaformátovaní,drobnézměny JanHutař 12.2.2012 0.3 doplněna možnost pro obrázek, který není součástí článku do logické strukturální mapy, TYPE<div>jePAGE JanHutař 6.12.2011 0.3 úpravaatributuusev<filegroup>ualtoxml Jan Hutař, Přemysl Twrdý 22. 25.11.2011 0.3 dalšíúpravy JanHutař NK 1. 21.11.2011 0.3 úpravy celého textu, logické struktury a specifikacejednotlivýchmetadatovýchschémat JanHutař NK únor říjen 2011 0.2 změnyvzávislostinavývojispecifikacemetadat properiodika JanHutař NK 1.2.2011 0.1 první verze pro zadávací dokumentaci NDK projektu 2
Obsah HISTORIE VERZÍ... 2 OBSAH... 3 1 VÝCHODISKA... 5 2 VÝSTUPY DIGITALIZACE... 7 3 GRANULARITA METADATOVÉHO ZÁZNAMU... 8 4 IDENTIFIKÁTORY... 9 5 STRUKTURA PSP BALÍČKU... 10 5.1 SOUBORINFO.XML...11 5.2 SLOŽKA[MASTERCOPY]...11 5.3 SLOŽKA[USERCOPY]...12 5.4 SLOŽKA[ALTO]...12 5.5 SLOŽKA[TXT]...12 5.6 SLOŽKA[AMDSEC]...12 5.7 SOUBORHLAVNI_METS.XML...13 5.8 SOUBORMD5...13 6 NÁZVOVÁ KONVENCE SLOŽEK A SOUBORŮ... 14 7 TRANSPORTNÍ BALÍK PRO JEDEN NEBO VÍCE PSP BALÍČKŮ... 16 8 METADATA... 17 8.1 KOŘENOVÝELEMENTHLAVNÍHOMETSZÁZNAMU...18 8.2 METSHLAVIČKA<METSHDR>...19 8.3 METSČÁST<DMDSEC> BIBLIOGRAFICKÁMETADATA FORMÁTMODSADUBLINCORE...20 8.3.1 Navrhovaná pole MODS a Dublin Core pro jednotlivé části monografie... 23 8.3.1.1 PoleMODSaDCprosvazekmonografie...24 8.3.1.2 PoleMODSaDCprovnitřníčástmonografie(textovýoddílaobraz)...31 8.4 METSČÁST<AMDSEC> TECHNICKÁAADMINISTRATIVNÍMETADATA FORMÁTYMIXAPREMIS...42 8.4.1 PREMIS Objects... 44 8.4.2 PREMIS Event... 51 3
8.4.3 PREMIS Agent... 55 8.4.4 Technická metadata MIX... 58 8.5 METSČÁST<FILESEC>...71 8.5.1 <filesec> hlavního záznamu METS... 71 8.5.2 <filesec> vedlejšího METS záznam AMD_METS.xml... 73 8.6 METSČÁST<STRUCTMAP> STRUKTURÁLNÍMETADATAAALTOXML...75 8.6.1 <structmap> hlavního záznamu METS... 75 8.6.1.1 Vyjádřenífyzickéstrukturálnímapy...75 8.6.1.2 Vyjádřenílogickéstrukturálnímapy...76 8.6.2 <filesec> vedlejšího záznamu METS (AMD_METS.xml)... 85 8.7 OCR(ALTOXMLATXTOCR)...86 4
1 Východiska - UC=usercopy=uživatelskékopie - MC=mastercopy=archivníkopie - PS = původní sken obrazový soubor vzniklý při digitalizaci, který se po zpracování (ořez, narovnáníapod.),mažeadáleseneukládá - u všech metadatových formátů budou použity verze aktuální vdobě implementace projektu NDK,neboverzepředchozívpřípadě,ženováverzejenovámin.3měsíce - základní intelektuální entita ve workflow digitalizace a následně i vltp systému = svazek monografie(vizdále). - PSPbalíček producersubmissionpackage - balíčekdatametadat,kterýpřicházíodproducentadat(tedynapř.zworkflowdigitalizace) - PSPbalíčekbudeobsahovatkompletníintelektuálníentitutj.svazek monografie - zworkflowdigitalizacelzeposlatvícepspbalíčkůvbalíkunapř.[.tar]apod. - pokud má dvousvazkové dílo vkatalogu knihovny bibliografický záznam pro každý svazek, vznikneprokaždýsvazekpspbalíčekakaždýsvazekbudebránjakojednaintelektuálníentita;to saméplatíipropřípad,ževícesvazkovédílomápouzejedenzáznam - SIP balíček submission information package je balíček dat a metadat vpodobě, ve které je akceptovatelný pro LTP systém nebo pro aplikaci zpřístupnění. Může vznikat vtransformačním moduluzpspbalíčkupojehokontrolách.sipbymělobsahovatjenjednuintelektuálníentitu. - primárně se u monografií nebude dělat členění na vnitřní části (kapitoly apod.) pouze u některých zvláště důležitých monografií > tj. musí existovat možnost vyjádřit popis částí(např. kapitoly,přílohyapod.)vmetadatech - základní bibliografická metadata budou stahována přímo zknihovních katalogů do workflow digitalizace - převod stávajících dat, která jsou vproprietárním DTD (periodika a monografie) do vnitřního formátultpsystémubudeprobíhatvtransformačnímmodulu - i u nových dat zdigitalizace bude nutný převod do interních formátů LTP systému a aplikací zpřístupnění opětbudeprobíhatvmodulutransformace - úpravyobrazu,kterévedoukezměněrozměrůobrazu,rozlišeníapod.,semusídělatpředtím, nežseuděláocr,tj.budousedělatnatiffsouborech; 5
- OCR(ALTO XML) bude vznikat zuživatelské kopie OCR je lepší ze souborů s kompresí(méně šumu) - je nutné zachovat velikost obrazu uživatelských a archivních kopií stejnou (počet pixelů, rozlišení)tak,abyaltoxmlpasovalo jakovýchozíswprovytvářenísouborůjpeg2000sebudepoužívatkakadu veškerámetadatamusíprozápispoužívatkodováníutf 8 6
2 Výstupy digitalizace Pozn. 1) archivníkopie(1mcprokaždoustránku) 2) uživatelskékopie(1ucprokaždouvznikloumc,tedystránku) 3) OCR ALTOXMLsouborprokaždoustránku 4) OCR TXT soubor pro možnost stáhnout si jen text dokumentu (tam kde kvalita OCR je odpovídající),vyhledávání/indexace. 5) metadatapromc a. bibliografickámetadata MODSaDC b. strukturálnímetadata METS c. technickámetadata MIX,PREMIS d. administrativnímetadata PREMIS,METS 6) kontrolnímetadatovésoubory(skontrolnímisoučtyaúdajiovznikudatapod.) METS neobsahuje popisná, ani technická metadata pro UC. Obrazové soubory UC jsou pouze součástí strukturálnímapy<structmap>a<filesec>.součástípspbalíčkujsouobrazyucvesložce[usercopy]. 7
3 Granularita metadatového záznamu Monografie - základníintelektuálníentitoupromonografieje1svazek - pokudmámonografiepouzejedensvazek,vzniknejedenmetadatovýpopis(=metszáznam) - pokudmámonografiesvazkydva,např.dvousvazkovýslovník,jednáseodvěintelektuálníentity (svazek první a svazek druhý) a vzniknou tedy dva metadatové záznamy, ke každému svazku jedenmetszáznamatedydvapspbalíčky - vknihovních katalozích jsou někdy vícesvazkové monografiekatalogizovány jako jeden soubor, tj. mají jeden záznam vkatalogu, někdy jsou jednotlivé díly vedeny jako jednotlivé záznamy vkatalogu;oboupřípadechmusívzniknoutmetadatovýpopiskekaždémusvazkujakozákladní intelektuálníentitěataképspbalíčekprokaždýsvazek - každý METS záznam musí obsahovat metadata o nadřazené intelektuální entitě (např. soubor monografie)tak,abybylomožnéoběentityvirtuálněspojitabylojasnéuživateli,žesejednáo jedensoubor/titul,kterýmádvasvazky. 8
4 Identifikátory Doworkflowdigitalizacebudoupřicházetbibliografickámetadata,kterájižbudouobsahovatnásledující identifikátoryvrchníchúrovníintelektuálníchentit(úroveňtitulu): - ISBN pouze pro titul monografie (jednosvazkové) nebo pro soubor monografií, které mají pouzejedensoubornýzáznam,isbnnenípřidělenovždy - ISSN - ččnb identifikátor entity tak jak odpovídá katalogizačnímu záznamu, tj. každá entita se záznamemvkatalogunk/mzkmátentoidentifikátor - URN:NBNprosvazekmonografie,kterébudepřidělovánoběhemdigitalizace 1. - URN:NBN může být přidělováno také nižším logickým úrovním (entitám) tedy vnitřní část (zejménanapř.článekvesborníku),příloha - syntax URN:NBN musí odpovídat specifikaci identifkátoru URN:NBN pro resolver NK (např. urn:nbn:cz:ndk 123456provýstupyzprojektuNDK) - dalšímožnostíjevyužitíuuid 1 buďpřímovswproworkflowdigitalizace,nebozapomociaplikaceresolverurn:nbn 3 pozorvýraz kapitola jevtomtokontextuobecnýamůževyjadřovatnejenkapitolu,aletakénapř.předmluvu, 9
5 Struktura PSP balíčku Jedná se o variantu, kdy technická a administrativní metadata nejsou obsažena vhlavním METS záznamu, ale pro každou stránku vjiném dalším METS záznamu (AMD_METS.xml). Důvodem je to, že pokudbybylovševhlavnímmetsu,bylbyneúměrnědlouhý.taktojezhlavníhozáznamunalinkováno. Hlavní metadatový záznam METS obsahuje metadata pro archivní kopie obrazových dat, neobsahuje všakžádnámetadataprouživatelskékopie. PSPbalíček=1složkaprosvazekmonografie.Vpřípadě,žemámonografie2svazky/díly,tak1svazek= 1PSP. HlavnísložkaPSPbalíčkuobsahujenásledujícísložkyasoubory: 10
5.1 soubor info.xml VelmikrátcetubudouzaznamenányúdajeovznikuceléhoPSPbalíčku kdo,kdyhovytvořil,jakouměl velikost,odkudkambylnakopírovánapod.zaznamenánymohoubýtúdajeoobsahupspbalíčku počet anázvysouborůapod.souborobsahujeodkaznasouborsmd5.souborinfo.xmlbytakémohlbýtvedle hlavníhopspbalíčku.údajeastrukturainfo.xmlsouboru: 1. vznikbalíčku datumdleiso8601naúroveňvteřin 2. IDbalíčku použítidentifikátorčíslaperiodika(urn:nbn) viznázvovákonvencevkap.6 3. IDtitulu ččnb,isbnneboissn(opakovatelné) 4. údajeovětšímcelku(projektu),dokteréhobalíčekpatří např.digitalizaceproanl 5. názevinstituce,kterájezadavatelemdigitalizace 6. tvůrcebalíčku kódinstituce(firmy),kterábalíčekvytvořila 7. velikostbalíčku vkb 8. obsahbalíčku 9. názvysouborůvčetnědirectorypathakoncovky(mimetype)(nepovinné) 10. početsouborůvbalíčkucelkem 11. odkaznasouborsmd5ajehomd5 12. poznámka např.otom,žebalíčekneobsahujeocrapod. <?xml version="1.0" encoding="utf-8"?> <info xmlns="http://www.ee.cz/schemas/ndk/info.xsd"> <created>2012-01-26t13:53:11</created> <packageid>anl_123456</packageid> <titleid TYPE= issn >ISSN0009-2770</titleid> <titleid TYPE= ccnb >cnb123456789</titleid> <collection>anl</collection> <institution>nkp</institution> <creator>název firmy</creator> <size>123456789</size> <itemlist ITEMTOTAL="35"/> <item>... </item> <checksum TYPE="md5" CHECKSUM="fe8e0172fb031cdc79a9f6002cb64f55" >/MD5_anl001-000003.md5</checksum> <note /> </info> 5.2 složka [mastercopy] Složka smaster kopiemi, obsahuje soubory JPEG2000 vneztrátové kompresi, 1 soubor = 1 stránka, tj. obsahujevšechnynaskenovanéstránkymonografie. 11
5.3 složka [usercopy] Složkasuživatelskýmikopiemi,prokaždounaskenovanoustránkumonografieobsahujejedenJPEG2000 souborseztrátovoukompresí. 5.4 složka [ALTO] Obsahuje ke každé stránce 1 ALTO XML soubor, tj. tolik ALTO XML souborů kolik je stránek svazku monografie. 5.5 složka [TXT] Obsahujekekaždéstránce1OCRsouborjakočistýtext.Tj.tolikOCR.TXTsouborůkolikjestráneksvazku monografie. 5.6 složka [amdsec] Složka stechnickými metadaty obsahuje pro každou naskenovanou stránku monografie 1 METS soubor (AMD_METS.xml).ZáměrněnejsoutatometadatavhlavnímMETSzáznamu(hlavni_METS.xml), protožetenbyneúměrněnarostlabylobyobtížnésnímpracovat.musíznějbýtovšemnalinkována(z částifilesec).každýmetssouboramd_mets.xmlobsahujenásledujícíčástimetsformátu: - amdsec administrativnímetadata obsahuječást o o o o technických metadat (techmd), která ve formátu PREMISobject popisuje vlastnosti archivníchkopií,uživatelskýchkopií,altoxml,původníhotiffsouboru,zekteréhovznikly archivní kopie. Dále je přítomen záznam technických metadat vmix formátu pro archivní kopieapropůvodnítiff. metadat o provenienci digitálních objektů (digiprovmd) vtéto části je využit formát PREMISevent a PREMISagent. Zachyceny budou následující události (vytvoření skenu, uložení obrazu, různé migrace vdigitalizaci, ořez apod. informace o datu, místu, osobě nebosw,kterýtytoúkonyudělal). filesec sekce sodkazy na soubory povinná část METS záznamu vpřípadě tohoto METS záznamu pro jednu stránku, který vzniká primárně kzachycení technických a administrativníchmetadatbudeodkazovatnasoubory,kteréjsoustoukonkrétnístránkou spojeny,tj.archivníkopie,altoxmlaocrtxt.jdeopovinnousekcimetszáznamu,pro dalšímapovánídoltpsystémunebudepotřeba. structmap pouze fyzická strukturální mapa, povinná část METS záznamu. Bude ukazovat strukturu souborů kdané stránce, tj. opět archivní kopie, ALTO XML a OCR TXT. Pro další mapovánídoltpsystémunebudepotřeba. 12
5.7 soubor Hlavni_METS.xml DalšíčástíPSPbalíčkujehlavníMETSdokument.HlavníMETSzáznamtedyobsahuje: - dmdsec bibliografickámetadataksvazkumonografievčetněpopisunadřazenýchentit(např.titul) nebo naopak částí (např. kapitola). Základ bude zkatalogu, případný další popis částí bude zdigitalizace. Formátem hlavním bude MODS, nutná pro LTP je i přítomnost zkráceného záznam vdublincore. - filesec hlavníčástslinkynavšechnydigitálníobjekty(archivníkopie,altoxmlaocrtxt),které se váží kjednomu svazku monografie. Obsahuje také linky na administrativní metadata AMD_METS.xmldosložky[amdSec]. - structmap strukturálnímapaprocelýdokument,tj.projedensvazekmonografie.obsahuje: o o o logickoučást vyjadřujelogickoustrukturusvazkusodkazynaaltoxml fyzickoučástobsahujícíinformaceovšechreprezentacíchkonkrétnístránky(archivníkopie, ALTOXML,OCRTXTaAMD_METS.xml) mapovánínaaltoxmlareas 5.8 soubor MD5 PosledníčástíPSPbalíčkujesouborskontrolnímisoučtyprovšechnysouborybalíčku(kroměinfo.xmla.md5 souboru samotného). Soubor.md5 je jeden pro 1 celý balíček SPS (balíček se svazkem monografie). Tento soubor.md5 obsahuje kontrolní součet pro každý soubor obsažený vpsp balíčku. Ztohoto důvodu nejsou samostatné kontrolní součty součástí podsložek balíčku. Kontrolní součty jsou takésamozřejměvtechnickýchmetadatech. 13
6 Názvová konvence složek a souborů PojmenováníPSPbalíčku - každýpspbalíčekpřicházejícízdigitalizacebymělobsahovatpouzejedinouintelektuálníentitu (svazek monografie). Pak musí název balíčku vycházet zidentifikátoru této entity, např. URN:NBN,čísločárovéhokódupoužitéhonafyzickéjednotceapod. - každý svazek monografie musí mít svůj jednoznačný identifikátor, tím pádem pak každý PSP balíčekakaždýsouborvněmmávlastníjednoznačnýidentifikátor Pojmenovánísložek - viznávrhstrukturpspbalíčku(kap.5) Pojmenovánísouborů - názvy jakýchkoliv souborů náležejících kjedné základní entitě (svazek) musí být založeny na jednomtypuidentifikátoru - prosvazekmonografiebytakovýmidentifikátoremmohlobýturn:nbn,ččnb,isbnneboissn titulu - podobně využitelným identifikátorem by mohlo být generované číslo UUID, které by se generovaloprokaždýsoubor.tímbyseovšemztratila(ivizuální)vazbanavrchníúroveňtitului vazbanasouvisejícísoubory(stránkavjp2aknínáležejícísouboraltoxmlapod.). Svyužitím URN:NBN to může vypadat následovně (použit příklad pojmenování pro projekt NDK digitalizacemonografií): typsouboru názevsouboru vysvětlení PSPbalíček(číslo,svazek) NDK_123456 název celé složky PSP balíčku, u základních int. entit bude v názvu využitovždyurn:nbn archivníkopie MC_NDK_123456_0013.jp2 archivní JPEG2000 stránky 13 svazku monografiesurn:nbn:cz:ndk 123456 uživatelskákopie UC_NDK_123456_0013.jp2 uživatelskákopieveformátujpeg2000 stránky 13 svazku monografie s urn:nbn:cz:ndk 123456 ALTOXML ALTO_NDK_123456_0013.xml ALTOsoubornáležejícíke13téstránce zesvazkumonografiesurn:nbn:cz:ndk 14
123456 OCRTXT TXT_NDK_123456_0013.txt TXT soubor s OCR náležející ke 13té stránce ze svazku monografies urn:nbn:cz:ndk 123456 info.xml INFO_NDK_123456.xml info xml k celému PSP balíčku svazku monografie MD5 NDK_123456.md5 soubor s kontrolními součty k celému PSPbalíčkusvazkumonografie Hlavni_METS.xml METS_NDK_123456.xml hlavní METS záznam k celému svazku monografiesurn:nbn:cz:ndk 123456 AMD_METS.xml AMD_METS_NDK_123456_0013.xml METS záznam s technickými metadaty prostránku13zesvazkumonografies urn:nbn:cz:ndk 123456 Složka jednoho balíčku PSP, který obsahuje jen jeden obrazový soubor kprvní stránce svazku monografie,pakmůževypadatnásledovně(příkladbalíčkuzdigitalizacendk): NDK_123456 info.xml [mastercopy] MC_NDK_123456_0001.jp2 [usercopy] UC_NDK_123456_0001.jp2 [ALTO] ALTO_NDK_123456_0001.xml [TXT] TXT_NDK_123456_0013.txt [amdsec] AMD_METS_NDK_123456_0001.xml METS_NDK_123456.xml NDK_123456.md5 15
7 Transportní balík pro jeden nebo více PSP balíčků PokudbudejedenPSPbalíkobsahující1základníintelektuálníentitu(svazekmonografie)přemísťován např. jako tar, měl by název souboru tar odpovídat názvu PSP balíčku (tedy vycházet zpoužitého identifikátoruproentitusvazku). Výstupemworkflowdigitalizacealemůžetakébýtbalík(např.tar),kterýobsahujevícePSPbalíčků toto sdružování bude omezeno jen kapacitou HW. Takovýto sdružený balík by měl být pojmenován na základějižužívanéhoidentifikátoru. - vpřípadě,žebalíkobsahujesvazky jednohovícesvazkovéhodíla,mělbynázevbalíkuvycházet zččnbneboisbn - typ identifikátoru musí být vyjádřen vnázvu souboru např. ISBN_1234567890.tar nebo CCNB_12345678910.tarapod. - lzepočítatstím,žebudedocházetktomu,žesdruženýbalíknebudeobsahovatnapř.všechny svazky titulu monografie tato skutečnost musí být patrná znázvu balíku (např. ISBN_1234567890_YYYYkdeYYYYmůžebýtpořadovéčíslo,datum,dobavznikujednohozvíce balíkůobsahujícíchsvazkyurčitéhotitulu/souborusidentifikátoremisbn1234567890). Transportníbalíkbymělobsahovatnásledujícíčásti: o o o o balíčkypsp(svazků) informačnísoubor,kterýodpovídáspecifikaciinfo.xml kontrolnísoučtyvšechpspbalíčků seznambalíčkůvtransportnímbalíku 16
8 Metadata - veškerámetadatabudou zabalena pomocíkontejnerovéhoformátumets - formátmetsbudevaktuálníverzivdoběimplementaceneboverzipředchozí(prosinec2010verze 1.9 http://www.loc.gov/standards/mets/mets schemadocs.html) - veškerámetadatavevšechformátechmusíbýtzapsánapomocíxmlzapoužitíkodováníutf 8 - vložení metadatových formátů do kontejneru METS bude vždy formou <mdwrap>, tj. ne odkazovánímzmetszáznamuven Význam pole povinnost - pole povinnost uvádí,zdajeplněníjednotlivýchelementůpovinné,doporučenénebovolitelné - můženabývatnásledujícíchhodnot o M mandatory(povinněplnit elementjesoučástíkaždéhozáznamu) o MA mandatoryifavailable(povinněplnitpokudjetomožné,pokudlzeapod.) o R recommended(plněníhodnotelementujedoporučeno,neníovšempovinné) o RA recommendedifavailable(doporučenopokudlzeplnit) o O optional(plněníhodnotelementujezceladlekonkrétníchpotřeb) 17
8.1 Kořenový element hlavního METS záznamu Kořenový element hlavního METS záznamu kjednomu svazku monografie musí obsahovat linky na specifikacejednotlivýchpoužitýchmetadatovýchschémat(mets,mods,dublincore). element atributy popis Povinnost <mets> Příklad: LABEL TYPE kořenovýelementmetszáznamu M LABEL názevtitulumonografie,včetněrokuvydání,např.honzíkova cesta,1979 TYPE hodnotavždy Monograph <mets:mets xmlns:xsi="http://www.w3.org/2001/xmlschema-instance" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:mods="http://www.loc.gov/mods/v3" xmlns:oai_dc="http://www.openarchives.org/oai/2.0/oai_dc/" xmlns:dc="http://purl.org/dc/elements/1.1/" xsi:schemalocation="http://www.w3.org/2001/xmlschema-instance http://www.w3.org/2001/xmlschema.xsd http://www.loc.gov/mets/ http://www.loc.gov/standards/mets/mets.xsd http://www.loc.gov/mods/v3 http://www.loc.gov/standards/mods/mods.xsd http://www.openarchives.org/oai/2.0/oai_dc/ http://www.openarchives.org/oai/2.0/oai_dc.xsd" TYPE="Monograph" LABEL="Honzíkova cesta, 1979" xmlns:mets="http://www.loc.gov/mets/"> 18
8.2 METS hlavička <metshdr> - dokumentujevznikaúpravymetszáznamu element atributy popis Povinnost <metshdr> hlavičkametszáznamu M LASTMODDATE CREATEDATE LASTMODDATE datumposledníúpravyzáznamu,musíbýt vetvaruiso8601(naúroveňvteřin) CREATEDATE datumvytvořenízáznamu,musíbýtvetvaru ISO8601(naúroveňvteřin) <agent> údajeotvůrcizáznamumets M ROLE TYPE ROLE hodnota CREATOR TYPE hodnota ORGANIZATION <name> jménojednotlivceneboorganizace; M tvůrce záznamu, buď dodavatel (firma XY) nebo vpřípadě tvorby záznamu vknihovně bude využita sigla knihoven, tj. pronkčrhodnota ABA001 <agent> údajeovlastníkovimets M ROLE TYPE ROLE hodnota IPOWNER TYPE hodnota ORGANIZATION <name> jménojednotlivceneboorganizace; M vlastník záznamu, buď dodavatel (firma XY) nebo vpřípadě tvorby záznamu vknihovně bude využita sigla knihoven, tj. pronkčrhodnota ABA001 Příklad: <mets:metshdr CREATEDATE="2012-01-26T13:49:12" LASTMODDATE="2012-01-26T13:49:12"> <mets:agent ROLE="CREATOR" TYPE="ORGANIZATION"> <mets:name>elsyst Egineering</mets:name> </mets:agent> <mets:agent ROLE="IPOWNER" TYPE="ORGANIZATION"> <mets:name>národní knihovna ČR</mets:name> </mets:agent> </mets:metshdr> 19
8.3 METS část <dmdsec> Bibliografická metadata formát MODS a Dublin Core - každáčást<dmdsec>musímítidavnořenýelement<mdwrap>satributymdtype,mimetype element atributy popis povinnost <dmdsec> identifikátor<dmdsec>částimetszáznamu M ID pro <dmdsec> spopisem svazku (titulu) monografie hodnota MODSMD_VOLUME a DCMD_VOLUME pro <dmdsec> spopisem vnitřní části monografie hodnota dle typů vnitřníčásti(oddíl 3,obraz) hodnoty MODSMD_CHAP a DCMD_CHAP pročlánekahodnoty MODSMD_PICT a DCMD_PICT proobraz pro <dmdsec> spopisem přílohy monografie hodnota MODSMD_SUPPL a DCMD_SUPPL <mdwrap> elementobsahujícívloženézáznamymods M MDTYPE MIMETYPE MDTYPE hodnota MODS pro záznamy vmods, hodnota DC pro záznamvdublincore MIMETYPE hodnota text/xml - na samotný bibliografický popis bude použit formát MODS, aktuální verze vdobě implementace, nebo verze předchozí(prosinec 2010 verze 3.4 viz http://www.loc.gov/standards/mods/) a formát DublinCore(dáleDC)kvalifikovaný(http://dublincore.org/documents/dcmi terms/) - DC je primárně určeno na poskytnutí dat přes OAI PMH, bude odpovídat OAI XSD (viz http://www.openarchives.org/oai/2.0/oai_dc.xsd)abudesejednatonekvalifikovanýdublincore - DC bude použito, uloženo vmets apod. stejným způsobem jako formát MODS viz možnosti strukturypspbalíčkuvýše - pro vytvoření DC zmods formátu může být použito oficiální mapování Kongresové knihovny viz http://www.loc.gov/standards/mods/mods conversions.html - DCaMODSbudevloženvMETSčástidmdSec vizmožnostistrukturpspbalíčkuvkap.7 - základním zdrojem pro popisnámetadata je katalog NK a MZK pro převod metadata k titulu 3 pozorvýraz kapitola jevtomtokontextuobecnýamůževyjadřovatnejenkapitolu,aletakénapř.předmluvu, obsahapod. 20
monografiezmarc21resp.marcxmldomodslzevyužítoficiálnímapováníakonverzníšablonu zestránekhttp://www.loc.gov/standards/mods/mods conversions.html - u digitalizovaných dokumentů je bibliografický popis vytvářen primárně zpohledu popisu fyzické předlohy,nejdeopopiselektronickéhodokumentu Monografie - základní intelektuální entitou pro popis je svazek monografie, tj. vjednom METS záznamu, který budeobsahovatmetadataastrukturujednohosvazku,budoumodszáznamyktomutosvazku - metadatabudoupopisovatentity 4 : 1. svazek (Volume) 2. vnitřní část (InternalPart) typy textový oddíl (Chapter) a obraz (Picture) 3. příloha (Supplement) - pozn: nepočítá se súrovní titulu, ani pro vícedílné publikace, které mají pouze jeden katalogizační záznam; u jednosvazkových monografií titul splývá spopisem svazku (MODS záznam popisující svazekjezáznamtituluzkatalogunk/mzk);pokudpřecijenexistujesouhrnnýnázevprovícesvazků (např.sebranéspisy),jeřešenoplněnímsournnéhonázvudoúdajůoedici 1. ad svazek (Volume) popissvazkuuklasickémonografie(1svazek=1záznam)odpovídázáznamu vkatalogu 2. ad vnitřní část bližší určení typů kapitol a obrazu (fotografie, tabulka, ilustrace, graf apod.) budemožnévyjádřitpomocíatributůavýrazůkontrolovanéhoslovníkuvelementu<genre> o u popisu vnitřní části je i element <recordinfo> důvodem je to, že popis bude vznikat manuálněaježádoucíovznikuzáznamudržetkontrolníúdaje;elementjevolitelný 3. ad příloha (Supplement) přílohou se rozumí volně vložená entita do jednotlivého svazku, např. mapa,klíč(řešeníúloh),pracovnísešit,cd/dvdapod. Rozlišujeme 3 druhy příloh monografie: a) příloha, která se neskenuje,alechcemeonívytvořitbibliografickýzáznam,dátnajevočtenáři,že existuje tomůžebýtnapř.cd/dvdapod. o digitálnípodobapřílohy(pokudexistuje)nenísoučástíbalíčkupspsvazku o popislzeudělatvrámcipopisupřílohy(supplement)vmods vizspecifikaceníže pokudexistujezáznamvkataloguktétopříloze(např.cd/dvd,mapaapod.),bude využitprogenerovánímodszáznamupřílohy o takovápřílohanenísoučástílogickéstrukturálnímapyformátumets 4 totopořadínevyjadřujelogickoustrukturudokumentu,tajepopsánajinde 21
b) příloha podobného typu, tvaru a velikosti jako je popisovaný svazek monografie, která se spolu s číslem skenuje o digitální podoba přílohy je, spolu se svazkem (Volume), součástí PSP balíčku svazku a je součástíhlavníhometszáznamu o popislzeudělatvrámcipopisupřílohy(supplement)vmods vizspecifikaceníže o takovápřílohamůžemítvnitřníčásti(internalpart)stejnějakosvazek(volume)ajejichtext jesoučástíaltoxml,kteréjespolečnéprosvazek(volume)ipřílohu(supplement) o taková příloha je součástí logické strukturální mapy formátu METS o taková příloha je součástí fyzické strukturální mapy formátu METS (linky mezi jednotlivými soubory reprezentujícími stránky a popisnými metadaty) c) příloha odlišného typu, tvaru a velikosti než je popisovaný svazek monografie, která se skenuje zvlášťnasvazkunezávisle o můžejítnapř.omapuapod. ktěmtopřílohámvznikajímetadatapodobnějakoprojednotlivésvazkymonografií,ovšem na původním svazku, ke kterému příloha patřila, nezávisle tj. pro původní svazek, u kteréhobylapříloha,vznikne1popis(pspbalíčeksjednímhlavnímmetszáznamemaalto XMLsouborem)apropřílohujevytvořendalší1popis(aPSPbalíčeksMETSzáznamem) Záznamy monografie mohou být v katalozích následující: o o monografie má jen jeden svazek existujejedenzáznamvkataloguajednoččnb monografie má více svazků pakexistujebuď 1) jeden záznam pro soubor, pokud jednotlivé svazky/díly nejsou od sebe příliš odlišné(např.slovníka k,l z),kjednomuzáznamuexistujejednoččnb;nebo 2)vpřípadě,žejednotlivédíly/svazkysouborujsouodlišné(např.Vlastivědačeská díl flora, díl fauna, atd.), tak má každý svazek svůj záznam vkatalogu a své ččnb, soubornýzáznamvtomtopřípaděneexistuje - popisnadřazenéentity,kdetedyexistujepouze1katalogizačnízáznamprovícesvazkůmonografie, nebudesoučástímetadatpopisujícíchsvazek. - stránka se nebude popisovat, její logické i fyzické číslování i typ stránky je obsaženo ve struktuře METSdokumentu(částstructMap) - typ stránky bude odpovídat přesně seznamu typů zdtd monografie viz http://digit.nkp.cz/monographs/dtd/2.10/monograph.xsd (NormalPage, Advertisement, BackCover, BackEndSheet, Blank, FlyLeaf, FrontCover, FrontEndSheet, Index, ListOfIllustrations, ListOfMaps,ListOfTables,NormalPage,Spine,Table,TableOfContents,TitlePage) - vkatalozích NK a MZK neexistují údaje o kapitolách monografií tj. vnitřní členění a popis musí vzniknout vdigitalizaci, popis titulu/svazku monografie musí být stažen zkatalogu do workflow digitalizace 22
- prokaždouentituvzniknejedenmodszáznamsvlastnímid,kterébudeoznačovatitypčásti(např. oddíl, ilustrace apod.) vpřípadě opakování částí se bude opakovat odpovídající počet MODS záznamůvjednompspbalíčku o každýmodszáznammávlastní<dmdsec>část - každýmodszáznambudeuloženvevlastnímetsčásti<dmdsec>pomocímdwrap - všechny top elementy MODS formátu jsou opakovatelné, kromě <recordinfo> - všechny elementy Dublin Core jsou opakovatelné 8.3.1 Navrhovaná pole MODS a Dublin Core pro jednotlivé části monografie - mapováníjednotlivýchpolízmarc21lzenaléztnapř.najednézoficiálníchstránekmodsformátuu jednotlivýchtop levelelementů: o http://www.loc.gov/standards/mods/userguide/generalapp.html - konverzníšablonypropřevodzmarcxmldomodssenacházejízde: o http://www.loc.gov/standards/mods/mods conversions.html Obsah sloupce Popis : - vysvětleníapříklad - doporučenéplněnítam,kdejetomožnéuvést - povinnostplatíproelementymodstakproelementydublincorestejně - pokud je rodičovský element např. doporučený, a dceřinný element povinný, znamená to že dceřinnýelementjepovinnýpouzetehdypokudjepoužitelementrodičovský Význam sloupce povinnost - pole povinnost uvádí,zdajeplněníjednotlivýchelementůpovinné,doporučenénebovolitelné - můženabývatnásledujícíchhodnot o M mandatory(povinněplnit elementjesoučástíkaždéhozáznamu) o MA mandatoryifavailable(povinněplnitpokudjetomožné,pokudlzeapod.) o R recommended(plněníhodnotelementujedoporučeno,neníovšempovinné) o RA recommendedifavailable(doporučenopokudlzeplnit) o O optional(plněníhodnotelementujezceladlekonkrétníchpotřeb) 23
8.3.1.1 Pole MODS a DC pro svazek monografie Element MODS Atributy Popis povi nnos t <mods> ID ID musí vyjadřovat název úrovně, tj. např. MODS_VOLUME <titleinfo> názevsvazkumonografie proplněnípoužítkatalogizačnízáznam type type: hodnota alternative pro paralelní a jiné názvy(odpovídajípoli245podpoli b ) <title> názvováinformace názevsvazkumonografie hodnoty převzít zkatalogu, odpovídá poli 245, podpoli a prohlavnínázev 24 M Element DC M <dc.title> <subtitle> podnázevsvazkumonografie MA <dc.title> <partnumber> čísločásti,např.určitéřady/edice(část1,řadab) R <dc:descrip tion> <partname> jméno edice nebo speciální ediční řady, např. Knihy odvahyadobrodrůžství <name> údajeoodpovědnostizasvazek POZOR údajeoodpovědnostinutnopřebíratzpolí 1XXa7XXMARCu21 pokud má monografie autora a ilustrátora, element <name>seopakujesrůznýmirolemi type type:použítjedenztypů - personal - corporate - conference - family <namepart> údajeokřestnímjméněapříjmeníapod. nutnovyjádřitprokřestníjménoipříjmení pokud nelze rozlišit křestní jméno a příjmení, nepoužije se type a jméno se zaznamená vpodobě jakéjedojednohoelementu<namepart> type type:použítjednuzhodnot: - date doporučenépokudlzeuvést - family povinnépokudlzeuvést - given povinnépokudlzeuvést - termsofaddress doporučenépokudlzeuvést R <dc:descrip tion> M M <dc:creator > nutno do jednoho pole DC spojit jméno i příjmení
<role> specifikace role osoby nebo organizace uvedené velementu<name> <roleterm> popisrole nutnopoužítkontrol.slovníknapř.zmarc21 type type:code kódrolezkontrolovanéhoslovníkurolí http://www.loc.gov/marc/relators/relaterm.html) authority authority údaje o kontrolovaném slovníku využitém kpopisu role, kpopisu výše uvedeného MARC seznamu nutno uvést authority= marcrelator ; <typeofresource> pro monografie hodnota text; mělo by se vyčítat zmarc21 katalogizačního záznamuzpozice06návěští popischarakteristikytypuneboobsahuzdroje jednazhodnot: - text M M R <dc:type> - cartographic - notatedmusic - soundrecording musical - soundrecording nonmusical - soundrecording - stillimage - movingimage - threedimensionalobject - software,multimedia - mixedmaterial <genre> bližšíúdajeotypudokumentu hodnota: volume <origininfo> informaceopůvodupředlohy Poznámka: Jedennebovícevýskytůelementůsepředpokládá provydavatele,dalšívýskytvpřípaděnutnosti popsattiskaře.pokudjenutnovyjádřittiskaře(pole 260podpole f a e a g vmarc21),jenutno M <dc:type> M 25
element<origininfo>opakovatsatributem transliteration= printer aelementy<place>, <publisher>,<datecreated>,kterébudouobsahovat údajeotiskaři. <place> údaje o místě spojeném svydáním, výrobou nebo původempopisovanéhodokumentu <placeterm> konkrétníurčenímísta,např.praha odpovídá hodnotě zkatalogizačního záznamu, pole 260,podpole a type type budevždytext <publisher> jméno entity, která dokument vydala, vytiskla nebo jinakvyprodukovala odpovídá poli 260 podpoli b katalogizačního záznamuvmarc21; Pokud má monografie více vydavatelů, přebírají se zazáznamuvšichni(jsouvjednompoli260). <dateissued> datumvydánípředlohy, přebíratzkatalogu; odpovídá hodnotě zkatalogizačního záznamu, pole 260,podpole c jiná data než rok možno zapsat vnásledujících podobách: qualifier DD.MM.RRRR pokudvímeden,měsícirok vydání MM.RRRR pokud víme jen měsíc a rok vydání RRRR pokudvímepouzerok DD. DD.MM.RRRR vydáníprovícední MM. MM.RRRR vydáníprovíceměsíců qualifier možnost dalšího upřesnění, hodnota approximate prodata,kdenevímepřesnýúdaj <datecreated> datumvytvořenípředlohy budepoužitopouzepřipopisutiskaře,vizpoznámka uelementu<origininfo> odpovídá hodnotě zkatalogizačního záznamu, pole 260,podpole g qualifier qualifier možnost dalšího upřesnění, hodnota approximate prodata,kdenevímepřesnýúdaj 26 MA MA MA <dc:covera ge> <dc:covera ge> <dc:publish er> M <dc:date> R <issuance> údajeovydávání M
hodnotamonographic odpovídá hodnotě uvedené návěští MARC21 na pozici07 <language> údajeojazycedokumentu; vpřípadě vícenásobného výskytu nutno element <language>opakovat <languageterm> přesnéurčeníjazyka kódem nutno použít kontrolovaný slovník ISO 639 2, http://www.loc.gov/standards/iso639 2/php/code_list.php objectpart type authority objectpart: možnost vyjádřit jazyk konkrétní části svazku; možné hodnoty např.: summary (pro shrnutí), original (pro předlohu u překladu) aj. nutno vytvořitkontrolovanýslovník; jazykresumélzepřebíratzpole041,podpole b jazyk předlohy u překladu lze přebírat zpole 041, podpole h type:použíthodnotucode authority:použíthodnotu iso639 2b ; odpovídápoli041marc21,podpoli a 27 M <physicaldescription> obsahujeúdajeofyzickémpopisuzdroje/předlohy M <form> údaje o fyzické podobě dokumentu, např. print, electronicapod. promonografiehodnotaprint odpovídá hodnotám pozice 23 a 29 vpoli 008 MARC21 authority authority:hodnota marcform <extent> údajeorozsahu(stran,svazkůneborozměrů) odpovídá hodnotám vpoli 300 podpolích a a c MARC21, pokud jsou vyplněna obě pole, bude se element<extent>opakovat; počet stránek bude vyjádřen ve fyzické strukturální mapě a bude tak vidět vaplikaci zpřístupnění i bez vyplněnítohotopole <note> poznámkaofyzickémstavudokumentu; prokaždoupoznámkujenutnovytvořitnový<note> element M <dc:langua ge> M <dc:format > RA RA <dc:format > <abstract> shrnutíobsahujakocelku R <dc:descrip
odpovídápoli520marc21 <note> obecnápoznámkakesvazkumonografiejakocelku odpovídápoli500vmarc21 <subject> údajeověcnémtřídění předpokládásepřebíránízkatalogizačníhozáznamu authority authority:vyplnithodnotu czenas RA R tion> <dc:descrip tion> <topic> libovolnývýrazspecifikujícínebo charakterizujícíobsahsvazkumonografie; použít kontrolovaný slovník např. zbáze autorit AUT NK ČR (věcné téma) nebo obsahpole 650 záznamumarc21 <geographic> geografickévěcnétřídění použít kontrolovaný slovník např. zbáze autorit AUT NK ČR (geografický termín) nebo obsah pole 651záznamuMARC21 <temporal> chronologickévěcnétřídění použít kontrolovaný slovník např. zbáze autorit AUT NK ČR (chronologický údaj) nebo obsah pole 648záznamuMARC21 <name> jménopoužitéjakověcnézáhlaví použít kontrolovaný slovník např. zbáze autorit AUT NK ČR (jméno osobní) nebo obsah pole 600 záznamumarc21 <namepart> celéjménosezapíšedotohotoelementu M <dc:subject > R <dc:subject > R <dc:subject > R <dc:subject > <classification> klasifikační údaje věcného třídění podle Mezinárodníhodesetinnéhotřídění odpovídápoli080marc21 authority authority:vyplnithodnotu udc <relateditem> informace o dalších dokumentech/částech/zdrojích, kteréjsouvevztahukpopisovanémudokumentu; Poznámka: element <relateditem> může obsahovat jakýkoliv jiný element MODS jejich použití se řídí pravidly popsanýmiprotytoelementy; type type:hodnota series M <dc:subject > RA 28
<identifier> údaje o identifikátorech, obsahuje unikátní identifikátorymezinárodnínebolokální,kterésvazek monografiemá vizpřehledtypůatributůníže M <dc:identifi er> type type: budou se povinně vyplňovat následující hodnoty,pokudexistují: - doi - hdl handle - issn převzítzkatalogizačníhozáznamunk ČR - isbn převzítzkatalogizačníhozáznamunk ČR - ccnb ččnb převzítzkatalogizačního záznamunkčr - permalinkzáznamuzkatalogunkčr,např. http://aleph.nkp.cz/f/?func=direct&doc_nu mber=002186258&local_base=nkc - urnnbn prourn:nbn,např.zápisvetvaru urn:nbn:cz:ndk 123456proprojektNDK; pozor,musíodpovídaturn:nbn,podle kteréhojepojmenovanýpspbalíčekajeho jednotlivésoubory - uuid - jiný interní identifikátor, hodnota atributu local,lzepoužítnapř.kvyjádřeníčárového kódu <location> údaje o uložení popisovaného dokumentu, např. signatura,místouloženíapod. MA <url> prouvedenílokaceelektronickéhodokumentu O <dc:source note note: pro poznámku o typu URL (na plný text, abstraktapod.) <physicallocation> údaje o instituci, kde je fyzicky uložen popisovaný dokument,např.nkčr nutnopoužítkontrolovanýslovník siglyknihovnen (ABA001atd.) odpovídápoli040vmarc21 pozn. u dokumentů vdigitální podobě není možné vyplnit authority authority:hodnota siglaadr > M <dc:source > 29
<shelflocator> signaturanebolokačníúdajeodokumentu M <dc:source > <part> popisčásti,pokudjesvazekčástisouboru, element může být využit jen na zaznamenání <caption> type type:hodnotabudevždy volume O <detail> <caption> text před označením čísla, např. č., část, No. apod. <recordinfo> údaje o metadatovém záznamu jeho vzniku, změnáchapod. <recordcontentsour ce> <recordcreationdate > kód nebo jméno instituce, která záznam vytvořila nebozměnila;nutnovytvořitkontrolovanýslovník RA M R datumprvníhovytvořenízáznamu,naúroveňminut M encoding encoding: záznam bude podle normy ISO 8601 na úroveňminut,hodnotaatribututedyiso8601 <recordchangedate> datumzměnyzáznamu R encoding encoding: záznam bude podle normy ISO 8601 na úroveňminut,hodnotaatribututedyiso8601 <recordorigin> údajeovznikuzáznamu hodnoty:machinegeneratednebohumanprepared R 30
8.3.1.2 Pole MODS a DC pro vnitřní část monografie (textový oddíl a obraz) Element MODS Atributy Popis Pov inn ost <mods> ID ID musí vyjadřovat název úrovně, tj. např. MODS_PICTURE pro obrázek vtextu, MODS_CHAPTER protextovýoddílapod. M <titleinfo> názvováinformacevnitřníčásti <title> vlastnínázevvnitřníčásti(oddílu,obrazu); uobrazubrátpřípadnězpopiskuobrazu; pokud není titul, nutno vyplnit hodnotu untitled <subtitle> podnázevvnitřníčásti(oddílu); např.podnázevkapitoly Element DC M <dc:title> MA <dc:title> <partnumber> číslovnitřníčásti RA <dc:title> <partname> názevvnitřníčásti RA <dc:title> <name> type údaje o odpovědnosti za vnitřní část (oddíl i obraz) type:použítjedenztypů: - personal - corporate - konference - family <namepart> údajeokřestnímjméněapříjmeníapod. MA MA <dc:creator> type nutnovyjádřitprokřestníjménoipříjmení pokud nelze rozlišit křestní jméno a příjmení, nepoužije se type a jméno se zaznamená vpodobě jaké je do jednoho elementu <namepart> type:použítjednuzhodnot: - date doporučenépokudlzeuvést - family povinnépokudlzeuvést - given povinnépokudlzeuvést - termsofaddress doporučené pokud lze uvést 31 nutno do jednoho pole DC spojit jméno i příjmení
<role> specifikace role osoby nebo organizace uvedené velementu<name> <roleterm> type authority popisrole nutnopoužítkontrol.slovníknapř.zmarc21 type: code kód role zkontrolovaného slovníku rolí http://www.loc.gov/marc/relators/relaterm.html ) authority údaje o kontrolovaném slovníku využitémkpopisurole,kpopisuvýšeuvedeného MARC seznamu nutno uvést authority= marcrelator <genre> bližšíúdajeotypuvnitřníčásti povinné hodnota:chapternebopicture MA MA M <dc:type> type type: doporučené hodnota pro chapter možnost vyplnit bližší určení typu oddílu (možnost použít DTD monografie, MonographComponentPart Types): - tableofcontent - advertisement - abstract - introduction - review - dedication - bibliography - editorsnote - preface - chapter - article - index (použije se pro všechny typy seznamů mimo hlavní obsah; např. seznamobrazů,tabulekapod.) - unspecified pokudnepatříanidojedné zvýšeuvedenýchkategorií - aj. hodnota pro picture možnost vyplnit další určení typu obrazu: 32
- table - illustration - chart - photograph - graphic - map - advertisement - cover - unspecified pokudnepatříanidojedné zvýšeuvedenýchkategorií - aj. <language> údajeojazycevnitřníčásti nelzeplnituobrazu; vpřípadě vícenásobného výskytu nutno element <language>opakovat <languageterm> přesnéurčeníjazyka kódem nutno použít kontrolovaný slovník ISO 639 2, http://www.loc.gov/standards/iso639 2/php/code_list.php nelzeplnituobrazu type authority type:použíthodnotucode authority:použíthodnotu iso639 2b <physicaldescription> obsahujeúdajeofyzickémpopisuvnitřníčásti; určenospíšeprooddílynežproobrazy <form> údaje o fyzické podobě vnitřní části, např. print, electronicapod. authority authority:hodnota marcform 33 MA M <dc:language> R R <dc:format> <abstract> shrnutíobsahuvnitřníčásti R <dc:descriptio n> <note> obecnápoznámkakvnitřníčásti dopoznámkybyseměladávatšifraautoravnitřní části,kterásevyskytujepodvnitřníčástí <subject> údajeověcnémtřídění R <topic> libovolnývýrazspecifikujícínebo charakterizujícíobsahvnitřníčásti; lze (není ovšem nutno) použít kontrolovaný slovník authority (volitelné) např.zbázeautoritautnkčr(věcnétéma) připoužitíautoritníchzáznamůpoužítautnkčr RA <dc:descriptio n> M <dc:subject>
aatributauthority:vyplnithodnotu czenas ; připoužitívolnýchklíčovýchslovatributauthority nepoužívat <geographic> geografickévěcnétřídění použítkontrolovanýslovník např.zbázeautorit AUTNKČR(geografickýtermín) authority authority:vyplnithodnotu czenas <temporal> chronologickévěcnétřídění použítkontrolovanýslovník např.zbázeautorit AUTNKČR(chronologickýúdaj) authority authority:vyplnithodnotu czenas <name> jménopoužitéjakověcnézáhlaví použítkontrolovanýslovník např.zbázeautorit AUTNKČR(jménoosobní) authority authority:vyplnithodnotu czenas <namepart> celéjménosezapíšedotohotoelementu R <dc:subject> R <dc:subject> R <dc:subject> <classification> klasifikační údaje věcného třídění podle Mezinárodníhodesetinnéhotřídění plnitpouzeprooddíl odpovídápoli080marc21 authority authority:vyplnithodnotu udc <identifier> údaje o identifikátorech, obsahuje unikátní identifikátory mezinárodní nebo lokální, které vnitřníčástmá vizpřehledtypůatributůníže type type: budou se povinně vyplňovat následující hodnoty, pokud existují pro oddíl nebo obraz: - doi - hdl handle - urnnbn pro URN:NBN, u vnitřních částí monografií se surn:nbn počítá primárně pro články ve sborníku, ne pro obyčejné kapitoly - uuid jinýinterníidentifikátor,hodnotaatributu local, lzepoužítnapř.kvyjádřeníčárovéhokódu <part> vrchní element, který bude použit pouze na záznamrozsahuvnitřníčásti; nelzeuobrazu RA <dc:subject> M <dc:identifier> povinné RA 34
<extent> upřesněnípopisučásti rozsahnastránkách MA <dc:format> <start> prvnístránka,nakterévnitřníčástzačíná MA <dc:coverage> <end> poslednístránka,nakterévnitřníčástkončí MA <dc:coverage> <recordinfo> údaje o metadatovém záznamu vnitřní části jehovzniku,změnáchapod. <recordcontentsource > kódnebojménoinstituce,kterázáznamvytvořila nebo změnila; nutno vytvořit kontrolovaný slovník M R <recordcreationdate> datumprvníhovytvořenízáznamuvnitřníčásti M encoding encoding:záznambudepodlenormyiso8601na úroveňminut,hodnotaatribututedyiso8601 <recordchangedate> datumzměnyzáznamuvnitřníčásti R encoding encoding:záznambudepodlenormyiso8601na úroveňminut,hodnotaatribututedyiso8601 <recordorigin> údajeovznikuzáznamuvnitřníčásti hodnoty: machine generated nebo human prepared R 35
8.3.1.3 Pole MODS a DC pro přílohu Element MODS Atributy Popis Povin nost <mods> ID ID musí vyjadřovat název úrovně, tj. MODS_SUPPLEMENT <titleinfo> názvováinformacepřílohy použít názvové autority nebo katalogizační záznam <title> názvová informace název svazku monografie,jehožsoučástípřílohaje; převzítzkatalogu <partnumber> číslopřílohy,pokudnějakémá doporučenépokudlzevyplnit M Element DC M <dc:title> MA <dc:description> <partname> názevpřílohy MA <dc:title> <name> údajeoodpovědnostizapřílohu MA type type:použítjedenztypů: - personal - corporate - conference - family <namepart> údajeokřestnímjméněapříjmeníapod. nutnovyjádřitprokřestníjménoipříjmení pokudnelzerozlišitkřestníjménoapříjmení, nepoužije se type a jméno se zaznamená vpodobě jaké je do jednoho elementu <namepart> type type:použítjednuzhodnot: - date doporučenépokudlzeuvést - family povinnépokudlzeuvést - given povinnépokudlzeuvést - termsofaddress doporučenépokudlze uvést <role> specifikace role osoby nebo organizace uvedenévelementu<name> <roleterm> popisrole nutnopoužítkontrol.slovníknapř.zmarc21 MA MA MA <dc:creator> nutno do jednohopoledc spojit jméno i příjmení 36
type authority type: code kód role zkontrolovaného slovníku rolí http://www.loc.gov/marc/relators/relaterm. html) authority údaje o kontrolovaném slovníku využitém kpopisu role, kpopisu výše uvedeného MARC seznamu nutno uvést authority= marcrelator <typeofresource> popis charakteristiky typu nebo obsahu přílohy - jednazhodnot: - text např.propřílohutypučasopis, kniha,brožuraapod. - cartographic promapy - notatedmusic - sound recording musical pro hudebnícd/dvd - soundrecording nonmusical - soundrecording - stillimage fotografie,plakátyapod. - movingimage profilmovádvd - threedimensionalobject - software, multimedia pro CD/DVD sesw - mixedmaterial <genre> bližšíúdajeotypudokumentu hodnota: supplement <origininfo> informaceopůvodupřílohy plnit pokud se liší od údajů v popisu svazku monografie (platí i pro jednotlivé subelementy) Poznámka: Jedennebovícevýskytůelementůse předpokládáprovydavatele,dalšívýskyt vpřípaděnutnostipopsattiskaře.pokudje nutnovyjádřittiskaře(pole260podpole f a e a g vmarc21),jenutnoelement R <dc:type> M <dc:type> MA 37
<origininfo>opakovatsatributem transliteration= printer aelementy<place>, <publisher>,<datecreated>,kterébudou obsahovatúdajeotiskaři. <place> údaje o místě spojeném svydáním, výrobou nebopůvodempřílohy <placeterm> konkrétníurčenímísta,např.praha odpovídá hodnotě katalogizačního záznamu, pole260,podpole a type type budevždytext <publisher> jméno entity, která přílohu vydala, vytiskla nebojinakvyprodukovala odpovídá poli 260 podpoli b katalogizačníhozáznamuvmarc21 <dateissued> datum vydání přílohy, dle toho jaké údaje jsoukdispozici možno použít hodnotu zkatalogizačního záznamu,pole260,podpole c jiná data než rok možno zapsat vnásledujícíchpodobách: DD.MM.RRRR pokud víme den, měsíc i rokvydání RRRR pokudvímepouzerok MM.RRRR pokud víme jen měsíc a rok vydání DD. DD.MM.RRRR vydáníprovícední MM. MM.RRRR vydáníprovíceměsíců MA MA MA MA <dc:coverage> <dc:coverage> <dc:publisher> <dc:date> qualifier qualifier možnost dalšího upřesnění, hodnota approximate pro data, kde nevímepřesnýúdaj <datecreated> datumvytvořenípřílohy bude použito pouze při popisu tiskaře, viz poznámka u elementu <origininfo> nebo např.upopisucd/dvdapod. odpovídá hodnotě zkatalogizačního záznamu,pole260,podpole g R 38
qualifier qualifier možnost dalšího upřesnění, hodnota approximate pro data, kde nevímepřesnýúdaj <frequency> údajeopravidelnostivydávání odpovídá údaji MARC21 vpoli 310 nebo pozici18vpoli008 RA <language> údajeojazycedokumentu M <languageterm> přesnéurčeníjazyka kódem nutnopoužítkontrolovanýslovníkiso639 2, http://www.loc.gov/standards/iso639 2/php/code_list.php type authority type:použíthodnotucode authority:použíthodnotu iso639 2b <physicaldescription> obsahujeúdajeofyzickémpopisu M <form> údaje o fyzické podobě dokumentu, např. print,electronicapod. povinné pro tištěné předlohy hodnota print, pro elektronicképřílohy electronic odpovídáhodnotámpozice23a29vpoli008 MARC21 authority authority:hodnota marcform <extent> údaje o rozsahu (stran, svazků nebo rozměrů) odpovídáhodnotámvpoli300podpolích a a c MARC21, pokud jsou vyplněna obě pole,budeseelement<extent>opakovat <note> poznámkaofyzickémstavudokumentu; prokaždoupoznámkujenutnovytvořitnový <note>element <abstract> shrnutíobsahudokumentu odpovídápoli520marc21 <note> obecnápoznámkakdokumentu odpovídápoli500vmarc21 M <dc:language> M <dc:format> RA RA <subject> údajeověcnémtřídění R RA RA <dc:format> <dc:description> <dc:description> authority authority:vyplnithodnotu czenas <topic> libovolnývýrazspecifikujícínebo charakterizujícíobsahpřílohy; M <dc:subject> 39
použít kontrolovaný slovník např. zbáze autoritautnkčr(věcnétéma) <geographic> geografickévěcnétřídění použít kontrolovaný slovník např. zbáze autoritautnkčr(geografickýtermín) <temporal> chronologickévěcnétřídění použít kontrolovaný slovník např. zbáze autoritautnkčr(chronologickýúdaj) <name> jménopoužitéjakověcnézáhlaví použít kontrolovaný slovník např. zbáze autoritautnkčr(jménoosobní) <namepart> celéjménosezapíšedotohotoelementu R <dc:subject> R <dc:subject> R <dc:subject> <classification> klasifikační údaje věcného třídění podle Mezinárodníhodesetinnéhotřídění odpovídápoli080marc21 authority authority:vyplnithodnotu udc M <dc:subject> <identifier> údaje o identifikátorech, obsahuje unikátní identifikátory mezinárodní nebo lokální, které příloha má viz přehled typů atributů níže type type:budousepovinněvyplňovatnásledující hodnoty,pokudexistují: - doi - hdl handle - issn převzítzkatalogizačního záznamnkčr - isbn převzítzkatalogizačního záznamnkčr - ccnb ččnb převzít zkatalogizačníhozáznamnkčr - permalinkzáznamuzkatalogunk ČR,např. http://aleph.nkp.cz/f/?func=direct& doc_number=002186258&local_bas e=nkc - urnnbn prourn:nbn - uuid - jiný interní identifikátor, hodnota MA <dc:identifier> 40
atributu local, lze použít např. kvyjádřeníčárovéhokódu 41
8.4 METS část <amdsec> Technická a administrativní metadata formáty MIX a PREMIS - provšechnadigitalizovanádatasebudouvyužívatformátpremis(jehočástiobject,eventaagent), proobrazovádatadáleiformátmix - technickáaadministrativnímetadatabudouzabalenavčásti<amdsec>formátumetsvevlastních formátech(mix,premis částiobject;events;agent) - technická a administrativní metadata budou vznikat i pro prvotní sken(většinou TIFF), který se po nutnýchúpraváchmažeadáleneuchovává o technickámetadatajsouurčenaprimárněprozachycenítechnickýchinformacíoformátech souborů,ovýsledcíchvalidacíakontrol o administrativní metadata zachycují veškeré změny, procesy apod., které byly na datech i metadatechprovedeny - technickámetadatapřicházejícízdigitalizacejsoudálevmaximálnímířeukládánavltpsystému(po namapovánídointerníhoformátultpsystému) - všechnypremiszáznamybudouvevedlejšímmetszáznamu(amd_mets.xml),kterýjeurčenpro administrativníatechnickámetadata(spolusmixzáznamy). o celýmetszáznam(amd_mets.xml)ajelinkovánzhlavníhometszáznamudokumentu - plnění technických metadat se předpokládá z výstupů vzniklých využitím služeb třetích stran jako jsou JHOVE2, PRONOM aj.) - <amdsec> část bude existovat vždy jedna pro všechny reprezentace jedné stránky dokumentu (MC, ALTO XML, OCR.TXT) a bude obsahovat metadata v <techmd> a <digiprovmd> podčástech - část<amdsec>musímítidavnořenýelement<techmd>nebo<digiprovmd>,obasidavnořeným elementem<mdwrap>satributemmdtype element atributy popis Povin nost <amdsec> element obsahující technická metadata ve formátu PREMIS nebo MIX <techmd> nebo <digiprovmd> ID ID identifikátorkonkrétníčásti<amdsec>,např.prostránku1by hodnotamohlabýt PAGE0001 elementrozlišujícítypyjednotlivýchadministrativníchmetadat M ID ID pro část <techmd>: - pro části obsahující PREMIS object hodnota OBJ_001 objekt1(premisobjectprosmazanýtiff),obj_002promc, OBJ_003proALTOXML - pročástiobsahujícímixhodnota MIX_001 =MIXmetadata propůvodnítiff, MIX_002 promc 42 M
ID pro část <digiprovmd>: - pročástiobsahujícípremis eventhodnota EVT_001 apod. pročástiobsahujícípremis agenthodnota AGENT_001 apod. <mdwrap> elementobsahujícívloženézáznamypremis,mix M MDTYPE MDTYPE - pro záznamy PREMIS object, event i agent vždy hodnota PREMIS prozáznamymixhodnota NISOIMG Příklad: <mets:amdsec ID="PAGE0001"> <mets:techmd ID="OBJ_001"> <mets:mdwrap MDTYPE="PREMIS" MIMETYPE="text/xml"> <mets:xmldata>... </mets:xmldata> </mets:mdwrap> </mets:techmd> <mets:techmd ID="MIX_001"> <mets:mdwrap MDTYPE="NISOIMG" MIMETYPE="text/xml"> <mets:xmldata>... </mets:xmldata> </mets:mdwrap> </mets:techmd> <mets:digiprovmd ID="EVT_001"> <mets:mdwrap MDTYPE="PREMIS" MIMETYPE="text/xml"> <mets:xmldata>... </mets:xmldata> </mets:mdwrap> </mets:digiprovmd> <mets:digiprovmd ID="AGENT_001"> <mets:mdwrap MDTYPE="PREMIS" MIMETYPE="text/xml"> <mets:xmldata>... </mets:xmldata> </mets:mdwrap> </mets:digiprovmd> </mets:amdsec> 43