Definice metadatových formátů pro digitalizaci periodik Vychází z obecné specifikace metadat v projektu NDK verze 1.3 Autor: Jan Hutař Úpravy: Pavla Švástová 2012
Historie verzí jméno datum verze dokumentu provedenézměny PavlaŠvástová 2.3.2012 1.3 Úpravy dle domluv sproducenty dat a krajskými knihovnami, přidána druhá logická mapa JanHutař 12.2.2012 1.2 doplněna možnost pro obrázek, který není součástí článku do logické strukturální mapy, TYPE<div>jePAGE JanHutař 6.12.2011 1.2 úpravaatributuusev<filegroup>ualtoxml JanHutař NK 25.11.2011 1.2 úprava logické strukt. mapy vukázce oprava AUTHORuobrazunaPICT_AUTHOR JanHutař NK 25.10.2011 1.2 úpravy překlepů, u elementu <genre> u vnitřní části přidána hodnota atributu unspecified ; přidánelement<url>kelementu<location>; JanHutař NK 19.10.2011 1.2 přidány informace o kořenovém elementu METS(LABELaTYPE);opravypřeklepůoomylů JanHutař NK 20.9 12.10.2011 1.1 úpravy DC; povinností výskytu u některých elementů vmods; forma zápisu data u vnitřních částí MODS; úpravy povinností plnění subelementů ALTO <preprocessingstep> <processingdatetime>; změna MD5 souborů, doplněnaspecifikaceinfo.xml;novýsloupecpro povinnost elementů; <margin> valto bude obsahovat text a textové bloky; upřesnění příloh; u všech tabulek přibyl sloupec povinnost; do logické mapy doplněn <div> pro přílohu;specifikaceinfo.xml;+dalšídrobnosti JanHutař NK 25. 7.9.2011 verze1.0 kompletní úprava logické strukturální mapy; doplněnídetailůometszáznamu JanHutař NK 22 24.8.2011 draft0.2 vymazání UC zcelého dokumentu, úpravy textu, výměna obrázku; kvnitřní části přidán element recordinfo nutno kvůli údajům o popisu článku; element <subject> přidán kpopisu titulu, čísla, vnitřní části a přílohy; kčíslupřidánabstrakt JanHutař NK 15.8.2011 vymazán element <name> na úrovni titulu; drobnéúpravy JanHutař NK 21.7.2011 draft0.1 prvníznění 2
Obsah dokumentu HISTORIE VERZÍ... 2 OBSAH DOKUMENTU... 3 1 VÝCHODISKA... 4 2 VÝSTUPY DIGITALIZACE... 5 3 GRANULARITA METADATOVÉHO ZÁZNAMU... 6 4 IDENTIFIKÁTORY... 7 5 STRUKTURA PSP BALÍČKU... 8 5.1SOUBORINFO.XML...9 5.2SLOŽKA[MASTERCOPY]...9 5.3SLOŽKA[USERCOPY]...9 5.4SLOŽKA[ALTO]...10 5.5SLOŽKA[TXT]...10 5.6SLOŽKA[AMDSEC]...10 5.7SOUBORHLAVNI_METS.XML...10 5.8SOUBORMD5...11 6 NÁZVOVÁ KONVENCE SLOŽEK A SOUBORŮ... 12 7 TRANSPORTNÍ BALÍK PRO JEDEN NEBO VÍCE PSP BALÍČKŮ... 14 8 METADATA... 15 8.1KOŘENOVÝELEMENTHLAVNÍHOMETSZÁZNAMU...15 8.2METSHLAVIČKA<METSHDR>...16 8.3METSČÁST<DMDSEC> BIBLIOGRAFICKÁMETADATA FORMÁTMODSADUBLINCORE...17 8.3.1 Pole MODS a Dublin Core pro jednotlivé části periodika... 20 8.3.1.1 PoleMODSaDCprotitulperiodika...20 8.3.1.2 PoleMODSaDCpročísloperiodika...27 8.3.1.3 PoleMODSaDCprovnitřníčástperiodika(článekaobraz)...33 8.3.1.4 PoleMODSaDCpropřílohu...38 8.4METSČÁST<AMDSEC> TECHNICKÁAADMINISTRATIVNÍMETADATA FORMÁTYMIXAPREMIS...43 8.4.1 PREMIS Objects... 45 8.4.2 PREMIS Event... 51 8.4.3 PREMIS Agent... 54 8.4.4 Technická metadata MIX... 56 8.5METSČÁST<FILESEC>...66 8.5.1 <filesec> hlavního záznamu METS... 66 8.5.2 <filesec> vedlejšího METS záznam AMD_METS.xml... 68 8.6METSČÁST<STRUCTMAP> STRUKTURÁLNÍMETADATA...69 8.6.1 <structmap> hlavního záznamu METS... 69 8.6.1.1 Vyjádřenífyzickéstrukturálnímapy...69 8.6.1.2 Vyjádřenílogickéstrukturálnímapy...70 8.6.2 <structmap> vedlejšího záznamu METS (AMD_METS.xml)... 77 8.7OCR(ALTOXMLATXTOCR)...78 3
1 Východiska - UC=usercopy=uživatelskékopie - MC=mastercopy=archivníkopie - PS = původní sken obrazový soubor vzniklý při digitalizaci, který se po zpracování (ořez, narovnáníapod.),mažeadáleseneukládá - u všech metadatových formátů budou použity verze aktuální vdobě implementace projektu NDK,neboverzepředchozívpřípadě,ženováverzejenovámin.3měsíce - základníintelektuálníentitaveworkflowdigitalizaceanásledněivltpsystému=čísloperiodika - PSPbalíček producersubmissionpackage o balíček dat a metadat, který přichází od producenta dat (tedy např. zworkflow digitalizace) o PSPbalíčekbudeobsahovatkompletníintelektuálníentitutj.čísloperiodika o zworkflowdigitalizacelzeposlatvícepspbalíčkůvbalíkunapř.[.tar]apod. o pokud má dvousvazkové dílo vkatalogu knihovny bibliografický záznam pro každý svazek, vznikne pro každý svazek PSP balíček a každý svazek bude brán jako jedna intelektuální entita; to samé platí i pro případ, že vícesvazkové dílo má pouze jeden záznam - základní bibliografická metadata budou stahována přímo zknihovních katalogů do workflow digitalizace - jakovýchozíswprovytvářenísouborůjpeg2000sebudepoužívatkakadu - veškerámetadatamusíprozápispoužívatkodováníutf 8 4
2 Výstupy digitalizace 1. archivníkopie(1mcprokaždoustránku) 2. uživatelskékopie(1ucprokaždouvznikloumc,tedystránku) 3. OCR ALTOXMLsouborprokaždoustránku 4. OCR TXT soubor pro možnost stáhnout si jen text dokumentu (tam kde kvalita OCR je odpovídající),vyhledávání/indexace. 5. metadatapromc a. bibliografickámetadata MODSaDC b. strukturálnímetadata METS c. technickámetadata MIX,PREMIS d. administrativnímetadata PREMIS,METS 6. kontrolnímetadatovésoubory(skontrolnímisoučtyaúdajiovznikudatapod.) Pozn. METS neobsahuje popisná, ani technická metadata pro UC. Obrazové soubory UC jsou pouze součástí strukturálnímapy<structmap>a<filesec>.součástípspbalíčkujsouobrazyucvesložce[usercopy]. 5
3 Granularita metadatového záznamu Periodika - základní intelektuální entitou periodik je 1 číslo - každé číslo periodika má svůj vlastní metadatový záznam (=METS), který obsahuje údaje o nadřazených entitách čísla jako jsou ročník, titul periodika, tj. je pro uživatele i pro systém možnéspojitjednotliváčísladoročníkůatitulů 6
4 Identifikátory Doworkflowdigitalizacebudoupřicházetbibliografickámetadata,kterájižbudouobsahovatnásledující identifikátoryvrchníchúrovníintelektuálníchentit(úroveňtitulu): - ISBN pouzeprotitulmonografie(jednosvazkové),neboprosoubormonografií,kterémajípouze jedensoubornýzáznam,isbnnenípřidělenovždy - ISSN pouzeprotitulperiodika,issnnenípřidělenovždy(chybínapř.ustarýchtitulůz19.století) - ččnb identifikátorentitytakjakodpovídákatalogizačnímuzáznamu,tj.každáentitasezáznamem vkatalogunk/mzkmátentoidentifikátor - pokud není ani jeden zvýše uvedených, lze použít čárový kód dokumentu, systémové číslo, signatura,nebosystémovéčíslokombinovanéspolem001marczáznamuapod. Nižší úrovně intelektuálních entit by měly mít také své identifikátory, ideálně URN:NBN (pouze pro digitálnídokumenty),kterébudepřidělovánoběhemdigitalizace 1. - přidělovánobudelogickýmúrovním(entitám) o uperiodiktedy:číslo,vnitřníčást,příloha,případněročník - dalšímožnostíjevyužitíuuid 1 buďpřímovswproworkflowdigitalizace,nebozapomociaplikaceresolverurn:nbn 2 https://confluence.ucop.edu/display/curation/bagit 7
5 Struktura PSP balíčku Vkapitole je návrh struktury balení dat a metadat vjednom PSP balíčku na výstupu zworkflow digitalizace. Jedná se o variantu, kdy technická a administrativní metadata nejsou obsažena vhlavním METS záznamu, ale pro každou stránku vjiném dalším METS záznamu (AMD_METS.xml). Důvodem je to, že pokudbybylovševhlavnímmetsu,bylbyneúměrnědlouhý.taktojezhlavníhozáznamunalinkováno. PSP balíček = 1 složka pro 1 číslo periodika. HlavnísložkaPSPbalíčkuobsahujenásledujícísložkyasoubory: 8
5.1 soubor info.xml VelmikrátcetubudouzaznamenányúdajeovznikuceléhoPSPbalíčku kdo,kdyhovytvořil,jakouměl velikost,odkudkambylnakopírovánapod.obsahovatbytakémělinformaciostavuzpracováníbalíčku. ZaznamenánymohoubýtúdajeoobsahuPSPbalíčku početanázvysouborůapod.souborobsahuje odkaznasouborsmd5.souborinfo.xmlbytakémohlbýtvedlehlavníhopspbalíčku.údajeastruktura info.xmlsouboru: 1. vznikbalíčku datumdleiso8601naúroveňvteřin 2. IDbalíčku použítidentifikátorčíslaperiodika(urn:nbn) viznázvovákonvencevkap.6 3. IDtitulu ččnb,isbnneboissn(opakovatelné) 4. údajeovětšímcelku(projektu),dokteréhobalíčekpatří např.digitalizaceproanl 5. názevinstituce,kterájezadavatelemdigitalizace 6. tvůrcebalíčku kódinstituce(firmy),kterábalíčekvytvořila 7. velikostbalíčku vkb 8. obsahbalíčku 9. názvysouborůvčetnědirectorypathakoncovky(mimetype)(nepovinné) 10. početsouborůvbalíčkucelkem 11. odkaznasouborsmd5ajehomd5 12. poznámka např.otom,žebalíčekneobsahujeocrapod. <?xml version="1.0" encoding="utf-8"?> <info xmlns="http://www.ee.cz/schemas/ndk/info.xsd"> <created>2012-01-26t13:53:11</created> <packageid>anl_123456</packageid> <titleid TYPE= issn >ISSN0009-2770</titleid> <titleid TYPE= ccnb >cnb123456789</titleid> <collection>anl</collection> <institution>nkp</institution> <creator>název firmy</creator> <size>123456789</size> <itemlist ITEMTOTAL="35"/> <item>... </item> <checksum TYPE="md5" CHECKSUM="fe8e0172fb031cdc79a9f6002cb64f55" >/MD5_anl001-000003.md5</checksum> <note /> </info> 5.2 složka [mastercopy] Složka smaster kopiemi, obsahuje soubory JPEG2000 vneztrátové kompresi, 1 soubor = 1 stránka, tj. obsahujevšechnynaskenovanéstránkyčíslaperiodika. 5.3 složka [usercopy] Složka suživatelskými kopiemi, pro každou naskenovanou stránku čísla periodika obsahuje jeden JPEG2000souborseztrátovoukompresí. 9
5.4 složka [ALTO] Obsahuje ke každé stránce 1 ALTO XML soubor, tj. tolik ALTO XML souborů kolik je stránek čísla periodika. 5.5 složka [TXT] Obsahujekekaždéstránce1OCRsouborjakočistýtext.Tj.tolikOCR.TXTsouborůkolikjestránekčísla periodika. 5.6 složka [amdsec] Složka stechnickými metadaty obsahuje pro každou naskenovanou stránku čísla časopisu 1 METS soubor (AMD_METS.xml).ZáměrněnejsoutatometadatavhlavnímMETSzáznamu(hlavni_METS.xml), protožetenbyneúměrněnarostlabylobyobtížnésnímpracovat.musíznějbýtovšemnalinkována(z částifilesec).každýmetssouboramd_mets.xmlobsahujenásledujícíčástimetsformátu: - amdsec administrativnímetadata obsahuječást o technických metadat (techmd), která ve formátu PREMISobject popisuje vlastnosti archivníchkopií,altoxml,původníhotiffsouboru,zekteréhovzniklyarchivníkopie. Dále je přítomen záznam technických metadat vmix formátu pro archivní kopie a pro původnítiff. o metadat o provenienci digitálních objektů (digiprovmd) vtéto části je využit formát PREMISeventaPREMISagent. o filesec sekce sodkazy na soubory povinná část METS záznamu vpřípadě tohoto METS záznamu pro jednu stránku, který vzniká primárně kzachycení technických a administrativních metadat bude odkazovat na soubory, které jsou stou konkrétní stránkou spojeny, tj. archivní kopie, ALTO XML aocr TXT. Jde o povinnou sekci METS záznamu. o structmap pouze fyzická strukturální mapa, povinná část METS záznamu. Bude ukazovat strukturu souborů kdané stránce, tj. opět archivní kopie, ALTO XML a OCR TXT.ProdalšímapovánídoLTPsystémunebudepotřeba. 5.7 soubor Hlavni_METS.xml DalšíčástíPSPbalíčkujehlavníMETSdokument.HlavníMETSzáznamtedyobsahuje: - dmdsec bibliografická metadata kčíslu periodika včetně popisu nadřazených entit (např. ročník,titul)nebonaopakčástí(např.kapitola).základbudepřevzatzkatalogu,případnýdalší popis částí bude vyroben vdigitalizaci případně dogenerován. Hlavním formátem bude MODS, nutnáproltpjeipřítomnostzkrácenéhozáznamuvdublincore. - filesec hlavníčástslinkynavšechnydigitálníobjekty(archivníkopie,uživatelskékopie,alto 10
XMLaOCRTXT),kterésevážíkjednomučísluperiodika.Obsahujetakélinkynaadministrativní metadataamd_mets.xmldosložky[amdsec]. - structmap strukturálnímapaprocelýdokument,tj.projednočísloperiodika.obsahuje: o fyzickou část obsahující informace o všech reprezentacích konkrétní stránky (archivní kopie,uživatelskákopie,altoxml,ocrtxtaamd_mets.xml) o logickoučást vyjadřujelogickoustrukturučíslaperiodikasodkazynaaltoxml o mapovánínaaltoxmlareas 5.8 soubor MD5 PosledníčástíPSPbalíčkujesouborskontrolnímisoučtyprovšechnysouborybalíčku(kroměinfo.xmla.md5souborusamotného).Soubor.md5jejedenpro1celýbalíčekSPS(balíčeksčíslemperiodikanebo svazkem monografie). Tento soubor.md5 obsahuje kontrolní součet pro každý soubor obsažený vpsp balíčku. Ztohoto důvodu nejsou samostatné kontrolní součty součástí podsložek balíčku. Kontrolní součtyjsoutakésamozřejměvtechnickýchmetadatech. 11
6 Názvová konvence složek a souborů PojmenováníPSPbalíčku: - každýpspbalíčekpřicházejícízdigitalizacebymělobsahovatpouzejedinouintelektuálníentitu (čísloperiodika).pak musí název balíčku vycházet z identifikátoru této entity, např. URN:NBN, číslo čárového kódu použitého na fyzické jednotce apod. - každé číslo periodika musí mít svůj jednoznačný identifikátor, tím pádem pak každý PSP balíček a každý soubor v něm má vlastní jednoznačný identifikátor Pojmenovánísložek: - viznávrhstrukturpspbalíčku(kap.5) Pojmenovánísouborů: - názvy jakýchkoliv souborů náležejících kjedné základní entitě (svazek nebo číslo) musí být založenynajednomtypuidentifikátoru - pročísloperiodikabytakovýmidentifikátoremmohlobýturn:nbn,ččnb,isbnneboissntitulu +dalšíupřesnění(číslovýtiskuapod.) - podobně využitelným identifikátorem by mohlo být generované číslo UUID, které by se generovaloprokaždýsoubor.tímbyseovšemztratilavazba(ivizuální)navrchníúroveňtitului vazbanasouvisejícísoubory(stránkavjp2aknínáležejícísouboraltoxmlapod.). SvyužitímURN:NBNmohlobytovypadatnásledovně(POZOR: je použit příklad pojmenování pro projekt ANL+ digitalizace periodik): typsouboru názevsouboru vysvětlení PSPbalíček(číslo,svazek) ANL_123456 název celé složky PSP balíčku, u základních int. entit bude v názvu využitovždyurn:nbn archivníkopie MC_ANL_123456_0013.jp2 archivní JPEG2000 stránky 13 čísla periodikasurn:nbn:cz:anl 123456 uživatelskákopie UC_ANL_123456_0013.jp2 uživatelskákopieveformátujpeg2000 stránky 13 čísla periodika s urn:nbn:cz:anl 123456 ALTOXML ALTO_ANL_123456_0013.xml ALTOsoubornáležejícíke13téstránce z čísla periodika s urn:nbn:cz:anl 123456 OCRTXT TXT_ANL_123456_0013.txt TXT soubor s OCR náležející ke 13té stránce z čísla periodika s urn:nbn:cz:anl 123456 info.xml INFO_ANL_123456.xml info xml k celému PSP balíčku čísla periodika 12
MD5 ANL_123456.md5 soubor s kontrolními součty k celému PSPbalíčkučíslaperiodika Hlavni_METS.xml METS_ANL_123456.xml hlavní METS záznam k celému číslu periodikasurn:nbn:cz:anl 123456 AMD_METS.xml AMD_METS_ANL_123456_0013.xml METS záznam s technickými metadaty pro stránku 13 z čísla periodika s urn:nbn:cz:anl 123456 popispojmenovánísložekvizstrukturabalíčkuvýševkapitole5 Složka jednoho balíčku PSP, který obsahuje jen jeden obrazový soubor kprvní stránce čísla periodika, pakmůževypadatnásledovně(příklad balíčku z digitalizace v projektu ANL+): 13
7 Transportní balík pro jeden nebo více PSP balíčků PokudbudejedenPSPbalíkobsahující1základníintelektuálníentitu(čísloperiodika)přemísťovánnapř. tar,mělbynázevsouborutarodpovídatnázvupspbalíčku(tedyvycházetzpoužitéhoidentifikátorupro číslo). Výstupemworkflowdigitalizacealemůžetakébýtbalík(např.tar),kterýobsahujevícePSPbalíčků toto sdružování bude omezeno jen kapacitou HW. Takovýto sdružený balík by měl být pojmenován na základějižužívanéhoidentifikátoru. - vpřípadě, že balík obsahuje čísla titulu periodika, měl by název balíku vycházet zččnb nebo zissn - vpřípadě, že balík obsahuje svazky vícesvazkového díla, měl by název balíku vycházet zččnb neboisbn - typ identifikátoru musí být vyjádřen vnázvu souboru např. ISSN_1234 5678.tar nebo CCNB_12345678910.tarapod. - lzepočítatstím,žebudedocházetktomu,žesdruženýbalíknebudeobsahovatnapř.všechny číslaurčitéhotituluperiodika tatoskutečnostmusíbýtpatrnáznázvubalíku(např.issn_1234 5678_YYYY kde YYYY může být pořadové číslo, datum, doba vzniku jednoho zvíce balíků obsahujícíchčíslaurčitéhotitulusidentifikátoremissn1234 5678). Transportníbalíkbymělobsahovatnásledujícíčásti: balíčkypsp(svazkůnebočísel) informačnísoubor,kterýodpovídáspecifikaciinfo.xml kontrolnísoučtyvšechpspbalíčků seznambalíčkůvtransportnímbalíku DoúvahymohoupřijítbalícímetodyjakoBagIt 2),tarapod. 2 https://confluence.ucop.edu/display/curation/bagit 14
8 Metadata - veškerámetadatabudou zabalena pomocíkontejnerovéhoformátumets - formátmetsbudevaktuálníverzivdoběimplementaceneboverzipředchozí(prosinec2010verze 1.9 http://www.loc.gov/standards/mets/mets schemadocs.html) - veškerámetadatavevšechformátechmusíbýtzapsánapomocíxmlzapoužitíkodováníutf 8 - vložení metadatových formátů do kontejneru METS bude vždy formou <mdwrap>, tj. ne odkazováním z METS záznamu ven Význam pole povinnost - pole povinnost uvádí,zdajeplněníjednotlivýchelementůpovinné,doporučenénebovolitelné - můženabývatnásledujícíchhodnot o M mandatory(povinněplnit elementjesoučástíkaždéhozáznamu) o MA mandatoryifavailable(povinněplnitpokudjetomožné,pokudlzeapod.) o R recommended(plněníhodnotelementujedoporučeno,neníovšempovinné) o RA recommendedifavailable(doporučenopokudlzeplnit) o O optional(plněníhodnotelementujezceladlekonkrétníchpotřeb) 8.1 Kořenový element hlavního METS záznamu Kořenový element hlavního METS záznamu kjednotlivému číslu periodika musí obsahovat linky na specifikacejednotlivýchpoužitýchmetadatovýchschémat(mets,mods,dublincore). element atributy popis Povinnost <mets> kořenovýelementmetszáznamu M LABEL LABEL název titulu periodika, včetně čísla a data vydání čísla, např. Mladáfrontano.529.06.1979 TYPE TYPE hodnotavždy Periodical Příklad: <mets:mets xmlns:xsi="http://www.w3.org/2001/xmlschema-instance" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:mods="http://www.loc.gov/mods/v3" xmlns:oai_dc="http://www.openarchives.org/oai/2.0/oai_dc/" xmlns:dc="http://purl.org/dc/elements/1.1/" xsi:schemalocation="http://www.w3.org/2001/xmlschema-instance http://www.w3.org/2001/xmlschema.xsd http://www.loc.gov/mets/ http://www.loc.gov/standards/mets/mets.xsd http://www.loc.gov/mods/v3 http://www.loc.gov/standards/mods/mods.xsd http://www.openarchives.org/oai/2.0/oai_dc/ 15
http://www.openarchives.org/oai/2.0/oai_dc.xsd" TYPE="Periodical" LABEL="Chemické listy no.6 1951" xmlns:mets="http://www.loc.gov/mets/"> 8.2 METS hlavička <metshdr> - dokumentujevznikaúpravymetszáznamu element atributy popis Povinnost <metshdr> hlavičkametszáznamu M LASTMODDATE CREATEDATE LASTMODDATE datumposledníúpravyzáznamu,musíbýt vetvaruiso8601(naúroveňvteřin) CREATEDATE datumvytvořenízáznamu,musíbýtvetvaru ISO8601(naúroveňvteřin) <agent> údajeotvůrcizáznamumets M ROLE TYPE ROLE hodnota CREATOR TYPE hodnota ORGANIZATION <name> jménojednotlivceneboorganizace; tvůrce záznamu, buď dodavatel (firma XY) nebo vpřípadě tvorby záznamu vknihovně bude využita sigla knihoven, tj. pronkčrhodnota ABA001 <agent> údajeovlastníkovimets M ROLE TYPE ROLE hodnota IPOWNER TYPE hodnota ORGANIZATION <name> jménojednotlivceneboorganizace; vlastník záznamu, buď dodavatel (firma XY) nebo vpřípadě tvorby záznamu vknihovně bude využita sigla knihoven, tj. pronkčrhodnota ABA001 Příklad: <mets:metshdr CREATEDATE="2012-01-26T13:49:12" LASTMODDATE="2012-01-26T13:49:12"> <mets:agent ROLE="CREATOR" TYPE="ORGANIZATION"> <mets:name>elsyst Egineering</mets:name> </mets:agent> <mets:agent ROLE="IPOWNER" TYPE="ORGANIZATION"> <mets:name>národní knihovna ČR</mets:name> </mets:agent> </mets:metshdr> M M 16
8.3 METS část <dmdsec> Bibliografická metadata formát MODS a Dublin Core - každáčást<dmdsec>musímítidavnořenýelement<mdwrap>satributymdtype,mimetype element atributy popis povi nnos t <dmdsec> identifikátor<dmdsec>částimetszáznamu M ID pro <dmdsec> spopisem titulu periodika hodnota MODSMD_TITLE pro záznam v MODS nebo DCMD_TITLE prozáznamvdublincore pro <dmdsec> spopisem čísla periodika hodnota MODSMD_ISSUE a DCMD_ISSUE pro <dmdsec> spopisem vnitřní části periodika hodnota dle typů vnitřní části (článek, obraz) hodnoty MODSMD_ART a DCMD_ART pro článek a hodnoty MODSMD_PICT a DCMD_PICT proobraz pro <dmdsec> spopisem přílohy periodika hodnota MODSMD_SUPPL a DCMD_SUPPL <mdwrap> elementobsahujícívloženézáznamymods M MDTYPE MIMETYPE MDTYPE hodnota MODS pro záznamy vmods, hodnota DC prozáznamvdublincore MIMETYPE hodnota text/xml Příklad: <mets:dmdsec ID="MODSMD_TITLE"> <mets:mdwrap MDTYPE="MODS" MIMETYPE="text/xml"> - na samotný bibliografický popis bude použit formát MODS, aktuální verze vdobě implementace, nebo verze předchozí(prosinec 2010 verze 3.4 viz http://www.loc.gov/standards/mods/) a formát DublinCore(dáleDC)kvalifikovaný(http://dublincore.org/documents/dcmi terms/) - DC je primárně určeno na poskytnutí dat přes OAI PMH, bude odpovídat OAI XSD (viz http://www.openarchives.org/oai/2.0/oai_dc.xsd)abudesejednatonekvalifikovanýdublincore - DC bude použito, uloženo vmets apod. stejným způsobem jako formát MODS viz struktura PSP balíčkuvýše - pro vytvoření DC zmods formátu může být použito oficiální mapování Kongresové knihovny viz http://www.loc.gov/standards/mods/mods conversions.html - DCaMODSbudevloženvMETSčástidmdSec vizstrukturapspbalíčkuvkap.7 - základním zdrojem pro popisná metadata je katalog NK a MZK pro převod metadat ktitulu periodikazmarc21resp.marcxmldomodslzevyužítoficiálnímapováníakonverzníšablonuze stránekhttp://www.loc.gov/standards/mods/mods conversions.html 17
- u digitalizovaných dokumentů je bibliografický popis vytvářen primárně zpohledu popisu fyzické předlohy,nejdeopopiselektronickéhodokumentu Periodika - základní intelektuální entitou pro popis je číslo periodika, tj. vjednom METS záznamu, který budeobsahovatmetadataastrukturujednohočíslaperiodika,budoumodszáznamyktomuto číslu - metadatabudoupopisovatnásledujícíentity: 1. titul (Title) 2. číslo (Issue) 3. vnitřní část (InternalPart) typy článek (Article) a obraz (Picture) 4. příloha (Supplement) 1. titul (Title) MODSzáznambudeobsahovatiúdaje o ročníku 2. číslo (Issue) typyčíslajsouvelementu<genre>zapoužitíatribututype 3. vnitřní část (InternalPart) typyvnitřníčástičlánekaobrazbymělypokrýtveškerouvariabilitu možností,kterémohoutextyaobrázkynatištěnéstráncemít;bližšíurčenítypůčlánku(novinky, zprávy,reklamaapod.)aobrazu(fotografie,tabulka,ilustrace,grafapod.)budemožnévyjádřit pomocíatributůavýrazůkontrolovanéhoslovníkuvelementu<genre> a) upopisuvnitřníčástijeielement<recordinfo> důvodemjeto,žepopisčlánkůbude vznikatmanuálněaježádoucíovznikuzáznamučlánkudržetkontrolníúdaje;elementje volitelný 4. příloha (Supplement) přílohou se rozumí volně vložená entita do jednotlivého čísla, např. mapa,obsahceléhoročníku,cd/dvdapod. Rozlišujeme3druhypřílohperiodik: a) příloha, která se neskenuje, ale chceme o ní vytvořit bibliografický záznam, dát najevo čtenáři,žeexistuje tomůžebýtnapř.cd/dvd,pohlednice,plakátapod. digitálnípodobapřílohy(pokudexistuje)nenísoučástíbalíčkupspčísla(issue) popislzeudělatvrámcipopisupřílohy(supplement)vmods vizspecifikaceníže takovápřílohanenísoučástílogickéstrukturálnímapyformátumets b) přílohapodobnéhotypu,tvaruavelikostijakojepopisovanéčísloperiodika,kterásespolu sčíslemskenuje digitálnípodobapřílohyje,spolusčíslem(issue),součástípspbalíčkučísla(issue)a jesoučástíhlavníhometszáznamu popislzeudělatvrámcipopisupřílohy(supplement)vmods vizspecifikaceníže takovápřílohamůžemítvnitřníčásti(internalpart)stejnějakočíslo(issue)ajejich textjesoučástíaltoxml,kteréjespolečnépročíslo(issue)ipřílohu(supplement) taková příloha je součástí logické strukturální mapy formátu METS taková příloha je součástí fyzické strukturální mapy formátu METS (linky mezi jednotlivými soubory reprezentujícími stránky a popisnými metadaty) c) příloha odlišného typu typu, tvaru a velikosti než je popisované číslo periodika, která se skenuje zvlášťnačíslenezávisle taková příloha se zpracovává zpohledu katalogizace jako nezávislé periodikum, 18
zpohledudigitalizacepakjako nezávislý časopis můžesejednatopřílohyčasopiseckéhotypuvycházejícíurůznýchdeníků(páteku LidovýchNovin,čtvrtečnípřílohaMFDnesapod.) ktěmtopřílohámvznikajímetadatapodobnějakoprojednotliváčísladeníkůnebo klasickéčasopisy,ovšemnapůvodnímčísle,kekterémupřílohapatřila,nezávisle tj.pro původní číslo,ukteréhobylapříloha,vznikne1popis(pspbalíčeksjedním hlavnímmetszáznamemaaltoxmlsouborem)apropřílohujevytvořendalší1 popis(apspbalíčeksmetszáznamem),jakobyšlooběžnýsamostatnýčasopis přílohasepakpopisujejakočíslo(issue) - jednotlivé MODS záznamy pro části(titul, číslo, vnitřní část a příloha) nejsou samopopisné, tj. neobsahujívždyúdajeovrchníchentitách(článekneobsahujeinformaceotituluapod.) - pro každou entitu vznikne jeden MODS záznam svlastním ID, které bude označovat i typ části (např. článek, ilustrace apod.) vpřípadě opakování částí se bude opakovat odpovídající počet MODSzáznamů - každýmodszáznambudeuloženvevlastnímetsčásti<dmdsec>pomocímdwrap - u úrovní kde je to potřeba (vnitřní část, příloha apod.) se budou opakovat <dmdsec> části tolikrát,kolikjekonkrétníchčástí a) tj.vmetszáznamuvznikne1část<dmdsec>probibliografickýzáznamtituluperiodika, 1část<dmdSec>probibliografickýzáznamčíslaperiodika,několik<dmdSec>částipro vnitřní části (pro všechny články i obrázky) a odpovídající počet <dmdsec> částí pro přílohy,dlepočtupříloh i. bibliografickýpopisobrazůbudevelmiminimalistický - záznamperiodikavkatalogu vkatalozíchnkamzkexistujezáznampouzeprotitulperiodika, neexistují samostatné záznamy pro čísla, ročníky apod. tj. vnitřní členění a popis musí vzniknoutvdigitalizaci,popistituluperiodikamusíbýtstaženzkatalogudoworkflowdigitalizace - stránkasenebudepopisovat,jejílogickéifyzickéčíslováníitypstránkyjeobsaženovestruktuře METSdokumentu(částstructMap) a) typ stránky bude odpovídat novým pravidlům popisu periodik (dočasně na: https://docs.google.com/a/mzk.cz/document/d/1zsrihpdnuy5d_tkv0m8a6neym560dk h2h6xz24tgaew/edit) b) NormalPage, Advertisement, BackCover, BackEndSheet, Blank, FlyLeaf, FrontCover, FrontEndSheet, Index, ListOfIllustrations, ListOfMaps, ListOfTables, NormalPage, Spine, Table,TableOfContents,TitlePage - všechny top elementy MODS formátu jsou opakovatelné, kromě <recordinfo> - všechny elementy Dublin Core jsou opakovatelné 19
8.3.1 Pole MODS a Dublin Core pro jednotlivé části periodika Obsah pole Popis : - vysvětleníapříklad - doporučenéplněnítam,kdejetomožnéuvést - povinnostplatíproelementymodstakproelementydublincorestejně - pokud je rodičovský element např. doporučený, a dceřinný element povinný, znamená to že dceřinnýelementjepovinnýpouzetehdypokudjepoužitelementrodičovský Význam pole povinnost - pole povinnost uvádí,zdajeplněníjednotlivýchelementůpovinné,doporučenénebovolitelné - můženabývatnásledujícíchhodnot o M mandatory(povinněplnit elementjesoučástíkaždéhozáznamu) o MA mandatoryifavailable(povinněplnitpokudjetomožné,pokudlzeapod.) o R recommended(plněníhodnotelementujedoporučeno,neníovšempovinné) o RA recommendedifavailable(doporučenopokudlzeplnit) o O optional(plněníhodnotelementujezceladlekonkrétníchpotřeb) 8.3.1.1 Pole MODS a DC pro titul periodika Element MODS Atributy Popis povi nnos t <mods> ID ID musí vyjadřovat název úrovně, tj. např. MODS_TITLE <titleinfo> názevtituluperiodika proplněnípoužítkatalogizačnízáznam <title> názvováinformace názevperiodika hodnotypřevzítzkatalogu M M Element DC M <dc.title> <subtitle> podnázevperiodika MA <dc.title> <partnumber> číslo části, např. určité řady/edice (část 1, řada B), kpoužitíuročenekapod. <partname> jménoedicenebospeciálníedičnířady,např.hygiena. kpoužitíuročenekaspecializovanýchperiodik <typeofresource> popis charakteristiky typu nebo obsahu zdroje; pro periodikaamonografiehodnotatext; R <dc:descrip tion> R <dc:descrip tion> R <dc:type> 20
mělobysevyčítatzmarc21katalogizačníhozáznamu zpozice06návěští jednazhodnot: - text - cartographic - notatedmusic - soundrecording musical - soundrecording nonmusical - soundrecording - stillimage - movingimage - threedimensionalobject - software,multimedia - mixedmaterial <genre> bližšíúdajeotypudokumentu hodnota: title zkatalogusekzáznamunaúrovnititulupřevádípole 655doelementugenre(např. Českápróza ) <origininfo> informaceopůvodupředlohy Poznámka: Jedennebovícevýskytůelementůsepředpokládápro vydavatele, další výskyt vpřípadě nutnosti popsat tiskaře. Pokud je nutno vyjádřit tiskaře (pole 260 podpole f a e a g vmarc21),jenutnoelement <origininfo> opakovat satributem transliteration= printer a elementy <place>, <publisher>, <datecreated>, které budou obsahovat údajeotiskaři. Pokud bylo za dobu vydávání více vydavatelů, nutno vzítzkatalogizačníhozáznamupole260indikátor02a údajeovydavatelíchopakovat. <place> údaje o místě spojeném svydáním, výrobou nebo původempopisovanéhodokumentu <placeterm> konkrétníurčenímísta,např.praha odpovídá hodnotě zkatalogizačního záznamu, pole 260,podpole a type type bude vždy text M <dc:type> M MA MA <dc:covera ge> <dc:covera ge> <publisher> jméno entity, která dokument vydala, vytiskla nebo jinakvyprodukovala odpovídá poli 260 podpoli b katalogizačního MA <dc:publish er> 21
záznamuvmarc21; vpřípadě, že existovalo více vydavatelů, jsou uvedeni vpoznámcevpoli500amělibyseobjevitvelementu topelementu<note> <dateissued> datum vydání předlohy, nutno zaznamenat vpřípadě titulurokyvnichžčasopisvycházel(např.1900 1939), přebírat ve formě, jak je zapsáno vhodnotě pole v katalogu odpovídá hodnotě zkatalogizačního záznamu, pole 260,podpole c <datecreated> datumvytvořenípředlohy budepoužitopouzepřipopisutiskaře,vizpoznámkau elementu<origininfo> odpovídá hodnotě zkatalogizačního záznamu, pole 260,podpole g <issuance> údajeovydávání hodnota continuing odpovídáhodnotěuvedenénávěštímarc21napozici 07 <frequency> údajeopravidelnostivydávání odpovídá údaji MARC21 vpoli 310 nebo pozici 18 vpoli008 M <dc:date> R M R <language> údajeojazycedokumentu M <languageterm> přesnéurčeníjazyka kódem nutno použít kontrolovaný slovník ISO 639 2, http://www.loc.gov/standards/iso639 2/php/code_list.php type authority type:použíthodnotucode authority:použíthodnotu iso639 2b M <dc:langua ge> <physicaldescription> obsahujeúdajeofyzickémpopisuzdroje/předlohy M <form> údaje o fyzické podobě dokumentu, např. print, electronicapod. properiodikahodnotaprint odpovídáhodnotámpozice23a29vpoli008marc21 authority authority:hodnota marcform <extent> údajeorozsahu(stran,svazkůneborozměrů);použití spíšeuročenekapod. odpovídá hodnotám vpoli 300 podpolích a a c MARC21, pokud jsou vyplněna obě pole, bude se element<extent>opakovat M <dc:format > RA <dc:format > 22
<note> poznámkaofyzickémstavudokumentu; pro každou poznámku je nutno vytvořit nový <note> element zdesezapíšídefektyzjištěnépřidigitalizaciproúroveň periodika (např. chybějící ročníky a chybějící či poškozenáčíslaapod.) <abstract> shrnutíobsahuperiodikajakocelku odpovídápoli520marc21 <note> obecnápoznámkakperiodikujakocelku odpovídápoli500vmarc21 <subject> údajeověcnémtřídění předpokládásepřebíránízkatalogizačníhozáznamu RA R <dc:descrip tion> RA R authority authority:vyplnithodnotu czenas <topic> libovolnývýrazspecifikujícínebo charakterizujícíobsahperiodika; použítkontrolovanýslovník např.zbázeautoritaut NK ČR (věcné téma) nebo obsahpole 650 záznamu MARC21 <geographic> geografickévěcnétřídění použítkontrolovanýslovník např.zbázeautoritaut NK ČR (geografický termín) nebo obsah pole 651 záznamumarc21 <temporal> chronologickévěcnétřídění použítkontrolovanýslovník např.zbázeautoritaut NK ČR (chronologický údaj) nebo obsah pole 648 záznamumarc21 <name> jménopoužitéjakověcnézáhlaví použítkontrolovanýslovník např.zbázeautoritaut NK ČR(jméno osobní) nebo obsah pole 600 záznamu MARC21 <namepart> celéjménosezapíšedotohotoelementu <classification> klasifikační údaje věcného třídění podle Mezinárodníhodesetinnéhotřídění odpovídápoli080marc21 authority authority:vyplnithodnotu udc <relateditem> informace o dalších dokumentech/částech/zdrojích, kteréjsouvevztahukpopisovanémudokumentu; použití pro vyjádření edice, ve které je dokument vydán, údaj o edici musí obsahovat minimálně element<title>sjejímnázvem Poznámka: <dc:descrip tion> M <dc:subject > R <dc:subject > R <dc:subject > R <dc:subject > M <dc:subject > RA 23
element <relateditem> může obsahovat jakýkoliv jiný element MODS jejich použití se řídí pravidly popsanýmiprotytoelementy; type type:hodnota series <identifier> údaje o identifikátorech, obsahuje unikátní identifikátory mezinárodní nebo lokální, které titul periodikamá vizpřehledtypůatributůníže type type:budousepovinněvyplňovatnásledujícíhodnoty, pokudexistují: - doi - hdl handle - issn převzítzkatalogizačníhozáznamunkčr M <dc:identifi er> - isbn převzítzkatalogizačníhozáznamunkčr - ccnb ččnb převzít zkatalogizačního záznamunkčr - permalink záznamu zkatalogu NK ČR, např. http://aleph.nkp.cz/f/?func=direct&doc_num ber=002186258&local_base=nkc - uuid - jiný interní identifikátor, hodnota atributu local, lze použít např. kvyjádření čárového kódu <location> údaje o uložení popisovaného dokumentu, např. signatura,místouloženíapod. MA <url> prouvedenílokaceelektronickéhodokumentu O <dc:source note note:propoznámkuotypuurl(naplnýtext,abstrakt apod.) <physicallocation> údaje o instituci, kde je fyzicky uložen popisovaný dokument,např.nkčr nutno použít kontrolovaný slovník sigly knihovnen (ABA001atd.) odpovídápoli040vmarc21 pozn. u dokumentů vdigitální podobě není možné vyplnit authority authority:hodnota siglaadr > M <dc:source > <shelflocator> siglnaturanebolokačníúdajeodokumentu M <dc:source > 24
<part> popis částí dokumentu, bude využit jen na popis ročníku(volume)periodika type type: hodnota bude vždy volume M <detail> upřesněnípopisučásti M type type: hodnota bude vždy volume <number> čísločásti(ročníku) <caption> text před číslem ročníku, např. ročník, roč., volume apod. <date> datumvztahujícísekčásti vpřípadě, že se ročník vycházel během více let (přelomroku),nutnouvéstobaroky,např.1920 1921 <recordinfo> údaje o metadatovém záznamu jeho vzniku, změnáchapod. <recordcontentsour ce> <recordcreationdate > kód nebo jméno instituce, která záznam vytvořila nebozměnila;nutnovytvořitkontrolovanýslovník MA O MA M R datumprvníhovytvořenízáznamu,naúroveňminut M encoding encoding: záznam bude podle normy ISO 8601 na úroveňminut,hodnotaatribututedyiso8601 <recordchangedate> datumzměnyzáznamu R <dc:descrip tion> povinné pokud lze uvést; nutno doplnit slovo volume number, viz <dc:descrip tion>volum e number: 25 </dc:descri ption> encoding encoding: záznam bude podle normy ISO 8601 na úroveňminut,hodnotaatribututedyiso8601 <recordorigin> údajeovznikuzáznamu hodnoty:machinegeneratednebohumanprepared Příklad: R 25
<mets:dmdsec ID="MODSMD_TITLE"> <mets:mdwrap MDTYPE="MODS" MIMETYPE="text/xml"> <mets:xmldata xmlns:mods="http://www.loc.gov/mods/v3"> <mods:mods ID="MODS_TITLE"> <mods:titleinfo> <mods:title>chemické listy</mods:title> </mods:titleinfo> <mods:genre>title</mods:genre> <mods:origininfo> <mods:place> <mods:placeterm type="text">praha</mods:placeterm> </mods:place> <mods:publisher>průmyslové vydavatelství</mods:publisher> <mods:dateissued>1951</mods:dateissued> <mods:issuance>continuing</mods:issuance> </mods:origininfo> <mods:language> <mods:languageterm type="code" authority="iso639-2b">cze</mods:languageterm> </mods:language> <mods:physicaldescription> <mods:form authority="marcform">print</mods:form> </mods:physicaldescription> <mods:classification authority="udc">54</mods:classification> <mods:classification authority="udc">050</mods:classification> <mods:classification authority="udc">66</mods:classification> <mods:identifier type="issn">0009-2770</mods:identifier> <mods:identifier type="ccnb">cnb000356352</mods:identifier> <mods:identifier type="uuid">{b6edddb3-51b6-4703-9585- FB9B9BFA858A}</mods:identifier> <mods:location> <mods:physicallocation authority="siglaadr">aba001</mods:physicallocation> <mods:shelflocator>54 C 000412</mods:shelfLocator> <mods:shelflocator>nd 000329</mods:shelfLocator> </mods:location> <mods:part type="volume"> <mods:detail type="volume"> <mods:number>105</mods:number> </mods:detail> <mods:date>2011</mods:date> </mods:part> <mods:recordinfo> <mods:recordcreationdate encoding="iso8601">2011-12- 12T00:00:00</mods:recordCreationDate> </mods:recordinfo> </mods:mods> </mets:xmldata> </mets:mdwrap> </mets:dmdsec> 26
8.3.1.2 Pole MODS a DC pro číslo periodika Element MODS Atributy Popis povi nnos t <mods> ID ID musí vyjadřovat název úrovně, tj. např. MODS_ISSUE <titleinfo> název titulu periodika, kterého je číslo součástí, převzítzkatalogizačníhozáznamutituluperiodika použít názvové autority nebo katalogizační záznam M M Element DC <title> názvováinformace titulperiodika převzítzkatalogu M <dc:title> <subtitle> podnázevperiodika RA <dc:title> <partnumber> pořadovéčíslovydání(čísla),např.40; nebo u ročenek číslo určité řady/edice (část 1, řadab) <partname> jméno edice nebo speciální ediční řady, např. Hygiena;lzeuvéstinázevtématickéhočíslanebo zvláštníhovydání; kpoužití u ročenek a specializovaných periodik neboutematickýchčíselnebozvláštníchvydání <name> údajeoodpovědnostizačísloperiodika; nepočítá se svyplněním u deníků, ale např. u ročenek, zvláštních vydání čísel periodika apod., kterémajívlastníhoautora/editora type type:použítjedenztypů - personal - corporate - conference - family <namepart> údajeokřestnímjméněapříjmeníapod. nutnovyjádřitprokřestníjménoipříjmení pokud nelze rozlišit křestní jméno a příjmení, nepoužije se type a jméno se zaznamená vpodobě jaké je do jednoho elementu <namepart> type type:použítjednuzhodnot: - date doporučenépokudlzeuvést - family povinnépokudlzeuvést - given povinnépokudlzeuvést - termsofaddress doporučené pokud lze MA <dc:descripti on> R <dc:descripti on> MA MA <dc:creator> nutno do jednohopole DC spojit jméno i příjmení 27
uvést <role> specifikace role osoby nebo organizace uvedené velementu<name> <roleterm> popisrole nutnopoužítkontrol.slovníknapř.zmarc21 type authority type: code kód role zkontrolovaného slovníku rolí http://www.loc.gov/marc/relators/relaterm.html authority údaje o kontrolovaném slovníku využitémkpopisurole,kpopisuvýšeuvedeného MARC seznamu nutno uvést authority= marcrelator <genre> bližšíúdajeotypudokumentu hodnota: issue type type: pro upřesnění typu čísla a jednotlivých vydání povinné hodnotamůžebýt: - normal běžnévydání - morning rannívydání - afternoon odpolednívydání - evening večernívydání - sequence_x pořadívydání(sequence_1 = první vydání toho dne; sequence_2 = druhévydáníatd.) - corrected opravenévydání - special zvláštní vydání (např. knějaké události) - supplement vpřípadě, že se příloha časopiseckéhotypupopisujejakočíslo <origininfo> informaceopůvodupředlohy doporučenékdelzevyplnit(např.uročenek,kde sevydavatelměnil) nepovinné pro deníky a běžná čísla periodik Poznámka: Jeden nebo více výskytů elementů se předpokládá pro vydavatele, další výskyt vpřípaděnutnostipopsattiskaře.pokudjenutno vyjádřittiskaře(pole260podpole f a e a g vmarc21), je nutno element <origininfo> opakovat satributem transliteration= printer a MA MA M <dc:type> RA/O 28
elementy <place>, <publisher>, <datecreated>, kterébudouobsahovatúdajeotiskaři. <place> údajeomístěspojenémsvydáním,výrobounebo původempopisovanéhodokumentu <placeterm> konkrétníurčenímísta,např.praha odpovídá hodnotě zkatalogizačního záznamu, pole260,podpole a type type budevždytext <publisher> jméno entity, která dokument vydala, vytiskla nebojinakvyprodukovala odpovídá poli 260 podpoli b katalogizačního záznamuvmarc21 <dateissued> datum vydání předlohy, vpřípadě čísla datum dne,kdyvyšlo;musívyjádřitden,měsícarok,dle tohojakéúdajejsoukdispozici; nutnozapsatvnásledujícíchpodobách: DD.MM.RRRR pokud víme den, měsíc i rokvydání MM.RRRR pokud víme jen měsíc a rok vydání RRRR pokudvímepouzerok DD. DD.MM.RRRR vydáníprovícední - MM. MM.RRRR vydáníprovíceměsíců MA MA MA MA <dc:coverage > <dc:coverage > <dc:publishe r> <dc:date> qualifier qualifier možnost dalšího upřesnění, hodnota approximate prodata,kdenevímepřesnýúdaj <datecreated> datumvytvořenípředlohy bude použito pouze při popisu tiskaře, viz poznámkauelementu<origininfo>; odpovídá hodnotě zkatalogizačního záznamu, pole260,podpole g qualifier qualifier možnost dalšího upřesnění, hodnota approximate prodata,kdenevímepřesnýúdaj R <language> údajeojazycedokumentu M <languageterm> přesnéurčeníjazyka kódem nutno použít kontrolovaný slovník ISO 639 2, http://www.loc.gov/standards/iso639 2/php/code_list.php type type:použíthodnotucode M <dc:language > 29
authority authority:použíthodnotu iso639 2b <physicaldescription> obsahuje údaje o fyzickém popisu zdroje/předlohy <extent> údaje o rozsahu (stran, svazků nebo rozměrů); použitíspíšeuročenekapod. odpovídá hodnotám vpoli 300 podpolích a a c MARC21,pokudjsouvyplněnaoběpole,bude seelement<extent>opakovat; počet stránek bude vyjádřen ve fyzické strukturální mapě a bude tak vidět vaplikaci zpřístupněníibezvyplněnítohotopole <note> poznámkaofyzickémstavudokumentu; pro každou poznámku je nutno vytvořit nový <note>element zde se zapíší poznámky o defektech zjištěné při digitalizaci pro úroveň čísla (chybějící a poškozenéstránkyapod.) <abstract> shrnutí obsahu dokumentu, zvláště pro ročenky, zvláštnívydáníatematickáčísla plnitpouzevpřípadech,žeselišíodabstraktuna úrovnititulu odpovídápoli520marc21 <note> obecnápoznámkakdokumentu odpovídápoli500vmarc21 <subject> authority údajeověcnémtřídění plnit pouze pro tématická čísla, zvláštní vydání a ročenky pouze pokud se liší od údajů velementu<subject>naúrovnititulu authority authority:vyplnithodnotu czenas <topic> libovolnývýrazspecifikujícínebo charakterizujícíobsahčísla; použítkontrolovanýslovník např.zbázeautorit AUTNKČR(věcnétéma) <geographic> geografickévěcnétřídění použítkontrolovanýslovník např.zbázeautorit AUTNKČR(geografickýtermín) <temporal> chronologickévěcnétřídění použítkontrolovanýslovník např.zbázeautorit AUTNKČR(chronologickýúdaj) <name> jménopoužitéjakověcnézáhlaví použítkontrolovanýslovník např.zbázeautorit AUTNKČR(jménoosobní) M RA RA RA RA RA <dc:format> <dc:descripti on> M <dc:subject> R <dc:subject> R <dc:subject> R <dc:subject> 30
<namepart> celé jméno se zapíše do elementu <namepart>, viztopelement<name> <identifier> údaje o identifikátorech čísla, obsahuje unikátní identifikátorymezinárodnínebolokální type type: budou se povinně vyplňovat následující hodnoty,pokudexistují: - doi - hdl handle - isbn převzít zkatalogizačního záznam NKČR(ročenkyapod.) - urnnbn pro URN:NBN, např. zápis ve tvaru urn:nbn:cz:anl 123456 pro projekt ANL+; pozor, musí odpovídat URN:NBN, podle kterého je pojmenovaný PSP balíčekajehojednotlivésoubory - uuid - jiný interní identifikátor, hodnota atributu local, lze použít např. kvyjádřeníčárovéhokódu <location> údaje o uložení popisovaného dokumentu, např. signatura,místouloženíapod. doporučené např. pro ročenky apod., kde se signaturyjednotlivýchčíselliší M <dc:identifier > R <url> prouvedenílokaceelektronickéhodokumentu O <dc:source> note note: pro poznámku o typu URL (na plný text, abstraktapod.) <physicallocation> údajeoinstituci,kdejefyzickyuloženpopisovaný dokument,např.nkčr nutno použít kontrolovaný slovník sigly knihovnen(aba001atd.) odpovídápoli040vmarc21 authority authority:hodnota siglaadr MA <dc:source> <shelflocator> signaturanebolokačníúdajeodokumentu MA <dc:source> <part> popis částí dokumentu, bude využit jen na zaznamenání<caption> type type:hodnotabudevždy issue O <detail> <caption> text před označením čísla, např. č., číslo, No. apod. RA 31
Příklad: <mets:dmdsec ID="MODSMD_ISSUE_1"> <mets:mdwrap MDTYPE="MODS" MIMETYPE="text/xml"> <mets:xmldata xmlns:mods="http://www.loc.gov/mods/v3"> <mods:mods ID="MODS_ISSUE"> <mods:titleinfo> <mods:title>chemické listy</mods:title> <mods:partnumber>6</mods:partnumber> </mods:titleinfo> <mods:genre type="normal">issue</mods:genre> <mods:language> <mods:languageterm type="code" authority="iso639-2b">cze</mods:languageterm> </mods:language> <mods:physicaldescription> <mods:extent>504 s.</mods:extent> </mods:physicaldescription> <mods:identifier type="uuid">{fdee51ab-1547-4b9c-bf0e- CB0FDAD7E40E}</mods:identifier> </mods:mods> </mets:xmldata> </mets:mdwrap> </mets:dmdsec> 32
8.3.1.3 Pole MODS a DC pro vnitřní část periodika (článek a obraz) Element MODS Atributy Popis Povi nnos t <mods> ID ID musí vyjadřovat název úrovně, tj. např. MODS_PICTURE pro obrázek vtextu, MODS_ARTICLE pročlánekapod. M <titleinfo> názvováinformacevnitřníčásti M <title> vlastnínázevvnitřníčásti(článku,obrazu); uobrazubrátpřípadnězpopiskuobrazu; pokud není titul, nutno vyplnit hodnotu untitled <subtitle> podnázevvnitřníčásti(článku); za podnázev lze považovat i krátký text, který se před článkem objevuje tučným písmem (shrnutí obsahučlánku) <partnumber> číslovnitřníčásti např.článeknapokračování Element DC M <dc:title> MA RA <dc:title> <dc:title> <partname> názevpokračovánívnitřníčásti(článku) RA <dc:title> <name> údaje o odpovědnosti za vnitřní část (článek i obraz) type type:použítjedenztypů - personal - corporate - conference - family <namepart> údajeokřestnímjméněapříjmeníapod. nutnovyjádřitprokřestníjménoipříjmení; pokud nelze rozlišit křestní jméno a příjmení, nepoužije se type a jméno se zaznamená vpodobě jaké je do jednoho elementu <namepart> type type:použítjednuzhodnot: - date doporučenépokudlzeuvést - family povinnépokudlzeuvést - given povinnépokudlzeuvést - termsofaddress doporučené pokud lze uvést <role> specifikace role osoby nebo organizace uvedené velementu<name> MA MA RA <dc:creator> nutno do jednoho pole DC spojit jméno i příjmení 33
<roleterm> popisrole nutnopoužítkontrol.slovníknapř.zmarc21 type authority type: code kód role zkontrolovaného slovníku rolí http://www.loc.gov/marc/relators/relaterm.html authority údaje o kontrolovaném slovníku využitémkpopisurole,kpopisuvýšeuvedeného MARC seznamu nutno uvést authority= marcrelator <genre> bližšíúdajeotypuvnitřníčásti povinné hodnota:articlenebopicture type:doporučené type hodnotaproarticle možnostvyplnitbližšíurčení typu článku (možnost použít DTD periodika, ArticleTypes) - news - tableofcontent - advertisement - abstract - introduction - review - dedication - bibliography - editorsnote - preface - mainarticle - index (použije se pro všechny typy seznamů mimo hlavní obsah; např. seznam obrazů, tabulekapod.) - unspecified pokud nepatří ani do jedné zvýšeuvedenýchkategorií - aj. hodnota pro picture možnost vyplnit další určenítypuobrazu - table - illustration - chart - photograph - graphic - map - advertisement MA M <dc:type> 34
- cover - unspecified pokud nepatří ani do jedné zvýšeuvedenýchkategorií <language> údajeojazycevnitřníčásti nelzeplnituobrazu aj. <languageterm> přesnéurčeníjazyka kódem nutno použít kontrolovaný slovník ISO 639 2, http://www.loc.gov/standards/iso639 2/php/code_list.php nelzeplnituobrazu type authority type:použíthodnotucode authority:použíthodnotu iso639 2b <physicaldescription> obsahuje údaje o fyzickém popisu zdroje/předlohy; určenospíšepročlánkynežproobrazy <form> údaje o fyzické podobě vnitřní části, např. print, electronicapod. odpovídá hodnotám pozice 23 a 29 vpoli 008 MARC21 type type:použíthodnotucode MA M <dc:language > R R <dc:format> <abstract> shrnutíobsahuvnitřníčásti R <dc:descripti on> <note> obecnápoznámkakvnitřníčásti dopoznámkybyseměladávatšifraautoravnitřní části,kterásevyskytujepodvnitřníčástí odpovídápoli500vmarc21 <subject> údajeověcnémtřídění R <topic> libovolnývýrazspecifikujícínebo charakterizujícíobsahvnitřníčásti; lze (není ovšem nutno) použít kontrolovaný slovník např. zbáze autorit AUT NK ČR (věcné téma) authority (volitelné) připoužitíautoritníchzáznamůpoužítautnkčr aatributauthority:vyplnithodnotu czenas ; připoužitívolnýchklíčovýchslovatributauthority nepoužívat <geographic> geografickévěcnétřídění použítkontrolovanýslovník např.zbázeautorit AUTNKČR(geografickýtermín) authority authority:vyplnithodnotu czenas RA <dc:descripti on> M <dc:subject> R <dc:subject> 35
<temporal> chronologickévěcnétřídění použítkontrolovanýslovník např.zbázeautorit AUTNKČR(chronologickýúdaj) authority authority:vyplnithodnotu czenas <name> jménopoužitéjakověcnézáhlaví použítkontrolovanýslovník např.zbázeautorit AUTNKČR(jménoosobní) authority authority:vyplnithodnotu czenas <namepart> vyplní se obdobně jako top element <name> celéjménoautoradotohotoelementu <classification> klasifikační údaje věcného třídění podle Mezinárodníhodesetinnéhotřídění plnitpouzepročlánek odpovídápoli080marc21 authority authority:vyplnithodnotu udc <identifier> údaje o identifikátorech, obsahuje unikátní identifikátory mezinárodní nebo lokální, které vnitřníčástmá vizpřehledtypůatributůníže type type: budou se povinně vyplňovat následující hodnoty,pokudexistujípročlánekneboobraz: - doi - hdl handle - urnnbn prourn:nbn - uuid - jiný interní identifikátor, hodnota atributu local, lze použít např. kvyjádřeníčárovéhokódu <part> popis částí vnitřní části, bude využito na záznam rozsahu nelzeuobrazu R <dc:subject> R <dc:subject> RA <dc:subject> M <dc:identifier > povinné RA <extent> upřesněnípopisučásti rozsahnastránkách MA <dc:format> <start> prvnístránka,nakterévnitřníčástzačíná MA <dc:coverage > <end> poslednístránka,nakterévnitřníčástkončí MA <dc:coverage > <recordinfo> údaje o metadatovém záznamu vnitřní části jehovzniku,změnáchapod. <recordcontentsource > kódnebojménoinstituce,kterázáznamvytvořila nebo změnila; nutno vytvořit kontrolovaný slovník M R <recordcreationdate> datumprvníhovytvořenízáznamuvnitřníčásti M encoding encoding:záznambudepodlenormyiso8601na 36
úroveňminut,hodnotaatribututedyiso8601 <recordchangedate> datumzměnyzáznamuvnitřníčásti R encoding encoding:záznambudepodlenormyiso8601na úroveňminut,hodnotaatribututedyiso8601 <recordorigin> údajeovznikuzáznamuvnitřníčásti hodnoty: machine generated nebo human prepared R Příklad: <mods:mods ID="MODS_ARTICLE_0001"> <mods:titleinfo> <mods:title>autoři a redaktoři (slovo do vlastních řad)</mods:title> </mods:titleinfo> <mods:name type="personal"> <mods:namepart type="given">bohumil</mods:namepart> <mods:namepart type="family">kratochvíl</mods:namepart> <mods:role> <mods:roleterm type="code" authority="marcrelator">aut</mods:roleterm> </mods:role> </mods:name> <mods:genre>article</mods:genre> <mods:language> <mods:languageterm type="code" authority="iso639-2b">cze</mods:languageterm> </mods:language> <mods:identifier type="uuid">53779de4-1c10-40e5-a6ee- 581796cb9a8c</mods:identifier> <mods:part> <mods:extent> <mods:start>437</mods:start> <mods:end>437</mods:end> </mods:extent> </mods:part> <mods:recordinfo> <mods:recordcontentsource>elsyst Engineering</mods:recordContentSource> <mods:recordcreationdate encoding="iso8601">2012-01- 13T06:28</mods:recordCreationDate> <mods:recordorigin>human prepared</mods:recordorigin> </mods:recordinfo> </mods:mods> 37
8.3.1.4 Pole MODS a DC pro přílohu Element MODS Atributy Popis Povi nnos t <mods> ID ID musí vyjadřovat název úrovně, tj. MODS_SUPPLEMENT <titleinfo> názvováinformacepřílohy použít názvové autority nebo katalogizační záznam <title> názvová informace název periodika, jehož součástípřílohaje převzítzkatalogu <partnumber> číslopřílohy,pokudnějakémá doporučenépokudlzevyplnit M M Element DC M <dc:title> MA <dc:descripti on> <partname> názevpřílohy MA <dc:title> <name> type údajeoodpovědnostizapřílohu MA type:použítjedenztypů: - personal - corporate - conference - family <namepart> údajeokřestnímjméněapříjmeníapod. nutnovyjádřitprokřestníjménoipříjmení pokud nelze rozlišit křestní jméno a příjmení, nepoužije se type a jméno se zaznamená vpodobě jaké je do jednoho elementu <namepart> type type:použítjednuzhodnot: - date doporučenépokudlzeuvést - family povinnépokudlzeuvést - given povinnépokudlzeuvést - termsofaddress doporučené pokud lze uvést <role> specifikace role osoby nebo organizace uvedené velementu<name> <roleterm> popisrole nutnopoužítkontrol.slovníknapř.zmarc21 MA MA MA <dc:creator> nutno do jednohopole DC spojit jméno i příjmení 38