Vysoká škola ekonomická v Praze Fakulta informatiky a statistiky. Vyšší odborná škola informačních služeb v Praze

Rozměr: px
Začít zobrazení ze stránky:

Download "Vysoká škola ekonomická v Praze Fakulta informatiky a statistiky. Vyšší odborná škola informačních služeb v Praze"

Transkript

1 Vysoká škola ekonomická v Praze Fakulta informatiky a statistiky Vyšší odborná škola informačních služeb v Praze Marie Šímová Identifikátory elektronických dokumentů Bakalářská práce 2010

2 .. Prohlášení Prohlašuji, že jsem bakalářskou práci na téma Identifikátory elektronických dokumentů zpracovala samostatně a použila pouze zdrojů, které cituji a uvádím v seznamu použité literatury. V Praze dne 20. prosince 2010

3 . Anotace Tato bakalářská práce se zabývá identifikátory elektronických dokumentů, popřípadě digitálních objektů. V práci je vymezen termín elektronický dokument, který se skládá z určitých formátů, má nějaké vlastnosti a může se pojit s dalšími informacemi o dokumentu samotném. Tyto informace nám umožňují dokument jednoznačně identifikovat a popsat. Abychom jednotlivé elektronické dokumenty od sebe mohli odlišit, přidělujeme jim identifikátory. Název určitého elektronického dokumentu i několika dalších dokumentů může být stejný. Identifikátor nikoli, jelikož je vždy jedinečný. V dnešní době, kdy většina dokumentů existuje v digitální podobě nebo do ní byla převedena se nám z důvodu vyhledávání a následné práce s dokumenty toto jednoznačné označení hodí. V práci je nastíněn přehled nejpoužívanějších identifikátorů pro elektronické dokumenty. Identifikátory jsou převážně využívány v oblasti digitálních knihoven, ale také pro komerční využití, při výměně informací nebo prokázání důvěryhodnosti daného elektronického dokumentu. This BA thesis is concerned with identifiers of electronic documents and digital objects. The term electronic document is defined in this work; it consists of certain formats, has certain characteristics and can be related to other information about the document itself. This information allows us to identify and define the document unambiguously. To be able to differentiate particular documents we assign them identifiers. A name of a particular electronic document and few other documents can be the same. The identifier cannot because it is always unique. Nowadays, when majority of documents is in digital form or is being transformed into it, this labeling is very useful to us mainly for searching and working with the documents. In this thesis the list of the most often used identifiers is presented. Identifiers are mainly used in the field of digital libraries but also for commercial purposes, for exchanging information and for proving credibility of certain electronic documents.

4 . Obsah 1 Úvod Elektronické dokumenty Od elektronického dokumentu k digitálnímu objektu Metadata Typy digitálních dokumentů Rozdělení podle charakteru Rozdělení podle způsobu vzniku Výhody a nevýhody Ochrana digitálních dat a jejich dlouhodobé zpřístupnění Identifikátory Nároky na trvalý identifikátor a spravující systémy Přehled vybraných trvalých identifikátorů Identifikátory spojené s objekty, které mohou mít digitální i fyzickou podobu ISBN ISSN a ISSN-L ISAN a V-ISAN ISWC ISRC ISTC ISRN Identifikátory převážně spojené s digitálními objekty URI URN HDL

5 DOI PURL ARK Digitální podpis Porovnání URI a DOI Závěr Seznam použité literatury

6 Úvod 1 Úvod Téma této práce jsem si vybrala, jelikož mě zaujala tématika propojení identifikátoru s elektronickými dokumenty, popřípadě s digitálními objekty. Rozvojem počítačových sítí a používáním internetu dnes vzniká většina dokumentů v elektronické podobě. Nebo jsou zpětně do elektronické podoby převáděny. Pokud chci něco najít a také to použít, potřebuji znát název, nebo alespoň něco, co o daném objektu vypovídá. Když vezmu v potaz samotné vyhledávání prostřednictvím internetového vyhledávače nebo jiných databází, ne vždy najdu to, co hledám, i když prostřednictvím internetu se dá získat skoro vše. Jedná se o hodiny a hodiny brouzdání po síti, než informace a odkazy začnou člověku dávat nějaký smysl nebo odpověď, kterou hledá. Někde jsou objekty volně ke stažení, jinde je potřebná registrace nebo určitý poplatek, díky kterému se k danému objektu dostaneme nebo alespoň k informaci o něm. Dobré věci totiž nikdy nejsou zadarmo. Nejvíce to platí hlavně u informací, protože jsou velice cennou komoditou, které má člověk k dispozici. Elektronické dokumenty jsou prostřednictvím internetu volně ke stažení, ale jsou také shromažďovány a uchovávány prostřednictvím různých databází, digitálních knihoven a archivů. Ve většině případů nás zajímá relevantní zdroj, ve kterém je elektronický dokument či objekt obsažen a nikoli například blog pomatené mladé slečny, která se o určitém dokumentu nebo objektu zmínila. Abychom daný dokument, objekt, informaci nebo zdroj našli, potřebujeme vědět, co a kde hledat. Samotný název ale nestačí. Můžeme narazit na stejné názvy, ale nejedná se o to, co hledáme. Jindy potřebujeme najít dokumenty, které mají podobný název nebo se zaobírají podobnou tématikou, aby informace, které hledáme, byly kompletní. Digitální objekty proto potřebujeme nějak identifikovat. K tomu nám slouží identifikátory. Může se jednat o pouhý vygenerovaný řetězec znaků, který je pořadovým číslem, ale může také o daném objektu něco vypovídat. Formou této práce je přehledová studie. Nemá cenu vymýšlet něco, co už vymyšleno bylo, ale spíše sumarizovat informace k dané problematice tak, aby dávali smysl. Má práce bude spočívat 3

7 Úvod v prostudování nalezených zdrojů a jejich následné interpretaci. Cílem této práce je snaha co nejvíce přiblížit a popsat pojem elektronický dokument popřípadě digitální objekt. Dále stanovit přehled identifikátorů, které jsou s elektronickými dokumenty a digitálními objekty používány. Nakonec bych chtěla porovnat dva identifikátory. Zatím nevím, jak spolu souvisí a jestli se vůbec porovnat dají, ale touto otázkou se budu zabírat až ke konci této práce. Mé shrnutí a poznatky dané problematiky budou uvedeny v závěru. Jak už jsem zmínila, informace jsou velice cenné. Sama se ráda učím novým věcem a dozvídám se nové informace a tak doufám, že i tato práce bude jistým přínosem pro její čtenáře. 4

8 Elektronické dokumenty 2 Elektronické dokumenty Slovo dokument má většina lidí spojené s něčím, co je vytištěno na papíře a fyzicky si na něj mohou sáhnout. Jenže stejně jako by v posledních pár staletích díky vzniku knihtisku byly nedostačující hliněné tabulky nebo papyrus, tak dnes při práci s počítači již nikomu nestačí jen dokumenty v papírové podobě. Samozřejmě, že většina listinných dokumentů se v dnešní době dá digitalizovat, ale na druhou stranu, ne vše, co je digitálním dokumentem se dá převést do fyzické formy. Při použití pojmu elektronický či digitální dokument už totiž nezůstáváme jen u textového záznamu vytvořeného v textovém editoru či u, ale přes fotografii vytvořenou digitálním fotoaparátem až k takovému typu, který je výčtem dalších různých typů digitálních dokumentů, jako je například webová stránka. V této kapitole jsem se nechala převážně inspirovat zdrojem [1]. Hlavním problémem je, že slovem dokument se standardně označuje textový záznam, ale s vývojem výpočetní techniky a s tím spojenou potřebou rychlejšího přístupu k dokumentům, vyšly najevo otázky, co všechno by mělo být za dokument považováno. Může tedy vedle textu vytvořeného v textovém editoru být slovem dokument označován například softwarový program, protože se skládá s řádků, které jsou tvořeny textem? Proto není zcela úplně jasné, kde jsou hranice pro vymezení pojmu elektronický dokument. Na začátku byla otázka, co je to dokument. Snahou bylo rozšířit pojem dokument i na nepsané dokumenty pro použití ve slovnících. Mezi dokumentaristy byl dokument spojovaný s vyjádřením jakéhokoli lidského myšlení. Ve Spojených státech amerických byl spojen s grafickým záznamem. Podle belgického spisovatele Paula Otleta, který na toto téma rád diskutoval, lze za dokumenty považovat všechny pozorované objekty, pokud jsme z nich informováni nebo se jedná o objekty nesoucí stopy lidské činnosti. Například archeologické nálezy, vzdělávací hry nebo umělecká díla. Mezinárodní institut pro duševní spolupráci 5

9 Elektronické dokumenty (International Institute for Intellectual Cooperation) vytvořil definici, kdy dokumentem mohou být všechny zdroje informací, v materiální formě, které mohou být použity pro odkaz nebo studium. Příkladem zde jsou: rukopisy, tiskoviny, diagramy, ilustrace, muzejní exempláře atd. Další tvrzení je, že dokument je důkaz, který se opírá o skutečnost. Tedy strom rostoucí v přírodě dokumentem není, ale zachycením na fotografii by se dokumentem stal. Těmito směry se vyvíjela odpověď na otázku, co je to dokument. [2] Když se vrátíme k dokumentu v papírové podobě, který je rozlišován už jen tím, že je na papíře, tak nám to u elektronického dokumentu moc nepomůže. Jelikož věci kolem nás jsou vytvořené z atomů, kdežto základním prvkem digitální informace je bit. Definicí elektronického dokumentu je, že se jedná o dokument, který se od tištěných typů dokumentů odlišuje nikoliv obsahovými, ale formálními vlastnostmi, zejména digitálním způsobem záznamu informací a z něho vyplývající větší nezávislostí a oddělitelností obsahu dokumentu od nosiče dat. Digitální uložení informace umožňuje aplikaci operativnějších individuálních metod práce s informacemi (vyhledávání, změny). [3] Uvedeno na příkladě, pokud je vyfocena fotografie, je uložena na paměťovou kartu, odkud ji můžeme přehrát na pevný disk počítače. Změnila tedy své místo uložení, ale můžeme s ní pracovat dál. S nosičem je spjat původ a trvanlivost dokumentu. V případě elektronického dokumentu nám tyto údaje uchovávají a poskytují metadata. 2.1 Od elektronického dokumentu k digitálnímu objektu Vedle bitu, je díky rozmanitosti digitálního světa, jednou ze stavebních jednotek digitální objekt. Podle [4] je definice digitálního objektu následující. Digitální objekt je objekt zaznamenaný nebo přenášený v digitálním formátu, tj. jako řetězce bitů, který byl v této formě vytvořen nebo do ní konvertován. Umožňuje kompresi dat a přidání dodatečné informace určené buď k opravě chyb nebo k popisu obsažených údajů (metadata). Podle [1] je Elektronický či digitální dokument vnitřně uspořádaný soubor digitálních objektů. Elementárním digitálním objektem rozumějme pro naši potřebu jednotlivý jednoduchý datový nebo metadatový soubor jako základní jednotku výstavby digitálního dokumentu v krajním případě se může digitální dokument rovnat právě jednomu souboru. 6

10 Elektronické dokumenty Pokud se elektronický dokument skládá z digitálních objektů, pak je jimi také tvořen a musí mezi nimi být nějaký vztah. Některé digitální objekty jsou nadřazené, jiné podřazené, některé odkazují na další externí objekty, jež mohou být datového nebo metadatového původu, a mají mezi sebou také vztahy. Je zde třeba vzít v úvahu nástroj, který by zajišťoval integritu elektronického dokumentu jako celku a mezi jednotlivými objekty dohlížel na jednotlivé vztahy. K dispozici máme SGML (Standard Generalized Markup Language). Jde o standardní jazyk určený k formálnímu popisu struktury dokumentů, který je definován v normě ISO 8879 z roku Můžeme jím znázornit objektově orientovaný přístup. [1] Při objektovém modelování jsou námi vytvořené věci pomocí počítače odrazem reálného světa. Základem jsou zde objekty (entity), které mají určité předdefinované vlastnosti (atributy) a můžeme je umisťovat do kategorií. Entity jsou vymezeny formálními či obsahovými kategoriemi. Při zpracování dat v dokumentu, se nám tato vlastnost může hodit například tím, že je rozlišováno mezi hodnotami, jakými jsou text a číslo. SGML je velmi obecné. Určuje, jak bychom měli objekty označovat, zapisovat jejich vlastnosti a vztahy s nimi spojené, ale vždy je potřeba konkretizace. Ta bývá vyjádřena jeho vlastními nástroji pomocí definice typu dokumentu (DTD). Dále pokud chceme daný dokument převést třeba na hypertextový odkaz a prohlížet jej interaktivně, poslouží nám HyperText Markup Language (HTML). Všechny značkovací jazyky pracují s takzvanými tagy. Nejčastěji se s nimi setkáme prostřednictvím HTML kódu. Vlastnosti aplikací SGML slouží pro popis, výstavbu a kontrolu integrity složených dokumentů. V jednom dokumentu můžeme díky množství informací najít různé seskupení metadatových a datových souborů, ale také jeden a tentýž objekt, který je vyobrazen různými datovými soubory a také můžeme mít v jednom dokumentu obsažené soubory různého původu a různého formátu. [5] 7

11 Elektronické dokumenty 2.2 Metadata Když bychom se vrátili o pár desítek let dozadu, kdy byly digitální systémy primárně určeny pro zachycení textu, a pracovalo se v prostředí MS-DOS, tak bychom už definici elektronického dokumentu znali. Postačila by nám jen definice dokumentu, ovšem s tím rozdílem, že formální úpravy můžeme v digitálním provedení dělat rychleji a mnohem snadněji. Ale dnes, kdy je zájem i o vektorovou či bitmapovou grafiku nebo o digitální zpracování audia a videa, vzniká problém v podobě odtržení těchto objektů od jejich kontextu. Potřebou je začlenění digitálních objektů do dalších struktur, které uchovávají informaci o objektech. Máme na výběr ze dvou možností. První možnost je pomocí záznamů uložených v relační databázi, jelikož popisná data objektů jsou uložena mimo tyto objekty. V tomto případě se ale musí dodržet relace mezi objektem a informacemi a dále také zajištění funkčnosti relační databáze. Ve druhém případě si objekt nese informaci s sebou a je tak více nezávislý. [1] Metadata jsou nesdílnou součástí elektronického dokumentu. Pokud vyhledáváme pojem metadata, setkáme se s definicemi, že jedná o data o datech, ovšem nejedná se o označení úplné. Mezi knihovnickými pracovníky se setkáme s pojmem katalogizační nebo bibliografický popis či záznam. Ale s rozvojem internetu a komunikací prostřednictvím počítačových sítí získávají metadata širší význam. Spíše se zde jedná o stroji srozumitelné informace o webovských zdrojích nebo dalších věcech (o lidech, věcech, pojmech, faktech, myšlenkách atd.). [6] V případě webové stránky najdeme tato data v hlavičce a u dalších digitálních objektů třeba ve vlastnostech. Nejedná se údaje, které by byly viděny na první pohled, ovšem některé specializované programy pro práci s daným objektem, toto umožňují. Tvořeny jsou většinou autory či vydavateli. Pokud jde o formu metadat, je tvořena množinou nezávislých výroků, které reprezentují údaje o zdroji. V počítačovém systému nabývají výroky formu jména či typu výroku a souboru dalších parametrů. [6] K čemu nám metadata slouží? V oblasti knihovnictví prostřednictvím katalogizačního záznamu, kdy je informace od dokumentu oddělena, převážně k vyhledávání a identifikaci. V informatice tomu není jinak. 8

12 Elektronické dokumenty Funkce metadat: Identifikace Popis objektu se zaměřením na jeho integritu Popis vlastností převážně vnějšího prostředí, ve kterém lze s objektem pracovat Jelikož název této studie je Identifikátory elektronických dokumentů, tak nás nejvíce bude zajímat právě identifikace, které bude věnována pozornost v další kapitole. Mezi nejznámějšího zástupce metadat patří Dublinské jádro (Dublin Core). Jde o soubor metadatových prvků, jehož hlavním cílem je vyhledávání mezi elektronickými zdroji. Původně byl vytvořen pro oblast webových stránek, ale díky jeho jednoduchosti, modifikovatelnosti a mezinárodní rozšířenosti o něj projevily zájem další instituce, které se zabývají zpracováním zdrojů. Může obsahovat až 15 prvků, které o objektu poskytují informace. I pro člověka, který není počítačově příliš gramotný, je připojení Dublin Core k dokumentu jednoduchá. [7] 2.3 Typy digitálních dokumentů Formy digitálních dokumentů rozlišujeme z hlediska jejich charakteru nebo podle zdroje. Dle charakteru je lze rozdělit na textové, obrazové, audio, video či smíšené. Do zvláštní skupiny spadá software. Toto rozdělení je založeno na tom, z čeho jsou dokumenty vytvořeny. Jsou tvořeny různými strukturami a formáty. Aby operační systém věděl, jak má s danými dokumenty zacházet, má k dispozici několik způsobů. Dokument může odlišovat pomocí přípony, hlavičky, metadat nebo atributů. U typů dokumentů jsem vycházela z uživatelské zkušenosti Rozdělení podle charakteru Mezi nejrozšířenější patří textové dokumenty. K jejich tvorbě byl dříve využíván textový editor T602, který vývojem později přešel k objektově orientovaným formátům typu MS Word. Ovšem pokud chceme přečíst jakýkoli textový soubor, podaří se nám jej otevřít prostřednictvím poznámkového bloku, který stejně jako T602 nepoužívá formátování a styly. Při předávání textových informací jsou na prvních místech HTML, MS Word, RTF a dále v dnešní době více a více rozšířený formát PDF. 9

13 Elektronické dokumenty Přehled nejpoužívanějších textových formátů: HTML (HyperText Markup Language), neboli hypertextový jazyk značek (tagů). Jedná se o formát, který je nejčastěji používaný prostřednictvím internetu. Jedná se o formát, který tvořen z hlavičky, těla a v něm zapsaných tagů. Můžeme do něj vkládat odkazy na ostatní objekty a formátovat jej. K tomu nám slouží již zmíněné tagy. V případě, že prohlížeč něco z HTML neumí přečíst, prostě to ignoruje. Za nástupce HTML je dnes označován XML (extensible Markup Language), jehož výhodou je, že tagy dokáží lépe a přesněji označit uvedené informace. Vedle textu, který obsahuje, s sebou nese i informaci o daném dokumentu. Převod do dalších formátů je z XML jednoduchý a je velice vhodný pro strukturovaná data, určená pro relační databáze. Dokument s příponou DOC, dnes již DOCX z dílny Microsoft Office, umožňuje kombinaci textu s grafikou a je nejčastěji využívaným textovým editorem RTF (Rich Text Format) slouží k přenosu naformátovaných dokumentů PDF (Portable Document Format) formát, který je schopen funkčnosti nezávisle na platformě, má stále stejnou kvalitu. Mezi jeho dvě největší výhody patří jeho uzamykatelnost a možnost zaindexování do systému, který vytváří fulltextové databáze Jako další jmenujme pár zástupců obrazových (grafických) formátů. Dělíme je na vektorové a bitmapové někdy také rastrové. Rozdíl mezi bitmapou a vektorem, je v prvcích, ze kterých se skládají. Bitmapu tvoří jednotlivé body (pixely) kdežto vektory jsou tvořeny z objektů, jako jsou křivky nebo základní geometrické tvary. U zpracování obrazových formátů, může docházet ke kompresi, která bývá využívaná ke zmenšení objektu. Dochází ale nejen ke zmenšení, ale i ke ztrátě informací. Základními používanými rastrovými formáty jsou: GIF je formát, který umožňuje animace, je ale omezen barvami. JPEG je formát pro ukládání obrázků v dobré kvalitě, ale dochází u něj ke ztrátové kompresi. TIFF jako jeden z mála umožňuje ukládání vícestránkových souborů. Používán je převážně pro dokumenty, které jsou určené k tisku. 10

14 Elektronické dokumenty RAW jsou neupravená data z digitálního fotoaparátu, se kterými se dá mnohem lépe pracovat, jelikož nepodléhají ztrátové kompresi. U každého výrobce fotoaparátů se liší, a proto společnost Adobe navrhla řešení v podobě univerzálního formátu DNG. BMP je formát, který jednoduchý a můžeme jej snadno zdokumentovat. PNG byl vytvořen pro bezztrátovou kompresi jako nástupce formátu GIF. Z vektorových formátů lze uvést: SLD je jednoduchý formát podporující pouze úsečky. SVG je značkovací jazyk, který popisuje dvourozměrnou grafiku pomocí XML. PostScript Mezi audio a video nahrávkami, je vlivem sílícího postavení internetu zájem o dosažení komprese dat, ale zároveň o zachování kvality nahrávky. K dispozici je zde přehled nejpoužívanějších audio a video typů. Audio formáty: WAV (Waveform Audio Format), byl vytvořen za spolupráce firem IBM a Microsoft. Tento formát se používá u hudebních nahrávek na CD discích. MP3 vzniká jako ztrátová komprese dat formátu WAV. Formát zachovává docela vysokou kvalitu nahrávky, přesto že se jeho velikost až desetinásobně sníží. MP3 potlačuje zvuky na hranici slyšitelnosti lidského ucha a proto není vhodnou volbou pro nahrávky, kde se vyskytuje mluvené slovo. WMA, byl vyvinut společností windows media jako náhrada za MP3 v prostředí windows VORBIS (označován také jako OCG), jde o formát, který je srovnatelný s formátem MP3. Na rozdíl od MP3 nespadá pod žádnou licenci. ACC (MPEG-4 Advanced Audio Coding), jde o kvalitní poměr mezi kvalitou a kompresí MIDI (Musical Instrument Digital Interface) je určen především pro profesionální hudebníky. Slouží pro komunikaci mezi hudebními nástroji a počítačem, generování jednotlivých zvuků a nástrojů a pro převod z notového zápisu do počítače. 11

15 Elektronické dokumenty Proudová média (stream) tyto zvukové a hudební nahrávky mají velice sníženou kvalitu zvuku, ale rychlý přenos a právě proto jsou používány internetovými rádii. Nejčastěji se s nimi setkáme prostřednictvím RealAudio, WindowsMedia a QuickTime. Audio a video soubory jsou ukládány to tzv. kontejnerů, díky kterým je umožněna lepší práce s multimediálními formáty. Přeci jen éra němých filmů už je dávno pryč, a proto k videu zvuk patří. Kontejnery mimo zvuku a videa mohou obsahovat i informace o kapitolách, menu nebo titulky. Typy kontejnerů: AVI (Audio Video Interleave) je nejrozšířenější kontejner pro ukládání videa. Podporuje většinu kompresí zvuku i obrazu a výhodou je, že je podporován všemi operačními systémy. Neumí si ale moc dobře poradit s novými kvalitními formáty zvuku a videa. MPEG Program Stream, zahrnuje video s kompresí MPEG-1 a MPEG-2. Také je podporován všemi operačními systémy. MPEG Transport Stream používá se pro digitální vysílání, AVC HD kamery a pro Bluray přehrávače. MP4 je rozšířený převážně mezi mobilními telefony a primárně je určen pro MPEG-4 video. Matroška je kontejner, který je volně k použití. Zařadit do něj můžeme širokou škálu podporovaných formátů. Bývá využíván se spojením pro HD videa. Toto byl přehled neužívanějších základních formátů elektronických dokumentů. Na výběr jich máme mnohem víc, stejně jako existují mnohem složitější struktury. Tím může být například jakýkoli program, aplikace nebo webové stránky napsané formou různých jazyků a vytvořené pomocí odlišných technologií Rozdělení podle způsobu vzniku Dále se elektronické dokumenty dělí dle místa svého vzniku. Můžeme mít elektronické dokumenty, které vznikly digitalizací a jsou převodem (kopií) tištěného originálu nebo už v digitální podobě vznikly. 12

16 Elektronické dokumenty Digitalizace je činnost, při které jsou dokumenty, které mají analogovou formu, převáděny do dvojkové soustavy. Poté je binární kód možné číst, přenášet a uchovávat pomocí počítače a počítačových sítí. Jedná se ve většině případů o přenos listinných dokumentů do elektronické podoby. Důvody k digitalizaci: Jedním z hlavních důvodů je úspora místa. Například dokument, který je naskenován černobíle při rozlišení 240 dpi, tedy nejběžnější a naprosto dostačující formát, má v digitální podobě velikost 70 až 100 kb. Při této velikosti je možné uložení statisíců či milionů dat na nejmenších discích. Dalším je dostupnost informací, kdy je elektronický dokument přístupný například na internetu. Neopomenutelným důvodem je ochrana dat. Papírový dokument není těžké jakkoli poničit, ať při nešetrném zacházení člověka či prostřednictvím vnějších vlivů. Kdežto při správném zacházení s nosičem, na kterém je uložen dokument v digitální podobě, by se nic podobného stát nemělo. V neposlední řadě mají digitalizované dokumenty výhodu v jednoduchosti vyhledávání. Díky tomu, že je dokument ukládán pomocí indexace, je možné prohledávat celé texty. A na bázi vyhledávání v celých textech funguje většina databází článků či fulltextové vyhledavače. [8] V této podkapitole jsem popisovala formáty, ze kterých se elektronické dokumenty skládají. Elektronických dokumentů jako takových je mnoho, ovšem většinou se skládají z těchto stavebních prvků. Webová stránka je v základu text, který pomocí programovacích jazyků nebo programů něco dělá. Různé elektronické účetní doklady, které se implementací informačních systémů rozšiřují, jsou také v základu text. Proto v tomto případě vyjdeme z definice jako takové a pro upřesnění je možné přiblížit elektronický dokument formou formátů, ze kterých se skládají. 13

17 Elektronické dokumenty 2.4 Výhody a nevýhody S používáním elektronických dokumentů jsou spojeny klady a zápory. Naštěstí díky rostoucímu množství těchto dokumentů začíná pozitivní stránka s jejich užíváním převyšovat tu negativní. A neustálým zlepšováním převádí nedokonalosti na výhody. [9] Výhody spojené s elektronickými dokumenty: Hypertext, který umožňuje upozornění na souvislosti. Úspora času, ke které dochází vlivem rychlejší práce při úpravách nebo změnách v dokumentech. Možnost aktualizace je také rychlejší a snazší než u tištěných dokumentů. Informace může být díky multimédiím přijata ve více podobách. Díky dosažitelnosti na síti nám odpadají výdaje, i když na počátku je potřeba drobné investice k zakoupení hardwaru nebo software, abychom s elektronickými dokumenty mohli vůbec pracovat. Uchování a archivace, jelikož dokumenty nezabírají fyzické místo, můžeme jich mít více, než bychom si v normální podobě mohli dovolit. Snadnost vyhledávání, například díky fulltextu, obsaženým metadatům nebo za použití umělé inteligence, která je schopna rozpoznat různé tvary. Interakce, ať již mezi objekty samotnými nebo mezi člověkem a dokumentem. Manipulace s daty, nejsou úplně spjaty s nosičem a můžeme je používat podle toho, jak potřebujeme. Druhou stránkou jsou zde i nevýhody, které se sice postupně transformují na výhody, ale vždy tu nějaké budou. Nevýhody spojené s elektronickými dokumenty: Při práci s technikou si musíme uvědomit, že se stále jedná jen o techniku, která není neomylná, a mohou nastat problémy. Snadná duplikace, ze začátku se může zdát, že se jedná o výhodu, ovšem v případě autora, který nechce, aby byl dokument volně šířen, jde o nevýhodu. 14

18 Elektronické dokumenty Zahlcení nepotřebnými dokumenty. Věrohodnost, při vyhledávání na internetu bývá velice těžké odlišit relevantnost nalezeného zdroje. 2.5 Ochrana digitálních dat a jejich dlouhodobé zpřístupnění Ve většině odborných textů je tato problematika spojována se zpřístupněním do digitálních knihoven, portálů nebo digitálních archivů. Digitální dokumenty většinou poskytují vysoké školy, výzkumná centra, některé knihovny, muzea a další kulturní a vzdělávací instituce. Jsou ukládány a spravovány prostřednictvím digitálních archivů (repozitářů). Digitální repozitář lze chápat jako organizaci lidí a systémů se závazkem ochraňovat a zpřístupňovat digitální data pro určitou skupinu uživatelů. Infrastruktura jednotlivého repozitáře může být navržena tak, aby navíc umožňovala i snadnou vzájemnou spolupráci s jinými systémy (portály, digitálními knihovnami) pomocí daných komunikačních protokolů. Digitální knihovnou rozumíme soubor aplikací, které nad daty v repozitáři provádějí nějaké stanovené operace za účelem jejich zpřístupnění koncovým uživatelům. Digitální repozitáře sehrávají klíčovou roli v dlouhodobé ochraně digitálních dat. Potřebou je, aby objekty zůstaly zachovány v původní podobě a mohly být dále využívány. [10] Tato oblast se dá rozšířit i na další autory ostatních elektronických dokumentů, kteří je prostřednictvím internetu dávají k dispozici okolnímu světu. Vlastně pro kohokoli, kdo má dokument, který stojí za to, aby byl uchován pro další generace. Při ochraně dat se nezaměřujeme jen na samotné objekty, ale i na metadata a identifikátory s nimi spojené. Cíle dlouhodobé ochrany digitálních dokumentů: Uchovávány jsou digitální objekty, které již vznikly prostřednictvím digitálního prostředí a nemají tedy žádnou jinou podobu a je potřeba zajistit, jejich neměnnost Zajištění dostupnosti, spolehlivosti a srozumitelnosti těchto objektů i budoucím uživatelům 15

19 Elektronické dokumenty Proces u dlouhodobé ochrany digitálních dat by měl být dobře vymyšlený, aby se dalo předejít výpadku techniky či technologickým změnám. Tato cesta je nezbytná k zajištění trvalého zpřístupnění elektronických dokumentů, abychom mohli objekty vyhledávat a pracovat s nimi, i přes jejich uložení v archivu Důvěryhodnost digitálních repozitářů, kterou je možno zajistit tím, že objekty nalézající se v archivech jsou autentické, úplné, přesné Abychom archiv mohli považovat za důvěryhodný, měl by zajišťovat autenticitu, integritu, být spolehlivý a dostupný a mít možnost opakovaného použití. Autenticita je důležitá pro jednoznačné určení, kdo je autorem digitálního objektu. Dnes se k tomuto prokázání využívají digitální podpisy, certifikáty, vodoznaky a časová razítka. Digitální podpis a certifikát bude popsán v následující kapitole. Pro zachování integrity je využíván MD5. Jedná se o algoritmus, který je uveden v internetovém standardu RFC 1321, a mimo jiné byl také užíván k ukládání hesel. V dnešní době se od něj z důvodu bezpečnosti upouští. Základní úlohou tohoto algoritmu je kontrola integrity a tím předcházení nežádoucím změnám a uchovávání dat v úplném a bezchybném stavu. Při spolehlivosti a dostupnosti musíme u techniky, rozumějme hardwaru a softwaru, zajistit bezchybné fungování nebo se alespoň snažit procento chybovosti a poruch snížit na minimum a zajistit, aby byl dokument dostupný po co nejdelší dobu. Těchto výsledků se dá dosáhnout za pomoci vytváření záložních kopií za použití zrcadel, upgradováním softwaru, používáním přepěťových ochran a antivirů a správně nastaveného firewallu. Vedle technického hlediska se musíme také zaměřit na finanční stránku situace, zajistit kvalifikovaný personál a organizace by měla být efektivně vedena. Abychom mohli dokument stále používat, je potřeba umožnit jeho vyhledávání, neměnnost a uchování po dlouhou dobu a to za pomoci trvalých identifikátorů, uchováváním na trvanlivých médiích a v dostupných formátech. U těchto cílů jsem vycházela ze zdroje [11]. 16

20 Elektronické dokumenty Elektronický dokument či digitální objekt je opatřen nějakým názvem, ovšem spousta dalších dokumentů se jmenuje podobně nebo dokonce stejně. Můžeme je tedy od sebe odlišit očíslováním, ale v budoucnosti může dojít k přečíslování či úplné změně značení. Při dlouhodobém uložení elektronických dokumentů potřebujeme něco, čím bude dokument označen od začátku až do konce jeho existence. Něco, co nám bude sloužit k jeho identifikaci, popřípadě k jeho vyhledávání. A tím něčím je právě trvalý identifikátor. 17

Zahraničně obchodní politika

Zahraničně obchodní politika Zahraničně obchodní politika Vzdělávací materiál ke kurzu Zahraniční obchod Slezská univerzita v Opavě Okresní hospodářská komora Karviná 2010-2013 Výukový materiál je výstupem projektu Posílení konkurenceschopnosti

Více

Informatika a výpočetní technika pro střední školy

Informatika a výpočetní technika pro střední školy Pavel Roubal Informatika a výpočetní technika pro střední školy Teoretická učebnice Computer Press Brno 2012 Informatika a výpočetní technika pro střední školy Teoretická učebnice Pavel Roubal, www.eduit.cz

Více

UNICORN COLLEGE. Katedra informačních technologií BAKALÁŘSKÁ PRÁCE. Datové modelování. Autor BP: Anatoliy Kybkalo. Vedoucí BP: Ing.

UNICORN COLLEGE. Katedra informačních technologií BAKALÁŘSKÁ PRÁCE. Datové modelování. Autor BP: Anatoliy Kybkalo. Vedoucí BP: Ing. UNICORN COLLEGE Katedra informačních technologií BAKALÁŘSKÁ PRÁCE Autor BP: Anatoliy Kybkalo Vedoucí BP: Ing. Miroslav Žďárský 2013 Praha Čestné prohlášení Prohlašuji, že jsem svou bakalářskou práci na

Více

ODBORNÁ ŠKOLENÍ A VZDĚLÁVÁNÍ

ODBORNÁ ŠKOLENÍ A VZDĚLÁVÁNÍ ODBORNÁ ŠKOLENÍ A VZDĚLÁVÁNÍ PRACOVNÍKŮ ÚZEMNÍ VEŘEJNÉ SPRÁVY PRO OBLAST CESTOVNÍHO RUCHU INFORMAČNÍ ZDROJE V CESTOVNÍM RUCHU PRO VEŘEJNOU SPRÁVU www.vzdelavanivcr.cz INFORMAČNÍ ZDROJE V CESTOVNÍM RUCHU

Více

Příručka uživatele systému ISBN

Příručka uživatele systému ISBN Národní knihovna České republiky Příručka uživatele systému ISBN 5. vyd. Revize březen 2011 Praha 2006 Národní knihovna ČR, 2006 2 Obsah Předmluva k českému vydání... 4 Předmluva k 5. mezinárodnímu vydání...

Více

Metodika publikace otevřených dat veřejné správy ČR. verze 1.0

Metodika publikace otevřených dat veřejné správy ČR. verze 1.0 Metodika publikace otevřených dat veřejné správy ČR verze 1.0 Praha, listopad 2012 Zpracovali: Dušan Chlapek Jan Kučera Martin Nečaský Fakulta informatiky a statistiky, Vysoká škola ekonomická v Praze

Více

Natalya Goncharova. Tvorba webu pomocí HTML 5.0. Bakalářská práce

Natalya Goncharova. Tvorba webu pomocí HTML 5.0. Bakalářská práce Vysoká škola ekonomická v Praze Fakulta informatiky a statistiky Vyšší odborná škola informačních služeb v Praze Natalya Goncharova Tvorba webu pomocí HTML 5.0. Bakalářská práce 2012 PROHLÁŠENÍ Prohlašuji,

Více

Univerzita Jana Evangelisty Purkyně v Ústí nad Labem Fakulta sociálně ekonomická BAKALÁŘSKÁ PRÁCE. 2002 Tomáš Psika

Univerzita Jana Evangelisty Purkyně v Ústí nad Labem Fakulta sociálně ekonomická BAKALÁŘSKÁ PRÁCE. 2002 Tomáš Psika Univerzita Jana Evangelisty Purkyně v Ústí nad Labem Fakulta sociálně ekonomická BAKALÁŘSKÁ PRÁCE 2002 Tomáš Psika Univerzita Jana Evangelisty Purkyně v Ústí nad Labem Fakulta sociálně ekonomická Studijní

Více

Bakalářská práce Lucie Nosková

Bakalářská práce Lucie Nosková UNIVERZITA PALACKÉHO V OLOMOUCI PEDAGOGICKÁ FAKULTA Katedra technické a informační výchovy Bakalářská práce Lucie Nosková Školní informační systémy Olomouc 2012 PhDr. PaedDr. Jiří Dostál, Ph.D. Anotace

Více

Pokročilá tvorba webu

Pokročilá tvorba webu Rozšíření výuky informačních technologií na Gymnáziu Pacov Reg. číslo: CZ.1.07/1.1.01/02.0008 Pokročilá tvorba webu Výukový materiál Bc. Patrik Jíra 27. 12. 2009 Tento projekt je spolufinancován z Evropského

Více

Návrh webového obchodu

Návrh webového obchodu Bankovní institut vysoká škola Praha Katedra informatiky a kvantitativních metod Návrh webového obchodu Bakalářská práce Autor: Alyabyev Alexandr Informační technologie Vedoucí práce: Ing. Bohuslav Růžička,

Více

Koncepce rozvoje Na rodnı knihovny C eske republiky jako vy zkumne organizace na le ta 2010-2015

Koncepce rozvoje Na rodnı knihovny C eske republiky jako vy zkumne organizace na le ta 2010-2015 Koncepce rozvoje Na rodnı knihovny C eske republiky jako vy zkumne organizace na le ta 2010-2015 Zpráva o řešení za r. 2010 Koordinátor: Mgr. Adolf Knoll, ředitel pro vědu, výzkum a mezinárodní vztahy

Více

Učební materiály tvorby webových prezentací pro výuku žáků se sluchovým postižením. Ing. Jaroslav Krajča

Učební materiály tvorby webových prezentací pro výuku žáků se sluchovým postižením. Ing. Jaroslav Krajča Učební materiály tvorby webových prezentací pro výuku žáků se sluchovým postižením Ing. Jaroslav Krajča Bakalářská práce 2013 ABSTRAKT Cílem bakalářské práce je vytvořit výukové materiály pro tvorbu

Více

UNICORN COLLEGE. Katedra informačních technologií BAKALÁŘSKÁ PRÁCE. Selftest systém v ASP.NET. Autor BP: Milan Klapač

UNICORN COLLEGE. Katedra informačních technologií BAKALÁŘSKÁ PRÁCE. Selftest systém v ASP.NET. Autor BP: Milan Klapač UNICORN COLLEGE Katedra informačních technologií BAKALÁŘSKÁ PRÁCE Autor BP: Milan Klapač Vedoucí BP: Ing. David Hartman Ph.D. 2013 Praha Čestné prohlášení Prohlašuji, že jsem svou bakalářskou práci na

Více

NÁVRH A REALIZACE INZERTNÍHO SERVERU CONCEPT AND REALISATION OF PUBLICITY SERVER

NÁVRH A REALIZACE INZERTNÍHO SERVERU CONCEPT AND REALISATION OF PUBLICITY SERVER VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA PODNIKATELSKÁ ÚSTAV INFORMATIKY FACULTY OF BUSINESS AND MANAGEMENT INSTITUTE OF INFORMATICS NÁVRH A REALIZACE INZERTNÍHO SERVERU CONCEPT

Více

Sem vložte zadání Vaší práce.

Sem vložte zadání Vaší práce. Sem vložte zadání Vaší práce. České vysoké učení technické v Praze Fakulta informačních technologií Katedra softwarového inženýrství Bakalářská práce Datové řezy a anonymizace Petr Smítka Vedoucí práce:

Více

Školní interaktivní web

Školní interaktivní web Mendelova zemědělská a lesnická univerzita Institut celoživotního vzdělávání Školní interaktivní web Závěrečná práce Vedoucí práce: Ing. Ludmila Brestičová Mgr. Otmar Němec Brno 2007 Zadání závěrečné práce

Více

UNICORN COLLEGE BAKALÁŘSKÁ PRÁCE

UNICORN COLLEGE BAKALÁŘSKÁ PRÁCE UNICORN COLLEGE Katedra ekonomiky a managementu BAKALÁŘSKÁ PRÁCE Popis procesů business testování a jejich optimalizace Autor BP: Dalibor Pavlíček Vedoucí BP: Mgr. Julius Čunderlík 2012 Praha Čestné prohlášení

Více

BAKALÁŘSKÁ PRÁCE. Zavedení datových schránek a jejich vliv na oběh účetních dokladů

BAKALÁŘSKÁ PRÁCE. Zavedení datových schránek a jejich vliv na oběh účetních dokladů BAKALÁŘSKÁ PRÁCE Zavedení datových schránek a jejich vliv na oběh účetních dokladů Implementation of Data Boxes and Their Influence on Accounting Unicorn College 2011 Unicorn College, V Kapslovně 2767/2,

Více

#1 Výukové objekty. http://www.jtie.upol.cz/clanky_3_2009/sehnalova.pdf. 1 Výukové objekty a jejich zdroje na Internetu.

#1 Výukové objekty. http://www.jtie.upol.cz/clanky_3_2009/sehnalova.pdf. 1 Výukové objekty a jejich zdroje na Internetu. Průvodka dokumentem Výukový software 2: - nadpisy tří úrovní (pomocí stylů Nadpis 1-3), před nimi je znak # - na začátku dokumentu je automatický obsah (#Obsah) - obrázky vynechány, zůstávají pouze původní

Více

MÉDIA A SVĚT ICT. Mgr. Lenka Fojtíková. Havířov 2013

MÉDIA A SVĚT ICT. Mgr. Lenka Fojtíková. Havířov 2013 MÉDIA A SVĚT ICT Mgr. Lenka Fojtíková Havířov 2013 Tyto studijní materiály vznikly za finanční podpory Evropského sociálního fondu (ESF) a rozpočtu České republiky v rámci řešení projektu OP VK CZ.1.07/3.1.00/37.0170

Více

INFORMAČNÍ A KOMUNIKAČNÍ TECHNOLOGIE PRO VZDĚLÁVÁNÍ OSOB S MENTÁLNÍM HANDICAPEM

INFORMAČNÍ A KOMUNIKAČNÍ TECHNOLOGIE PRO VZDĚLÁVÁNÍ OSOB S MENTÁLNÍM HANDICAPEM ČESKÁ ZEMĚDĚLSKÁ UNIVERZITA V PRAZE PROVOZNĚ EKONOMICKÁ FAKULTA INFORMAČNÍ A KOMUNIKAČNÍ TECHNOLOGIE PRO VZDĚLÁVÁNÍ OSOB S MENTÁLNÍM HANDICAPEM disertační práce Autor: Školitel: Obor: Ing. Petr Benda doc.

Více

Vysoká škola ekonomická v Praze Fakulta informatiky a statistiky Vyšší odborná škola informačních služeb v Praze. Jan Bursa

Vysoká škola ekonomická v Praze Fakulta informatiky a statistiky Vyšší odborná škola informačních služeb v Praze. Jan Bursa Vysoká škola ekonomická v Praze Fakulta informatiky a statistiky Vyšší odborná škola informačních služeb v Praze Jan Bursa Zavedení systému pro evidenci strojů ve firmě Doosan Bobcat Bakalářská práce 2012

Více

Bezpečnost dat v informatice Data Security in Computer Science. Jan Hraňo

Bezpečnost dat v informatice Data Security in Computer Science. Jan Hraňo Bezpečnost dat v informatice Data Security in Computer Science Jan Hraňo Bakalářská práce 2014 UTB ve Zlíně, Fakulta aplikované informatiky, 2014 4 ABSTRAKT Tato bakalářská práce se zaobírá především

Více

Západočeská univerzita v Plzni FAKULTA PEDAGOGICKÁ KATEDRA VÝPOČETNÍ A DIDAKTICKÉ TECHNIKY

Západočeská univerzita v Plzni FAKULTA PEDAGOGICKÁ KATEDRA VÝPOČETNÍ A DIDAKTICKÉ TECHNIKY Západočeská univerzita v Plzni FAKULTA PEDAGOGICKÁ KATEDRA VÝPOČETNÍ A DIDAKTICKÉ TECHNIKY PROBLEMATIKA OPTIMALIZACE PRO INTERNETOVÉ VYHLEDÁVÁNÍ BAKALÁŘSKÁ PRÁCE Filip Heidenreich Přírodovědná studia,

Více

ANALÝZA A ŘEŠENÍ SYSTÉMU PRO MONITORING ISIR A VYBRANÝCH REGISTRŮ ARES

ANALÝZA A ŘEŠENÍ SYSTÉMU PRO MONITORING ISIR A VYBRANÝCH REGISTRŮ ARES Vysoká škola ekonomická v Praze Fakulta informatiky a statistiky Katedra informačních technologií Studijní program : Aplikovaná informatika Obor: Informační systémy a technologie ANALÝZA A ŘEŠENÍ SYSTÉMU

Více

Metodika tvorby webových aplikací

Metodika tvorby webových aplikací BANKOVNÍ INSTITUT VYSOKÁ ŠKOLA Metodika tvorby webových aplikací Bakalářská páce Stanislav Němec březen/2009 BANKOVNÍ INSTITUT VYSOKÁ ŠKOLA Katedra informačních technologií Metodika tvorby webových aplikací

Více

TV vysílání přes Internet se zaměřením na on-line vysílání České televize

TV vysílání přes Internet se zaměřením na on-line vysílání České televize VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE FAKULTA INFORMATIKY A STATISTIKY KATEDRA SYSTÉMOVÉ ANALÝZY TV vysílání přes Internet se zaměřením na on-line vysílání České televize Bakalářská práce Autor: Radim Švehla

Více

Informační a komunikační systém školy v ASP.NET

Informační a komunikační systém školy v ASP.NET OSTRAVSKÁ UNIVERZITA V OSTRAVĚ PŘÍRODOVĚDECKÁ FAKULTA KATEDRA INFORMATIKY A POČÍTAČŮ Informační a komunikační systém školy v ASP.NET Bakalářská práce Autor práce: Vlastislav Novák Vedoucí práce: RNDr.

Více