Formáty WWW zdrojů. Mgr. Filip Vojtášek. vojtasek@ikaros.cz. http://webarchiv.nkp.cz



Podobné dokumenty
Schéma e-pošty. UA (User Agent) rozhraní pro uživatele MTA (Message Transfer Agent) zajišťuje dopravu dopisů. disk. odesilatel. fronta dopisů SMTP

VÝVOJ INTERNETOVÝCH APLIKACÍ - VIA

Principy fungování WWW serverů a browserů. Internetové publikování

IVT. Grafické formáty. 8. ročník

Základy informatiky. Elektronické publikování. Daniela Szturcová Část převzata z přednášky P. Děrgela

b) červená, zelená, modrá, c) černá, bílá, d) černá, bílá, šedá. 5. PNG je formát: a) textový,

Základy informatiky. 02 Elektronické publikování. Michal Kačmařík upraveno z přednášek D. Szturcové a P. Děrgela

rychlý vývoj webových aplikací nezávislých na platformě Jiří Kosek

Vzdělávací obsah vyučovacího předmětu

Převody datových formátů

INFORMAČNĚ TECHNOLOGICKÝ ZÁKLAD

ROZVOJ E-LEARNINGU NA 1. LF UK PRAHA

Ing. Přemysl Brada, MSc., Ph.D. Ing. Martin Dostal. Katedra informatiky a výpočetní techniky, FAV, ZČU v Plzni

Střední průmyslová škola elektrotechnická Praha 10, V Úžlabině 320

Mapový server Marushka. Technický profil

Specifikace software pro NUŠL

MBI - technologická realizace modelu

Jádrem systému je modul GSFrameWork, který je poskytovatelem zejména těchto služeb:

Informace o provozu podatelny a o podmínkách přijímání dokumentů na Krajském úřadu Ústeckého kraje

Grafický software ve výuce a pro výuku

TECHNICKÁ DOKUMENTACE

PRACOVIŠTĚ PRO DLOUHODOBÉ UCHOVÁVÁNÍ A ZPŘÍSTUPŇOVÁNÍ DOKUMENTŮ V DIGITÁLNÍ PODOBĚ NÁRODNÍ DIGITÁLNÍ ARCHIV

Základy informatiky. Elektronické publikování. Daniela Szturcová Část převzata z přednášky P. Děrgela

Wichterlovo gymnázium, Ostrava-Poruba, příspěvková organizace. Maturitní otázky z předmětu INFORMATIKA A VÝPOČETNÍ TECHNIKA

Osnova přednášky. Formáty uložení dat. Vyjádření hodnot datového typu. Vyjádření hodnot datového typu. Datové formáty. Výpočetní technika I

Úvod do tvorby internetových aplikací

WWW technologie. HTTP protokol

Počítačová grafika a vizualizace I

3 roky Open Source Software. Ing. Michal Miklenda stek generálního inspektora ní inspekce

Střední průmyslová škola elektrotechnická Praha 10, V Úžlabině 320 M A T U R I T N Í T É M A T A P Ř E D M Ě T U

Současný svět Projekt č. CZ.2.17/3.1.00/32038, podpořený Evropským sociálním fondem v rámci Operačního programu Praha adaptabilita

Evidence městského mobiliáře v GIS Kompas 3.2

Evidence a správa kanalizace v GIS Kompas 3.2

Povinně zveřejňované údaje dle vyhlášky č. 259/2012 Sb., o podrobnostech výkonu spisové služby

Profilová část maturitní zkoušky 2017/2018

FAKULTA STAVEBNÍ OBOR GEODÉZIE A KARTOGRAFIE KATEDRA MAPOVÁNÍ A KARTOGRAFIE

K PROBLEMATICE SPISOVÉ SLUŽBY v elektronické podobě

Základy informatiky část 10

Škola: Gymnázium, Brno, Slovanské náměstí 7 III/2 Inovace a zkvalitnění výuky prostřednictvím ICT Název projektu: Inovace výuky na GSN

Internet 2 css, skriptování, dynamické prvky

1. HDR. 2. Test Práce ve Windows. 3. Tilt-shift efekt. 4. Excel tisk a tvorba grafů. Informatika Ditta Kukaňová

Manuscriptorium jako základ pro virtuální badatelské prostředí

Profilová část maturitní zkoušky 2013/2014

Pojmenuje a ovládá základní funkce počítače, seznámí se s jednoduchou historií vývoje počítačů. Pojmenuje a ovládá základní funkce počítače

PŘÍSTUPNOST DOKUMENTŮ. Michal Rada

Dlouhodobá ochrana digitální dokumentů. Mgr. Jaroslav Kvasnica

Zdroj:

Archivace relačních databází

Název školy: Základní škola a Mateřská škola Žalany. Číslo projektu: CZ. 1.07/1.4.00/ Téma sady: Informatika pro pátý až šestý ročník

Formáty a dlouhodobé uložení: Identifikace, extrakce a validace

Projekt Datové schránky

Technologická centra obcí ZKUŠENOSTI HOSTOVÁNÍ ŘEŠENÍ SPISOVÉ SLUŽBY

Úvod do aplikací internetu a přehled možností při tvorbě webu

Jak lze zefektivnit monitoring médií

SADA VY_32_INOVACE_PP1

Měření teploty, tlaku a vlhkosti vzduchu s přenosem dat přes internet a zobrazování na WEB stránce

Systém GIMP (barvy, vrstvy, transformace, průhlednost)

Pasport veřejného osvětlení v GIS Kompas 3.2


Evidence hrobových míst v GIS Kompas 3.2

Dlouhodobé a důvěryhodné ukládání elektronických dokumentů. Oskar Macek

Projekt CDArcha: kooperativní zpracování datových CD disků. Zdeněk Hruška, Petr Žabička Moravská zemská knihovna v Brně AKM 2018

Uživatelská dokumentace

Cloud Computing pro státní správu v praxi. Martin Vondrouš - Software602, a.s. Pavel Kovář - T-Systems Czech Republic a.s.

HTTP protokol. HTTP protokol - úvod. Zpracoval : Petr Novotný novotny0@students.zcu.cz

Compatibility List. GORDIC spol. s r. o. Verze

INFORMATIKA. Charakteristika vyučovacího předmětu:

Příloha č. 1. Systém webových stránek města Česká Lípa. I. Vymezení předmětu VZ

Doručování analogových dokumentů. Doručování digitálních dokumentů

DOKUMENTACE A MANUÁLY

1. Formáty grafických dat

Vzdálený přístup k počítačům

Softwarová konfigurace PC

DŮVĚRYHODNÁ ELEKTRONICKÁ SPISOVNA

1. Pořízení dokumentu

Obraz jako data. Biofyzikální ústav Lékařské fakulty Masarykovy univerzity Brno. prezentace je součástí projektu FRVŠ č.2487/2011

imos DSP Nové možnosti datové sběrné pošty pro II. pololetí roku 2014

Elektronická pošta. elementární služba, výchozí pro některé další jedna z prvních síťových služeb vůbec. základní principy popisují

Hospodářská informatika

Spisová služba a její další rozvoj v souvislosti se zavedením datových schránek

5.15 INFORMATIKA A VÝPOČETNÍ TECHNIKA

Nové přístupy tvorby web site. Doc. Ing. Zdeněk Havlíček, CSc. KIT PEF CZU - 13/11/2001

SYLABUS IT V. Jiří Kubica. Ostrava 2011

Posouzení vlastností elektronických dokumentů z hlediska jejich dlouhodobého uchovávání

Číslo a název šablony III/2 Inovace a zkvalitnění výuky prostřednictvím ICT H/01 Kuchař - Číšník. IKT Informační a komunikační technologie

Využití ICT techniky především v uměleckém vzdělávání. Akademie - VOŠ, Gymn. a SOŠUP Světlá nad Sázavou

Rozdělení operačních systémů

JPEG Formát pro archivaci a zpřístupnění.

Registrační číslo projektu: CZ.1.07/1.5.00/ Elektronická podpora zkvalitnění výuky CZ.1.07 Vzděláním pro konkurenceschopnost

Datové schránky na UK

DINOX IP kamery řady: DDC-xxxx DDR-xxxx DDX-xxxx DDB-xxxx

Vyšší odborná škola a Střední škola,varnsdorf, příspěvková organizace. Šablona 4 VY 32 INOVACE

BI-AWD. Administrace Webového a Databázového serveru Virtualizace HTTP serveru

DigiDepot: JPEG 2000 jako ukládací formát

Informatika základní pojmy

Vaše jistota na trhu IT. ComDay. V datové schránce dokument nekončí. Roman Zemánek, ICZ a.s Petr Oplátek, ICZ a.s

6.28 Informatika. Vzdělávací oblast: Informační a komunikační technologie Vyučovací předmět: Informatika. Informační a komunikační technologie

INFORMAČNĚ TECHNOLOGICKÝ ZÁKLAD

Transkript:

Formáty WWW zdrojů Mgr. Filip Vojtášek vojtasek@ikaros.cz

Formáty: obecný pohled! Způsob uspořádání dat do sekvence pomocí binární soustavy " bit stream (logický formát)! Způsob vnější prezentace datového souboru pomocí aplikačního softwaru a výstupního hardwarového zařízení (fyzický formát)

MIME (Multipurpose Internet Mail Extension)! Původně konvence pro přenos zpráv elektronickou poštou a jejích příloh v jiné podobě než v ASCII! Princip se uplatňuje i v protokolu HTTP: součástí hlaviček (headers), které doprovázejí data jako odpověď webového serveru na požadavek klienta, je i specifikace jejich typu! Content-Type: základní typ/upřesnění obsahu (= formátu)! RFC 2045-2049! Registrované typy (IANA): ftp://ftp.isi.edu/innotes/iana/assignments/media-types/

MIME Jednoduché typy text image audio video application model Složené typy message multipart příklady html, plain, xml gif, jpeg, png wav mpeg msword, pdf, rtf, postscript vrml příklady rfc822 encrypted Vlastní typ: image/x-djvu (nutná úprava konfigurace webového serveru)

HTTP/1.0 200 OK Server: Netscape-FastTrack/2.01 Date: Thu, 14 Jun 2001 13:49:20 GMT Accept-ranges: bytes Last-modified: Wed, 13 Jun 2001 10:39:49 GMT Content-length: 1940 Content-type: text/html <HTML> <HEAD> <TITLE>Titulek</TITLE> </HEAD> <BODY> <H1>Kapitola</H1>... </BODY> </HTML>

Formáty dnes! Text: HTML 4.0! Rastrová grafika: JPEG a GIF (naděje vkládané do PNG se nepotvrdily)! Distribuce: PDF! Audio: MP3! Statické (hierarchické) systémy

Zastoupení formátů na WWW! Švédsko (automatické indexování harvesting v rámci projektu Kulturarw 3, 1998 a 2000) MIME typ/podtyp text/html image/gif image/jpeg text/plain application/pdf application/msword image/png 1998 56 20 10 9 2000 52 24 20 2 1,3 0,3 0,3

Zastoupení formátů na WWW! Nizozemí (projekt DNEP, 2000) MIME typ/podtyp text/html image/gif image/jpeg text/plain ostatní 2000 66 24 6 2 2

Zastoupení formátů na WWW! Česká republika (průzkum v databázích vyhledávacích služeb AltaVista a Google, červen 2001) ostatní 38 % AltaVista.pdf 4 %.txt 2 % Google ostatní 21 %.html+.htm 62 %.html+.htm 73 %

Webové prohlížeče! Univerzální prostředek pro přístup k elektronickým zdrojům v jednom (webovém) rozhraní! On-line > off-line! Standardy (W3) vs. reálná podpora ze strany prohlížečů! Čisté HTML minulostí (vnořené objekty a externí soubory)! Plug-in jako nezbytný doplněk pro práci s netradičními datovými formáty (.djvu,.lwf,.svg,.pdf,.swf )

Podíl přístupů podle prohlížeče (servery internet.com, květen 2001) IE 4.x 10 % NN 4.x 8 % NN 6.x 3 % IE 5.x 79 %

Formáty zítra I?! Text: XML/schémata XML (AML, WML, NewsML, CML, MathML, DocBook aj.) + XHTML místo HTML # WWW # Intranet # E-business # Databázové aplikace # WAP # DTP # DMS! Distribuce: PDF (elektronické časopisy aj.) místo postskriptu a T E X?! Rastrová grafika: wavelet technologie (JPEG 2000 aj.) místo JPEG?! Vektorová grafika: SVG (W3), Flash místo GIF?

Formáty zítra II?! Audio: MP3! Video: MPEG 4, MPEG 7! Živé vysílání (audio, video)! Elektronické knihy: kompatibilní s OEB (Open ebook Publication Structure) Microsoft a další! Dynamické systémy (SQL + ASP/PHP)

Formáty a archivace elektronických zdrojů! Rychlé morální stárnutí komponent digitálního prostředí (aplikační SW, operační systém, HW platforma) = nástrojů interpretace elektronických zdrojů! Primární faktor ovlivňující čitelnost elektronických zdrojů (x fyzická životnost nosiče)! Formáty: # Všeobecné (široká podpora různými producenty SW z dané kategorie TXT, HTML, XML, JPEG, GIF, RTF, MP3 ) # Proprietární (ideální dekódování zajišťuje pouze jeden aplikační SW DOC, PPT, PDF, RAM, WPD, CDR )! Jistota : zpětná kompatibilita u SW téhož producenta! Klíčová otázka: Uchovat obsah nebo obsah + formu?! Dvě metody: migrace a emulace

Migrace! Co uchovat? Obsah! Jak? Včasná cyklická konverze elektronických zdrojů ze staršího digitálního prostředí do nového! Proč ano? Praktické zkušenosti! Proč ne? Hrozí nebezpečí postupnéztráty integrity zdroje (nutnost výběru perspektivního formátu)

Emulace! Co uchovat? Zdroj v originálním formátu (tj. obsah i formu)! Jak? Spolu se zdrojem uložen příslušný aplikační SW a operační systém v původní podobě + specifikace HW platformy pro budoucí emulaci (= oživení) zastaralého digitálního prostředí! Proč ano? Teoreticky efektivnější a levnější! Proč ne? V reálných podmínkách neověřeno (ve stádiu testování - projekty NEDLIB, CAMiLEON)