Lidé komunikují prostřednictvím dokumentů připravovaných elektronicky.

Podobné dokumenty
Lidé komunikují prostřednictvím dokumentů připravovaných elektronicky

Lidé komunikují prostřednictvím dokumentů připravovaných elektronicky.

Lidé komunikují prostřednictvím dokumentů připravovaných elektronicky.

Obsah prezentace. Co je to XML? Vlastnosti. Validita

Vývoj Internetových Aplikací

Syntaxe XML XML teorie a praxe značkovacích jazyků (4IZ238)

24. XML. Aby se dokument XML vůbec zobrazil musí být well-formed (správně strukturovaný). To znamená, že splňuje formální požadavky specifikace XML.

Správnost XML dokumentu

Jazyky pro popis dat

APLIKACE XML PRO INTERNET

Uspořádání klient-server. Standardy pro Web

Úvod do databázových systémů B

Lidé komunikují prostřednictvím dokumentů připravovaných elektronicky.

ZNAČKOVACÍ JAZYKY A JEJICH VYUŽÍVÁNÍ MARKUP LANGUAGE AND THEIR USE. Zdeněk Havlíček

XML terminologie a charakteristiky. Roman Malo

Metody tvorby ontologií a sémantický web. Martin Malčík, Rostislav Miarka

Úvod do tvorby internetových aplikací

Úvod do aplikací internetu a přehled možností při tvorbě webu

Tvorba jednoduchých WWW stránek. VŠB - Technická univerzita Ostrava Katedra informatiky

Tvorba WWW stránek. Mojmír Volf

Dnešní téma. Oblasti standardizace v ICT. Oblasti standardizace v ICT. Oblasti standardizace v ICT

Další XML technologie

SCHÉMOVÉ JAZYKY. Přednáška z předmětu KMA/POK. Otakar ČERBA Západočeská univerzita v Plzni

(X)HTML, CSS a jquery

Škola: Gymnázium, Brno, Slovanské náměstí 7 III/2 Inovace a zkvalitnění výuky prostřednictvím ICT Název projektu: Inovace výuky na GSN

XML a DTD. <!DOCTYPE kořenový_element [deklarace definující vlastnosti jednotlivých elementů a atributů]> externí deklarace:

Lidé komunikují prostřednictvím dokumentů připravovaných elektronicky.

X36DSV 3. cvičení. XML (extensible Markup Language) JavaScript. AJAX (Asynchronous JavaScript and XML) X36DSV. 2007/10 ver.2.0 1

Verze z December 5, 2011 formátovaná k úspornému tisku.

Sémantický web 10 let poté

14. Jazyk HTML (vývoj, principy, funkce, kostra stránky). Jazyk XML, XHTML. Algoritmizace - cyklus for, while a do while, implementace v jazyce

Základy WWW publikování

Lidé komunikují prostřednictvím dokumentů připravovaných elektronicky.

Elektronické publikování. doc. RNDr. Petr Šaloun, Ph.D. katedra informatiky FEI VŠB TU Ostrava

HTML Hypertext Markup Language

XML schémata XML teorie a praxe značkovacích jazyků (IZI238)

Internetové publikování

POLOPROVOZ ZNALOSTNÍ DATABÁZE INTERPI DOKUMENTACE

Základy XML struktura dokumentu (včetně testových otázek)

Úvod do XML Technologie

HTML - Úvod. Zpracoval: Petr Lasák

HTML XHTML JavaScript PHP ASP.Net Zajímavé odkazy

MATURITNÍ OTÁZKY ELEKTROTECHNIKA - POČÍTAČOVÉ SYSTÉMY 2003/2004 PROGRAMOVÉ VYBAVENÍ POČÍTAČŮ

Kartografická webová aplikace. Přednáška z předmětu Počítačová kartografie (KMA/POK) Otakar Čerba Západočeská univerzita

NSWI096 - INTERNET. Úvod do HTML

CSS V DIGITÁLNÍ KARTOGRAFII

Michal Krátký, Miroslav Beneš

rychlý vývoj webových aplikací nezávislých na platformě Jiří Kosek

XML Š ABLONY A JEJICH INTEGRACE V LCMS XML TEMPLATES AND THEIN INTEGRATION IN LCMS

ČESKÁ TECHNICKÁ NORMA

Distanční opora předmětu: Databázové systémy Tématický blok č. 4: XML, DTD, XML v SQL Autor: RNDr. Jan Lánský, Ph.D.

Internet 1 vývoj, html, css

Analýza dat a modelování. Speciální struktury

Inovace výuky prostřednictvím šablon pro SŠ

Tvorba informačních systémů

Tvorba WWW stránek. přehled technologií používaných na webu principy jednotlivých technologií a možnosti jejich vzájemného kombinování

Tvorba webu. Úvod a základní principy. Martin Urza

Lidé komunikují prostřednictvím dokumentů připravovaných elektronicky.

Počítačová Podpora Studia. Přednáška 5 Úvod do html a některých souvisejících IT. Web jako platforma pro vývoj aplikací.

Technologie pro tvorbu webových aplikací 1. díl (rozdělení, HTML, XHTML)

Tvorba informačních systémů

Úvod do informatiky 5)

Lehký úvod do XML v kartografii

Lidé komunikují prostřednictvím dokumentů připravovaných elektronicky.

DUM č. 11 v sadě. 36. Inf-12 Počítačové sítě

Programovací jazyky Přehled a vývoj

WWW a HTML. Základní pojmy. Ivo Peterka

Možnosti využití XML v knihovnické praxi. Gabriela Krčmařová AKP 2001 Národní knihovna ČR Liberec,

Formáty WWW zdrojů. Mgr. Filip Vojtášek.

CZ.1.07/1.5.00/

Základy HTML (2. přednáška)

Ing. Přemysl Brada, MSc., Ph.D. Ing. Martin Dostal. Katedra informatiky a výpočetní techniky, FAV, ZČU v Plzni

Identifikátor materiálu: ICT-3-55

l Kontakt s klientem SSP Popis automatizované komunikace s ÚP ČR v součinnosti a exekuci

Značkovací jazyky a spol. HTML/XHTML XML JSON YAML Markdown, Texy!

VÝUKOVÝ MATERIÁL. Bratislavská 2166, Varnsdorf, IČO: tel Číslo projektu

Microsoft Office 2003 Souhrnný technický dokument white paper

Vstupní data pro program Deformace ve formátu XML

Python XML a Web 1 PGS

Prezentace XML. XML popisuje strukturu dat, neřeší vzhled definice vzhledu:

MBI - technologická realizace modelu

Maturitní otázky z předmětu PROGRAMOVÁNÍ

Internet 2 css, skriptování, dynamické prvky

Požadavky pro výběrová řízení TerraBus ESB/G2x

Lidé komunikují prostřednictvím dokumentů připravovaných elektronicky

Webové služby a XML. Obsah přednášky. Co jsou to webové služby. Co jsou to webové služby. Webové služby a XML

Současný svět Projekt č. CZ.2.17/3.1.00/32038, podpořený Evropským sociálním fondem v rámci Operačního programu Praha adaptabilita

Základy webových aplikací ZWA Přednáška č. 2 HTML. Martin Klíma

Kaskádové styly (CSS)

Publikování map na webu - WMS

Základy a principy World Wide Web-u

INFORMAČNÍ SYSTÉMY NA WEBU

Využití informačních technologií v cestovním ruchu P1

(X)HTML a CSS. VOŠ a SŠT Česká Třebová

Softwarové komponenty a Internet

XML a nové trendy v publikování na Webu

Předmluva k druhému vydání 13. Úvod 17. ČÁST 2 Vytváření dokumentů XML 65

Znalostní systém nad ontologií ve formátu Topic Maps

Transkript:

PB029 Elektronická příprava dokumentů Anyone who would letterspace the lowercase would steal sheep. Frederick Goudy (1865 1947), when looking on a prize winner certificate You cannot not communicate. Paul Watzlawick (1921 2007), in Pragmatics of Human Communication Lidé komunikují prostřednictvím dokumentů připravovaných elektronicky. Petr Sojka PB029 Od autora ke čtenáři podzim 2017 1 / 1

PB029 Elektronická příprava dokumentů PB029 Elektronická příprava dokumentů Petr Sojka podzim 2017 Petr Sojka PB029 Od autora ke čtenáři podzim 2017 2 / 1

Osnova dnešní přednášky a demopřednášky I Přednáška XML, Historický vývoj od SGML k XML. Formální dokumenty a gramatiky: DTD, XML Schema, Relax NG. HTML, XHTML, MathML, WML, HTML5. Formáty a normy související s XML (XLink, XPointer, RDF, XTM). AJAX. DOM. *ML, HTML, HTML5 vs. XHTML Výměna dokumentů na Internetu, URI/URL/URN. Readings do příště. Petr Sojka PB029 Značkování podzim 2017 54 / 1

Osnova dnešní přednášky a demopřednášky II Demopřednáška: Základní principy XML, tvorba vlastního XML jazyka s formální definicí pomocí XML Schema, transformace XML (povinná úloha). Příprava 1. a 2. zápočtového dokumentu doporučení. PV126, PB138? Petr Sojka PB029 Značkování podzim 2017 55 / 1

E = mc 2?! E = mc 2 E = mc 2 Značkování Markup Návrh Design Sazba Typesetting Korektury Proofreading Předloha Preprint Tisk Print Distribuce Distribution Petr Sojka PB029 Značkování podzim 2017 56 / 1

Co je to XML? 1. XML: EXtensible Markup Language. 2. Univerzální a otevřený formát pro reprezentaci (a výměnu) téměř libovolné datové struktury dokumentů i dat. 3. Doporučení WWW Consortium: rozšiřitelný značkovací (meta)jazyk. 4. Celá sada technologií a formátů s XML souvisejících (XHTML, XSL, XSL-FO, CSS, XPointer, XLink,... ) pro elektronické zpracování textů, design, sazbu i výměnu dokumentů či dat. Petr Sojka PB029 Značkování podzim 2017 57 / 1

Příklad XML dokumentu <?xml version="1.0" encoding="utf-8"?> <!- deklarace -> <!DOCTYPE faktura SYSTEM "faktura.dtd"> <!- gramatika -> <faktura vystaveni="22.10.2017" <!- data -> splatnost="22.11.2017"> <odberatel> <nazev>ferda Pistorius</nazev> <adresa>boubín 77</adresa> <ico>2862667777</ico> <dic>291-2862667777</dic> </odberatel> <dodavatel> <nazev>hynek Bedna</nazev> <adresa>máchovo jezero 78</adresa> <ico>2862467777</ico> <dic>291-2862467777</dic> </dodavatel> <polozka> <popis>xml editor</popis> <cena mena="kč">500</cena> </polozka> </faktura> Petr Sojka PB029 Značkování podzim 2017 58 / 1

Vymezení XML 1. Násobné a opakované použití dat. 2. Metajazyk: XML nespecifikuje ani sémantiku, ani množinu značek, umožňuje však značky definovat a definovat jejich strukturální závislosti. 3. Sémantiku určují aplikace (webové prohlížeče jsou jedny z nich). 4. Části XML dokumentu: deklarace + gramatika + data. Petr Sojka PB029 Značkování podzim 2017 59 / 1

XML jako metajazyk 1. XML je mezinárodní standard pro popis značkovacích jazyků. 2. Formálněji je to syntaktický metajazyk pro definici tříd dokumentů (deskriptivních značkovacích jazyků), nezávislých na abecedě. 3. Formální definice typu dokumentu se nazývá DTD Document Type Definition, definice typu dokumentu (gramatika třídy dokumentů). XML parser (validátor) pak čte na vstupu DTD a kontroluje formální správnost. 4. Instance XML dokumentu (dále jen XML dokument) sestává z deklarace (pokynů pro parser), gramatiky (DTD) a vlastního popisně označkovaného textu, dat. Petr Sojka PB029 Značkování podzim 2017 60 / 1

Syntaxe XML: správná strukturovanost well formed 1. XML document s korektní syntaxí (stromová struktura) je nazýván správně strukturovaný, well-formed. 2. Správně strukturovaný dokument by měla zpracovat každá XML aplikace. 3. Sekce CDATA pro pohodlnější psaní části dokumentů obsahujících významné znaky: <moudrost> <![CDATA[ (1 < 2) & 2 = 1000 x 1 ]]> </moudrost> Petr Sojka PB029 Značkování podzim 2017 61 / 1

Validita XML I 1. Silnější pojem než správná strukturovanost: validita. 2. Dokument vyhovuje gramatice, která vynucuje strukturu, pořadí a množství značek. 3. Gramatika ve formě DTD (Document Type Definition). 4. Validátory (parsery): nsgmls, msxml, xerces, xmllint,... 5. Webová validace XHTML: http://validator.w3.org. 6. HTML5 validace: http://html5.validator.nu. 7. Lokální validace: například nsgmls od Jamese Clarka z modulu sp (module add sp) na aisa. Petr Sojka PB029 Značkování podzim 2017 62 / 1

Validita XML II 8. Třídy dokumentů. CATALOG. /packages/share/sgml-catalogs/ 9. Výstup parseru: Element Structure Information Set (ESIS) formát (strom dokumentu). Petr Sojka PB029 Značkování podzim 2017 63 / 1

XML deklarace <?xml version="1.0" encoding="iso-8859-2" standalone="no"? 1. Musí být na prvním řádku dokumentu, pro způsob interpretace zbývajících bytů. 2. Při standalone="yes" není třeba číst externí DTD. Petr Sojka PB029 Značkování podzim 2017 64 / 1

Instrukce pro zpracování konkrétní aplikací Pokyny (procesní instrukce) pro specifické aplikace: <?xml-stylesheet href="epd.css" type="text/css"?> nebo <?LaTeX \pagebreak?> nebo <datum> <?php echo Date "d.m.y"?> </datum> Petr Sojka PB029 Značkování podzim 2017 65 / 1

PB029 Elektronická příprava dokumentů 4. přednáška, 11. 10. 2017 Z hlavy autora do značek: historický vývoj Petr Sojka PB029 Značkování podzim 2017 66 / 1

Historie XML (od SGML 1986) I 1. Organizace ISO (International Standards Organization), vydává známé normy jako ISO 8859-2, 10646-1 (Unicode),... 2. Norma ISO 8879:1986 Information processing Text and office systems Standard Generalized Markup Language (SGML), vydaná 15. 10. 1986 po dlouhém procesu standardizace na základě návrhu Charlese Goldfarba a jeho GML. Počátky již na konci šedesátých let při návrhu informačního systému právnických textů v IBM. Petr Sojka PB029 Značkování podzim 2017 67 / 1

Historie XML (od SGML 1986) II 3. Celá sada standardů ISO: kromě SGML, DSSSL (Document Style Semantics and Specification Language, ISO/IEC DIS 10179.2:1994), SPDL (Standard Page Description Language, ISO/IEC DIS 10180:1991) a HyTime (Hypermedia/Time-based Structuring Language, ISO/IEC 10744:1992). O 4. S odstupem času: nesporný úspěch SGML, základ pro další značkovací jazyky (XML), ale například neúspěch SPDL oproti proprietárnímu PostScriptu. Petr Sojka PB029 Značkování podzim 2017 68 / 1

SGML historické poznámky a motivace XML I 1. Výhody: znovupoužívání částí dokumentů, kvalita a otevřenost systému, obecnost, nezávislost na konkrétní formě (WWW konsorcium), rozšiřitelnost dle technologických možností (hypertext), snížení nákladů, možnost validace (ověření korektnosti dokumentu na základě formální definice jazyka dokumentu). 2. Nevýhody: za obecnost se platí složitostí, i po dekádách užívání jsou nejlepší systémy na plné SGML drahé, změna s rozšířeními HTML, přesto přechod k XML (složitost). Petr Sojka PB029 Značkování podzim 2017 69 / 1

SGML historické poznámky a motivace XML II 3. Uživatelé SGML (zpočátku velké instituce, elektronický a letecký průmysl, nakladatelé): AAP, OUP, Boeing, Lufthansa, British Patent Office, Association of German editors, TEI, McGraw-Hill, LDC,... viz stránky Organization for the Advancement of Structured Information Standards. 4. Dnešní motivací je přesnější a relevantnější vyhledávání na Internetu (mikroformáty apod.). Petr Sojka PB029 Značkování podzim 2017 70 / 1

SGML deklarace I 1. Pokyny pro parser s definicemi abeced (analogie popisu BNF): role oddělovačů; rezervovaná jména; zakázané znaky, typicky kontrolní ASCII; pravidla pro pojmenovávání, citlivost na malá a velká písmena; velikosti délek, značek,... ; komentáře; parametry chování, které vlastnosti kontrolovat (OMITTAG). 2. Pokud deklarace v dokumentu není uvedena, používá se implicitně referenční syntaxe Reference Concrete Syntax (RCS). Petr Sojka PB029 Značkování podzim 2017 71 / 1

Příklad SGML deklarace) I <!SGML "ISO 8879:1986" CHARSET BASESET "ISO 646:1991//CHARSET IRV//ESC 2/8 4/2" DESCSET 0 9 UNUSED 9 2 9 - TAB, LF - 11 2 UNUSED 13 1 13 - CR - 14 18 UNUSED 32 95 32 127 1 UNUSED CAPACITY SGMLREF Petr Sojka PB029 Značkování podzim 2017 72 / 1

Příklad SGML deklarace) II TOTALCAP 35000... MDO "<!" - markup decl open - Petr Sojka PB029 Značkování podzim 2017 73 / 1

Příklad SGML deklarace) III MDC ">" - markup decl close - DSO "[" - declaration subset open - DSC "]" - declaration subset close - MSC "]]" - marked section close - COM "--" - comment - RNI "#" - reserved name indicator - LIT """ - literal - LITA " " - alternative literal - GRPO "(" - group open - GRPC ")" - group close - AND "&" - and connector - OR " " - or connector - SEQ "," - seq connector - Petr Sojka PB029 Značkování podzim 2017 74 / 1

Příklad SGML deklarace) IV OPT "?" - opt occurrence indicator - REP "*" - rep occurrence indicator - PLUS "+" - plus occ ind, inclusion - MINUS "-" - exclusion, omission flag - CRO "&#" - character reference open - ERO "&" - entity reference open - PERO "%" - parameter entity reference open - REFC ";" - reference close - PIO "<?" - processing instruction open - PIC ">" - processing instruction close - STAGO "<" - start tag open - ETAGO "</" - end tag open - TAGC ">" - tag close - NET "/" - null end-tag - Petr Sojka PB029 Značkování podzim 2017 75 / 1

Příklad SGML deklarace) V... Petr Sojka PB029 Značkování podzim 2017 76 / 1

SGML/XML DTD: atributová gramatika I 1. Terminologie teorie formálních jazyků: neterminály (elementy), terminály (entity). 2. Elementy vytvářejí stromovou strukturu, nemohou se navzájem křížit, jeden element je kořenový. Lze použít prázdné elementy. <br/>. 3. Elementy mohou mít atributy. O Petr Sojka PB029 Značkování podzim 2017 77 / 1

SGML/XML DTD: atributová gramatika II <!ELEMENT faktura (odberatel,dodavatel, polozka+)> <!ELEMENT odberatel (nazev,adresa,ico,dic)> <!ELEMENT dodavatel (nazev,adresa,ico,dic)> <!ELEMENT polozka (popis?,cena,dph,ks?)> <!ELEMENT nazev (#PCDATA)> <!ELEMENT adresa (#PCDATA)> <!ELEMENT ico (#PCDATA)> <!ELEMENT dic (#PCDATA)> <!ELEMENT popis (#PCDATA)> <!ELEMENT cena (#PCDATA)> <!ELEMENT dph (#PCDATA)> <!ELEMENT ks (#PCDATA)> Petr Sojka PB029 Značkování podzim 2017 78 / 1

SGML/XML DTD: atributová gramatika III <!ATTLIST faktura cislo CDATA #REQUIRED vystaveni CDATA #REQUIRED splatnost CDATA #REQUIRED vystavil CDATA #IMPLIED> <!ATTLIST cena mena CDATA "CZK"> Petr Sojka PB029 Značkování podzim 2017 79 / 1

Deklarace elementů a atributů 1. Sekvence, alternativa, ANY, EMPTY, #PCDATA. 2. Opakování: právě jednou, nejvýše jednou (?), alespoň jednou (+), libovolněkrát (*). 3. Typy atributů CDATA, NMTOKEN, NMTOKENS, ID, IDREF, IDREFS, ENTITY, ENTITIES, výčet. 4. Implicitní hodnoty atributů: "hodnota", #REQUIRED, #IMPLIED, #FIXED "hodnota". Petr Sojka PB029 Značkování podzim 2017 80 / 1

Entity I Vhodné pojmenovat části a fragmenty XML, některé řetězce (&TeX; v IS) a znaky použité jako oddělovače v gramatice: <, &, ". Entity interní textové, externí textové, externí binární a parametrické. Příklad množiny interních textových entit: ISO Latin2. Petr Sojka PB029 Značkování podzim 2017 81 / 1

Entity II <!- Character entity set. Typical invocation: <!ENTITY % ISOlat2 PUBLIC "ISO 8879:1986//ENTITIES Added Latin 2//EN"> %ISOlat2; -> <!ENTITY abreve SDATA "[abreve]"-=small a, breve-> <!ENTITY Abreve SDATA "[Abreve]"-=capital A, breve-> <!ENTITY amacr SDATA "[amacr ]"-=small a, macron-> <!ENTITY Amacr SDATA "[Amacr ]"-=capital A, macron->... Externí textové entity: Petr Sojka PB029 Značkování podzim 2017 82 / 1

Entity III <!ENTITY název SYSTEM "URI"> Externí binární entity: <!ENTITY název SYSTEM "URI" NDATA "notace"> Petr Sojka PB029 Značkování podzim 2017 83 / 1

Připojení DTD k instanci dokumentu I Odkazem na soubor: <!DOCTYPE faktura SYSTEM "faktura.dtd"> <faktura>...</faktura> DTD součástí dokumentu: <!DOCTYPE faktura [ <!ELEMENT faktura (odberatel, dodavatel, polozka+)>... ]> <faktura>... </faktura> Petr Sojka PB029 Značkování podzim 2017 84 / 1

Připojení DTD k instanci dokumentu II Veřejný identifikátor PUBLIC s URL: <!DOCTYPE wml PUBLIC "-//WAPFORUM//DTD WML 1.3//EN" "http://www.wapforum.org/dtd/wml13.xml"> V případě veřejného identifikátoru je mapování od řetězce k souboru určeno tzv. katalogem (proměnná okolí SGML_CATALOG_FILES či XML_CATALOG_FILES). Petr Sojka PB029 Značkování podzim 2017 85 / 1

Pohledy na XML I 1. Lexikální pohled: XML dokument je řetěz znaků, z nichž některé jsou data a některé oddělovače, značky. <article> <title>úvod do XML</title> <section>xml: hlavní principy</section> <subsection>zobecněné značkování</subsection> <p>základem...... </article> Petr Sojka PB029 Značkování podzim 2017 86 / 1

Pohledy na XML II 2. Syntaktický pohled: XML dokument má tři části: XML deklaraci (instrukce pro XML parser), DTD (gramatiku jazyka) a vlastní instanci dokumentu (v tomto jazyce). Instance dokumentu obsahuje data a značky vyhovující DTD. Tento pohled vytváří parser z lexikálního pohledu. 3. Pohled hierarchie objektů: XML dokument je uspořádaná hierarchie (obvykle stromová struktura) objektů s obsahem (elementů). Elementy mají atributy, obsah a další vlastnosti. O Petr Sojka PB029 Značkování podzim 2017 87 / 1

Pohledy na XML III 4. Entitně-strukturní pohled: XML dokument je vnořená kolekce entit. Většina entit je pojmenovaných. Textové entity mohou odkazovat na další entity, zatímco datové entity obsahují libovolná data. 5. Aplikační pohled: XML dokument je cokoli, co autor chce aby jím bylo. Data belongs to whoever creates it, and you get to decide what s important about your own data. Petr Sojka PB029 Značkování podzim 2017 88 / 1

Typová kontrola XML: schémata Oproti DTD (struktura, pořadí elementů) přesnější kontrolu nad obsahem XML dávají jazyky XML Schema nebo Relax NG. Možná kontrola typů. Stejný cíl, různá syntaxe. Petr Sojka PB029 Značkování podzim 2017 89 / 1

XML Schema <xs:schema xmlns:xs="http://www.w3.org/2001/xmlschema"> <xs:element name="zamestnanec"> <xs:complextype> <xs:sequence> <xs:element name="jmeno" type="xs:string"/> <xs:element name="prijmeni" type="xs:string"/> <xs:element name="plat" type="xs:decimal"/> <xs:element name="narozen" type="xs:date"/> </xs:sequence> <xs:attribute name="id" type="xs:integer"/> </xs:complextype> </xs:element> </xs:schema> Více a detaily: http://www.kosek.cz/xml/schema/wxs.html Petr Sojka PB029 Značkování podzim 2017 90 / 1

Relax NG <element xmlns="http://relaxng.org/ns/structure/1.0" name="zamestnanec"> <attribute name="id"> <text/> </attribute> <element name="jmeno"> <text/> </element> <element name="prijmeni"> <text/> </element> <element name="plat"> <text/> </element> <element name="narozen"> <text/> </element> </element> Petr Sojka PB029 Značkování podzim 2017 91 / 1

Relax NG: kompaktní syntaxe element zamestnanec { attribute id { text }, element jmeno { text }, element prijmeni { text }, element plat { text }, element narozen { text } } Detaily: http://www.kosek.cz/xml/schema/rng.html Petr Sojka PB029 Značkování podzim 2017 92 / 1

Vývoj značkovacích jazyků na Internetu I 3/1989: návrh projektu World Wide Web, Tim Berners-Lee, CERN. 12/1990: návrh HTML DTD, první Web software pod NExT. 1991: první WWW prohlížeč pro omezené užití. 1992: CERN začíná propagovat WWW projekt. 2/1993: NCSA zveřejňuje α verzi prohlížeče Mosaic/X M. Andreesena. 7/1993: HTML 1.0 specifikace (Hypertext Markup Language) (RFC 1866) jako Internet draft pracovní skupinou IETF/IIR (Internet Engineering Task Force Internet Information Resources): dokumentový jazyk definovaný pomocí SGML užívaný na WWW. 9/1993: Mosaic pro PC, MAC a X-Window. Petr Sojka PB029 Značkování podzim 2017 93 / 1

Vývoj značkovacích jazyků na Internetu II 11/1993: Dave Raggett (HP) navrhuje HTML specifikaci s formuláři, tabulkami a rovnicemi. 6/1994: MIT/CERN vytváří organizaci W3. 6/1994: IETF vytváří pracovní skupinu HTML a HTML 2.0 specifikaci. 11/1994: volně šířený prohlížeč Netscape 1.0. 4/1995: Netscape Navigator 1.1.... World Wide Web Consortium (W3C). XML/XHTML, MathML. Petr Sojka PB029 Značkování podzim 2017 94 / 1

Výměna dokumentů na Internetu Identifikace dokumentů na Internetu: Uniform Resource Locator/Identifier/Name (URL/URI/URN). URN: URI, kdy organizace zajištuje trvalost odkazů (typicky překladovou službou). metoda://server[:port]/cesta/soubor[#kotva] Http, https, mailto, news, file, ftp, gopher, rlogin, telnet, tn3270, wais. Klient/server architektura; http, https server. Klienti: Google Chrome, Firefox/Mozilla, MS Internet Explorer, Edge, Safari, Opera, Galeon, Konqueror, Amaya, HotJava,... Různé módy renderování v klientech: zpětně kompatibilní (quirk mode) a standardy W3C dodržující (standard mode). Servery: Apache (na aise), MS IIS, NCSA,.... Petr Sojka PB029 Značkování podzim 2017 95 / 1

Dokumentové jazyky založené na XML/SGML I Vývoj HTML různá fixní DTD (jedné třídy dokumentů). Koordinace W3C, velké nekompatibilní odchylky velkých firem, problémy s validací. DocBook DTD: svět Linuxu, dokumentace, knihy (O Reilly, Kosek, Safari online). Nejrozšířenější je HTML, další dokumentové jazyky: TEI (Text Encoding Initiative) DTD; Rainbow DTD: formalizace RTF pro konverze z Wordu; MATHML, T E XML, CALS, WML (WAP)... Nyní HTML5 viz rozdíly HTML4 a HTML5. Petr Sojka PB029 Značkování podzim 2017 96 / 1

XHTML? XHTML! Postupný přechod z HTML: XHTML, reformulace HTML jako modulární XML aplikace. XHTML čtou všechny XML-kompatibilní aplikace. Příklad: <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/tr/xhtml1/dtd/xhtml1-strict.dtd"> <html> <head> <title>simple document</title> </head> <body> <p>a simple paragraph</p> </body> </html> Petr Sojka PB029 Značkování podzim 2017 97 / 1

HTML? HTML5! Postupný přechod z HTML: XHTML, reformulace HTML jako modulární XML aplikace. HTML5! Příklad HTML5 dokumentu: <!DOCTYPE html> <html> <head> <title>html dokument</title> </head> <body> <h1>příklad</h1> <p>toto je příklad HTML dokumentu. </body> </html> Petr Sojka PB029 Značkování podzim 2017 98 / 1

MathML: značkování matematiky na Webu I MATHML 3.0 (Mathematical Markup Language) doporučení W3C. XML slovník/aplikace pro popis matematiky (struktury formulí i prezentačních forem). Příklad: kubickou křivku formalizovat pro další zpracování (vykreslení křivky, integrace,... ) z MathML kódu: <math xmlns= http://www.w3.org/1998/math/mathml > <msup> <mi>x</mi> <mn>3</mn> </msup> </math> Petr Sojka PB029 Značkování podzim 2017 99 / 1

MathML: značkování matematiky na Webu II Použití jak pro sazbu, tak pro výpočet v systémech jako je Mathematica: přímočaré odlišení víceznačností: diferenciál x od proměnné dx a součinu proměnných dx. Možnosti výpočtů, validace, renderování na MathMLcentral. Možnost copy&paste. Značkování matematiky v (Tagged) PDF. Indexování MathML na http://eudml.org. Ukázka hledání včetně formulí. Petr Sojka PB029 Značkování podzim 2017 100 / 1

XPointer a XLink I Only connect! That was the whole of the sermon E. M. Forster, (1879 1970) Doporučení XLink XML Linking Language a draft XPointer XML Pointer language pro specifikaci vazeb mezi XML dokumenty nebo jejich částmi. 1. Zobecnění hypertextového odkazu známého z HTML, zpětná kompatibilita. 2. Odkazy mezi více zdroji. Petr Sojka PB029 Značkování podzim 2017 101 / 1

XPointer a XLink II 3. Doplnění odkazů o metadata. 4. Odkazy je možno uložit mimo odkazované dokumenty. 5. Xpointer: přesné určení místa ve zdroji, případně výběr jeho části. 6. Odkazy se vytvářejí pomocí elementů a atributů patřících do jmenného prostoru http://www.w3.org/1999/xlink. <odkaz xmlns:xlink="http://www.w3.org/1999/xlink" xlink:type="simple" xlink:href="http://www.fi.muni.cz/~sojka/pb029/"> Domovina PB029</odkaz> Petr Sojka PB029 Značkování podzim 2017 102 / 1

RDF (Resource Description Framework) Formální model (RDF validátor) pro reprezentaci metadat: pojmenovaných vlastností a reprezentaci hodnot. Krok k sémantickému Webu? <rdf:rdf xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns="http://purl.org/dc/element/1.0/"> <rdf:description about="http://www.fi.muni.cz/~sojka/pb029/"> <title>pb029 Elektronická příprava dokumentů</title> <description>stránky předmětu PB029 vyučovaného Petrem Sojkou na FI MU v Brně, CZ.</description> <author>petr Sojka</author> <creator>petr Sojka</creator> <date>2013-10-03</date> <format>text/html</format> <language>cs</language> </rdf:description> </rdf:rdf> Petr Sojka PB029 Značkování podzim 2017 103 / 1

Mikroformáty I <div class="vcard"> <img class="photo" src="www.example.cz/milankuchar.jpg" /> <strong class="fn">milan Kuchař</strong> <span class="title">vedoucí redaktor</span> ve společnosti <span class="org">recenze ACME</span> <span class="adr"> <span class="street-address">masarykova 200</span> <span class="locality">jaroměř</span>, <span class="region">královéhradecký kraj</span> <span class="postal-code">12345</span> </span> </div> Petr Sojka PB029 Značkování podzim 2017 104 / 1

Mikroformáty II Mikroformáty a Google: If I mark up my pages, does that guarantee I ll get Rich Snippets? No. We will be rolling this out gradually, and as always we will use our own algorithms and policies to determine relevant snippets for users queries. We will use structured data when we are able to determine that it helps users find answers sooner. And because you re providing the data on your pages, you should anticipate that other websites and other tools (browsers, phones) might use this data as well. You can let us know that you re interested in participating by filling out this form. Petr Sojka PB029 Značkování podzim 2017 105 / 1

RDFa: Resource Description Framework in attributes Technologie pro přenos strukturovaných informací uvnitř webových stránek. RDFa je jeden ze způsobů zápisu (serializace) datového formátu Resource Description Framework (RDF). <html> <head>... </head> <body>... <h2 property="http://purl.org/dc/terms/title"> The Trouble with Bob </h2> <p>date: <span property="http://purl.org/dc/terms/created"> 2011-09-10 </span> </p>... </body> Petr Sojka PB029 Značkování podzim 2017 106 / 1

Na cestě k sémantickému webu Hledání na webu: od řetězců znaků, přes slova k významům [slov]. Knowledge Graph z webu pro web. Komunitní databáze Freebase. Relevance, sémantika, sémantický web, ontologie: formální vyjádření sdílené konceptualizace daného oboru. Použití pro přesnější vyhledávání, Google. Video Davida Siegela: History of information: Push Pull. Petr Sojka PB029 Značkování podzim 2017 107 / 1

DOM: Document Object Model Objektový model dokumentu W3C: http://www.w3.org/dom/. Webová stránka dostupná jako datová struktura strom. Softwarové knihovny pro algoritmické zpracování webového dokumentu. Petr Sojka PB029 Značkování podzim 2017 108 / 1

JavaScript: interaktivita pro web, dynamické HTML Objektově orientovaný skriptovací jazyk, obvykle spouštěný na straně klienta. <html> <head> <title>dhtml Test</title> <script>function changeall() { document.getelementbyid( div1 ).style.color = blue ; } </script> </head> <body> <div id="div1" style="color: red;" onmouseover="changeall()"> Ukázka použití DHTML. Tento text se po najetí myší obarví modř </div> </body> </html> Petr Sojka PB029 Značkování podzim 2017 109 / 1

AJAX: Asynchronous JavaScript and XML Motivace: aktualizace pouze části stránky. w3schools.com Příklady aplikací s AJAXem: Google Suggest (2005), Gmail, Youtube, Google Maps, Facebook tabs. Více: http://www.w3schools.com/ajax/ajax_intro.asp Petr Sojka PB029 Značkování podzim 2017 110 / 1

Závěrem k etapě o značkování B2B, B2C rozhraní a služby na Webu: SOAP, UDDI, WSDL, XLANG/XAML, XKMS. XML a navazující technologie, Topic Maps (ISO/IEC 13250) mapy témat, XTM 1.0. SMIL (Synchronized Multimedia Integration Language) pro interaktivní multimédia na Webu. XML pro každého: stránky XML guru kolegy Koska http://www.kosek.cz/xml/. Školičky WWW technologií: W3Schools Technický úvod do XML Normana Walshe. Další zdroje, odkazy a literatura je na stránce předmětu (Kosek, xml.com, zvon.org, W3C, JakPsatWeb.cz... ). Petr Sojka PB029 Značkování podzim 2017 111 / 1

Shrnutí části o značkování Proč značky? Jaký značkovací jazyk? Jak jemné značky? Jak použití značkovacího jazyka definovat a kontrolovat? XML či L A TEX, DocBook či fithesis3.cls Petr Sojka PB029 Značkování podzim 2017 112 / 1