Lidé komunikují prostřednictvím dokumentů připravovaných elektronicky.

Podobné dokumenty
Lidé komunikují prostřednictvím dokumentů připravovaných elektronicky.

Lidé komunikují prostřednictvím dokumentů připravovaných elektronicky

Obsah prezentace. Co je to XML? Vlastnosti. Validita

Tvorba jednoduchých WWW stránek. VŠB - Technická univerzita Ostrava Katedra informatiky

Správnost XML dokumentu

24. XML. Aby se dokument XML vůbec zobrazil musí být well-formed (správně strukturovaný). To znamená, že splňuje formální požadavky specifikace XML.

Uspořádání klient-server. Standardy pro Web

Jazyky pro popis dat

Syntaxe XML XML teorie a praxe značkovacích jazyků (4IZ238)

APLIKACE XML PRO INTERNET

Úvod do databázových systémů B

Úvod do aplikací internetu a přehled možností při tvorbě webu

Úvod do tvorby internetových aplikací

Metody tvorby ontologií a sémantický web. Martin Malčík, Rostislav Miarka

Lidé komunikují prostřednictvím dokumentů připravovaných elektronicky.

Tvorba WWW stránek. Mojmír Volf

Vývoj Internetových Aplikací

Sémantický web 10 let poté

ZNAČKOVACÍ JAZYKY A JEJICH VYUŽÍVÁNÍ MARKUP LANGUAGE AND THEIR USE. Zdeněk Havlíček

Dnešní téma. Oblasti standardizace v ICT. Oblasti standardizace v ICT. Oblasti standardizace v ICT

Další XML technologie

Škola: Gymnázium, Brno, Slovanské náměstí 7 III/2 Inovace a zkvalitnění výuky prostřednictvím ICT Název projektu: Inovace výuky na GSN

(X)HTML, CSS a jquery

XML a DTD. <!DOCTYPE kořenový_element [deklarace definující vlastnosti jednotlivých elementů a atributů]> externí deklarace:

SCHÉMOVÉ JAZYKY. Přednáška z předmětu KMA/POK. Otakar ČERBA Západočeská univerzita v Plzni

Elektronické publikování. doc. RNDr. Petr Šaloun, Ph.D. katedra informatiky FEI VŠB TU Ostrava

Lidé komunikují prostřednictvím dokumentů připravovaných elektronicky.

XML terminologie a charakteristiky. Roman Malo

Lidé komunikují prostřednictvím dokumentů připravovaných elektronicky.

Kartografická webová aplikace. Přednáška z předmětu Počítačová kartografie (KMA/POK) Otakar Čerba Západočeská univerzita

XML schémata XML teorie a praxe značkovacích jazyků (IZI238)

Základy WWW publikování

Internetové publikování

Lidé komunikují prostřednictvím dokumentů připravovaných elektronicky.

X36DSV 3. cvičení. XML (extensible Markup Language) JavaScript. AJAX (Asynchronous JavaScript and XML) X36DSV. 2007/10 ver.2.0 1

Úvod do XML Technologie

HTML - Úvod. Zpracoval: Petr Lasák

14. Jazyk HTML (vývoj, principy, funkce, kostra stránky). Jazyk XML, XHTML. Algoritmizace - cyklus for, while a do while, implementace v jazyce

CZ.1.07/1.5.00/

rychlý vývoj webových aplikací nezávislých na platformě Jiří Kosek

Inovace výuky prostřednictvím šablon pro SŠ

HTML Hypertext Markup Language

MBI - technologická realizace modelu

Úvod do informatiky 5)

DUM č. 11 v sadě. 36. Inf-12 Počítačové sítě

Tvorba webu. Úvod a základní principy. Martin Urza

Internet 1 vývoj, html, css

Michal Krátký, Miroslav Beneš

CSS V DIGITÁLNÍ KARTOGRAFII

Softwarové komponenty a Internet

XML Š ABLONY A JEJICH INTEGRACE V LCMS XML TEMPLATES AND THEIN INTEGRATION IN LCMS

Verze z December 5, 2011 formátovaná k úspornému tisku.

Znalostní systém nad ontologií ve formátu Topic Maps

Tvorba jednoduchých WWW stránek. VŠB - Technická univerzita Ostrava Katedra informatiky

Tvorba WWW stránek. přehled technologií používaných na webu principy jednotlivých technologií a možnosti jejich vzájemného kombinování

Formáty WWW zdrojů. Mgr. Filip Vojtášek.

Distanční opora předmětu: Databázové systémy Tématický blok č. 4: XML, DTD, XML v SQL Autor: RNDr. Jan Lánský, Ph.D.

MATURITNÍ OTÁZKY ELEKTROTECHNIKA - POČÍTAČOVÉ SYSTÉMY 2003/2004 PROGRAMOVÉ VYBAVENÍ POČÍTAČŮ

Tvorba informačních systémů

Současný svět Projekt č. CZ.2.17/3.1.00/32038, podpořený Evropským sociálním fondem v rámci Operačního programu Praha adaptabilita

Programovací jazyky Přehled a vývoj

Lidé komunikují prostřednictvím dokumentů připravovaných elektronicky.

Ing. Přemysl Brada, MSc., Ph.D. Ing. Martin Dostal. Katedra informatiky a výpočetní techniky, FAV, ZČU v Plzni

HTML XHTML JavaScript PHP ASP.Net Zajímavé odkazy

Microsoft Office 2003 Souhrnný technický dokument white paper

Publikování map na webu - WMS

Lidé komunikují prostřednictvím dokumentů připravovaných elektronicky

WWW a HTML. Základní pojmy. Ivo Peterka

POLOPROVOZ ZNALOSTNÍ DATABÁZE INTERPI DOKUMENTACE

Elektronické publikování. Základní pojmy. B žné systémy. Publika ní nástroje. doc. RNDr. Petr Šaloun, Ph.D. FEI VŠB TU Ostrava

Technologie pro tvorbu webových aplikací 1. díl (rozdělení, HTML, XHTML)

Identifikátor materiálu: ICT-3-55

ČESKÁ TECHNICKÁ NORMA

Možnosti využití XML v knihovnické praxi. Gabriela Krčmařová AKP 2001 Národní knihovna ČR Liberec,

Základy HTML (2. přednáška)

VÝUKOVÝ MATERIÁL. Bratislavská 2166, Varnsdorf, IČO: tel Číslo projektu

Základy informatiky. 03 HTML, tvorba webových stránek. Kačmařík/Szturcová/Děrgel/Rapant

Webové služby a XML. Obsah přednášky. Co jsou to webové služby. Co jsou to webové služby. Webové služby a XML

NSWI096 - INTERNET. Úvod do HTML

Počítačová Podpora Studia. Přednáška 5 Úvod do html a některých souvisejících IT. Web jako platforma pro vývoj aplikací.

Internet 2 css, skriptování, dynamické prvky

3.4 Základní služby Internetu

Lidé komunikují prostřednictvím dokumentů připravovaných elektronicky.

Využití informačních technologií v cestovním ruchu P1

NSWI096 - INTERNET JavaScript

(X)HTML a CSS. VOŠ a SŠT Česká Třebová

Základy XML struktura dokumentu (včetně testových otázek)

Předmluva k druhému vydání 13. Úvod 17. ČÁST 2 Vytváření dokumentů XML 65

Nastavení provozního prostředí webového prohlížeče pro aplikaci

Lidé komunikují prostřednictvím dokumentů připravovaných elektronicky.

Teoretické a pokročilé aspekty XML technologií

Značkovací jazyky a spol. HTML/XHTML XML JSON YAML Markdown, Texy!

Principy fungování WWW serverů a browserů. Internetové publikování

Základy informatiky. HTML, tvorba WWW stránek. Daniela Szturcová Část převzata z přednášky P. Děrgela

NSWI108 Sémantizace Webu

Databázové aplikace pro internetové prostředí PHP úvod, základní princip, vkládání skriptu, komentáře, výpis na obrazovku

Internet WEB stránky HTML, Hypertext MarkUp Language - nadtextový jazyk - Místo příkazů obsahuje tagy - značky

Základy a principy World Wide Web-u

Transkript:

PB029 Elektronická příprava dokumentů Anyone who would letterspace the lowercase would steal sheep. Frederick Goudy (1865 1947), when looking on a prize winner certificate You cannot not communicate. Paul Watzlawick (1921 2007), in Pragmatics of Human Communication Lidé komunikují prostřednictvím dokumentů připravovaných elektronicky. Petr Sojka (FI MU Brno) podzim 2016 1 / 210

PB029 Elektronická příprava dokumentů PB029 Elektronická příprava dokumentů Petr Sojka Fakulta informatiky MU, Brno podzim 2016 Petr Sojka (FI MU Brno) podzim 2016 2 / 210

Osnova dnešní přednášky a demopřednášky Rozcvička, opakování Readings (flipped learning). Historický vývoj od SGML k XML. Formální dokumenty a gramatiky: DTD, XML Schema, Relax NG. HTML, XHTML, MathML, WML, HTML5. Formáty a normy související s XML (XLink, XPointer, RDF, XTM). AJAX. DOM. Demopřednáška: XML Petr Sojka (FI MU Brno) Značkování podzim 2016 53 / 210

E = mc 2?! E = mc 2 E = mc 2 Značkování Markup Návrh Design Sazba Typesetting Korektury Proofreading Předloha Preprint Tisk Print Distribuce Distribution Petr Sojka (FI MU Brno) Značkování podzim 2016 54 / 210

PB029 Elektronická příprava dokumentů 4. přednáška, 14. 10. 2016 Z hlavy autora do textu, historický vývoj Petr Sojka (FI MU Brno) Značkování podzim 2016 55 / 210

Historie XML (od SGML 1986) Organizace ISO (International Standards Organization), vydává známé normy jako ISO 8859-2, 10646-1 (Unicode),... Norma ISO 8879:1986 Information processing Text and office systems Standard Generalized Markup Language (SGML), vydaná 15. 10. 1986 po dlouhém procesu standardizace na základě návrhu Charlese Goldfarba a jeho GML. Počátky již na konci šedesátých let při návrhu informačního systému právnických textů v IBM. Petr Sojka (FI MU Brno) Značkování podzim 2016 56 / 210

Historie XML (od SGML 1986) (cont.) Celá sada standardů ISO: kromě SGML, DSSSL (Document Style Semantics and Specification Language, ISO/IEC DIS 10179.2:1994), SPDL (Standard Page Description Language, ISO/IEC DIS 10180:1991) a HyTime (Hypermedia/Time-based Structuring Language, ISO/IEC 10744:1992). O S odstupem času: nesporný úspěch SGML, základ pro další značkovací jazyky (XML), ale například neúspěch SPDL oproti proprietárnímu PostScriptu. Petr Sojka (FI MU Brno) Značkování podzim 2016 57 / 210

SGML historické poznámky a motivace XML Výhody: znovupoužívání částí dokumentů, kvalita a otevřenost systému, obecnost, nezávislost na konkrétní formě (WWW konsorcium), rozšiřitelnost dle technologických možností (hypertext), snížení nákladů, možnost validace (ověření korektnosti dokumentu na základě formální definice jazyka dokumentu). Nevýhody: za obecnost se platí složitostí, i po dekádách užívání jsou nejlepší systémy na plné SGML drahé, změna s rozšířeními HTML, přesto přechod k XML (složitost). Petr Sojka (FI MU Brno) Značkování podzim 2016 58 / 210

SGML historické poznámky a motivace XML (cont.) Uživatelé SGML (zpočátku velké instituce, elektronický a letecký průmysl, nakladatelé): AAP, OUP, Boeing, Lufthansa, British Patent Office, Association of German editors, TEI, McGraw-Hill, LDC,... viz stránky Organization for the Advancement of Structured Information Standards. Dnešní motivací je přesnější a relevantnější vyhledávání na Internetu (mikroformáty apod.). Petr Sojka (FI MU Brno) Značkování podzim 2016 59 / 210

SGML deklarace Pokyny pro parser s definicemi abeced (analogie popisu BNF): role oddělovačů; rezervovaná jména; zakázané znaky, typicky kontrolní ASCII; pravidla pro pojmenovávání, citlivost na malá a velká písmena; velikosti délek, značek,... ; komentáře; parametry chování, které vlastnosti kontrolovat (OMITTAG). Pokud deklarace v dokumentu není uvedena, používá se implicitně referenční syntaxe Reference Concrete Syntax (RCS). Petr Sojka (FI MU Brno) Značkování podzim 2016 60 / 210

Příklad SGML deklarace <!SGML "ISO 8879:1986" CHARSET BASESET "ISO 646:1991//CHARSET IRV//ESC 2/8 4/2" DESCSET 0 9 UNUSED 9 2 9 TAB, LF 11 2 UNUSED 13 1 13 CR 14 18 UNUSED 32 95 32 127 1 UNUSED CAPACITY SGMLREF TOTALCAP 35000... Petr Sojka (FI MU Brno) Značkování podzim 2016 61 / 210

Příklad SGML deklarace (pokr.) MDO "<!" markup decl open MDC ">" markup decl close DSO "[" declaration subset open DSC "]" declaration subset close MSC "]]" marked section close COM "--" comment RNI "#" reserved name indicator LIT """ literal LITA " " alternative literal GRPO "(" group open GRPC ")" group close AND "&" and connector OR " " or connector SEQ "," seq connector OPT "?" opt occurrence indicator REP "*" rep occurrence indicator Petr Sojka (FI MU Brno) Značkování podzim 2016 62 / 210

Příklad SGML deklarace (pokr.)... PLUS "+" plus occ ind, inclusion MINUS "-" exclusion, omission flag CRO "&#" character reference open ERO "&" entity reference open PERO "%" parameter entity reference open REFC ";" reference close PIO "<?" processing instruction open PIC ">" processing instruction close STAGO "<" start tag open ETAGO "</" end tag open TAGC ">" tag close NET "/" null end-tag Petr Sojka (FI MU Brno) Značkování podzim 2016 63 / 210

SGML/XML DTD: atributová gramatika Terminologie teorie formálních jazyků: neterminály (elementy), terminály (entity). Elementy vytvářejí stromovou strukturu, nemohou se navzájem křížit, jeden element je kořenový. Lze použít prázdné elementy. <br/> Elementy mohou mít atributy. O Petr Sojka (FI MU Brno) Značkování podzim 2016 64 / 210

SGML/XML DTD: atributová gramatika (cont.) <!ELEMENT faktura (odberatel,dodavatel, polozka+)> <!ELEMENT odberatel (nazev,adresa,ico,dic)> <!ELEMENT dodavatel (nazev,adresa,ico,dic)> <!ELEMENT polozka (popis?,cena,dph,ks?)> <!ELEMENT nazev (#PCDATA)> <!ELEMENT adresa (#PCDATA)> <!ELEMENT ico (#PCDATA)> <!ELEMENT dic (#PCDATA)> <!ELEMENT popis (#PCDATA)> <!ELEMENT cena (#PCDATA)> <!ELEMENT dph (#PCDATA)> <!ELEMENT ks (#PCDATA)> <!ATTLIST faktura cislo CDATA #REQUIRED vystaveni CDATA #REQUIRED Petr Sojka (FI MU Brno) Značkování podzim 2016 65 / 210

SGML/XML DTD: atributová gramatika (cont.) splatnost CDATA #REQUIRED vystavil CDATA #IMPLIED> <!ATTLIST cena mena CDATA "CZK"> Petr Sojka (FI MU Brno) Značkování podzim 2016 66 / 210

Deklarace elementů a atributů Sekvence, alternativa, ANY, EMPTY, #PCDATA. Opakování: právě jednou, nejvýše jednou (?), alespoň jednou (+), libovolněkrát (*). Typy atributů CDATA, NMTOKEN, NMTOKENS, ID, IDREF, IDREFS, ENTITY, ENTITIES, výčet. Implicitní hodnoty atributů: "hodnota", #REQUIRED, #IMPLIED, #FIXED "hodnota". Petr Sojka (FI MU Brno) Značkování podzim 2016 67 / 210

Entity Vhodné pojmenovat části a fragmenty XML, některé řetězce (&TeX; v IS) a znaky použité jako oddělovače v gramatice: <, &, ". Entity interní textové, externí textové, externí binární a parametrické. Příklad množiny interních textových entit: ISO Latin2. Petr Sojka (FI MU Brno) Značkování podzim 2016 68 / 210

Entity (cont.) <! Character entity set. Typical invocation: <!ENTITY % ISOlat2 PUBLIC "ISO 8879:1986//ENTITIES Added Latin 2//EN"> %ISOlat2; > <!ENTITY abreve SDATA "[abreve]" =small a, breve > <!ENTITY Abreve SDATA "[Abreve]" =capital A, breve > <!ENTITY amacr SDATA "[amacr ]" =small a, macron > <!ENTITY Amacr SDATA "[Amacr ]" =capital A, macron >... Externí textové entity: <!ENTITY název SYSTEM "URI"> Externí binární entity: <!ENTITY název SYSTEM "URI" NDATA "notace"> Petr Sojka (FI MU Brno) Značkování podzim 2016 69 / 210

Připojení DTD k instanci dokumentu Odkazem na soubor: <!DOCTYPE faktura SYSTEM "faktura.dtd"> <faktura>...</faktura> DTD součástí dokumentu: <!DOCTYPE faktura [ <!ELEMENT faktura (odberatel, dodavatel, polozka+)>... ]> <faktura>... </faktura> Veřejný identifikátor PUBLIC s URL: Petr Sojka (FI MU Brno) Značkování podzim 2016 70 / 210

Připojení DTD k instanci dokumentu (cont.) <!DOCTYPE wml PUBLIC "-//WAPFORUM//DTD WML 1.3//EN" "http://www.wapforum.org/dtd/wml13.xml"> V případě veřejného identifikátoru je mapování od řetězce k souboru určeno tzv. katalogem (proměnná okolí SGML_CATALOG_FILES či XML_CATALOG_FILES). Petr Sojka (FI MU Brno) Značkování podzim 2016 71 / 210

Pohledy na XML Lexikální pohled: XML dokument je řetěz znaků, z nichž některé jsou data a některé oddělovače, značky. <article> <title>úvod do XML</title> <section>xml: hlavní principy</section> <subsection>zobecněné značkování</subsection> <p>základem...... </article> Petr Sojka (FI MU Brno) Značkování podzim 2016 72 / 210

Pohledy na XML (cont.) Syntaktický pohled: XML dokument má tři části: XML deklaraci (instrukce pro XML parser), DTD (gramatiku jazyka) a vlastní instanci dokumentu (v tomto jazyce). Instance dokumentu obsahuje data a značky vyhovující DTD. Tento pohled vytváří parser z lexikálního pohledu. Pohled hierarchie objektů: XML dokument je uspořádaná hierarchie (obvykle stromová struktura) objektů s obsahem (elementů). Elementy mají atributy, obsah a další vlastnosti. O Entitně-strukturní pohled: XML dokument je vnořená kolekce entit. Většina entit je pojmenovaných. Textové entity mohou odkazovat na další entity, zatímco datové entity obsahují libovolná data. Petr Sojka (FI MU Brno) Značkování podzim 2016 73 / 210

Pohledy na XML (cont.) Aplikační pohled: XML dokument je cokoli, co autor chce aby jím bylo. Data belongs to whoever creates it, and you get to decide what s important about your own data. Petr Sojka (FI MU Brno) Značkování podzim 2016 74 / 210

Více k XML: odkazy XML pro každého: stránky XML guru kolegy Koska http://www.kosek.cz/xml/. Školičky WWW technologií: W3Schools Technický úvod do XML Normana Walshe. http://www.zvon.org a mnoho dalších. Petr Sojka (FI MU Brno) Značkování podzim 2016 75 / 210

Typová kontrola XML: schémata Oproti DTD (struktura, pořadí elementů) přesnější kontrolu nad obsahem XML dávají jazyky XML Schema nebo Relax NG. Možná kontrola typů. Stejný cíl, různá syntaxe. Petr Sojka (FI MU Brno) Značkování podzim 2016 76 / 210

XML Schema <xs:schema xmlns:xs="http://www.w3.org/2001/xmlschema"> <xs:element name="zamestnanec"> <xs:complextype> <xs:sequence> <xs:element name="jmeno" type="xs:string"/> <xs:element name="prijmeni" type="xs:string"/> <xs:element name="plat" type="xs:decimal"/> <xs:element name="narozen" type="xs:date"/> </xs:sequence> <xs:attribute name="id" type="xs:integer"/> </xs:complextype> </xs:element> </xs:schema> Více a detaily: http://www.kosek.cz/xml/schema/wxs.html Petr Sojka (FI MU Brno) Značkování podzim 2016 77 / 210

Relax NG <element xmlns="http://relaxng.org/ns/structure/1.0" name="zamestnanec"> <attribute name="id"> <text/> </attribute> <element name="jmeno"> <text/> </element> <element name="prijmeni"> <text/> </element> <element name="plat"> <text/> </element> <element name="narozen"> <text/> </element> </element> Petr Sojka (FI MU Brno) Značkování podzim 2016 78 / 210

Relax NG: kompaktní syntaxe element zamestnanec { attribute id { text }, element jmeno { text }, element prijmeni { text }, element plat { text }, element narozen { text } } Detaily: http://www.kosek.cz/xml/schema/rng.html Petr Sojka (FI MU Brno) Značkování podzim 2016 79 / 210

Vytváření značkovaných dokumentů Běžný ascii editor (emacs, joe, pico, vim nebo i notepad). Na demopřednášce resp. cvičení: ukázky, workflow pro vývoj XML, přípravu 2. zápočtového dokumentu Petr Sojka (FI MU Brno) Značkování podzim 2016 80 / 210

Značkovací jazyky na Internetu vývoj 3/1989: návrh projektu World Wide Web, Tim Berners-Lee, CERN 12/1990: návrh HTML DTD, první Web software pod NExT 1991: první WWW prohlížeč pro omezené užití 1992: CERN začíná propagovat WWW projekt 2/1993: NCSA zveřejňuje alfa verzi prohlížeče Mosaic/X Marca Andreesena 7/1993: HTML 1.0 specifikace (Hypertext Markup Language) (RFC 1866) jako Internet draft pracovní skupinou IETF/IIR (Internet Engineering Task Force Internet Information Resources): dokumentový jazyk definovaný pomocí SGML užívaný na WWW. Petr Sojka (FI MU Brno) Značkování podzim 2016 81 / 210

Značkovací jazyky na Internetu vývoj (cont.) 9/1993: Mosaic pro PC, MAC a X-Window 11/1993: Dave Raggett (HP) navrhuje HTML specifikaci s formuláři, tabulkami a rovnicemi 6/1994: MIT/CERN vytváří organizaci W3 6/1994: IETF vytváří pracovní skupinu HTML a HTML 2.0 specifikaci 11/1994: volně šířený prohlížeč Netscape 1.0 4/1995: Netscape Navigator 1.1 5/1995: Netscape a Sun se dohodli na podpoře Javy... World Wide Web Consortium (W3C). XML/XHTML, MathML. Petr Sojka (FI MU Brno) Značkování podzim 2016 82 / 210

XML vs. L A TEX: výhody a nevýhody snadnost zavedení vlastního jazyka a zkratek algoritmické vynucení struktury, a značkování množství software a nástrojů pro zpracování a jejich portabilita uživatelská přítulnost a snadnost editace rozšířenost a podpora Petr Sojka (FI MU Brno) Značkování podzim 2016 83 / 210

Výměna dokumentů na Internetu Identifikace dokumentů na Internetu: Uniform Resource Locator/Identifier/Name (URL/URI/URN). URN: URI, kdy organizace zajištuje trvalost odkazů (typicky překladovou službou). metoda://server[:port]/cesta/soubor[#kotva] Http, https, mailto, news, file, ftp, gopher, rlogin, telnet, tn3270, wais. Klient/server; http, https server. Klienti: Google Chrome, Firefox/Mozilla, MS Internet Explorer, Safari, Opera, Galeon, Konqueror, Amaya, HotJava,... Petr Sojka (FI MU Brno) Značkování podzim 2016 84 / 210

Výměna dokumentů na Internetu (cont.) Různé módy renderování v posledních verzích prohlížečů: zpětně kompatibilní (quirk mode) a standardy W3C dodržující (standard mode). Servery: Apache, MS IIS, Netscape Commerce, NCSA. Petr Sojka (FI MU Brno) Značkování podzim 2016 85 / 210

Dokumentové jazyky založené na XML/SGML Nejrozšířenější je HTML. Vývoj HTML různá fixní DTD (jedné třídy dokumentů). Koordinace W3C, velké nekompatibilní odchylky velkých firem, problémy s validací. DocBook DTD: svět Linuxu, dokumentace, knihy (O Reilly, Kosek, Safari online). Další rozšířené dokumentové jazyky: TEI (Text Encoding Initiative) DTD. Rainbow DTD: formalizace RTF pro konverze z Wordu. WML (WAP), CALS, MATHML, TEXML,... Nyní HTML5 viz rozdíly HTML4 a HTML5. Petr Sojka (FI MU Brno) Značkování podzim 2016 86 / 210

XHTML? XHTML! Postupný přechod z HTML: XHTML, reformulace HTML jako modulární XML aplikace. XHTML čtou všechny XML-kompatibilní aplikace, a zároveň je možno psát dobře zformované (well-formed) dokumenty již nyní. Příklad XHTML dokumentu: Petr Sojka (FI MU Brno) Značkování podzim 2016 87 / 210

XHTML? XHTML! (cont.) <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/tr/xhtml1/dtd/xhtml1-strict.dtd"> <html> <head> <title>simple document</title> </head> <body> <p>a simple paragraph</p> </body> </html> Petr Sojka (FI MU Brno) Značkování podzim 2016 88 / 210

HTML? HTML5! Postupný přechod z HTML: XHTML, reformulace HTML jako modulární XML aplikace. HTML5! Příklad HTML5 dokumentu: <!DOCTYPE html> <html> <head> <title>html dokument</title> </head> <body> <h1>příklad</h1> <p>toto je příklad HTML dokumentu. Petr Sojka (FI MU Brno) Značkování podzim 2016 89 / 210

HTML? HTML5! (cont.) </body> </html> Petr Sojka (FI MU Brno) Značkování podzim 2016 90 / 210

MathML: značkování matematiky na Webu MATHML 3.0 (Mathematical Markup Language) doporučení W3C. XML slovník/aplikace pro popis matematiky (struktury formulí i prezentačních forem). Příklad: kubickou křivku formalizovat pro další zpracování (vykreslení křivky, integrace,... ) na základě XML kódu: <math xmlns= http://www.w3.org/1998/math/mathml > <msup> <mi>x</mi> <mn>3</mn> </msup> </math> Petr Sojka (FI MU Brno) Značkování podzim 2016 91 / 210

MathML: značkování matematiky na Webu (cont.) Použití jak pro sazbu, tak pro výpočet v systémech jako je Mathematica: přímočaré odlišení víceznačností: diferenciál x od proměnné dx a součinu proměnných dx. Nativní podpora MathML od Mozilly 1.1. Renderovací stroj MathML pro MSIE: MathPlayer. Techexplorer IBM: plug-in pro Navigator a MSIE pro renderování TEXu, L A TEXu a MathML. Možnosti výpočtů, validace, renderování na MathMLcentral. Možnost copy&paste. Značkování matematiky v (Tagged) PDF. Indexování MathML na http://eudml.org. Ukázka hledání včetně formulí. Petr Sojka (FI MU Brno) Značkování podzim 2016 92 / 210

XPointer a XLink Only connect! That was the whole of the sermon E. M. Forster, (1879 1970) Doporučení XLink XML Linking Language a draft XPointer XML Pointer language pro specifikaci vazeb mezi XML dokumenty nebo jejich částmi. Zobecnění hypertextového odkazu známého z HTML, zpětná kompatibilita. Odkazy mezi více zdroji. Doplnění odkazů o metadata. Petr Sojka (FI MU Brno) Značkování podzim 2016 93 / 210

XPointer a XLink (cont.) Odkazy je možno uložit mimo odkazované dokumenty. Xpointer: přesné určení místa ve zdroji, případně výběr jeho části. Odkazy se vytvářejí pomocí elementů a atributů patřících do jmenného prostoru http://www.w3.org/1999/xlink. <odkaz xmlns:xlink="http://www.w3.org/1999/xlink" xlink:type="simple" xlink:href="http://www.fi.muni.cz/~sojka/pb029/"> Domovina PB029</odkaz> Petr Sojka (FI MU Brno) Značkování podzim 2016 94 / 210

RDF RDF (Resource Description Framework) metadata na WWW. Model pro reprezentaci pojmenovaných vlastností a reprezentaci hodnot. Krok k sémantickému Webu? RDF validátor: Petr Sojka (FI MU Brno) Značkování podzim 2016 95 / 210

RDF (cont.) <rdf:rdf xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns="http://purl.org/dc/element/1.0/"> <rdf:description about="http://www.fi.muni.cz/~sojka/pb029/"> <title>pb029 Elektronická příprava dokumentů</title> <description>stránky předmětu PB029 vyučovaného Petrem Sojkou na FI MU v Brně, CZ.</description> <author>petr Sojka</author> <creator>petr Sojka</creator> <date>2013-10-03</date> <format>text/html</format> <language>cs</language> </rdf:description> </rdf:rdf> Petr Sojka (FI MU Brno) Značkování podzim 2016 96 / 210

Mikroformáty <div class="vcard"> <img class="photo" src="www.example.cz/milankuchar.jpg" /> <strong class="fn">milan Kuchař</strong> <span class="title">vedoucí redaktor</span> ve společnosti <span class="org">recenze ACME</span> <span class="adr"> <span class="street-address">masarykova 200</span> <span class="locality">jaroměř</span>, <span class="region">královéhradecký kraj</span> <span class="postal-code">12345</span> </span> </div> Petr Sojka (FI MU Brno) Značkování podzim 2016 97 / 210

Mikroformáty (cont.) Mikroformáty a Google: If I mark up my pages, does that guarantee I ll get Rich Snippets? No. We will be rolling this out gradually, and as always we will use our own algorithms and policies to determine relevant snippets for users queries. We will use structured data when we are able to determine that it helps users find answers sooner. And because you re providing the data on your pages, you should anticipate that other websites and other tools (browsers, phones) might use this data as well. You can let us know that you re interested in participating by filling out this form. Petr Sojka (FI MU Brno) Značkování podzim 2016 98 / 210

RDFa: Resource Description Framework in attributes Technologie pro přenos strukturovaných informací uvnitř webových stránek. RDFa je jeden ze způsobů zápisu (serializace) datového formátu Resource Description Framework (RDF). <html> <head>... </head> <body>... <h2 property="http://purl.org/dc/terms/title">the Trouble with Bob</h2> <p>date: <span property="http://purl.org/dc/terms/created">2011-09-10</sp... </body> Petr Sojka (FI MU Brno) Značkování podzim 2016 99 / 210

Na cestě k sémantickému webu Hledání na webu: od řetězců znaků, přes slova k významům [slov]. Knowledge Graph z webu pro web. Komunitní databáze Freebase. Relevance, sémantika, sémantický web, ontologie: formální vyjádření sdílené konceptualizace daného oboru. Použití pro přesnější vyhledávání, Google. Video Davida Siegela: History of information: Push Pull. Petr Sojka (FI MU Brno) Značkování podzim 2016 100 / 210

DOM: Document Object Model Objektový model dokumentu W3C: http://www.w3.org/dom/. Webová stránka dostupná jako datová struktura strom. Softwarové knihovny pro algoritmické zpracování webového dokumentu. Petr Sojka (FI MU Brno) Značkování podzim 2016 101 / 210

JavaScript: interaktivita pro web, dynamické HTML Objektově orientovaný skriptovací jazyk, obvykle spouštěný na straně klienta. <html> <head> <title>dhtml Test</title> <script>function changeall() { document.getelementbyid( div1 ).style.color = blue ; } </script> </head> <body> <div id="div1" style="color: red;" onmouseover="changeall()"> Ukázka použití DHTML. Tento text se po najetí myší obarví modře. </div> </body> </html> Petr Sojka (FI MU Brno) Značkování podzim 2016 102 / 210

AJAX: Asynchronous JavaScript and XML Motivace: aktualizace pouze části stránky. w3schools.com Příklady aplikací s AJAXem: Google Suggest (2005), Gmail, Youtube, Google Maps, Facebook tabs. Více: http://www.w3schools.com/ajax/ajax_intro.asp Petr Sojka (FI MU Brno) Značkování podzim 2016 103 / 210

Závěrem k etapě o značkování B2B, B2C rozhraní a služby na Webu: SOAP, UDDI, WSDL, XLANG/XAML, XKMS. XML a navazující technologie, Topic Maps (ISO/IEC 13250) mapy témat, XTM 1.0. Unicode. SMIL (Synchronized Multimedia Integration Language) pro interaktivní multimédia na Webu. Další zdroje, odkazy a literatura je na stránce předmětu (Kosek, xml.com, zvon.org, W3C, JakPsatWeb.cz... ). Petr Sojka (FI MU Brno) Značkování podzim 2016 104 / 210

Shrnutí části o značkování Proč značky? Jaký značkovací jazyk? Jak jemné značky? Jak použití značkovacího jazyka definovat a kontrolovat? XML či L A TEX, DocBook či fithesis3.cls Petr Sojka (FI MU Brno) Značkování podzim 2016 105 / 210