Ukázka knihy z internetového knihkupectví www.kosmas.cz



Podobné dokumenty
XML technologie. Edice Management v informa ní spole nosti

XML technologie. Edice Management v informa ní spole nosti

FINAN NÍ ÍZENÍ A ROZHODOVÁNÍ PODNIKU

Seminá e. Ing. Michal Valenta PhD. Databázové systémy BI-DBS ZS 2010/11, sem. 1-13

Úvod, terminologie. Ing. Michal Valenta PhD. Databázové systémy BI-DBS ZS 2010/11, P edn. 1

Ukázka knihy z internetového knihkupectví

Edice Právo pro každého. JUDr. Jan Přib. Kdy do důchodu a za kolik 12. aktualizované vydání

ČÁST PÁTÁ POZEMKY V KATASTRU NEMOVITOSTÍ

APLIKACE METOD VÍCEKRITERIÁLNÍHO ROZHODOVÁNÍ PŘI HODNOCENÍ KVALITY VEŘEJNÉ DOPRAVY

Čl. 3 Poskytnutí finančních prostředků vyčleněných na rozvojový program Čl. 4 Předkládání žádostí, poskytování dotací, časové určení programu

Memoria Mundi Series Bohemica z trezoru na Internet

Integrování jako opak derivování

Věc: Výzva pro předložení nabídek k veřejné zakázce s názvem: VÚ a ŠJ PŠOV, Nákup nového osmimístného vozidla

Výzva pro předložení nabídek k veřejné zakázce malého rozsahu s názvem Výměna lina

MATERIÁL PRO JEDNÁNÍ RADY MĚSTA PÍSKU DNE

A. PODÍL JEDNOTLIVÝCH DRUHŮ DOPRAVY NA DĚLBĚ PŘEPRAVNÍ PRÁCE A VLIV DÉLKY VYKONANÉ CESTY NA POUŽITÍ DOPRAVNÍHO PROSTŘEDKU

STUDENTSKÁ GRANTOVÁ SOUTĚŽ UNIVERZITY J. E. PURKYNĚ V ÚSTÍ NAD LABEM

HLAVA III PODROBNOSTI O VEDENÍ ÚST EDNÍHO SEZNAMU OCHRANY P ÍRODY

Pravd podobnost a statistika - cvi ení. Simona Domesová místnost: RA310 (budova CPIT) web:

Orientační průvodce mateřstvím a rodičovstvím v zadávacích dokumentacích poskytovatele

Česká republika Ministerstvo práce a sociálních věcí Na Poříčním právu 1, Praha 2. vyzývá

3 nadbytek. 4 bez starostí

Limity funkcí v nevlastních bodech. Obsah

Biologie všedního dne

NÚOV Kvalifikační potřeby trhu práce

Prezentace. Ing. Petr V elák 6. b ezna 2009

DPH a ú tování p eprava, dovoz, vývoz, služby 4. aktualizované vydání

PRAVIDLA PRO PRODEJ BYTŮ A NEBYTOVÝCH PROSTOR V MAJETKU MĚSTA VRBNO POD PRADĚDEM

P íklad 1 (Náhodná veli ina)

Kreativní malování. s dětmi. Dana Cejpková

Česká zemědělská univerzita v Praze Fakulta provozně ekonomická. Obor veřejná správa a regionální rozvoj. Diplomová práce

Směrnice kvestorky AMU č. 1/2004

Metodický list úprava od Daně a organizační jednotky Junáka


TÉMA BAKALÁŘSKÉ PRÁCE

Matematick ústav v Opav, Na Rybní ku 1, Opava. Zápis z 16. zasedání V decké rady Matematického ústavu v Opav dne 15.

Skalární sou in. Úvod. Denice skalárního sou inu

Využití EduBase ve výuce 10

Binární operace. Úvod. Pomocný text

Ústavní sociální služby pro osoby s postižením v Moravskoslezském kraji

Směrnice DSO Horní Dunajovice a Želetice - tlaková kanalizace a intenzifikace ČOV. Dlouhodobý majetek. Typ vnitřní normy: Identifikační znak: Název:

Vydání občanského průkazu

Metodická pomůcka pro hodnotitele

DPH a účtování přeprava, dovoz, vývoz, služby 5. aktualizované vydání

Vyhlášení opakované veřejné soutěže 1/6

Regenerace zahrady MŠ Neděliště

Kelvin v kapkový generátor

Kočí, R.: Účelové pozemní komunikace a jejich právní ochrana Leges Praha, 2011

Stanovy spolku. I. Úvodní ustanovení. 1.Název spolku : KLUB PŘÁTEL HISTORICKÝCH VOJENSKÝCH JEDNOTEK z.s.

městské části Praha 3 pro rok 2016 připravila

Elektronické publikování. Základní pojmy. B žné systémy. Publika ní nástroje. doc. RNDr. Petr Šaloun, Ph.D. FEI VŠB TU Ostrava

Fiche opatření (dále jen Fiche)

1. VÝCHODISKA AKTUALIZOVANÉHO DLOUHODOBÉHO ZÁMĚRU

OBECN ZÁVAZNÁ VYHLÁ KA. Obce Plavsko. O fondu rozvoje bydlení

FOND VYSOČINY NÁZEV GP

Specifikace systému ESHOP

Zásady o poskytování finančních příspěvků z rozpočtu města Slaného pro sportovní a zájmové organizace (dále jen Zásady )

V Černošicích dne Výzva k podání nabídky na veřejnou zakázku malého rozsahu s názvem: Nákup a pokládka koberců OŽÚ.

Zápis z jednání č. 01 Městského zastupitelstva ze dne

na prodej nemovitosti objektu č.p. 9 - Chrudim VI. kolo(4)

Metodické doporučení MPSV č. 2/2010 pro postup orgánů sociálně-právní ochrany dětí při případové konferenci

+ 87,61 82,60 4,69 24,69 44,69 319, ,43 53,9

OBCHODNÍ PRÁVO Vysoká škola ekonomie a managementu 2012

Nemocenské pojištění v praxi zákon s výkladem, k Edice Účetnictví a daně. JUDr. Jan Přib

19 Jednočipové mikropočítače

Posilování sociálního dialogu v místním a regionálním správním sektoru. Diskusní dokument

Zakázka bude pln na b hem roku 2014 a v následujících 48 sících od uzav ení smlouvy.

PŘIJÍMACÍ ŘÍZENÍ. Strana

PRACOVNÍ MATERIÁLY PRACOVNÍ MATERIÁLY CHEMIE CHEMIE. Struktura vyu ovací hodiny. Záznamový Záznamový arch. P edm tový metodik: Ing.

Zdravotní nauka 2. díl

PROTOKOL. obec Kořenov souhlasíme s navrženou stavbou. Rozhodnutí o povolení sjezdu požadujeme zapracovat do podmínek stavebního povolení.

Problematika negativního dopadu intenzivní chemické ochrany polních plodin

10 KROKŮ K VYŠŠÍMU VÝKONU PRACOVNÍKŮ. Jak snadno a účinně předcházet nedostatkům v práci. Jan Urban

Střední průmyslová škola Brno, Purkyňova, příspěvková organizace Provozní řád školy

KRAJSKÉ KOLO SOUTĚŽE VE ŠPANĚLSKÉM JAZYCE PRO SŠ

Názory na bankovní úvěry

Projekt CZ.1.07/2.2.00/ Inovace výuky matematiky a v technickém a ekonomickém vzdělávání s cílem snížení studijní neúspěšnosti (REFIMAT)

ODBORNÝ POSUDEK. č. 2661/108/15

Kontrola správnosti sledování a měření objemu vypouštěných odpadních vod dle 92 vodního zákona

1. Informace o předmětu zakázky Stručný textový popis zakázky, technická specifikace

METODICKÝ POKYN NÁRODNÍHO ORGÁNU

Průzkum veřejného mínění věcné hodnocení

Služby péče o děti. jako nástroj sladění pracovního a rodinného života. Ministerstvo práce a sociálních věcí Mgr. Lydie Keprová

PŘÍRUČKA K PŘEDKLÁDÁNÍ PRŮBĚŽNÝCH ZPRÁV, ZPRÁV O ČERPÁNÍ ROZPOČTU A ZÁVĚREČNÝCH ZPRÁV PROJEKTŮ PODPOŘENÝCH Z PROGRAMU BETA

ABSOLVENTSKÉ PRÁCE ŽÁKŮ DEVÁTÉHO ROČNÍKU

Dotazování nad stromem abstraktní syntaxe

ODBORNÝ POSUDEK. č. 2588/35/15

Česká pedagogická společnost

DRAŽEBNÍ VYHLÁŠKA VEŘEJNÉ DOBROVOLNÉ DRAŽBY podle zák. č. 26/2000 Sb., o veřejných dražbách, ve znění pozdějších předpisů

. Alma Mater Studiorum

Směrnice pro vedení, vypracování a zveřejňování bakalářských prací na Vysoké škole polytechnické Jihlava

obecně závazné vyhlášky o vedení technické mapy obce A. OBECNÁ ČÁST Vysvětlení navrhované právní úpravy a jejích hlavních principů

Marketing. Modul 5 Marketingový plán

PROČ VĚDECKÁ ŠKOLA A JAK SE K NÍ DOSTAT? WHY SCIENTIFIC SCHOOL AND HOW TO ACHIEVE IT?

Zásady a podmínky pro poskytování dotací na program Podpora implementace Evropské charty regionálních či menšinových jazyků 2011

ODBORNÝ POSUDEK. č. 2381/21/14

~- ro!c...i 'K*. / XX. Služebný pozemek, panující pozemek, inženýrské sítě a sjezd

Název: Univerzita Karlova v Praze. 1. lékařská fakulta Děkanát Kateřinská 32, Praha 2

HERNÍ PLÁN pro provozování okamžité loterie POMÁHÁME NAŠÍ ZOO - DŽUNGLE

Znalecký posudek číslo /10

Transkript:

Ukázka knhy z nternetového knhkupectví www.kosmas.cz

U k á z k a k n h y z n t e r n e t o v é h o k n h k u p e c t v í w w w. k o s m a s. c z, U I D : K O S 1 8 1 5 4 7

Edce Management v nforma ní spole nost Ed ní rada: Prof. Ing. Josef Basl, CSc. Vysoká ²kola ekonomcká v Praze p edseda Ing. Kate na Drongová Grada Publshng, a.s. místop edseda Prof. Ing. Jan Ehleman, CSc. Techncká unverzta Lberec Doc. RNDr. Josef Hynek, MBA, Ph.D. Unverzta Hradec Králové JUDr. Martn Masner kancelá ROWAN LEGAL Doc. Ing. Karol Mata²ko, CSc. šlnská unverzta v šln Prof. RNDr. Jaroslav Pokorný, CSc. MFF UK v Praze Doc. Ing. Jan Pour, CSc. V E v Praze Doc. Ing. Karel Rchta, CSc. FEL ƒvut v Praze Doc. Ing. Petr Sodomka, Ph.D. UTB ve Zlín Doc. Ing. Mlena Tvrdíková, CSc. V B-TU Ostrava Prof. Ing. Ivan Vrana, DrSc. ƒeská zem d lská unverzta v Praze SEPARATOR Prof. RNDr. Jaroslav Pokorný, CSc. a kolektv XML technologe Prncpy a aplkace v prax Auto : RNDr. Irena Mlýnková, Ph.D. kap. 2, 4, 7.2 Mgr. Martn Ne aský kap. 9, 10 Prof. RNDr. Jaroslav Pokorný, CSc. úvod, kap. 1.5.2, 1.5.3, 3, 7.4 Doc. Ing. Karel Rchta, CSc. kap. 1, 5 Mgr. Kaml Toman kap. 6, 7.1, 7.3 Mgr. Vojt ch Toman kap. 8 Vydala Grada Publshng, a.s. U Pr honu 22, 170 00 Praha 7 tel.: +420 220 386 401, fax: +420 220 386 400 www.grada.cz jako svou 3420. publkac Recenzent Ing. J í Kosek a RNDr. Tomá² Ptner, Ph.D. Odpov dný redaktor Mgr. Petr Mu²álek Sazba RNDr. Irena Mlýnková, Ph.D. a Mgr. Martn Ne aský Po et stran 272 První vydání, Praha 2008 Vytskly Tskárny Havlí k v Brod, a.s. Husova 1881, Havlí k v Brod c Grada Publshng, a.s., 2008 Cover Photo c fotobanka allphoto mages ISBN 978-80-247-2725-7

Obsah O autorech......................................... 7 P edmluva.......................................... 9 Úvod............................................. 11 1 Prncpy formátu XML............................... 15 1.1 Formát XML...................................... 16 1.2 XML dokument..................................... 16 1.3 Dence struktury dokumentu pomocí DTD..................... 20 1.4 Jmenné prostory XML................................. 32 1.5 Aplka ní rozhraní................................... 36 2 XML schémata a jazyk XML Schema..................... 47 2.1 Motvace......................................... 47 2.2 Základy jazyka XML Schema............................. 50 2.3 Jednoduché datové typy................................ 52 2.4 Atrbuty......................................... 58 2.5 Elementy........................................ 59 2.6 Sloºené datové typy.................................. 60 2.7 Skupny atrbut.................................... 66 2.8 Dal²í jazyky pro denc XML schématu....................... 67 2.9 Shrnutí......................................... 70 3 Jazyky XPath, XPonter a XLnk........................ 71 3.1 XPath.......................................... 71 3.2 XPonter......................................... 82 3.3 XLnk.......................................... 85 3.4 Shrnutí......................................... 88 4 Pokro lé technky jazyka XML Schema.................... 89 4.1 Omezení dentty.................................... 89 4.2 Substtuovatelnost a substtu ní skupny....................... 93 4.3 Zástupc......................................... 95 4.4 Externí schémata.................................... 96 4.5 Notace.......................................... 97 4.6 Anotace......................................... 98 4.7 Ko enový element schema............................... 99 4.8 Vztah jazyka XML Schema k XML dokument m.................. 99 4.9 Vztah jazyka XML Schema k DTD.......................... 99 4.10 Shrnutí......................................... 100 5

5 Transformace XML dokument pomocí XSLT................ 103 5.1 Struktura XSL dokumentu............................... 104 5.2 Prvky jazyka XSL................................... 106 5.3 Aplkace pravdel XSLT................................ 116 5.4 Zpracování XML dokumentu pomocí XSLT..................... 117 5.5 P íklad p evodu XML do HTML........................... 119 5.6 P íklad jednoduché databáze v XML......................... 121 5.7 Shrnutí......................................... 125 6 Jazyk XQuery.................................... 127 6.1 Datové modely XML a dotazovacích jazyk..................... 127 6.2 Cesty.......................................... 129 6.3 Konstruktory...................................... 129 6.4 Výrazy FLWOR.................................... 131 6.5 Kvantkátory...................................... 135 6.6 Datový model XQuery................................. 136 6.7 Vstupní funkce..................................... 141 6.8 Funkce.......................................... 141 6.9 Datové typy a schémata................................ 143 6.10 Formální sémantka XQuery.............................. 145 6.11 Shrnutí......................................... 146 7 XML databáze.................................... 147 7.1 Uloºení XML dat v systému soubor......................... 147 7.2 Uloºení XML dat v rela ní databáz......................... 148 7.3 Natvní XML úloº²t................................. 161 7.4 SQL/XML........................................ 179 8 Komprese XML dat................................. 191 8.1 Komprese dat...................................... 193 8.2 Komprese XML dat.................................. 200 8.3 Shrnutí......................................... 215 9 Modelování XML dat................................ 217 9.1 Návody pro návrh XML schémat........................... 218 9.2 Abstrakce návrhu XML schémat........................... 225 10 Praktcké vyuºtí XML............................... 241 10.1 Vybrané standardní XML formáty.......................... 241 10.2 Webové sluºby..................................... 248 10.3 Podpora XML v exstujících RS BD......................... 254 10.4 Shrnutí......................................... 256 Lteratura.......................................... 257 Rejst ík........................................... 263 6 XML technologe

O autorech RNDr. Irena Mlýnková, Ph.D. absolvovala magsterské postgraduální studum na Matematcko-fyzkální fakult UK, kde v sou asné dob p sobí jako odborná asstentka na kated e softwarového nºenýrství. Ve své v decké nnost se v nuje problematce správy XML dat v (objektov ) rela ních databázích, podobnost XML dat a jejího vyuºtí, analýzy reálných XML dat, automatckého generování XML dat a XML benchmarkngu. Výsledky své práce publkuje na meznárodních konferencích (DocEng, DASFAA, DEXA, IDC, ISD,...) v odborných knhách a asopsech. N které z nch získaly významná ocen ní. V rámc svého pedagogckého p sobení spoluvytvá ela na MFF UK p edná²ku Technologe XML a Pokro lé technologe XML a na tuto oblast zam uje vedené bakalá ské a dplomové práce a studentské projekty. Mgr. Martn Ne aský vystudoval Matematcko-fyzkální fakultu UK, obor Datové nºenýrství. V sou asnost p sobí jako postgraduální student na kated e softwarového nºenýrství MFF UK. Tématy jeho výzkumu jsou návrh, ntegrace a správa XML dat a dále pak webové sluºby a sémantcký web. Výsledky své práce publkuje na meznárodních konferencích (SAC, EJC, ICDIM, APCCM,...). Na uvedené oblast zam uje témata vedených bakalá ských a dplomových prací. Na MFF UK vyu uje úvodní kurzy do databázových systém a programování a p edm ty Technologe XML a Pokro lé technologe XML. Na FEL VUT vyu uje p edm t Technologe XML. Prof. RNDr. Jaroslav Pokorný, CSc. byl jmenován profesorem nfor- matky v roce 1999. Je autorem více neº 250 p vodních publkací, v deckých monogra í a vysoko²kolských u ebnc z oblast zpracování dat. Jako len organza ního výboru se podílel na uskute n ní osm meznárodních konferencí. Je lenem v deckých rad FAV ZÚ v Plzn, FIS V E v Praze, rady ÚI AV R a MFF UK. Pracuje v koms pro státní zkou²ky na MFF UK a FEL VUT, je lenem oborové rady pro doktorské studum na MFF UK a dal²ích ²kolách. P sobí jako expert v European Commson, je reprezentantem R v organzac IFIP, stálým recenzentem Computng Revews a Zentralblatt für Mathematk. Na MFF UK pracuje od roku 1982, v letech 1995 2006 zde zastával funkc vedoucího katedry softwarového nºenýrství. Od roku 2008 je prod kanem MFF UK pro v du a zahran ní styky. O autorech 7 Ukázka knhy z nternetového knhkupectví www.kosmas.cz, UID: KOS181547

Doc. Ing. Karel Rchta, CSc. vystudoval obor Techncká kybernetka na FEL VUT v Praze, habltoval se v roce 1992 v oboru Výpo etní technka. V sou asnost pracuje na kated e softwarového nºenýrství MFF UK v Praze. Zabývá se formálním spec kacem, softwarovým nºenýrstvím, databázovým systémy a programováním. U í a u l také n které p edm ty na jných ²kolách, nap. na kated e po íta FEL VUT, kated e nforma ních technologí V E, kated e nforma ních technologí PEF ZU, kated e nformatky a matematky V FS a kated e nforma ních technologí BIV. Je autorem spoluautorem n kolka knh, publkoval více neº 100 p ísp vk na r zných konferencích. Je lenem ACM a SSI. Mgr. Kaml Toman vystudoval Matematcko-fyzkální fakultu UK, obor Po íta ové systémy. V sou asné dob p sobí jako postgraduální student na kated e softwarového nºenýrství. Tématy jeho výzkumné práce jsou zejména problematka adaptvního ukládání XML a vyhledávání v XML datech, analýza reálných XML dat a vyuºtí t chto postup v natvních XML databázích. Výsledky práce publkuje na meznárodních konferencích. V rámc svého p sobení na fakult spoluvytvá el p edná²ku Technologe XML. Mmo akademckou sféru p sobí jako softwarový archtekt, p emº se v nuje mmo jné problematce datových ntegrací a webových sluºeb. Mgr. Vojt ch Toman vystudoval Matematcko-fyzkální fakultu UK, obor Informatka. Po ukon ení studí pracoval jako softwarový nºenýr ve spole nost Gtus, a.s. Od roku 2006 p sobí v nzozemské spole nost X-Hve Corporaton B.V., která se zabývá vývojem technologí pro natvní správu XML dat a ízení a publkování komplexního XML obsahu. Je aktvním lenem pracovní skupny XML Processng Model konsorca W3C. Na MFF UK extern p edná²í o problematce komprese XML dat. 8 XML technologe Ukázka knhy z nternetového knhkupectví www.kosmas.cz

P edmluva Jazyk XML standardzovaný konsorcem W3C p sp l k vývoj souvsejících metod, které se dnes souhrnn nazývají XML technologí nebo XML technologem. Technologe, jak je známo, je soubor postup, nástroj a proces slouºících n jaké nnost. V p ípad XML m ºe jít nejen o transfer dokument nebo jejch transformace apod., ale o jejch ukládání v databáz a zpracování databázovým zp sobem. Zna kovací jazyk XML slouºí jako vým nný formát dat, tvo í syntaktckou základnu sémantckého webu, je na n m zaloºena servsn orentovaná ntegrace, lze ho dokonce povaºovat za nový databázový model. Exstence XML vedla k rozvoj ady dal²ích jazyk a podp rných nástroj pro pouºtí XML v softwarových systémech. Konsorcum W3C koordnuje rozvoj XML technologe a snaºí se dokonce o vytvo ení jejího formálního základu. ƒetba dokument vytvo ených W3C je ov²em, podobn jako jných standard, obtíºná, díky v²em nutným technckým detal m, které takové standardy musí mít. Jedním z cíl knhy je p blíºt technolog nformatkov tak, aby se mohl v p ípad pot eby orentovat v konkrétních prost edcích souvsejících s XML, které sou asná praxe nabízí, dokonce, aby byl schopen takové prost edky vyvíjet. P znejme, ºe zvlá²t u managementu XML dat, kam pat í sou asné XML databáze, to není njak snadný úkol. Seznámt eské tená e detaln j s databázovým zpracováním XML dat je proto dal²ím cílem knhy. P estoºe je knha zacílena na profesonály vyuºívající technolog XML v rámc aplkací, díky jejímu rozd lení do jednotlvých kaptol v ní m ºe za áte ník nalézt pot ebný úvodní materál a vynechat p ípadn detaly specálních ást XML technologe. Nezadatelnou motvací k vydání ttulu byl téº rychlý vývoj dané problematky v posledních letech. P pome me také v této souvslost, ºe od vydání p vodní eské práce o XML [91] J ího Koska uplynulo jº osm let. Knhu m ºeme neformáln rozd lt do dvou ástí. První, tj. kaptoly 16, vychází ze standard. Druhá ást, kaptoly 710, je zam ena na problematku, která se neustále vyvíjí a která spí²e mapuje stav v dané oblast. Díky rozsahu a orentac knhy se domníváme, ºe u nás exstuje relatvn ²roká základna potencálních tená, od student nformatky p es vývojá e software aº po manaºery podnkové nformatky. V textu je pouºta ada p íklad, které nazna ují, jak XML technolog vyuºít a zárove kudy se ubírá její dal²í vývoj. Na obsahu knhy se auto podílel následujícím zp sobem: Jaroslav Pokorný Úvod, kaptoly 1.5.2, 1.5.3, 3 a 7.4, Karel Rchta kaptoly 1 a 5, Irena Mlýnková kaptoly 2, 4 a 7.2, Kaml Toman kaptola 6, úvodní ást kaptoly 7 a kaptola 7.3, Vojt ch Toman kaptola 8, Martn Ne aský kaptoly 9 a 10. Knha p edstavuje vyúst ní aktvt autor v oblast XML technologe v posledních sedm letech. Látka byla nejprve zpracována na úrovn zvaného tutorálu konference EurOpen v roce 2000, dále pak byla zpracována pro semestrový kurz v nformatcké sekc MFF UK, který je dnes sou ástí magsterské výuky. Publka n byla ást materálu také zpracována ve form skrpt. Od roku 2007 je kurz v modkované form realzován na FEL ƒvut. Auto se v dané oblast v nují rovn º výzkumu. Jejch výsledky byly prezentovány jak na etných meznárodních konferencích, tak ve sv tových asopsech. P edmluva 9

Auto d kují Mgr. Janu Ulrychov za pe lvé p e tení rukopsu textu, kontrolu p íklad v odpovídajícím SW a za adu p pomínek, které p sp ly ke zkvaltn ní výsledku. Dále d kují RNDr. Davdu Bednárkov a Mgr. J ímu Dokullov za p e tení vybraných ástí textu a konzultace k nm. V neposlední ad pak pat í velký dík recenzent m, Ing. J ímu Koskov a RNDr. Tomá² Ptnerov, Ph.D., za cenné rady, p pomínky a post ehy a také sponzor m za významnou pomoc p pokrytí náklad na vydání knhy. Knha obsahuje pom rn velké mnoºství p íklad. V²echny p íklady je moºné nalézt na webové stránce http://kocour.ms.mff.cun.cz/necasky/bk/technologexml. Budou zde také umís ovány opravy p ípadných chyb a dal²í souvsející nformace. P pomínky ke knze jsou vítány na e-malové adrese technologexml@ks.mff.cun.cz. V Praze dne 8. 8. 2008 auto 10 XML technologe

Úvod O XML se m ºeme do íst, ºe je to zna kovací jazyk ur ený pro zna kování text. Co a k emu v²ak je to zna kování? Sta í s uv domt, ºe s n jakým zna kováním se setkáváme b ºn v ºvot. K zapsanému textu zapí²eme nap. po stranách jednotlvých stránek r zná znaménka, jejchº význam známe jen my sam, pouºjeme podtrhávání, r zné barvy pro orámování ástí textu apod. Zna ky tedy slouºí k vyzna ení jstých ástí nebo obecn j jednotek v textu. Z ejm je moºné pomocí zna ek vtsknout p vodn zcela nestrukturovanému textu n jakou strukturu. V XML se taková sada zna ek nejprve denuje, aby j mohla vyuºívat n jaká zájmová skupna, a pak se aplkuje na zvolené texty. Zna ky jsou vlastn jakés závorky vyjád ené op t jako text, který smyslupln vyjad uje, co obsah textu mez závorkam znamená. Nap. text Technologe XML ozna kovaný jako <název>technologe XML</název> m ºeme vnímat tak, ºe text mez závorkam <název> a </název> znamená název. O jaký název jde, m ºe být patrné z kontextu výskytu textu. To, ºe jsou zna ky voltelné, nazna uje, ºe XML je vlastn metajazyk. K dspozc jsou pevn daná (jen syntaktcká) pravdla, jak zna ky pouºívat. Je celkem z ejmé, jak zna kovat ru n, lze s v²ak p edstavt zp sob, kdy ozna kovaný text je podle n jakého p edpsu generován z po íta ových aplkací. A k emu je to dobré? Na základ dohodnutých zna ek pak jedna aplkace m ºe porozum t údaj m z jné aplkace. Prvotním ú elem jazyka XML bylo skute n podpo t vým nu dat. O jaká data vlastn jde? XML, jako zcela unverzální prost edek, samoz ejm m ºe být pouºt pro jakákolv data. Typcky m ºe jít o data z rela ní databáze, která jsou transportována v busness-to-busness (B2B) úlohách. Dále lze uvést poloºky z telefonního seznamu, rozvrh odlet letadel nebo data zákaznckých smluv. Jejch hlavním rysem je, ºe jsou pravdeln strukturovaná a v dob návrhu jejch po íta ového zpracování jsou známy jejch typy (v e databází schéma databáze). Na druhé stran spektra stojí data zcela nestrukturovaná, anebo strukturovaná jen velm málo. Jde obvykle o texty, u kterých sce známe autora a datum vydání apod., ne v²ak jº vnt ní strukturu samotného textu. Ta m ºe sce exstovat (kaptoly, odstavce), ale nejsou prost edky, jak j p esn popsat. Obvyklým nástrojem pro manpulac s t lem takového dokumentu jsou fulltextové systémy. Praxe proto rozl²la XML data na dokumentov orentovaná (document- -orented nebo document-centrc) a datov orentovaná (data-orented nebo data-centrc). Mez datov orentovaným a dokumentov orentovaným XML daty je v²ak n kdy hrance nez etelná, n které dokumenty mají rysy obou kategorí. Nap. objednávka m ºe obsahovat nestrukturovaná data jako nap. poznámky nebo komentá e, zatímco lánek v asopse obsahuje strukturovaná data jako nap. jméno autora, datum vydání apod. Na tuto kategor XML dat se hodí termín hybrdní. Dále exstují data, jako jsou záznamy o vy²et eních pacenta, soubor kucha ských recept, webová místa, nap. stránka Amazon.com, ale data ve formátu XHTML (XML následník formátu HTML). Tato data mohou být velm nepravdelná. Nap. záznamy pacent mohou obsahovat vºdy odl²né druhy vy²et ení a odpovídající nasazení lék. To znamená, ºe typy v²ech poloºek nejsou známy v dob návrhu po íta ového uloºení (depoztá e, databáze) t chto dat. Jným slovy e eno, je obtíºné, ne-l nemoºné, zkonstruovat jejch schéma. Rol hraje uspo ádání ástí dat. Ve známé databáz XML dat obsahující Shakespearovy hry jsou data reprezentována Úvod 11

tak, ºe lze rozl²t nap. v²echny replky Desdemondy, je ov²em vyºadováno, aby po adí replk v dalozích z stalo uspo ádáno stejn jako v p vodním textu. Hovo í se pak o semstrukturovaných datech, tj. datech, která nemají schéma, mají nepravdelnou nebo mplctní strukturu, jsou hnízd ná a heterogenní. O takových datech se p edpokládá, ºe budou spí²e zpracovávána strojov neº dotazována lov kem. XML text je dobrým p íkladem semstrukturovaných dat. Ozna kovaná data se tedy vym ují mez aplkacem a dokonce exstují poºadavky, aby byla vhodným zp sobem transformovatelná. Moºná do jných XML dat a nebo k prezentac v uºvatelských výstupech nebo na webových stránkách. V obou p ípadech je ob as nutné XML data ukládat do n jakého repoztá e nebo dokonce databáze. To umoº uje jejch sostkovan j²í management, a to nejen pro dotazování, ale pro aktualzac. Jako databáze m ºe být pouºt n jaký dostupný systém ízení bází dat (S BD) (pro datov orentovaná XML data), ale specální databáze, kterým se íká natvní. Tyto databáze jsou zaloºeny na mplementac ²té na míru XML dat m a jejch zpracování. Nep íl² zajímavá je moºnost chápat XML data pouze jako text. Pak lze pouºít pouze prost edky pro prác s textovým daty umoº ující ndexac, vyhledávání podle klí ových slov apod. Podívejme se nyní na XML z hledska nového databázového modelu. P blº²ím zkoumání zna kování v XML uvdíme, ºe správn se zna ky do sebe zahnz ují herarchckým zp sobem. Tedy XML lze dob e pouºít pro reprezentac dat, která jsou p rozen herarchcká a vyºadují navíc jsté uspo ádání. To napl uje deu roz²í t stávající moºnost databázového zpracování tam, kde byly rela ní databáze nepouºtelné nebo byly pouºtelné jen velm obtíºn. P pome me v této souvslost obtíºn vyjád telné dotazy nad stromovým strukturam v SQL, nap. sou ástek a jejch díl. Jakmle XML pronklo do sv ta databází, bylo nutné vytvo t jazyky pro vyjád ení schématu XML databáze ( kdyº XML databáze m ºe exstovat bez takového schématu). Objevly se dotazovací jazyky a dal²í jazyky pro prác s XML daty. Lze jº tedy hovo t o technolog XML. Knha by m la tená m p blíºt základy technologe XML. Jejím cílem není podat podrobný pops formátu XML. V textu jsou zd razn ny zejména základní my²lenky souvsející s XML, je nastín n datový model XML a moºnost dence struktury XML dokument jazyky DTD a XML Schema. Knha se dále zabývá nástroj, jako jsou jazyk XPath, dotazovací jazyk XQuery a transforma ní nástroj XSLT. Zvlá²tní d raz je kladen na základy databází orentovaných na XML, smyslem je ukázat, jak ukládat XML data do databáze, jak je zpracovávat databázovým zp sobem a jak se k novému trendu staví sou asné standardy. Ze standard jmenujme zejména d leºtá doporu ení konsorca W3C 1, zvlá²t pak jeho pracovní skupny XML Query WG, ale také aktvty tým rozvíjejících pod ISO a ANSI rela ní jazyk SQL. Dal²í významnou pr myslovou ncatvou je XML:DB 2, která se zabývá hlavn návrhem API k XML databázím. Prncpy jazyka XML jsou uvedeny v kaptole 1. Zahrnují syntax jazyka a jeden z moºných model XML dat Infoset, dále pak aplka ní rozhraní SAX, StAX a DOM umoº ující snaz²í prác s XML daty. V kaptole je také popsán prost edek pro denc struktury XML dokument jazyk DTD. Kaptola 2 je v nována podstatn sloºt j²ímu prost edku, neº je DTD, jazyku XML Schema (v aktuální verz 1.0), který slouºí podobnému ú elu, ov²em na mnohem vy²²í úrovn a s podstatn v t²ím moºnostm. V kaptole 3 vysv tlujeme základy t í d leºtých jazyk XML technologe. První z nch XPath (ve verz 1.0) je p íkladem jednoduchého dotazovacího jazyka nad XML daty, XPonter umoº uje odkazování mez XML dokumenty a XLnk zobec uje vazby mez webovým místy do prost edí, kde jsou místo HTML stránek XML dokumenty. Výklad pokro lých rys jazyka XML Schema je obsaºen kaptole 4. Jazyk transformací XSLT, dal²í z rodny XML jazyk, je popsán v kaptole 5. Vyvrcholení výkladu o XML p edstavuje z ejm kaptola 6, v novaná jazyku XQuery. Tento jazyk, jehoº sou ástí je mmo jné jazyk XPath 2.0, p edstavuje zatím nejv t²í o í²ek v technolog XML, nejv t²í výzkumné úslí dosaºené v jejím vývoj, zvlá²t pak z hledska efektvní mplementace jazyka. Následující rozsáhlá kaptola 7 1 http://www.w3.org/ 2 http://www.xmldb.org/ 12 XML technologe

se v nuje XML databázím. Rozebírají se v ní tzv. natvní XML databáze a ukládání XML dat v rela ní databáz. Aktuální je také ntegrace XML dat a rela ních dat podle standardu SQL/XML. Dal²í kaptoly se zabývají tématy, která v dostupné lteratu e zatím nebývají p íl² prezentována. Kaptola 8 pojednává o kompres XML dat. Je z ejmé, ºe jde o d leºtou oblast technologe XML, která p spívá k efektvnost provozu XML dat, jak p p enosech, tak p dotazování. Konceptuální modelování XML dat je p edm tem kaptoly 9. Toto téma je dnes zvlá² aktuální v souvslost s aplkacem orentovaným na webové sluºby. Poslední kaptola 10 je zam ena na praktcké vyuºtí XML a jeho podporu v exstujících rela ních S BD. Následuje rejst ík umoº ující rychlej²í orentac v textu a seznam obsahující uºte né odkazy na dal²í relevantní lteraturu. Úvod 13

?

Kaptola 1 Prncpy formátu XML Formát XML denovalo konsorcum W3C jako formát pro p enos obecných dokument a dat. XML je zkratka pro extensble Markup Language, tj. roz² telný zna kovací jazyk [47]. Návrh XML vychází ze star²ího a obecn j²ího standardu SGML (Standard Generalzed Markup Language ISO 8879:1986 [2]). Poznamenejme, ºe ze standardu SGML vycházel formát dokument HTML (Hyper-Text Markup Language [116]). Sada zna ek formátu HTML je pevná a slouºí k vyjád ení prezenta ní podoby dokumentu. Naprot tomu v XML sada zna ek pevná není, ale m ºe být denována pro r zné sady dokument r zn. Dence sady zna ek m ºe být sou ástí dence XML dokumentu, m ºe být speckována odkazem, nebo m ºe být dohodnuta p edem. Zna ky mají tvar obecných závorek, nap.: <podps>josef</podps> Zna ky slouºí k ozna ení ur tých prvk ( ástí) dokumentu. Zna ky mají otevírací závorku (start-tag), nap. <podps>, a zavírací závorku (end-tag), nap. </podps>. Pokud je text mez závorkam prázdný, lze dvojc otevírací a zavírací závorky nahradt prázdným elementem (empty-element), v na²em p ípad nap. <podps/>. Obr. 1.1 P íklad neozna kované a ozna kované zprávy Uvaºme nap. hypotetckou zprávu na obrázku 1.1. Vyzna íme-l v této zpráv závorkam podps odesílatele, bude takový dokument lépe uchoptelný a bude jej moºno zpracovat programem. V XML m ºeme navíc stanovt, ºe dokument typu zpráva musí obsahovat adresu, oslovení, text, podps a dodatek. Tento poºadavek zapí²eme nap. pomocí nástroje DTD (Document Type Denton) následovn : Prncpy formátu XML 15