ROZDÍLY MEZI RDF MODELEM A TOPIC MAPS DIFFERENCES BETWEEN RDF MODEL AND TOPIC MAPS. Martin Žáček



Podobné dokumenty
Budování aplikačních rozhraní pro obousměrnou komunikaci mezi ERMS a jejich vztah k Národnímu standardu pro komunikaci mezi ERMS.

Objektově orientované databáze

Miroslav Kunt. Srovnávací přehled terminologie archivních standardů ISAD(G), ISAAR(CPF) a české archivní legislativy

3 nadbytek. 4 bez starostí

M. Balíková, R. Záhořík, NK ČR 1

obecně závazné vyhlášky o vedení technické mapy obce A. OBECNÁ ČÁST Vysvětlení navrhované právní úpravy a jejích hlavních principů

Data v počítači EIS MIS TPS. Informační systémy 2. Spojení: jan.skrbek@tul.cz tel.: Konzultace: úterý

EXTRAKT z české technické normy

ČÁST PÁTÁ POZEMKY V KATASTRU NEMOVITOSTÍ

Matematický model kamery v afinním prostoru

1. POLOVODIČOVÁ DIODA 1N4148 JAKO USMĚRŇOVAČ

-1- N á v r h ČÁST PRVNÍ OBECNÁ USTANOVENÍ. 1 Předmět úpravy

účetních informací státu při přenosu účetního záznamu,

Příloha č. 54. Specifikace hromadné aktualizace SMS-KLAS

Střední škola pedagogická, hotelnictví a služeb, Litoměříce, příspěvková organizace

3.5.8 Otočení. Předpoklady: 3506

2.2.2 Zlomky I. Předpoklady:

Všeobecné obchodní podmínky portálu iautodíly společnosti CZ-Eko s.r.o.

Vydání občanského průkazu

funkční na dual-sim telefonech možnost přesměrovat příchozí hovory možnost nastavení více telefonních čísel pro případ, že je jedno nedostupné

U S N E S E N Í. I. Elektronické dražební jednání se koná dne v 09:00:00 hodin, prostřednictvím elektronického systému dražeb na adrese:

Univerzitní 2732/8, Plzeň. doc. Dr. RNDr. Miroslavem Holečkem, rektorem IČO:

Koncepce rozvoje Polytematického strukturovaného hesláře (PSH)

Oborové číslo Hodnocení - část A Hodnocení - část B Hodnocení - část A+B

NÁVRHOVÝ PROGRAM VÝMĚNÍKŮ TEPLA FIRMY SECESPOL CAIRO PŘÍRUČKA UŽIVATELE

OBEC HORNÍ MĚSTO Spisový řád

1. kolo soutěže probíhá: od :00:00 hod do :59:59 hod

Maturitní otázka - optimalizace webových stránek

VI. Finanční gramotnost šablony klíčových aktivit

Všeobecné obchodní podmínky

Statistika ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA DOPRAVNÍ. Jiří Volf, Adam Kratochvíl, Kateřina Žáková. Semestrální práce - 0 -

Specialista pro vytvá řenívztahů Specialist for Creating Relations

Co najdete v ASPI? (pro uživatele SVI FSE UJEP)

ORGANIZAČNÍ ŘÁD ŠKOLY

Zásady pro prodej bytových domů Městské části Praha 5

MOBILNÍ KOMUNIKACE STRUKTURA GSM SÍTĚ

SMLOUVA O PODMÍNKÁCH A PRAVIDLECH ÚČASTI NA ELEKTRONICKÝCH AUKCÍCH DŘÍVÍ

Koncepce hospodaření s bytovým fondem Městské části Praha 5

SBÍRKA ZÁKONŮ. Ročník 2009 ČESKÁ REPUBLIKA. Částka 129 Rozeslána dne 18. listopadu 2009 Cena Kč 44, O B S A H :

S_5_Spisový a skartační řád

Žáci mají k dispozici pracovní list. Formou kolektivní diskuze a výkladu si osvojí grafickou minimalizaci zápisu logické funkce

Autorizovaným techniků se uděluje autorizace podle 5 a 6 autorizačního zákona v těchto oborech a specializacích:

CELOŽIVOTNÍ VZDĚLÁVÁNÍ PRÁVNÍ ÚPRAVA A VÝZNAM NEJEN Z HLEDISKA FINANCOVÁNÍ VYSOKÝCH ŠKOL

Příloha č. 1 k Zadávací dokumentaci Závazný vzor návrhu smlouvy. Dodávky drogistického zboží, čisticích prostředků a obalového materiálu

HERNÍ PLÁN pro provozování okamžité loterie POMÁHÁME NAŠÍ ZOO - DŽUNGLE

Vážení klienti, Upozorníme i na praktické důsledky nesjednání pravidelného pracoviště při poskytování cestovních náhrad. TaxVision, s.r.o.

BLENDED LEARNING A JEDEN JEHO KONKRÉTNÍ PŘÍPAD V PRAXI BLENDED LEARNING AND ONE ITS SPECIFIC EXAMPLE IN PRACTICE

XML a nové trendy v publikování na Webu

Informace veřejného sektoru zdroj surovin pro informace a znalosti ve firmě

rové poradenství Text k modulu Kariérov Autor: PhDr. Zdena Michalová,, Ph.D

Modul informačního systému SPŠSE Liberec

Tvorba webových stránek

POKYNY PRO ŽADATELE PŘÍLOHA 8 DEFINICE POVINNÝCH PŘÍLOH GRANTOVÁ SCHÉMATA SROP. Moravskoslezský kraj PŘÍLOHY POKYNŮ PRO ŽADATELE 2.

ZADÁVACÍ DOKUMENTACE

SMLOUVA O POSKYTOVÁNÍ SOCIÁLNÍ SLUŽBY č.../2013

209/2004 Sb. VYHLÁŠKA ze dne 15. dubna o bližších podmínkách nakládání s geneticky modifikovanými organismy a genetickými produkty

Seriál: Management projektů 7. rámcového programu

Vyhlášení opakované veřejné soutěže 1/6

Vyřizuje: Tel.: Fax: Datum: Oznámení o návrhu stanovení místní úpravy provozu na místní komunikaci a silnici

o místních poplatcích

STŘEDOŠKOLSKÁ ODBORNÁ ČINNOST. Chemické výpočty. Aleš Kajzar Martin Honka

POKYNY Č. 45. Část I Zápis nové stavby jako samostatné věci

Katedra obecné elektrotechniky Fakulta elektrotechniky a informatiky, VŠB - TU Ostrava 16. ZÁKLADY LOGICKÉHO ŘÍZENÍ

Inovace výuky prostřednictvím šablon pro SŠ

Zadávací dokumentace

PRAVIDLA soutěže COOP DOBRÉ RECEPTY Jarní probuzení

Zákon o elektronickém podpisu

Přechod na nový způsob měření psů pro účely určení výšky překážek

Zadávací dokumentace

Pravidla pro využívání lokální počítačové sítě Slovanského gymnázia v Olomouci. Preambule

veřejných výdajů metodou stanovení koeficientu

Systém elektronického zpracování údajů o výzkumných projektech a jejich hodnocení v GA AV

Zadávací dokumentace

NÚOV Kvalifikační potřeby trhu práce

OBCHODNÍ PRÁVO Vysoká škola ekonomie a managementu 2012

Příloha č. 13. Statistický metainformační systém - úvod

DATOVÉ SCHRÁNKY. Seminární práce z předmětu Information and communication policy

Projekt CZ.1.07/2.2.00/ Inovace výuky matematiky a v technickém a ekonomickém vzdělávání s cílem snížení studijní neúspěšnosti (REFIMAT)

FOND VYSOČINY NÁZEV GP

Praktické úlohy- zaměření specializace

I. OBECNÁ USTANOVENÍ II. POSTUP PŘI UZAVÍRÁNÍ SMLOUVY

R O Z S U D E K J M É N E M R E P U B L I K Y

Notebooky a mobilní zařízení 2015

Zadávání tiskových zakázek prostřednictvím JDF a Adobe Acrobat Professional

Vybrané změny v oblasti nemovitostí ve vztahu k energetice

Informačnígramotnost a informačnívýchova

EXTRAKT z mezinárodní normy

MANUÁL. k vyplňování. TŘÍDNÍ KNIHY pro gymnaziální obory

29 Evidence smluv. Popis modulu. Záložka Evidence smluv

N á v r h VYHLÁŠKA. ze dne 2015,

tímto vyzývá k podání nabídky a prokázání kvalifikace a poskytuje zadávací dokumentaci na veřejnou zakázku malého rozsahu na dodávky

V této části manuálu bude popsán postup jak vytvářet a modifikovat stránky v publikačním systému Moris a jak plně využít všech možností systému.

Zadávací podmínky opatření alternativního učení pro cílovou skupinu Migranti

Smlouva o ubytování. Článek I Smluvní strany

Směrnice Rady města č. 2/2011

ÚPLNÉ ZNĚNÍ PRAVIDEL SOUTĚŽE Verze č. 3 ze dne Marketingová soutěž OLYMPIA OLOMOUC

Rozšířená nastavení. Kapitola 4

Tento projekt je spolufinancován. a státním rozpočtem

Mendelova zemědělská a lesnická univerzita v Brně Agronomická fakulta Ústav techniky a automobilové techniky

Algoritmizace a programování

Transkript:

ROZDÍLY MEZI RDF MODELEM A TOPIC MAPS DIFFERENCES BETWEEN RDF MODEL AND TOPIC MAPS Martin Žáček Katedra informatiky a počítačů, Přírodovědecká fakulta, Ostravská univerzita v Ostravě, 30. Dubna 22, Ostrava, e-mail: martin.zacek@osu.cz Abstract This paper provides a brief overview and introduction to the forms of RDF model and Topic Maps. The thesis is divided into three parts. The first part describes the RDF model and its properties. The second part is focused on the second format, and that's Topic Maps. The last part deals with the differences between the formats that will be used for other researchoriented principles of transformation between the two formats. Keywords: RDF model, Topic Maps 1 Úvod Žijeme v informační době a potřeba informací neustále stoupá, avšak s množstvím informací vznikají problémy s jejich ukládáním, tříděním, vyhledáváním, ověřováním a hlavně s jejich porozuměním. Proto vzniklo hned několik na sobě nezávislých formátů pro reprezentaci metadat informačních zdrojů. Mezi tyto formáty řadíme jak RDF model, tak i Topic Maps. Oba formáty mají své nesporné výhody a jsou určené k trochu jinému použití, ale jsou si v mnohém podobné. Pro budoucí vývoj znalostního inženýrství bude velmi podstatným milníkem překonání tohoto rozdílu, v nejlepším případě sjednocením těchto formátů do jednoho, který by se stal standardem pro práci se znalostmi. 2 RDF model Z hlediska transformace syntaktického webu na sémantický web jde o přechod od strukturálně propojených datových zdrojů na bázi klíčových slov k jejich propojení na bázi významových asociací. Potřeba strukturovat data na webu podle jejich významu v rámci zaměření na sémantický web obrací pozornost k datovému modelování na konceptuální úrovni návrhů znalostních bází nad webovými zdroji. Jako prostředek datového modelování vlastností a vztahů mezi datovými zdroji byl vyvinut model RDF jako základní rámec komplexního pojetí reprezentace znalostí na webu. Propojení webových zdrojů na bázi významů dokumentů, které jsou jejich obsahem, realizuje datový model RDF prostřednictvím speciálních informací (metadat) o datových zdrojích. Základem této reprezentace jsou popisy vlastností webových zdrojů prostřednictvím metadat vycházejících ze stanovených konkrétních vlastností (atributů) zdrojů. Datový model RDF popisuje zdroje a vztahy mezi nimi v termínech pojmenovaných vlastností a jejich hodnot, které mohou reprezentovat, jak samotné vlastnosti (atributy) zdrojů, tak též vztahy mezi zdroji. Z tohoto hlediska je třeba model RDF vidět jako konceptuální datový model, podobně jako je tomu např. u E-R modelu. Model vychází z myšlenky známé již z asociativních (sémantických) sítí, spočívající v jednoduchých tvrzeních, týkajících se vztahů mezi objekty (zde zdroji), a to ve formě vektorů (trojic) subjekt - má vlastnost - objekt. 843

Původním záměrem bylo vytvořit model využívající metadat (název, autor, datum vytvoření apod.) všeobecně považovaných za základní informace o webových zdrojích s využitím jazyka XML (extensible Markup Language), ale postupně se model stal obecnou metodou konceptuálního modelování znalostí obsažených v dokumentech webu, bez ohledu na formát jejich syntaxe. Reprezentace metadat z webu se totiž ve své podstatě neliší od reprezentace dat obecně. RDF lze proto používat jako obecný konceptuální rámec pro výměnu dat, a to nejen těch, která jsou dostupná na webu. Metadata neboli strukturovaná data o datech, na nichž je RDF model postaven, zlepšují významně možnost přístupu k informacím. RDF jako datový model je pro sémantický web základním reprezentačním prostředkem, podobně jako tomu bylo a dosud je v případě jazyka HTML a syntaktického webu. 2.1 Idea a formy reprezentace v RDF Základem koncepce RDF jako konceptuálního modelu jsou dva principy, které představují v konceptuálním modelování nové ideje. Jde o způsob popisu konceptů, jejich vlastností a vzájemných vztahů v termínech vlastností (atributů) a jejich hodnot (tj. způsobem typickým pro konceptově orientované datové modelování) a identifikaci prvků modelu, kterými jsou zde webové zdroje, pomocí uniformních identifikátorů zdrojů URI (Uniform Resource Identifier). RDF má abstraktní syntax vycházející z reprezentace jednoduchých tvrzení prostřednictvím RDF trojic (viz následující odstavec) textovou formou i grafovou formou, a tomu odpovídající formální, na teorii modelů založenou, sémantiku. Grafový způsob reprezentace trojic činí model srozumitelným i těm, kteří nemají odpovídající základní teoretické znalosti problematiky. RDF model je popsán v dokumentech konsorcia W3C, z nichž první (RDF) se týká abstraktní syntaxe, druhý (RDFS) se týká schémat (slovníků, ontologií) další pak sémantické stránky modelu. Vedle abstraktní syntaxe RDF je definována též RDF XML syntaxí modelu RDF s vlastní sémantikou pro účely strojového porozumění a přenosu informací obsažených v modelu. V následujících odstavcích budou pouze pro získání představy o syntaxi jazyka RDF XML k některým RDF grafům vytvořeny též jejich RDF XML popisy. 2.2 RDF - trojice a graf Základním jednotkou modelu RDF je tvrzení (statement) o zdrojích tvořící vektor (trojici), tj. tvrzení, že "subjekt" "má vlastnost" určenou "objektem", reprezentovatelné grafově (Obr. 1) nebo v podobě textu jako subjekt má_vlastnost objekt, resp. subjekt predikát objekt. Grafová reprezentace: má_vlastnost subjekt objekt predikát subjekt objekt Obr. 1 Grafová reprezentace sémantické sítě. 844

RDF-trojice je uspořádaný ohodnocený graf reprezentující tvrzení <subjekt> má vlastnost <predikát> s hodnotou <objekt>. RDF-graf je množina RDF-trojic. RDF-trojice má tři komponenty: zdroj <subjekt> je grafově zpravidla reprezentovaný elipsou jako ohodnocený uzel, spojený se zdrojem <objekt> grafově zpravidla reprezentovaným rovněž elipsou jako ohodnocený uzel, pomocí ohodnocené hrany <predikátu>. Návěštími ohodnocení uzlů (subjektů a objektů) mohou být literály (textové řetězce), URIodkazy nebo návěští mohou být prázdná. Návěští hran (predikáty) tvoří vždy URI-odkaz. RDF adaptér může přiřadit jednoznačný identifikátor zdroje URI-odkaz těm zdrojům, které jej nemají. Potom cokoliv, co má URI-odkaz, je považováno za zdroj náležející webu. Příklad 1: Tvrzení, že nákladní auta tvoří podtřídu třídy motorových vozidel (převzato z W3C dokumentu RDF Primer), na Obr. má jako návěští subjektu URI-odkaz http://www.example.org/schemas/vehicles#van, který sděluje v lidsky i strojově čitelné formě, jakého subjektu se reprezentované tvrzení týká (zde třídy nákladních aut), URI-odkaz http://www.example.org/schemas/vehicles#motorvehicles, sděluje, co je objektem reprezentovaného tvrzení (zde třída motorových vozidel), a URI-odkaz http://www.w3.org/2000/01/rdf-schema#subclassof, jako návěští predikátu odkazuje na specifikaci vlastnosti "být podtřídou" (subclassof) třídy motorových vozidel. http://www.example.org/schemas/vehicles#motorvehicle s http://www.w3.org/2000/01/rdf-schema#subclassof http://www.example.org/schemas/vehicles#van Obr. 2 Grafová notace příkladu 1 Protože každý zdroj je identifikován pomocí uniformního identifikátoru zdroje, který je pro zdroj jedinečný, je možné spojování RDF grafů na základě shody zdrojů, které se v nich vyskytují (možno i distribuovaně). Některá vývojová prostředí slučují grafy automaticky. 3 Topic Maps Český překlad názvu technologie Topic Maps je mapy témat. Počátky vývoje map témat můžeme datovat do roku 1991. Skupina autorů, později nazvaná Davenport Group, si dala za cíl vyvinout systém umožňující elektronickou správu a sdílení softwarových manuálů. Pro vyznačení obsahu dokumentu vzniklo SGML DTD, dnes známé jako DocBook. Jeden z problémů, se kterými se Davenport Group musela vyrovnat, bylo spojování rejstříků z různých dokumentací. Prvotní pokus byl vyřešit tento problém pomocí HyTime 845

(Hypermedia/Time-based Structuring Language), v této době (1993) už tvůrcům ale dochází možnosti daleko přesahující pouhé modelování rejstříků a vzniká první idea Topic Maps. 3.1 Model mapy témat Jelikož mapy témat vznikly na principu fungování rejstříků v knihách, jejich model obsahuje dvě vrstvy. (Ontopia, 2007) Vrstva informací (information layer) je označována také jako "spodní vrstva", jedná se o vrstvu informačních zdrojů. Ta by se nechala přirovnat k samotnému obsahu knihy. Většinou má elektronickou podobu, ale není to podmínkou. V našem případě bude touto vrstvou soubor statických dokumentů nahraných na www serveru, pro který chceme vytvořit navigaci. Naopak za "horní vrstvu" bývá označována vrstva znalostí (knowledge layer), ta funguje na principu rejstříku na konci knihy. Znalostní vrstva obsahuje témata (topics) a vztahy (associations). Téma reprezentuje v mapě témat vždy nějaký předmět, jejich význam je obdobný jako význam jednotlivých pojmů v rejstříku. Vztahy zase reprezentují vztahy mezi těmito předměty. Vrstva informací a vrstva znalostí jsou propojeny výskyty (occurrences), které spojují téma a nějaký související informační zdroj. Výskyty hrají roli čísel stran u jednotlivých položek rejstříku knihy. Obr. 3 Model mapy témat 3.2 TAO Topic, Associations, Occurances Základem TM jsou Topics (téma) - reprezentace reálného objektu. Témata jsou propojeny tzv. asociacemi (Associations), které přinášejí do struktury TM sémantický význam. Každé téma může být prostřednictvím asociací navázán na jeden až n dalších tématů. (Kosek, 2006) Každé téma je spojen s reálnou informací, předmětem, částí kapitoly, apod., které jsou nazývány Occurances (výskyty). Na obrázku 4 je možné vidět strukturu TM. Témata jsou reprezentovány kruhy, asociace šipkami a výskyty čtverci. 846

R.U.R napsal Karel Čapek Praha zemřel Obr. 4 - Témata Jednotlivé témata jsou různého typu. Tak vzniká např. R.U.R. je název (knihy), Praha je místo. Důležité však je také to, že tyto typy tématů jsou samy dalšími tématy. Také asociace jsou různého typu. Např. Karel Čapek zemřel v Praze. R.U.R. byl napsán Karlem Čapkem. Stejně tak, jako u témat, jsou tyto typy asociací také dalšími tématy. 3.3 Syntaxe TM jsou např. XTM - XML, CTM Následný příklad ukazuje, jak je možné zapsat strojově čitelnou podobu informace, že Martin Žáček je studentem OU od roku 2003 a díky tématům také přinést sémantický kontext, že neformální jméno je Martin, že patří mezi lidi na OU, že je student apod.: <topic id="martin"> <instanceof> <topicref xlink:href="#lidé na OU"/> </instanceof> <instanceof> <topicref xlink:href="#student"/> </instanceof> <basename> <basenamestring>martin Zacek</baseNameString> </basename> <occorrence> <instanceof> <topicref xlink:href="#popis"/> </instanceof> <resourcedata>martin je studentem OU od roku 2003</resourceData> </occorence> </topic> Nesporná výhoda standardu TM je jednoduché spojování již existujících map. Toto spojování je možné i přesto, že mohou existovat rozdíly, např. v jazyce daných map. Tento nedostatek v konzistenci map je odstraněn díky funkci tzv. scope (oblast). Scope omezuje 847

platnost charakteru TM. Na následujícím případu je možné vidět, že záznam je vybaven dvěma scopy, které upravují jazykový význam mapy týkající se České republiky: <topic id="česká republika"> <basename> <scope><topicref xlink:href="#cz"/> <basenamestring>česká republika</basenamestring> </basename> <basename> <scope><topicref xlink:href="#en"/> <basenamestring>czech republic</basenamestring> </basename> </topic> Problém TM je také v tom, co přesně reprezentuje daný topic (téma), neboť někdy může docházet k nejednoznačnosti. Je tak nutné do každé TM přidat tzv. Published Subject Identifier (PSI), který jednoznačně určí vlastnosti a charakter příslušného topicu. Takový PSI může být jakákoli webová stránka, která význam topicu specifikuje. Jako vhodný PSI se v poslední době jeví především Wikipedie, která existuje v mnoha jazycích a vzniká na základě sociálního konstruktu. Na následujícím příkladě je zachycen jednoznačný PSI Katedry informatiky a počítačů: <topic id="kip"> <instanceof> <topicref xlink:href="#katedra"/> </instanceof> <subjectidentity> <subjectindicatorref xlink:ref="http://prf.osu.cz/kip"> </subjectidentity> <basename> <basenamestring>katedra informatiky a počítačů</basenamestring> </basename> </topic> 4 Rozdíly mezi RDF modelem a Topic Maps Vývoj obou formátů vznikal na jiných institucích a v jiných časech. Proto nikdy nevznikl jednoduší a efektivnější standard namísto dvou podobných (RDF a Topic Maps). Pravděpodobně je to tak lepší, protože obě platformy mají přece jen trochu jiné uplatnění. RDF vnikalo především pro strojové zpracování informací, zatímco Topic Maps jsou určeny k reprezentaci znalostí pro lidi. Proto mají tyto formáty různé silné a slabé stránky. Např. RDF umožňuje odvozování a má více propracované ontologie, zatímco v Topic Maps je toto nemyslitelné. Topic Maps umožňují efektivní slučování map na základě identifikátorů témat. 4.1 Použití RDF model má uplatnění v těchto oblastech: katalogizace, vyhledávání zdrojů, e-commerce, hodnocení obsahu, znalostní inženýrství. Mezi konkrétní aplikace využití v praxi je například FOAF (Friend Of A Friend RDF je zde navržen jako prostředek k popsání lidí, jejich koníčků a jejich vzájemných vztahů) nebo DOAC (Description Of A Career umožní sdílet přídavné informace k FOAFu). 848

Topic Maps se dá s výhodou použít v těchto oblastech: organizace rozsáhlých zdrojů (rejstříky v knihovnách), shromažďování informací v distribuovaném prostředí, podpora navigace v aplikacích, vyhledávání v rozsáhlých databázích elektronických zdrojů, Topic Maps se využívá v managementu znalostí pro práci se znalostmi, Kdekoliv, kde se potřebují zachytit vlastnosti o předmětu a vztahy mezi nimi (Topic Maps mohou v některých případech dokonce dobře nahradit relační databáze), Integrace knihovních katalogů, E-learning. 4.2 Reprezentace Jak RDF, tak Topis Maps jsou formáty založené na identitách. To znamená, že klíčovým konceptem je symbol reprezentující identifikovatelnou věc, o které můžeme něco tvrdit. Například z Obr. 4 lze symbolu přiřadit název Karel Čapek a spojit jej s jiným symbolem R.U.R. přes vztah napsal. V RDF je pojem pro věc zdroj (Resource) a termín, který reprezentuje zdroj v RDF je URI-odkaz jako návěští uzlu (Node). V Topic Maps je termín pro věc předmět (Subject), a symbolem představující předmět v mapách témat je téma (Topic). 4.3 Tvrzení Zatím bylo řečeno, jak tyto formáty používají symboly k reprezentaci věcí. To podstatné je však jakým způsobem RDF a Topic Maps mohou o těchto věcech něco říct. Zde se ukazuje podstatný rozdíl mezi uvedenými formáty. RDF může tvořit tvrzení o věcech pouze jedním způsobem, naproti tomu Topic Maps má tří různé způsoby (3 různé charakteristiky témat názvy, výskyty a vztahy). Základním stavebním prvkem, jak již bylo řečeno, je u modelu RDF tvrzení (statement). Tvrzení je vztah subjektu (uzel, o kterém se vyjadřujeme) k objektu (uzel, který je hodnotou) daný vlastností (predikátem). Objekt nemusí být pouze zdroj, ale může být i literál. foaf: name foaf: homepage Karel Čapek http://cs.wikipedia.org/ wiki/karel_čapek ex: book Obr. 5 RDF tvrzení ex: bookname R.U.R Topic Maps na rozdíl od RDF využívá 3 různé způsoby, jak vytvořit přiřazení, a těmi jsou: názvy, výskyty a role ve vztazích. Názvy (Names) Název je nejjednodušší přiřazení v Topic Maps. Název je textová hodnota (string), ale může být kvalifikována (může obsahovat obor platnosti). Toto přiřazení má v Topic Maps zvláštní postavení, jelikož reprezentuje téma navenek a je přímo v datovém modelu. V RDF se přiřazení názvu provádí použitím vlastnosti, která název vyjadřuje (které vlastnost to bude, se liší na použitém RDF slovníku). Obrázek zobrazuje mapu témat s jedním tématem, které 849

reprezentuje Karla Čapka. Toto téma má přiřazeno jeden název, který je vidět přímo na tématu. Karel Čapek Obr. 6 Téma s názvem Výskyty (Occurences) Výskyty mohou být literály přímo v mapě témat, nebo URI odkazy na informační zdroje mimo mapu. Výskyty mají typ a tímto typem je téma ve stejné mapě témat. Na výskytech je zajímavé, že jsou strukturálně stejné jako RDF vlastnosti (když pomineme podporu oborů platnosti). Díky této podobnosti je možné konvertovat RDF a Topic Maps oběma směry. Každopádně i výskyty se drobně liší od RDF vlastností a to tím že RDF vlastnosti jsou sémanticky méně omezené. Příklad ukazuje přiřazení výskytu k tématu. Karel Čapek homepage http://cs.wikipedia.org/wiki/karel_čapek Obr. 7 Přiřazení výskytu Vztahy (Associations) Můžeme také tvořit vztahy mezi tématy, kde vztah má typ, kterým je téma ze stejné mapy. Každé téma ve vztahu se tohoto vztahu účastní jako hráč role vztahu. Těchto rolí ve vztahu může být neomezeně, na rozdíl od RDF, kde je to naprosto vyloučené. Příklad ukazuje vztah napsal mezi osobou Karel Čapek a jeho knihou R.U.R. Může si všimnout rolí napsal a autor. http://cs.wikipedia.org/wiki/karel_čapek Karel Čapek homepage R.U.R autor R napsána A R napsal Obr. 8 Vztahy a role témat 4.4 Identita Identifikace je o zjišťování, jestli dva různé symboly nereprezentují stejnou věc. Jak RDF, tak i Topic Maps je navržený, aby identifikaci podporoval, ale oba formáty jí podporují odlišným způsobem. V RDF existují 3 typy uzlů: literály, URI odkazy tyto uzly jsou jasně identifikovatelné (pokud máme dva uzly se stejným URI, reprezentují oba jeden zdroj), prázdné uzly jsou uzly, které nejsou označeny ani URI a ani literály. V RDF neexistuje žádný standard pro zjištění, který prázdné uzly reprezentují stejnou věc (vysoko-úrovňové slovníky jako OWL toto umožňují). 850

V Topic Maps mohou být témata také jako prázdné uzly, ale v tématu mohou být přiřazeny URI pro indikátory objektu (Subject identifier), který věc identifikuje. Pokud nejsou žádné indikátory přiřazeny, odpovídá téma prázdnému uzlu v RDF. Topic Maps má na rozdíl od RDF propracovanější systém identifikace předmětů. Topic Maps rozlišuje předměty a informační zdroje. V RDF není na první pohled jasné, zda URI http://cs.wikipedia.org/wiki/karel_čapek reprezentuje stránku na wikipedii nebo samotnou osobu o Karlu Čapkovi. Tento problém se dá vyřešit na úrovni ontologie, kde přiřadíme zdrojům třídy Document a Person. 4.5 Typy a podtřídy Jedno z nejdůležitějších přiřazení, které se provádí je přiřazení typu (type). Což nám v příkladu umožní říci, že Karel Čapek je jiný druh věci než drama a že se na každý tento předmět vztahují jiná pravidla. Navíc bychom mohli chtít poznamenat, že drama je podtřída (subclass) kniha. Tedy že všechna dramata jsou knihy, ale existují i jiné knihy, které nejsou drama (např. próza). K určení typu se v RDF používá vlastnost rdf:type, která je součástí samotného RDF, a k určení podtřídy se používá vlastnost rdfs:subclassof, která je spíše součástí RDF schéma nežli RDF. V Topic Maps je situace podobná, k určení typu poskytují Topic Maps předdefinované vztahy type-instance a supertype-suptype, jediný rozdíl je, že jsou tyto vztahy součástí samotného standardu Topic Maps a že Topic Maps raději vlastnosti nazývají subtype namísto subclassof. 4.6 Slučování Slučování je proces, který slučuje symboly, které reprezentují stejné věci. V RDF jsou to uzly, které mají stejný literál, nebo používají stejné URI. Jazyky pro ontologie, tj.owl, DAML+OIL, navíc poskytují mechanismus, která umožňuje identifikovat uzly podle jejich tvrzení. V Topic Maps se slučují jednoduše témata, které mají stejné identifikátory předmětu (PSI) či lokátory předmětu. Navíc stejně jako u RDF nové standardy Topic Maps umožňují identifikovat témata na základě jejich charakteristik. 5 Závěr Podle názoru L. M. Garshola (Garshol, 2003) se spojení obou technologií nejeví jako možné ani jako žádoucí Obě technologie mají jiné možnosti určené pro jiné použití. Každopádně mým budoucím záměrem bude podrobné zkoumání jednotlivých technologií a jejich převáděním mezi nimi, čili převádění oběma směry a to díky použitím mapovaní vlastností specifických slovníků na jejich možné ekvivalenty v opačném formátu. Což umožňuje, mimo samotné konverze i vzájemnému sdílení RDF a Topic Maps slovníků. Stručně řečeno RDF model a Topic Maps spolu mohou existovat bok po boku, aniž by jeden formát omezoval působnost toho druhého. 6 Literatura GARSHOL, Lars Marius : Living with topic maps and RDF [online]. [2003] [cit. 2007-11- 06]. Dostupný z WWW: <http://www.ontopia.net/omnigator/docs/schema/tutorial.html> CHAMPIN, P. A.: RDF tutoriál. Bechhofer, S. (ed.): Ontology Language Standardization Efforts. KOSEK, Jiří. Topic Maps : Tutoriál [online]. 2006 [cit. 2007-12-14]. Dostupný z WWW: <http://www.kosek.cz/xml/tmtut/> 851

ONTOPIA. The Ontopia Schema Language : Tutorial [online]. 2007, [cit. 2007-12-19]. Dostupný z WWW: <http://www.ontopia.net/topicmaps/materials/tmrdf.html> Recenzent: prof. RNDr. Alena Lukasová, CSc., katedra informatiky a počítačů, Přírodovědecká fakulta, Ostravská univerzita v Ostravě, 30. Dubna 22, Ostrava, e-mail: Alena.Lukasova@osu.cz 852