Metadata, sémantika a sémantický web. Ing. Vilém Sklenák, CSc.

Podobné dokumenty
Web 2.0 vs. sémantický web

Ontologie. Otakar Trunda

Quo vadis, vyhledávání (na webu)?

Metadata, sémantika a sémantický web

Vilém Sklenák Inforum2009,

Uživatelská podpora v prostředí WWW

Vyhledávání nebo nalezení informací

Znalostní báze pro obor organizace informací a znalostí

Sémantický web 10 let poté

Metody tvorby ontologií a sémantický web. Martin Malčík, Rostislav Miarka

Znalostní báze pro obor organizace informací a znalostí

On-line katalog On-line digitální knihovna

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

Výměnný formát XML DTM DMVS PK

EXTRAKT z mezinárodní normy

co uživatel? Vilém Sklenák Vysoká škola ekonomická, fakulta informatiky a statistiky, katedra informačního a znalostního inženýrství

Možnosti využití XML v knihovnické praxi. Gabriela Krčmařová AKP 2001 Národní knihovna ČR Liberec,

Workshop k terminologickým otázkám organizace znalostí Motivace a hypotézy projektu. Cíl projektu NAKI DF13P01OVV013

MBI - technologická realizace modelu

WWW jako dynamická knihovna

Sémantická interoperabilita v rámci iniciativ EU

Dokumentační služba projektu MediGrid

Od relačních databází k technologiím sémantickému webu

Manuscriptorium v roce 2013

Metadata. podmínka naplnění požadavků a očekávání INSPIRE. INSPIRE a GII/SDI, Praha,

III. Informační systém & databáze

Modely a sémantika. Petr Šaloun VŠB-Technická univerzita Ostrava FEI, katedra informatiky

The bridge to knowledge 28/05/09

Cesta ke zpřístupnění a archivaci dokumentů. Jan Pokorný, MULTIDATA Praha s.r.o. INFORUM 2008, VŠE Praha

Web 2.0, Search 2.0 jak se to rýmuje?

Vývoj moderních technologií při vyhledávání. Patrik Plachý SEFIRA spol. s.r.o.

PRODUKTY Tovek Server 6

Repositář audiovizuálních dokumentů Akademie múzických umění v Praze..

Rešeršní a studijně rozborová činnost

Modely datové. Další úrovní je logická úroveň Databázové modely Relační, Síťový, Hierarchický. Na fyzické úrovni se jedná o množinu souborů.

Jak vysoké školy pokročily ve zpřístupňování své šedé literatury

Univerzální vyhledávací portál jako integrační řešení pro digitální knihovny

Teorie systémů TES 5. Znalostní systémy KMS

Role informační architektury a optimalizace pro vyhledavače v online publikování

Standardy publikace a katalogizace otevřených dat

Logický datový model VF XML DTM DMVS

Tovek Tools. Tovek Tools jsou standardně dodávány ve dvou variantách: Tovek Tools Search Pack Tovek Tools Analyst Pack. Připojené informační zdroje

Manuscriptorium jako základ pro virtuální badatelské prostředí

SEARCH & BIG DATA [ & ANALYTICS] INFORUM 2015, Pavel Kocourek

V praxi se může jednat například o procesní instrukce, pracovní instrukce a podobný druh dokumentace.

Open Bibliography Data. ( Matouš Jobánek

Otevřená data ve veřejné správě , Mikulov. Tomáš Kroupa, Ministerstvo vnitra - Odbor hlavního architekta egovernmentu

Archivace relačních databází

Tovek Server. Tovek Server nabízí následující základní a servisní funkce: Bezpečnost Statistiky Locale

Jak budeme řešit otevřená data ve veřejné správě? Michal Rada Ministerstvo vnitra ČR

S M Ě R N I C E č. 6/2014 ministra financí

Kurz pro studenty oboru Informační studia a knihovnictví 5. Informační architektura

Popis a zpřístupnění záznamů performativního umění - výzvy a možná řešení. Bohuš Získal, CESNET / NFA

Standard výměnného formátu XML Digitální technické mapy

Informační architektura (IA)

SCREENINGOVÉ METODY - CÍLENÉ A NECÍLENÉ

POUŽITÍ DATABÁZÍ. Po ukončení tohoto kurzu budete schopni

Manuscriptorium v roce 2013

Vývoj a využití plnotextových edic historických dokumentů v Manuscriptoriu

Web a očekávání budoucího

Z papíru na web a ke čtenáři aneb Digitalizace není jen skenování. Mgr. Monika Oravová Moravskoslezská vědecká knihovna v Ostravě

Registrační číslo projektu: Škola adresa:

Modely vyhledávání informací 4 podle technologie. 1) Booleovský model. George Boole Aplikace booleovské logiky

Otázky k BZK pro studující od akademického roku 2010/2011 Povinný předmět - Informační věda

Wichterlovo gymnázium, Ostrava-Poruba, příspěvková organizace. Maturitní otázky z předmětu INFORMATIKA A VÝPOČETNÍ TECHNIKA

Zpráva o zhotoveném plnění

Dobývání znalostí z webu web mining

Vzdělávací obsah předmětu

Otevřená a propojitelná data ve veřejné správě Národní katalog otevřených dat

Správa VF XML DTM DMVS Datový model a ontologický popis

Elektronické zdroje a digitální knihovny pro zrakově postižené

Tzv. životní cyklus dokumentů u původce (Tematický blok č. 4) 1. Správa podnikového obsahu 2. Spisová služba

Národní technické specifikace. služeb nad prostorovými daty a metadaty

Jak na opendata ve veřejné správě. Michal Rada Ministerstvo vnitra

Digitální knihovny: principy a problémy Jaroslav Pokorný MFF UK Katedra softwarového inženýrství Praha

Databáze. Logický model DB. David Hoksza

Obohacování bibliografických záznamů o věcné selekční prvky postup NKČR

ZEMĚMĚŘICKÝ ÚŘAD. Uživatelská příručka - Metadatový editor MDE. Pod Sídlištěm 9/1800, Praha 8. Verze IS nebo části IS: Účel poslední změny:

Témata k závěrečným bakalářským zkouškám 2019

Dotazování nad stromem abstraktní syntaxe

Máte to? Summon jako základní vyhledávací nástroj NTK

Oborové číslo Hodnocení - část A Hodnocení - část B Hodnocení - část A+B

Otevřená data. Shrnutí. Když stavím nový IS nebo upravuji existující, co musím udělat, abych byl Open Data Ready? Prosinec 2018

Digitalizace knihovních dokumentů. Jiří Polišenský

RDF a RDF Query. Jakub Nerad 1. prosince Nerad () RDF a RDF Query 1. prosince / 16

ECM. Enterprise Content Management. čt 9:15 Petr Bouška (xboup00) Zbyněk Hostaš Lukáš Maršíček Martin Nikl (xnikm00)

Ožehavé problémy normalizace a užívání české terminologie v geoinformatice. Doc. Ing. Jiří Šíma, CSc. Praha

Jak psát bakalářskou práci v DocBooku

environmentálních rizik a ekologických škod

Digitální knihovny v České republice

Věcné zpracování a zpřístupnění informačních zdrojů Marie Balíková Národní knihovna ČR

Nepravidlové a hybridní znalostní systémy

Nastavení provozního prostředí webového prohlížeče pro aplikaci

Logika pro sémantický web

Přehled mezinárodních norem (ISO) Označení mezinárodní normy Názvy mezinárodních norem Rok vydání

Technologie digitálních knihoven

Evropská digitální knihovna. < Prezentace k eseji pro předmět PV070 Digitální knihovny. Tomáš Drusa

Stručně o XML (výhody, nevýhody) Proč komprimovat XML? Metody komprese XML XMill. Optimalizace komprese XML. Závěr

Co jsou otevřená data?

Transkript:

Metadata, sémantika a sémantický web Ing. Vilém Sklenák, CSc.

Inforum 2004, Praha, 27. 5. 2004 2/21 There are things we know that we know. There are known unknowns that is to say, there are things that we now know we dont know but there are also unknown unknowns. There are things we do not know we dont know. Existuje známé známé, tedy věci, o nichž víme, že víme. Víme také, že jsou známé neznámé, to jest - víme, že jsou některé věci, které nevíme. Existují ale rovněž neznámé neznámé. Takové, o nichž nevíme, že nevíme.

Neznámá známá metadata Pojem je všeobecně známý, ale co je správně? 1. data o datech 2. informace o informacích 3. význam nebo sémantika dat 4. zdroj poskytující informace o jiném zdroji 5. popisná informace o webovém zdroji A co ví Google? define:metadata Inforum 2004, Praha, 27. 5. 2004 3/21

Inforum 2004, Praha, 27. 5. 2004 4/21 Jsou vždy metadata metadaty? Data mohou být jednak metadaty, jednak prostými daty. Rozhoduje způsob použití. Bibliografický záznam: 1. metadata pro uživatele 2. data pro knihovní systém

Inforum 2004, Praha, 27. 5. 2004 5/21 Přednosti metadat Umožňují abstrahovat od detailů reprezentace, zachycují informační obsah nezávisle na původní formě dat. Umožňují reprezentovat doménové znalosti popisem informační oblasti dle příslušnosti výchozích dat úsudky, odvozování...

Inforum 2004, Praha, 27. 5. 2004 6/21 Klasifikace metadat Lze uplatnit různá kritéria. Například TDKIV: administrativní m. popisná m. archivační m. m. pro právní nároky m. pro užití strukturální m. technická m. resp. samostatná m. vložená m.

Klasifikace metadat Z hlediska úrovně abstrakce popisu obsahu: Syntaktická m. detaily o zdroji (dokumentu), katalogizace, kategorizace. Strukturální m. struktura dokumentu, navigace, zobrazení, XML schémata. Sémantická m. kontextově relevantní informace, doménově specifické elementy Ontologie nejvyšší forma metadat, klíčový princip sémantického webu. Inforum 2004, Praha, 27. 5. 2004 7/21

Inforum 2004, Praha, 27. 5. 2004 8/21 Ontologie Sémantická m. Firma, e-mail, kontakt... Strukturální metadata DTD, XSL, shlukování, extrakce... Syntaktická metadata Jazyk, formát, délka, datum vytvoření aj. Data Strukturovaná, semistrukturovaná a nestrukturovaná

Inforum 2004, Praha, 27. 5. 2004 9/21 Web se mění Lokalizace zdrojů od jednoduchého použití klíčových slov k sémantickým technikám Uživatelé zdroje použitelné jak pro člověka, tak pro strojové zpracování Webové služby zatím je web spíše v pasivním postavení = místo pro nalezení věcí, ale...

Inforum 2004, Praha, 27. 5. 2004 10/21 Sémantika Co říká encyklopedie CoJeCo: 1. oddíl jazykovědy 2. součást sémiotiky zkoumající vztah mezi formou a významem znaku 3. informatika pravidla přisuzující význam přípustným kombinacím symbolů Co ví Google? define:semantics

Inforum 2004, Praha, 27. 5. 2004 11/21 Sémantiky mohou být různé Implicitní s. Neformální s. Formální s.

Implicitní sémantika <zbozi> <nazev>neco</nazev> <dodavatel>firma</dodavatel> <cena>190.00</cena> </zbozi> existuje-li konsensus impl. s. rovnou ve webových aplikacích (např. shopping agenty). problém mnohoznačnosti Co je cena?. Inforum 2004, Praha, 27. 5. 2004 12/21

Inforum 2004, Praha, 27. 5. 2004 13/21 Neformální sémantika explicitní sémantika vyjádřená neformálním způsobem omezená možnost přímého strojového zpracování obchází se přímou implementací do softwaru Například: <h2>, Dublin Core,...

Formální sémantika explicitní sémantika vyjádřená formálně umožňuje přímé zpracování včetně automatické inference určující vlastnost sémantického webu = strojově zpracovatelný obsah: sémantika jako součást aplikace robustnější je oddělení procedurální nebo deklaratovní přístup Inforum 2004, Praha, 27. 5. 2004 14/21

Inforum 2004, Praha, 27. 5. 2004 15/21

Sémantický web Inforum 2004, Praha, 27. 5. 2004 16/21

Inforum 2004, Praha, 27. 5. 2004 17/21 Dolování metadat lexikografická analýza vizuální vzory využití ontologií

Inforum 2004, Praha, 27. 5. 2004 18/21 Úvod závěru Vyhledávání informací volá po sémantické podpoře. Vyhledávací stroje jsou zdokonalovány a pořád dokáží uživatele příjemně překvapit. Efektivnost je však v porovnání se sémantickým vyhledáváním nižší...

Inforum 2004, Praha, 27. 5. 2004 19/21 Efektivnost vyhledávání klíčová slova vs. ontologie F score obecné dotazy KW: 20 44 %, ON: 92 94 % specifické dotazy KW: 71 83 %, ON: 83 91 %

Inforum 2004, Praha, 27. 5. 2004 20/21 Pokračování závěru Sémantický web je vize. Její naplňování je během na dlouhou trať. Rozpor s očekáváním okamžitých efektů jak ze strany uživatelů, tak firem. Nyní je stabilizovaný stav v otázce jak metadata vyjadřovat. Další vývoj způsoby získávání metadat.

Inforum 2004, Praha, 27. 5. 2004 21/21 Vize? August 2009: How Google beat Amazon and Ebay to the Semantic Web