NSWI108 Sémantizace Webu 1. Úvod do problematiky Peter Vojtáš a J. Dědek,. Eckhardt, M. Nečaský Sémantizace webu Úvod 1
Začátky webu Internet, http, HTML, URL Sir Timothy Berners-Lee TBL Sémantizace webu Úvod 2
Začátky webu první editor, prohlížeč, TBL The WorldWideWeb browser (nyní Nexus) (bez mezer) WorldWideWeb (s mezerama) je informační prostor článek Tim J. Berners-Lee, R. Cailliau,. Luotonen, H. Frystyk Nielsen,. Secret. "The World-Wide- -Web" in Communications of the CM (CCM), 37(8), 76-82, 1994, viz též, Early adopters CERN Sémantizace webu Úvod 3
Problém - velikost, lokalizace, heterogenita Sémantizace webu Úvod 4 Kumar, R. et al: The Web as a graph. In CM SIGMOD-SIGCT-SIGRT, 2000
Problém hledání podle klíč.slov Raketa nebo strom? Značka lyží nebo koníček? Sémantizace webu Úvod 5
K čemu? Pomoc, zisk, komunikace, učení Sémantizace webu Úvod 6
Problém webu stroje umí, lidé ne, Proč to lidí umí lépe a stroje neumí? σημαντικος (ΣΗΜΑΝΤΙΚΟΣ) sémantika, význam Kontext a implicitní znalost člověka? Sémantizace webu Úvod 7
Možné cesty vylepšení Proč to lidí umí lépe a stroje neumí? Sémantický web Web 2.0 Sémantizace webu (postupná s., proces s.) Jiné? Sémantizace webu Úvod 8
(Velká) vize sémantického webu - příběh - Bratr a sestra mají problém maminka stůně; - Specialista předepsal pravidelnou terapii; -Různí poskytovatelé vzdálenost, kvalita, čas, mají smlouvu s maminčinou pojišťovnou? -Přes celé město (L) a dopravní špičce NE; -Přesuneme některé naše méně důležité termíny; - Nové hledání... a to všechno zorganizuje agent automaticky, např. z mobilu... Tim Berners-Lee(TBL), James Hendler and Ora Lassila, The Semantic Web, Scientific merican, May 17, 2001, lokálně jen pro výukové účely Sémantizace webu Úvod 9
Základní myšlenka sémantického webu P. Vojtáš. Web semantization. WIC 2009 Sémantizace webu Úvod 10 Motivováno P. Hitzler, M. Krötzsch, S. Rudolph, Y. Sure. Semantic Web Grundlagen
Základní myšlenka sémantického webu utor Publikace P. Vojtáš. Web semantization. WIC 2009 název konference Ontologie Schema Sémantizace webu Úvod 11 P. Hitzler, M. Krötzsch, S. Rudolph, Y. Sure. Semantic Web Grundlagen
Základní myšlenka sémantického webu utor Publikace P. Vojtáš. Web semantization. WIC 2009 název konference Ontologie Schema Sémantizace webu Úvod 12 P. Hitzler, M. Krötzsch, S. Rudolph, Y. Sure. Semantic Web Grundlagen
Základní myšlenka sémantického webu binární vztah utor Publikace binární vztah P. Vojtáš. Web semantization. WIC 2009 název konference Ontologie Schema Sémantizace webu Úvod 13 P. Hitzler, M. Krötzsch, S. Rudolph, Y. Sure. Semantic Web Grundlagen
Základní myšlenka sémantického webu utor Publikace prezentér přednáška program název konference P. Vojtáš. Web semantization. WIC 2009 název konference Znalost: Publikace má alespoň jedného autora Ontologie Schema Prezentér je jeden z utorů. Sémantizace webu Úvod 14 P. Hitzler, M. Krötzsch, S. Rudolph, Y. Sure. Semantic Web Grundlagen
Základní myšlenka sémantického webu utor Publikace prezentér přednáška program název konference P. Vojtáš. Web semantization. WIC 2009 název konference Znalost: Publikace má alespoň jedného autora Ontologie Schema Prezentér je jeden z utorů. Sémantizace webu Úvod 15 P. Hitzler, M. Krötzsch, S. Rudolph, Y. Sure. Semantic Web Grundlagen
Sémantický web binární datový model ontologie (můžou) reprezentují schema znalost, kontext umožňují integraci nalogie z DBMS od síťového (hierarchického) k relačnímu modelu od ad hoc aplikací (Cobol) k deklarativnímu SQL Od procedurálního k deklarativnímu Sémantizace webu Úvod 16 Příklad z W3C materiálu Resource Description Framework (RDF) Primer http://www.w3.org/tr/rdf-primer/
Sémantický Web Web s automatizovaným sdílením a zpracováním dat nezávislé od předešlé domluvy Datový model webu RDF RDF Schema+OWL SPRQL dotazy Standardizováno (ne použito) výzkum Ontologie OWL RDF + RDFSchema důkaz? Logika dotazy důvěryhodnost digitální podpis Standardizováno použito XML + jmenné prostory + XMLSchema Unicode URI IRI Sémantizace webu Úvod 17
Sémantický Web W3C World Wide Web Consortium šéf TBL Vyvíjí interoperabilní technologie (specifikace, směrnice, software a nástroje) K využití plného potenciálu webu. W3C aktivity Document Object Model Graphics Internationalization Mobile Web Initiative Patent Policy Rich Web Client Semantic Web Synchronized Multimedia Voice Browser WI Technical Extensible Markup Language (XML) HTML Math Multimodal Interaction Privacy Security Style Ubiquitous Web pplications WI International Program Office Web Services XForms... Incubator ctivities... šli cestou standardizace modelů, pro automatizaci Sémantizace webu Úvod 18
Jiná možná cesta vylepšení Web 2.0 Centrálním principem úspěchu gigantů zrozených v první éře Web-u, kteřípřežili burzovní krach.com, teď posílení, vedou Web 2.0 éru, se zdá být uchopení síly webu k zapřáhnutí kolektivní inteligence (social tagging), Tim O Reilly, 2006 taky +$ z aukcí sponzorovaných odkazů, Sémantizace webu Úvod 19
Jiná možná cesta vylepšení Web 2.0 Čemu stroje nerozumí Lidi označují tagují,... Např. http://www.flickr.com/ le stroje tomu pořád nerozumí většinou volnočasové aktivity skupiny s nízkým příjmem šli cestou web pro lidského uživatele Sémantizace webu Úvod 20
Sociologie, psychologie, antropologie, vzhled... Sémantizace webu Úvod 21
Sociologie, psychologie, antropologie, vzhled... Sémantizace webu Úvod 22
Trade off mezi efektivností a pohodlím IBM Information Management Systém COBOL SQL Web 2.0 mashups Semantic web services Sémantizace webu Úvod 23 Příklad z W3C materiálu Resource Description Framework (RDF) Primer http://www.w3.org/tr/rdf-primer/
Příklad aplikace ručně (Web2.0) lze Sémantizace webu Úvod 24
Příklad aplikace ručně (Web2.0) lze Sémantizace webu Úvod 25
Příklad aplikace ručně (Web2.0) lze Sémantizace webu Úvod 26
Příklad aplikace ručně (Web2.0) lze Sémantizace webu Úvod 27
utomatická integrace možná díky Sémantice Sémantizace webu Úvod 28
Sémantický web (některé) problémy Model, standardy, -ještě automaticky neznamenají, že se budou používat -Ještě neznamenají, že se osvědčí Kdo je early adopter Sémantického webu důvěryhodnost Kdo sehraje roli CERN-u? Kdo to udělá? Postupně? Kdy? proč? Co za to? Unicode Ontologie OWL RDF + RDFSchema důkaz? Logika dotazy XML + jmenné prostory + XMLSchema URI IRI digitální podpis Sémantizace webu Úvod 29
Obsah, plán,... TBL - Sémantický web a Web2.0 spolu zajímavé Naše idea postupné sémantizace Hlavní cíl, zmenšit podíl lidské práce při práci s webem Nejdřív modely SW (standardy W3C) Každý student vize, co by chtěl od strojového webu Laboratoř projekt (doména zajímavá pro studenty) Další rozvoj modelů SW Web Information Extraction základ sémantizace Sémantická anotace webovských zdrojů Uživatelské modely, preference, Sémantizace webu Úvod 30
Obsah, plán,... organizace,... Zápočet vize a projekt Zkouška písemný test Závazné jsou informace na webu předmětu (ne v SIS) Literatura Materiály W3C http://www.w3.org/ P. Hitzler, M. Krötzsch, S. Rudolph, Y. Sure. Semantic Web Grundlagen, Springer 2008 slidy z přednášek z Univerzity Karlsruhe Wikipedia a odkazy z ní Sémantizace webu Úvod 31
Jiná řešení Sémantizace webu Úvod 32 Příklad z W3C materiálu Resource Description Framework (RDF) Primer http://www.w3.org/tr/rdf-primer/
Jiná řešení Sémantizace webu Úvod 33 Příklad z W3C materiálu Resource Description Framework (RDF) Primer http://www.w3.org/tr/rdf-primer/