Propojená data na webu (motivační úvod)

Podobné dokumenty
4IZ440 Propojená data na webu Organizační a kontextový úvod

4IZ440 Propojená data na webu Organizační a kontextový úvod

4IZ440 Propojená data na webu Organizační a kontextový úvod

4IZ440 Propojená data na webu Organizační úvod

Sémantický web 10 let poté

4IZ440 Reprezentace a zpracování znalostí na WWW

Metody tvorby ontologií a sémantický web. Martin Malčík, Rostislav Miarka

Otevřená data veřejné správy

Ontologie. Otakar Trunda

Otevřená data veřejné správy

Datová věda (Data Science) akademický navazující magisterský program

OpenData.cz. Jan Kučera. Otevřená data v České republice. Otevřené repositáře

Kognitivní informatika očima studentů

Znalostní báze pro obor organizace informací a znalostí

Přepoužívání ontologických modelů na sémantickém webu

Soulad studijního programu. Aplikovaná informatika

Znalostní technologie proč a jak?

Znalostní báze pro obor organizace informací a znalostí

Ekonomické aspekty propojitelných dat. Jan Kučera Katedra informačních technologií

Logika pro sémantický web

Masterský studijní obor datové & webové inženýrství

Aplikace s odvozováním nad ontologiemi

GISON: ontologická integrace urbanistických datových sad IPR

Informatika na Univerzitě Palackého

D. Chlapek, J. Kučera, M. Nečaský: Principy a technologie otevřených dat a jejich využití v managementu


Obsah. 1. Co jsou otevřená data 2. Aktivity v oblasti otevřených dat v ČR 3. Přínosy a výzvy využívání otevřených dat v ČR

Vysoká škola ekonomická v Praze Fakulta managementu v Jindřichově Hradci Opatření děkana Fakulty managementu č. 7/2016

Jaká data veřejné správy ČR jsou otevřená?

Informace pro vědu a výzkum zkušenosti z kurzu ÚK ČVUT pro doktorandy. Věra Pilecká, Ústřední knihovna ČVUT Seminář IVIG,

Web 2.0 vs. sémantický web

bakalářském a magisterském stupni VŠ vzdělání

Aplikovaná informatika

Specializace Kognitivní informatika

Znalostní systém nad ontologií ve formátu Topic Maps


Sémantický web a extrakce

Linked Data a jazyk RDF

Klasické metodiky softwarového inženýrství I N G M A R T I N M O L H A N E C, C S C. Y 1 3 A N W

SíťIT: Portál na podporu sociální sítě informatiků v ČR

Studijní obor doktorského studia Politologie (P0312D20548)

MBI a jeho komunita Řízení informatiky v soukromém a veřejném sektoru

Prohloubení spolupráce VŠ v oblasti řízení kvality technického vzdělávání dle potřeb společnosti a znalostní ekonomiky

Workshop k terminologickým otázkám organizace znalostí Motivace a hypotézy projektu. Cíl projektu NAKI DF13P01OVV013

Portál IT komunity v ČR Kamil Matoušek, Jiří Kubalík ČVUT Praha

Seminář ČSSI: Otevřená a propojitelná data

Tvorba DSD a kódovníků pro fiskální data z projektu OpenBudgets.eu Doplněná verze vyznačeno červeně

Výměnný formát XML DTM DMVS PK

Quo vadis, vyhledávání (na webu)?

Šedá literatura jako zdroj odborných informací

Od relačních databází k technologiím sémantickému webu

XML jako prostředek pro citování informačních zdrojů

AKLUALIZOVANÝ DLOUHODOBÝ ZÁMĚR VZDĚLÁVACÍ A VĚDECKÉ, VÝZKUMNÉ, VÝVOJOVÉ, INOVAČNÍ A DALŠÍ TVŮRČÍ ČINNOSTI ČVUT V PRAZE, FAKULTY DOPRAVNÍ PRO ROK 2016

Modely a sémantika. Petr Šaloun VŠB-Technická univerzita Ostrava FEI, katedra informatiky

Problematika transferu technologií ve výuce a praxi Zajištění vzdělávání v oblasti transferu technologií v rámci výuky na LF v Plzni

INTLIB. Osnova. Projekt (TA /Inteligentní knihovna) je řešen s finanční podporou TA ČR. ! Legislativní doména

Otevřená data ČSSZ: Přehledné informace dostupné všem, snadno a zdarma. Ing. Jiří Šunka Ing. Michaela Hendrychová. ISSS Hradec Králové, 5. 4.

Zápatí prezentace 1

Uživatelská podpora v prostředí WWW

Ing. Miloš Maryška, Ph.D. Seminář VŠE, ČSSI a ICT UNIE

Soulad studijního programu. Ochrana a tvorba krajiny. Biologie, ekologie a životní prostředí

Vilém Sklenák Inforum2009,

Jakub Klímek Zlín

Doktorský studijní obor Didaktika literatury. 1 Organizace doktorského studijního oboru Didaktika literatury

Fenomén Open Access INICIATIVY, VÝZNAM, PŘÍNOSY. PhDr. Jindra Planková, Ph.D. Ústav informatiky Slezská univerzita v Opavě

Automatizovatelná aktualizace Wikidata z veřejných databází. Jakub Klímek

Č. j.: TF/5/14 V Praze dne

Seminář pro vedoucí knihoven asviústavů AV ČR ASEP

RDF serializace Turtle

Studijní program je těsně vázán na vědeckou činnost Katedry experimentální fyziky PřF UP či praxí Forma studia

Směrnice děkana 8/2014 Organizace studia v doktorských studijních oborech

Výzvy využívání otevřených dat v ČR

Bakalářský studijní obor informatika

Tvorba DSD a kódovníků pro fiskální data z projektu OpenBudgets.eu

IT Cluster cesta ke spolupráci Jak sjednotit akademickou a firemní sféru?! Ivo Vondrák, rektor

současný neformální mluvený jazyk (komunikace v rodině nebo mezi přáteli), včetně propojení přepisu se zvukem;

Bc Doktorský studijní program (obor) a témata disertačních prací Vysoká škola

Institucionální rozvojový plán

PROJEKT CEINVE NA MASARYKOVĚ CESTA K AKADEMICKÝM KOMPETENCÍM DOKTORANDŮ. Mgr. Pavlína Mazáčová, Ph.D. Filozofická fakulta Masarykovy univerzity

Business Intelligence

Informační média a služby

Metodika publikace otevřených a propojitelných dat

Další povinnosti / odb. praxe. Návrh témat prací. Návaznost na další stud. prog.

Doktorské studium na FPH VŠE. Martin Lukeš proděkan pro vědu, výzkum a doktorské studium

Obsah Poslání Ekonomické fakulty Priority Ekonomické fakulty Vzdělávání a pedagogická činnost... 2

AKTUALIZACE DLOUHODOBÉHO ZÁMĚRU

Podpora výzkumu a inovací Horizont 2020 Úloha kanceláře CZELO

Vymezení pracovních činností akademických a vědeckých pracovníků. vědeckých pracovníků

bibliografických dat - Má MARC

Cíle a metodika průzkumu

Partnerství znalostního transferu

Otevřená a propojitelná data

VYHLÁŠKA. EkF_VYH_18_004. ZÁSADY pro aktualizaci studijních plánů pro akademický rok 2018/2019

Linked Data a jazyk RDF

Přidružené publikace v České republice

Grey Literature ve světě

Plán realizace Strategického záměru Pedagogické fakulty Ostravské univerzity na rok 2017

DOKTORSKÉ STUDIUM: OBOR OBECNÁ JAZYKOVĚDA

Otevřená data. Shrnutí. Když stavím nový IS nebo upravuji existující, co musím udělat, abych byl Open Data Ready? Prosinec 2018

Výuka práv duševního vlastnictví na Univerzitě Karlově v Praze

Transkript:

Propojená data na webu (motivační úvod) prof. Ing. Vojtěch Svátek, Dr. Katedra informačního a znalostního inženýrství ZS 2018

Propojená data na webu Jeden z frekventovaných termínů, které označují téměř totéž, např. v angličtině: Linked (open?) data (on the web) Web of data Web of entities Semantic web Semantic technology Semantics

Běžný vs. sémantický web

Běžný vs. sémantický web Běžný web složený z dokumentů určených pro lidské uživatele dokumenty jsou propojeny netypovanými odkazy

Běžný vs. sémantický web Běžný web složený z dokumentů určených pro lidské uživatele dokumenty jsou propojeny netypovanými odkazy požadavek HTTP jde na server, ten vrací dokument HTTP URL

Běžný vs. sémantický web Běžný web složený z dokumentů určených pro lidské uživatele dokumenty jsou propojeny netypovanými odkazy požadavek HTTP jde na server, ten vrací dokument HTTP URL

Běžný vs. sémantický web Idea sémantického webu (T. Berners Lee)

Běžný vs. sémantický web Idea sémantického webu (T. Berners Lee) propojit nejen dokumenty, ale i strukturovaná data

Běžný vs. sémantický web Idea sémantického webu (T. Berners Lee) propojit nejen dokumenty, ale i strukturovaná data opatřit data strojově čitelným významem

Běžný vs. sémantický web Idea sémantického webu (T. Berners Lee) propojit nejen dokumenty, ale i strukturovaná data opatřit data strojově čitelným významem propojit je typovanými odkazy

Běžný vs. sémantický web Idea sémantického webu (T. Berners Lee) propojit nejen dokumenty, ale i strukturovaná data opatřit data strojově čitelným významem propojit je typovanými odkazy požadavek HTTP bude vracet množinu dat

Běžný vs. sémantický web Idea sémantického webu (T. Berners Lee) propojit nejen dokumenty, ale i strukturovaná data opatřit data strojově čitelným významem propojit je typovanými odkazy požadavek HTTP bude vracet množinu dat HTTP IRI

Běžný vs. sémantický web Idea sémantického webu (T. Berners Lee) propojit nejen dokumenty, ale i strukturovaná data opatřit data strojově čitelným významem propojit je typovanými odkazy požadavek HTTP bude vracet množinu dat HTTP IRI

Běžný vs. sémantický web Idea sémantického webu (T. Berners Lee) propojit nejen dokumenty, ale i strukturovaná data opatřit data strojově čitelným významem propojit je typovanými odkazy požadavek HTTP bude vracet množinu dat HTTP IRI

Strojově čitelný význam HTTP IRI

Strojově čitelný význam

Strojově čitelný význam Veřejná zakázka Firma Produkt Osoba

Strojově čitelný význam Veřejná zakázka Firma získala vyrábí je předmětem Produkt má vlastníka Osoba

Strojově čitelný význam Veřejná zakázka Firma získala je předmětem má vlastníka vyrábí Produkt Identifikátory, ne (jen) textové názvy Osoba

Cíl předmětu Naučit se data na sémantickém webu vytvářet a vystavovat, včetně návrhu datových schémat a doménových slovníků extrakce dat, která nativně v RDF nejsou zpracovávat (čistit, transformovat a propojovat) využívat (v jednoduchých aplikacích)

Probíraná témata RDF: jazyk pro reprezentaci propojitelných dat na webu v obecné grafové struktuře SPARQL: dotazovací jazyk pro RDF Datové slovníky (ontologie): popis významu RDF dat existujícími slovníky, i tvorba nových slovníků Proces zpracování dat ( ETL ) vedoucí k jejich vystavení v RDF: extrakce, transformace (včetně čištění a propojování) a výsledné publikování Využívání RDF dat v softwarových aplikacích Byznys modely podporující využití RDF dat na webu

Dimenze uvažování o tématu Životní cyklus dat zdrojová data RDF schémata a slovníky ETL dotazování pomocí SPARQL využití v aplikaci Věcné domény dat encyklopedická; statisticko-ekonomická (jiné: biomedicína, knihovnictví, produkty/služby ) Myšlenková prostředí Věda: výzkumné projekty, experimenty a publikace Inženýrství: reprezentační jazyky a SW nástroje Byznys: modely výnosů a nákladů

Co předmět je a není? Nejde o desítky let ustálenou disciplínu, pro kterou by existovaly nepohnutelné osnovy (i když dobré knihy a příručky už vyšly!) Obsahem výuky není jedna přesně vymezená technologie (jazyk, metodika, software ) ALE Jde o relativně volné propojení jazykových standardů, softwarových nástrojů, výzkumných projektů a iniciativ Správné odpovědi na mnohé klíčové otázky zatím nikdo na 100% nezná, obor se rok od roku rychle vyvíjí metafora lesní školky něco vyroste, něco padne a pohnojí Vzhledem k tomu je u studentů velmi vítána vlastní iniciativa, zvědavost, zkoumání toho, co se nově objevuje jak na akademických konferencích, tak i např. v blogpostech

Prof. Anja Feldmann Pražský informatický seminář, 27.4.2017 The Internet: A fascinating (research) object Témata přednášky: detekce výpadků sítě, predikce výkonu distribuovaných systémů, apod.

Prof. Anja Feldmann Pražský informatický seminář, 27.4.2017 The Internet: A fascinating (research) object Témata přednášky: detekce výpadků sítě, predikce výkonu distribuovaných systémů, apod. Internet, ale i web jako jeho nejviditelnější součást, jsou fascinujícími tématy výzkumu.

Prof. Anja Feldmann Pražský informatický seminář, 27.4.2017 The Internet: A fascinating (research) object Témata přednášky: detekce výpadků sítě, predikce výkonu distribuovaných systémů, apod. Internet, ale i web jako jeho nejviditelnější součást, jsou fascinujícími tématy výzkumu. Neplatí to ještě více o spojení internetu/webu s možností předávat si přes něj strukturovaná data s popsaným významem?

27 Možnosti uplatnění Univerzity Dělá se v nějaké podobě skoro na všech Veřejná správa Otevírání datových zdrojů státní správy, měst a obcí Výzkumná centra zahraničních korporací 2 noví part-time doktorandi KIZI pro tuto oblast SW startupy domácí, ale zejména zahraniční práce na dálku - Praha je kompetenčním centrem pro PDW Běžné (velké) firmy Ano search engines, business info; pharma, automotive, Ne banky nebo SW firmy - spíš mainstream technologie

28 PDW, přednášející a katedra PDW spadá do tématiky pracovní skupiny SWOE ( Semantic Web and Ontological Engineering ) Jedna z pracovních skupin KIZI, viz https://kizi.vse.cz/english/research-groups/ Vedoucí V. Svátek a O. Zamazal Skupina zaměřená primárně vědecky spíše sekundárně na spolupráci s praxí a na (magisterskou) výuku; PDW je jediný takto zaměřený předmět povinný pro ZWT

PDW, přednášející a katedra SWOE v kontextu ostatních pracovních skupin Využití webu jako platformy pro sdílení dat viz webové inženýrství - skupina WELT Využití strojového odvozování viz umělá inteligence - skupina IIS Příprava vysokých (sémanticky popsaných) a širokých (propojených) dat pro analytické využití viz data mining/science - skupina DMKD Tj. skupina do značné míry průniková, lze propojit s kteroukoli z ostatních

PDW, přednášející a katedra SWOE v kontextu ostatních pracovních skupin Využití webu jako platformy pro sdílení dat viz webové inženýrství - skupina WELT Využití strojového odvozování viz umělá inteligence - skupina IIS Příprava vysokých (sémanticky popsaných) a širokých (propojených) dat pro analytické využití viz data mining/science - skupina DMKD Kdo je tady spíš webový vývojář, nadšenec do AI, nebo datový analytik?

PDW, přednášející a katedra (Jen na okraj ) hlavní oblasti odborného zájmu přednášejícího Ontologické inženýrství úzká nika, v ČR převážně jen akademický výzkum skupina SWOE zde patří k širší světové špičce oboru Publikování a využívání propojených dat i v ČR už řadu let populární téma, zvl. ve veřejné správě zapojení do projektů EU, hlavní zdroj financování skupiny hlavní téma předmětu 4iz440 Data mining (historicky mj. DP a DisP) Business informatika ( zainteresovaný laik ) plyne z pozice garanta doktorského oboru sledování témat doktorandů všech 4 informatických kateder hledání prostoru pro vědecká témata v této oblasti

Související předměty 5FI430 Znalosti a ontologické inženýrství M. Vacura, KFIL, povinný pro KI Problematika ontologických modelů jako bohatší varianty datových slovníků formální odvozování nad koncepty, filozofické ukotvení atd. 4IZ470 Dolování znalostí z webu V. Svátek, povinný pro ZWT (zpravidla již absolvovali ) Součástí web miningu je extrakce informací z webových textů komplementární k převodu již strukturovaných dat do RDF 4IZ530 Logické programování Š. Sem, oborově volitelný pro ZWT a KI Programování v jazyce Prolog; má řadu společných rysů s psaním dotazů ve SPARQL, lze v něm psát sémantické aplikace

Pro hlubší zájemce Pracovní skupina KIZI SWOE účastní se i studenti, zvl. v rámci DP Neformální výzkumný seminář KEG Knowledge Engineering Group některé (1./2.) čtvrtky v semestru od 16 hodin zpravidla na 473NB (zasedačka FIS) možno přijít bez předchozího přihlášení viz http://keg.vse.cz/seminars kdo chcete dostávat oznámení, napište! Aktivity mezi-institucionální iniciativy OpenData.cz: http://opendata.cz vč. společného týmu KIT a KIZI, http://opendata.vse.cz/ weeding the semantic web garden

Příklady zajímavých DP na SWOE Řízení kvality otevřených dat veřejné správy ETL a využívání OD města Děčín Zpřístupnění dat o VŠ kvalifikačních pracech z NUŠL v podobě LD Ontologie přístupnosti budov pro handicapované Modeling Events on the Semantic Web Využití propojených dat na webu ke tvorbě strategické znalostní hry