4IZ440 Propojená data na webu Organizační a kontextový úvod

Podobné dokumenty
4IZ440 Propojená data na webu Organizační a kontextový úvod

4IZ440 Propojená data na webu Organizační úvod

4IZ440 Propojená data na webu Organizační a kontextový úvod

Propojená data na webu (motivační úvod)

4IZ440 Reprezentace a zpracování znalostí na WWW

Sémantický web 10 let poté

Aplikace s odvozováním nad ontologiemi

OpenData.cz. Jan Kučera. Otevřená data v České republice. Otevřené repositáře

Úvod do Informatiky 2006

Datová věda (Data Science) akademický navazující magisterský program

Otevřená data veřejné správy

Znalostní báze pro obor organizace informací a znalostí

Metody tvorby ontologií a sémantický web. Martin Malčík, Rostislav Miarka

Ontologie. Otakar Trunda

Informace pro vědu a výzkum zkušenosti z kurzu ÚK ČVUT pro doktorandy. Věra Pilecká, Ústřední knihovna ČVUT Seminář IVIG,

Management informačních systémů. Název Information systems management Způsob ukončení * přednášek týdně

Informační média a služby

Znalostní báze pro obor organizace informací a znalostí

Znalostní technologie proč a jak?

Obecná teorie systémů

Univerzita Karlova v Praze, Fakulta sociálních věd Institut politologických studií

Úvod do Informatiky. 0 Organizační pokyny k výuce IB000. Organizátor předmětu: Ondrej Moriš Cvičící (online přes IS MU):

D. Chlapek, J. Kučera, M. Nečaský: Principy a technologie otevřených dat a jejich využití v managementu


Kognitivní informatika očima studentů

E-learning v cestovním ruchu. Josef Zelenka

Soulad studijního programu. Aplikovaná informatika

Databázové systémy úvod

Vysoká škola ekonomická v Praze Fakulta managementu v Jindřichově Hradci Opatření děkana Fakulty managementu č. 7/2016

Logika pro sémantický web

Předměty. Algoritmizace a programování Seminář z programování. Verze pro akademický rok 2012/2013. Verze pro akademický rok 2012/2013

Výzvy využívání otevřených dat v ČR

KIG/1GIS2. Geografické informační systémy. rozsah: 2 hod přednáška, 2 hod cvičení způsob ukončení: zápočet + zkouška

P 8109 Obecná teorie a dějiny umění a kultury DĚJINY VÝTVARNÉHO UMĚNÍ

Workshop k terminologickým otázkám organizace znalostí Motivace a hypotézy projektu. Cíl projektu NAKI DF13P01OVV013

Studijní obor doktorského studia Politologie (P0312D20548)

INTLIB. Osnova. Projekt (TA /Inteligentní knihovna) je řešen s finanční podporou TA ČR. ! Legislativní doména

SYLABUS MODUL BUSINESS MODELOVÁNÍ. Doc. RNDr. Vladimír Krajčík, Ph.D.

GISON: ontologická integrace urbanistických datových sad IPR

12PPOK PROJEKTOVÁNÍ POZEMNÍCH KOMUNIKACÍ

RDF a RDF Query. Jakub Nerad 1. prosince Nerad () RDF a RDF Query 1. prosince / 16

Úvod do softwarového inženýrství a týmového vývoje

přednášek domácího nebo zahraničního hosta na pracovišti. Součástí volitelné části studijního plánu je i podíl studenta na pedagogické činnosti

Identifikační karta modulu v. 4. Forma výuky. Doporučený typ studia. Personální zabezpečení (vyplňte ve formátu Příjmení Jméno, bez titulů)

PRŮVODCE STUDIEM PRO PREZENČNÍ FORMU STUDIA MODULU LOGISTIKA A JAKOST

Tvorba DSD a kódovníků pro fiskální data z projektu OpenBudgets.eu

Masterský studijní obor datové & webové inženýrství

Doktorský studijní obor Didaktika literatury. 1 Organizace doktorského studijního oboru Didaktika literatury

SYLABUS BAKALÁŘSKÁ PRÁCE A PRAXE

PRŮVODCE STUDIEM PRO PREZENČNÍ FORMU STUDIA MODULU IT V PODNIKU DÍLČÍ ČÁST PROGRAMOVÁNÍ BUSINESS APLIKACÍ

Od ledna 2015 budou zahájeny kurzy pro veřejnost. Termíny budou upřesněny podle počtu přihlášek.

Klepnutím lze upravit styl předlohy nadpisů.

Studijní program Elektrotechnika a komunikační technologie. prof. Ing. Aleš Prokeš, Ph.D Ústav radioelektroniky FEKT VUT v Brně

CO DĚLAT, ABY BYLA DATA V DOKTORSKÝCH DISERTACÍCH ZNOVU VYUŽITELNÁ PRO VÝZKUM? Joachim Schöpfel Hélène Prost Cécile Malleret

Směrnice děkana 8/2014 Organizace studia v doktorských studijních oborech

Fenomén Open Access INICIATIVY, VÝZNAM, PŘÍNOSY. PhDr. Jindra Planková, Ph.D. Ústav informatiky Slezská univerzita v Opavě

Modelování a simulace: o předmětu. Radek Pelánek

Zásady zpracování vědecké práce

Průvodce studiem modulu pro kombinovanou formu studia. Modul č. 13 UPLATNĚNÍ NA TRHU PRÁCE - dílčí část II Bakalářský seminář + příprava na praxi

DOKTORSKÉ STUDIUM: OBOR OBECNÁ JAZYKOVĚDA

Otevřená data veřejné správy

Podmínky pro přijetí ke studiu v doktorském studijním programu P2301 Strojní inženýrství na Fakultu strojní ZČU v Plzni pro akademický rok 2018/2019

Tvorba DSD a kódovníků pro fiskální data z projektu OpenBudgets.eu Doplněná verze vyznačeno červeně

Doktorské studium na FPH VŠE. Martin Lukeš proděkan pro vědu, výzkum a doktorské studium

Obor EST :: Web UREL :: Bakalářky :: Co dále :: Odborná práce :: Kontakt. ského studia LOVACÍ TECHNIKA EST. Informace o výuce i nevýuce na webu UREL:

Vyhodnocení koncepce rozvoje výzkumné činnosti FIS VŠE za rok 2017

Databázové systémy úvod

Academic Writing na ZČU. Barbora Katolická Univerzitní knihovna ZČU v Plzni , IVIG

Obsah. 1. Co jsou otevřená data 2. Aktivity v oblasti otevřených dat v ČR 3. Přínosy a výzvy využívání otevřených dat v ČR

PC GRAMOTNOST PRO POLITOLOGY

IB013 Logické programování I Hana Rudová. jaro 2011

P 7311 Anglistika-amerikanistika ANGLICKÁ A AMERICKÁ LITERATURA

P 7311 Anglistika-amerikanistika ANGLICKÁ A AMERICKÁ LITERATURA Vstupní požadavky Uchazeč o studium by měl být absolventem magisterského studia

VŠB-TECHNICKÁ UNIVERZITA OSTRAVA EKONOMICKÁ FAKULTA Sokolská třída 33, Ostrava

Pravidla pro organizaci doktorského studia na Institutu mezinárodních studií Fakulty sociálních věd Univerzity Karlovy platná od ZS 2017/2018

MBI a jeho komunita Řízení informatiky v soukromém a veřejném sektoru

Přírodní vědy. Doplňující pedagogické studium - geografie - učitelství pro SŠ a ZŠ

Publikace dat důchodové statistiky v podobě otevřených propojených dat

Seminář ČSSI: Otevřená a propojitelná data

P 7310 Filologie SLOVANSKÉ LITERATURY

ELEKTRONIKA A SDĚLOVACÍ TECHNIKA EST

Jaká data veřejné správy ČR jsou otevřená?

Databázové systémy BIK-DBS

Sociologie (jednooborové studium) N 6703 Sociologie (Platnost akreditace: )

RDF serializace Turtle

P 7310 Filologie TEORIE A DĚJINY LITERATUR ZEMÍ ASIE A AFRIKY

Doktorské studium

5.1.7 Informatika a výpočetní technika. Časové, obsahové a organizační vymezení. ročník hodinová dotace

Studijní program Elektrotechnika a komunikační technologie. prof. Ing. Aleš Prokeš, Ph.D Ústav radioelektroniky FEKT VUT v Brně

Manažerská informatika projektové řízení

VYHLÁŠKA. EkF_VYH_17_011

Václav Matoušek KIV. Umělá inteligence a rozpoznávání. Václav Matoušek / KIV

INŽENÝRSKÁ PEDAGOGIKA A IGIP ENGINEERING PEDAGOGY AND IGIP. Jiří Měřička

BPH_EKOR Ekonomika organizací. podzim 2012

Obecná didaktika úvodem Petr Knecht. SZ7MP_ODI1 St 19:25-20:10 (prezenční st.) SZ7MK_ODI1 Po 18:30-20:10 (kombinované st.)

Modelování a simulace: o předmětu. Radek Pelánek

KITTV PedF UK TÉMATA BAKALÁŘSKÝCH PRACÍ pro školní rok 2010/2011

Ph.D. studium, aneb bez pomoci to nejde. Martina Kosinová (Brno)

InformatikaaVT(1) Cílem předmětu je: Žáci:

Další povinnosti / odb. praxe. Návrh témat prací. Návaznost na další stud. prog.

Transkript:

4IZ440 Propojená data na webu Organizační a kontextový úvod Vyučující: Doc. Ing. Vojtěch Svátek, Dr. Zimní semestr 2017 http://nb.vse.cz/~svatek/rzzw.html

Náplň předmětu Technologie propojených dat (linked data, LD) na (tzv. sémantickém) webu Cílem je naučit se data na sémantickém webu vytvářet a vystavovat, včetně návrhu datových schémat a doménových slovníků extrakce dat, která nativně v RDF nejsou zpracovávat (čistit, transformovat a propojovat) využívat (v jednoduchých aplikacích) Důraz je na aktivní přístup a interakci Když vám něco není jasné nebo připadá divné, ptejte se!

Probíraná témata RDF: jazyk pro reprezentaci propojitelných dat na webu v obecné grafové struktuře SPARQL: dotazovací jazyk pro RDF Datové slovníky (ontologie): popis RDF dat existujícími slovníky, i tvorba nových slovníků Proces zpracování dat ( ETL ) vedoucí k jejich vystavení v RDF: extrakce, transformace (včetně čištění a propojování) a výsledné publikování Využívání RDF dat v softwarových aplikacích Byznys modely podporující využití RDF dat na webu

Co předmět je a není? Nejde o desítky let ustálenou disciplínu, pro kterou by existovaly nepohnutelné osnovy a učebnice (i když dobré knihy a příručky už vyšly!) Obsahem výuky není jedna přesně vymezená technologie (jazyk, metodika, software ) ALE Jde o relativně volné propojení jazykových standardů, softwarových nástrojů, výzkumných projektů a iniciativ Správné odpovědi na mnohé klíčové otázky zatím nikdo na 100% nezná, obor se rok od roku rychle vyvíjí Vzhledem k tomu je u studentů velmi vítána vlastní iniciativa, zvědavost, zkoumání toho, co se nově objevuje jak na akademických konferencích, tak i např. v blogpostech

Zdroje pro studium Základní literatura: kniha: Linked Data: Evolving the Web into a Global Data Space od T. Heatha a C. Bizera, online http://linkeddatabook.com Slidy k přednáškám, budou postupně vystavovány na webu Tutoriál L. Feigenbaum, E. Prud'hommeaux: SPARQL by Example, online http://www.cambridgesemantics.com/semanticuniversity/sparql-by-example Kapitoly z knihy Umělá inteligence 6, Academia (knihovna/studovna/zakoupit?) učební text Aktuální problémy a perspektivy sémantického webu přístupný z webu předmětu Doplňková literatura: Viz web; zvl. B. DuCharme: Learning SPARQL (knihovna/studovna) Specifikace jazyků a formátů (RDF, Turtle, SPARQL), dostupné na webu Tutoriály k nástroji LP-ETL přístupné z https://etl.linkedpipes.com/ Další tutoriály ze Semantic University na http://www.cambridgesemantics.com V případě zájmu mnoho další literatury u vyučujícího, články na WWW a v digitálních knihovnách

Kontrolní testy Teoretické znalosti budou ověřeny třemi písemnými testy (předběžně 13+14+13 = 40 bodů) psaní kódu, grafy, odpovědi volným textem, zaškrtávačky Bodové minimum z každého testu je 5; v jednom testu lze minimum nesplnit bez dalších sankcí V případě nedosažení minima ve dvou testech lze o absolvování předmětu uvažovat jen pokud budou splněny všechny ostatní povinnosti a součet bodů dosáhne 60 následuje ústní přezkoušení, a pokud je úspěšné, student získá známku vyhověl bez ohledu na celkový počet bodů Testy budou zřejmě v 5., 8. a 13. týdnu semestru, a to na přednáškách

Praktické úkoly Zpracovat samostatně semestrální projekt (max. 40 bodů) Průběžná prezentace na posledním cvičení 11.12. ústní, plus odevzdání jednostránkového konceptu Finální odevzdání ve zkouškovém období (termín bude upřesněn) Zpracovat samostatně ústní a písemný minireferát (max. 15 bodů) Ústní prezentace 27.11. nebo 4.12. Z odborného článku z hlavní vědecké konference v oboru - ISWC 2017 (vysoce doporučeno, po dohodě lze i z jiné tematicky vhodné konference, případně časopisu), přístup k článkům bude zajištěn Průběžné úkoly na cvičeních (celkem až 15 bodů), předběžně Převody RDF mezi různými způsoby vyjádření Tvorba dotazů SPARQL na různých úrovních náročnosti (dotazování, kontrola a transformace dat, propojování ) a pro různé typy dat Návrh jednoduchého datového slovníku Týmová případová studie zahrnující extrakci, čištění, propojení a využití (v primitivní aplikaci) fiskálních dat

Dimenze uvažování o tématu Životní cyklus LD zdrojová data RDF schémata a slovníky ETL dotazování pomocí SPARQL využití v aplikaci Věcné domény dat encyklopedická; statisticko-ekonomická (jiné: biomedicína, knihovnictví, produkty/služby ) Myšlenková prostředí Věda: výzkumné projekty, experimenty a publikace Inženýrství: reprezentační jazyky a SW nástroje Byznys: modely výnosů a nákladů

A k čemu Vám to dále může být? Pro studenty bezprostředně směřující do praxe Nový pohled na techniky, které se v praxi běžně využívají (integrace datových zdrojů, grafové DB, správa metadat, podnikové taxonomie, webová API, textová a webová analytika, architektury orientované na služby, konceptuální modelování, ) Připravenost na novinky, které do praxe zřejmě proniknou v příštích 5-10 letech Pro studenty se zájmem o prozkoumávání neprozkoumaného Přehled významné části výzkumných témat, která jsou na KIZI řešena a mohou být předmětem doktorských disertací, ale i diplomových prací

Tým vyučujících Doc. Ing. Vojtěch Svátek, Dr.: většina přednášek i cvičení Ing. Jakub Klímek, Ph.D. (FIT ČVUT, MFF UK): technologie ETL pro RDF přednáška i cvičení Ing. Jan Kučera, Ph.D. (KIT VŠE): případová studie ETL pro RDF (ČSSZ) - přednáška Ing. Marek Dudáš: tvorba slovníků pro RDF; využití RDF dat v aplikaci oboje cvičení Ing. Václav Zeman: ETL pro encyklopedická data cvičení Mgr. Jindřich Mynarz: konzultační podpora ohledně jazyka SPARQL a technologií propojených dat obecně

Související předměty 5FI430 Znalosti a ontologické inženýrství M. Vacura, KFIL, povinný pro KI Problematika ontologických modelů jako bohatší varianty datových slovníků formální odvozování nad koncepty, filozofické ukotvení atd. 4IZ470 Dolování znalostí z webu V. Svátek, povinný pro ZWT (zpravidla již absolvovali ) Součástí web miningu je extrakce informací z webových textů komplementární k převodu již strukturovaných dat do RDF 4IZ530 Logické programování Š. Sem, oborově volitelný pro ZWT a KI Programování v jazyce Prolog; má řadu společných rysů s psaním dotazů ve SPARQL, lze v něm psát sémantické aplikace

Pro hlubší zájemce Pracovní skupina KIZI SWOE Semantic web and ontological engineering, viz http://kizi.vse.cz/swoe účastní se i studenti Neformální výzkumný seminář KEG Knowledge Engineering Group některé (1./2.) čtvrtky v semestru od 16 hodin zpravidla na 473NB (zasedačka FIS) možno přijít bez předchozího přihlášení viz http://keg.vse.cz/seminars kdo chcete dostávat oznámení, napište! Aktivity mezi-institucionální iniciativy OpenData.cz: http://opendata.cz vč. společného týmu KIT a KIZI, http://opendata.vse.cz/ weeding the semantic web garden