Automatizovaný návrh pravidel pro integraci dat a sémantický web

Podobné dokumenty
Automatizovaný návrh pravidel pro integraci dat a sémantický web

2


Pro každé formule α, β, γ, δ platí: Pro každé formule α, β, γ platí: Poznámka: Platí právě tehdy, když je tautologie.


Matematická logika. Rostislav Horčík. horcik

Teorie her pro FJFI ČVUT řešené úlohy

Matematická logika. Miroslav Kolařík

Doktorandské dny 07. Ústav informatiky. v.v.i. vydavatelství Matematicko-fyzikální fakulty University Karlovy v Praze


Centralizované a decentralizované hodnocení kvality webových zdrojů

Stavební fakulta Katedra mechaniky. Jaroslav Kruis, Petr Štemberk

Interpolace, ortogonální polynomy, Gaussova kvadratura

(2) [B] Nechť G je konečná grupa tvořena celočíselnými maticemi roměru 2 2 s operací násobení. Nalezněte všechny takové grupy až na izomorfizmus.

Proseminář z matematiky pro fyziky

DATABÁZOVÉ SYSTÉMY. Metodický list č. 1

Kvantová mechanika ve 40 minutách

ELIMINACE VLIVU DRUHÉ ROTACE PŘI AFINNĚ INVARIANTNÍM 2D ROZPOZNÁVÁNÍ

LWS při heteroskedasticitě

Úvod do informatiky. Miroslav Kolařík

R β α. Obrázek 1: Zadání - profil složený ze třech elementárních obrazců: 1 - rovnoramenný pravoúhlý trojúhelník, 2 - čtverec, 3 - kruhová díra

InternetovéTechnologie

A Metodologie návrhu ERD (Batini, Ceri, Navathe)

Úvod do kvantového počítání


terminologie předchozí kapitoly: (ϕ, Ω) - plocha, S - geometrický obraz plochy

A Metodologie návrhu ERD (Batini, Ceri, Navathe)

MBI - technologická realizace modelu

Matematická logika. Lekce 1: Motivace a seznámení s klasickou výrokovou logikou. Petr Cintula. Ústav informatiky Akademie věd České republiky

InternetovéTechnologie


Transformace obrazu Josef Pelikán KSVI MFF UK Praha

Operace s maticemi

Robustní odhady kovarianční matice

Automatizované řešení úloh s omezeními

KLASICKÁ MECHANIKA. Předmětem mechaniky matematický popis mechanického pohybu v prostoru a v čase a jeho příčiny.

Obr. 0.1: Nosník se spojitým zatížením.

Operátory a maticové elementy

9. Vícerozměrná integrace

1. Řešená konstrukce Statické řešení Výpočet průhybové čáry Dynamika Vlastní netlumené kmitání...

Osové a deviační momenty setrvačnosti ploch (opakování ze 4. cvičení) Momenty setrvačnosti k otočeným osám Kroucení kruhových a mezikruhových průřezů

Tvorba informačních systémů

PLASTICITA A CREEP PLASTICITA V

Báze konečněrozměrných vektorových prostorů, lineární zobrazení vektorových prostorů

Příklady k přednášce 8 - Geometrické místo kořenů aneb Root Locus

4. Napjatost v bodě tělesa

Obsah. Úvod 9 Poděkování 10 Co je obsahem této knihy 10 Pro koho je tato kniha určena 11 Zpětná vazba od čtenářů 11 Errata 11

2. Modelovací jazyk UML 2.1 Struktura UML Diagram tříd Asociace OCL. 3. Smalltalk 3.1 Jazyk Pojmenování


Výroková a predikátová logika - X

Národní informační středisko pro podporu kvality

Výroková logika syntaxe a sémantika

Elektromagnetické pole je generováno elektrickými náboji a jejich pohybem. Je-li zdroj charakterizován nábojovou hustotou ( r r

TEORIE ZPRACOVÁNÍ DAT


Dynamické rozvrhování

InternetovéTechnologie

Variační počet 2. Prof. RNDr. Olga Krupková, DrSc. Autorizovaný zápis přednášek (letní semestr 2004/2005) Zapsal Jan Šustek

Analýza napjatosti PLASTICITA

Úvod do teorie grafů

Michal Krátký. Tvorba informačních systémů, 2008/2009. Katedra informatiky VŠB Technická univerzita Ostrava. Tvorba informačních systémů

Variační počet 2. Prof. RNDr. Olga Krupková, DrSc. Obsahuje 1413 hypertextových odkazů. Autorizovaný zápis přednášek (letní semestr 2004/2005)

Modelové výpočty na H 2 a HeH +

Nosné desky. 1. Kirchhoffova teorie ohybu tenkých desek (h/l < 1/10) 3. Mindlinova teorie pro tlusté desky (h/l < 1/5)

Kybernetika. Wiener 1948: Rok 2000:

Dnešní látka: Literatura: Kapitoly 3 a 4 ze skript Karel Rektorys: Matematika 43, ČVUT, Praha, Text přednášky na webové stránce přednášejícího.

/1: Teoretická informatika(ti) přednáška 4

Primitivní funkce a Riemann uv integrál Lineární algebra Taylor uv polynom Extrémy funkcí více prom ˇenných Matematika III Matematika III Program

Literatura: Kapitoly 3, 4 a 2 d) ze skript Karel Rektorys: Matematika 43, ČVUT, Praha, Text přednášky na webové stránce přednášejícího.

U1, U2 vnější napětí dvojbranu I1, I2 vnější proudy dvojbranu

AVDAT Vektory a matice

Úvod do parciálních diferenciálních rovnic. 2 Kanonický tvar lineárních PDR 2. řádu pro funkce

Syntetická geometrie I

13. Lineární programování

ELEKTRONICKÝ PODPIS V PODNIKOVÝCH APLIKACÍCH. Tomáš Vaněk ICT Security Consultant

Mezoúrovňové modelování železničního štěrku pomocí kulovitých a polyhedrálních

Automaty a gramatiky(bi-aag) Formální překlady. 5. Překladové konečné automaty. h(ε) = ε, h(xa) = h(x)h(a), x, x T, a T.

Charakterizace rozdělení

Lineární algebra : Násobení matic a inverzní matice

Regulární výrazy. Definice Množina regulárních výrazů nad abecedou Σ, označovaná RE(Σ), je definována induktivně takto:

Projekční algoritmus. Urychlení evolučních algoritmů pomocí regresních stromů a jejich zobecnění. Jan Klíma

Optimalizace & soft omezení: algoritmy

TSO NEBO A INVARIANTNÍ ROZPOZNÁVACÍ SYSTÉMY

Správa VF XML DTM DMVS Datový model a ontologický popis

Ab initio výpočty v chemii a biochemii

Četba: Texty o lineární algebře (odkazy na webových stránkách přednášejícího).

Syntetická geometrie I

Lineární algebra : Metrická geometrie

Úvod do dobývání. znalostí z databází

Rovinná úloha v MKP. (mohou být i jejich derivace!): rovinná napjatost a r. deformace (stěny,... ): u, v. prostorové úlohy: u, v, w

Nelineární optimalizace a numerické metody (MI NON)

DODATEČNÉ INFORMACE K ZADÁVACÍM PODMÍNKÁM Č. 4

Mul$determinantální metody: CASSCF

Lineární algebra : Násobení matic a inverzní matice

9. Vícerozměrná integrace

III. MKP vlastní kmitání

22 Základní vlastnosti distribucí

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Literatura: Text o lineární algebře na webových stránkách přednášejícího (pro opakování). Kapitoly 4 a 5 ze skript Ondřej Zindulka: Matematika 3,

Princip rozšíření a operace s fuzzy čísly

Transkript:

Automatizovaný návrh pravidel pro integraci dat a sémantický web Zdeňka Linková, Martin Řimnáč Ústav informatiky AV ČR, v.v.i. Znalosti 008 Bratislava 1.-15.0. 008

1 Motivace Integrace dat pomocí pohledů Automatická integrace dat Formalismus pro datový zdroj Využití měr Závěr

Integrace dat Motivace Integrace dat pomocí pohledů Automatická integrace dat Formalismus pro datový zdroj Web jako studnice dat mnoho zdrojů(stále progresivně rostoucí) (částečně) redundantní popis Integrace dat umožňuje data z lokálních zdrojů prezentovat pomocí jednoho zdroje matrializovaně virtuálně- pomocí pohledů Mediační systémy

Integrace dat pomocí pohledů Integrace dat pomocí pohledů Automatická integrace dat Formalismus pro datový zdroj Úlohy v procesu integrace dat: schema matching schema mapping: LAV(Local As View) GAV(Global As View) GLAV(Global Local As View) zpracování dotazů: query rewriting

Automatická integrace dat Integrace dat pomocí pohledů Automatická integrace dat Formalismus pro datový zdroj 1 Manuální návrh integrace dat návrh pravidel- človek na základě své intrepretace schématů prácesmnohadaty možnost omylu, důvěryhodnost třetích stran (Semi)automatický návrh pravidel na základě dat návrh kandidátů jako(ohodnocené) doporučení pro návrháře jako nejlepší možný odhad ohodnocení kandidátů- kosinové fuzzy míry lexikální analýza strukturální analýza...

Formalismus- datový zdroj Integrace dat pomocí pohledů Automatická integrace dat Formalismus pro datový zdroj Formalismus binárních matic 1 Matice úložiště { 1 pokudei e Φ=[φ ij ], φ ij = j I 0 jinak Matice funkčních závislostí { 1 pokudai A Ω=[ω ij ], ω ij = j F 0 jinak Vztah(transformace) Ω= T Φ Φ =Φ Ω T pomocí matice aktivních domén atributů { 1 pokudei =(A =[δ ij ], δ ij = j,v ) E 0 jinak

Příklad Motivace Integrace dat pomocí pohledů Automatická integrace dat Formalismus pro datový zdroj Φ= Ω= 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0 1 0 0 0 0 1 1 0 1 0 0 1 1 0 1 0 1 0 0 0 1 0 1 0 1 1 0 0 1 1 0 1 1 1 Město Stát Měna Město, Praha Město, Košice Město, Bratislava Stát, ČR Stát, Slovensko Měna, CZK Měna, SSK y=φ x

Virtuální globální matice úložiště Centralizovaně Φ S = Γ Sl Φ Sl Γ T S l S l S Γ Sl..mediátorelementůmeziΦ Sl aφ S

Virtuální globální matice úložiště Centralizovaně Φ S = S l S Γ Sl Φ Sl Γ T S l Γ Sl..mediátorelementůmeziΦ Sl aφ S Decentralizovaně Φ S = 6 4 Φ 1 Ψ 1 Ψ 1 S Ψ 1 Φ Ψ S.... Ψ S 1 Φ S 7 5 Ψ ij..mediátorelementůmeziφ Si aφ Sj

Virtuální globální matice úložiště Centralizovaně Φ S = S l S Γ Sl Φ Sl Γ T S l Γ Sl..mediátorelementůmeziΦ Sl aφ S Decentralizovaně Φ S = 6 4 Φ 1 Ψ 1 Ψ 1 S Ψ 1 Φ Ψ S.... Ψ S 1 Φ S 7 5 Ψ ij..mediátorelementůmeziφ Si aφ Sj Ψ ij =Γ T S i Γ Sj

na úrovni elementů 1 Binární Ψ kl =[ψ kl ij];ψ kl ij = { 1 pokudei zs l odpovídáe j zs k 0 jinak

na úrovni elementů 1 Binární Ψ kl =[ψ kl ij];ψ kl ij = Vážené Ψ kl =[ψij kl ];ψkl ij = { 1 pokudei zs l odpovídáe j zs k 0 jinak µ E (e i,e j ) pokude i zs l odpovídáe j zs k sjistotou µ E (e i,e j ) 0 jinak

na úrovni elementů 1 Binární Ψ kl =[ψ kl ij];ψ kl ij = Vážené Ψ kl =[ψij kl ];ψkl ij = { 1 pokudei zs l odpovídáe j zs k 0 jinak µ E (e i,e j ) pokude i zs l odpovídáe j zs k sjistotou µ E (e i,e j ) 0 jinak Triviální návrh mapování { Ψ kl=[ψij]; ψij kl 1 pokudei =(A = I,v) e j =(A J,v) 0 jinak

na úrovni atributů 1 Binární Π kl =[π kl ij];π kl ij = { 1 pokudai zs l odpovídáa j zs k 0 jinak

na úrovni atributů 1 Binární Π kl =[π kl ij];π kl ij = { 1 pokudai zs l odpovídáa j zs k 0 jinak Vážené Π kl =[πij];π kl ij kl = µ A (e i,e j ) pokuda i zs l odpovídáa j zs k sjistotou µ A (e i,e j ) 0 jinak

na úrovni atributů 1 Binární Π kl =[π kl ij];π kl ij = { 1 pokudai zs l odpovídáa j zs k 0 jinak Vážené Π kl =[πij];π kl ij kl = atributů versus elementů µ A (e i,e j ) pokuda i zs l odpovídáa j zs k sjistotou µ A (e i,e j ) 0 jinak Ψ kl =Ψ kl S l Π kl T S k Π kl = T S l Ψ kl Sk

Cosinové míry- Předpoklad: podobné atributy budou mít podobné(aktivní) domény Cosinová míra: π ij = DS k α (A i) D S l α (A j) D S k α(a i ) D S l α(a j )

Cosinové míry- Předpoklad: podobné atributy budou mít podobné(aktivní) domény Cosinová míra: π ij = DS k α (A i) D S l α (A j) D S k α(a i ) D S l α(a j ) Symetrie ekvivalence Π kl =Π T lk

Výběr kadidátů Motivace Φ 1 = 6 4 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0 1 0 0 0 0 1 1 0 1 0 0 1 1 0 1 0 1 0 0 0 1 0 1 0 1 7 5 město, Praha město, Košice město, Bratislava stát, ČR stát, Slovensko měna, CZK měna, SSK Mediátor: ˆΠ 1 = 0 1 0 0 0 Φ = 6 4 1 0 1 0 0 1 0 1 1 0 1 0 0 1 0 1 7 5 země, Česká republika země, Slovensko hlavní město, Praha hlavní město, Bratislava preference pravidel s maximální podporou A i A j µ A (A i,a j ) hlavní město město 1 země stát

Cosinové míry- Cosinová míra: π ij = DS k α(a i ) D S l α(a j ) D S k α(a i )

Cosinové míry- Cosinová míra: π ij = DS k α(a i ) D S l α(a j ) D S k α(a i ) není symetrické

Cosinové míry- Cosinová míra: π ij = DS k α(a i ) D S l α(a j ) D S k α(a i ) není symetrické vyjma kombinací pravidel vedoucích na cykly: A j A k A i :A i,a i A l,a k A k

Cosinové míry- Cosinová míra: π ij = DS k α(a i ) D S l α(a j ) D S k α(a i ) není symetrické vyjma kombinací pravidel vedoucích na cykly: A j A k A i :A i,a i A l,a k A k Pro kombinaci ekvivalence a hierarchie- preference σij = πij kl πji lk σij = πij kl (1 πji lk )

Výběr kadidátů Motivace Φ 1 = 6 4 Φ = 6 4 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0 1 0 0 0 0 1 1 0 1 0 0 1 1 0 1 0 1 0 0 0 1 0 1 0 1 1 0 1 0 0 1 0 1 1 0 1 0 0 1 0 1 7 5 7 5 město, Praha město, Košice město, Bratislava stát, ČR stát, Slovensko měna, CZK měna, SSK země, Česká republika země, Slovensko hlavní město, Praha hlavní město, Bratislava Hierarchie: preference pravidel s maximální podporou Π 1 = 0 1 0 0 0 Π 1 = [ 0 1 z :hlavníměsto z 1 :město z :hlavníměsto z 1 :město 9 z :stát z 1 :země 1 4 z :stát z 1 :země 1 4 z 1 :země z :stát 1 4 z 1 :město z :hlavníměsto 1 9 0 0 0 ]

Využití měr Závěr Použití měr- dotaz- ekvivalence Dotaz na Prahu 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 1 1 0 1 0 0 0 1 0 0 Φ S = 1 1 0 1 0 1 0 0 0 0 0 0 0 1 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 1 6 0 0 0 1 0 1 4 7 0 0 0 0 0 0 1 0 1 0 5 0 0 0 0 0 0 0 1 0 1 x 0 = [1 0 0 0 0 0 0 0 0 1 0] x 1 = [1 0 0 1 0 1 0 1 0 1 0] z 1 :město,z :hlavníměsto Praha 1+1= z 1 :stát,z :země 1 ČR 1 1 Česká Republika 1 z 1 :měna 1 CZK 1 město, Praha město, Košice město, Bratislava stát, ČR stát, Slovensko měna, CZK měna, SSK země, Česká Republika země, Slovensko hlavní město, Praha hlavní město, Bratislava

Využití měr Závěr Použití měr- dotaz- ekvivalence Dotaz na hlavní město Praha 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 1 1 0 1 0 0 0 1 0 0 Φ S = 1 1 0 1 0 1 0 0 0 0 0 0 0 1 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 1 6 0 0 0 1 0 1 4 7 0 0 0 0 0 0 1 0 1 0 5 0 0 0 0 0 0 0 1 0 1 x 0 = [0 0 0 0 0 0 0 0 0 1 0] x 1 = [ 0 0 0 0 0 0 1 0 1 0] x = [ 0 0 0 0 1 0 1 0] z 1 :město,z :hlavníměsto Praha 1+0.66=1.66 z 1 :stát,z :země 1 ČR 0.66 1 Česká Republika 1 z 1 :měna 1 CZK 0.66 město, Praha město, Košice město, Bratislava stát, ČR stát, Slovensko měna, CZK měna, SSK země = Česká Republika země = Slovensko hlavní město = Praha hlavní město = Bratislava

Využití měr Závěr Použití měr- dotaz- ekvivalence Dotaz na město Košice 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 1 1 0 1 0 0 0 1 0 0 Φ S = 1 1 0 1 0 1 0 0 0 0 0 0 0 1 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 1 6 0 0 0 1 0 1 4 7 0 0 0 0 0 0 1 0 1 0 5 0 0 0 0 0 0 0 1 0 1 x 0 = [0 1 0 0 0 0 0 0 0 0 0] x 1 = [0 1 0 0 1 0 1 0 1 0 0] x = [0 1 0 0 1 0 1 0 1 0 1 ] z 1 :město,z :hlavníměsto 1 Košice 1 1 Bratislava 0. z 1 :stát,z :země 1 Slovensko 1. z 1 :měna 1 SKK 1 město, Praha město, Košice město, Bratislava stát, ČR stát, Slovensko měna, CZK měna, SSK země = Česká Republika země = Slovensko hlavní město = Praha hlavní město = Bratislava

Použití měr- dotaz- Hierarchie Využití měr Závěr Dotaz na město Košice 1 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 1 0 0 1 0 0 0 0 0 0 0 0 1 1 0 1 0 0 0 1 0 0 Φ S = 1 0 0 1 0 1 0 0 0 0 0 0 1 1 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 6 0 0 0 0 1 4 0 0 0 1 0 1 7 5 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 1 0 1 x 0 = [0 1 0 0 0 0 0 0 0 0 0] x 1 = [0 1 0 0 1 0 1 0 1 0 0] x = [0 1 0 0 1 0 1 0 1 0 1 ] z 1 :město Košice 1 z :hlavníměsto Bratislava 0.50 z 1 :stát,z :země 1 Slovensko 1.50 z 1 :měna 1 SKK 1 město, Praha město, Košice město, Bratislava stát, ČR stát, Slovensko měna, CZK měna, SSK země, Česká Republika země, Slovensko hlavní město, Praha hlavní město, Bratislava

Reálná data Motivace Využití měr Závěr

Využití měr Závěr Závěr Možnost(semi)automatického návrhu integračních pravidel Využití měr při návrhu ověření navržených pravidel na datech při dotazování 1 rozhodnutí při nekonzistenci(preference) ochrana lokálního zdroje před ostatními(reputace) Pravidla vhodnost uvažovat hierarchii- nutnost dalších testů polynomiální složitost jednoznačné přiřazení při disjunktnosti globálních domén atributů