Schéma identifikační procedury

Podobné dokumenty
Zjednodušení generativního systému redukcí rozlišení

PC: Identifikace struktury zobecněného dynamického systému

Rekonstrukce diskrétního rozdělení psti metodou maximální entropie

Prohledávání svazu zjemnění

Síla a významnost asociace mezi proměnnými v systému

Matice. Přednáška MATEMATIKA č. 2. Jiří Neubauer. Katedra ekonometrie FEM UO Brno kancelář 69a, tel

Aplikace 2: Hledání informativních příznaků pro rozpoznávání

Přednáška 6, 6. listopadu 2013

SIGNUM 3SB3 Tlačítka a signálky

Databázové systémy Tomáš Skopal

PRAVDĚPODOBNOST A STATISTIKA

Hranová konzistence. Arc consistency AC. Nejprve se zabýváme binárními CSP. podmínka odpovídá hraně v grafu podmínek

Součin matice A a čísla α definujeme jako matici αa = (d ij ) typu m n, kde d ij = αa ij pro libovolné indexy i, j.

Projekt OPVK - CZ.1.07/1.1.00/ Matematika pro všechny. Univerzita Palackého v Olomouci

B A B A B A B A A B A B B

Základy biostatistiky (MD710P09) ak. rok 2007/2008

Základy biostatistiky (MD710P09) ak. rok 2008/2009

1 Klasická pravděpodobnost. Bayesův vzorec. Poslední změna (oprava): 11. května 2018 ( 6 4)( 43 2 ) ( 49 6 ) 3. = (a) 1 1 2! + 1 3!

pro každé i. Proto je takových čísel m právě N ai 1 +. k k p

3. přednáška 15. října 2007

LIMITA A SPOJITOST FUNKCE

VĚTY Z LINEÁRNÍ ALGEBRY

Teorie informace a kódování (KMI/TIK)

Marie Duží

Navrhování experimentů a jejich analýza. Eva Jarošová

Kontingenční tabulky. (Analýza kategoriálních dat)

Úvod do databázových systémů 10. cvičení

FIT ČVUT MI-LOM Lineární optimalizace a metody. Dualita. Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti

Maticí typu (m, n), kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru:

Optimalizace & soft omezení: algoritmy

= = = : 1 k > 0. x k + (1 x) 4k = 2k x + 4 4x = 2 x = x = = 2 : 1.

Teorie informace. Mirko Navara. katedra kybernetiky FEL ČVUT Karlovo náměstí, budova G, místnost 104a navara/psi 3. 1.

Lineární algebra : Násobení matic a inverzní matice

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

64. ročník matematické olympiády Řešení úloh krajského kola kategorie A

UČENÍ BEZ UČITELE. Václav Hlaváč

Kybernetika a umělá inteligence, cvičení 10/11

2. LIMITA A SPOJITOST FUNKCE

Oct 19th Charles University in Prague, Faculty of Mathematics and Physics. Multidimensional estimators. Základní pojmy.

Základy maticového počtu Matice, determinant, definitnost

UDBS Cvičení 10 Funkční závislosti

Optimalizace provozních podmínek. Eva Jarošová

Důkaz Heineho Borelovy věty. Bez újmy na obecnosti vezmeme celý prostor A = M (proč? úloha 1). Implikace. Nechť je (M, d) kompaktní a nechť.

5. Formalizace návrhu databáze

Lineární algebra : Násobení matic a inverzní matice

Úvod do databázových systémů. Cvičení 12 Ing. Martin Zwierzyna

1 Výroková logika 1. 2 Predikátová logika 3. 3 Důkazy matematických vět 4. 4 Doporučená literatura 7

PŘEDNÁŠKA 7 Kongruence svazů

Poznámky k předmětu Aplikovaná statistika, 11. téma

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

4EK211 Základy ekonometrie

Výběrové charakteristiky a jejich rozdělení

Definice 13.1 Kvadratická forma v n proměnných s koeficienty z tělesa T je výraz tvaru. Kvadratická forma v n proměnných je tak polynom n proměnných s

maticeteorie 1. Matice A je typu 2 4, matice B je typu 4 3. Jakých rozměrů musí být matice X, aby se dala provést

Lineární algebra Kapitola 1 - Základní matematické pojmy

Kontingenční tabulky, korelační koeficienty

Teoretická informatika - Úkol č.1

PŘEDNÁŠKA 5 Konjuktivně disjunktivní termy, konečné distributivní svazy

Vektorové podprostory, lineární nezávislost, báze, dimenze a souřadnice

Teorie množin. Čekají nás základní množinové operace kartézské součiny, relace zobrazení, operace. Teoretické základy informatiky.

30. listopadu Derivace. VŠB-TU Ostrava. Dostupné: s1a64/cd/index.htm.

Spojitost a limita funkce

11 Vzdálenost podprostorů

Kapitola 13: Transakce. Koncept transakce. ACID vlastnosti

Úlohy krajského kola kategorie A

PŘEDNÁŠKA 2 POSLOUPNOSTI

Síla a významnost asociace mezi proměnnými v systému

Kontingenční tabulky, korelační koeficienty

KMA/P506 Pravděpodobnost a statistika KMA/P507 Statistika na PC

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Plánování experimentu

Rozptyl. Pozn.: rozptyl je nezávislý na posunu hustoty pravděpodobnosti na ose x, protože Var(X) mi určuje jen šířku rozdělení.

63. ročník matematické olympiády Řešení úloh krajského kola kategorie B. 1. Odečtením druhé rovnice od první a třetí od druhé dostaneme dvě rovnice

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

Učební texty k státní bakalářské zkoušce Matematika Matice. študenti MFF 15. augusta 2008

Y36BEZ Bezpečnost přenosu a zpracování dat. Úvod. Róbert Lórencz. lorencz@fel.cvut.cz

Úvod do logiky (presentace 2) Naivní teorie množin, relace a funkce

TOPOLOGIE A TEORIE KATEGORIÍ (2017/2018) 4. PREDNÁŠKA - SOUČIN PROSTORŮ A TICHONOVOVA VĚTA.

Kongruence na množině celých čísel

Jana Vránová, 3. lékařská fakulta UK

obytný soubor D.1.1 ARCH. STAVEBNÍ ČÁST DUR+DSP 06/2016 1/100 Langrova 814/15, Brno - Slatina

Diferenciální počet funkcí jedné proměnné

Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague

6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový.

Základy matematické analýzy

Teorie informace: řešené příklady 2014 Tomáš Kroupa

Syntetická geometrie I

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Limita a spojitost funkce a zobrazení jedné reálné proměnné

Výroková a predikátová logika - VII

Západočeská univerzita v Plzni FAKULTA PEDAGOGICKÁ

Doporučené příklady k Teorii množin, LS 2018/2019

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

TOPOLOGIE A TEORIE KATEGORIÍ (2017/2018) 3. PREDNÁŠKA - KOMPAKTNÍ PROSTORY.

Syntetická geometrie I

Kapitola 1: Reálné funkce 1/20

1. přednáška 1. října Kapitola 1. Metrické prostory.

7. Důležité pojmy ve vektorových prostorech

Plánování experimentu

Transkript:

Schéma identifikační procedury systém S generátor rekonstrukčních hypotéz G a S nejsou porovnatelné nelze srovnat kvalitu G a S S a S jsou porovnatelné kvalita dekompozice S? S : (S,S ) = G dekompozice na podsystémy = rekonstrukční hypotéza G = { 1 S, 2 S,..., q S} nestranné spojení rekonstrukce S Systém, identifikace struktury; R. Šára, CMP (str. 10)

Globální konzistence chování Sdruženou funkci přípustnosti p B musí být možno zkonstruovat z marginálních i p B, i N q. 1 S 2 S Př: Globálně nekonzistentní systémy: v 1 v 2 v 3 3 S Lokálně konzistentní: To je ve sporu. v 1 v 2 1 p B 0 0 0 (= a + x) 0 1 0.7 1 0 0.3 Systém, identifikace struktury; R. Šára, CMP (str. 13) v 2 v 3 2 p B 0 1 0.3 1 0 0.7 1 1 0 (= b + y) v 1 v 3 3 p B 0 0 0.4 0 1 0.3 (= a + b) 1 0 0.3 {z } v 1 v 2 v 3 p B 0 0 1 a 0 1 1 b a + x = 0 a = x = 0 (a, x 0) b + y = 0 b = y = 0 (y 0) a + b = 0.3

Rekonstrukce systému Dáno: Dekompozice systému G = { 1 S, 2 S,..., q S}. i S je podmnožina proměnných, i S S Cíl: Nejlepší hypotéza o celkovém systému S. (s S je stav a S je velikost stavového prostoru) Postup: 1. Určit množinu možných rekonstrukcí. i p B ( i S) = S\iS p B (S) q i S rovnic i=1 p B (S) 0 S nerovnic 2. Vybrat nejlepší z nich. Volba (nestranná rekonstrukce): S neobsahuje jinou informaci než tu obsaženou v množinách { i S, i = 1, 2,..., q}. Implementace: Spojovací procedura. Systém, identifikace struktury; R. Šára, CMP (str. 14)

Spojení dvou marginálních funkcí přípustnosti Marginální funkce přípustnosti: rozklad množiny proměnných: 1 S 2 S A B C 1 p B : R(A) R(B) 0, 1 2 p B : R(B) R(C) 0, 1 Spojení: 1 p B 2 p B : R(A) R(B) R(C) 0, 1 Nestranné spojení (o maximální entropii): p B(a, b, c) = ( 1 p B 2 p B )(a, b, c) def = 1 p B (a, b) 2p B (c b) Pozn: 1 p B (b) = 2 p B (b) (kompatibilita), 1 p B 2 p B = 2 p B 1 p B Speciální případy: A = : ( 1 p B 2 p B )(b, c) = 1 p B (b) 2p B (c b) B = : ( 1 p B 2 p B )(a, c) = 1 p B (a) 2p B (c) Systém, identifikace struktury; R. Šára, CMP (str. 15)

Příklad podsystémy: lokální kompatibilita: a b 1 p B (a, b) 0 0 0.4 0 1 0.3 1 0 0.2 1 1 0.1 b c 2 p B (b, c) 0 0 0.4 0 1 0.2 1 0 0.1 1 1 0.3 b 1 p B (b) 2 p B (b) 0 0.6 0.6 1 0.4 0.4 vyplníme tabulku přípustnosti stavu pro p B (a, b, c) = 1 p B (a, b) 2 p B (c b) a b c p B (a, b, c) 0 0 0 0.4 0.4/0.6 = 0.266 0 0 1 0.4 0.2/0.6 = 0.133 0 1 0 0.075 0 1 1 0.225 1 0 0 1 0 1 1 1 0 1 1 1 Systém, identifikace struktury; R. Šára, CMP (str. 16)

Poznámky 1. Připojením podsystému se nestane nic B C ( 1 p 2 p)(b, c) = 1 p(b) 2p(c b) = 2 p(b) 2p(c b) = 2 p(b, c) 2. Je-li p (a, b, c) = p(a, b) p(c b), potom marginální funkce p(a, b) a p(b, c) jsou zachovány: p (a, b) = c k p (a, b, c k ) = c k p(a, b) p(c k b) = p(a, b) p (b, c) = a i p (a i, b, c) = a i p(a i, b) p(c b) = p(b, c) 3. Marginální funkce p(a, c) obecně zachována není. a b c p p 0 0 0 0.0370 0.0106 0 0 1 0.1111 0.1376 0 1 0 0.0741 0.0684 0 1 1 0.3704 0.3761 1 0 0 0.0000 0.0265 1 0 1 0.3704 0.3439 1 1 0 0.0000 0.0057 1 1 1 0.0370 0.0313 Systém, identifikace struktury; R. Šára, CMP (str. 17) a c p p 0 0 0.0790 0.1111 0 1 0.5136 0.4815 1 0 0.0322 0.0000 1 1 0.3753 0.4074

Věta o maximalitě entropie spojení Nechť S s funkcí přípustnosti stavu p(a, b, c) je libovolná rekonstrukce systému S s funkcí přípustnosti stavu p(a, b, c) a nechť S je rekonstrukce spojením p (a, b, c) = p(a, b) p(c b). Potom H( S) H(S ). Pozn: Platí i pro případ, kdy S je původní systém S. Důkaz Předpokládejme, že existuje p tak, že H( S) > H(S ). Použijeme Gibbsovu nerovnost H( S) = i,j,k p(a i, b j, c k ) log p(a i, b j, c k ) i,j,k p(a i, b j, c k ) log p (a i, b j, c k ) a to, že p (a, b, c) = p(a, b) p(c b), p(a, b) = p(a, b) a p(b, c) = p(b, c). Dostaneme H( S) H(S ), což je spor. Systém, identifikace struktury; R. Šára, CMP (str. 18)

Spojovací procedura Jednoduchá procedura pro { 1 S, 2 S,..., q S}: p B = q p B ( q 1 p B ( (2 p B 1 p B ))) libovolné pořadí spojování 2 p B 21 p B 1 p B 3 p B 321 p B 1 S 2 S Problém: cyklické vazby mezi proměnnými v 1 v 2 v 3 3 S Je-li splněna podmínka [p B i S] = i p B, potom je spojení nestranné. Jinak nutno použít iterativní proceduru (viz dále). Systém, identifikace struktury; R. Šára, CMP (str. 19)

Iterativní spojovací procedura Odstraní vliv cyklických vazeb. Iterativní spojovací procedura S ( 1 S, 2 S,..., q S; ε) 1. k := 0, p 0 := q p B q 1 p B 1 p B 2. k := k + 1, p k := q p B q 1 p B (1 p B p k 1 3. jestliže max s S p k(s) p k 1 (s) < ε stop, jinak opakuj krok 2. ) Jestliže X s S p k (s) = 1, pak řešení nalezeno s chybou ±ε, jinak { 1 S, 2 S,..., q S} není globálně konzistentní. Výsledkem je nestranná rekonstrukce s chybou ε nutná jen, pokud pro nějaké i = 1, 2,..., q platí [ p B i S ] i p B připojování nekonzistentních podsystémů přepisováním marginálních funkcí 2 p B (b) 1p B (c b) = 2 p B (b) 1 p B (b) 1p B (b, c) Důkaz konvergence: [Brown, Information and Control 4(2):386-393, 1959] Systém, identifikace struktury; R. Šára, CMP (str. 20)

Příklad 1 Máme tři podsystémy systému s funkcí přípustnosti stavu p abc a b p ab b c p bc a c p ac 0 0 0.1481 0 0 0.0370 0 0 0.1111 0 1 0.4444 0 1 0.4815 0 1 0.4815 1 0 0.3704 1 0 0.0741 1 0 0.0000 1 1 0.0370 1 1 0.4074 1 1 0.4074 Marginální funkce přípustnosti stavu po jednoduchém spojení p ac (p ab p bc ) p ac se připojil poslední a b ˆp ab b c ˆp bc a c ˆp ac 0 0 0.1438 0 0 0.0149 0 0 0.1111 0 1 0.4487 0 1 0.5023 0 1 0.4815 1 0 0.3734 1 0 0.0962 0 0 0.0000 1 1 0.0340 1 1 0.3866 1 1 0.4074 Srovnání výsledku jednoduchého a iterativního spojení a b c p abc p ac (p ab p bc ) p abc 0 0 0 0.0370 0.0149 0.0370 0 0 1 0.1111 0.0962 0.1111 0 1 0 0.0741 0.1290 0.0741 0 1 1 0.3704 0.3525 0.3704 1 0 1 0.3704 0.3734 0.3704 1 1 1 0.0370 0.0340 0.0370 Systém, identifikace struktury; R. Šára, CMP (str. 21)

Příklad 2 Máme tři podsystémy, které nejsou globálně konzistentní (viz str. 13) v 1 v 2 1 p B v 2 v 3 2 p B v 1 v 3 3 p B 0 0 0.0000 0 0 0.0000 0 0 0.4000 0 1 0.7000 0 1 0.3000 0 1 0.3000 1 0 0.3000 1 0 0.7000 1 0 0.3000 1 1 0.0000 1 1 0.0000 1 1 0.0000 Výsledek jednoduchého i iterativního spojení podmínka X s S p k (s) = 1 není splněna v 1 v 3 v 2 p k 0 0 0 0.0000 0 0 1 0.4000 0 1 0 0.0000 0 1 1 0.0000 1 0 0 0.0000 1 0 1 0.0000 1 1 0 0.0000 1 1 1 0.0000 Systém, identifikace struktury; R. Šára, CMP (str. 22)

Rekonstrukční chyba Dvě rozdělení p (s), p(s), s S nad stavovým prostorem S. Kullbackova-Leiblerova vzdálenost L(p, p ) = s S p(s) log p(s) p (s) (informační vzdálenost, poměrná entropie) Vlastnosti: L(p, p ) 0 L(p, p ) L(p, p) L(p, p ) = 0 p p je-li p nestranné spojení, pak 1. p (s) = 0 p(s) = 0 ( Gibbsova nerovnost) 2. L(p, p ) = H(S ) H(S) 3. ale L(p, p) H(S) H(S ) (není metrika) Pro generativní systém L(p, p ) = g G p(g) g G p(g g) log p(g g) p (g g) = = H(G G ) H(G G) Rekonstrukční chyba: G = (S, S ) = L(p, p ) Systém, identifikace struktury; R. Šára, CMP (str. 23)

Příklad a b p B (a, b) p B (a, b) = 1 p B (a) 2 p B (b) 0 0 0 0.21 0 1 0.3 0.09 1 0 0.7 0.49 1 1 0 0.21 a 1 p B (a) 0 0.3 1 0.7 b 2 p B (b) 0 0.7 1 0.3 L(S, S ) = 0.3 log 0.3 0.09 + 0.7 log 0.7 0.49 = 0.6109 H(S S) = H(S ) H(S) = 1.2217 0.6109 = 0.6109 Systém, identifikace struktury; R. Šára, CMP (str. 24)

Test statistické významnosti struktury systému skutečná četnost n(a i, b j, c k ) H 0 : p(a i, b j, c k ) = ( 1 p 2 p)(a i, b j, c k ) teoretická četnost n (a i, b j, c k ) = n ( 1 p 2 p)(a i, b j, c k ) χ 2 = I i=1 J j=1 K k=1 (n(a i, b j, c k ) n (a i, b j, c k )) 2 n (a i, b j, c k ) I J K J(I + K) + 1 stupňů volnosti Lze jen u identifikace struktury systému (máme n i n ) Systém, identifikace struktury; R. Šára, CMP (str. 25)

poznámky Počet stupňů volnosti 1. celý stavový prostor má velikost I J K 2. 1 podmínka p(a i, b j, c k ) = 1 i,j,k 3. p(a, b) musí být marginální funkce: I J 1 nezávislých vedlejších podmínek protože X i,j p(a i, b j ) = 1 4. p(b, c) musí být marginální funkce: J K 1 nezávislých vedlejších podmínek I J K 1 (I J 1) (J K 1) = I J K J(I + K) + 1 [1] Mood, AM Graybill, FA Boes, DC. Introduction to the Theory of Statistics. McGraw-Hill 1974, str. 454ff. Systém, identifikace struktury; R. Šára, CMP (str. 26)