Zjednodušení generativního systému redukcí rozlišení

Zjednodušení generativního systému redukcí rozlišení Ze studie zahrnující dotaz na vzdělání. Obor hodnot v i : e základní vzdělání h střední vzdělání c bakalář g magistr Možné redukce rozlišení cg vysoké hc střední nebo bakalářské eh ne vyšší než střední ehc nižší než magisterské hcg vyšší než základní ehcg jakékoliv (triviální případ) diagram redukcí rozlišení oboru hodnot jedné proměnné v i reprezentuje částečné uspořádání e h c g e h c g e h c g e h c g e h c g e h c g e h c g Převzato z Klir, G. Architecture of Systems Problem Solving, 1985 e h c g OTS; Systém, identifikace parametrů a struktury; R. Šára, CMP (str. 16)

Diagram redukcí rozlišení pro dvě proměnné Obory hodnot R(v i ) = {0, 1, 2}, i = 1, 2, 0 1 2 jedna proměnná v 1 dvě proměnné v 1, v 2 : ca = 0 1 2, 0 1 2, atd b a d c a = 0 1 2 b = 0 1 2 c = 0 1 2 d = 0 1 2 ab ac aa ba ca počet možností pro m = 3, n = 1: ad bb cb bc cc da Λ m,1 = 2 m 1 = 4 bd cd db dc dd OTS; Systém, identifikace parametrů a struktury; R. Šára, CMP (str. 17) dc odpovídá eliminaci proměnné v 1 počet možností pro m = 3, n = 2: diagram zahrnuje zjednodušení vylučováním proměnných i redukcí rozlišení grafový součin diagramů pro jednu proměnnou Λ m,2 = (2 m 1 ) n = 4 2 = 16

Volba zjednodušení generativního systému 1. Vygeneruj všechny redukce, vypočti generativní neurčitost a spočti počet stavů nenulové pravděpodobnosti. maska: 1 2 3 4 s 1 s 2 s 3 s 4 p 0 0 0 1 0.2 0 1 1 1 0.1 0 1 1 2 0.1 1 1 2 2 0.1 1 2 1 2 0.2 1 2 2 2 0.1 2 2 0 0 0.2 ac = 0 1 2, 0 1 2 }{{}}{{} v 1 v 2 s 1 s 2 s 3 s 4 p 0 0 0 1 0.2 0 1 1 1 0.2 1 1 2 1 0.2 1 1 1 1 0.2 2 1 0 0 0.2 cc = 0 1 2, 0 1 2 }{{}}{{} v 1 v 2 s 1 s 2 s 3 s 4 p 0 0 0 1 0.2 0 1 1 1 0.2 1 1 1 1 0.4 1 1 0 0 0.2 2. Zkonstruuj graf, jehož hrany směřují od uzlů s nižším počtem stavů k uzlům s vyšším nebo stejným počtem stavů a zároveň od uzlů s vyšší generativní neurčitostí k uzlům s nižší nebo stejnou generativní neurčitostí. 3. Uzly, které nemají následníka, reprezentují množinu řešení. OTS; Systém, identifikace parametrů a struktury; R. Šára, CMP (str. 18)

Postup na diagramu zjemnění rozlišení 1. Zruš orientaci všech hran 2. Doplň hrany tak, aby vznikly kliky na jednotlivých úrovních diagramu 3. Všechny hrany orientuj tak, aby šipky směřovaly od vyššího k nižšímu nebo stejnému počtu stavů 4. Odstraň všechny hrany, které směřují od nižší k vyšší generativní neurčitosti 5. Odstraň tranzitivní hrany nepovinné 6. Uzly, které nemají následníka, reprezentují množinu řešení Kroky 1 až 3: aa 7 7 5 ab ac ba ca 7 6 5 ad 6 bb 6 cb bc 4 cc 4 da 5 3 bd 4 cd db 4 dc 3 dd 1 OTS; Systém, identifikace parametrů a struktury; R. Šára, CMP (str. 19)

pokračování Krok 4: Kroky 5 a 6: aa 0.475 aa 0.475 0.4 0.752 ab ac ba ca 0.876 0.685 0.876 0.4 0.752 ab ac ba ca 0.685 0.8 ad 0.961 bb 1.086 cb bc 0.551 cc 0.551 da 0.761 0.8 ad 0.961 bb 1.086 cb bc 0.551 cc 0.551 da 0.761 0.649 bd 0.951 cd db 0.971 dc 0.649 0.649 0.649 0.971 bd 0.951 cd db dc dd 0 dd 0 OTS; Systém, identifikace parametrů a struktury; R. Šára, CMP (str. 20)

Počet rozkladů oboru hodnot v i s rozlišením na m úrovní 1. Obor hodnot R(v i ) není úplně uspořádaný, m = R(v i ) Λ m = m 1 i=0 ( ) m 1 Λ i, Λ 0 = 1 i 2. Obor hodnot R(v i ) je úplně uspořádaný Λ m = 2 m 1 s 1, s 2,..., s m stavy systému s jednou proměnnou; s i a s i+1, i = 1, 2,..., m 1 spojeny nebo ne 2 m 1 možností m 2 3 4 5 6 7 8 9 Λ m 2 5 15 52 203 877 4140 21147 Λ m 2 4 8 16 32 64 128 256 n proměnných v i, i = 1, 2,..., n se stejným rozkladem OTS; Systém, identifikace parametrů a struktury; R. Šára, CMP (str. 21) Λ m,n = (Λ m ) n

PC: Identifikace struktury zobecněného dynamického systému Důležitý problém v obecné teorii systémů. 1. Podsystém a nadsystém. 2. Definice dekompozice systému. 3. Problém rekonstrukce systému: a. lokální a globální konzistence dynamických systémů, b. jednoduchá a iterativní spojovací procedura. 4. Problém identifikace struktury: a. generátor rekonstrukčních hypotéz, b. kvalita rekonstrukční hypotézy, c. identifikační procedura. 5. Příklad identifikace na skutečném systému. OTS; Systém, identifikace parametrů a struktury; R. Šára, CMP (str. 22)

Podsystém dynamického systému systém 1 F v 1 systém 2 F a b 1 2 v 2 v 3 4 3 5 w A v 4 6 w B c s 1 s 2 s 3 s 4 s 5 s 6 1 p B (s) 0 0 0 0 0 0 0.20 0 0 0 0 1 0 0.05 0 0 1 1 0 0 0.05 0 1 0 0 0 0 0.05 1 1 0 0 1 0 0.10 1 1 1 0 0 0 0.05 1 1 1 0 1 0 0.05 1 1 1 1 0 0 0.10 1 1 1 1 1 0 0.05 1 1 1 1 1 1 0.30 s a s b s c 2 p B (s) 0 0 0 0.30 0 1 0 0.05 1 1 0 0.35 1 1 1 0.30 Jde o nadsystém a podsystém 2 F 1 F? Musíme vědět, že 1. w A = v 1, w B = v 4 2. parametrizační množina je stejná Potom můžeme zkontrolovat: 1. obory hodnot R(w A ) = R(v 1 ), R(w B ) = R(v 4 ) 2. vnoření masky 2 M 1 M, s a = s 1, s b = s 2, s c = s 6 3. marginalitu 2 p B vzhledem k 1 p B OTS; Systém, identifikace parametrů a struktury; R. Šára, CMP (str. 23)

Podsystém a nadsystém dynamického systému Def: i F = ( i A, i B; i M, i p B ) je podsystém systému F = (A, B; M, p B ), když platí následující podmínky: 1. kompatibilita s F (ztotožnění atributů a parametrů) má stejnou parametrizační množinu: i B = B obory hodnot základních proměnných V j zachovány 2. vnoření i F F a. množina vzorkovacích proměnných je vnořena: i S S b. (data pro proměnné v i S jsou zachována) maska je vnořena i M M funkce přípustnosti i p B je marginální k p B Hierarchie podsystémů Konvence: S značí dále pouze množinu (vzorkovacích) proměnných dynamického systému F. Místo i F F budeme používat zkráceně i S S. OTS; Systém, identifikace parametrů a struktury; R. Šára, CMP (str. 24)

Dekompozice systému blokové vyjádření struktury struktura jako rozklad množiny vzorkovacích proměnných v 4 F Ú ½ ½ 4 F v 1 1 F v 2 3 F Ú Ú ¾ v 3 2 F Ú ¾ OTS; Systém, identifikace parametrů a struktury; R. Šára, CMP (str. 25)

Dekompozice systému Celkový systém obsahuje všechny proměnné. Dekompozice: Množina podsystémů G = { 1 S, 2 S,..., q S} celkového systému S, taková, že žádné dva j S a k S nejsou navzájem podsystémy: j S k S Protipříklad: ½ Ú Þ Ò ÔÖÓÑ ÒÒ ¾ Podmínka iredundance: podsystém 3 S 1 S nenese žádnou novou informaci o S a nepatří tedy do dekompozice systému S. Vazební proměnné mezi podsystémy: C k,l = k S l S Orientované vazby: rozklad proměnných na vstupní a výstupní. Proměnná může být deklarována jako výstupní jen v jednom podsystému (jednoznačnost řízení) OTS; Systém, identifikace parametrů a struktury; R. Šára, CMP (str. 26)

Rozklad proměnných na vazební vstupní, vazební výstupní generující, vazební výstupní generované a nevazební generující proměnné ½ ¾ ½ ¾ ¾ ¾ ½ 1 2 3 4 ½ 1 2 3 4 ½ 1 2 3 4 ½ 1 2 3 4 ¾ 3 4 5 6 ¾ 3 4 5 6 ¾ 3 4 5 6 ¾ 3 4 5 6 celkem 24 možností identifikace struktury systému není tímto rozkladem ovlivněna orientace vazby se pozná dle generativní neurčitosti příslušné proměnné vzhledem k 1. nebo 2. systému kauzalita se takto ale nezjistí OTS; Systém, identifikace parametrů a struktury; R. Šára, CMP (str. 27)

Rekonstrukce a identifikace: úvod Rekonstrukce systému Konstrukce hypotézy o nejlepším celkovém systému S, je-li dána jeho dekompozice { 1 S, 2 S,..., q S}. Aplikace: 1. inference celkového systému z dílčích 2. procedura nutná pro identifikaci Identifikace struktury Nejlepší dekompozice systému S na { 1 S, 2 S,..., q S}. Aplikace: 1. zjednodušení systému (např. rozpoznávání: jednodušší modely se odhadují lépe z dat) 2. nalezení struktury ve složitém systému (např. analýza kritických vazeb a závislostí) OTS; Systém, identifikace parametrů a struktury; R. Šára, CMP (str. 28)

Velikost reprezentace celkového a dekomponovaného systému 10 12 Pro k = 10 k počet stavů jedné proměnné n počet proměnných v systému (1 + n) k n velikost reprezentace celkového systému funkcí přípustnosti 3 2 k2 n (n 1) velikost reprezentace dekompozice, kde každý podsystém má jen dvě proměnné = n(n 1) 2 (2 + 1) k 2 (Gibbs) velikost reprezentace 10 10 10 8 10 6 10 4 celkovy system dekomponovany system 10 2 2 4 6 8 10 pocet promennych dekomponovaný syst.: méně proměnných lepší odhad z dat OTS; Systém, identifikace parametrů a struktury; R. Šára, CMP (str. 29)

Rekonstrukce celku z částí OTS; Systém, identifikace parametrů a struktury; R. Šára, CMP (str. 30) Převzato z Klir, G. Architecture of Systems Problem Solving, 1985

Schéma identifikační procedury Ý Ø Ñ Ò Ö ØÓÖ Ö ÓÒ ØÖÙ Ò ÝÔÓØ Þ G a S nejsou porovnatelné nelze srovnat kvalitu G a S S a S jsou porovnatelné Ú Ð Ø ÓÑÔÓÞ µ ÓÑÔÓÞ Ò ÔÓ Ý Ø ÑÝ Ö ÓÒ ØÖÙ Ò ÝÔÓØ Þ ½ ¾ Õ Ò ØÖ ÒÒ ÔÓ Ò Ö ÓÒ ØÖÙ OTS; Systém, identifikace parametrů a struktury; R. Šára, CMP (str. 31)

Vzájemná konzistence dynamických systémů Lokální konzistence chování Marginální funkce přípustnosti nad vazebními proměnnými musí být stejné C i,j = i S j S [ i p B C i,j ] = [ j p B C i,j ] marginalizace do vazebních proměnných Př: Lokálně nekonzistentní systémy: ½ Ú½ Ú ¾ Ú ¾ 1 S v 1 v 2 1 p B 0 0 0.5 0 1 0.2 1 0 0.1 1 1 0.2 2 S v 2 v 3 2 p B 0 0 0.4 0 1 0.25 1 0 0.15 1 1 0.2 v 2 [ 1 p B {v 2 } ] 0 0.6 1 0.4 v 2 [ 2 p B {v 2 } ] 0 0.65 1 0.35 Pozn: podsystémy vzniklé rozkladem systému jsou lokálně konzistentní. OTS; Systém, identifikace parametrů a struktury; R. Šára, CMP (str. 32)

Stačí lokální konzistence k rekonstrukci? v 1 v 2 1 p B 0 0 0.25 0 1 0.18 1 0 0.20 1 1 0.37 v 2 v 3 2 p B 0 0 0.17 0 1 0.16 0 2 0.12 1 0 0.14 1 1 0.18 1 2 0.23 v 1 v 3 3 p B 0 0 0.11 0 1 0.14 0 2 0.18 1 0 0.20 1 1 0.20 1 2 0.17 v 1 v 2 v 3 p B 0 0 0 p 0 0 0 1 p 1 0 0 2 p 2 0 1 0 p 3 0 1 1 p 4 0 1 2 p 5 1 0 0 p 6 1 0 1 p 7 1 0 2 p 8 1 1 0 p 9 1 1 1 p 10 1 1 2 p 11 Množina možných rekonstrukcí? 0.06 p 10 0.18 0.05 p 11 0.17 0.23 p 10 + p 11 0.34 p 0 = 0.34 p 10 p 11 p 1 = 0.04 + p 10 p 2 = 0.05 + p 11. p 9 = OTS; Systém, identifikace parametrů a struktury; R. Šára, CMP (str. 33)

Globální konzistence chování Sdruženou funkci přípustnosti p B musí být možno zkonstruovat z marginálních i p B, i N q. ½ ¾ Př: Globálně nekonzistentní systémy: Ú ½ Ú ¾ Ú Lokálně konzistentní: To je ve sporu. v 1 v 2 1 p B 0 0 0 (= a + x) 0 1 0.7 1 0 0.3 OTS; Systém, identifikace parametrů a struktury; R. Šára, CMP (str. 34) v 2 v 3 2 p B 0 1 0.3 1 0 0.7 1 1 0 (= b + y) v 1 v 3 3 p B 0 0 0.4 0 1 0.3 (= a + b) 1 0 0.3 {z } v 1 v 2 v 3 p B 0 0 1 a 0 1 1 b a + x = 0 a = x = 0 (a, x 0) b + y = 0 b = y = 0 (y 0) a + b = 0.3

Rekonstrukce systému Dáno: Dekompozice systému G = { 1 S, 2 S,..., q S}. i S je podmnožina proměnných, i S S Cíl: Nejlepší hypotéza o celkovém systému S. (s S je stav a S je velikost stavového prostoru) Postup: 1. Určit množinu možných rekonstrukcí. i p B ( i S) = S\iS p B (S) q i S rovnic i=1 p B (S) 0 S nerovnic 2. Vybrat nejlepší z nich. Volba (nestranná rekonstrukce): S neobsahuje jinou informaci než tu obsaženou v množinách { i S, i = 1, 2,..., q}. Implementace: Spojovací procedura. OTS; Systém, identifikace parametrů a struktury; R. Šára, CMP (str. 35)

Spojení dvou marginálních funkcí přípustnosti Marginální funkce přípustnosti: rozklad množiny proměnných: ½ ¾ 1 p B : R(A) R(B) 0, 1 2 p B : R(B) R(C) 0, 1 Spojení: 1 p B 2 p B : R(A) R(B) R(C) 0, 1 Nestranné spojení (o maximální entropii): p B(A, B, C) = ( 1 p B 2 p B )(A, B, C) def = 1 p B (A, B) 2p B (C B) Pozn: 1 p B (B) = 2 p B (B) (kompatibilita), 1 p B 2 p B = 2 p B 1 p B Speciální případy: A = : ( 1 p B 2 p B )(B, C) = 1 p B (B) 2p B (C B) B = : ( 1 p B 2 p B )(A, C) = 1 p B (A) 2p B (C) OTS; Systém, identifikace parametrů a struktury; R. Šára, CMP (str. 36)