Výpočet marginálních podmíněných pravděpodobností v bayesovské síti

Podobné dokumenty
Bayesian Networks. The graph represents conditional independencies of the join probability distribution Π X V P(X pa(x)).

H {{u, v} : u,v U u v }

Stromové rozklady. Definice 1. Stromový rozklad grafu G je dvojice (T, β) taková, že T je strom,

Vybíravost grafů, Nullstellensatz, jádra

Definice. Vektorový prostor V nad tělesem T je množina s operacemi + : V V V, tj. u, v V : u + v V : T V V, tj. ( u V )( a T ) : a u V které splňují

10. Soustavy lineárních rovnic, determinanty, Cramerovo pravidlo

1 Báze a dimenze vektorového prostoru 1

= je prostý orientovaný graf., formálně c ( u, v) 0. dva speciální uzly: zdrojový uzel s a cílový uzel t. Dále budeme bez

Modely teorie grafů, min.kostra, max.tok, CPM, MPM, PERT

Vrcholová barevnost grafu

Úvod do vybíravosti grafů, Nullstellensatz, polynomiální metoda

Operační výzkum. Síťová analýza. Metoda CPM.

Jan Březina. 7. března 2017

4 Pojem grafu, ve zkratce

Grafy. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 13.

Teorie užitku. Marta Vomlelová 14. prosince / 23

Vektorové podprostory, lineární nezávislost, báze, dimenze a souřadnice

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od podzimu 2016

IB112 Základy matematiky

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od jara 2014

5 Orientované grafy, Toky v sítích

0.1 Úvod do lineární algebry

PQ-stromy a rozpoznávání intervalových grafů v lineárním čase

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od podzimu 2014

Usuzování za neurčitosti

Výroková a predikátová logika - IV

10 Podgrafy, isomorfismus grafů

Kostry. 9. týden. Grafy. Marie Demlová (úpravy Matěj Dostál) 16. dubna 2019

Ústav teorie informace a automatizace. J. Vomlel (ÚTIA AV ČR) Úvod do bayesovských sítí 30/10/ / 28

TGH08 - Optimální kostry

5. Lokální, vázané a globální extrémy

Dijkstrův algoritmus

Dnešní program odvozování v Bayesovských sítích exaktní metody (enumerace, eliminace proměnných) aproximační metody y( (vzorkovací techniky)

Minimalizace KA - Úvod

Výroková a predikátová logika - III

Výroková a predikátová logika - II

1 Řešení soustav lineárních rovnic

Matematika I 12a Euklidovská geometrie

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od podzimu 2015

PŘEDNÁŠKA 2 POSLOUPNOSTI

Vektory a matice. Obsah. Aplikovaná matematika I. Carl Friedrich Gauss. Základní pojmy a operace

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

Ukážeme si lineární algoritmus, který pro pevné k rozhodne, zda vstupní. stromový rozklad. Poznamenejme, že je-li k součástí vstupu, pak rozhodnout

Kolik existuje různých stromů na pevně dané n-prvkové množině vrcholů?

1 Topologie roviny a prostoru

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.

Výroková a predikátová logika - II

IB112 Základy matematiky

Obsah prezentace. Základní pojmy v teorii o grafech Úlohy a prohledávání grafů Hledání nejkratších cest

0.1 Úvod do lineární algebry

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od jara 2016

fakulty MENDELU v Brně (LDF) s ohledem na disciplíny společného základu (reg. č. CZ.1.07/2.2.00/28.

Definice 1 eulerovský Definice 2 poloeulerovský

Agent pracující v částečně pozorovatelném prostředí udržuje na základě senzorického modelu odhaduje, jak se svět může vyvíjet.

ANALYTICKÁ GEOMETRIE V ROVINĚ

α β ) právě tehdy, když pro jednotlivé hodnoty platí β1 αn βn. Danou relaci nazýváme relace

TGH10 - Maximální toky

Jan Březina. Technical University of Liberec. 21. dubna 2015

Matematika (CŽV Kadaň) aneb Úvod do lineární algebry Matice a soustavy rovnic

oddělení Inteligentní Datové Analýzy (IDA)

GRAFY A GRAFOVÉ ALGORITMY

Markovské procesy. příklad: diabetický pacient, hladina inzulinu, léky, jídlo

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od jara 2017

Diskrétní matematika. DiM /01, zimní semestr 2018/2019

LDF MENDELU. Simona Fišnarová (MENDELU) Základy lineárního programování VMAT, IMT 1 / 25

Důkaz Heineho Borelovy věty. Bez újmy na obecnosti vezmeme celý prostor A = M (proč? úloha 1). Implikace. Nechť je (M, d) kompaktní a nechť.

Funkce komplexní proměnné a integrální transformace

Další NP-úplné problémy

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně

3 Lineární kombinace vektorů. Lineární závislost a nezávislost

Vysoká škola ekonomická Praha. Tato prezentace je k dispozici na:

TEORIE GRAFŮ TEORIE GRAFŮ 1

Paralelní grafové algoritmy

Limitní věty teorie pravděpodobnosti. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Zdůvodněte, proč funkce n lg(n) roste alespoň stejně rychle nebo rychleji než než funkce lg(n!). Symbolem lg značíme logaritmus o základu 2.

PŘEDNÁŠKA 7 Kongruence svazů

Modely Herbrandovské interpretace

10 Přednáška ze

EM algoritmus. Proč zahrnovat do modelu neznámé veličiny

autorovu srdci... Petr Hliněný, FI MU Brno 1 FI: MA010: Průnikové grafy

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

Riemannův určitý integrál

Poznámka. V některých literaturách se pro označení vektoru také používá symbolu u.

Výroková a predikátová logika - VIII

Neurčitost: Bayesovské sítě

(ne)závislost. α 1 x 1 + α 2 x α n x n. x + ( 1) x Vektoru y = ( 1) y říkáme opačný vektor k vektoru y. x x = 1. x = x = 0.

Výroková a predikátová logika - II

VLASTNOSTI GRAFŮ. Doc. RNDr. Josef Kolář, CSc. Katedra teoretické informatiky, FIT České vysoké učení technické v Praze. BI-GRA, LS 2010/2011, Lekce 5

Matematika I 2a Konečná pravděpodobnost

Věta o dělení polynomů se zbytkem

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ

TOKY V SÍTÍCH II. Doc. RNDr. Josef Kolář, CSc. Katedra teoretické informatiky, FIT České vysoké učení technické v Praze

Soustavy linea rnı ch rovnic

4EK311 Operační výzkum. 5. Teorie grafů

Jan Březina. Technical University of Liberec. 30. dubna 2013

Diskrétní matematika. DiM /01, zimní semestr 2016/2017

Vícerozměrná rozdělení

ALGEBRA. Téma 5: Vektorové prostory

13. cvičení z PSI ledna 2017

Zjednodušení generativního systému redukcí rozlišení

Transkript:

Výpočet marginálních podmíněných pravděpodobností v bayesovské síti Úmluva: Zajímáme se pouze o bayesovské sítě, jejichž graf je spojitý. Jinak uvažujeme každou komponentu zvlášť. Notace Definition (Pojmy v orientovaném grafu) parents( either,chestdag$dag) - odkud vede hrana do either children( tub,chestdag$dag) - kam vede hrana z tub ancestralset( either,chestdag$dag) - ancestrální množina, předkové Pravděpodobnostní grafické modely 3 Posílání zpráv ve stromu spojení 25. října 2017 1 / 27

Moralizace, sousedé, klika, simpliciální uzly Definition (Moralizace) Moralizací grafu bayesovské sítě rozumíme následující dva kroky: Oženit (spojit hranou) rodiče společných dětí. (Neboli: spojit hranou každé dva vrcholy, které se společně vyskytují v některé tabulce dané bayesovské sítě.) Zapomenout orientaci hran, tj. vytvořit neorientovaný graf se stejnými hranami. Definition (Pojmy v neorientovaném grafu) Nechť X je uzel neorientovaného grafu. Pak mají označení následující význam: N X sousedé X sousedé X včetně X samého (family) F X Podgraf je úplný, pokud jsou každé dva jeho uzly spojeny hranou. Podgraf je klika, pokud je maximální úplný podgraf. Vrchol X je simpliciální, pokud je N X úplný podgraf. Ekvivalentně: vrchol X je simpliciální, je li F X klika. Pravděpodobnostní grafické modely 3 Posílání zpráv ve stromu spojení 25. října 2017 2 / 27

Graf domén Definition (Graf domén) Graf domén v konkrétním kroku eliminace proměnných je takový graf, kde uzly jsou právě všechny dosud neeliminované proměnné, dva uzly jsou spojeny hranou právě když se odpovídající proměnné vyskytují v aspoň jedné tabulce zároveň. Graf domén je na počátku moralizovaná bayesovská síť. Po eliminaci každé proměnné odstraníme jí příslušející uzel a spojíme všechny jeho sousedy (nově přidané hrany se nazývají doplněné, fill in). Naším cílem jsou co nejmenší domény, tj. co nejméně doplněných hran. Pravděpodobnostní grafické modely 3 Posílání zpráv ve stromu spojení 25. října 2017 3 / 27

Algoritmus eliminace proměnných INIT Do seznamu Φ 1 dáme všechny tabulky P(A i, e pa(a i )), v každé tabulce odstraním "řádky"nekonzistentní s evidencí, tj. s nulovou pravděpodobností. Tj. předem evidencí vynásobíme a marginalizujeme přes proměnné s evidencí. ELIM Postupně budeme eliminovat (následujícím algoritmem) všechny proměnné bez evidence, které nás nezajímají (dostaneme P(A, e)). ORM Nakonec eliminujeme i zbývající proměnné bez evidence, čímž spočteme normalizační konstatnu α = P(e); touto konstantou vydělíme tabulku z předchozího kroku a dostaneme podmíněnou pravděpodobnost P(A e). Eliminace proměnné X v kroku i znamená: 1 Vyber z Φ i všechny tabulky, které mají v doméně X, dej je do Φ X. 2 Spočti φ = X Π T Φ X T 3 Nové Φ i+1 se rovná: Φ i \ Φ X {φ} V jakém pořadí eliminovat? Špatné pořadí vede ke zbytečně velkým tabulkám φ. patně Nejdřív nepozorované rodiče (např. v minách ). rávně Nejdřív barren tj. uzly bez dětí a bez evidence. becně Nejdřív simpliciální uzly. Pravděpodobnostní grafické modely 3 Posílání zpráv ve stromu spojení 25. října 2017 4 / 27

Perfektní eliminační posloupnost Definition (Perfektní eliminační posloupnost) Perfektní eliminační posloupnost je taková posloupnost eliminace všech proměnných bayesovské sítě, která nevynucuje žádné doplněné hrany v grafu domén. Lemma (6 Simpliciální uzel smí na začátek PEP) Nechť je X 1,..., X k perfektní eliminační posloupnost (PEP), X j uzel, jehož každí dva sousedi jsou spojeni hranou. Pak je posloupnost X j, X 1,..., X j 1, X j+1,..., X k také perfektní. Eliminace X j nepřidá žádnou hranu, tj. nikomu nepřidá souseda, a při eliminaci se každý stará jen o své sousedy, tj. se na eliminaci ostatních nic nezmění (ledaže by nemuseli přidávat hranu do X j, ale i původní posloupnost byla perfektní). Pravděpodobnostní grafické modely 3 Posílání zpráv ve stromu spojení 25. října 2017 5 / 27

Definition (Množina maximálních domén) Množina maximálních domén je množina všech domén tabulek, vzniklých během výpočtu, ze které vyřadíme ty domény, které jsou vlastní podmnožinou jiného prvku této množiny. Lemma Všechny perfektní posloupnosti vytvářejí stejnou množinu maximálních domén, a to množinu klik moralizovaného grafu. Kliky tam musí být, neboť tabulka jejich domény vznikne při eliminaci první proměnné z kliky. Nic většího tam nemůže být, neboť by to způsobilo doplněné hranu. Pravděpodobnostní grafické modely 3 Posílání zpráv ve stromu spojení 25. října 2017 6 / 27

Triangulované grafy POZOR, něco jiného než triangulovaný planární graf!!! Pozn: Pro některé moralizované grafy neexistuje perfektní posloupnost. Definition (triangulovaný graf) Graf je triangulovaný, pokud pokud pro něj existuje perfektní eliminační posloupnost. Lemma (Alternativní definice triang. grafu) Graf je triangulovaný, pokud každý jeho cyklus délky větší než tři má aspoň jednu tětivu. Je chestdag triangulovaný? Pravděpodobnostní grafické modely 3 Posílání zpráv ve stromu spojení 25. října 2017 7 / 27

Lemma Nechť je G triangulovaný graf a X simpliciální uzel. Pak graf G získaný eliminací X z G je také triangulovaný. Důsledek lemmatu 6. Theorem Triangulovaný graf s aspoň dvěma vrcholy má aspoň dva simpliciální uzly. Navíc: pokud není úplný, tak má aspoň dva simpliciální uzly, které nejsou spojeny hranou. Důkaz indukcí podle počtu vrcholů. Pro tři vrcholy platí. Pro více: První uzel perfektní posloupnosti je simpliciální, vzniklý graf je triangulovaný. Pokud vzniklý graf není úplný, z indukčního předpokladu má aspoň dva nesousední simpliciální uzly, sousedé eliminovaného uzlu byly propojeni (simpliciální uzel) proto aspoň jeden z nových simpliciálních uzlů nesousedil s eliminovaným uzlem. Pravděpodobnostní grafické modely 3 Posílání zpráv ve stromu spojení 25. října 2017 8 / 27

Lemma Pro každý vrchol A triangulovaného grafu existuje perfektní posloupnost, kde je A poslední prvek. Důkaz: Vždy eliminuj simpliciální uzel různý od A. Theorem Neorientovaný graf je triangulovaný právě když můžeme eliminovat všechny uzly tak, že vždy eliminujeme simpliciální uzel. Je li graf triangulovaný, eliminací simpliciálního uzlu vznikne opět triangulovaný graf a můžeme pokračovat v eliminaci simpliciálních uzlů. Eliminací simpliciálních uzlů tvoříme perfektní posloupnost, tj. graf je triangulovaný. Pravděpodobnostní grafické modely 3 Posílání zpráv ve stromu spojení 25. října 2017 9 / 27

Stromy spojení (Join trees) Definition (Strom spojení) Mějme množinu klik neorientovaného grafu G, kliky jsou organizovány do stromu T. T je strom spojení, pokud pro každé dva vrcholy V, W T všechny uzly na cestě z V do W obsahují průnik W V. Průnik dvou sousedních uzlů nazveme separátor těchto uzlů, separátorem V a W je S V,W = V W. Theorem Pokud kliky grafu G lze organizovat do stromu spojení, pak je G triangulovaný. Vezměme list stromu spojení V, který sousedí jen s W. V průnik libovolný uzel je částí W, proto V obsahuje uzel, který není v žádné jiné klice. Ten eliminujeme. Pokud byl poslední z W \ V, odstraníme uzel V a dostaneme zase strom spojení, který má list, pokračujeme prvním bodem. Pravděpodobnostní grafické modely 3 Posílání zpráv ve stromu spojení 25. října 2017 10 / 27

Theorem Pokud je G triangulovaný, pak kliky grafu G lze organizovat do stromu spojení. Důkaz indukcí, pro grafy s jedním vrcholem platí. Eliminuji simpliciální uzel X, jeho rodina F X je klika (označíme jí C). Pro vzniklý graf G = G \ {X} najdu strom spojení T dle indukčního předpokladu. Pokud je C \ {X} klika G, k uzlu odpovídajícímu této klice v T přidám popisku X a mám strom spojení grafu G. Pokud C \ {X} není klika G : musí být částí kliky C? grafu G, Ke stromu T přidáme uzel C a připojíme separátorem C \ {X} k uzlu kliky C?. Vzniklý strom je strom spojení pro G. Pravděpodobnostní grafické modely 3 Posílání zpráv ve stromu spojení 25. října 2017 11 / 27

Alternativní konstrukce Najdi kliky. Vytvoř graf, uzly=kliky, hrany váhy počtu veličin v průniku. Najdi kostru (spanning tree) nejvyšší váhy (Prim s or Kruskal s algorithm). Tato kostra je strom spojení, protože Je-li proměnná X v j klikách, může být maximálně v j 1 separátorech stromu spojení. Číslo j 1 dosáhneme jen v případě, že všechny kliky obsahující X budou spojeny separátorem obsahujícím X. Proto má strom spojení nejvyšší možný součet velikostí separátorů přes všechny kostry grafu. Pravděpodobnostní grafické modely 3 Posílání zpráv ve stromu spojení 25. října 2017 12 / 27

Join tree, Junction tree Strom spojení Používám termín strom spojení ve třech významech: viz definice výše, strom klik splňující vlastnost průniků strom dle definice výše, kde jsou navíc hrany označeny separátory strom dle definice výše, kde je navíc v každé klice "schránka" na seznam pravděpodobnostních tabulek a v každém separátoru jsou dvě schránky na zprávy tabulky jdoucí jednotlivými směry. Tomuto se říká junction tree. Pravděpodobnostní grafické modely 3 Posílání zpráv ve stromu spojení 25. října 2017 13 / 27

Strom spojení reprezentující bayesovskou síť Mějme bayesovskou síť s množinou pravděpodobnostních tabulek Φ a evidenci e. Nechť množina tabulek Φ e vznikne z Φ vložením evidence e do příslušných tabulek, tj. "vyříznutím"konkrétních "řádků"v pravděpodobnostních tabulkách. Strom spojení reprezentuje bayesovskou síť s evidencí e, pokud každou tabulku φ Φ e přiřadíme do schránky některé z klik C i takových, že dom(φ) C i. Pozn: pokud strom spojení vznikl z moralizovaného a triangularizovaného grafu bayesovské sítě, tak takové klika vždy existuje. Pokud moralizovaný graf není triangulovaný, doplníme ho hranami na triangulovaný a z něj vytvoříme strom spojení. Pokud některý uzel stromu spojení nemá žádnou tabulku, přiřadíme tabulku dávající identicky 1 na doméně dané kliky. Pravděpodobnostní grafické modely 3 Posílání zpráv ve stromu spojení 25. října 2017 14 / 27

Propagace ve stromu spojení Propagace (výpočet) ve stromu spojení spočívá v posílání zpráv, kterými se postupně plní schránky separátorů. Každý uzel (klika) posílá v každém směru právě jednu zprávu. Uzel (klika) může poslat zprávu v daném směru, pokud už ze všech ostatních směrů zprávy dostala. Protože se jedná o strom, vždycky někdo může poslat zprávu, nebo jsou již všechny schránky plné. Pravděpodobnostní grafické modely 3 Posílání zpráv ve stromu spojení 25. října 2017 15 / 27

Poslání zprávy Uvažujme kliku C se sousedními separátory S 1,..., S k, směr separátoru S 1 (bez újmy na obecnosti). Poslat zprávu z C do S 1 znamená zapsat do odchozí schránky S 1 tabulku, která vznikne součinem příchozích zpráv v separátorech S 2,..., S k a tabulek obsažených v C. Tento součin marginalizujeme přes všechny veličiny C \ S 1 a výsledek zapíšeme do S 1. Pravděpodobnostní grafické modely 3 Posílání zpráv ve stromu spojení 25. října 2017 16 / 27

Theorem Nechť strom spojení reprezentuje bayesovskou síť a evidenci e, všechny schánky byly naplněny. Potom: Nechť V je klika obsahující tabulky Φ V a k ní směřující separátory S 1,..., S k obsahují zprávy φ 1,..., φ k. P(V, e) = Π φ ΦV φ Π k i=1φ i Nechť S je separátor se zprávami φ 1, φ 2. P(S, e) = φ 1 φ 2 Zprávy směřující do V odpovídají perfektní elim. posl., která má V na svém konci. Pro separátor, odchozí zpráva vznikla marginalizací z V, jen tam nebyla započtena zpráva přicházející z tohoto směru. P(S 1, e) = V \S 1 P(V, e) = V \S 1 (Π φ ΦV φ Π k i=1φ i ) = V \S 1 (Π φ ΦV Π k i=2φ i φ 1 ) = ( V \S 1 Π φ ΦV Π k i=2φ i ) φ 1 což je odchozí krát příchozí zpráva. Poslední řádek plyne z toho, že dom(φ 1 ) = S 1.

Výpočet pomocí stromu spojení (shrnutí) BN moralizujeme doplníme hrany na triangulovaný graf vytvoříme strom spojení naplníme tabulkami vypočteme posíláním zpráv pravděpodobnost na veličině A zjistíme tak, že najdeme libovolnou kliku C obsahující A a marginalizujeme, tj. P(A, e) = C\{A} P(C, e) pokud nás zajímá sdružená distibuce na množině, která není částí žádné kliky, musíme použít Eliminaci proměnných. Nebo předem zajistit výskyt v jedné klice: m3=compile(grain(plist),root=c( lung, bronc, tub ), propagate=true). Pravděpodobnostní grafické modely 3 Posílání zpráv ve stromu spojení 25. října 2017 18 / 27

Separace, rozložitelnost Definition (Separace) Buď G neorientovaný graf nad V. Řekneme C separuje A a B, psáno A G B C v G, pokud každá cesta z A do B v G vede přes C. Definition (Rozklad) Buď G neorientovaný graf nad V. Jestliže S, T V jsou takové, že 1 S T = N 2 S T je úplná množina v G a 3 S \ T G T \ S S T, Pak dvojici indukovaných podgrafů G S, G T nazveme rozkladem G. Tento rozklad nazveme netriviální, jestli že S \ T T \ S. Neorientovaný graf G nazveme rozložitelný buď G je úplný nebo existuje netriviální rozklad G S, G T grafu G takový, že G S a G T jsou rozložitelné. Pravděpodobnostní grafické modely 3 Posílání zpráv ve stromu spojení 25. října 2017 19 / 27

Markovské vlastnosti Definition Markovská vlastnost, Globální, lokální, párová Buď G neorientovaný graf nad V. Pravděpodobnostní míra P nad V je (globálně) markovská vzhledem k G, jestliže: (A, B V, C V ) A G B C A B C v P. Míra je lokálně markovská, pokud A V A V \ Fa A N A [P] Míra je párově markovská, pokud A, B V, A B, nespojené hranou, A B V \ {A, B} [P] Pro strikně positivní míry (bez nul) jsou všechny tři vlastnosti ekvivalentní. Jinak protipříklady s mírou v bodech (0, 0, 0) a (1, 1, 1) viz Studený. Pravděpodobnostní grafické modely 3 Posílání zpráv ve stromu spojení 25. října 2017 20 / 27

Definition (d-separace) Dvě veličiny A, B V bayesovské sítě G = (V, E) jsou d-separované A d B C množinou C V \ {A, B} právě když pro každou (neorientovanou) cestu z A do B platí aspoň jedno z následujících: cesta obsahuje uzel Blocking C a hrany se v Blocking nesetkávají head-to-head, cesta obsahuje uzel Blocking kde se hrany setkávají head-to-head a ani on ani nikdo z jeho následníků není v C, {Blocking, succ(blocking)} C =. Theorem (d-separace) Pokud jsou A, B d-separované dáno C (A d B C) v BN B, pak jsou i podmíněně nezávislé (A B C). A C E Platí? E d B ano E d D ne E d D A ne E d D C ano B D F E d D {C, F } ne E d B F ne Pravděpodobnostní grafické modely 3 Posílání zpráv ve stromu spojení 25. října 2017 21 / 27

Podmíněná nezávislost Tabulka ukazuje zadané hodnoty P(A, B, C). Pro která x, y, v, w platí podmíněná nezávislost A B C? c1 c2 b1 b2 b1 b2 a1 x 0,2 v w a2 y 0,1 0,1 0,1 P(a 1, b 1, c 1 ) P(a 2, b 1, c 1 ) = P(a 1 c 1 ) P(b 1 c 1 ) P(c 1 ) P(a 2 c 1 ) P(b 1 c 1 ) P(c 1 ) = P(a 1, b 2, c 1 ) P(a 2, b 2, c 1 ) tedy x = 2 y obdobně v = w. Navíc celkový součet musí být 1, tedy: 0, 5 + 3y + 2v = 1 v = 0, 25 1, 5y Pravděpodobnostní grafické modely 3 Posílání zpráv ve stromu spojení 25. října 2017 22 / 27

Přibližný výpočet bayesovské sítě Základní myšlenkou je vygenerovat data dle zadaných podmíněných pravděpodobností a z nich spočítat pravděpodobnosti, které nás zajímají. Přesnost výpočtu samozřejmě závisí na počtu vygenerovaných vzorků. Metody generující náhodné vzorky se nazývají metody Monte Carlo. Základem je generátor náhodného výsledku podle zadané pravděpodobnosti, např. 1 4, 1 2, 1 4. Pravděpodobnostní grafické modely 3 Posílání zpráv ve stromu spojení 25. října 2017 23 / 27

Přímé vzorkování bez evidence Uspořádáme vrcholy BN tak, aby každá hrana začínala v uzlu menšího čísla než končí. Vytvoříme N vzorků, každý následovně Pro první uzel A 1 vygenerujeme náhodně výsledek a 1 podle P(A 1). Pro druhý uzel A 2 vygenerujeme náhodně výsledek a 2 podle P(A 2 A 1 = a 1) (je li hrana, jinak nepodmíněně) Pro n tý uzel vygenerujeme výsledek podle P(A n pa(a n)), na rodičích už známe konkrétní hodnoty. Z N vzorků spočteme pravděpodobnost jevu, který nás zajímá. Pro N jdoucí k nekonečnu podíl výskytu jevu konverguje k správné pravděpodobnosti. Pravděpodobnostní grafické modely 3 Posílání zpráv ve stromu spojení 25. října 2017 24 / 27

Přímé vzorkování s evidencí e (rejection sampling) N(e) značí počet vzorků konzistentních s evidencí e, tj. nabývající na příslušných veličinách správné hodnoty. Vzorky tvoříme úplně stejně, jako dříve, jen ty, co nejsou konzistentní s e vyšktneme, tj. ˆP(X e) = N(X,e) N(e) Problém je v tom, že je li P(e) malé, tak většinu vzorků zahazujeme. Pravděpodobnostní grafické modely 3 Posílání zpráv ve stromu spojení 25. října 2017 25 / 27

Vážení věrohodností (Likelihood weighting) Generuje jen vzorky konzistentní s e. Váhy vzorků jsou různé, podle P(e vzorek) (což je věrohodnost L(vzorek e), odtud likelihood weighting). Algoritmus vytvoření váženého vzorku pro (bn, e) w = 1 v pořadí topologického uspořádání bn, for i = 1 to n if A i má evidenci a i v e w = w P(A i = a i pa(a i )) else a i vyber podle rozložení P(A i = a i pa(a i )) return (w, a 1,..., a n ) Pravděpodobnostní grafické modely 3 Posílání zpráv ve stromu spojení 25. října 2017 26 / 27