Prohledávání svazu zjemnění

Podobné dokumenty
Rekonstrukce diskrétního rozdělení psti metodou maximální entropie

PC: Identifikace struktury zobecněného dynamického systému

Schéma identifikační procedury

Zjednodušení generativního systému redukcí rozlišení

Kybernetika. Wiener 1948: Rok 2000:

Aplikace 2: Hledání informativních příznaků pro rozpoznávání

Síla a významnost asociace mezi proměnnými v systému

Umělá inteligence II

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

UČENÍ BEZ UČITELE. Václav Hlaváč

Obr. 1: Vizualizace dat pacientů, kontrolních subjektů a testovacího subjektu.

Analýza textury. Radim Šára Centrum strojového vnímání FEL ČVUT. DZO, R. Šára

Náhodné vektory a matice

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

13.1. Úvod Cílem regresní analýzy je popsat závislost hodnot znaku Y na hodnotách

State Space Search Step Run Editace úloh Task1 Task2 Init Clear Node Goal Add Shift Remove Add Node Goal Node Shift Remove, Add Node


Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Pokročilé neparametrické metody. Klára Kubošová

Agent pracující v částečně pozorovatelném prostředí udržuje na základě senzorického modelu odhaduje, jak se svět může vyvíjet.

STATISTICKÉ ODHADY Odhady populačních charakteristik

Kybernetika a umělá inteligence, cvičení 10/11

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Statistická analýza jednorozměrných dat

1 0 0 u 22 u 23 l 31. l u11

AVDAT Mnohorozměrné metody, metody klasifikace

Regresní analýza 1. Regresní analýza

LINEÁRNÍ MODELY. Zdeňka Veselá

PRAVDĚPODOBNOST A STATISTIKA

Umělá inteligence I. Roman Barták, KTIML.

Testy. Pavel Provinský. 19. listopadu 2013

Lineární stabilita a teorie II. řádu

Jana Vránová, 3. lékařská fakulta UK

správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B.

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně

1 Extrémy funkcí - slovní úlohy

y = 1/(x 3) - 1 x D(f) = R D(f) = R\{3} D(f) = R H(f) = ( ; 2 H(f) = R\{ 1} H(f) = R +

Regresní a korelační analýza

Apriorní rozdělení. Jan Kracík.

Rozdělení náhodné veličiny. Distribuční funkce. Vlastnosti distribuční funkce

Zdůvodněte, proč funkce n lg(n) roste alespoň stejně rychle nebo rychleji než než funkce lg(n!). Symbolem lg značíme logaritmus o základu 2.

8 Coxův model proporcionálních rizik I

1 Polynomiální interpolace

VLASTNOSTI GRAFŮ. Vlastnosti grafů - kap. 3 TI 5 / 1

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Příklady - Bodový odhad

ROZPOZNÁVÁNÍ S MARKOVSKÝMI MODELY

AVDAT Náhodný vektor, mnohorozměrné rozdělení

CVIČNÝ TEST 36. OBSAH I. Cvičný test 2. Mgr. Tomáš Kotler. II. Autorské řešení 6 III. Klíč 15 IV. Záznamový list 17

4EK211 Základy ekonometrie

7. Funkce jedné reálné proměnné, základní pojmy

TECHNICKÁ UNIVERZITA V LIBERCI

Matematická analýza pro informatiky I.

Statistická teorie učení

PRAVDĚPODOBNOST A STATISTIKA

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Analýza textury sonografických obrazů difúzních procesů

12. cvičení z PST. 20. prosince 2017

Bayesian Networks. The graph represents conditional independencies of the join probability distribution Π X V P(X pa(x)).

Modely Herbrandovské interpretace

Vzdálenost uzlů v neorientovaném grafu

Jasové transformace. Karel Horák. Rozvrh přednášky:

4EK211 Základy ekonometrie

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

Klasifikace a rozpoznávání. Lineární klasifikátory

Síla a významnost asociace mezi proměnnými v systému

Úvodem Dříve les než stromy 3 Operace s maticemi

Vytěžování znalostí z dat

STROMY A KOSTRY. Doc. RNDr. Josef Kolář, CSc. Katedra teoretické informatiky, FIT České vysoké učení technické v Praze. BI-GRA, LS 2010/2011, Lekce 6

AVDAT Mnohorozměrné metody, metody klasifikace Shluková analýza

Vlastnosti odhadů ukazatelů způsobilosti

Bayesovská klasifikace

7. Analýza rozptylu.

AVDAT Nelineární regresní model

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

Dnešní látka: Literatura: Kapitoly 3 a 4 ze skript Karel Rektorys: Matematika 43, ČVUT, Praha, Text přednášky na webové stránce přednášejícího.

Literatura: Kapitoly 3, 4 a 2 d) ze skript Karel Rektorys: Matematika 43, ČVUT, Praha, Text přednášky na webové stránce přednášejícího.

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

PRAVDĚPODOBNOST A STATISTIKA

Základy počtu pravděpodobnosti a metod matematické statistiky

Ilustrační příklad odhadu LRM v SW Gretl

Aproximace binomického rozdělení normálním

Přednáška X. Testování hypotéz o kvantitativních proměnných

Kapitola 1: Reálné funkce 1/13

NEPARAMETRICKÉ BAYESOVSKÉ ODHADY V KOZIOLOVĚ-GREENOVĚ MODELU NÁHODNÉHO CENZOROVÁNÍ. Michal Friesl

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Pravděpodobně skoro správné. PAC učení 1

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Vícerozměrná rozdělení

Kapitola 1. Úvod. 1.1 Značení. 1.2 Výroky - opakování. N... přirozená čísla (1, 2, 3,...). Q... racionální čísla ( p, kde p Z a q N) R...

III. Úplná pravděpodobnost. Nezávislé pokusy se dvěma výsledky. Úplná pravděpodobnost Nezávislé pokusy se dvěma výsledky Náhodná veličina

Příklady na testy hypotéz o parametrech normálního rozdělení

Výpočetní teorie strojového učení a pravděpodobně skoro správné (PAC) učení. PAC učení 1

oddělení Inteligentní Datové Analýzy (IDA)

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

4EK211 Základy ekonometrie

Transkript:

Prohledávání svazu zjemnění Rekonstrukční chyba je monotonně neklesající podél každé cesty svazu zjemnění: Je-li G i G k G j potom (G i ) (G k ) (G j ) Rekonstrukční chyba je aditivní podél každé cesty svazu zjemnění: je-li G i G k G j, potom (G j, G i ) = (G k, G i ) + (G j, G k ) [Higashi 1983] Nejjednodušší postup: Hledáme cestu, podle které roste nejpomaleji Složitější postup: Na každé úrovni nás zajímá množina řešení s nejmenším G 0 G 1 = 0 (H(G 0 ) = 8.32) = 0.0001 Není nutno expandovat všechny větve: postačí metoda větví a mezí [Narenda&Fukunaga 1977] G 2 0.0049 G 3 0.3373 G 4 0.0162 G 5 0.3960 G 6 0.0749 0.4073 G 7 G 8 = 0.4660 Systém, identifikace struktury; R. Šára, CMP (str. 34)

Aditivita podél cesty ve svazu zjemnění rozkladu pro jednoduchost předpokládáme, že jednoduchá spojovací procedura stačí k nestrannému spojení S 01 02 { 1 S, 2 S} 1 S = 11 S 12 S 1k S 12 02? = 01 + 12 { 11 S, 12 S,..., 1k S, 2 S} 1 S a b 2 S c 01 = L(S, 1 S 2 S) = i,j,k p(a i, b j, c k ) log p(a i, b j, c k ) p (a i, b j, c k ) 12 = L( 1 S 2 S, 1 S 2 S) = L( 1 S, 1 S ) = i,j 1 p(a i, b j ) log 1 p(a i, b j ) 1 p (a i, b j ) 02 = L(S, 1 S 2 S) Systém, identifikace struktury; R. Šára, CMP (str. 35)

Metoda větví a mezí na svazu zjemnění ki T k1 k: G k1 G k2 G ki G kn T G T G k i k i? T 1. vygeneruj úroveň k 2. nalezni uzel G k1 s nejmenším a expanduj ho 3. najdi G T s nejmenším mezi expandovanými uzly 4. zvol práh T = (G T ) 5. expanduj G k2, G k3,..., G kn jen pokud (G ki ) T 6. (aktualizuj T, pokud nalezneš menší hodnotu prahu) 7. pokračuj stejně na úrovni k + 1 Takto lze jen proto, že platí monotonicita! Toto není obecná metoda větví a mezí Systém, identifikace struktury; R. Šára, CMP (str. 36)

Identifikační procedura 1. Identifikuj zobecněný dynamický systém S z datového systému D. 2. Vytvoř rekonstrukční hypotézu G 0 = {S}. 3. Prohledej svaz zjemnění hypotézy G 0, na každé úrovni zjemnění zaznamenej hypotézu G k o nejmenší hodnotě (G k ). 4. Výsledkem je soubor nejlepších dekompozičních hypotéz klesajícího stupně strukturní složitosti. Systém, identifikace struktury; R. Šára, CMP (str. 37)

Sonogram štítné žlázy v podélném řezu zdravá lymfocitická thyroitida Systém, identifikace struktury; R. Šára, CMP (str. 38)

Příklad: Klasifikace textury Aplikace Diagnóza difúzních změn ve štítné žláze. Pracovní hypotéza Klasifikace je možná na základě textury. Volba Model založený na zobecněném dynamickém systému (kookurenční matici). Základní problém Zvolit co nejmenší model textury založený na funkci přípustnosti. Důvody: 1. klasifikace je jednodušší 2. klasifikátor je mnohem snadnější naučit Systém, identifikace struktury; R. Šára, CMP (str. 39)

Rekonstrukční analýza vzorek textury: svaz zjemnění G 0 = 0 (H(G 0 ) = 8.32) rekonstrukční hypotézy G 0 = 123 maska: 1 2 3 G 1 = 0.0001 G 1 = 12 13 23 G 2 = 12 13 G 3 = 12 23 G 2 0.0049 G 3 0.3373 G 4 0.0162 G 4 = 13 23 G 5 = 12 3 G 5 0.3960 G 6 0.0749 0.4073 G 7 G 6 = 13 2 G 7 = 1 23 G 8 = 0.4660 G 8 = 1 2 3 Závěr: kookurenční matici má smysl počítat pouze ve svislém směru Systém, identifikace struktury; R. Šára, CMP (str. 40)

Infanticida u myší Test hypotézy sexuálního soutěžení: samec zvyšuje svůj sexuální úspěch na úkor konkurentů tím, že zabíjí jeho potomstvo a páří se s jejich matkou. Studie: 114 jedinců 90-denních myší Funkce přípustnosti stavu v 1 v 2 v 3 dominance sexuální zkušenost chování vůči potomstvu ( 0 dominantní 1 podřízený ( 0 nemá 1 má 8 >< 0 infanticidní 1 rodičovské >: 2 nevšímavé v 1 v 2 v 3 N 0 0 0 28 0 0 1 4 0 0 2 2 0 1 0 5 0 1 1 25 0 1 2 3 1 0 0 5 1 0 1 9 1 0 2 8 1 1 0 7 1 1 1 15 1 1 2 3 Systém, identifikace struktury; R. Šára, CMP (str. 41)

Infanticida u myší: rekonstrukční analýza dominance chování 1 3 2 zkušenost svaz zjemnění G 0 0 (H(G 0 ) = 2.1569) rekonstrukční hypotézy G 0 = 123 G 1 0.0586 G 1 = 12 13 23 G 2 = 12 13 G 3 = 12 23 G 2 0.1702 G 3 0.0994 G 4 0.0588 G 4 = 13 23 G 5 = 12 3 G 5 0.2116 G 6 0.1710 G 7 0.1002 G 6 = 13 2 G 7 = 1 23 G 8 = 1 2 3 G 8 0.2124 Závěry chování je ovlivněno oběma faktory, ale zkušenost je dvakrát významnější než dominance ( G 6, G 7 ) dominance a zkušenost jsou nezávislé ( G 3 G 7, první vazba, která se rozpadne) Systém, identifikace struktury; R. Šára, CMP (str. 42)

Systém, identifikace struktury; R. Šára, CMP (str. 43) Struktura Parlamentu k G k (G k ) 1 1234 2345 3451 4512 5123 0.0158 2 1234 2345 3451 5123 0.0169 3 1234 2345 5123 451 0.0177 4 1234 2345 5123 0.0181 5 1234 5123 345 452 0.0194 6 1234 5123 345 0.0194 7 1234 5123 45 0.0195 8 5123 45 234 341 412 0.0230 9 45 234 341 412 512 123 235 351 0.0296 10 45 234 341 412 123 235 351 0.0296 11 45 234 341 412 235 351 0.0333 12 45 234 341 412 235 51 0.0398 13 45 234 341 235 51 12 0.0477 14 45 341 235 51 12 42 0.0544 15 45 341 235 51 12 0.0548 16 45 235 51 12 34 41 13 0.0614 17 45 235 51 12 34 13 0.0614 18 45 235 51 12 13 0.0641 19 45 235 51 12 0.0713 20 235 51 12 4 0.0800 21 235 12 4 0.0900 22 235 4 1 0.1025 23 4 1 23 35 52 0.1158 24 4 1 23 35 0.1158 25 4 1 35 2 0.1160 26 4 1 2 3 5 0.1169 0.12 0.1 0.08 0.06 0.04 0.02 0 1 3 5 7 9 11 13 15 17 19 21 23 25 uroven zjemneni

Parlament: interpretace úrovně 7 a 15+17 k G k (G k ) 7 1234 5123 45 0.0195 4 5 1 2 3 k G k (G k ) 15 45 341 235 51 12 0.0548 17 45 235 51 12 34 13 0.0614 2 1 4 5 3 Systém, identifikace struktury; R. Šára, CMP (str. 44)

Posibilistická funkce přípustnosti posibilita π: stupeň možnosti π = 1... událost je možná x i elementární jevy, x i S posibilita pravděpodobnost definiční vlastnosti π : exp S 0, 1 p: exp S 0, 1 π({}) = 0 p({}) = 0 π(s) = 1 p(s) = 1 π ( i x i) = max i π(x i ) p ( i x i) = i p(x i) π(x i ) N(x i) max N(x j ) j odhad z dat p(x i ) N(x i) N(x j ) j Systém, identifikace struktury; R. Šára, CMP (str. 45)

Posibilistická míra neurčitosti X α = {x i, π(x i ) α} L = {α, x i : π(x i ) = α} {0} α-řez množina α-hladin U-míra U(π) = k (α j α j 1 ) log X αj = j=2 1 0 log X α dα x i 1 2 3 4 5 6 π(x i ) 0.1 0.0 0.3 1.0 0.3 0.2 příklad j α j X αj X αj 1 0.0 6 2 0.1 5 3 0.2 4 4 0.3 3 5 1.0 1 U = 0.1 log 5 {z } j=2 + 0.1 log 4 {z } j=3 + 0.1 log 3 {z } j=4 + 0.7 log 1 {z } j=5 Systém, identifikace struktury; R. Šára, CMP (str. 46)

Posibilistické spojení Posibilistická marginální funkce π(x) = max y π(x, y) Posibilistická generativní neurčitost U(G Ḡ) = U(G, Ḡ) U(Ḡ) Posibilistické spojení ( 1 π 2 π)(a, b, c) = min (1 π(a, b), 2 π(b, c) ) není nutná iterativní spojovací procedura Rekonstrukční chyba (G) = L(π, π ) = 1 0 log X α(π ) X α (π) dα Systém, identifikace struktury; R. Šára, CMP (str. 47)

Diagnostika obvodů v 1 v 2 v 3 v 4 & 1 v 5 v 6 předpokládaný systém v 1 v 2 v 3 v 4 & 1 v 5 v 6 diagnostifikovaný systém není pozorován stav a pozorované stavy ḡ g v 1 v 2 v 3 v 4 v 5 v 6 0 0 0 0 0 0 0 0 0 1 0 1 0 0 1 0 0 1 0 0 1 1 0 1 0 1 0 0 0 0 0 1 0 1 0 1 0 1 1 0 0 1 0 1 1 1 0 1 1 0 0 0 0 0 1 0 0 1 0 1 1 0 1 0 0 1 1 0 1 1 0 1 a = 1 1 0 0 0 0 b = 1 1 0 0 1 1 1 1 0 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 správná rekonstrukční hypotéza 1256 3456 = G A G A > 0 obvod je vadný G A = 0 nedokazuje plnou funkcionalitu nutná rekonstrukční analýza pro předchůdce G A nutná rekonstrukční analýza pro následníky G A Systém, identifikace struktury; R. Šára, CMP (str. 48)

Podgraf s nulovou rekonstrukční chybou 1256 3456 předpokládaná struktura v 1 v 2 v 3 v 4 256 156 126 125 3456 & 1 156 126 125 3456 256 126 125 3456 256 156 125 3456 v 5 v 6 v 1 v 2 v 3 v 4 126 125 3456 156 26 125 3456 256 16 125 3456 26 16 125 3456 156 125 3456 26 16 125 3456 256 125 3456 & v 5 v 6 1 16 125 3456 26 125 3456 Pozn: (1256 346) = 3 125 3456 skutečná struktura Systém, identifikace struktury; R. Šára, CMP (str. 49)