Rekonstrukce diskrétního rozdělení psti metodou maximální entropie

Podobné dokumenty
Schéma identifikační procedury

Prohledávání svazu zjemnění

Síla a významnost asociace mezi proměnnými v systému

Funkce v ıce promˇ enn ych Extr emy Pˇredn aˇska p at a 12.bˇrezna 2018

Zjednodušení generativního systému redukcí rozlišení

PC: Identifikace struktury zobecněného dynamického systému

Charakterizace rozdělení

Semestrální písemka BMA3 - termín varianta A13 vzorové řešení

Definice spojité náhodné veličiny zjednodušená verze

Výběrové charakteristiky a jejich rozdělení

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Statistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I

a způsoby jejího popisu Ing. Michael Rost, Ph.D.

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

Charakterizují kvantitativně vlastnosti předmětů a jevů.

Mgr. Rudolf Blažek, Ph.D. prof. RNDr. Roman Kotecký Dr.Sc.

EXTRÉMY FUNKCÍ VÍCE PROMĚNNÝCH

Fyzikální korespondenční seminář MFF UK

n = 2 Sdružená distribuční funkce (joint d.f.) n. vektoru F (x, y) = P (X x, Y y)

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně

PRAVDĚPODOBNOST A STATISTIKA

Lineární algebra : Metrická geometrie

1 Rozptyl a kovariance

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

ÚSTAV MATEMATIKY A DESKRIPTIVNÍ GEOMETRIE. Matematika 0A4. Cvičení, letní semestr DOMÁCÍ ÚLOHY. Jan Šafařík

Aplikace 2: Hledání informativních příznaků pro rozpoznávání

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od jara 2014

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

Numerické řešení nelineárních rovnic

Apriorní rozdělení. Jan Kracík.

AVDAT Náhodný vektor, mnohorozměrné rozdělení

1 Báze a dimenze vektorového prostoru 1

Téma 22. Ondřej Nývlt

Vlastní (charakteristická) čísla a vlastní (charakteristické) Pro zadanou čtvercovou matici A budeme řešit maticovou

Definice globální minimum (absolutní minimum) v bodě A D f, jestliže X D f

Inovace bakalářského studijního oboru Aplikovaná chemie

MATEMATICKÁ STATISTIKA

Odhady Parametrů Lineární Regrese

Matematická analýza III.

naopak více variant odpovědí, bude otázka hodnocena jako nesprávně zodpovězená.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Chyby měření 210DPSM

Pravděpodobnost a statistika (BI-PST) Cvičení č. 7

Algoritmy komprese dat

prof. RNDr. Roman Kotecký DrSc., Dr. Rudolf Blažek, PhD Pravděpodobnost a statistika Katedra teoretické informatiky Fakulta informačních technologií

VYBRANÁ ROZDĚLENÍ. SPOJITÉ NÁH. VELIČINY Martina Litschmannová

3 Bodové odhady a jejich vlastnosti

I. D i s k r é t n í r o z d ě l e n í

Kybernetika a umělá inteligence, cvičení 10/11

Nosné desky. 1. Kirchhoffova teorie ohybu tenkých desek (h/l < 1/10) 3. Mindlinova teorie pro tlusté desky (h/l < 1/5)

Matematika II, úroveň A ukázkový test č. 1 (2018) 1. a) Napište postačující podmínku pro diferencovatelnost funkce n-proměnných v otevřené

6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový.

p(x) = P (X = x), x R,

y H = c 1 e 2x + c 2 xe 2x, Partikularni reseni hledam metodou variace konstant ve tvaru c 1(x)e 2x + c 2(x)xe 2x = 0

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Matematika II, úroveň A ukázkový test č. 1 (2017) 1. a) Napište postačující podmínku pro diferencovatelnost funkce n-proměnných v otevřené

7. Rozdělení pravděpodobnosti ve statistice

Numerické řešení nelineárních rovnic

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ

KGG/STG Statistika pro geografy

Dnešní látka: Literatura: Kapitoly 3 a 4 ze skript Karel Rektorys: Matematika 43, ČVUT, Praha, Text přednášky na webové stránce přednášejícího.

Uzavřené a otevřené množiny

správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B.

Derivace funkce. Přednáška MATEMATIKA č Jiří Neubauer

Základy teorie odhadu parametrů bodový odhad

Katedra matematiky Fakulty jaderné a fyzikálně inženýrské ČVUT v Praze Příjmení a jméno ➊ ➋ ➌ ➍ ➎ ➏ Bonus

Matematika II, úroveň A ukázkový test č. 1 (2016) 1. a) Napište postačující podmínku pro diferencovatelnost funkce n-proměnných v otevřené

MODEL TVÁŘECÍHO PROCESU

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Interpolace, ortogonální polynomy, Gaussova kvadratura

oddělení Inteligentní Datové Analýzy (IDA)

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

Nalezněte hladiny následujících funkcí. Pro které hodnoty C R jsou hladiny neprázdné

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od jara 2016

DRN: Kořeny funkce numericky

PRAVDĚPODOBNOST A STATISTIKA

Přijímací zkouška na navazující magisterské studium 2018

Q(y) dy = P(x) dx + C.

Přijímací zkoušky z matematiky pro akademický rok 2018/19 NMgr. studium Učitelství matematiky ZŠ, SŠ

Limitní věty teorie pravděpodobnosti. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Přijímací zkouška na navazující magisterské studium 2014

Vybraná rozdělení náhodné veličiny

Vlastnosti odhadů ukazatelů způsobilosti

Funkce jedné proměnné

Pravděpodobnost a statistika (BI-PST) Cvičení č. 9

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od jara 2017

LWS při heteroskedasticitě

Stochastické signály (opáčko)

2. Entropie a Informace. Gerstnerova laboratoř katedra kybernetiky fakulta elektrotechnická ČVUT v Praze

Kombinatorická minimalizace

Co jsme udělali: Au = f, u D(A)

Pravděpodobnost a statistika

Normální rozložení a odvozená rozložení

7. Derivace složené funkce. Budeme uvažovat složenou funkci F = f(g), kde některá z jejich součástí

Transkript:

Rekonstrukce diskrétního rozdělení psti metodou maximální entropie Příklad Lze nalézt četnosti nepozorovaných stavů tak, abychom si vymýšleli co nejméně? Nechť n i, i = 1, 2,..., N jsou známé (absolutní) četnosti z neznámého diskrétního rozdělení pravděpodobnosti a nechť m j, j = 1, 2,..., M jsou neznámé četnosti z tohoto rozdělení. Hledáme hodnoty m j tak, aby entropie celého rozdělení byla maximální. J = N i=1 n i n log n i n M neznámé jsou m j, j = 1, 2,..., M, n a λ. m j n log m j n + λ(n N i=1 n i M m j ), Výsledek: m j = m = n 0 e H 0, kde n 0 = N n i a H 0 = i=1 N i=1 n i n 0 log n i n 0 H = H 0 + log n n 0, kde n = n 0 + M m Systém, identifikace struktury; R. Šára, CMP (str. 27)

Rekonstrukce spojitého rozdělení ze známých momentů Příklad Nechť µ je střední hodnota a σ rozptyl neznámého rozdělení pravděpodobnosti s hustotou f(x). Jak vypadá f(x): IR [0, 1], která má za těchto podmínek maximální diferenciální entropii? Q = + λ 2 (σ 2 f(x) log f(x)dx + λ 0 (1 ) ( f(x)dx + λ 1 µ ) xf(x)dx + ) (1) (x µ) 2 f(x)dx Výsledek f(x) = 1 T ea 1x+a 2 x 2 = = 1 σ (x µ) 2 2π e 2σ 2 (2) Důkaz 1. pomocí Gibbsovy nerovnosti (viz dále) 2. pomocí variačního počtu z rovnice (1) 1 Systém, identifikace struktury; R. Šára, CMP (str. 28)

Zobecnění předchozího výsledku Nechť g i (x), i = 1, 2,..., K jsou známé funkce a c i = g i(x)f(x)dx jsou známé hodnoty. Rekonstruujeme z nich neznámou hustotu f(x) tak, aby maximalizovala entropii H(x). Výsledek a H(x) = f(x) = 1 T e P K a j g j (x) f(x) log f(x)dx = log T + K a j c j Důkaz Nechť φ(x) je hustota rozdělení, které má větší entropii než f(x) a vyhovuje podmínkám (má stejné hodnoty c i ). Platí Gibbsova nerovnost H φ (x) = = φ(x) log φ(x) φ(x) log T + φ(x) log f(x)dx = K a j g j (x) dx = log T + K a j c j = H f (x) což je spor. Systém, identifikace struktury; R. Šára, CMP (str. 29)

Výpočet a i, i = 1, 2,..., K Zavedeme funkci Platí Z a i = Z(a 1,..., a K ) = T = g i (x)e P K a j g j (x) dx = Z Takže a i jsou řešením soustavy nelineárních rovnic 1 Z e P K a j g j (x) dx g i (x)f(x)dx = Z c i Z a i = c i, i = 1, 2,... K, (3) kde neznámé jsou a i, kde c i jsou dány a kde g i (x) jsou známé funkce. Pozn soustava (3) je většinou obtížně řešitelná analyticky 2 použijte pro důkaz výsledku (2) na str 28. Systém, identifikace struktury; R. Šára, CMP (str. 30)

Identifikace struktury Identifikace struktury Nejlepší dekompozice systému S na množinu podsystémů G = { 1 S, 2 S,..., q S} Podproblémy 1. systematické generování rekonstrukčních hypotéz G neredundance i, j {1, 2,..., q}: i S j S pokrytí i i S = S 2. Rekonstrukce celkového systému S z G. (S... množina proměnných systému) 3. Vyhodnocení rekonstrukční chyby (G) = L(S, S ) Bez podmínky nerendundance a pokrytí by byl počet hypotéz 2 2n 1 1. (n počet proměnných, n = 2 7 hypotéz, n = 4 32767 hypotéz) Systém, identifikace struktury; R. Šára, CMP (str. 31)

Zjemnění rekonstrukční hypotézy Rekonstrukční hypotéza G = { 1 S, 2 S,..., q S} Zjemnění rekonstrukční hypotézy G i je zjemněním G j když pro každé x S G i existuje y S G j takové, že x S y S. Značíme G i G j Bezprostřední zjemnění G i je bezprostředním zjemněním G j jestliže neexistuje G k takové, že G i G k a G k G j Relace bezprostředního zjemnění tvoří svaz na množině všech rekonstrukčních hypotéz. Pozn: nejde o zjemňování rozkladu, rekonstrukční hypotézy netvoří rozklad (proměnné se opakují). Systém, identifikace struktury; R. Šára, CMP (str. 32)

Generátor rekonstrukčních hypotéz Vstup: Rekonstrukční hypotéza G = { 1 S, 2 S,..., q S} Výstup: Všechna bezprostřední zjemnění G Procedura (prohledávání svazu (G, )) 1. Pro i = 1, 2,..., q dělej kroky 2,3. 2. Jestliže i S 2 potom nahraď i S množinou všech podmnožin i S o velikosti i S 1. 3. Po odstranění redundantních podmnožin v každém rozkladu dostaneme seznam bezprostředních zjemnění G. Pozn: může se opakovat na stejné úrovni zjemnění. G = {1, 2, 3}, {2, 3, 4}, {1, 4} = { 1 S, 2 S, 3 S} G 1 = {1, 2}, {1, 3}, {2, 3, 4}, {1, 4} G 2 = {1, 2, 3}, {2, 4}, {3, 4}, {1, 4} G 3 = {1, 2, 3}, {2, 3, 4}} G 4 = {1, 2}, {1, 3}, {2, 3}, {3, 4}, {2, 4}, {1, 4} G 5 = {1, 2}, {1, 3}, {2, 3, 4} G 6 = {1, 2, 3}, {2, 4}, {3, 4} Systém, identifikace struktury; R. Šára, CMP (str. 33)

Prohledávání svazu zjemnění Rekonstrukční chyba monotonně roste podél každé větve svazu zjemnění: Je-li G i G k G j potom (G i ) (G k ) (G j ) Nejjednodušší postup: Hledáme cestu, podle které roste nejpomaleji Složitější postup: Na každé úrovni nás zajímá množina řešení s nejmenším Není nutno expandovat všechny větve: postačí metoda větví a mezí G 0 = 0 [Narenda&Fukunaga 1977] G 1 = 0.0001 G 2 0.0049 G 3 0.3373 G 4 0.0162 G 5 0.3960 G 6 0.0749 0.4073 G 7 G 8 = 0.4660 Systém, identifikace struktury; R. Šára, CMP (str. 34)