Apriorní rozdělení. Jan Kracík.

Podobné dokumenty
Téma 22. Ondřej Nývlt

Definice spojité náhodné veličiny zjednodušená verze

PRAVDĚPODOBNOST A STATISTIKA

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

PRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady

Interpolace, ortogonální polynomy, Gaussova kvadratura

Výběrové charakteristiky a jejich rozdělení

Bayesovské metody. Mnohorozměrná analýza dat

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně

PRAVDĚPODOBNOST A STATISTIKA. Odhady parametrů Postačující statistiky

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

NMAI059 Pravděpodobnost a statistika

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Základy teorie odhadu parametrů bodový odhad

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

I. D i s k r é t n í r o z d ě l e n í

p(x) = P (X = x), x R,

4. Aplikace matematiky v ekonomii

Statistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I

Testování statistických hypotéz

Statistika II. Jiří Neubauer

Pravděpodobnost a statistika I KMA/K413

n = 2 Sdružená distribuční funkce (joint d.f.) n. vektoru F (x, y) = P (X x, Y y)

Odhady Parametrů Lineární Regrese

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

Pravděpodobnost a statistika

15. T e s t o v á n í h y p o t é z

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013

AVDAT Mnohorozměrné metody, metody klasifikace

Markov Chain Monte Carlo. Jan Kracík.

NEPARAMETRICKÉ BAYESOVSKÉ ODHADY V KOZIOLOVĚ-GREENOVĚ MODELU NÁHODNÉHO CENZOROVÁNÍ. Michal Friesl

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

Základy teorie pravděpodobnosti

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

KMA/P506 Pravděpodobnost a statistika KMA/P507 Statistika na PC

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

Numerická stabilita algoritmů

Úvod do lineární algebry

5. B o d o v é o d h a d y p a r a m e t r ů

Odhady - Sdružené rozdělení pravděpodobnosti

Přijímací zkouška na navazující magisterské studium 2014

Charakterizace rozdělení

MATEMATICKÁ STATISTIKA

Limitní věty teorie pravděpodobnosti. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

PRAVDĚPODOBNOST A STATISTIKA

Teorie náhodných matic aneb tak trochu jiná statistika

PRAVDĚPODOBNOST A STATISTIKA. Metoda momentů Metoda maximální věrohodnosti

STATISTICKÉ ODHADY Odhady populačních charakteristik

Fakt. Každou soustavu n lineárních ODR řádů n i lze eliminací převést ekvivalentně na jednu lineární ODR

Regresní analýza 1. Regresní analýza

Náhodný vektor. Náhodný vektor. Hustota náhodného vektoru. Hustota náhodného vektoru. Náhodný vektor je dvojice náhodných veličin (X, Y ) T = ( X

Waldovy testy, vlastnosti a Operační charakteristika

Vektorové podprostory, lineární nezávislost, báze, dimenze a souřadnice

3 Bodové odhady a jejich vlastnosti

Aplikace 2: Hledání informativních příznaků pro rozpoznávání

správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B.

Obsah. Lineární rovnice. Definice 7.9. a i x i = a 1 x a n x n = b,

Mgr. Rudolf Blažek, Ph.D. prof. RNDr. Roman Kotecký Dr.Sc.

Náhodná veličina. Michal Fusek. 10. přednáška z ESMAT. Ústav matematiky FEKT VUT, Michal Fusek

Náhodné vektory a matice

oddělení Inteligentní Datové Analýzy (IDA)

Základní statistické modely Statistické vyhodnocování exp. dat M. Čada ~ cada

LWS při heteroskedasticitě

Pravděpodobnost a aplikovaná statistika

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Rekonstrukce diskrétního rozdělení psti metodou maximální entropie

Matematické přístupy k pojištění automobilů. Silvie Kafková září 2013, Podlesí

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Diferenˇcní rovnice Diferenciální rovnice Matematika IV Matematika IV Program

7. Rozdělení pravděpodobnosti ve statistice

15. T e s t o v á n í h y p o t é z

15 Maticový a vektorový počet II

Rozdělení náhodné veličiny. Distribuční funkce. Vlastnosti distribuční funkce

BAYESOVSKÉ ODHADY. Michal Friesl V NĚKTERÝCH MODELECH. Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni

Symetrické a kvadratické formy

1 Klasická pravděpodobnost. Bayesův vzorec. Poslední změna (oprava): 11. května 2018 ( 6 4)( 43 2 ) ( 49 6 ) 3. = (a) 1 1 2! + 1 3!

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

PRAVDĚPODOBNOST A STATISTIKA

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

BAYESOVSKÉ ODHADY V NĚKTERÝCH MODELECH

Kapitola 11: Lineární diferenciální rovnice 1/15

Chyby měření 210DPSM

Lineární algebra : Metrická geometrie

5. T e s t o v á n í h y p o t é z

y = 0, ,19716x.

ROZDĚLENÍ NÁHODNÝCH VELIČIN

MATEMATICKÁ STATISTIKA - XP01MST

Matematika 4 FSV UK, LS Miroslav Zelený

Příklady: - počet členů dané domácnosti - počet zákazníků ve frontě - počet pokusů do padnutí čísla šest - životnost televizoru - věk člověka

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

Tento dokument obsahuje zadání pro semestrální programy z PAA. Vypracování. vypracovanou úlohu podle níže uvedených zadání. To mimo jiné znamená, že

Transkript:

Apriorní rozdělení Jan Kracík jan.kracik@vsb.cz

Apriorní rozdělení Apriorní rozdělení (spolu s modelem) reprezentuje informaci o neznámém parametru θ, která je dostupná předem, tj. bez informace z dat. Má zásadní význam v případě, že data jsou málo informativní. Problém Jak sestavit apriorní rozdělení při nedostatečném množství apriorní informace?

Apriorní rozdělení Obecné poznámky Apriorní rozdělení často volíme přibližné. Lepší než nic! Apriorní rozdělení musí nést co nejméně špatné informace. Preferujeme kompatibilitu s apriorní informací před jednoduchostí. V praxi volíme kompromis.

Apriorní rozdělení - příklad Příklad Viz segmentace obrazu, Gibbsovo apriorní rozdělení: 1 f (x) = Z (β) exp( βh(x)) H(x) = δ(x ij, x kl ) (i,j) S (k,l) N(i,j) (i,j) S (k,l) N(i,j) ( ) δ(x ij, x kl ) = 2 n 2 délka hranice

Apriorní rozdělení - příklad Zvolené apriorní rozdělení neobsahuje informace o počtu objektů a jejich poloze, jen o délce hranice: Preferuje segmentaci s kratší délkou hranice mezi oblastmi ( správná informace). Apriorní rozdělení je přibližné. Lze např. zvolit vhodnější potenciál (lineární členy) i parametry. Obsahuje špatnou informaci: nejpravděpodobnější je segmentace s délkou hranice 0. x Argmax f (x) ( (i, j) S : x ij = 0) ( (i, j) S : x ij = 1) Díky informaci z dat je špatná část informace potlačena, správná zůstává (je kompatibilní s daty). Celkově má apriorní hustota pozitivní vliv na dobrý výsledek. Apriorní rozdělení lze dále vylepšit (např. hierarchický model).

Aproximace apriorního rozdělení V praxi často využíváme přibližné postupy. Θ konečná množina: subjektivní přiřazení pravděpodobností Θ nekonečná (nespočetná): konečné dělení množiny, dále jako pro diskrétní θ problém: určení pravděpodobností chvostů někdy je jednodušší zvolit apriorní rozdělení f (x) = f (x θ)f (θ)dθ; odtud lze (někdy) určit f (θ).

Apriorní rozdělení s maximální entropií Informace ve formě momentů, pravděpodobností zajímavých jevů,... Obecně: g k (θ)f (θ)dθ = ω k, (1) kde g k : Θ R, ω k R, k = 1,... n. Apriorní rozdělení pak lze volit tak, aby mělo maximální entropii vzhledem k daným omezením. Pro diskrétní parametr θ: f (θ = θ i ) = exp ( k λ kg k (θ i )) i exp ( k λ kg k (θ i )), kde λ k jsou Lagrangeovy multiplikátory; určíme tak, aby platila omezení (1).

Apriorní rozdělení s maximální entropií Podobně pro spojitý parametr: f (θ) = exp ( k λ kg k (θ)) exp ( k λ kg k (θ)) dθ

Hierarchické apriorní rozdělení Často lze zvolit vhodné apriorní rozdělení až na neznámý parametr. K tomuto parametru přistupujeme stejně jako ke všem ostatním: považujeme jej za náhodnou veličinu a hledáme pro něj vhodné apriorní rozdělení. Ve složitějších úlohách velmi častý přístup. Hierarchickým apriorním rozdělením rozumíme rozdělení s hustotou f (θ) ve tvaru f (θ) = f (θ θ 1 )f (θ 1 θ 2 )... f (θ n 1 θ n )f (θ n )dθ 1... dθ n. Θ 1 Θ n

Hierarchické apriorní rozdělení Příklad Skrytý markovovský řetězec s neznámými pravděpodobnostmi přechodu Pozorované veličiny: y 1,..., y t Skryté veličiny (parametry): x 1,..., x t, η f (y 1,..., y t x 0,..., x t, η) = f (x 1,..., x t x 0, η) = t f (y τ x τ ) τ=1 t f (x τ x τ 1, η) τ=1 f (η) =...

Konjugované rodiny apriorních rozdělení Množina (rodina) F hustot pravděpodobnosti parametru θ se nazývá konjugovaná pro model f (x θ), jestliže pro každé apriorní rozdělení f (θ) z F a každé pozorování x je aposteriorní rozdělení f (θ x) jakožto hustota θ rovněž z F. Příklady Viz odhad parametru alternativního rozdělení, normálního rozdělení se známým rozptylem.

Konjugované rodiny apriorních rozdělení Poznámky Množina všech hustot θ je konjugovaná, ale nezajímavá. Zajímavé jsou malé a parametrizované konjugované rodiny. Konjugovaná rodina hustot je určena modelem. Ne pro každý model existují konjugovaná apriorní rozdělení. Výpočet aposteriorního rozdělení spočívá v určení parametru. Velmi praktické, ale ne vždy vhodné.

Postačující statistiky Definice Uvažujme statistický model f (x θ) náhodné veličiny X s hodnotami v X. Necht pro T : X R n, n N platí f (x T (X) = t, θ) = f (x T (X) = t). Statistiku T pak nazýváme postačující statistikou modelu f (x θ).

Postačující statistiky Postačující statistika nese stejnou informaci o parametru θ jako náhodná veličina X. Necht t = T (x). Pak f (θ x) = f (θ x, t) = f (x, t θ)f (θ) f (x, t θ)f (θ)dθ = = = f (x t, θ)f (t θ)f (θ) f (x t, θ)f (t θ)f (θ)dθ f (x t)f (t θ)f (θ) f (x t) f (t θ)f (θ)dθ f (t, θ)f (θ) = f (θ t) f (t, θ)f (θ)dθ

Exponenciální rodina Statistický model, který lze vyjádřit ve tvaru ( n ) f (x θ) = C(θ) exp B i (θ)s i (x), kde B 1,..., B n : Θ R, S 1,..., S n : X R, C : Θ R, se nazývá exponenciální rodina s postačujícími statistikami S 1,..., S n. i=1

Exponenciální rodina Apriorní hustoty ve tvaru ( n ) f (θ) (C(θ)) v exp B i (θ)v i pro nějaké (v, V 1,..., V n ) R n+1 představují konjugované hustoty pro exponenciální rodinu s postačujícími statistikami S 1,..., S n. i=1 ( n ( f (θ x 1,..., x t ) (C(θ)) v+t exp B i (θ) V i + i=1 (2) )) t S i (x τ ) τ=1 Aposteriorní rozdělení má stejný tvar jako apriorní pro hodnoty parametrů ( ) t t v + t, V 1 + S 1 (x τ ),..., V n + S n (x τ ). τ=1 τ=1

Exponenciální rodina Pro libovolnou posloupnost pozorování x 1,..., x t je vektorová funkce ( t ) t S 1 (x τ ),..., S n (x τ ) τ=1 τ=1 postačují statistikou modelu ( n f (x 1,..., x t θ) = (C(θ)) t exp B i (θ) i=1 ) t S i (x τ ). τ=1 Dimenze této postačující statistiky nezávisí na počtu pozorování t.

Konjugovaná apriorní hustoty vybraných jednoparametrických modelů Neznámý parametr: θ, ostatní parametry jsou známé Model Rozdělení x Konjug. rozdělení θ Normální N (θ, σ 2 ) N (µ, ξ 2 ) Normální N (µ, 1 θ ) G(α, β) Poissonovo P(θ) G(α, β) Gama G(ν, θ) G(α, β) Binomické Bi(n, θ) Be(α, β) Multinomické rozdělení M k (θ 1,..., θ k ) D(α 1,..., α k )

Neinformativní apriorní hustoty V případě, že není k dispozici žádná vhodná apriorní informace, lze využít tzv. neinformativních apriorních rozdělení. Nejčastěji používaná jsou Jeffreysovy a referenční hustoty. Uvažujme statistický model f (x θ). Fisherova informace pro Θ R je definována vztahem (( ) ) ln f (x θ) 2 I(θ) = E θ θ Poznámka (( ) ln f (x θ) E θ) = 0 θ I(θ) charakterizuje množství informace, které o parametru θ přinese pozorování x. Tato informace je závislá na θ.

Jeffeysova apriorní hustota Jeffreysova apriorní hustota pro model f (x θ) je definována jako f (θ) (I(θ)) 1 2. Jeffreysovya apriorní hustota je často nevlastní (nemá konečný integrál, nejde o skutečnou hustoty).

Jeffeysova apriorní hustota Pro Θ R n definujeme Fisherovu informační matici: (( ) ( ) ln f (x θ) ln f (x θ) (I(Θ)) ij = E θ) θ i θ j Jeffreysova apriorní hustota: f (θ) (det I(θ)) 1 2