Analytické pravděpodobnostní modely, Markovské procesy

Podobné dokumenty
A6M33SSL: Statistika a spolehlivost v lékařství Teorie spolehlivosti

Markovské metody pro modelování pravděpodobnosti

ROVNICE NA ČASOVÝCH ŠKÁLÁCH A NÁHODNÉ PROCESY. Michal Friesl

Fakt. Každou soustavu n lineárních ODR řádů n i lze eliminací převést ekvivalentně na jednu lineární ODR

Stochastické modely Informace k závěrečné zkoušce

Učební texty k státní bakalářské zkoušce Matematika Diferenciální rovnice. študenti MFF 15. augusta 2008

a počtem sloupců druhé matice. Spočítejme součin A.B. Označme matici A.B = M, pro její prvky platí:

4. Aplikace matematiky v ekonomii

Úvod do lineární algebry

MATICE. a 11 a 12 a 1n a 21 a 22 a 2n A = = [a ij]

Úvod do SHO. Výkonnost a spolehlivost programových systémů KIV/VSS. Richard Lipka

Soustavy lineárních rovnic

Pravděpodobnost a aplikovaná statistika

KGG/STG Statistika pro geografy

Náhodné (statistické) chyby přímých měření

13. cvičení z PSI ledna 2017

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

Náhodné chyby přímých měření

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ

Odhady - Sdružené rozdělení pravděpodobnosti

SPOJITÉ ROZDĚLENÍ PRAVDĚPODOBNOSTI. 7. cvičení

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

Diferenciální rovnice 3

8.3). S ohledem na jednoduchost a názornost je výhodné seznámit se s touto Základní pojmy a vztahy. Definice

2.6. VLASTNÍ ČÍSLA A VEKTORY MATIC

VI. Maticový počet. VI.1. Základní operace s maticemi. Definice. Tabulku

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od podzimu 2015

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

SIMULACE SPOLEHLIVOSTI SYSTÉMŮ HROMADNÉ OBSLUHY. Michal Dorda. VŠB - TU Ostrava, Fakulta strojní, Institut dopravy

VĚTY Z LINEÁRNÍ ALGEBRY

Požadavky k písemné přijímací zkoušce z matematiky do navazujícího magisterského studia pro neučitelské obory

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

Soustavy lineárních rovnic

Výběrové charakteristiky a jejich rozdělení

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

10. Soustavy lineárních rovnic, determinanty, Cramerovo pravidlo

Operace s maticemi. 19. února 2018

Definice spojité náhodné veličiny zjednodušená verze

Exponenciální modely hromadné obsluhy

7. Rozdělení pravděpodobnosti ve statistice

1/10. Kapitola 12: Soustavy lineárních algebraických rovnic

Úlohy k přednášce NMAG 101 a 120: Lineární algebra a geometrie 1 a 2,

Diskrétní náhodná veličina

Téma 22. Ondřej Nývlt

VYBRANÁ ROZDĚLENÍ. SPOJITÉ NÁH. VELIČINY Martina Litschmannová

Markovovy řetězce se spojitým časem CTMC (Continuous time Markov Chain)

1 0 0 u 22 u 23 l 31. l u11

Náhodné vektory a matice

TECHNICKÁ UNIVERZITA V LIBERCI

1 Determinanty a inverzní matice

Pravděpodobnost a matematická statistika

ALGEBRA. Téma 5: Vektorové prostory

Zadání a řešení testu z matematiky a zpráva o výsledcích přijímacího řízení do magisterského navazujícího studia od jara 2016

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013

Příklady: - počet členů dané domácnosti - počet zákazníků ve frontě - počet pokusů do padnutí čísla šest - životnost televizoru - věk člověka

Charakterizace rozdělení

Základy maticového počtu Matice, determinant, definitnost

Základy teorie pravděpodobnosti

intenzitu příchodů zákazníků za čas t intenzitu obsluhy (průměrný počet obsloužených) za čas t

Nelineární obvody. V nelineárních obvodech však platí Kirchhoffovy zákony.

Vektorové podprostory, lineární nezávislost, báze, dimenze a souřadnice

Matematika I A ukázkový test 1 pro 2014/2015

1 Modelování systémů 2. řádu

Statistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I

1 Zobrazení 1 ZOBRAZENÍ 1. Zobrazení a algebraické struktury. (a) Ukažte, že zobrazení f : x

Modely teorie grafů, min.kostra, max.tok, CPM, MPM, PERT

Náhodný vektor a jeho charakteristiky

Věta 12.3 : Věta 12.4 (princip superpozice) : [MA1-18:P12.7] rovnice typu y (n) + p n 1 (x)y (n 1) p 1 (x)y + p 0 (x)y = q(x) (6)

Rovinná úloha v MKP. (mohou být i jejich derivace!): rovinná napjatost a r. deformace (stěny,... ): u, v. prostorové úlohy: u, v, w

2.6. Vlastní čísla a vlastní vektory matice

Řízení projektů. Konstrukce síťového grafu pro řízení projektů Metoda CPM Metoda PERT

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně

1 Vektorové prostory.

Jedná se o soustavy ve tvaru A X = B, kde A je daná matice typu m n,

Statistika a spolehlivost v lékařství Markovovy modely

Vlastní čísla a vlastní vektory

11MAMY LS 2017/2018. Úvod do Matlabu. 21. února Skupina 01. reseni2.m a tak dále + M souborem zadané funkce z příkladu 3 + souborem skupina.

Řešení. Hledaná dimenze je (podle definice) rovna hodnosti matice. a a 2 2 1

Matematika B101MA1, B101MA2

Václav Jirchář, ZTGB

Nejdřív spočítáme jeden příklad na variaci konstant pro lineární diferenciální rovnici 2. řádu s kostantními koeficienty. y + y = 4 sin t.

Řešení. Označme po řadě F (z) Odtud plyne, že

Vektorový prostor. Př.1. R 2 ; R 3 ; R n Dvě operace v R n : u + v = (u 1 + v 1,...u n + v n ), V (E 3 )...množina vektorů v E 3,

Regresní analýza 1. Regresní analýza

Greenova funkce pro dvoubodové okrajové úlohy pro obyčejné diferenciální rovnice

U Úvod do modelování a simulace systémů

0.1 Úvod do lineární algebry

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

Statistika II. Jiří Neubauer

Inženýrská statistika pak představuje soubor postupů a aplikací teoretických principů v oblasti inženýrské činnosti.

DEFINICE Z LINEÁRNÍ ALGEBRY

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

( + ) ( ) f x x f x. x bude zmenšovat nekonečně přesný. = derivace funkce f v bodě x. nazýváme ji derivací funkce f v bodě x. - náš základní zápis

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Lineární zobrazení. 1. A(x y) = A(x) A(y) (vlastnost aditivity) 2. A(α x) = α A(x) (vlastnost homogenity)

Náhodné signály. Honza Černocký, ÚPGM

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

2 Hlavní charakteristiky v analýze přežití

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Matematika I A ukázkový test 1 pro 2011/2012. x + y + 3z = 1 (2a 1)x + (a + 1)y + z = 1 a

Transkript:

Analytické pravděpodobnostní modely, Markovské procesy Výkonnost a spolehlivost programových systémů KIV/VSS Richard Lipka

Motivace Andrej Markov (1856-1922) Budoucnost je nezávislá na minulosti, pokud je dán přesný popis současného stavu (Wilkinson, 2006) Modelování sekvencí dat Markov jen teoretik

Příklady využití Modelování systémů s náhodnými příchody požadavků Lidé ve frontě Telefonní linky Půjčovny aut Vozidla v křižovatce Vědecké modely Modelování náhodného pohybu molekul Fungování enzymů Modelování burzy PageRank

Příklady využití Rozpoznávání a analýza řeči (převod mluveného slova na text) Slova / fonémy následují v určitých kombinacích po sobě častěji než v jiných I další aplikace analýza DNA, dešifrování Generování textů Náhodné texty které vypadají na první pohled smysluplně Chomskybot Mark V Shaney

Generátory řeči Mark V Shaney It looks like Reagan is going to say? Ummm... Oh yes, I was looking for. I'm so glad I remembered it. Yeah, what I have wondered if I had committed a crime. Don't eat with your assessment of Reagon and Mondale. Up your nose with a guy from a firm that specifically researches the teen-age market. ChomskyBot Note that relational information can be defined in such a way as to impose a descriptive fact. So far, the natural general principle that will subsume this case does not affect the structure of a parasitic gap construction. Suppose, for instance, that the systematic use of complex symbols suffices

Vlastnosti Modelování systémů s jasně určenými stavy (jako u KA ve stavu všechny vlastnosti systému) přechody (u kterých známe intenzitu / četnost) Stav: pro znalost systému mi stačí znát jeho aktuální konfiguraci, nepotřebuji vědět jak se k současné konfiguraci dostal systém bez paměti na minulosti nesejde Markovská vlastnost: pravděpodobnost přechodu má exponenciální rozdělení (= model pracuje se spojitým časem) Pravděpodobnost stavu závisí jen na předchozím stavu a ne na cestě do něj

Exponenciální a Poissonovo rozdělení Poissonovo rozdělení Počet jevů v určitém časovém intervalu Kolik aut projede za hodinu Kolikrát za den zazvoní telefon Všechny jevy mají stejnou pravděpodobnost Neumí rozlišit osobní a nákladní auta Parametr: λ střední počet událostí za jednotku času Exponenciální rozdělení Délka intervalu mezi dvěma událostmi Jaká doba uplyne mezi dvěma projíždějícími auty Jaká doba uplyne mezi dvěma hovory Spojité rozdělení (čas, ne počet událostí) Parametr: λ střední počet událostí za jednotku času ( střední doba mezi událostmi je 1 λ )

Exponenciální a Poissonovo rozdělení Poissonovo rozdělení Exponenciální rozdělení Pravděpodobnostní funkce Hustota pravděpodobnosti

Exponenciální a Poissonovo rozdělení Poissonovo rozdělení Exponenciální rozdělení Distribuční funkce

Obecný model λ i,j i j Intenzita přechodu λ 1 s frekvence přechodů (počet za jednotku času) Očekáváme konstantní (jinak nelze řešit analyticky, jen simulačně) Prvd. přechodu z i do j v malém časovém intervalu je p i,j = λ dt (dt 0) podmíněná nejdřív musí být ve stavu i

Obecný model λ i,j p i i j je-li pravděpodobnost stavu i v čase t rovna p i (t), je pravděpodobnost přechodu p i,j = λ p i (t) dt nepodmíněná pravděpodobnost přechodu v čase t, t + dt ale potřebuji znát pravděpodobnost výskytu ve stavu i

Obecný model λ a,b λ b,c a λ b,a b c λ b,d d λ d,e λ e,d e λ e,c Popis orientovaným váženým grafem

Obecný model P k = p 1,1 (k) p 1,2 (k) p 1,n (k) p n,1 (k) p n,2 (k) p n,n (k), n j=1 p i,j (k) = 1 Je-li X k = i (systém je ve stavu i), pak je p i,j k je prvd. přechodu do stavu j (tedy prvd. že X k+1 = j ) Homogenní proces p i,j = p i,j t 1, t 2 = p i,j t p i,j ( t) λ i,j = lim t 0 t - konstantní intenzita přechodu t 0, p i,j ( t) λ i,j t

Obecný model i p i t + t = p i t λ i,jp i,j t t λ i,j p j i t + t p i (t) = λ t i,j p i t p i t + λ i,j p i t = 0 Lineární diferenciální rovnice prvního řádu Počáteční podmínka p i 0 = 1 někde musím začít p i t = e λ i,jt - prvd. setrvání ve stavu i (bez poč. podmínky p i t = c 1 e λ i,jt )

Obecný model i k λ i,k λ i,j Lze odvodit střední dobu setrvání ve stavu i T i = 1 λ i (což souhlasí s tím že λ i je frekvence) j Analogicky lze odvodit p i t = λ i,j + λ i,k p i t = λ i p i t prvd. setrvání ve stavu i záleží na součtu intenzit odchodů z něj

Kolmogorovovy rovnice p t p t je vektor pravděpodobností stavů p t vektor derivací prvd. stavů Λ matice intenzit přechodů λ i,j pro i j intenzita přechodu z i do j = p(t)λ pro i = j je λ i,j = λ i (záporná hodnota součtu ostatních prvků řádku) součet řádku je 0 Počáteční podmínky vektor p 0 - kde začnu

Absorpční stavy a λ a,b λ b,a λ b,d b d λ b,c λ d,e λ e,d c e λ e,c Stav kde model končí nevede z něj žádná hrana (podobně absorpční množina stavů) život modelu je omezený a v některém absorpčním stavu časem skončí (z dlouhodobého pohledu jde jen o to ve kterém) Modelování přechodových jevů

Absorpční stavy - příklad Spolehlivostní model 1 prvku bez jeho opravy (např. IO nebo nezálohovaný počítač) Funguje nebo je porouchaný, nebude opraven λ jako intenzita poruchy prvku Pro počítač cca 10 4 hod 1 Pro obvod cca 10 6 hod 1 (nepřevádět na čas fungování prvd. že se zařízení v následující jednotce času porouchá ve skutečnosti nejsou konstantní po celou dobu života systému)

Absorpční stavy - rovnice 0 λ 1 p 0 = 1 počáteční podmínka p 0 t + t = p 0 t p 0 (t) λ t p 0 t + t p 0 (t) + p t 0 t λ = 0 p 0 t + p 0 t λ = 0

Absorpční stavy - rovnice Pravděpodobnost 0 že systém ještě hodinu vydrží p 0 = 1 λ 1 počáteční λ podmínka p 0 t + t = p 0 t p 0 (t) λ t p 0 t + t p 0 (t) + p t 0 t λ = 0 p 0 t + p 0 t λ = 0 1 hodina nejmenší jednotka se kterou pracuji Absolutní pravděpodobnost stavu 0 v čase t Absolutní pravděpodobnost přechodu do stavu 1

Absorpční stavy - rovnice 0 λ 1 p 0 = 1 Derivace p 0 podle času viz definice derivace počáteční podmínka p 0 t + t = p 0 t p 0 (t) λ t p 0 t + t p 0 (t) + p t 0 t λ = 0 p 0 t + p 0 t λ = 0 Lineární diferenciální rovnice 1. řádu s konstantními koeficienty

Absorpční stavy - rovnice p 0 t + p 0 t λ = 0 Navíc víme že platí p 0 t + p 1 t = 1 jiné stavy nejsou a doplníme počáteční podmínku p 0 0 = 1 řešení (metodou charakteristické rovnice): p 0 t = e λt, p 1 t = 1 e λt Exponenciální rozdělení: Hustota pravděpodobnosti: P(X) = λe λt Distribuční funkce: P(X x) = 1 e λt

Absorpční stavy kdy dojde k přechodu τ doba za kterou dojde k poruše (př. z 0 do 1) p 1 (τ) prvd. že k poruše došlo P τ t = F t Distribuční funkce náh. doby poruchy τ F t = p 1 t = 1 e λt Hustota pravděpodobnosti (derivace dist. fce) f t = λ e λt náhodná doba poruchy má exponenciální rozdělení E τ = 1 λ - vlastnost exp. rozdělení (odhad pro konstantní λ)

Zobecnění modelu s absorpčními stavy Soustava lin. dif. rovnic 1. řádu, pro každý stav 1 rovnice získám n rovnic pro stavy Pro i-tý stav Levá strana: p i t Pravá strana: součet příspěvků λ ve tvaru + p k t λ k,i - hrany do stavu i p i t λ i,k - hrany vedoucí ze stavu i Počáteční podmínky p i 0 pro všechny stavy určím všechna p i 0

Zobecnění modelu s absorpčními stavy Náhodná doba setrvání ve stavu v každém stavu i má exp. rozdělení Parametr λ i n λ i = j=0 λ i,j - součet hran vedoucích ven Střední doba setrvání ve stavu i T i = 1 λ i

Markovské modely bez absorpčních stavů (cyklické) Graf složený z cyklů nekonečný život modelu v jakém stavu bude v určitém čase? Graf musí být silně souvislý odkudkoliv se dá dostat kamkoliv (neexistují podgrafy odkud se nedá dostat absorpční skupiny ) Lze určit limitní pravděpodobnosti stavů p 0, p 1,, p n (dále jen p 0, p 1,, p n ) snáze než soustavou dif. rovnic

Jak zjednodušit výpočet Jestliže existují hodnoty limitních pravděpodobností, odpovídající derivace jsou nulové (prvd. se už nemění) pro t přejde popis modelu na soustavu lineárních rovnic, p i = 0, p 1,, p n budou jen neznámé, ne funkce: 0 = p Λ kde 0 je nulový vektor a p = p 1,, p n Pro řešení nutné doplnit normalizační podmínku i=1 p i = 1, která nahradí libovolnou z rovnic n

0 2λ μ Příklad synchronizace procesů 1 2 vlákna, paralelní, každé na svém procesoru 1 kritická sekce do které obě potřebují Parametry τ loc a τ sec náhodné a s exp. rozdělením λ μ 2 Lokální výpočet (doba τ loc, střední doba T loc ) λ = 1 T loc Lokální výpočet (doba τ sec, střední doba T sec ) μ = 1 T sec

0 2λ μ Příklad synchronizace procesů Lze určit p 0 t, p 1 t, p 2 (t): 1 p 0 t = 2λp 0 t + μp 1 t p 1 t = 2λp 0 t μ + λ p 1 t + μp 2 (t) p 2 t = λp 1 t μp 2 t λ μ 2 0 oba lokálně 1 1 v krit. sekci, druhý lokálně 2 1 čeká na krit. sekci, druhý čeká Pro poč. podmínky p 0 0 = 1, p 1 0 = p 2 0 = 0

Příklad synchronizace procesů U non-stop dějů hledáme obvykle ustálené (asymptotické) prvd. stavů p 0 = lim e 0 t = p 0 (p 1, p 2 ) t Nejprve určíme limity derivací (ustálený stav!) p 0 = 0, p 1 = 0, p 2 = 0 soustava se mění na soustavu lineárně závislých algebraických rovnic (= jejich součet je 0) Zavádíme normalizační podmínku p 0 + p 1 + p 2 = 1 - v nějakém stavu systém být musí

Příklad synchronizace procesů 0 = 2λp 0 + μp 1 0 = 2λp 0 μ + λ p 1 + μp 2 0 = λp 1 μp 2 1 = p 0 + p 1 + p 2 3 neznámé, 3 rovnice, lze řešit Gaussovou eliminací (Matlab) Význam: p 2 = 0,05 model stráví v p 2 5% času 0 2λ μ 1 λ μ 2 Platné jen pro ustálený stav (při dlouhodobém sledování)!

Zobecnění modelu bez absorpčních stavů Z grafu lze odvodit soustavu lineárních rovnic (podobná pravidla jako u diferenciálních) lze získat vektor p i ustálených pravděpodobností Stále platí že doba setrvání ve stavu má exponenciální rozdělení s parametrem λ i (součet intenzit odchodů z daného stavu), respektive střední dobou setrvání ve stavu T i = 1 λ i Děj je cyklický lze určovat frekvence přechodů mezi stavy

Frekvence přechodů Střední frekvence přechodů po dané hraně z i do j f i,j = p i λ i,j Střední frekvence průchodů stavem n f i = p i j=0 λ i,j = p i λ i (intenzita výstupních hran) Střední doba cyklu průchodů stavem i T ci = 1 f i (jak často se stav opakuje)

Pagerank Důležité stránky budou odkazovány z jiných důležitých stránek Odvozeno s citačních metrik (eigenvalue, impact factor) náhodná procházka grafem stránek Stránky uzly Odkazy hrany (orientované) PR stránky určen z PR stránek které na ni odkazují Pro výpočet potřebuji znát PR všech stránek předem? Iterativní výpočet PR A = 1 d + d PR(T 1) + + PR(T n) C(T 1 ) C(T n ) Určím PR každé stránky bez jakýchkoliv znalostí a výpočet iterativně opakuji po každé iteraci je hodnota PR přesnější Na výchozích zvolených hodnotách nezáleží

Nástroj Markov Nástroj pro vyhodnocování markovských modelů DP Radka Hoštičky a Marka Pašky K dispozici na portálu Spustitelný program Dokumentace (stručný návod + DP Marka Pašky s podrobným popisem programu i teorie Markovských modelů) Pro modely bez absorpčních stavů, s konstantními koeficienty, popsané silně souvislým grafem

Nástroj Markov Definice modelu Jazyk pro popis grafů (uzly a intenzity přechodů mezi nimi) Podobný jazyku C, podporuje cykly pro vytvoření grafu (snazší než mít GUI pro velké modely) Vypočte ustálené pravděpodobnosti Dotazování nad modelem kombinace SQL a C deklarativní jazyk pro dotazy nad zpracovaným modelem Definované matematické funkce a cykly, řazení výsledků, agregační funkce

Lze definovat konstanty #define lambda 0.9 Definice modelu Stavy definovány v souřadné mřížce modelu (n dimenzí) module model1 [10, 10] stavy lze označit vlastními čísly [1,1] = 1; Mezi stavy jde nastavit přechody [1,1]->0.9 [1,2];

Definice modelu příklad module bufferexample [200]; #define size 200 #define lambda 0.9 #define mi 1.0 for (i ;0; size-2){ [i]->lambda [i+1]; } for (i; 0; size-2){ [i+1]->mi [i]; } Definice konstant Přechody v jednom směru (zprava doleva) Přechody v opačném směru (zleva doprava)

Řešení modelu model.map transformace z prostoru stavů (n-rozměrné mřížky) do matice přechodů model.mtx popis matice přechodů mezi stavy modelu model.val uživatelská ohodnocení stavů model.pbt pravděpodobnosti stavů výsledek výpočtu model.err protokol o případných chybách

Dotazování Nutné načíst model load "C:\Models\model1" as buf Lze definovat konstanty define size := 200; Definované konstanty e a pi Lze se dotazovat na pravděpodobnosti select p[0] from buf Definované identifikátory p a val

Dotazování Iterace v dotazu select p[i] from model1 for i:= 0 to 19 select p[i, j] from model2 for i:= 0 to 19, j:= 1 to I Podmínka v dotazu select i, p[i] from model1 for i:= 0 to 19 where p[i] > 0.1 Agregační funkce select sum(p[i]) as SUMA from model1 for i:= 0 to 19

Dotazování Výpis stavů s nadprůměrnou pravděpodobností select i, p[i] from model3 for i:= 0 to 99 where p[i] >= (select avg(p[j]) from model3 for j := 0 to 99 group 1) Podmínka vyhodnocována s každou iterací lépe 2 dotazy Vypočtené sloupce select p[0] * 100 as PercentState0 from model4

Děkuji za pozornost Příště modelování systémů hromadné obsluhy