METODASEGMENTACEV CHANGE POINT PROBLÉMU

Rozměr: px
Začít zobrazení ze stránky:

Download "METODASEGMENTACEV CHANGE POINT PROBLÉMU"

Transkript

1 ROBUST 2002, c JČMF 2002 METODASEGMENTACEV CHANGE POINT PROBLÉMU MARTIN JANŽURA, JAN NIELSEN Abstract. The method of segmentation is used to solve the change-point problem. Rez mз. Metod segmentacii primenen k rexeni problemy detekcii razladki. 1. Úvod Obecně je úloha detekce změn formulována tak, že cílem je zjistit, zda v nějaké časové posloupnosti došlo ke změnám v pravděpodobnostním rozdělení, kterým se řídí pozorované veličiny. Máme tedy náhodné veličiny X 1,...,X N, kde vpřípadějejichnezávislosti předpokládáme,ževeličina X i mározdělení p i pro i=1,...,n.(uzávislýchveličinbychommuseliuvažovatrozdělenípodmíněná minulostí,tedy L(X i X i 1,..., X 1 )=p i (x i x i 1,...,x 1 )pro i=1,...,n).statistická úloha detekce změny je potom testování hypotézy H 0 : p 1 = =p N proti různě obecným alternativám(viz např. Csörgö a Horváth(1997) nebo Antoch, Hušková a Jarušková(1998)). Je přitom zřejmé, že zcela obecným a úplným řešením by bylo nalezení přímo posloupnosti p 1,...,p N. Takto obecnou úlohu však pochopitelně nelze řešit. Budeme tedy uvažovat některá zjednodušení. Předně nebudeme předpokládat zcela obecná rozdělení, ale vymezíme pevně danou konečnou množinu přípustných distribucí P= {p (a) } a A, kde A je konečná množina návěští ( štítků, jmen ). Posloupnost distribucí p 1,..., p N,kde p i Pprokaždé i=1,...,n,námtaktopřirozeněindukujeposloupnost návěští a N =(a 1,...,a N ) A N kdevždy p i = p (ai) pro i=1,...,n. Projednoduchostbudemepředpokládat p (a) >0provšechna a A.Můžeme nyní psát N L(X 1,..., X N a 1,..., a N )= p (ai) (x i ) 2000 Mathematics Subject Classification. 62M99 62P12. Klíčová slova. Segmentace, detekce struktuálních změn statistických modelů, statistický rozhodovací problém, metoda MAP, simulované žíhání, Metropolisnlv-Hastingsv algoritmus. Tato práce je podporována grantem GA ČR 201/00/1149. i=1

2 164 Martin Janžura, Jan Nielsen pronezávislápozorování(případně N i=1 p(ai) (x i x i 1,...,x 1 )prozávislá).totorozdělenípakbudemepovažovatzapodmíněnérozdělenívektoruveličin X 1,..., X N za podmínkyposloupnostinávěští a 1,..., a N. Navíc budeme předpokládat, že průběh změn v posloupnosti není libovolný, ale je ovlivněn nějakou vnitřní strukturou, a proto všechny posloupnosti nejsou nutně stejně možné, ale existuje nám známé apriorní rozdělení {P(a (N) )} an A (N), kdeopětprojednoduchost P >0. Tímtosepřímonabízířešitúlohunalezeníposloupnosti a N =(a 1,..., a N )na základědat x N =(x 1,..., x N ),vzniklýchpozorovánímposloupnosti X 1,...,X N, pomocí bayesovského přístupu. Vzhledem k tomu, že v typických situacích, které budeme mít na mysli, nebudou změny příliš časté a tudíž se posloupnosti návěští budou podle očekávání skládat z homogenních úseků(segmentů), metoda zvolená v tomto článku se podobá metodám segmentace(či klasifikace) známé např. v oblasti zpracování obrazu(viz Winkler(1995) pro přehled). V následující části navrhneme řešení v rámci obecného bayesovského rozhodovacího problému. 2. Bayesovské řešení statistického rozhodovacího problému Statistický rozhodovací problém je dán čtveřicí(viz např. Vajda(1987)) {Y, Q, D, Z}, kde Yjestavovýprostor, Q={q θ } θ Θ jeparametrickárodinapravděpodobnostních rozdělení, Djemnožinamožných rozhodnutí a Z=Θ D [0, ) je ztrátová funkce, kde Z(θ, d) vyjadřuje ztrátu, která nastane při rozhodnutí d, jestliže skutečná hodnota parametru je θ Θ. Provolbu dobrého rozhodnutípakmámekdispozicipozorování y Y,přičemž tuto volbu popisuje rozhodovací funkce δ: Y D. Kvalitu rozhodovací funkce posuzujeme podle ztráty Z(θ, δ)= Z(θ, δ(y))dq θ (y) spojené s touto rozhodovací funkcí.(necháme v těchto úvahách stranou otázku měřitelnoti jednotlivých zobrazení. Můžeme např. pro jednoduchost považovat všechny množiny za konečné.) Cílem úlohy je pak nalézt takovou rozhodovací funkci, která ztrátu v nějakém smyslu minimalizuje. Pokudpronějakourozhodovacífunkci δ s je Z(θ, δ s )=min Z(θ, δ) prokaždé θ Θ, δ jetato δ s stejnoměrněnejlepšímřešením.řešeníminimaxníjedánopodmínkou max Z(θ, δ m)=minmax Z(θ, δ). θ Θ δ θ Θ

3 Metodasegmentacev change point problému 165 My zde budeme předpokládat, že máme na prostoru Θ nějakou apriorní distribuci Q(θ).Potomjebayesovskýmřešenímtakovérozhodovacífunkce δ b,kteráminimalizuje očekávanou ztrátu Z(δ)= Z(θ, δ) dq(θ), tedy Označme nyní Z(δ b )=min Z(δ). δ Z(d y) = Z(θ, d) dq(θ y) (kdepřirozeně Q(θ y)= Q(θ;y) Q(y) = qθ (y) Q(θ) qτ (y)dq(τ) ). Tvrzení:Bayesovskéřešení δ b rozhodovacíhoprocesujedánopředpisem Z(δ b (y) y)=min d D Z(d y). Důkaz: Nechť δ je nějaká jiná rozhodovací funkce. Potom Z(δ b )= Z(δ b (y) y)dq(y) Z(δ(y) y) dq(y) = Z(δ). Uvažujmenyníspeciálnípřípad,kdymáme rozhodnout oparametru,tedyjej odhadnout. Potom Θ = D. Navíc se omezíme na speciální ztrátovou funkci 0 pokud θ=d Z(θ, d)= 1 jinak. Potom máme Z(d y)=1 Q(d y) aprotoje(podletvrzenínahoře)bayesovskéřešení δ b =ˆθdáno Q(ˆθ(y) y)=max θ Θ Q(θ y). Je to tedy odhad maximalizující aposteriorní pravděpodobnost(map), který je bayesovským řešením, neboť minimalizuje očekávanou ztrátu, danou zde pravděpodobností chyby Z(ˆθ)=Q(θ ˆθ(y)). 3. Řešení původní úlohy metodou MAP Budeme řešit úlohu zformulovanou v části 1 metodou MAP, tzn. pro daná data x N =(x 1,...,x N )budemehledattakovouposloupnost â N,kterámaximalizujeaposteriorní pravděpodobnost, tedy kde â N argmax an A N P(aN x N ) = argmax an A N P(aN ; x N )= P(a N ; x N )= = argmax an A Nlog P(aN ; x N ) N p (ai) (x i ) P(a N ). i=1 Protutoúlohudiskrétníoptimalizacevšakpronetriviálnírozdělení P(a N )anetriviální dimenzi dat N není k dispozici účinný deterministický algoritmus. Pro numerické řešení použijeme tedy algoritmus stochastický, založený na znáhodněném prohledávánímnožiny A N aznámýpodjménem simulovanéžíhání (viznapř.

4 166 Martin Janžura, Jan Nielsen Winkler(1995)) nebo Janžura(1990)). Ten je založený na následujících úvahách. Nechťmámenaléztmaximumfunkce F: A N R. Označme Q τ (a N )= eτf(an ) c(f,τ) proreálné τ,kde c(f, τ)= b N A N eτf(bn) jenormalizační konstanta. Zřejmě nyní platí kde Q (a N )= Q τ Q pro τ, 1 M 0 jinak. pro a N M=argmaxF Symbolem M označíme kardinalitu množiny. Můžeme nyní vyvozovat, že nalézt a N M znamenátosaméjakosimulovatsrozdělením Q,cožje skorojako simulovatsrozdělením Q τ prodostatečněveliké τ >0.Tovšakstáleještěneumíme, neboť nejsme schopni vyčíslit normalizační konstantu c(f, τ) pro příslušnou velikost množiny A N.Musímetedypokročitdále.ZteorieMarkovovýchřetězcůvíme,že pokud je R(τ)=(R(τ) a N b N) a N,b N A N nerozložitelná stochastická matice, která splňuje Q τ R(τ)=Q τ (kde Q τ chápemejakořádkovývektor),platí [R(τ)] n a N (0) Qτ ( ) pro n přilibovolnémpočátečním a N (0) AN. Odtudmůžemeopětvyvodit,žesimulovatsrozdělením Q τ je skorototéž jako simulovatsrozdělením[r(τ)] n a n přinějakémdostatečněvelkém n.apodstata (0) simulovaného žíhání je ve spojení obou těchto limitních vlastností. Věta:Nechť τ n (F)log n,potom [R(τ 1 ) R(τ 2 )... R(τ n )] a n (0) Q ( ) pro n. Důkaz: Např. Winkler(1995), Věta Algoritmus nyní můžeme popsat takto: (1)zvolíme a N (0) (2)pro j=1,...,n STOP vybereme a N (j) srozdělením R(τ j) a N (j 1) (3)ponecháme a N (n STOP ). Taktozískané a N n STOP prodostatečněvelké n STOP považujemezavybrané skoro jako srozdělením Q atudížzařešeníúlohy. Jak ale zvolit stochastickou matici R(τ)? Jeden z návodů poskytuje metoda Metropolise Hastingse: Zvolmenerozložitelnoustochastickoumatici Radefinujme ) R(τ) a N b N = R a N b N min ( R(τ) an a N = 1 b N a N R(τ) an b N. 1, Qτ (b N ) R(τ) b N a N Q τ (a N ) R(τ) a N b N pro b N a N Jelikož0 R(τ) a N b N R a N b N,mámetaké b N a N R(τ) a N b N 1aprotojematice R(τ) stochastická.

5 Metodasegmentacev change point problému 167 Abychom zaručili nerozložitelnost, budeme navíc předpokládat, že R a N b N=0 právěkdyž Rb N a N=0. PotomzR(τ) an b N =0plyne R an bn =0anerozložitelnost R(τ)plyneznerozložitelnosti R.Tentododatečnýpředpokladjesnadnosplněnnapř.prosymetrické matice R. Nakonec ověříme invarianci. Můžeme psát Q τ (a N )R(τ) a N b N= ) min (Q τ (a N ) R a N b N, Qτ (b N ) R b N a N + a N a N b N + Q τ (b N ) 1 =Q τ (b N ) neboť také a N b N R(τ) b N a N Q τ (b N )R(τ) bn a N=min ( Q τ (b N ) R bn a N, Qτ (a N ) R an b N ). Tím jsme ukázali, že tato matice má potřebné vlastnosti a přitom na rozdělení Q τ závisípouzeprostřednictvímpodílů Q τ (b N ) Q τ (a N ) = eτ(f(bn ) F(a N )), které již neobsahují problémovou normalizační konstantu c(f, τ) a proto mohou být vyčísleny. Stochastickoumatici Rvolímesohledemnajednoduchostsimulace,zpravidla nezávisle a rovnoměrně,tj. R a N b N= 1 A N provšechna a N, b N A N. Nebo také můžeme v každém kroku měnit náhodně pouze jednu souřadnici, potom máme R a N b N= 1 N A pokudexistuje t {1,...,N}tak,že a s = b s prokaždé s t, R an bn=0 jinak. 1 (Zde nejprve náhodně vybereme souřadnici t s pravděpodobností N anovouhodnotu b t vyberemespravděpodobností 1 A.) Máme-litedyzvolenumatici R,probíhá j-týkroksimulacevedvoufázích: 1.:návrh:simulujeme ã N srozdělením R a N (j 1) 2.: přijetí: pokud Q τj (ã N ) RãN a N (j 1) j = Q τj (a N (j 1) ) R 1, a N (j 1)ãN dosadímepřímo a N j := ã N. Pokud j <1,učinímedalšínezávislousimulaciadosadíme a N (j) := ãn spravděpodobností j neboponecháme a N (j) := an (j 1) spravděpodobností 1 j.

6 168 Martin Janžura, Jan Nielsen Poznámka:Častosepostupujetakétímzpůsobem,žekonfiguraci a N A N pozměňujemepostupně posložkách (pojednéneboněkolikamálo)vnějakémdeterministickémpořadí.toznamená,žeprokaždé j=1,...,nmáme S j {1,...,N} tak, že R (j) a N b N =0 pokud b s a s pronějaké s / S j. Tedy opět např. R (j) a N b N = 1 A S j = 0 jinak. pokud a s = b s prokaždé s / S j. Tím ovšemkaždájednotlivá návrhová matice R (j) (a tudíž i od ní odvozená R(τ) (j) )nenínerozložitelnáamusímetedybrát R(τ)=R(τ) (1) R(τ) (N). Pokudpřitomplatí N j=1 S j= {1,..., N},jeužtatosoučinovámaticenerozložitelná. Tentopostupmátuvýhodu,žejekaždýjehodílčíkrokvelmirychleasnadno realizovatelný. 4. Implementace a příklady V naší úloze jsme použili Metropolisův Hastingsův algoritmus v modifikaci popsané vpoznámcevpředchozíčásti,kdyjsmebrali S j = {j 1, j, j+1}pro j=2,...,n 1. Abychom eliminovali směrový efekt při simulaci, měnili jsme periodicky směr času, brali jsme tedy vlastně R(τ)=R(τ) (1) R(τ) (N) R(τ) (N) R(τ) (1). Velmipodstatnýmparametremúlohyjevolbafunkce τ n (nazývanávterminologii simulovanéhožíháníjako ochlazovacíplán.)vzhledemkesvépomalérychlosti konvergencejelogaritmusvšeobecněpovažovánproreálnědosažitelné n STOP za příliš pomalý(viz např. Winkler(1995), Kapitola 6). Jde zde však třeba postupovat velmi opatrně, neboť volba příliš rychlé konvergence zavádí metodu okamžitě do nějakého lokálního extrému blízko počáteční konfigurace. Po určitých numerických experimentechsevnašempřípaděosvědčilobrát τ n =(1+10 l ) n,kdemůžeme zvolit l {3,4,5}.Potomzpravidlapostačuje n STOP =10 5. Metodu jsme aplikovali na simulovaná i reálná data. Vzhledem k tomu, že reálná data se týkala ročních průměrných teplot v Praze, pracovali jsme s podobným oborem hodnot i pro simulovaná data. Zvolili jsme a P(a N ) exp A={8,9,10,11} { α } N a i a i 1, cožznamená,žeapriornírozděleníjemarkovskéapro α >0jsoupreferoványblízké (nejvíce přímo totožné) hodnoty v sousedících bodech. To odpovídá méně četným améněvýznamnýmzměnám.dáleprokaždé i=1,...,nbylo p (a) i (x i )= 1 e 1 2σ 2(xi a)2, 2πσ takžejsmemělidatasnezávislýmgaussovskýmšumem.sdruženérozdělení L(X 1,......, X N )jetedydánotzv.skrytýmmarkovskýmmodelem(viznapř.macdonald i=2

7 Metodasegmentacev change point problému 169 a Zucchini(1997) pro podrobnou studii). Simulovaná data vznikla tak, že jsme nejprvesimulovaliposloupnost a N apotomji zašuměli. Prodanádata ˆx 1,...,ˆx N vedemetodamapnaúlohu [ N ] N min (ˆx i a i ) 2 +2γ a i a i 1 a N i=1 kde γ = σ 2 αjenyníjedinýmparametremúlohy,vyjadřujícímrelacimezi důvěryhodností data důvěryhodností informaceobsaženévsousedníchhodnotách. (Např. pokud je malý rozptyl v datech a malé závislosti mezi sousedy, dáváme větší váhu informaci v datech.) Za počáteční konfiguraci jsme volili vždy postupně dvě krajní možnosti, a to jednakkonfiguracizískanou zdat (tj.vyřešenímúlohypři γ=0),apotomkonfiguracikonstantní(tumůžemepovažovatzařešenípři γ= ).Pokudsepřitakto významně odlišných počátečních hodnotách řešení nelišila, mohli jsme to považovat za známku spolehlivosti výsledku. Samozřejmě,žeobecněbychomneznaliani správnou množinu Aaparametr γ (když už bychom připustili daný typ rozdělení). Proto jsme experimenty prováděli při různých volbách těchto parametrů. Reálnými daty byly průměrné roční teploty naměřené v pražském Klementinu od roku 1775(autoři děkují J. Antochovi za laskavé zapůjčení). Aplikovali jsme na ně stejný model jako na data simulovaná. i=2 5. Výsledky Výsledky uvádíme formou obrázků, kde slabá čára vždy značí průběh dat, silná výslednou konfiguraci a pro simulovaná data pak středně silná skoková čára znázorňujeprůběh správné konfigurace.vzhledemktomu,žejsmemělinamyslidetekci změn,volilijsmetutokonfiguraciseskokovýmprůběhem. Výsledkyuvádímeprotrojerůznádata.Nejprve(Obr.1 Obr.6)prodatasimulovanásrozptylem σ 2 =0,5(při α=5, A={8,9,10,11}),dalšísérie(Obr.7 Obr.12)obsahujevýsledkyprojinádatapřivětšímrozptylu σ 2 =1(stejné αaa) aposlednísérie(obr.13 Obr.18)setýkáreálnýchdatzKlementina.Prokaždádata uvádímeřešeníprovšechnykombinacevolbyparametru γ=1nebo γ=5amnožiny A=[8,11]spřesností0,1( Krok=0,1 ), A={8;8,5;9;9,5;10;10,5;11}( Krok =0,5 )a A={8;9;10;11}(Krok=1). 6. Závěry (1) Správná volba parametru γ je důležitá. Při malém γ = 1 řešení obvykle příliš sledujedata(svýjimkounaobr.5,kdepřisprávnězvolenémnožině Aje i takto malý parametr γ postačující, vedoucí ke stejnému řešení jako γ = 5 naobr.6).protoprodobrévýsledkybylotřebazpravidlapoužít γ=5. (2)Volbastavovémnožiny A(čili Kroku )takéovlivňujeřešenípodstatně. Vzhledem k principu metody, která preferuje stejné nebo blízké hodnoty, docházípřivětšístavovémnožině(tj.jemnějšíškále)k vyhlazení skokové funkce tvořící správnou konfiguraci. (3) Při správně zvolených parametrech funguje metoda dostatečně spolehlivě. (4) Výsledky pro klementinská data nejsou v rozporu s očekáváním a výstupy z jiných zpracování a poskytují zajímavé náhledy a interpretační možnosti. (5) Celkově je možné říci, že zejména pro reálná data poskytuje metoda i nástroj pro generování hypotéz, které mohou být dále zkoumány jinými postupy.

8 170 Martin Janžura, Jan Nielsen Obr.1Rozptyl=0,5,Gamma=1,Krok=0,1. Obr.2Rozptyl=0,5,Gamma=5,Krok=0,1. Obr.3Rozptyl=0,5,Gamma=1,Krok=0,5.

9 Metodasegmentacev change point problému 171 Obr.4Rozptyl=0,5,Gamma=5,Krok=0,5. Obr.5Rozptyl=0,5,Gamma=1,Krok=1,0. Obr.6Rozptyl=0,5,Gamma=5,Krok=1,0.

10 172 Martin Janžura, Jan Nielsen Obr.7Rozptyl=1,0,Gamma=1,Krok=0,1. Obr.8Rozptyl=1,0,Gamma=5,Krok=0,1. Obr.9Rozptyl=1,0,Gamma=1,Krok=0,5.

11 Metodasegmentacev change point problému 173 Obr.10Rozptyl=1,0,Gamma=5,Krok=0,5. Obr.11Rozptyl=1,0,Gamma=1,Krok=1,0. Obr.12Rozptyl=1,0,Gamma=5,Krok=1,0.

12 174 Martin Janžura, Jan Nielsen Obr.13Klementinum,Gamma=1,Krok=0,1. Obr.14Klementinum,Gamma=5,Krok=0,1. Obr.15Klementinum,Gamma=1,Krok=0,5.

13 Metodasegmentacev change point problému 175 Obr.16Klementinum,Gamma=5,Krok=0,5. Obr.17Klementinum,Gamma=1,Krok=1,0. Obr.18Klementinum,Gamma=5,Krok=1,0.

14 176 Martin Janžura, Jan Nielsen 7. Další zobecnění V předchozích částech jsme uvažovali pouze nezávislé veličiny lišící se střední hodnotou.nynísiukážeme,žemetodajedostatečněobecnáažezáležíjennanaší schopnosti zformulovat řešený problém v jejím rámci. i) Trend Uvažujmesystém,kterýsemůženacházetvesvoustavech,atovestavu stagnace nebo růstu. Stagnaci v čase i {1,...,N} vyjádříme tak, že EX i = EX i 1,arůsttak,že EX i = EX i 1 + c,kde c > 0jeznámá konstanta. Předpokládáme opět gaussovský šum a markovskou apriorní distribuci. Metoda MAP pak vede na min a N N ˆx i c i=1 i j=1 a j 2 + γ N a i a i 1 kde a N {0,1} N (a i =0znamenástagnaciaa i =1růst). ii) AR procesy Nyní předpokládejme, že pozorované veličiny tvoří gaussovskou autoregresní posloupnost, jejíž parametry se mohou měnit. Máme dán seznam modelů ( ) µ (a), {c (a) k }K k=1 { kde µ (a) jsoustředníhodnotya c (a) k } K i=2 a A dataˆx k+1,...,ˆx N,řešímeúlohu ( 2 N K min ˆx i µ (ai) c (ai) a N k ˆx i k) + γ i=1 k=1 k=1 autoregresníkoeficienty.máme-li N DIST(a i, a i 1 ) kde a N A N adist(, )jerelaceodvozenáodapriornídistribuce. Vtěchtoúloháchjsmestálepracovalise známou množinou A.Jednalosetedy, striktně vzato, o klasifikaci a ne o segmentaci. Z předpokladu gaussovského šumu a markovské apriorní distribuce můžeme však odvodit i účelovou funkci typu N [ (xi x i 1 ) 2 δ(a i, a i 1 )+γ (1 δ(a i, a i 1 )) ], kde i=2 δ(a, b)= 1 pro a=b, 0 jinak. Zde potom volíme pouze velikost množiny A, na konkrétních hodnotách jejich elementůnezáleží.paksejednáopravou nesupervizovanou segmentaci. Literatura [1] Antoch, J., Hušková, M. a Jarušková D.(1998): Change point problem po deseti letech. Sborník Robust 98, JČMF Praha, [2] Csörgö, M. a Horváth, L.(1997): Limit Theorems in Change Point Analysis. Wiley. [3] Janžura, M.(1990): O jednom pravděpodobnostním algoritmu pro optimalizační úlohy. Sborník Robust 90, JČMF Praha, i=2

15 Metodasegmentacev change point problému 177 [4] MacDonald, I. L. a Zucchicni, W. (1997): Hidden Markov and Other Models for Discrete valued Times Series. Chapman& Hall. [5] Vajda, I.(1987): Theory of Information and Statistical Decision (in Slovak). Alfa, Bratislava. [6] Winkler, G.(1995): Image Analysis, Random Fields and Dynamic Monte Carlo Methods. Springer. ÚstavteorieinformaceaautomatizaceAVČR,PodVodárenskouvěží4,18208Praha8

Markov Chain Monte Carlo. Jan Kracík.

Markov Chain Monte Carlo. Jan Kracík. Markov Chain Monte Carlo Jan Kracík jan.kracik@vsb.cz Princip Monte Carlo integrace Cílem je (přibližný) výpočet integrálu I(g) = E f [g(x)] = g(x)f (x)dx. (1) Umíme-li generovat nezávislé vzorky x (1),

Více

Pravděpodobnost, náhoda, kostky

Pravděpodobnost, náhoda, kostky Pravděpodobnost, náhoda, kostky Radek Pelánek IV122 Výhled pravděpodobnost náhodná čísla lineární regrese detekce shluků Dnes lehce nesourodá směs úloh souvisejících s pravděpodobností připomenutí, souvislosti

Více

Testování změn v binárnách autoregresních modelech Šárka Hudecová 1/ 36

Testování změn v binárnách autoregresních modelech Šárka Hudecová 1/ 36 Testování změn v binárnách autoregresních modelech Šárka Hudecová KPMS MFF UK ROBUST 2012 Němčičky 9. 14.9.2012 Testování změn v binárnách autoregresních modelech Šárka Hudecová 1/ 36 Uvažovaná situace

Více

Pravděpodobnost, náhoda, kostky

Pravděpodobnost, náhoda, kostky Pravděpodobnost, náhoda, kostky Radek Pelánek IV122, jaro 2015 Výhled pravděpodobnost náhodná čísla lineární regrese detekce shluků Dnes lehce nesourodá směs úloh souvisejících s pravděpodobností krátké

Více

Bayesovské metody. Mnohorozměrná analýza dat

Bayesovské metody. Mnohorozměrná analýza dat Mnohorozměrná analýza dat Podmíněná pravděpodobnost Definice: Uvažujme náhodné jevy A a B takové, že P(B) > 0. Podmíněnou pravěpodobností jevu A za podmínky, že nastal jev B, nazýváme podíl P(A B) P(A

Více

AVDAT Mnohorozměrné metody, metody klasifikace

AVDAT Mnohorozměrné metody, metody klasifikace AVDAT Mnohorozměrné metody, metody klasifikace Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Mnohorozměrné metody Regrese jedna náhodná veličina je vysvětlována pomocí jiných

Více

Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Stochastický proces Posloupnost náhodných veličin {Y t, t = 0, ±1, ±2 } se nazývá stochastický proces

Více

Časové řady, typy trendových funkcí a odhady trendů

Časové řady, typy trendových funkcí a odhady trendů Časové řady, typy trendových funkcí a odhady trendů Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Jiří Neubauer (Katedra ekonometrie UO Brno) Časové

Více

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Pravděpodobnost a učení Doc. RNDr. Iveta Mrázová,

Více

EM algoritmus. Proč zahrnovat do modelu neznámé veličiny

EM algoritmus. Proč zahrnovat do modelu neznámé veličiny EM algoritmus používá se pro odhad nepozorovaných veličin. Jde o iterativní algoritmus opakující dva kroky: Estimate, který odhadne hodnoty nepozorovaných dat, a Maximize, který maximalizuje věrohodnost

Více

UČENÍ BEZ UČITELE. Václav Hlaváč

UČENÍ BEZ UČITELE. Václav Hlaváč UČENÍ BEZ UČITELE Václav Hlaváč Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání hlavac@fel.cvut.cz, http://cmp.felk.cvut.cz/~hlavac 1/22 OBSAH PŘEDNÁŠKY ÚVOD Učení

Více

Apriorní rozdělení. Jan Kracík.

Apriorní rozdělení. Jan Kracík. Apriorní rozdělení Jan Kracík jan.kracik@vsb.cz Apriorní rozdělení Apriorní rozdělení (spolu s modelem) reprezentuje informaci o neznámém parametru θ, která je dostupná předem, tj. bez informace z dat.

Více

NEPARAMETRICKÉ BAYESOVSKÉ ODHADY V KOZIOLOVĚ-GREENOVĚ MODELU NÁHODNÉHO CENZOROVÁNÍ. Michal Friesl

NEPARAMETRICKÉ BAYESOVSKÉ ODHADY V KOZIOLOVĚ-GREENOVĚ MODELU NÁHODNÉHO CENZOROVÁNÍ. Michal Friesl NEPARAMETRICKÉ BAYESOVSKÉ ODHADY V KOZIOLOVĚ-GREENOVĚ MODELU NÁHODNÉHO CENZOROVÁNÍ Michal Friesl Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni Princip Příklady V K.-G. modelu

Více

Faster Gradient Descent Methods

Faster Gradient Descent Methods Faster Gradient Descent Methods Rychlejší gradientní spádové metody Ing. Lukáš Pospíšil, Ing. Martin Menšík Katedra aplikované matematiky, VŠB - Technická univerzita Ostrava 24.1.2012 Ing. Lukáš Pospíšil,

Více

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1 Minikurz aplikované statistiky Marie Šimečková, Petr Šimeček Minikurz aplikované statistiky p.1 Program kurzu základy statistiky a pravděpodobnosti regrese (klasická, robustní, s náhodnými efekty, ev.

Více

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně Testování hypotéz Nechť,, je náhodný výběr z nějakého rozdělení s neznámými parametry. Máme dvě navzájem si odporující hypotézy o parametrech daného rozdělení: Nulová hypotéza parametry (případně jediný

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Náhodný výběr Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

Výběrové charakteristiky a jejich rozdělení

Výběrové charakteristiky a jejich rozdělení Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový

Více

Základy teorie pravděpodobnosti

Základy teorie pravděpodobnosti Základy teorie pravděpodobnosti Náhodný jev Pravděpodobnost náhodného jevu Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 15. srpna 2012 Statistika

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

BAYESOVSKÉ ODHADY. Michal Friesl V NĚKTERÝCH MODELECH. Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni

BAYESOVSKÉ ODHADY. Michal Friesl V NĚKTERÝCH MODELECH. Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni BAYESOVSKÉ ODHADY V NĚKTERÝCH MODELECH Michal Friesl Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni Slunce Řidiči IQ Regrese Přežití Obvyklý model Pozorování X = (X 1,..., X

Více

Pravděpodobnost a statistika

Pravděpodobnost a statistika Pravděpodobnost a statistika Bodové odhady a intervaly spolehlivosti Vilém Vychodil KMI/PRAS, Přednáška 10 Vytvořeno v rámci projektu 963/011 FRVŠ V. Vychodil (KMI/PRAS, Přednáška 10) Bodové odhady a intervaly

Více

Intervalové Odhady Parametrů

Intervalové Odhady Parametrů Parametrů Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení technické v Praze

Více

Odhady - Sdružené rozdělení pravděpodobnosti

Odhady - Sdružené rozdělení pravděpodobnosti Odhady - Sdružené rozdělení pravděpodobnosti 4. listopadu 203 Kdybych chtěl znát maximum informací o náhodné veličině, musel bych znát všechny hodnoty, které mohou padnout, a jejich pravděpodobnosti. Tedy

Více

Vytěžování znalostí z dat

Vytěžování znalostí z dat Pavel Kordík, Jan Motl (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2012, Přednáška 7 1/27 Vytěžování znalostí z dat Pavel Kordík, Jan Motl Department of Computer Systems Faculty of Information Technology

Více

Markovské metody pro modelování pravděpodobnosti

Markovské metody pro modelování pravděpodobnosti Markovské metody pro modelování pravděpodobnosti rizikových stavů 1 Markovský řetězec Budeme uvažovat náhodný proces s diskrétním časem (náhodnou posloupnost) X(t), t T {0, 1, 2,... } s konečnou množinou

Více

Teorie rozhodování (decision theory)

Teorie rozhodování (decision theory) Umělá inteligence II Roman Barták, KTIML roman.bartak@mff.cuni.cz http://ktiml.mff.cuni.cz/~bartak Teorie pravděpodobnosti (probability theory) popisuje v co má agent věřit na základě pozorování. Teorie

Více

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D. Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost

Více

Pravděpodobnost a její vlastnosti

Pravděpodobnost a její vlastnosti Pravděpodobnost a její vlastnosti 1 Pravděpodobnost a její vlastnosti Náhodné jevy Náhodný jev je výsledek pokusu (tj. realizace určitého systému podmínek) a jeho charakteristickým rysem je, že může, ale

Více

PRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady

PRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady PRAVDĚPODOBNOST A STATISTIKA Bayesovské odhady Bayesovské odhady - úvod Klasický bayesovský přístup: Klasický přístup je založen na opakování pokusech sledujeme rekvenci nastoupení zvolených jevů Bayesovský

Více

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D. Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít

Více

Základy matematické analýzy

Základy matematické analýzy Základy matematické analýzy Spojitost funkce Ing. Tomáš Kalvoda, Ph.D. 1, Ing. Daniel Vašata 2 1 tomas.kalvoda@fit.cvut.cz 2 daniel.vasata@fit.cvut.cz Katedra aplikované matematiky Fakulta informačních

Více

7. Rozdělení pravděpodobnosti ve statistice

7. Rozdělení pravděpodobnosti ve statistice 7. Rozdělení pravděpodobnosti ve statistice Statistika nuda je, má však cenné údaje, neklesejte na mysli, ona nám to vyčíslí Jednou z úloh statistiky je odhad (výpočet) hodnot statistického znaku x i,

Více

Matematické přístupy k pojištění automobilů. Silvie Kafková. 3. 6. září 2013, Podlesí

Matematické přístupy k pojištění automobilů. Silvie Kafková. 3. 6. září 2013, Podlesí Matematické přístupy k pojištění automobilů Silvie Kafková 3. 6. září 2013, Podlesí Obsah 1 Motivace 2 Tvorba tarifních skupin a priori 3 Motivace Obsah 1 Motivace 2 Tvorba tarifních skupin a priori 3

Více

STANOVENÍ SPOLEHLIVOSTI GEOTECHNICKÝCH KONSTRUKCÍ. J. Pruška, T. Parák

STANOVENÍ SPOLEHLIVOSTI GEOTECHNICKÝCH KONSTRUKCÍ. J. Pruška, T. Parák STANOVENÍ SPOLEHLIVOSTI GEOTECHNICKÝCH KONSTRUKCÍ J. Pruška, T. Parák OBSAH: 1. Co je to spolehlivost, pravděpodobnost poruchy, riziko. 2. Deterministický a pravděpodobnostní přístup k řešení problémů.

Více

oddělení Inteligentní Datové Analýzy (IDA)

oddělení Inteligentní Datové Analýzy (IDA) Vytěžování dat Filip Železný Katedra počítačů oddělení Inteligentní Datové Analýzy (IDA) 22. září 2014 Filip Železný (ČVUT) Vytěžování dat 22. září 2014 1 / 25 Odhad rozdělení Úloha: Vstup: data D = {

Více

Klasifikace a rozpoznávání. Lineární klasifikátory

Klasifikace a rozpoznávání. Lineární klasifikátory Klasifikace a rozpoznávání Lineární klasifikátory Opakování - Skalární součin x = x1 x 2 w = w T x = w 1 w 2 x 1 x 2 w1 w 2 = w 1 x 1 + w 2 x 2 x. w w T x w Lineární klasifikátor y(x) = w T x + w 0 Vyber

Více

SIGNÁLY A LINEÁRNÍ SYSTÉMY

SIGNÁLY A LINEÁRNÍ SYSTÉMY SIGNÁLY A LINEÁRNÍ SYSTÉMY prof. Ing. Jiří Holčík, CSc. holcik@iba.muni.cz II. SIGNÁLY ZÁKLADNÍ POJMY SIGNÁL - DEFINICE SIGNÁL - DEFINICE Signál je jev fyzikální, chemické, biologické, ekonomické či jiné

Více

LWS při heteroskedasticitě

LWS při heteroskedasticitě Stochastické modelování v ekonomii a financích Petr Jonáš 7. prosince 2009 Obsah 1 2 3 4 5 47 1 Předpoklad 1: Y i = X i β 0 + e i i = 1,..., n. (X i, e i) je posloupnost nezávislých nestejně rozdělených

Více

Rovnovážné modely v teorii portfolia

Rovnovážné modely v teorii portfolia 3. září 2013, Podlesí Obsah Portfolio a jeho charakteristiky Definice portfolia Výnosnost a riziko aktiv Výnosnost a riziko portfolia Klasická teorie portfolia Markowitzův model Tobinův model CAPM - model

Více

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin Příklady k procvičení z Matematické statistiky Poslední úprava. listopadu 207. Konvergence posloupnosti náhodných veličin. Necht X, X 2... jsou nezávislé veličiny s rovnoměrným rozdělením na [0, ]. Definujme

Více

Charakterizace rozdělení

Charakterizace rozdělení Charakterizace rozdělení Momenty f(x) f(x) f(x) μ >μ 1 σ 1 σ >σ 1 g 1 g σ μ 1 μ x μ x x N K MK = x f( x) dx 1 M K = x N CK = ( x M ) f( x) dx ( xi M 1 C = 1 K 1) N i= 1 K i K N i= 1 K μ = E ( X ) = xf

Více

Vlastnosti a modelování aditivního

Vlastnosti a modelování aditivního Vlastnosti a modelování aditivního bílého šumu s normálním rozdělením kacmarp@fel.cvut.cz verze: 0090913 1 Bílý šum s normálním rozdělením V této kapitole se budeme zabývat reálným gaussovským šumem n(t),

Více

Náhodné chyby přímých měření

Náhodné chyby přímých měření Náhodné chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně pravděpodobná.

Více

Oct 19th Charles University in Prague, Faculty of Mathematics and Physics. Multidimensional estimators. Základní pojmy.

Oct 19th Charles University in Prague, Faculty of Mathematics and Physics. Multidimensional estimators. Základní pojmy. Charles University in Prague, Faculty of Mathematics and Physics Oct 19th 2009 Influence Function Stejné jako pro jednorozměrný případ až na Θ R p. Influence Function IF (x; T, F) = lim h 0 T [(1 h)f +

Více

Modely teorie grafů, min.kostra, max.tok, CPM, MPM, PERT

Modely teorie grafů, min.kostra, max.tok, CPM, MPM, PERT PEF ČZU Modely teorie grafů, min.kostra, max.tok, CPM, MPM, PERT Okruhy SZB č. 5 Zdroje: Demel, J., Operační výzkum Jablonský J., Operační výzkum Šubrt, T., Langrová, P., Projektové řízení I. a různá internetová

Více

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

Matematicko-fyzikální fakulta Univerzity Karlovy

Matematicko-fyzikální fakulta Univerzity Karlovy Oceňování finančních derivátů ve spojitém čase Václav Kozmík Matematicko-fyzikální fakulta Univerzity Karlovy 4. 10. 2010 Úvod Stochastický kalkulus Wienerův proces stochastické procesy Itoovo lemma změna

Více

Agent pracující v částečně pozorovatelném prostředí udržuje na základě senzorického modelu odhaduje, jak se svět může vyvíjet.

Agent pracující v částečně pozorovatelném prostředí udržuje na základě senzorického modelu odhaduje, jak se svět může vyvíjet. Umělá inteligence II Roman Barták, KTIML roman.bartak@mff.cuni.cz http://ktiml.mff.cuni.cz/~bartak Dnešní program Agent pracující v částečně pozorovatelném prostředí udržuje na základě senzorického modelu

Více

Konvoluční model dynamických studií ledvin. seminář AS UTIA

Konvoluční model dynamických studií ledvin. seminář AS UTIA Konvoluční model dynamických studií ledvin Ondřej Tichý seminář AS UTIA.. Obsah prezentace Scintigrafická obrazová sekvence a její analýza Konstrukce standardního modelu a jeho řešení Experiment Ovlivnění

Více

7. Analýza rozptylu.

7. Analýza rozptylu. 7. Analýza rozptylu. Uvedeme obecnou ideu, která je založena na minimalizaci chyby metodou nejmenších čtverců. Nejdříve uvedeme několik základních tvrzení. Uvažujeme náhodný vektor Y = (Y, Y,..., Y n a

Více

5 Časové řady. Definice 16 Posloupnost náhodných veličin {X t, t T } nazveme slabě stacionární, pokud

5 Časové řady. Definice 16 Posloupnost náhodných veličin {X t, t T } nazveme slabě stacionární, pokud 5 Časové řady Časovou řadou rozumíme posloupnost reálných náhodných veličin X 1,..., X n, přičemž indexy t = 1,..., n interpretujeme jako časové okamžiky. Někdy však uvažujeme i nekonečné posloupnosti

Více

Lineární regrese. Komentované řešení pomocí MS Excel

Lineární regrese. Komentované řešení pomocí MS Excel Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních

Více

ODHADY NÁVRATOVÝCH HODNOT

ODHADY NÁVRATOVÝCH HODNOT ODHADY NÁVRATOVÝCH HODNOT KLIMATOLOGICKÝCH DAT Katedra aplikované matematiky Fakulta přírodovědně-humanitní a pedagogická Technická univerzita v Liberci Robust 2018 ÚVOD Velká pozornost v analýze extrémních

Více

Pravděpodobnost a statistika

Pravděpodobnost a statistika Pravděpodobnost a statistika 1 Náhodné pokusy a náhodné jevy Činnostem, jejichž výsledek není jednoznačně určen podmínkami, za kterých probíhají, a které jsou (alespoň teoreticky) neomezeně opakovatelné,

Více

Greenova funkce pro dvoubodové okrajové úlohy pro obyčejné diferenciální rovnice

Greenova funkce pro dvoubodové okrajové úlohy pro obyčejné diferenciální rovnice Greenova funkce pro dvoubodové okrajové úlohy pro obyčejné diferenciální rovnice Jan Tomeček Tento stručný text si klade za cíl co nejrychlejší uvedení do teorie Greenových funkcí pro obyčejné diferenciální

Více

Stochastické diferenciální rovnice

Stochastické diferenciální rovnice KDM MFF UK, Praha Aplikace matematiky pro učitele 15.11.2011 Kermack-McKendrickův model Kermack-McKendrickův model s vakcinací Model pro nemoc s rychlým šířením a krátkou dobou léčby. Příkladem takovéto

Více

SIGNÁLY A LINEÁRNÍ SYSTÉMY

SIGNÁLY A LINEÁRNÍ SYSTÉMY SIGNÁLY A LINEÁRNÍ SYSTÉMY prof. Ing. Jiří Holčík, CSc. holcik@iba.muni.cziba.muni.cz II. SIGNÁLY ZÁKLADNÍ POJMY SIGNÁL - DEFINICE SIGNÁL - DEFINICE Signál je jev fyzikální, chemické, biologické, ekonomické

Více

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady PSY117/454 Statistická analýza dat v psychologii přednáška 8 Statistické usuzování, odhady Výběr od deskripce k indukci Deskripce dat, odhad parametrů Usuzování = inference = indukce Počítá se s náhodným

Více

Kombinatorická minimalizace

Kombinatorická minimalizace Kombinatorická minimalizace Cílem je nalézt globální minimum ve velké diskrétní množině, kde může být mnoho lokálních minim. Úloha obchodního cestujícího Cílem je najít nejkratší cestu, která spojuje všechny

Více

Statistická teorie učení

Statistická teorie učení Statistická teorie učení Petr Havel Marek Myslivec přednáška z 9. týdne 1 Úvod Představme si situaci výrobce a zákazníka, který si u výrobce objednal algoritmus rozpoznávání. Zákazník dodal experimentální

Více

Detekce interakčních sil v proudu vozidel

Detekce interakčních sil v proudu vozidel Detekce interakčních sil v proudu vozidel (ANEB OBECNĚJŠÍ POHLED NA POJEM VZDÁLENOSTI V MATEMATICE) Doc. Mgr. Milan Krbálek, Ph.D. Katedra matematiky Fakulta jaderná a fyzikálně inženýrská České vysoké

Více

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ Michal Kořenář 1 Abstrakt Rozvoj výpočetní techniky v poslední době umožnil také rozvoj výpočetních metod, které nejsou založeny na bázi

Více

Necht tedy máme přirozená čísla n, k pod pojmem systém lineárních rovnic rozumíme rovnice ve tvaru

Necht tedy máme přirozená čísla n, k pod pojmem systém lineárních rovnic rozumíme rovnice ve tvaru 2. Systémy lineárních rovnic V této kapitole se budeme zabývat soustavami lineárních rovnic s koeficienty z pole reálných případně komplexních čísel. Uvádíme podmínku pro existenci řešení systému lineárních

Více

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0. 11 cvičení z PSI 12-16 prosince 2016 111 (Test dobré shody - geometrické rozdělení Realizací náhodné veličiny X jsme dostali následující četnosti výsledků: hodnota 0 1 2 3 4 5 6 pozorovaná četnost 29 15

Více

Testy dobré shody pro časové řady s diskrétními veličinami

Testy dobré shody pro časové řady s diskrétními veličinami Testy dobré shody pro časové řady s diskrétními veličinami Šárka Hudecová, Marie Hušková a Simos G. Meintanis KPMS MFF UK Robust 2016 Testy dobré shody pro časové řady s diskrétními veličinami Šárka Hudecová

Více

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

MATEMATICKÁ STATISTIKA.   Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci Matematická statistika Matematická statistika se zabývá matematickým

Více

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457. 0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti

Více

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení 2 Zpracování naměřených dat Důležitou součástí každé experimentální práce je statistické zpracování naměřených dat. V této krátké kapitole se budeme věnovat určení intervalů spolehlivosti získaných výsledků

Více

správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B.

správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B. Zkouška z předmětu KMA/PST. Anotace předmětu Náhodné jevy, pravděpodobnost, podmíněná pravděpodobnost. Nezávislé náhodné jevy. Náhodná veličina, distribuční funkce. Diskrétní a absolutně spojitá náhodná

Více

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com) Testování statistických hypotéz Testování statistických hypotéz Princip: Ověřování určitého předpokladu zjišťujeme, zda zkoumaný výběr pochází ze základního souboru, který má určité rozdělení zjišťujeme,

Více

cv3.tex. Vzorec pro úplnou pravděpodobnost

cv3.tex. Vzorec pro úplnou pravděpodobnost 3 cvičení - pravděpodobnost 2102018 18cv3tex n i=1 Vzorec pro úplnou pravděpodobnost Systém náhodných jevů nazýváme úplným, jestliže pro něj platí: B i = 1 a pro i k je B i B k = 0 Jestliže je (Ω, A, P

Více

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY Statistická hypotéza je určitá domněnka (předpoklad) o vlastnostech ZÁKLADNÍHO SOUBORU. Test statistické hypotézy je pravidlo (kritérium), které na základě

Více

Pravděpodobnostní algoritmy

Pravděpodobnostní algoritmy Pravděpodobnostní algoritmy 17. a 18. přednáška z kryptografie Alena Gollová 1/31 Obsah 1 Diskrétní rozdělení náhodné veličiny Algoritmus Generate and Test 2 Alena Gollová 2/31 Diskrétní rozdělení náhodné

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

12. cvičení z PST. 20. prosince 2017

12. cvičení z PST. 20. prosince 2017 1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace

Více

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group

Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group Vytěžování dat Miroslav Čepek, Filip Železný Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group Evropský sociální fond Praha & EU: Investujeme

Více

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) cvičení z PSI 0-4 prosince 06 Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) Z realizací náhodných veličin X a Y s normálním rozdělením) jsme z výběrů daného rozsahu obdrželi

Více

Systém rizikové analýzy při sta4ckém návrhu podzemního díla. Jan Pruška

Systém rizikové analýzy při sta4ckém návrhu podzemního díla. Jan Pruška Systém rizikové analýzy při sta4ckém návrhu podzemního díla Jan Pruška Definice spolehlivos. Spolehlivost = schopnost systému (konstrukce) zachovávat požadované vlastnos4 po celou dobu životnos4 = pravděpodobnost,

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

2 Hlavní charakteristiky v analýze přežití

2 Hlavní charakteristiky v analýze přežití 2 Hlavní charakteristiky v analýze přežití Předpokládané výstupy z výuky: 1. Student umí definovat funkci přežití, rizikovou funkci a kumulativní rizikovou funkci a zná funkční vazby mezi nimi 2. Student

Více

Intervalová data a výpočet některých statistik

Intervalová data a výpočet některých statistik Intervalová data a výpočet některých statistik Milan Hladík 1 Michal Černý 2 1 Katedra aplikované matematiky Matematicko-fyzikální fakulta Univerzita Karlova 2 Katedra ekonometrie Fakulta informatiky a

Více

Úvod do analýzy časových řad

Úvod do analýzy časových řad Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Posloupnost náhodných veličin {Y t, t = 0, ±1, ±2... } se nazývá stochastický

Více

Stochastické modely Informace k závěrečné zkoušce

Stochastické modely Informace k závěrečné zkoušce Stochastické modely Informace k závěrečné zkoušce Jan Zouhar Katedra ekonometrie, FIS VŠE v Praze, zouharj@vse.cz 10. února 2015 Průběh zkoušky. Zkouška je ústní s přípravou na potítku. Každý si vylosuje

Více

Interpolace, ortogonální polynomy, Gaussova kvadratura

Interpolace, ortogonální polynomy, Gaussova kvadratura Interpolace, ortogonální polynomy, Gaussova kvadratura Petr Tichý 20. listopadu 2013 1 Úloha Lagrangeovy interpolace Dán omezený uzavřený interval [a, b] a v něm n + 1 různých bodů x 0, x 1,..., x n. Nechť

Více

Lekce 4 Statistická termodynamika

Lekce 4 Statistická termodynamika Lekce 4 Statistická termodynamika Osnova 1. Co je statistická termodynamika 2. Mikrostav, makrostav a Gibbsův soubor 3. Příklady Gibbsových souborů 4. Souborové střední hodnoty 5. Časové střední hodnoty

Více

Kredibilitní pojistné v pojištění automobilů. Silvie Zlatošová září 2016, Robust

Kredibilitní pojistné v pojištění automobilů. Silvie Zlatošová září 2016, Robust Silvie Zlatošová 11. - 16. září 2016, Robust Obsah 1 Motivace a cíl 2 Tvorba apriorních tarifních skupin 3 Teorie kredibility 4 Aplikace aposteriorních korekcí Motivace a cíl Obsah 1 Motivace a cíl 2 Tvorba

Více

Aplikovaná numerická matematika

Aplikovaná numerická matematika Aplikovaná numerická matematika 6. Metoda nejmenších čtverců doc. Ing. Róbert Lórencz, CSc. České vysoké učení technické v Praze Fakulta informačních technologií Katedra počítačových systémů Příprava studijních

Více

4. Na obrázku je rozdělovací funkce (hustota pravděpodobnosti) náhodné veličiny X. Jakou hodnotu musí mít parametr k?

4. Na obrázku je rozdělovací funkce (hustota pravděpodobnosti) náhodné veličiny X. Jakou hodnotu musí mít parametr k? A 1. Stanovte pravděpodobnost, že náhodná veličina X nabyde hodnoty menší než 6: P( X 6). Veličina X má rozdělení se střední hodnotou 6 a směrodatnou odchylkou 5: N(6,5). a) 0 b) 1/3 c) ½ 2. Je možné,

Více

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y 9. T r a n s f o r m a c e n á h o d n é v e l i č i n y Při popisu procesů zpracováváme vstupní údaj, hodnotu x tak, že výstupní hodnota y závisí nějakým způsobem na vstupní, je její funkcí y = f(x).

Více

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz. Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení

Více

Texty k přednáškám z MMAN3: 4. Funkce a zobrazení v euklidovských prostorech

Texty k přednáškám z MMAN3: 4. Funkce a zobrazení v euklidovských prostorech Texty k přednáškám z MMAN3: 4. Funkce a zobrazení v euklidovských prostorech 1. července 2008 1 Funkce v R n Definice 1 Necht n N a D R n. Reálnou funkcí v R n (reálnou funkcí n proměnných) rozumíme zobrazení

Více

Implementace Bayesova kasifikátoru

Implementace Bayesova kasifikátoru Implementace Bayesova kasifikátoru a diskriminačních funkcí v prostředí Matlab J. Havlík Katedra teorie obvodů Fakulta elektrotechnická České vysoké učení technické v Praze Technická 2, 166 27 Praha 6

Více

Téma 4: Stratifikované a pokročilé simulační metody

Téma 4: Stratifikované a pokročilé simulační metody 0.007 0.006 0.005 0.004 0.003 0.002 0.001 Dlouhodobé nahodilé Std Distribution: Gumbel Min. EV I Mean Requested: 140 Obtained: 141 Std Requested: 75.5 Obtained: 73.2-100 0 100 200 300 Mean Std Téma 4:

Více

Úvod do problematiky měření

Úvod do problematiky měření 1/18 Lord Kelvin: "Když to, o čem mluvíte, můžete změřit, a vyjádřit to pomocí čísel, něco o tom víte. Ale když to nemůžete vyjádřit číselně, je vaše znalost hubená a nedostatečná. Může to být začátek

Více

Value at Risk. Karolína Maňáková

Value at Risk. Karolína Maňáková Value at Risk Karolína Maňáková Value at risk Historická metoda Model-Building přístup Lineární model variance a kovariance Metoda Monte Carlo Stress testing a Back testing Potenciální ztráta s danou pravděpodobností

Více

Přednáška 6, 6. listopadu 2013

Přednáška 6, 6. listopadu 2013 Přednáška 6, 6. listopadu 2013 Kapitola 2. Posloupnosti a řady funkcí. V dalším jsou f, f n : M R, n = 1, 2,..., reálné funkce jedné reálné proměnné definované na (neprázdné) množině M R. Co to znamená,

Více

Lineární klasifikátory

Lineární klasifikátory Lineární klasifikátory Lineární klasifikátory obsah: perceptronový algoritmus základní verze varianta perceptronového algoritmu přihrádkový algoritmus podpůrné vektorové stroje Lineární klasifikátor navrhnout

Více