METODASEGMENTACEV CHANGE POINT PROBLÉMU
|
|
- Leoš Bartoš
- před 6 lety
- Počet zobrazení:
Transkript
1 ROBUST 2002, c JČMF 2002 METODASEGMENTACEV CHANGE POINT PROBLÉMU MARTIN JANŽURA, JAN NIELSEN Abstract. The method of segmentation is used to solve the change-point problem. Rez mз. Metod segmentacii primenen k rexeni problemy detekcii razladki. 1. Úvod Obecně je úloha detekce změn formulována tak, že cílem je zjistit, zda v nějaké časové posloupnosti došlo ke změnám v pravděpodobnostním rozdělení, kterým se řídí pozorované veličiny. Máme tedy náhodné veličiny X 1,...,X N, kde vpřípadějejichnezávislosti předpokládáme,ževeličina X i mározdělení p i pro i=1,...,n.(uzávislýchveličinbychommuseliuvažovatrozdělenípodmíněná minulostí,tedy L(X i X i 1,..., X 1 )=p i (x i x i 1,...,x 1 )pro i=1,...,n).statistická úloha detekce změny je potom testování hypotézy H 0 : p 1 = =p N proti různě obecným alternativám(viz např. Csörgö a Horváth(1997) nebo Antoch, Hušková a Jarušková(1998)). Je přitom zřejmé, že zcela obecným a úplným řešením by bylo nalezení přímo posloupnosti p 1,...,p N. Takto obecnou úlohu však pochopitelně nelze řešit. Budeme tedy uvažovat některá zjednodušení. Předně nebudeme předpokládat zcela obecná rozdělení, ale vymezíme pevně danou konečnou množinu přípustných distribucí P= {p (a) } a A, kde A je konečná množina návěští ( štítků, jmen ). Posloupnost distribucí p 1,..., p N,kde p i Pprokaždé i=1,...,n,námtaktopřirozeněindukujeposloupnost návěští a N =(a 1,...,a N ) A N kdevždy p i = p (ai) pro i=1,...,n. Projednoduchostbudemepředpokládat p (a) >0provšechna a A.Můžeme nyní psát N L(X 1,..., X N a 1,..., a N )= p (ai) (x i ) 2000 Mathematics Subject Classification. 62M99 62P12. Klíčová slova. Segmentace, detekce struktuálních změn statistických modelů, statistický rozhodovací problém, metoda MAP, simulované žíhání, Metropolisnlv-Hastingsv algoritmus. Tato práce je podporována grantem GA ČR 201/00/1149. i=1
2 164 Martin Janžura, Jan Nielsen pronezávislápozorování(případně N i=1 p(ai) (x i x i 1,...,x 1 )prozávislá).totorozdělenípakbudemepovažovatzapodmíněnérozdělenívektoruveličin X 1,..., X N za podmínkyposloupnostinávěští a 1,..., a N. Navíc budeme předpokládat, že průběh změn v posloupnosti není libovolný, ale je ovlivněn nějakou vnitřní strukturou, a proto všechny posloupnosti nejsou nutně stejně možné, ale existuje nám známé apriorní rozdělení {P(a (N) )} an A (N), kdeopětprojednoduchost P >0. Tímtosepřímonabízířešitúlohunalezeníposloupnosti a N =(a 1,..., a N )na základědat x N =(x 1,..., x N ),vzniklýchpozorovánímposloupnosti X 1,...,X N, pomocí bayesovského přístupu. Vzhledem k tomu, že v typických situacích, které budeme mít na mysli, nebudou změny příliš časté a tudíž se posloupnosti návěští budou podle očekávání skládat z homogenních úseků(segmentů), metoda zvolená v tomto článku se podobá metodám segmentace(či klasifikace) známé např. v oblasti zpracování obrazu(viz Winkler(1995) pro přehled). V následující části navrhneme řešení v rámci obecného bayesovského rozhodovacího problému. 2. Bayesovské řešení statistického rozhodovacího problému Statistický rozhodovací problém je dán čtveřicí(viz např. Vajda(1987)) {Y, Q, D, Z}, kde Yjestavovýprostor, Q={q θ } θ Θ jeparametrickárodinapravděpodobnostních rozdělení, Djemnožinamožných rozhodnutí a Z=Θ D [0, ) je ztrátová funkce, kde Z(θ, d) vyjadřuje ztrátu, která nastane při rozhodnutí d, jestliže skutečná hodnota parametru je θ Θ. Provolbu dobrého rozhodnutípakmámekdispozicipozorování y Y,přičemž tuto volbu popisuje rozhodovací funkce δ: Y D. Kvalitu rozhodovací funkce posuzujeme podle ztráty Z(θ, δ)= Z(θ, δ(y))dq θ (y) spojené s touto rozhodovací funkcí.(necháme v těchto úvahách stranou otázku měřitelnoti jednotlivých zobrazení. Můžeme např. pro jednoduchost považovat všechny množiny za konečné.) Cílem úlohy je pak nalézt takovou rozhodovací funkci, která ztrátu v nějakém smyslu minimalizuje. Pokudpronějakourozhodovacífunkci δ s je Z(θ, δ s )=min Z(θ, δ) prokaždé θ Θ, δ jetato δ s stejnoměrněnejlepšímřešením.řešeníminimaxníjedánopodmínkou max Z(θ, δ m)=minmax Z(θ, δ). θ Θ δ θ Θ
3 Metodasegmentacev change point problému 165 My zde budeme předpokládat, že máme na prostoru Θ nějakou apriorní distribuci Q(θ).Potomjebayesovskýmřešenímtakovérozhodovacífunkce δ b,kteráminimalizuje očekávanou ztrátu Z(δ)= Z(θ, δ) dq(θ), tedy Označme nyní Z(δ b )=min Z(δ). δ Z(d y) = Z(θ, d) dq(θ y) (kdepřirozeně Q(θ y)= Q(θ;y) Q(y) = qθ (y) Q(θ) qτ (y)dq(τ) ). Tvrzení:Bayesovskéřešení δ b rozhodovacíhoprocesujedánopředpisem Z(δ b (y) y)=min d D Z(d y). Důkaz: Nechť δ je nějaká jiná rozhodovací funkce. Potom Z(δ b )= Z(δ b (y) y)dq(y) Z(δ(y) y) dq(y) = Z(δ). Uvažujmenyníspeciálnípřípad,kdymáme rozhodnout oparametru,tedyjej odhadnout. Potom Θ = D. Navíc se omezíme na speciální ztrátovou funkci 0 pokud θ=d Z(θ, d)= 1 jinak. Potom máme Z(d y)=1 Q(d y) aprotoje(podletvrzenínahoře)bayesovskéřešení δ b =ˆθdáno Q(ˆθ(y) y)=max θ Θ Q(θ y). Je to tedy odhad maximalizující aposteriorní pravděpodobnost(map), který je bayesovským řešením, neboť minimalizuje očekávanou ztrátu, danou zde pravděpodobností chyby Z(ˆθ)=Q(θ ˆθ(y)). 3. Řešení původní úlohy metodou MAP Budeme řešit úlohu zformulovanou v části 1 metodou MAP, tzn. pro daná data x N =(x 1,...,x N )budemehledattakovouposloupnost â N,kterámaximalizujeaposteriorní pravděpodobnost, tedy kde â N argmax an A N P(aN x N ) = argmax an A N P(aN ; x N )= P(a N ; x N )= = argmax an A Nlog P(aN ; x N ) N p (ai) (x i ) P(a N ). i=1 Protutoúlohudiskrétníoptimalizacevšakpronetriviálnírozdělení P(a N )anetriviální dimenzi dat N není k dispozici účinný deterministický algoritmus. Pro numerické řešení použijeme tedy algoritmus stochastický, založený na znáhodněném prohledávánímnožiny A N aznámýpodjménem simulovanéžíhání (viznapř.
4 166 Martin Janžura, Jan Nielsen Winkler(1995)) nebo Janžura(1990)). Ten je založený na následujících úvahách. Nechťmámenaléztmaximumfunkce F: A N R. Označme Q τ (a N )= eτf(an ) c(f,τ) proreálné τ,kde c(f, τ)= b N A N eτf(bn) jenormalizační konstanta. Zřejmě nyní platí kde Q (a N )= Q τ Q pro τ, 1 M 0 jinak. pro a N M=argmaxF Symbolem M označíme kardinalitu množiny. Můžeme nyní vyvozovat, že nalézt a N M znamenátosaméjakosimulovatsrozdělením Q,cožje skorojako simulovatsrozdělením Q τ prodostatečněveliké τ >0.Tovšakstáleještěneumíme, neboť nejsme schopni vyčíslit normalizační konstantu c(f, τ) pro příslušnou velikost množiny A N.Musímetedypokročitdále.ZteorieMarkovovýchřetězcůvíme,že pokud je R(τ)=(R(τ) a N b N) a N,b N A N nerozložitelná stochastická matice, která splňuje Q τ R(τ)=Q τ (kde Q τ chápemejakořádkovývektor),platí [R(τ)] n a N (0) Qτ ( ) pro n přilibovolnémpočátečním a N (0) AN. Odtudmůžemeopětvyvodit,žesimulovatsrozdělením Q τ je skorototéž jako simulovatsrozdělením[r(τ)] n a n přinějakémdostatečněvelkém n.apodstata (0) simulovaného žíhání je ve spojení obou těchto limitních vlastností. Věta:Nechť τ n (F)log n,potom [R(τ 1 ) R(τ 2 )... R(τ n )] a n (0) Q ( ) pro n. Důkaz: Např. Winkler(1995), Věta Algoritmus nyní můžeme popsat takto: (1)zvolíme a N (0) (2)pro j=1,...,n STOP vybereme a N (j) srozdělením R(τ j) a N (j 1) (3)ponecháme a N (n STOP ). Taktozískané a N n STOP prodostatečněvelké n STOP považujemezavybrané skoro jako srozdělením Q atudížzařešeníúlohy. Jak ale zvolit stochastickou matici R(τ)? Jeden z návodů poskytuje metoda Metropolise Hastingse: Zvolmenerozložitelnoustochastickoumatici Radefinujme ) R(τ) a N b N = R a N b N min ( R(τ) an a N = 1 b N a N R(τ) an b N. 1, Qτ (b N ) R(τ) b N a N Q τ (a N ) R(τ) a N b N pro b N a N Jelikož0 R(τ) a N b N R a N b N,mámetaké b N a N R(τ) a N b N 1aprotojematice R(τ) stochastická.
5 Metodasegmentacev change point problému 167 Abychom zaručili nerozložitelnost, budeme navíc předpokládat, že R a N b N=0 právěkdyž Rb N a N=0. PotomzR(τ) an b N =0plyne R an bn =0anerozložitelnost R(τ)plyneznerozložitelnosti R.Tentododatečnýpředpokladjesnadnosplněnnapř.prosymetrické matice R. Nakonec ověříme invarianci. Můžeme psát Q τ (a N )R(τ) a N b N= ) min (Q τ (a N ) R a N b N, Qτ (b N ) R b N a N + a N a N b N + Q τ (b N ) 1 =Q τ (b N ) neboť také a N b N R(τ) b N a N Q τ (b N )R(τ) bn a N=min ( Q τ (b N ) R bn a N, Qτ (a N ) R an b N ). Tím jsme ukázali, že tato matice má potřebné vlastnosti a přitom na rozdělení Q τ závisípouzeprostřednictvímpodílů Q τ (b N ) Q τ (a N ) = eτ(f(bn ) F(a N )), které již neobsahují problémovou normalizační konstantu c(f, τ) a proto mohou být vyčísleny. Stochastickoumatici Rvolímesohledemnajednoduchostsimulace,zpravidla nezávisle a rovnoměrně,tj. R a N b N= 1 A N provšechna a N, b N A N. Nebo také můžeme v každém kroku měnit náhodně pouze jednu souřadnici, potom máme R a N b N= 1 N A pokudexistuje t {1,...,N}tak,že a s = b s prokaždé s t, R an bn=0 jinak. 1 (Zde nejprve náhodně vybereme souřadnici t s pravděpodobností N anovouhodnotu b t vyberemespravděpodobností 1 A.) Máme-litedyzvolenumatici R,probíhá j-týkroksimulacevedvoufázích: 1.:návrh:simulujeme ã N srozdělením R a N (j 1) 2.: přijetí: pokud Q τj (ã N ) RãN a N (j 1) j = Q τj (a N (j 1) ) R 1, a N (j 1)ãN dosadímepřímo a N j := ã N. Pokud j <1,učinímedalšínezávislousimulaciadosadíme a N (j) := ãn spravděpodobností j neboponecháme a N (j) := an (j 1) spravděpodobností 1 j.
6 168 Martin Janžura, Jan Nielsen Poznámka:Častosepostupujetakétímzpůsobem,žekonfiguraci a N A N pozměňujemepostupně posložkách (pojednéneboněkolikamálo)vnějakémdeterministickémpořadí.toznamená,žeprokaždé j=1,...,nmáme S j {1,...,N} tak, že R (j) a N b N =0 pokud b s a s pronějaké s / S j. Tedy opět např. R (j) a N b N = 1 A S j = 0 jinak. pokud a s = b s prokaždé s / S j. Tím ovšemkaždájednotlivá návrhová matice R (j) (a tudíž i od ní odvozená R(τ) (j) )nenínerozložitelnáamusímetedybrát R(τ)=R(τ) (1) R(τ) (N). Pokudpřitomplatí N j=1 S j= {1,..., N},jeužtatosoučinovámaticenerozložitelná. Tentopostupmátuvýhodu,žejekaždýjehodílčíkrokvelmirychleasnadno realizovatelný. 4. Implementace a příklady V naší úloze jsme použili Metropolisův Hastingsův algoritmus v modifikaci popsané vpoznámcevpředchozíčásti,kdyjsmebrali S j = {j 1, j, j+1}pro j=2,...,n 1. Abychom eliminovali směrový efekt při simulaci, měnili jsme periodicky směr času, brali jsme tedy vlastně R(τ)=R(τ) (1) R(τ) (N) R(τ) (N) R(τ) (1). Velmipodstatnýmparametremúlohyjevolbafunkce τ n (nazývanávterminologii simulovanéhožíháníjako ochlazovacíplán.)vzhledemkesvépomalérychlosti konvergencejelogaritmusvšeobecněpovažovánproreálnědosažitelné n STOP za příliš pomalý(viz např. Winkler(1995), Kapitola 6). Jde zde však třeba postupovat velmi opatrně, neboť volba příliš rychlé konvergence zavádí metodu okamžitě do nějakého lokálního extrému blízko počáteční konfigurace. Po určitých numerických experimentechsevnašempřípaděosvědčilobrát τ n =(1+10 l ) n,kdemůžeme zvolit l {3,4,5}.Potomzpravidlapostačuje n STOP =10 5. Metodu jsme aplikovali na simulovaná i reálná data. Vzhledem k tomu, že reálná data se týkala ročních průměrných teplot v Praze, pracovali jsme s podobným oborem hodnot i pro simulovaná data. Zvolili jsme a P(a N ) exp A={8,9,10,11} { α } N a i a i 1, cožznamená,žeapriornírozděleníjemarkovskéapro α >0jsoupreferoványblízké (nejvíce přímo totožné) hodnoty v sousedících bodech. To odpovídá méně četným améněvýznamnýmzměnám.dáleprokaždé i=1,...,nbylo p (a) i (x i )= 1 e 1 2σ 2(xi a)2, 2πσ takžejsmemělidatasnezávislýmgaussovskýmšumem.sdruženérozdělení L(X 1,......, X N )jetedydánotzv.skrytýmmarkovskýmmodelem(viznapř.macdonald i=2
7 Metodasegmentacev change point problému 169 a Zucchini(1997) pro podrobnou studii). Simulovaná data vznikla tak, že jsme nejprvesimulovaliposloupnost a N apotomji zašuměli. Prodanádata ˆx 1,...,ˆx N vedemetodamapnaúlohu [ N ] N min (ˆx i a i ) 2 +2γ a i a i 1 a N i=1 kde γ = σ 2 αjenyníjedinýmparametremúlohy,vyjadřujícímrelacimezi důvěryhodností data důvěryhodností informaceobsaženévsousedníchhodnotách. (Např. pokud je malý rozptyl v datech a malé závislosti mezi sousedy, dáváme větší váhu informaci v datech.) Za počáteční konfiguraci jsme volili vždy postupně dvě krajní možnosti, a to jednakkonfiguracizískanou zdat (tj.vyřešenímúlohypři γ=0),apotomkonfiguracikonstantní(tumůžemepovažovatzařešenípři γ= ).Pokudsepřitakto významně odlišných počátečních hodnotách řešení nelišila, mohli jsme to považovat za známku spolehlivosti výsledku. Samozřejmě,žeobecněbychomneznaliani správnou množinu Aaparametr γ (když už bychom připustili daný typ rozdělení). Proto jsme experimenty prováděli při různých volbách těchto parametrů. Reálnými daty byly průměrné roční teploty naměřené v pražském Klementinu od roku 1775(autoři děkují J. Antochovi za laskavé zapůjčení). Aplikovali jsme na ně stejný model jako na data simulovaná. i=2 5. Výsledky Výsledky uvádíme formou obrázků, kde slabá čára vždy značí průběh dat, silná výslednou konfiguraci a pro simulovaná data pak středně silná skoková čára znázorňujeprůběh správné konfigurace.vzhledemktomu,žejsmemělinamyslidetekci změn,volilijsmetutokonfiguraciseskokovýmprůběhem. Výsledkyuvádímeprotrojerůznádata.Nejprve(Obr.1 Obr.6)prodatasimulovanásrozptylem σ 2 =0,5(při α=5, A={8,9,10,11}),dalšísérie(Obr.7 Obr.12)obsahujevýsledkyprojinádatapřivětšímrozptylu σ 2 =1(stejné αaa) aposlednísérie(obr.13 Obr.18)setýkáreálnýchdatzKlementina.Prokaždádata uvádímeřešeníprovšechnykombinacevolbyparametru γ=1nebo γ=5amnožiny A=[8,11]spřesností0,1( Krok=0,1 ), A={8;8,5;9;9,5;10;10,5;11}( Krok =0,5 )a A={8;9;10;11}(Krok=1). 6. Závěry (1) Správná volba parametru γ je důležitá. Při malém γ = 1 řešení obvykle příliš sledujedata(svýjimkounaobr.5,kdepřisprávnězvolenémnožině Aje i takto malý parametr γ postačující, vedoucí ke stejnému řešení jako γ = 5 naobr.6).protoprodobrévýsledkybylotřebazpravidlapoužít γ=5. (2)Volbastavovémnožiny A(čili Kroku )takéovlivňujeřešenípodstatně. Vzhledem k principu metody, která preferuje stejné nebo blízké hodnoty, docházípřivětšístavovémnožině(tj.jemnějšíškále)k vyhlazení skokové funkce tvořící správnou konfiguraci. (3) Při správně zvolených parametrech funguje metoda dostatečně spolehlivě. (4) Výsledky pro klementinská data nejsou v rozporu s očekáváním a výstupy z jiných zpracování a poskytují zajímavé náhledy a interpretační možnosti. (5) Celkově je možné říci, že zejména pro reálná data poskytuje metoda i nástroj pro generování hypotéz, které mohou být dále zkoumány jinými postupy.
8 170 Martin Janžura, Jan Nielsen Obr.1Rozptyl=0,5,Gamma=1,Krok=0,1. Obr.2Rozptyl=0,5,Gamma=5,Krok=0,1. Obr.3Rozptyl=0,5,Gamma=1,Krok=0,5.
9 Metodasegmentacev change point problému 171 Obr.4Rozptyl=0,5,Gamma=5,Krok=0,5. Obr.5Rozptyl=0,5,Gamma=1,Krok=1,0. Obr.6Rozptyl=0,5,Gamma=5,Krok=1,0.
10 172 Martin Janžura, Jan Nielsen Obr.7Rozptyl=1,0,Gamma=1,Krok=0,1. Obr.8Rozptyl=1,0,Gamma=5,Krok=0,1. Obr.9Rozptyl=1,0,Gamma=1,Krok=0,5.
11 Metodasegmentacev change point problému 173 Obr.10Rozptyl=1,0,Gamma=5,Krok=0,5. Obr.11Rozptyl=1,0,Gamma=1,Krok=1,0. Obr.12Rozptyl=1,0,Gamma=5,Krok=1,0.
12 174 Martin Janžura, Jan Nielsen Obr.13Klementinum,Gamma=1,Krok=0,1. Obr.14Klementinum,Gamma=5,Krok=0,1. Obr.15Klementinum,Gamma=1,Krok=0,5.
13 Metodasegmentacev change point problému 175 Obr.16Klementinum,Gamma=5,Krok=0,5. Obr.17Klementinum,Gamma=1,Krok=1,0. Obr.18Klementinum,Gamma=5,Krok=1,0.
14 176 Martin Janžura, Jan Nielsen 7. Další zobecnění V předchozích částech jsme uvažovali pouze nezávislé veličiny lišící se střední hodnotou.nynísiukážeme,žemetodajedostatečněobecnáažezáležíjennanaší schopnosti zformulovat řešený problém v jejím rámci. i) Trend Uvažujmesystém,kterýsemůženacházetvesvoustavech,atovestavu stagnace nebo růstu. Stagnaci v čase i {1,...,N} vyjádříme tak, že EX i = EX i 1,arůsttak,že EX i = EX i 1 + c,kde c > 0jeznámá konstanta. Předpokládáme opět gaussovský šum a markovskou apriorní distribuci. Metoda MAP pak vede na min a N N ˆx i c i=1 i j=1 a j 2 + γ N a i a i 1 kde a N {0,1} N (a i =0znamenástagnaciaa i =1růst). ii) AR procesy Nyní předpokládejme, že pozorované veličiny tvoří gaussovskou autoregresní posloupnost, jejíž parametry se mohou měnit. Máme dán seznam modelů ( ) µ (a), {c (a) k }K k=1 { kde µ (a) jsoustředníhodnotya c (a) k } K i=2 a A dataˆx k+1,...,ˆx N,řešímeúlohu ( 2 N K min ˆx i µ (ai) c (ai) a N k ˆx i k) + γ i=1 k=1 k=1 autoregresníkoeficienty.máme-li N DIST(a i, a i 1 ) kde a N A N adist(, )jerelaceodvozenáodapriornídistribuce. Vtěchtoúloháchjsmestálepracovalise známou množinou A.Jednalosetedy, striktně vzato, o klasifikaci a ne o segmentaci. Z předpokladu gaussovského šumu a markovské apriorní distribuce můžeme však odvodit i účelovou funkci typu N [ (xi x i 1 ) 2 δ(a i, a i 1 )+γ (1 δ(a i, a i 1 )) ], kde i=2 δ(a, b)= 1 pro a=b, 0 jinak. Zde potom volíme pouze velikost množiny A, na konkrétních hodnotách jejich elementůnezáleží.paksejednáopravou nesupervizovanou segmentaci. Literatura [1] Antoch, J., Hušková, M. a Jarušková D.(1998): Change point problem po deseti letech. Sborník Robust 98, JČMF Praha, [2] Csörgö, M. a Horváth, L.(1997): Limit Theorems in Change Point Analysis. Wiley. [3] Janžura, M.(1990): O jednom pravděpodobnostním algoritmu pro optimalizační úlohy. Sborník Robust 90, JČMF Praha, i=2
15 Metodasegmentacev change point problému 177 [4] MacDonald, I. L. a Zucchicni, W. (1997): Hidden Markov and Other Models for Discrete valued Times Series. Chapman& Hall. [5] Vajda, I.(1987): Theory of Information and Statistical Decision (in Slovak). Alfa, Bratislava. [6] Winkler, G.(1995): Image Analysis, Random Fields and Dynamic Monte Carlo Methods. Springer. ÚstavteorieinformaceaautomatizaceAVČR,PodVodárenskouvěží4,18208Praha8
Markov Chain Monte Carlo. Jan Kracík.
Markov Chain Monte Carlo Jan Kracík jan.kracik@vsb.cz Princip Monte Carlo integrace Cílem je (přibližný) výpočet integrálu I(g) = E f [g(x)] = g(x)f (x)dx. (1) Umíme-li generovat nezávislé vzorky x (1),
Pravděpodobnost, náhoda, kostky
Pravděpodobnost, náhoda, kostky Radek Pelánek IV122 Výhled pravděpodobnost náhodná čísla lineární regrese detekce shluků Dnes lehce nesourodá směs úloh souvisejících s pravděpodobností připomenutí, souvislosti
Testování změn v binárnách autoregresních modelech Šárka Hudecová 1/ 36
Testování změn v binárnách autoregresních modelech Šárka Hudecová KPMS MFF UK ROBUST 2012 Němčičky 9. 14.9.2012 Testování změn v binárnách autoregresních modelech Šárka Hudecová 1/ 36 Uvažovaná situace
Pravděpodobnost, náhoda, kostky
Pravděpodobnost, náhoda, kostky Radek Pelánek IV122, jaro 2015 Výhled pravděpodobnost náhodná čísla lineární regrese detekce shluků Dnes lehce nesourodá směs úloh souvisejících s pravděpodobností krátké
Bayesovské metody. Mnohorozměrná analýza dat
Mnohorozměrná analýza dat Podmíněná pravděpodobnost Definice: Uvažujme náhodné jevy A a B takové, že P(B) > 0. Podmíněnou pravěpodobností jevu A za podmínky, že nastal jev B, nazýváme podíl P(A B) P(A
AVDAT Mnohorozměrné metody, metody klasifikace
AVDAT Mnohorozměrné metody, metody klasifikace Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Mnohorozměrné metody Regrese jedna náhodná veličina je vysvětlována pomocí jiných
Časové řady, typy trendových funkcí a odhady trendů
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Stochastický proces Posloupnost náhodných veličin {Y t, t = 0, ±1, ±2 } se nazývá stochastický proces
Časové řady, typy trendových funkcí a odhady trendů
Časové řady, typy trendových funkcí a odhady trendů Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Jiří Neubauer (Katedra ekonometrie UO Brno) Časové
Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze
Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Pravděpodobnost a učení Doc. RNDr. Iveta Mrázová,
EM algoritmus. Proč zahrnovat do modelu neznámé veličiny
EM algoritmus používá se pro odhad nepozorovaných veličin. Jde o iterativní algoritmus opakující dva kroky: Estimate, který odhadne hodnoty nepozorovaných dat, a Maximize, který maximalizuje věrohodnost
UČENÍ BEZ UČITELE. Václav Hlaváč
UČENÍ BEZ UČITELE Václav Hlaváč Fakulta elektrotechnická ČVUT v Praze katedra kybernetiky, Centrum strojového vnímání hlavac@fel.cvut.cz, http://cmp.felk.cvut.cz/~hlavac 1/22 OBSAH PŘEDNÁŠKY ÚVOD Učení
Apriorní rozdělení. Jan Kracík.
Apriorní rozdělení Jan Kracík jan.kracik@vsb.cz Apriorní rozdělení Apriorní rozdělení (spolu s modelem) reprezentuje informaci o neznámém parametru θ, která je dostupná předem, tj. bez informace z dat.
NEPARAMETRICKÉ BAYESOVSKÉ ODHADY V KOZIOLOVĚ-GREENOVĚ MODELU NÁHODNÉHO CENZOROVÁNÍ. Michal Friesl
NEPARAMETRICKÉ BAYESOVSKÉ ODHADY V KOZIOLOVĚ-GREENOVĚ MODELU NÁHODNÉHO CENZOROVÁNÍ Michal Friesl Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni Princip Příklady V K.-G. modelu
Faster Gradient Descent Methods
Faster Gradient Descent Methods Rychlejší gradientní spádové metody Ing. Lukáš Pospíšil, Ing. Martin Menšík Katedra aplikované matematiky, VŠB - Technická univerzita Ostrava 24.1.2012 Ing. Lukáš Pospíšil,
Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1
Minikurz aplikované statistiky Marie Šimečková, Petr Šimeček Minikurz aplikované statistiky p.1 Program kurzu základy statistiky a pravděpodobnosti regrese (klasická, robustní, s náhodnými efekty, ev.
Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně
Testování hypotéz Nechť,, je náhodný výběr z nějakého rozdělení s neznámými parametry. Máme dvě navzájem si odporující hypotézy o parametrech daného rozdělení: Nulová hypotéza parametry (případně jediný
PRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Náhodný výběr Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr
Výběrové charakteristiky a jejich rozdělení
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový
Základy teorie pravděpodobnosti
Základy teorie pravděpodobnosti Náhodný jev Pravděpodobnost náhodného jevu Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 15. srpna 2012 Statistika
Odhad parametrů N(µ, σ 2 )
Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný
BAYESOVSKÉ ODHADY. Michal Friesl V NĚKTERÝCH MODELECH. Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni
BAYESOVSKÉ ODHADY V NĚKTERÝCH MODELECH Michal Friesl Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni Slunce Řidiči IQ Regrese Přežití Obvyklý model Pozorování X = (X 1,..., X
Pravděpodobnost a statistika
Pravděpodobnost a statistika Bodové odhady a intervaly spolehlivosti Vilém Vychodil KMI/PRAS, Přednáška 10 Vytvořeno v rámci projektu 963/011 FRVŠ V. Vychodil (KMI/PRAS, Přednáška 10) Bodové odhady a intervaly
Intervalové Odhady Parametrů
Parametrů Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení technické v Praze
Odhady - Sdružené rozdělení pravděpodobnosti
Odhady - Sdružené rozdělení pravděpodobnosti 4. listopadu 203 Kdybych chtěl znát maximum informací o náhodné veličině, musel bych znát všechny hodnoty, které mohou padnout, a jejich pravděpodobnosti. Tedy
Vytěžování znalostí z dat
Pavel Kordík, Jan Motl (ČVUT FIT) Vytěžování znalostí z dat BI-VZD, 2012, Přednáška 7 1/27 Vytěžování znalostí z dat Pavel Kordík, Jan Motl Department of Computer Systems Faculty of Information Technology
Markovské metody pro modelování pravděpodobnosti
Markovské metody pro modelování pravděpodobnosti rizikových stavů 1 Markovský řetězec Budeme uvažovat náhodný proces s diskrétním časem (náhodnou posloupnost) X(t), t T {0, 1, 2,... } s konečnou množinou
Teorie rozhodování (decision theory)
Umělá inteligence II Roman Barták, KTIML roman.bartak@mff.cuni.cz http://ktiml.mff.cuni.cz/~bartak Teorie pravděpodobnosti (probability theory) popisuje v co má agent věřit na základě pozorování. Teorie
Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.
Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost
Pravděpodobnost a její vlastnosti
Pravděpodobnost a její vlastnosti 1 Pravděpodobnost a její vlastnosti Náhodné jevy Náhodný jev je výsledek pokusu (tj. realizace určitého systému podmínek) a jeho charakteristickým rysem je, že může, ale
PRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady
PRAVDĚPODOBNOST A STATISTIKA Bayesovské odhady Bayesovské odhady - úvod Klasický bayesovský přístup: Klasický přístup je založen na opakování pokusech sledujeme rekvenci nastoupení zvolených jevů Bayesovský
Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.
Problematika analýzy rozptylu Ing. Michael Rost, Ph.D. Úvod do problému Již umíte testovat shodu dvou středních hodnot prostřednictvím t-testů. Otázka: Jaké předpoklady musí být splněny, abyste mohli použít
Základy matematické analýzy
Základy matematické analýzy Spojitost funkce Ing. Tomáš Kalvoda, Ph.D. 1, Ing. Daniel Vašata 2 1 tomas.kalvoda@fit.cvut.cz 2 daniel.vasata@fit.cvut.cz Katedra aplikované matematiky Fakulta informačních
7. Rozdělení pravděpodobnosti ve statistice
7. Rozdělení pravděpodobnosti ve statistice Statistika nuda je, má však cenné údaje, neklesejte na mysli, ona nám to vyčíslí Jednou z úloh statistiky je odhad (výpočet) hodnot statistického znaku x i,
Matematické přístupy k pojištění automobilů. Silvie Kafková. 3. 6. září 2013, Podlesí
Matematické přístupy k pojištění automobilů Silvie Kafková 3. 6. září 2013, Podlesí Obsah 1 Motivace 2 Tvorba tarifních skupin a priori 3 Motivace Obsah 1 Motivace 2 Tvorba tarifních skupin a priori 3
STANOVENÍ SPOLEHLIVOSTI GEOTECHNICKÝCH KONSTRUKCÍ. J. Pruška, T. Parák
STANOVENÍ SPOLEHLIVOSTI GEOTECHNICKÝCH KONSTRUKCÍ J. Pruška, T. Parák OBSAH: 1. Co je to spolehlivost, pravděpodobnost poruchy, riziko. 2. Deterministický a pravděpodobnostní přístup k řešení problémů.
oddělení Inteligentní Datové Analýzy (IDA)
Vytěžování dat Filip Železný Katedra počítačů oddělení Inteligentní Datové Analýzy (IDA) 22. září 2014 Filip Železný (ČVUT) Vytěžování dat 22. září 2014 1 / 25 Odhad rozdělení Úloha: Vstup: data D = {
Klasifikace a rozpoznávání. Lineární klasifikátory
Klasifikace a rozpoznávání Lineární klasifikátory Opakování - Skalární součin x = x1 x 2 w = w T x = w 1 w 2 x 1 x 2 w1 w 2 = w 1 x 1 + w 2 x 2 x. w w T x w Lineární klasifikátor y(x) = w T x + w 0 Vyber
SIGNÁLY A LINEÁRNÍ SYSTÉMY
SIGNÁLY A LINEÁRNÍ SYSTÉMY prof. Ing. Jiří Holčík, CSc. holcik@iba.muni.cz II. SIGNÁLY ZÁKLADNÍ POJMY SIGNÁL - DEFINICE SIGNÁL - DEFINICE Signál je jev fyzikální, chemické, biologické, ekonomické či jiné
LWS při heteroskedasticitě
Stochastické modelování v ekonomii a financích Petr Jonáš 7. prosince 2009 Obsah 1 2 3 4 5 47 1 Předpoklad 1: Y i = X i β 0 + e i i = 1,..., n. (X i, e i) je posloupnost nezávislých nestejně rozdělených
Rovnovážné modely v teorii portfolia
3. září 2013, Podlesí Obsah Portfolio a jeho charakteristiky Definice portfolia Výnosnost a riziko aktiv Výnosnost a riziko portfolia Klasická teorie portfolia Markowitzův model Tobinův model CAPM - model
z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin
Příklady k procvičení z Matematické statistiky Poslední úprava. listopadu 207. Konvergence posloupnosti náhodných veličin. Necht X, X 2... jsou nezávislé veličiny s rovnoměrným rozdělením na [0, ]. Definujme
Charakterizace rozdělení
Charakterizace rozdělení Momenty f(x) f(x) f(x) μ >μ 1 σ 1 σ >σ 1 g 1 g σ μ 1 μ x μ x x N K MK = x f( x) dx 1 M K = x N CK = ( x M ) f( x) dx ( xi M 1 C = 1 K 1) N i= 1 K i K N i= 1 K μ = E ( X ) = xf
Vlastnosti a modelování aditivního
Vlastnosti a modelování aditivního bílého šumu s normálním rozdělením kacmarp@fel.cvut.cz verze: 0090913 1 Bílý šum s normálním rozdělením V této kapitole se budeme zabývat reálným gaussovským šumem n(t),
Náhodné chyby přímých měření
Náhodné chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně pravděpodobná.
Oct 19th Charles University in Prague, Faculty of Mathematics and Physics. Multidimensional estimators. Základní pojmy.
Charles University in Prague, Faculty of Mathematics and Physics Oct 19th 2009 Influence Function Stejné jako pro jednorozměrný případ až na Θ R p. Influence Function IF (x; T, F) = lim h 0 T [(1 h)f +
Modely teorie grafů, min.kostra, max.tok, CPM, MPM, PERT
PEF ČZU Modely teorie grafů, min.kostra, max.tok, CPM, MPM, PERT Okruhy SZB č. 5 Zdroje: Demel, J., Operační výzkum Jablonský J., Operační výzkum Šubrt, T., Langrová, P., Projektové řízení I. a různá internetová
JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica
JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu
PRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr
Matematicko-fyzikální fakulta Univerzity Karlovy
Oceňování finančních derivátů ve spojitém čase Václav Kozmík Matematicko-fyzikální fakulta Univerzity Karlovy 4. 10. 2010 Úvod Stochastický kalkulus Wienerův proces stochastické procesy Itoovo lemma změna
Agent pracující v částečně pozorovatelném prostředí udržuje na základě senzorického modelu odhaduje, jak se svět může vyvíjet.
Umělá inteligence II Roman Barták, KTIML roman.bartak@mff.cuni.cz http://ktiml.mff.cuni.cz/~bartak Dnešní program Agent pracující v částečně pozorovatelném prostředí udržuje na základě senzorického modelu
Konvoluční model dynamických studií ledvin. seminář AS UTIA
Konvoluční model dynamických studií ledvin Ondřej Tichý seminář AS UTIA.. Obsah prezentace Scintigrafická obrazová sekvence a její analýza Konstrukce standardního modelu a jeho řešení Experiment Ovlivnění
7. Analýza rozptylu.
7. Analýza rozptylu. Uvedeme obecnou ideu, která je založena na minimalizaci chyby metodou nejmenších čtverců. Nejdříve uvedeme několik základních tvrzení. Uvažujeme náhodný vektor Y = (Y, Y,..., Y n a
5 Časové řady. Definice 16 Posloupnost náhodných veličin {X t, t T } nazveme slabě stacionární, pokud
5 Časové řady Časovou řadou rozumíme posloupnost reálných náhodných veličin X 1,..., X n, přičemž indexy t = 1,..., n interpretujeme jako časové okamžiky. Někdy však uvažujeme i nekonečné posloupnosti
Lineární regrese. Komentované řešení pomocí MS Excel
Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních
ODHADY NÁVRATOVÝCH HODNOT
ODHADY NÁVRATOVÝCH HODNOT KLIMATOLOGICKÝCH DAT Katedra aplikované matematiky Fakulta přírodovědně-humanitní a pedagogická Technická univerzita v Liberci Robust 2018 ÚVOD Velká pozornost v analýze extrémních
Pravděpodobnost a statistika
Pravděpodobnost a statistika 1 Náhodné pokusy a náhodné jevy Činnostem, jejichž výsledek není jednoznačně určen podmínkami, za kterých probíhají, a které jsou (alespoň teoreticky) neomezeně opakovatelné,
Greenova funkce pro dvoubodové okrajové úlohy pro obyčejné diferenciální rovnice
Greenova funkce pro dvoubodové okrajové úlohy pro obyčejné diferenciální rovnice Jan Tomeček Tento stručný text si klade za cíl co nejrychlejší uvedení do teorie Greenových funkcí pro obyčejné diferenciální
Stochastické diferenciální rovnice
KDM MFF UK, Praha Aplikace matematiky pro učitele 15.11.2011 Kermack-McKendrickův model Kermack-McKendrickův model s vakcinací Model pro nemoc s rychlým šířením a krátkou dobou léčby. Příkladem takovéto
SIGNÁLY A LINEÁRNÍ SYSTÉMY
SIGNÁLY A LINEÁRNÍ SYSTÉMY prof. Ing. Jiří Holčík, CSc. holcik@iba.muni.cziba.muni.cz II. SIGNÁLY ZÁKLADNÍ POJMY SIGNÁL - DEFINICE SIGNÁL - DEFINICE Signál je jev fyzikální, chemické, biologické, ekonomické
PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady
PSY117/454 Statistická analýza dat v psychologii přednáška 8 Statistické usuzování, odhady Výběr od deskripce k indukci Deskripce dat, odhad parametrů Usuzování = inference = indukce Počítá se s náhodným
Kombinatorická minimalizace
Kombinatorická minimalizace Cílem je nalézt globální minimum ve velké diskrétní množině, kde může být mnoho lokálních minim. Úloha obchodního cestujícího Cílem je najít nejkratší cestu, která spojuje všechny
Statistická teorie učení
Statistická teorie učení Petr Havel Marek Myslivec přednáška z 9. týdne 1 Úvod Představme si situaci výrobce a zákazníka, který si u výrobce objednal algoritmus rozpoznávání. Zákazník dodal experimentální
Detekce interakčních sil v proudu vozidel
Detekce interakčních sil v proudu vozidel (ANEB OBECNĚJŠÍ POHLED NA POJEM VZDÁLENOSTI V MATEMATICE) Doc. Mgr. Milan Krbálek, Ph.D. Katedra matematiky Fakulta jaderná a fyzikálně inženýrská České vysoké
VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ
VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ Michal Kořenář 1 Abstrakt Rozvoj výpočetní techniky v poslední době umožnil také rozvoj výpočetních metod, které nejsou založeny na bázi
Necht tedy máme přirozená čísla n, k pod pojmem systém lineárních rovnic rozumíme rovnice ve tvaru
2. Systémy lineárních rovnic V této kapitole se budeme zabývat soustavami lineárních rovnic s koeficienty z pole reálných případně komplexních čísel. Uvádíme podmínku pro existenci řešení systému lineárních
11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.
11 cvičení z PSI 12-16 prosince 2016 111 (Test dobré shody - geometrické rozdělení Realizací náhodné veličiny X jsme dostali následující četnosti výsledků: hodnota 0 1 2 3 4 5 6 pozorovaná četnost 29 15
Testy dobré shody pro časové řady s diskrétními veličinami
Testy dobré shody pro časové řady s diskrétními veličinami Šárka Hudecová, Marie Hušková a Simos G. Meintanis KPMS MFF UK Robust 2016 Testy dobré shody pro časové řady s diskrétními veličinami Šárka Hudecová
MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci
MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci Matematická statistika Matematická statistika se zabývá matematickým
10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.
0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti
2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení
2 Zpracování naměřených dat Důležitou součástí každé experimentální práce je statistické zpracování naměřených dat. V této krátké kapitole se budeme věnovat určení intervalů spolehlivosti získaných výsledků
správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B.
Zkouška z předmětu KMA/PST. Anotace předmětu Náhodné jevy, pravděpodobnost, podmíněná pravděpodobnost. Nezávislé náhodné jevy. Náhodná veličina, distribuční funkce. Diskrétní a absolutně spojitá náhodná
You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)
Testování statistických hypotéz Testování statistických hypotéz Princip: Ověřování určitého předpokladu zjišťujeme, zda zkoumaný výběr pochází ze základního souboru, který má určité rozdělení zjišťujeme,
cv3.tex. Vzorec pro úplnou pravděpodobnost
3 cvičení - pravděpodobnost 2102018 18cv3tex n i=1 Vzorec pro úplnou pravděpodobnost Systém náhodných jevů nazýváme úplným, jestliže pro něj platí: B i = 1 a pro i k je B i B k = 0 Jestliže je (Ω, A, P
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY Statistická hypotéza je určitá domněnka (předpoklad) o vlastnostech ZÁKLADNÍHO SOUBORU. Test statistické hypotézy je pravidlo (kritérium), které na základě
Pravděpodobnostní algoritmy
Pravděpodobnostní algoritmy 17. a 18. přednáška z kryptografie Alena Gollová 1/31 Obsah 1 Diskrétní rozdělení náhodné veličiny Algoritmus Generate and Test 2 Alena Gollová 2/31 Diskrétní rozdělení náhodné
Testování statistických hypotéz
Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné
Normální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký
12. cvičení z PST. 20. prosince 2017
1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace
Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group
Vytěžování dat Miroslav Čepek, Filip Železný Katedra kybernetiky laboratoř Inteligentní Datové Analýzy (IDA) Katedra počítačů, Computational Intelligence Group Evropský sociální fond Praha & EU: Investujeme
12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)
cvičení z PSI 0-4 prosince 06 Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) Z realizací náhodných veličin X a Y s normálním rozdělením) jsme z výběrů daného rozsahu obdrželi
Systém rizikové analýzy při sta4ckém návrhu podzemního díla. Jan Pruška
Systém rizikové analýzy při sta4ckém návrhu podzemního díla Jan Pruška Definice spolehlivos. Spolehlivost = schopnost systému (konstrukce) zachovávat požadované vlastnos4 po celou dobu životnos4 = pravděpodobnost,
Odhad parametrů N(µ, σ 2 )
Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný
2 Hlavní charakteristiky v analýze přežití
2 Hlavní charakteristiky v analýze přežití Předpokládané výstupy z výuky: 1. Student umí definovat funkci přežití, rizikovou funkci a kumulativní rizikovou funkci a zná funkční vazby mezi nimi 2. Student
Intervalová data a výpočet některých statistik
Intervalová data a výpočet některých statistik Milan Hladík 1 Michal Černý 2 1 Katedra aplikované matematiky Matematicko-fyzikální fakulta Univerzita Karlova 2 Katedra ekonometrie Fakulta informatiky a
Úvod do analýzy časových řad
Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Posloupnost náhodných veličin {Y t, t = 0, ±1, ±2... } se nazývá stochastický
Stochastické modely Informace k závěrečné zkoušce
Stochastické modely Informace k závěrečné zkoušce Jan Zouhar Katedra ekonometrie, FIS VŠE v Praze, zouharj@vse.cz 10. února 2015 Průběh zkoušky. Zkouška je ústní s přípravou na potítku. Každý si vylosuje
Interpolace, ortogonální polynomy, Gaussova kvadratura
Interpolace, ortogonální polynomy, Gaussova kvadratura Petr Tichý 20. listopadu 2013 1 Úloha Lagrangeovy interpolace Dán omezený uzavřený interval [a, b] a v něm n + 1 různých bodů x 0, x 1,..., x n. Nechť
Lekce 4 Statistická termodynamika
Lekce 4 Statistická termodynamika Osnova 1. Co je statistická termodynamika 2. Mikrostav, makrostav a Gibbsův soubor 3. Příklady Gibbsových souborů 4. Souborové střední hodnoty 5. Časové střední hodnoty
Kredibilitní pojistné v pojištění automobilů. Silvie Zlatošová září 2016, Robust
Silvie Zlatošová 11. - 16. září 2016, Robust Obsah 1 Motivace a cíl 2 Tvorba apriorních tarifních skupin 3 Teorie kredibility 4 Aplikace aposteriorních korekcí Motivace a cíl Obsah 1 Motivace a cíl 2 Tvorba
Aplikovaná numerická matematika
Aplikovaná numerická matematika 6. Metoda nejmenších čtverců doc. Ing. Róbert Lórencz, CSc. České vysoké učení technické v Praze Fakulta informačních technologií Katedra počítačových systémů Příprava studijních
4. Na obrázku je rozdělovací funkce (hustota pravděpodobnosti) náhodné veličiny X. Jakou hodnotu musí mít parametr k?
A 1. Stanovte pravděpodobnost, že náhodná veličina X nabyde hodnoty menší než 6: P( X 6). Veličina X má rozdělení se střední hodnotou 6 a směrodatnou odchylkou 5: N(6,5). a) 0 b) 1/3 c) ½ 2. Je možné,
9. T r a n s f o r m a c e n á h o d n é v e l i č i n y
9. T r a n s f o r m a c e n á h o d n é v e l i č i n y Při popisu procesů zpracováváme vstupní údaj, hodnotu x tak, že výstupní hodnota y závisí nějakým způsobem na vstupní, je její funkcí y = f(x).
Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.
Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení
Texty k přednáškám z MMAN3: 4. Funkce a zobrazení v euklidovských prostorech
Texty k přednáškám z MMAN3: 4. Funkce a zobrazení v euklidovských prostorech 1. července 2008 1 Funkce v R n Definice 1 Necht n N a D R n. Reálnou funkcí v R n (reálnou funkcí n proměnných) rozumíme zobrazení
Implementace Bayesova kasifikátoru
Implementace Bayesova kasifikátoru a diskriminačních funkcí v prostředí Matlab J. Havlík Katedra teorie obvodů Fakulta elektrotechnická České vysoké učení technické v Praze Technická 2, 166 27 Praha 6
Téma 4: Stratifikované a pokročilé simulační metody
0.007 0.006 0.005 0.004 0.003 0.002 0.001 Dlouhodobé nahodilé Std Distribution: Gumbel Min. EV I Mean Requested: 140 Obtained: 141 Std Requested: 75.5 Obtained: 73.2-100 0 100 200 300 Mean Std Téma 4:
Úvod do problematiky měření
1/18 Lord Kelvin: "Když to, o čem mluvíte, můžete změřit, a vyjádřit to pomocí čísel, něco o tom víte. Ale když to nemůžete vyjádřit číselně, je vaše znalost hubená a nedostatečná. Může to být začátek
Value at Risk. Karolína Maňáková
Value at Risk Karolína Maňáková Value at risk Historická metoda Model-Building přístup Lineární model variance a kovariance Metoda Monte Carlo Stress testing a Back testing Potenciální ztráta s danou pravděpodobností
Přednáška 6, 6. listopadu 2013
Přednáška 6, 6. listopadu 2013 Kapitola 2. Posloupnosti a řady funkcí. V dalším jsou f, f n : M R, n = 1, 2,..., reálné funkce jedné reálné proměnné definované na (neprázdné) množině M R. Co to znamená,
Lineární klasifikátory
Lineární klasifikátory Lineární klasifikátory obsah: perceptronový algoritmus základní verze varianta perceptronového algoritmu přihrádkový algoritmus podpůrné vektorové stroje Lineární klasifikátor navrhnout