Odhad hierarchické sm si

Podobné dokumenty
Odhad sm si se statickým ukazovátkem i komponentami 1

Odhad sm si s datov závislým dynamickým ukazovátkem a statickými komponentami 1

Odhad sm si se smí²enými daty

Odhad sm si s dynamickým ukazovátkem a statickými komponentami 1

Odhad sm si s rovnom rnými komponentami

Logistická regrese pomocí odhadu sm si

P íklad 1 (Náhodná veli ina)

Vektor náhodných veli in - práce s více prom nnými

1. (18 bod ) Náhodná veli ina X je po et rub p i 400 nezávislých hodech mincí. a) Pomocí ƒeby²evovy nerovnosti odhadn te pravd podobnost

T i hlavní v ty pravd podobnosti

Cvi ení 7. Docházka a testík - 15 min. Distfun 10 min. Úloha 1

na za átku se denuje náhodná veli ina

Skalární sou in. Úvod. Denice skalárního sou inu

Pravd podobnost a statistika - cvi ení. Simona Domesová místnost: RA310 (budova CPIT) web:

Integrování jako opak derivování

1 P ílohy. 1.1 Dopln ní na tverec

e²ení systém lineárních rovnic pomocí s ítací, dosazovací a srovnávací metody

Limity funkcí v nevlastních bodech. Obsah

Text m ºe být postupn upravován a dopl ován. Datum poslední úpravy najdete u odkazu na staºení souboru. Veronika Sobotíková

Regrese a nelineární regrese

2. Ur íme sudost/lichost funkce a pr se íky s osami. 6. Na záv r na rtneme graf vy²et ované funkce. 8x. x 2 +4

Vektory. Vektorové veli iny

VYBRANÉ APLIKACE RIEMANNOVA INTEGRÁLU I. OBSAH A DÉLKA. (f(x) g(x)) dx.

Binární operace. Úvod. Pomocný text

Text m ºe být postupn upravován a dopl ován. Datum poslední úpravy najdete u odkazu na staºení souboru. Veronika Sobotíková

Rovnice a nerovnice. Posloupnosti.

Základní praktikum laserové techniky

Aplikace pravd podobnostních model v kurzovém sázení

Domácí úkol 2. Obecné pokyny. Dbejte na formáln správný zápis výpo tu! Pro vy íslení výsledku pro binomické rozd lení pouºijte nap. Maple nebo Matlab.

Kuželosečky a kvadriky ve škole i kolem

Státní maturita 2010 Maturitní generálka 2010 Matematika: didaktický test - základní úrove obtíºnosti MAGZD10C0T01 e²ené p íklady

Soft Computing (SFC) 2014/2015 Demonstrace u ení sít RCE, Java aplikace

Statistika pro geografy. Rozd lení etností DEPARTMENT OF GEOGRAPHY

Reálná ísla a posloupnosti Jan Malý

1 Data. 2 Výsledky m ení velikostí. Statistika velikostí výtrus. Roman Ma ák

Odhad sm si s dynamickým ukazovátkem a stavovými komponentami

Co je to tensor... Vektorový prostor

nazvu obecnou PDR pro neznámou funkci

Teorie her. Klasikace. Pomocný text

3 D leºitá rozd lení náhodné veli iny

Dolní odhad síly pro ztrátu stability obecného prutu

7 Algebraické a nealgebraické rovnice a nerovnice v C. Numerické e²ení rovnic

Záludnosti velkých dimenzí

Karta předmětu prezenční studium

Jméno: P íjmení: Datum: 17. ledna 2018 Nechci zápo et p i hodnocení niº²ím neº (nezávazné): vadí mi vystavení mého hodnocení na internetu.

Modelování v elektrotechnice

Analýza variance (ANOVA) - jednocestná; faktor s pevným efektem; mnohonásobná srovnání

ST2 - Cvi ení 1 STATISTICKÁ INDUKCE

Jevy, nezávislost, Bayesova v ta

Unfolding - uºivatelský manuál

Stochastické Systémy. Ivan Nagy 1. Obsah

1 Spo jité náhodné veli iny

Obsah. Pouºité zna ení 1

se nazývá charakter grupy G. Dále budeme uvaºovat pouze kone né grupy G. Charaktery tvo í také grupu, s násobením denovaným

P íklady k prvnímu testu - Pravd podobnost

Pr b h funkce I. Obsah. Maxima a minima funkce

1 Odhad spojitého modelu

ízení Tvorba kritéria 2. prosince 2014

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

11 Soustavy rovnic a nerovnic, Determinanty a Matice

energie v esk é republic e

Po etní geometrie. Výpo et délky p epony: c 2 = a 2 + b 2 Výpo et délky odv sny: a 2 = c 2 b 2, b 2 = c 2 a 2

Průzkum dopravy v ulicích Pod Vinohrady a Havlíčkova

Ekonomické předstihové ukazatele: nástroj krátkodobé predikce

Odhady Parametrů Lineární Regrese

1 Spojitý model. 1.1 Princip stochastického modelu

Post ehy a materiály k výuce celku Funkce

Aplikovaná matematika 1

Příprava na 1. čtvrtletní písemku pro třídu 1EB

1 Pravd podobnost - plán p edná²ek. 2 Pravd podobnost - plán cvi ení

Department of Mathematical Analysis and Applications of Mathematics Faculty of Science, Palacký University Olomouc Czech Republic

2C Tisk-ePROJEKTY

Kapitola 1. Teorie portfolia. 1.1 Výnos a riziko akcie

Derivování sloºené funkce

Apriorní rozdělení. Jan Kracík.

Diamantová suma - řešení příkladů 1.kola

Státnice - Rekurzivní a rekurzivn spo etné mnoºiny

ST2 - Cvi ení 1 STATISTICKÁ INDUKCE

MATEMATICKÁ STATISTIKA - XP01MST

Matematický KLOKAN kategorie Benjamín

Testy pro více veli in

brmiversity: Um lá inteligence a teoretická informatika

ÚKOL ,77 5,00 5 2,531,003,056 -,869,113

Model. 1 Spojitý model. 1.1 Princip stochastického modelu

V tabulce jsou uvedeny roční náklady na údržbu (v dolarech) a cena domu (v tis. dolarů).

1 BUBNOVÁ BRZDA. Bubnové brzdy používané u vozidel jsou třecí s vnitřními brzdovými čelistmi.

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie

Frikce pracovního trhu

e²ení 1. série Úvodní gulá² autor: Kolektiv org

STUDIE. SEVERNÍHO OBCHVATU MĚSTA PŘELOUČ silnice č. I/2 PROJEKTANT VYPRACOVAL KRESLIL KONTROLOVAL DOC. DOLEŽEL ING.LOPOUR ING.LOPOUR DOC.

Vzorové e²ení 4. série

odvodit vzorec pro integraci per partes integrovat sou in dvou funkcí pouºitím metody per partes Obsah 2. Odvození vzorce pro integraci per partes

Obsah. Zpracoval Ctirad Novotný pro matmodel.cz.

Ergodické Markovské et zce

Graf 21: Rozvody v ČR a podíl rozvodů cizinců v letech (Pramen: ČSÚ) , ,0

ST1 - Úkol 1. [Minimáln 74 K /láhev]

RNÉ MATERIÁLY. PSYCHODIAGNOSTIKA - VYHODNOCENÍ z , 13:19 hodin

e²ení 4. série Binární operace

Termíny zkoušek Komise Komise. subkomise 1 (obhaj.) :30 B subkomise 2 (obhaj.) :30 B8 120

A. PODÍL JEDNOTLIVÝCH DRUHŮ DOPRAVY NA DĚLBĚ PŘEPRAVNÍ PRÁCE A VLIV DÉLKY VYKONANÉ CESTY NA POUŽITÍ DOPRAVNÍHO PROSTŘEDKU

Transkript:

Odhad hierarchické sm si Hierarchická sm s je p esn to, co se pod pojmem hierarchická myslí. Naho e je sm s s n kolika komponentami. Kaºdá komponenta je op t sm sí a m ºe ukazovat na dal²í sm si jako své komponenty. Hlavní význam takového modelu je z ejm v tom, ºe celý problém (klastrování a klasikace) je na nejvy²²í úrovni zhruba rozd len do n kolika ástí (komponenty vrchní sm si). Kaºdá z t chto ástí je potom dále podrobn ji zkoumána (d lena) podle dal²ích podrobností v komponentách p íslu²né sub-komponenty z vy²²í ásti. Pro lep²í p edstavu uvedeme konkrétní p íklad. P íklad Sledujeme jízdu osobního automobilu a rádi bychom detekovali, zda jde o jízdu ekonomickou (opatrnou) nebo sportovní (divokou). To, jak se jízda projevuje se nejlépe pozná z m eného p í ného a podélného zrychlení. Ekonomická jízda má tato zrychlení v t²inou nulové, jen vyjíme n se objevují malé odchylky. Divoká jízda naopak má tato zrychlení v t²inou nenulová, ob as mohou klesnout sm rem k nule ale ob as také mohou vylet t do v t²ích hodnot. Ale to, jak se zm ny v akceleraci projeví bude z ejm záviset na tom, kde se automobil zrovna pohybuje. Vytipujeme si 3 druhy prost edí: ve m st, mimo m sto a na dálnici. Vrchní komponenta modelu se bude týkat prost edí. Bude mít 3 komponenty (podle typ prost edí) a jako data zvolíme rychlost (do 50 km/h m sto, mezi 50 a 100 km/k mimo m sto a nad 100 km/h dálnice - tyto hodnoty vyuºijeme pro apriorní nastavení horní sm si). Kaºdá z práv jmenovaných komponent bude zase sm sí s dv ma komponentami. Jedna pro ekonomickou jízdu (malá zrychlení) a druhá pro divokou jízdu (v t²í zrychlení). Model Obecná formulace hierarchického modelu sm si plyne z uvedeného p íkladu. Pro jednoduchost se ale budeme i nadále p íkladu drºet. Nejprve zavedeme zna ení: Horní sm s y t jsou jsou data pro horní sm s (rychlost) c t je ukazovátko pro horní sm s Θ jsou parametry horních komponent (závisí na c t ) α je parametr horního ukazovátka Dolní sm si d t jsou data pro dolní sm si (p í né a podélné zrychlení) k t je ukazovátko pro dolní sm si (k t bude závislé na c t ) ϑ jsou parametry dolních komponent (závisí na c t i k t ) β jsou parametry dolních ukazovátek Model pak bude f (y t, d t c t, k t, Θ, ϑ, α, β) = f (y t c t, Θ, α) f (d t k t, c t, ϑ, β) kde první ást na pravé stran je model horní sm si a druhá ást jsou modely dolních sm sí. 1

Odhad parametr modelu Pro odvození odhadu vyjdeme op t ze sdruºené pravd podobnosti J (kde D t 1 = [y (t 1), d (t 1)] je mnoºina v²ech starých dat) Ozna íme: J = f (y t, d t, c t, k t, Θ, ϑ, α, β D t 1 ) = = f (y t c t, Θ) f (Θ y (t 1)) f (c t α) f (c t 1 y (t 1)) f (α y (t 1)) }{{}}{{} horní komponenty horní pointer model f (d t c t, k t, ϑ) f (ϑ d (t 1)) f (k t c t, β) f (β d (t 1)). }{{}}{{} dolní komponenty dolní pointer model predikce z horních komponent ˆ p ct = f (y t c t, Θ) f (Θ y (t 1)) dθ =. f (y t c t, ˆΘ ) t 1 Θ predikce z dolních komponent ˆ q kt c t = f (d t k t, c t, ϑ) f (ϑ d (t 1)) dϑ =. f (d t k t, c t, ˆϑ ) t 1 ϑ predikce horního pointru ˆ ˆα ct c t 1 = f (c t c t 1, α) f (α y (t 1)) dα α predikce dolního pointru staré váhy ˆ ˆβ kt c t = f (k t c t, β) f (β d (t 1)) dβ β f ct 1 = f (c t 1 y (t 1)) Sdruºenou predikci v²ech ukazovátek m ºeme psát P = f (c t, c t 1, k t y (t), d (t)) p ct ˆα ct c t 1 f ct 1 q kt c t ˆβkt c t kde prvá ást (do ) pat í horní sm si a druhá ást dolním sm sím. Sdruºená pravd podobnost c t a c t 1 je W t = f (c t, c t 1 y (t)) = P, k t pravd podobnost c t je marginála W t a pravd podobnost k t je wu;t = c t 1 W t w l;t = P. c t c t 1 Tím je ur en výpo et pot ebných vah. 2

P epo et statistik P epo et statistik pro ukazovátka je standardní p epo et pro diskrétní model s p íslu²nými vahami komponent. P epo et statistik pro komponenty závisí na modelu, který se pro n pouºije. Zde se op eme o jiº zmín ný p íklad o sledování jízdy osobního automobilu. Horní komponenty pracují s veli inou rychlost a o ekáváme centra komponent v hodnotách 40 (m sto), 80 (mino m sto) a 110 (dálnice). I kdyº se jedná o nezápornou veli inu, m ºeme pro ní uvaºovat normální model (data budou p ibliºn symetrická podle zmín ných center). Dolní komponenty modelují zrychlení. Protoºe o ekáváme, ºe rozjezd bude p ibliºn stejn jako brzd ní a zatá ek doleva tolik, kolik zatá ek doprava, ekáme, ºe data budou symetrická kolem po átku - p i emº maximální po et hodnot pro ekonomickou jízdu bude v nule, pro sportovní jízdu kolem nuly. Klastry tedy budou v nule (ekonomická jízda) a jakýsi prstenec kolem nuly (sportovní jízda). Takové klastry ale nejsou vhodné pro detekci pomocí hustot pravd podobností. Proto tyto data p evedeme na absolutní hodnoty a dále s nimi budeme po ítat v této form. Máme tedy nezáporná data: v jedné komponent nahromad ná p edev²ím na nule, v druhé kousek od nuly. Modely t chto komponent hledáme tedy mezi nezápornými rozd leními - viz úloha ODHAD SM SI PRO NEZÁPORNÁ DATA. Program // Estimation of hierarchical mixture // - upper - SPEED (with three normal components) // - lower - SPEED DIFFERENCE and CROSS ACCELERATION // (economical and sport-like driving is to be detected) // absolute values of data -> first quadrant // two lower components: 1. HNm, 2. Exp // ---------------------------------------------------------- exec ScIntro.sce, mode(0) nd=1500; ni=50; // number of data for estimation // virtual length of initialization load dataokruhy.dat; // real data from a car dat=dataokruhy.dataorig(:,3001:10:$); dat=dat(:,3601:7240); // data v=dat(2,1:nd); d=abs([diff(v) 0]); a=20*abs(dat(9,1:nd)); // upper data - velocity // abs. values of velocity variations // abs. values of cross-acceleration // variables yt=v; dt=[d;a]+1e-8; // data -> varibles (speed) // data -> varibles (accelerations) // INITIAL PARAMETERS ============================================ 3

thc0=[50 70 100]; // speeds in: town, out-town, motorway thp0=[.2.5.3]; // probabilities of going in -"- nc0=length(thc0); // number of upper components nv=2; nc=[2 2 2]; // number of lower variables // number of lower components w0=fnorm(ones(1,nc0)); w=list(); for i=1:nc0 w(i)=3+rand(1,nc(i)); w(i)=w(i)/sum(w(i)); // initial upper weights // initial lower weights thcr=list(); thce=list(); // parameters of lower components // - the data are: - d1 long. acceleration (mean value is 2.6 // - d2 cross accel. (mean after normaliz. is 3.8 // d1 d2 thce(1)= [1.2]'; // Exp (1st comp. of 1st mixture) thcr(1)=%pi/2*[8 4]'; // HNm (2nd komp. of 1st mixture) thce(2)= [1.2]'; // 2nd mixture thcr(2)=%pi/2*[8 4]'; // expectation -> statistics thce(3)= [1.2]'; // 3rd mixture thcr(3)=%pi/2*[8 4]'; // INITIALIZATION ================================================ // UPPER mixture for j=1:nc0 Ps=[thC0(:,j);1]; // Regression vector Cyp.V=Ps*Ps'; Est0.Cy(j)=Cyp; // information matrix Est0.Cy(j).th=thC0(:,j); // parameters Est0.Cy(j).sd=.1; // std of noise Est0.ka=1*rand(1,nc0,'u'); // counter Est0.Cp.V=rand(nc0,nc0,'u')+1;// statistics for pointer estimation Est0.Cp.th=fnorm(Est0.Cp.V,2);// parameters of pointer model Est0.ct=1; // initial value of the pointer Est0.nc=nc0; // number of upper components Est0.w=w0; // initial weight Est0.W=zeros(nc0,nc0); Est0.tht=zeros(nc0,nd); Est0.wt=zeros(nc0,nd); // LOWER mixture for i=1:nc0 4

Esti.i=i; Esti.ka=ni*ones(1,2); // first component Esti.Cy(1).V=ni*thCe(i); Esti.Cy(1).th=thCe(i); // second component Esti.Cy(2).V=ni*thCr(i); Esti.Cy(2).th=.8*thCr(i); // label of lower component // counter // statistics // initial parameters // statistics // initial parameters Esti.Cp.V=rand(1,nc(i),'u')+1; // pointer statistics Esti.Cp.th=fnorm(Esti.Cp.V); // pointer parameters Esti.nc=nc(i); Esti.w=w(i); Esti.ct=zeros(1,nd); // number of lower components // initial weights Est(i)=Esti; // lower component construction //pause // ESTIMATION loop =============================================== tic(); kk=ceil(nd/10); printf('\n 2 4 6 8 \n ') for t=1:nd if t/kk==fix(t/kk), printf('.'); [Est0,Est]=MEst78(yt(:,t),dt(:,t),Est0,Est); [xxx,est0.ct(1,t)]=max(est0.w); Est0.wt(:,t)=Est0.w'; Est0.tht(:,t)=[Est0.Cy(1).th,Est0.Cy(2).th,Est0.Cy(3).th]'; for i=1:nc0 Est(i).tht(:,t)=[Est(i).Cy(1).th(:);Est(i).Cy(2).th(:)]; [xxx,est(i).ct(t)]=max(est(i).w); Est(i).wt(:,t)=Est(i).w'; // of estimation loop ======================================== disp ' ', time=toc()/60; printf(' time = %5.2f min.\n',time) // RESULTS d=list(); for i=1:3 m=find(est0.ct==i); d(i)=dt(:,m); for j=1:2 k=find(est(i).ct(m)==j); Ct.t=d(i)(:,k); E(i).C(j)=Ct; // data in components 5

// data clusters colored with respect to components tx=['in town';'outside town';'motorway']; set(scf(112),'position',[400 150 1000 350]); for i=1:3 subplot(1,3,i) plot(e(i).c(1).t(1,:),e(i).c(1).t(2,:),'b.','markersize',3) plot(e(i).c(2).t(1,:),e(i).c(2).t(2,:),'r.','markersize',3) title(tx(i)) set(gca(),'data_bounds',[0 30 0 20]); leg('economic driving','sport driving'); Procedura function [Eh,Ed]=MEst78(y,d,Eh,Ed) // estimation of both upper and lower mixture // upper: 3 norm. components // lower: 2 comp. - first half-normal // - second exponential nc=eh.nc; al=eh.cp.th; Wh=Eh.w; ny=length(d); wd=list(); v=list(); // PROXIMITIES AND WEIGHTS for i=1:nc // PROXIMITY UPPER [xxx,gh(i)]=gaussn(y,eh.cy(i).th,eh.cy(i).sd); // Gauss // PROXIMITY LOWER [xxx,gd(1)]=hnormn(d,ed(i).cy(1).th) // (th is "s"; E=.8*s) [xxx,gd(2)]=expn(d,ed(i).cy(2).th); // (th is expectation) Ld=Gd-max(Gd); q(i,:)=fnorm(exp(ld))'; // proximity lower wd(i)=ed(i).w; be(i,:)=ed(i).cp.th; Lh=Gh-max(Gh); p=fnorm(exp(lh))'; // proximity upper W=fnorm((Wh'*p).*al); Wh=sum(W,1); [xxx,ch]=max(wh); // joint pf of c_t and c_t-1 // uppwer weight 6

Eh.w=Wh; Wd=fnorm((Wh'*ones(1,2)).*(q.*be)); // lower weight for i=1:eh.nc Ed(i).w=Wd(i,:); // ---------------------------------------- of proximity // UPDATE OF COMPONENTS AND COMPUTATION OF POINT ESTIMATES // UPPER mixture Ps=[y';1]; // Regression vekcor for i=1:eh.nc Eh.Cy(i).V=Eh.Cy(i).V+Wh(i)*Ps*Ps'; // information matrix Eh.ka(i)=Eh.ka(i)+Wh(i); // counter // point estimates of upper parameters // for scalar y!!! Vy=Eh.Cy(i).V(1,1); // Vyp - y.y Vyp=Eh.Cy(i).V($,1); // Vyp - psi.y Vp=Eh.Cy(i).V($,$); // Vp - psi.psi' Eh.Cy(i).th=inv(Vp+1e-8*eye(Vp))*Vyp; // estimate of reg. coef. Eh.Cy(i).tht(:,t)=Eh.Cy(i).th'; if 0 // estimate of covariance Eh.Cy(i).cv=(Vy-Vyp'*inv(Vp+1e-8*eye(Vp))*Vyp)/Eh.ka(i); Eh.Cp.V=Eh.Cp.V+W; // pointer statistics Eh.Cp.th=fnorm(Eh.Cp.V,2); // estimate of pt. parameters // LOWER mixture // update of statistics for hnm for i=1:eh.nc Ed(i).Cy(1).V=Ed(i).Cy(1).V+wd(i)(1)*d^2; // stat. = sum of squares Ed(i).ka(1)=Ed(i).ka(1)+wd(i)(1); // counter // point estimates of parameters for hnm Ed(i).Cy(1).th=sqrt(Ed(i).Cy(1).V/Ed(i).ka(1)); // update of statistics for exp Ed(i).Cy(2).V=Ed(i).Cy(2).V+wd(i)(2)*d; Ed(i).ka(2)=Ed(i).ka(2)+wd(i)(2); // point estimates of parameters for exp Ed(i).Cy(2).th=Ed(i).Cy(2).V/Ed(i).ka(2); // stat. = sum // counter Ed(i).Cp.V=Ed(i).Cp.V+wd(i); Ed(i).Cp.th=fnorm(Ed(i).Cp.V,2); function // pointer statistics // pointer parameters 7

Popis programu Program je dosti sloºitý. Proto je realizován pomocí procedury MEst78.sci, která obsahuje algoritmus vlastního odhadu komponent jednotlivých sm sí. Hlavní program obstarává nataºení a úpravu dat (absolutní hodnoty akcelerací), inicializaci odhadu pro horní a dolní sm si, prezentaci výsledk. V asové smy ce (ESTIMATION lopp) se volá funkce MEst78(yt(:,t),dt(:,t),Est0,Est), která obstarává on-line b h odhadovacího algoritmu. Je tvo ena t emi ástmi 1. Výpo et vah w pro jednotlivé komponenty, kde hlavním prvkem jsou tzv. proximity - tj. hodnoty hustoty pravd podobnosti p íslu²né komponenty s dosazenými existujícími bodovými odhady parametr a aktuáln zm enými daty, tj. f c ( y t ˆΘ c;t 1 ), kde c = 1, 2,, nc (pro v²echny komponenty). 2. P epo et statistik, kde data se p idávají s p íslu²nou váhou. 3. Výpo et bodových odhad. Kaºdý z t chto krok se provádí nejd íve pro horní sm s a pak pro jednotlivé dolní sm si. Proximity jsou po ítány pomocí funkcí GaussN, HNormN a ExpN, a pomocí nich jsou dále po ítány váhy W h a W d. V dal²í ásti jsou p epo ítávány statistiky a po ítány bodové odhady parametr pro jednotlivé sm si: horní s normálním rozd lením a dolní s polovi ním normálním a exponenciálním rozd lením. 8