ROBUST 000, 10 108 c JČMF 001 ODHAD BODU VZNIKU KVADRATICKÉHO TRENDU DANIELA JARUŠKOVÁ Abstrakt The problem of least squares method estimatioof the parameter τ ithe regressiomodel Y i = β i/ ) + + γ i/ ) + + e i is cosidered Supposig γ 0adτ 0, 1) it is showthat the distributio of ˆτ ) is largely affected by the value of β Ithecaseβ 0thevariable ˆτ ) is asymptotically ormally distributed whereas i the case β =0 the variable ˆτ ) has the same distributioas max 0,Z)whereZ has a zero mea ormal distributio The problem of least squares method estimatioof the parameter τ ithe regressiomodel Y i = β i/ ) + + γ i/ ) + + e i is cosidered Supposig γ 0adτ 0, 1) it is showthat the distributio of ˆτ ) is largely affected by the value of β Ithecaseβ 0thevariable ˆτ ) is asymptotically ormally distributed whereas i the case β =0 the variable ˆτ ) has the same distributioas max 0,Z)whereZ has a zero mea ormal distributio Rezme: Uvaaets problema oceivai parametra τ v modeli lieioi regresii Y i = β i/ ) + + γ i/ ) + + e i pri ispo zovaii metoda aimexih kvadratov Pokazyvaets, qto predpologa γ 0i τ 0, 1), zaqeie parametra β imeet bo xoe vliie a raspredeleie ˆτ ) V sluxae kogda β 0, potom ˆτ ) imeet asimptotiqeski orma oe raspredeleie Naoborot, kogda β =0,potom ˆτ τ ) obladaet teme paspredeleiem kak 0,Z), kde Z sleduet orma oe raspredeleie s ulovym sredim 1 Úvod V praxi občas arazíme a problém, kde se lieárí závislost v ezámém časovém okamžiku změí v závislost kvadratickou Sledujeme-li apříklad u jistých typů sliti závislost apětí Y a zatížeí X, ukazuje se, že při malém zatížeí je zvyšováí apětí lieárí elastická oblast), zatímco po překročeí určitého kritického zatížeí se měí kvadraticky quasielastická oblast), tj Y = fx), kde fx) =p + qx+ β x ) + + γ x ) +, při ozačeí a + =max0,a) V ašem čláku si poěkud zjedodušíme situaci tím, že budeme předpokládat, že parametry p a q jsou zámé, a tedy je bez újmy a obecosti můžeme položit rovy ule Dále budeme předpokládat, že veličia X je měřea v equidistatích vzdáleostech,,,, a tudíž ji lze trasformovat a veličiu abývající 000 Mathematics Subject Classificatio Primary 6F1 Klíčová slova Detekce bodu změy chage-poit problem), elieárí regrese, odhady Práce byla částečě podporováa graty GAČR 01/00/0769 a MSM 10000001
Odhad bodu vziku kvadratického tredu 10 hodot 1/, /,,1, to jest veličiu, která abývá hodot pouze v itervalu [0, 1] Jestliže předpokládáme aditiví vliv áhodých chyb {e i } a aměřeé hodoty ezávisle proměé Y, dospíváme k regresímu modelu 1) Y i = β i/ ) + + γ i/ ) + + e i, kde β, γ a τ jsou ezámé parametry Pro jedoduchost předpokládejme, že áhodé chyby {e i } jsou ezávislé stejě rozděleé s rozděleím N0,σ ), kde σ je zámé, a tudíž opět bez újmy a obecosti můžeme položit σ =1 Úlohou, kterou se budeme zabývat, je odhad ezámých parametrů β, γ a τ Především ás bude zajímat odhad parametru τ,kterýseazývábodzměy Budeme předpokládat, že τ 0, 1) Parametr β odpovídá prví derivaci zprava aγ druhé derivaci zprava regresí fukce v bodě τ Vzhledem k ormalitě chyb {e i } lze maximálě věrohodé odhady získat metodou ejmeších čtverců Bodový odhad parametrů Model 1) je speciálím modelem elieárí regrese, kterému se ěkdy říká semilieárí model, viz Kowles et all 1991) Kdybychom totiž zali hodotu τ parametru τ,tjτ = τ, pak by model 1) byl modelem lieárí regrese s dvěma vysvětlujícími proměými, tj lieárí model s maticí pláu experimetu X τ) = [τ ]+1 [τ ]+ 0 0 0 0 [τ ]+1 [τ ]+1 1 1 ) ) ) Ozačme β τ, γ τ ) T = X T τ)x τ) ) 1 X T τ)y, kde Y =Y 1,,Y ) T,a S τ,β,γ) = i=1 Y i β i/ ) + + γ i/ ) +)) Pak S τ, β, γ) = mi S τ,β,γ) = mi S τ, β τ, γ τ ) β,γ,τ 0,1) τ 0,1) Nejčastějším umerickým postupem pro alezeí přibližých hodot odhadů τ, β, γ spočívá v tom, že pro hodoty τ zdostihustémřížebodůt v itervalu 0,1) počítáme residuálí součet čtverců S τ, β τ, γ τ ) a pak hledáme mi τ T S τ, β τ, γ τ ) Statistik se však obvykle espokojí s bodovým odhadem ezámých parametrů, ale zajímá se též o itervaly spolehlivosti, respektive oblasti spolehlivosti
104 Daiela Jarušková Oblasti spolehlivosti v elieárí regresi Uvažujme obecý model elieárí regrese s k -rozměrým vektorem parametrů θ =θ 1,,θ k )T Y i = f i θ )+e i, i =1,,, kde {f i )} jsou zámé fukce a {e i } jsou ezávislé stejě rozděleé áhodé veličiy s rozděleím N0, 1) Ozačme S θ) = Y i f i θ) ) a θ odhad θ metodou ejmeších čtverců, tj S θ) =mi θ1,,θ k Yi f i θ 1,θ,,θ k ) ) Dále ozačme θ θ 1 ),, θ k θ 1 ) ) odhad metodou ejmeších čtverců při pevé hodotě prvího parametru rovajícího se θ 1,tjS θ 1, θ θ 1 ),, θ k θ 1 ) ) =mi θ,,θ k Yi f i θ 1,θ,,θ k ) ) Užívaé kofidečí oblasti pro celý vektor parametrů θ jsou obvykle dvou typů: 1a) {θ, θ θ) T A θ θ) <C 1 },kdea je ějaká symetrická matice, a) {θ,s θ) <S θ)+c } Prví oblast je eliptická, zatímco druhá může mít aprosto obecý tvar a může být dokoce esouvislá Druhé oblasti se ěkdy říká exaktí, eboť je odvozea přímo z poměru věrohodosti Aalogické kofidečí oblasti pro jede parametr, řekěme θ 1,majítvar: 1b) {θ 1, θ 1 θ 1 <K 1 }, b) {θ 1,S θ1, θ θ 1 ),, θ k θ 1 ) ) <S θ)+k } Kostaty C 1, C,respK 1, K, jsou obvykle odvozey z asymptotického rozděleí θ θ a S θ) S θ ), resp θ 1 θ1 a S θ) S θ1, θ θ1),, θ k θ1) ) Je-li splěa celá řada podmíek, viz apříklad podmíky A1),, A9) ebo B1),, B8) v kize Seber & Wild 1989), kapitola 1, pak θ θ )má asymptoticky ormálí rozděleí Většiou mezi tyto podmíky patří existece spojitých prvích i druhých parciálích derivací fiθ) θ r a f iθ) θ r θ s, i =1,,, r, s = 1,,k, a ějakém okolí správé hodoty θ Navíc se předpokládá, že matice 1 F θ) ) T F θ) ),kde f 1 θ 1 F θ) = f θ 1 koverguje stejoměrě a ějakém okolí θ k esigulárí matici Gθ) Matice G 1 θ ) je pak limití variačí maticí vektoru θ θ ) f 1 θ k f θ k, 4 Oblasti spolehlivosti v modelu 1) Je patré, že v modelu 1) emá regresí fukce vzhledem k parametru τ již ai prví derivaci Přesto se však dá ukázat, že v případě, že β 0, γ 0 a τ 0, 1), má τ, β β, γ γ ) asymptoticky ormálí rozděleí se symetrickou variačí maticí G 1,kde
Odhad bodu vziku kvadratického tredu 105 β 1 )+4β γ 1 ) G = β 1 ) β 1 ) +4γ 1 ) γ 1 ) γ 1 ) 4 4 1 ) 1 ) 4 1 ) 5 4 5 1 Zřejmě G = lim F T F,kde 0 0 0 F = 0 0 0 ) ) β γ [τ ]+1 [τ ]+1 [τ ]+1 β γ 1 ) 1 1 ) K důkazu lze použít stejý postup, který použila Hušková 1998) pro jedodušší model typu ) Y i = β i/ ) + + e i, a který spočívá v tom, že a okolí správé hodoty aproximujeme fukci ejmeších čtverců kvadratickou fukcí Speciálě ukázala, že a okolí bodu τ lze aproximovat S τ, β τ ) S τ, β τ ) fukcí Cτ ) +X τ ), kde X/C má ormálí rozděleí N0, 1/C) Jiý postup použil Feder 1975), který modely 1) i ) považuje za speciálí případy regresí fukce fx, θ) =f 1 x, θ 1 ) pro 0 x τ = f x, θ ) pro τ x 1, kde f i x, θ) = Ki) j=1 θ ijf ij x) Za přípustou možiu parametrů Θ pak uvažuje je takové parametry, při kterých se fukce f 1 x, θ 1 )af x, θ ) protíají uvitř itervalu 0,1) Ukazuje, že limití rozděleí θ θ závisí a tom, zda θ je vitřím ebo krajím bodem možiy Θ Parametr τ pak odhaduje jako průsečík fukcí f 1 x, θ 1 )af x, θ ) Řád kovergece τ k τ závisí a tom, v kolika derivacích se shodují fukce f 1 x, θ )af x, θ )vboděτ V případě modelu 1) s β 0,γ 0aτ 0, 1) lze z přístupů Huškové 1998) i Federa 1975) odvodit asymptotickou ormalitu τ, β β, γ γ ) Speciálě platí ) ) τ 9 ) N 0, β 1 ) a S τ, β τ, γ τ ) S τ, β, γ) má asymptoticky χ rozděleí o 1 stupi volosti Všiměme si, že asymptotický rozptyl odhadu τ, viz ), záleží a poloze τ, což je jakási globálí vlastost regresí fukce Je přirozeé, že parametr τ lépe
106 Daiela Jarušková odhademe, máme-li možost pozorovat kvadratický tred delší dobu Dále však je asymptotický rozptyl τ, a tedy i délka itervalu spolehlivosti typu a), ovlivěa prví derivací kvadratické fukce v bodě τ, což je lokálí vlastost regresí fukce Je-li β malé, můžeme použijeme-li postup 1 b)) dostat pro koečá dokoce iterval spolehlivosti, jehož krají body leží mimo iterval 0, 1) V teorii elieárí regrese se teto jev azývá špatá podmíěost Špatá podmíěost je způsobea tvarem regresí fukce Horí část obrázku 1 představuje regresí fukci 4) fx, τ,β,γ )=β x ) + + γ x ) + pro τ =05, β =10aγ = 4 a dolí část obrázku zobrazuje odpovídající fukci ejmeších čtverců B τ,τ )pro = 500 a τ 0, 06) za předpokladu, že model eobsahuje žádé chyby, tj B τ,τ )= 1 i ) i f,τ, β τ, γ τ f,τ, β ) ) τ, γ τ 1 i=1 10 8 6 4 0 0 01 0 0 04 05 06 07 08 09 1 60 50 40 0 0 10 0 10 0 05 0 05 04 045 05 055 06 065 Obrázek 1 Jestliže uvažujeme model 1) s regresí fukcí 4) včetě áhodých chyb, pak může fukce ejmeších čtverců a 95% oblast spolehlivosti typu b) vypadat apříklad jako a obrázku
Odhad bodu vziku kvadratického tredu 107 14 1 10 8 6 4 0 4 0 01 0 0 04 05 06 07 08 09 1 560 550 540 50 50 510 500 0 05 0 05 04 045 05 055 06 065 Obrázek Ačkoliv k tomu emáme žádý teoretický důvod doporučujeme ze zkušeostí používat spíše oblast spolehlivosti typu b), kde K je příslušý kvatil χ -rozděleí o 1 stupi volosti V každém případě doporučujeme vždy při statistické aalýze vykreslit průběh fukce S τ, β τ, γ τ ) V krajím případě, kde β =0,γ 0aτ 0, 1), lze ukázat, že v okolí bodu τ lze rozdíl fukcí čtverců S τ, β τ, γ τ ) S τ, β τ, γ τ ) aproximovat fukcí Cτ ) 4 +X τ ), kde X/C N0, 1/C) ac = γ 1 )/9 Je zřejmé, že fukce Cx x X/C) abývá maxima v ule, pokud X je záporé, a hodoty X/C, pokudx je kladé Odtud vyplývá, že τ ) má asymptoticky stejé rozděleí jako max 0,Z), kde veličia Z má ormálí rozděleí 5) Z N 9 ) 0, γ 1 )
108 Daiela Jarušková Výsledek 5) lze použít pro kostrukci symetrického itervalu spolehlivosti a) Můžeme též zkostruovat oblast typu b) s využitím toho, že S τ, β τ, γ τ ) S τ, β, γ) má asymptoticky stejé rozděleí jako max0,y)),kdey má stadardí ormálí rozděleí Pro zajímavost uveďme, že pokud odhadujeme parametr τ vmodelu Y i = γ i/ ) + + e i, i =1,,, pak τ ) má asymptoticky ormálí rozděleí N 0, 1/ γ 1 ) )) Odtud je zřejmé, že iformace, zda-li je prví derivace v bodě změy ulová, je při odhadováí tohoto bodu velmi velmi důležitá Literatura Feder P J 1975) O asymptotic distributio theory i segmeted regressio problems - idetified case The Aals of Statistics, 49 6 Hušková M 1998) Estimators i the locatio model with gradual chages Commet Math Uiv Caroliae 9, 147 157 Kowles M, Siegmud D a Zhag H 1991) Cofidece regios i semiliear regressio Biometrika 78, 1991, 15 1 Seber G A F a Wild C J 1989) Noliear regressio J Wiley, New York ČVUTv Praze, Stavebí fakulta, Katedra matematiky, Thákurova 7, 166 9 Praha 6 E-mail: jarus@matfsvcvutcz