ODHAD BODU VZNIKU KVADRATICKÉHO TRENDU. 1. Úvod

Podobné dokumenty
6 Intervalové odhady. spočteme aritmetický průměr, pak tyto průměry se budou chovat jako by pocházely z normálního. nekonečna.

8. Analýza rozptylu.

PRAVDĚPODOBNOST A STATISTIKA

12. N á h o d n ý v ý b ě r

Odhady parametrů 1. Odhady parametrů

Náhodný výběr 1. Náhodný výběr

Odhady parametrů polohy a rozptýlení pro často se vyskytující rozdělení dat v laboratoři se vyčíslují podle následujících vztahů:

Pravděpodobnost a aplikovaná statistika

Intervalové odhady parametrů některých rozdělení.

Mezní stavy konstrukcí a jejich porušov. Hru IV. Milan RůžR. zbynek.hruby.

4. B o d o v é o d h a d y p a r a m e t r ů

14. B o d o v é o d h a d y p a r a m e t r ů

jako konstanta nula. Obsahem centrálních limitních vět je tvrzení, že distribuční funkce i=1 X i konvergují za určitých

PRAVDĚPODOBNOST A STATISTIKA

procesy II Zuzana 1 Katedra pravděpodobnosti a matematické statistiky Univerzita Karlova v Praze

8. Odhady parametrů rozdělení pravděpodobnosti

Deskriptivní statistika 1

Při sledování a studiu vlastností náhodných výsledků poznáme charakter. podmínek různé výsledky. Ty odpovídají hodnotám jednotlivých realizací

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

2. Náhodná veličina. je konečná nebo spočetná množina;

ZÁKLADNÍ STATISTICKÉ VÝPOČTY (S VYUŽITÍM EXCELU)

odhady parametrů. Jednostranné a oboustranné odhady. Intervalový odhad střední hodnoty, rozptylu, relativní četnosti.

Odhady parametrů základního souboru. Ing. Michal Dorda, Ph.D.

3. Lineární diferenciální rovnice úvod do teorie

Základy statistiky. Zpracování pokusných dat Praktické příklady. Kristina Somerlíková

STATISTIKA. Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. H. Levinson

Přednáška VI. Intervalové odhady. Motivace Směrodatná odchylka a směrodatná chyba Centrální limitní věta Intervaly spolehlivosti

Intervalové odhady parametrů

Pravděpodobnost a aplikovaná statistika

VYSOCE PŘESNÉ METODY OBRÁBĚNÍ

EKONOMETRIE 9. přednáška Zobecněný lineární regresní model

Testujeme hypotézu: proti alternativě. Jednoduché třídění:

veličiny má stejný řád jako je řád poslední číslice nejistoty. Nejistotu píšeme obvykle jenom jednou

Pevnost a životnost - Hru III 1. PEVNOST a ŽIVOTNOST. Hru III. Milan Růžička, Josef Jurenka, Zbyněk Hrubý.

Popisná statistika. Zdeněk Janák 9. prosince 2007

Interval spolehlivosti pro podíl

Úloha II.S... odhadnutelná

MATICOVÉ HRY MATICOVÝCH HER

n=0 a n, n=0 a n = ±. n=0 n=0 a n diverguje k ±, a píšeme n=0 n=0 b n = t. Pak je konvergentní i řada n=0 (a n + b n ) = s + t. n=0 k a n a platí n=0

Katedra pravděpodobnosti a matematické statistiky. χ 2 test nezávislosti

Univerzita Karlova v Praze Matematicko-fyzikální fakulta. Pavel Pejřimovský. Katedra pravděpodobnosti a matematické statistiky

PRAVDĚPODOBNOST A STATISTIKA

Odhady parametrů základního. Ing. Michal Dorda, Ph.D.

Matematika 1. Katedra matematiky, Fakulta stavební ČVUT v Praze. středa 10-11:40 posluchárna D / 13. Posloupnosti

Kapitola 5 - Matice (nad tělesem)

Přednášky část 7 Statistické metody vyhodnocování dat

Dynamická pevnost a životnost Statistika

Náhodu bychom mohli definovat jako součet velkého počtu drobných nepoznaných vlivů.

n-rozměrné normální rozdělení pravděpodobnosti

Iterační metody řešení soustav lineárních rovnic

Posloupnosti a číselné řady. n + 1. n n n n. n n n. = lim. n2 sin n! lim. = 0, je lim. lim. lim. 1 + b + b b n) = 1 b

17. Statistické hypotézy parametrické testy

Parametr populace (populační charakteristika) je číselná charakteristika sledované vlastnosti

ŘADY Jiří Bouchala a Petr Vodstrčil

Metody zkoumání závislosti numerických proměnných

14. Testování statistických hypotéz Úvod statistické hypotézy Definice 14.1 Statistickou hypotézou parametrickou neparametrickou. nulovou testovanou

6. Posloupnosti a jejich limity, řady

je konvergentní, právě když existuje číslo a R tak, že pro všechna přirozená <. Číslu a říkáme limita posloupnosti ( ) n n 1 n n n

8 DALŠÍ SPOJITÁ ROZDĚLENÍ PRAVDĚPODOBNOSTI

ASYMPTOTICKÉ TESTY HYPOTÉZ V MODELECH S RUŠIVÝMI PARAMETRY

Obsah. 1 Mocninné řady Definice a vlastnosti mocninných řad Rozvoj funkce do mocninné řady Aplikace mocninných řad...

1 POPISNÁ STATISTIKA V PROGRAMU MS EXCEL

} kvantitativní znaky. korelace, regrese. Prof. RNDr. Jana Zvárov. Obecné principy

Cvičení 6.: Výpočet střední hodnoty a rozptylu, bodové a intervalové odhady střední hodnoty a rozptylu

i 1 n 1 výběrový rozptyl, pro libovolné, ale pevně dané x Roznačme n 1 Téma 6.: Základní pojmy matematické statistiky

I. TAYLORŮV POLYNOM. Taylorovy řady některých funkcí: Pro x R platí: sin(x) =

Teorie odhadů 2 Teorie odhadů... 3 Odhad parametrů... 4

P2: Statistické zpracování dat

V. Normální rozdělení

Užitečné zdroje příkladů jsou: Materiály ke cvičením z Kalkulu 3 od Kristýny Kuncové:

Zformulujme PMI nyní přesně (v duchu výrokové logiky jiný kurz tohoto webu):

Bc. Barbora Šimková. Odhady parametrů rozdělení náhodných veličin

z možností, jak tuto veličinu charakterizovat, je určit součet

Seznámíte se s pojmem Riemannova integrálu funkce jedné proměnné a geometrickým významem tohoto integrálu.

UPLATNĚNÍ ZKOUŠEK PŘI PROHLÍDKÁCH MOSTŮ

IAJCE Přednáška č. 12

Testy homoskedasticity v lineárním modelu

Cvičení 6.: Bodové a intervalové odhady střední hodnoty, rozptylu a koeficientu korelace, test hypotézy o střední hodnotě při známém rozptylu

Seriál XXX.II Zpracování dat fyzikálních měření

Analýza a zpracování signálů. 3. Číselné řady, jejich vlastnosti a základní operace, náhodné signály

Přednáška II. Lukáš Frýd

Číselné charakteristiky náhodných veličin

OKRUŽNÍ A ROZVOZNÍ ÚLOHY: OBCHODNÍ CESTUJÍCÍ. FORMULACE PŘI RESPEKTOVÁNÍ ČASOVÝCH OKEN

je konvergentní, právě když existuje číslo a R tak, že pro všechna přirozená <. Číslu a říkáme limita posloupnosti ( ) n n 1 n n n

Základní požadavky a pravidla měření

FITOVÁNÍ ROZDĚLENÍ PRAVDĚPODOBNOSTI PRO APLIKACE

( + ) ( ) ( ) ( ) ( ) Derivace elementárních funkcí II. Předpoklady: Př. 1: Urči derivaci funkce y = x ; n N.

3. Charakteristiky a parametry náhodných veličin

1 Uzavřená Gaussova rovina a její topologie

NEPARAMETRICKÉ METODY

Přednáška 7, 14. listopadu 2014

vají statistické metody v biomedicíně Literatura Statistika v biomedicínsk nském výzkumu a ve zdravotnictví

Intervalový odhad. nazveme levostranným intervalem pro odhad parametru Θ. Statistiku. , kde číslo α je blízké nule, nazveme horním

7. Odhady populačních průměrů a ostatních parametrů populace

NMAF061, ZS Zápočtová písemná práce skupina A 16. listopad dx

Lineární a adaptivní zpracování dat. 8. Modely časových řad I.

Přijímací zkouška na navazující magisterské studium 2016

Lineární a adaptivní zpracování dat. 9. Modely časových řad II.

Závislost slovních znaků

základním prvkem teorie křivek v počítačové grafice křivky polynomiální n

Transkript:

ROBUST 000, 10 108 c JČMF 001 ODHAD BODU VZNIKU KVADRATICKÉHO TRENDU DANIELA JARUŠKOVÁ Abstrakt The problem of least squares method estimatioof the parameter τ ithe regressiomodel Y i = β i/ ) + + γ i/ ) + + e i is cosidered Supposig γ 0adτ 0, 1) it is showthat the distributio of ˆτ ) is largely affected by the value of β Ithecaseβ 0thevariable ˆτ ) is asymptotically ormally distributed whereas i the case β =0 the variable ˆτ ) has the same distributioas max 0,Z)whereZ has a zero mea ormal distributio The problem of least squares method estimatioof the parameter τ ithe regressiomodel Y i = β i/ ) + + γ i/ ) + + e i is cosidered Supposig γ 0adτ 0, 1) it is showthat the distributio of ˆτ ) is largely affected by the value of β Ithecaseβ 0thevariable ˆτ ) is asymptotically ormally distributed whereas i the case β =0 the variable ˆτ ) has the same distributioas max 0,Z)whereZ has a zero mea ormal distributio Rezme: Uvaaets problema oceivai parametra τ v modeli lieioi regresii Y i = β i/ ) + + γ i/ ) + + e i pri ispo zovaii metoda aimexih kvadratov Pokazyvaets, qto predpologa γ 0i τ 0, 1), zaqeie parametra β imeet bo xoe vliie a raspredeleie ˆτ ) V sluxae kogda β 0, potom ˆτ ) imeet asimptotiqeski orma oe raspredeleie Naoborot, kogda β =0,potom ˆτ τ ) obladaet teme paspredeleiem kak 0,Z), kde Z sleduet orma oe raspredeleie s ulovym sredim 1 Úvod V praxi občas arazíme a problém, kde se lieárí závislost v ezámém časovém okamžiku změí v závislost kvadratickou Sledujeme-li apříklad u jistých typů sliti závislost apětí Y a zatížeí X, ukazuje se, že při malém zatížeí je zvyšováí apětí lieárí elastická oblast), zatímco po překročeí určitého kritického zatížeí se měí kvadraticky quasielastická oblast), tj Y = fx), kde fx) =p + qx+ β x ) + + γ x ) +, při ozačeí a + =max0,a) V ašem čláku si poěkud zjedodušíme situaci tím, že budeme předpokládat, že parametry p a q jsou zámé, a tedy je bez újmy a obecosti můžeme položit rovy ule Dále budeme předpokládat, že veličia X je měřea v equidistatích vzdáleostech,,,, a tudíž ji lze trasformovat a veličiu abývající 000 Mathematics Subject Classificatio Primary 6F1 Klíčová slova Detekce bodu změy chage-poit problem), elieárí regrese, odhady Práce byla částečě podporováa graty GAČR 01/00/0769 a MSM 10000001

Odhad bodu vziku kvadratického tredu 10 hodot 1/, /,,1, to jest veličiu, která abývá hodot pouze v itervalu [0, 1] Jestliže předpokládáme aditiví vliv áhodých chyb {e i } a aměřeé hodoty ezávisle proměé Y, dospíváme k regresímu modelu 1) Y i = β i/ ) + + γ i/ ) + + e i, kde β, γ a τ jsou ezámé parametry Pro jedoduchost předpokládejme, že áhodé chyby {e i } jsou ezávislé stejě rozděleé s rozděleím N0,σ ), kde σ je zámé, a tudíž opět bez újmy a obecosti můžeme položit σ =1 Úlohou, kterou se budeme zabývat, je odhad ezámých parametrů β, γ a τ Především ás bude zajímat odhad parametru τ,kterýseazývábodzměy Budeme předpokládat, že τ 0, 1) Parametr β odpovídá prví derivaci zprava aγ druhé derivaci zprava regresí fukce v bodě τ Vzhledem k ormalitě chyb {e i } lze maximálě věrohodé odhady získat metodou ejmeších čtverců Bodový odhad parametrů Model 1) je speciálím modelem elieárí regrese, kterému se ěkdy říká semilieárí model, viz Kowles et all 1991) Kdybychom totiž zali hodotu τ parametru τ,tjτ = τ, pak by model 1) byl modelem lieárí regrese s dvěma vysvětlujícími proměými, tj lieárí model s maticí pláu experimetu X τ) = [τ ]+1 [τ ]+ 0 0 0 0 [τ ]+1 [τ ]+1 1 1 ) ) ) Ozačme β τ, γ τ ) T = X T τ)x τ) ) 1 X T τ)y, kde Y =Y 1,,Y ) T,a S τ,β,γ) = i=1 Y i β i/ ) + + γ i/ ) +)) Pak S τ, β, γ) = mi S τ,β,γ) = mi S τ, β τ, γ τ ) β,γ,τ 0,1) τ 0,1) Nejčastějším umerickým postupem pro alezeí přibližých hodot odhadů τ, β, γ spočívá v tom, že pro hodoty τ zdostihustémřížebodůt v itervalu 0,1) počítáme residuálí součet čtverců S τ, β τ, γ τ ) a pak hledáme mi τ T S τ, β τ, γ τ ) Statistik se však obvykle espokojí s bodovým odhadem ezámých parametrů, ale zajímá se též o itervaly spolehlivosti, respektive oblasti spolehlivosti

104 Daiela Jarušková Oblasti spolehlivosti v elieárí regresi Uvažujme obecý model elieárí regrese s k -rozměrým vektorem parametrů θ =θ 1,,θ k )T Y i = f i θ )+e i, i =1,,, kde {f i )} jsou zámé fukce a {e i } jsou ezávislé stejě rozděleé áhodé veličiy s rozděleím N0, 1) Ozačme S θ) = Y i f i θ) ) a θ odhad θ metodou ejmeších čtverců, tj S θ) =mi θ1,,θ k Yi f i θ 1,θ,,θ k ) ) Dále ozačme θ θ 1 ),, θ k θ 1 ) ) odhad metodou ejmeších čtverců při pevé hodotě prvího parametru rovajícího se θ 1,tjS θ 1, θ θ 1 ),, θ k θ 1 ) ) =mi θ,,θ k Yi f i θ 1,θ,,θ k ) ) Užívaé kofidečí oblasti pro celý vektor parametrů θ jsou obvykle dvou typů: 1a) {θ, θ θ) T A θ θ) <C 1 },kdea je ějaká symetrická matice, a) {θ,s θ) <S θ)+c } Prví oblast je eliptická, zatímco druhá může mít aprosto obecý tvar a může být dokoce esouvislá Druhé oblasti se ěkdy říká exaktí, eboť je odvozea přímo z poměru věrohodosti Aalogické kofidečí oblasti pro jede parametr, řekěme θ 1,majítvar: 1b) {θ 1, θ 1 θ 1 <K 1 }, b) {θ 1,S θ1, θ θ 1 ),, θ k θ 1 ) ) <S θ)+k } Kostaty C 1, C,respK 1, K, jsou obvykle odvozey z asymptotického rozděleí θ θ a S θ) S θ ), resp θ 1 θ1 a S θ) S θ1, θ θ1),, θ k θ1) ) Je-li splěa celá řada podmíek, viz apříklad podmíky A1),, A9) ebo B1),, B8) v kize Seber & Wild 1989), kapitola 1, pak θ θ )má asymptoticky ormálí rozděleí Většiou mezi tyto podmíky patří existece spojitých prvích i druhých parciálích derivací fiθ) θ r a f iθ) θ r θ s, i =1,,, r, s = 1,,k, a ějakém okolí správé hodoty θ Navíc se předpokládá, že matice 1 F θ) ) T F θ) ),kde f 1 θ 1 F θ) = f θ 1 koverguje stejoměrě a ějakém okolí θ k esigulárí matici Gθ) Matice G 1 θ ) je pak limití variačí maticí vektoru θ θ ) f 1 θ k f θ k, 4 Oblasti spolehlivosti v modelu 1) Je patré, že v modelu 1) emá regresí fukce vzhledem k parametru τ již ai prví derivaci Přesto se však dá ukázat, že v případě, že β 0, γ 0 a τ 0, 1), má τ, β β, γ γ ) asymptoticky ormálí rozděleí se symetrickou variačí maticí G 1,kde

Odhad bodu vziku kvadratického tredu 105 β 1 )+4β γ 1 ) G = β 1 ) β 1 ) +4γ 1 ) γ 1 ) γ 1 ) 4 4 1 ) 1 ) 4 1 ) 5 4 5 1 Zřejmě G = lim F T F,kde 0 0 0 F = 0 0 0 ) ) β γ [τ ]+1 [τ ]+1 [τ ]+1 β γ 1 ) 1 1 ) K důkazu lze použít stejý postup, který použila Hušková 1998) pro jedodušší model typu ) Y i = β i/ ) + + e i, a který spočívá v tom, že a okolí správé hodoty aproximujeme fukci ejmeších čtverců kvadratickou fukcí Speciálě ukázala, že a okolí bodu τ lze aproximovat S τ, β τ ) S τ, β τ ) fukcí Cτ ) +X τ ), kde X/C má ormálí rozděleí N0, 1/C) Jiý postup použil Feder 1975), který modely 1) i ) považuje za speciálí případy regresí fukce fx, θ) =f 1 x, θ 1 ) pro 0 x τ = f x, θ ) pro τ x 1, kde f i x, θ) = Ki) j=1 θ ijf ij x) Za přípustou možiu parametrů Θ pak uvažuje je takové parametry, při kterých se fukce f 1 x, θ 1 )af x, θ ) protíají uvitř itervalu 0,1) Ukazuje, že limití rozděleí θ θ závisí a tom, zda θ je vitřím ebo krajím bodem možiy Θ Parametr τ pak odhaduje jako průsečík fukcí f 1 x, θ 1 )af x, θ ) Řád kovergece τ k τ závisí a tom, v kolika derivacích se shodují fukce f 1 x, θ )af x, θ )vboděτ V případě modelu 1) s β 0,γ 0aτ 0, 1) lze z přístupů Huškové 1998) i Federa 1975) odvodit asymptotickou ormalitu τ, β β, γ γ ) Speciálě platí ) ) τ 9 ) N 0, β 1 ) a S τ, β τ, γ τ ) S τ, β, γ) má asymptoticky χ rozděleí o 1 stupi volosti Všiměme si, že asymptotický rozptyl odhadu τ, viz ), záleží a poloze τ, což je jakási globálí vlastost regresí fukce Je přirozeé, že parametr τ lépe

106 Daiela Jarušková odhademe, máme-li možost pozorovat kvadratický tred delší dobu Dále však je asymptotický rozptyl τ, a tedy i délka itervalu spolehlivosti typu a), ovlivěa prví derivací kvadratické fukce v bodě τ, což je lokálí vlastost regresí fukce Je-li β malé, můžeme použijeme-li postup 1 b)) dostat pro koečá dokoce iterval spolehlivosti, jehož krají body leží mimo iterval 0, 1) V teorii elieárí regrese se teto jev azývá špatá podmíěost Špatá podmíěost je způsobea tvarem regresí fukce Horí část obrázku 1 představuje regresí fukci 4) fx, τ,β,γ )=β x ) + + γ x ) + pro τ =05, β =10aγ = 4 a dolí část obrázku zobrazuje odpovídající fukci ejmeších čtverců B τ,τ )pro = 500 a τ 0, 06) za předpokladu, že model eobsahuje žádé chyby, tj B τ,τ )= 1 i ) i f,τ, β τ, γ τ f,τ, β ) ) τ, γ τ 1 i=1 10 8 6 4 0 0 01 0 0 04 05 06 07 08 09 1 60 50 40 0 0 10 0 10 0 05 0 05 04 045 05 055 06 065 Obrázek 1 Jestliže uvažujeme model 1) s regresí fukcí 4) včetě áhodých chyb, pak může fukce ejmeších čtverců a 95% oblast spolehlivosti typu b) vypadat apříklad jako a obrázku

Odhad bodu vziku kvadratického tredu 107 14 1 10 8 6 4 0 4 0 01 0 0 04 05 06 07 08 09 1 560 550 540 50 50 510 500 0 05 0 05 04 045 05 055 06 065 Obrázek Ačkoliv k tomu emáme žádý teoretický důvod doporučujeme ze zkušeostí používat spíše oblast spolehlivosti typu b), kde K je příslušý kvatil χ -rozděleí o 1 stupi volosti V každém případě doporučujeme vždy při statistické aalýze vykreslit průběh fukce S τ, β τ, γ τ ) V krajím případě, kde β =0,γ 0aτ 0, 1), lze ukázat, že v okolí bodu τ lze rozdíl fukcí čtverců S τ, β τ, γ τ ) S τ, β τ, γ τ ) aproximovat fukcí Cτ ) 4 +X τ ), kde X/C N0, 1/C) ac = γ 1 )/9 Je zřejmé, že fukce Cx x X/C) abývá maxima v ule, pokud X je záporé, a hodoty X/C, pokudx je kladé Odtud vyplývá, že τ ) má asymptoticky stejé rozděleí jako max 0,Z), kde veličia Z má ormálí rozděleí 5) Z N 9 ) 0, γ 1 )

108 Daiela Jarušková Výsledek 5) lze použít pro kostrukci symetrického itervalu spolehlivosti a) Můžeme též zkostruovat oblast typu b) s využitím toho, že S τ, β τ, γ τ ) S τ, β, γ) má asymptoticky stejé rozděleí jako max0,y)),kdey má stadardí ormálí rozděleí Pro zajímavost uveďme, že pokud odhadujeme parametr τ vmodelu Y i = γ i/ ) + + e i, i =1,,, pak τ ) má asymptoticky ormálí rozděleí N 0, 1/ γ 1 ) )) Odtud je zřejmé, že iformace, zda-li je prví derivace v bodě změy ulová, je při odhadováí tohoto bodu velmi velmi důležitá Literatura Feder P J 1975) O asymptotic distributio theory i segmeted regressio problems - idetified case The Aals of Statistics, 49 6 Hušková M 1998) Estimators i the locatio model with gradual chages Commet Math Uiv Caroliae 9, 147 157 Kowles M, Siegmud D a Zhag H 1991) Cofidece regios i semiliear regressio Biometrika 78, 1991, 15 1 Seber G A F a Wild C J 1989) Noliear regressio J Wiley, New York ČVUTv Praze, Stavebí fakulta, Katedra matematiky, Thákurova 7, 166 9 Praha 6 E-mail: jarus@matfsvcvutcz