Robustní odhady statistických parametrů

Save this PDF as:
 WORD  PNG  TXT  JPG

Rozměr: px
Začít zobrazení ze stránky:

Download "Robustní odhady statistických parametrů"

Transkript

1 Robustní odhady statistických parametrů ěkdy pracují dobře, jinde ne.

2 Typická data - pozorování BL Lac 100 mag JD date

3 σ-clipping algoritmy snaží se eliminovat příliš odlehlé hodnoty Příklad použití na data z BL Lac (nevážené, σ 3 3): i x i σ xi Příklad použití na data z BL Lac (nevážené, σ 2 0): σ xi i x i Typy na zlepšení: váhování dat, použití mediánu

4 Odhad aritmetického průměru Vychází z metody největší věrohodnosti (Brandt 1970): L f x;t l lnl ln f x i ;t kde t jsou hledané parametry a x i pak naměřená data. V případě minimalizace nejmenších čtverců použijeme f x i ;x 1 2π exp x i což vede na x i x 2 0 x 2 2 x 1 x i

5 Robustní odhad Vychází opět z metody největší věrohodnosti. Základní rozdíl je v tom, že hledáme minimum určité funkce (Launer, Wilkinson 1979): l lnl ln f x i ;t ρ x i ;t Minimalizací pak dostáváme: ρ x i ;t ψ x i ;t 0 Tato poslední rovnice je implicitní rovnicí vzhledem k parametrům. Její řešení je v praktických případech nutné provádět numericky.

6 Běžně používané volby ψ Gaussova funkce ρ x x 2 2 ρ ψ x x x ρ Huberova funkce (a = na 95% hladině) a x 2 x 2 x a 2 x a a 2 ρ ρ a x x a a x a x a x

7 Robustní aritmerický průměr Jejím základem je řešení rovnice x i i x ψ 0 s 1 kde parameter s je normalizační parametr volený tak aby se blížil k sigma parametru gausova rozdělení u normálně rozdělených dat. Tuto rovnici lze nejlépe řešit ewtonovou metodou. Předtím ovšem musíme znát dobrý odhad kořene, v našem případě prumeru. Obyčejný průměr je k tomu nevhodný, nejlépe je použít median nebo nejčetnější hodnotu. x 0! x 0 #" 0 x i s x i 6745 x i$ 1 x i&% s' ψ( x i *) x ' ψ ( i x i *) x i

8 Zjednodužšená implementace odhadu z Munipacku: subroutine prumer(n,x,t,dt) integer :: n! pocet dat real :: x(n)! hodnoty vyberu real :: t,dt! odhady parametru! nulty odhad t = median(n,x) s = median(n,abs(x - t)) s = s/ do d = s*sum(psi((x - t)/s))/ & sum(dpsi((x - t)/s)) t = t + d if( abs(d) < epsilon(d) exit enddo dt = sqrt(s**2*n/(n-1)* & sum(psi((x - t)/s)**2)/ & sum(dpsi((x - t)/s))**2) end subroutine

9 Porovnání různých metod odhadu pro BL Lac Aritmetický průměr: Vážený aritmetický průměr: σ clip bez vah: Robustní průměr bez vah : i x i σ xi

10 Odhad úrovně oblohy CCD snímku Histogram intenzit náhodně vybraných ze snímku. Obloha určena aritmetickým průměrem: Obloha určena robustním průměrem: frequency value

11 Přehled robustních metod M-odhady představují odhady založené na metodě největší věrohodnosti, (Maximum likelihood) L-odhady jsou Lineární kombinace několika statistik, například průměr, median, kvantily a pod R-odhady jsou na základě fitování parametrů distribucí bud v histogramu nebo distribuční funkci, (Rank tests) (Press, Flannery, Teukolsky, Vetterling 1986), (Launer, Wilkinson 1979) Robustní metody a robustní metody V praxi se lze setkat se dvojím typem tzv. robustních metod: odhady robustní odhad o kterém uz byla řeč metody to je pojem odvozený z různých sw balíků (Matlab, S, Octave,...) kde se tak označují fitovací metody pro vícerozměrnou minimalizaci

12 Vícerozměrná robustní minimalizace Pricip metod vícerozměrné minimalizace je stejný jako jako u jednorozměrné. Rozdíly jsou: počátecní odhad nelze získávat medianem. Je nutné použít vícerozměrnou obdobu mediánu, kterou je minimalizace součtu absloutních odchylek Je nutné použít vícerozměrnou verzi ewtonovy metody řešení rovnic. Všeobecně nejvíce uznávaná metoda na řešeni nelineárních rovnic jsou algoritmy MIPACKU založené na Marquard-Levendbergove metodě s výpočtem linearnich rovnic pomoci QR algoritmu.

13 Fitování profilu hvězdy Byla fitována funkce G x y x 0 y 0 σ x σ y B G 0 G 0 e,-/.0 x. x 021 2σ x.2 y. y 021 2σ y/34% B Výsledek pro LM metodu bez robustního odhadu s výpočtem matice LL faktorizací: x y σ x σ y G B Residuální součet byl E+08. Robustní odhad MIPACKem s QR faktorizací: x y σ x σ y G B Residualní součet E+07.

14 intensity

15 Literatura S. Brandt: Statistical and Computational Methods in data analysis, Elsevier 1970 W. H. Press, B. P. Flannery, S. A. Teukolsky, W. T. Vetterling : umerical Recipes, Cambridge University Press 1986 R. L. Lauer, G.. Wilkinson (eds.): Robustness in statistics, Academic Press 1979