Robustní statistické metody

Podobné dokumenty
Robustní odhady statistických parametrů

Pravděpodobnost a matematická statistika

Charakterizace rozdělení

IDENTIFIKACE BIMODALITY V DATECH

Klasická a robustní ortogonální regrese mezi složkami kompozice

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace

AVDAT Klasický lineární model, metoda nejmenších

PRŮZKUMOVÁ ANALÝZA JEDNOROZMĚRNÝCH DAT Exploratory Data Analysis (EDA)

AVDAT Náhodný vektor, mnohorozměrné rozdělení

Zápočtová práce STATISTIKA I

Řešení. Označme po řadě F (z) Odtud plyne, že

Optimalizace provozních podmínek. Eva Jarošová

Eva Fišerová a Karel Hron. Katedra matematické analýzy a aplikací matematiky Přírodovědecká fakulta Univerzity Palackého v Olomouci.

Popis plnění balíčku WP08: Snižování mechanických ztrát pohonných jednotek

Aplikace 2: Hledání informativních příznaků pro rozpoznávání

Definice spojité náhodné veličiny zjednodušená verze

Statistika. Regresní a korelační analýza Úvod do problému. Roman Biskup

Klasifikační metody pro genetická data: regularizace a robustnost

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

ODHADY NÁVRATOVÝCH HODNOT

Statistická analýza jednorozměrných dat

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Mgr. Rudolf Blažek, Ph.D. prof. RNDr. Roman Kotecký Dr.Sc.

Úlohy nejmenších čtverců

ÚSTAV MATEMATIKY A DESKRIPTIVNÍ GEOMETRIE. Matematika 0A4. Cvičení, letní semestr DOMÁCÍ ÚLOHY. Jan Šafařík

4. Aplikace matematiky v ekonomii

15. T e s t o v á n í h y p o t é z

Oct 19th Charles University in Prague, Faculty of Mathematics and Physics. Multidimensional estimators. Základní pojmy.

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

ANALÝZA DAT V R 2. POPISNÉ STATISTIKY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Odhady Parametrů Lineární Regrese

Úvodem Dříve les než stromy 3 Operace s maticemi

23. Matematická statistika

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Regresní analýza 1. Regresní analýza

Pravděpodobnost a statistika

M - ODHADY M - ODHADY

Kvantily a písmenové hodnoty E E E E-02

Numerické řešení soustav lineárních rovnic

UNIVERZITA PARDUBICE. 4.4 Aproximace křivek a vyhlazování křivek

Praktická statistika. Petr Ponížil Eva Kutálková

M-estimators. Oct 19th Charles University in Prague, Faculty of Mathematics and Physics. M-estimators. Základní pojmy - připomenutí.

Úloha 1. Napište matici pro případ lineárního regresního spline vyjádřeného přes useknuté

AVDAT Nelineární regresní model


správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B.

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:

Bodové a intervalové odhady parametrů v regresním modelu

7. Analýza rozptylu.

Numerické řešení soustav lineárních rovnic

Testování změn v binárnách autoregresních modelech Šárka Hudecová 1/ 36

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN

Statistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

Ukázka závěrečného testu

Normální rozložení a odvozená rozložení

Charakteristika datového souboru

ZÁKLADNÍ POJMY a analýza výběru

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

3 Bodové odhady a jejich vlastnosti

VYBRANÁ ROZDĚLENÍ. SPOJITÉ NÁH. VELIČINY Martina Litschmannová

SPOJITÉ ROZDĚLENÍ PRAVDĚPODOBNOSTI. 7. cvičení

Chyby měření 210DPSM

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

15. T e s t o v á n í h y p o t é z

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

KGG/STG Statistika pro geografy

Statistika s Excelem aneb Máme data. A co dál? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Matematika pro chemické inženýry

Pravděpodobnost a aplikovaná statistika

5. B o d o v é o d h a d y p a r a m e t r ů

Nadstavba pro statistické výpočty Statistics ToolBox obsahuje více než 200 m-souborů které podporují výpočty v následujících oblastech.

Statistika pro geografy

Statistická analýza jednorozměrných dat

Numerické metody a programování

KGG/STG Statistika pro geografy

Průzkumová analýza dat

AVDAT Mnohorozměrné metody, metody klasifikace

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Metodologie pro ISK II

Statistická analýza jednorozměrných dat

AVDAT Geometrie metody nejmenších čtverců

Analýza dat na PC I.

Pravděpodobnost, náhoda, kostky

Základní statistické metody v rizikovém inženýrství

MATEMATICKÁ STATISTIKA - XP01MST

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

BAYESOVSKÉ ODHADY. Michal Friesl V NĚKTERÝCH MODELECH. Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni

Vlastnosti odhadů ukazatelů způsobilosti

y = 0, ,19716x.

Transkript:

Populární úvod Ústav teoretické fyziky a astrofyziky, MU Brno 28. říjen 2006, Vlašim

O co jde? Robustní znamená: necitlivý k malým odchylkám od ideálních předpokladů na který je metoda odhadu optimalizována. Praktický rozdíl pro PCVista vs. DAOPHOT. Tento způsob nazírání zavedl do statistiky G.E.P. Box v roce 1953. Životně důležitá metoda pro hromadné zpracování dat bez jakéhokoli zásahu obsluhy. Slovem robustní se označují často též metody numericky stabilní (řešení normálních rovnic singulárním nebo QR rozkladem místo LL eliminace).

Klasické metody Někdy fungují dobře, jindy ne. Aritmerický průměr x, střední odchylka, σ. Předpoklad: data mají normální rozdělení. Problém odlehlých hodnot se řeší filtrováním, např. σ-clipping. σ = 3.3 i x (i) σ (i) 0 9.71900 7.74145 1 9.71900 7.74145 2 9.71900 7.74145... σ = 2.0 i x (i) σ (i) 0 9.71900 7.74145 1-1.56600 2.91379 2-1.56600 0.00773...

Klasické metody BL Lac Část měřených magnitud t JD m i σ i 0.38223-1.586 0.017 0.40059 99.999 9.999 0.40184-1.558 0.015 0.40428-1.572 0.018 t JD m i σ i 0.40550-1.530 0.019 0.40671-1.511 0.017 0.38353-1.562 0.019 0.40792 99.999 9.999

Metoda největší věrohodnosti Maximum likehood method N L = f (x; t) i=1 (max.) Metoda nejmenších čtverců f (x i ; x) = 1 2π e (x i x) 2 /2 N (x i x) 2 = 0 i=1 N x = 1 N i=1 x i

Metoda největší věrohodnosti rozdělovací funkce Substituce funkcí ln L( x) = ln f (x i x) = ϱ(x i x) ψ(xi x) = 0 Normální rozdělení aritmerický průměr f (x) = exp( x 2 /2), ϱ = x 2 Exponenciální rozdělení medián f (x) = exp( x ), ϱ = x, ψ = 2, ψ = x { 1, x 0 1, x < 0

Robustní metody Princip: minimalizujeme L pro speciální funkce. { x ϱ(x) = 2 /2, x a a = 1.345 a x a 2 /2, x > a

Robustní aritmetický průměr Postup řešení 0 i N i=1 ψ( x i x ) = 0 s x (0) = med(x i ), s = med(x i x (0) )/0.6745 x (i+1) = x (i) + s ψ( x i x (i) s ) ψ ( x i x (i) s ) σ 2 = s 2 n ψ 2 n 1 ( ψ ) 2

Robustní metody přehled Huberova klasifikace M-odhady představují odhady založené na metodě největší věrohodnosti (Maximum likelihood). L-odhady jsou Lineární kombinace několika statistik, například průměr, median, kvantily a pod. R-odhady jsou na základě fitování parametrů distribucí buď v histogramu nebo distribuční funkci, (Rank test).

Použití robustních metod flat field originál

Použití robustních metod flat field průměr

Použití robustních metod BL Lac Průměrná magnituda Aritmetický průměr: 9.719 ± 7.741 Vážený aritmetický průměr: 1.565 ± 0.018 2.0 σ clip bez vah: 1.566 ± 0.008 Robustní průměr bez vah : i x (i) σ (i) 0-1.56100 0.02500 1-1.56583 0.00799 2-1.56582 0.00791

Použití robustních metod jas oblohy Úroveň oblohy aritmetický průměr: 32361.3 ± 33.6 robustní průměr: 31972.7 ± 1.6 Histogram intenzit náhodně vybrané části snímku.

ve více rozměrech Změny Medián je transformován na součet absolutních hodnot odchylek (minimalizace negradientní metodou). Vícerozměrná metoda řešení rovnic MINPACK (QR + Marquart Levendberg).

Použití robustních metod ve více rozměrech profil (1) G(x, y x 0, y 0, d x, d y, B, G 0 ) = G 0 e [( (x x 0) 2 /2d 2 x (y y 0 ) 2 /2d 2 y )] + B

Použití robustních metod ve více rozměrech profil (2) LM+LL* MINPACK+QR* x 0 67.0 ± 6.9 y 0 253.1 ± 7.3 d x 0.810 ± 6.6 d y 0.928 ± 7.3 G 0 47900 ± 1170 B 57300 ± 390 S 0 6.91 10 8 * Levendberg Marquartova metoda + LL rozklad při výpočtu matic. x 0 67.0 ± 2.7 y 0 252.47 ± 0.16 d x 0.798 ± 2.130 d y 1.192 ± 0.165 G 0 46600 ± 14200 B 57300 ± 19000 S 0 1.64 10 7 *Upravená Levendberg Marquartova metoda + QR rozklad při výpočtu matic.

Literatura S. Brandt: Statistical and Computational Methods in data analysis, Elsevier 1970 P. J. Huber: Robust Statistics, Wiley, New York 1981 R. L. Lauer, G. N. Wilkinson (eds.): Robustness in statistics, Academic Press 1979 W. H. Press, B. P. Flannery, S. A. Teukolsky, W. T. Vetterling: Numerical Recipes, Cambridge University Press 1986