dat Robust ledna 2018

Podobné dokumenty
Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

Modelování sesuvu svahu v Halenkovicích pomocí metody kriging

AVDAT Nelineární regresní model

Korelační a regresní analýza

LINEÁRNÍ MODELY. Zdeňka Veselá

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Eva Fišerová a Karel Hron. Katedra matematické analýzy a aplikací matematiky Přírodovědecká fakulta Univerzity Palackého v Olomouci.

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

13.1. Úvod Cílem regresní analýzy je popsat závislost hodnot znaku Y na hodnotách

AVDAT Klasický lineární model, metoda nejmenších

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

Bodové a intervalové odhady parametrů v regresním modelu

AVDAT Mnohorozměrné metody, metody klasifikace

12. cvičení z PST. 20. prosince 2017

Statistická analýza jednorozměrných dat

AKM CVIČENÍ. Opakování maticové algebry. Mějme matice A, B regulární, potom : ( AB) = B A

PRAVDĚPODOBNOST A STATISTIKA

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

odpovídá jedna a jen jedna hodnota jiných

LWS při heteroskedasticitě

Klasická a robustní ortogonální regrese mezi složkami kompozice

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Časové řady, typy trendových funkcí a odhady trendů

AVDAT Geometrie metody nejmenších čtverců

Statistika (KMI/PSTAT)

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Metoda backward výběru proměnných v lineární regresi a její vlastnosti

Regresní analýza 1. Regresní analýza

Časové řady, typy trendových funkcí a odhady trendů

PRAVDĚPODOBNOST A STATISTIKA

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

Statistická analýza jednorozměrných dat

Technická univerzita v Liberci

Tomáš Karel LS 2012/2013

Prostorová variabilita

6. Lineární regresní modely

4EK211 Základy ekonometrie

PRAVDĚPODOBNOST A STATISTIKA

PROSTOROVÁ STATISTIKA V MATLABU. , Liberci, Liberec

Odhady Parametrů Lineární Regrese

4. Aplikace matematiky v ekonomii

5EN306 Aplikované kvantitativní metody I

EKONOMICKÁ APLIKACE KOMPOZIČNÍHO REGRESNÍHO MODELU

Statistická analýza jednorozměrných dat

Diagnostika regrese pomocí grafu 7krát jinak

1. Číselné posloupnosti - Definice posloupnosti, základní vlastnosti, operace s posloupnostmi, limita posloupnosti, vlastnosti limit posloupností,

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

6. Lineární regresní modely

Spektrofotometrické stanovení pk léčiv

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Regresní a korelační analýza

4EK211 Základy ekonometrie

Aplikovaná statistika v R - cvičení 3

Návrh a vyhodnocení experimentu

Pojem endogenity a exogenity

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

10. Předpovídání - aplikace regresní úlohy

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

4EK211 Základy ekonometrie

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

Lineární a logistická regrese

Matematika pro chemické inženýry

Cvičení 10. Přednášející: Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc.

Ilustrační příklad odhadu LRM v SW Gretl

Intervalová data a výpočet některých statistik

4EK211 Základy ekonometrie

Statistické metody v marketingu. Ing. Michael Rost, Ph.D.

Inovace bakalářského studijního oboru Aplikovaná chemie

Bodové a intervalové odhady parametrů v regresním modelu

4EK211 Základy ekonometrie

KGG/STG Statistika pro geografy

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

CHOVÁNÍ SILOFUNKCÍ TESTŮ V COXOVĚ MODELU PROPORCIONÁLNÍCH RIZIK

Ústav matematiky a statistiky Masarykova univerzita Brno. workshopy Finanční matematika v praxi III Matematické modely a aplikace Podlesí

Kontingenční tabulky, korelační koeficienty

PRAVDĚPODOBNOST A STATISTIKA

Návrh a vyhodnocení experimentu

LINEÁRNÍ REGRESE. Lineární regresní model

7. Analýza rozptylu.

Úvodem Dříve les než stromy 3 Operace s maticemi

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

6. Lineární regresní modely

Zobecněná analýza rozptylu, více faktorů a proměnných

VEKTOROVÉ AUTOREGRESE. APLIKACE V PROGNÓZOVÁNÍ.

Matematika (CŽV Kadaň) aneb Úvod do lineární algebry Matice a soustavy rovnic

4EK211 Základy ekonometrie

5EN306 Aplikované kvantitativní metody I

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Vícerozměrná rozdělení

KGG/STG Statistika pro geografy

Přednáška X. Testování hypotéz o kvantitativních proměnných

7 Regresní modely v analýze přežití

You created this PDF from an application that is not licensed to print to novapdf printer (

Intervaly spolehlivosti

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

Testování předpokladů pro metodu chain-ladder. Seminář z aktuárských věd Petra Španihelová

Transkript:

Analýza prostorově závislých funkcionálních dat V. Římalová, A. Menafoglio, A. Pini, E. Fišerová Robust 2018 25. ledna 2018

Motivace Data a náhled lokace Měsíční měření (březen-říjen 2015 a 2016) 5 chemických ukazatelů 5 lokací (transektů) v okolí obce Křtiny na Brněnsku V transektu se nachází 11 odběrných míst umístěných v přímce za sebou, vzdálenost sousedících OM je 3 metry. Uprostřed ležící odběrné místo, ekoton, rozděluje lokaci na polní a lesní část.

Cíl Ověřit, zda se naměřené hodnoty chemických ukazatelů liší v závislosti na typu půdy a vzdálenosti od ekotonu. V příspěvku prezentujeme výsledky pro ph chlornanu draselného naměřeného v transektu 1 v hloubce 5 cm.

Funkcionální geostatistika Necht (Ω, F, P) je pravděpodobnostní prostor a H je Hilbertův prostor, na němž je definovaný skalární součin.,. indukující normu.. Funkcionální náhodnou proměnnou nazveme měřitelnou funkci X : Ω H Množina {X s, s D R d } je funkcionální náhodné pole. Funkcionální dataset X s1,..., X sn je množinou n pozorování náhodného pole vzhledem k lokacím s 1,..., s n D

Funkcionální geostatistika Necht (Ω, F, P) je pravděpodobnostní prostor a H je Hilbertův prostor, na němž je definovaný skalární součin.,. indukující normu.. Funkcionální náhodnou proměnnou nazveme měřitelnou funkci X : Ω H Množina {X s, s D R d } je funkcionální náhodné pole. Funkcionální dataset X s1,..., X sn je množinou n pozorování náhodného pole vzhledem k lokacím s 1,..., s n D

Funkcionální geostatistika Množina {X s, s D R d } je nestacionární náhodné pole, jehož prvky lze vyjádřit jako X s = m s + δ s. Drift lze modelovat jako m s (t) = Σ L l=0 β l(t)f l (s), s D, t T, β l (t) jsou funkcionální regresní parametry a f l (s) regresory. Necht δ s1,..., δ sn jsou realizace reziduálního procesu {δ s, s D}, který má nulový průměr, stacionaritu druhého řádu a je isotropní [Menafoglio, Secchi 2016]. Empirický semivariogram tohoto reziduálního procesu má tvar ˆγ(h) = 1 2 N(h) Σ (i,j) N(h) δ si δ sj 2, kde N(h) = {(i, j) : s i s j = h} a N(h) je mohutnost této množiny. Empirický variogram je definován jako 2ˆγ(h)

Funkcionální permutační testy pro dvě populace Necht X s (1) i a X s (2) i jsou dva náhodné výběry funkcí, i = 1,..., n g, g = 1, 2 je populační index. Testujeme hypotézu H 0 : X s (1) X s (2) proti alternativě H 1 : X (1) s X (2) s. Testujeme pomocí intervalových permutačních testů pro funkcionální data. Výhody: Umožní identifikovat, v které části definičního oboru dochází k porušení H 0. Neklade žádné předpoklady na rozdělení funkcionálních dat.

Permutační testy testování významnosti regresních parametrů Uvažujme lineární model X s = β 0 (t) + Σ L l=1 β l(t)f l (s) + δ s, t a, b, s D Chceme testovat hypotézu H 0 : β 1 (t) =... = β L (t) = 0, t a, b proti alternativě H 1 : β l (t) 0 pro nějaké l 1,..., L. Předpoklad: zaměnitelnost pozorování X s [Pini & Vantini, 2017].

Model pro data se stejným rozptylem Za předpokladu X s (1) X s (2), uvažujme model X s (t) = β 0 (t) + β 1 (t)d + δ s (t). Prostorové vztahy jsou dány indikátorovou funkcí d = { 0 pro s { 15, 12, 9, 6, 3}, 1 pro s {3, 6, 9, 12, 15}.

Ověření shody rozptylů pomocí permutačních testů H 0 : X (1) X (2) testujeme na reziduích δ s (g), g = 1, 2, z modelu pomocí statistiky T I = 1 I X s (t) = β 0 (t) + β 1 (t)d + δ s (t) I [ var[δ ˆ (1) (t)] var[δ ˆ (2) (t)]] 2 dt, kde I je libovolný podinterval a, b, t a, b a var[δ ˆ (g) (t)], g = 1, 2, značí rozptyl reziduí z 1. nebo 2. populace.

Ověření shody rozptylů pomocí permutačních testů H 0 : X (1) X (2) testujeme na reziduích δ s (g), g = 1, 2, z modelu pomocí statistiky T I = 1 I X s (t) = β 0 (t) + β 1 (t)d + δ s (t) I [ var[δ ˆ (1) (t)] var[δ ˆ (2) (t)]] 2 dt, kde I je libovolný podinterval a, b, t a, b a var[δ ˆ (g) (t)], g = 1, 2, značí rozptyl reziduí z 1. nebo 2. populace.

Model pro data s různým rozptylem Není-li splněn předpoklad X s (1) X s (2) a funkcionální pozorování mají různý rozptyl v závislosti na typu půdy, lze použít model X s (g) (t) = β 0 (t) + β 1 (t)d + δ s (g) (t), g = 1, 2. δ s (g) (t) = σ (g) δ s (t) Prostorové vztahy modelujeme indikátorovou funkcí { 0 pro s { 15, 12, 9, 6, 3}, d = 1 pro s {3, 6, 9, 12, 15} Rozptyly σ (g) odhadneme z parciálních modelů X (g) s (t) = β (g) (t) + δ(g) s (t), g = 1, 2. 0

Testování významnosti regresních parametrů V modelu X s (g) (t) = β 0 (t) + β 1 (t)d + δ s (g) (t), g = 1, 2, testujeme hypotézu H 0 : β 1 (t) = 0 t a, b proti alternativě H 1 : β 1 0 pomocí testové statistiky [ ] T 0 = [C ˆβ(t)] (CZ WZC ) 1 [C ˆβ(t)] dt, kde W je matice vah, Z designová matice a vektor C = (0, 1). Permutační schéma: (g) 1 Redukovaný model ˆX s (t) = ˆβ 0 (t) 2 Vydělit ˆδ s (g) (t) příslušným rozptylem a získaná ˆδ s (t) permutovat Xs (t) = ˆβ 0 (t) + ˆσ (g)ˆδ s(t). 3 Z Xs (t) odhadnout parametry původního modelu a vypočítat testovou statistiku. 4 p-hodnota permutačního testu je vypočtena jako poměr permutací vedoucích k vyšší hodnotě testové statistiky, než byla ta z původních dat, k celkovému počtu permutací.

Závěr Návrh modelů pro nekorelovaná funkcionální data se stejnými a různými rozptyly. Test pro 2 populace na reziduích prostorového lineárního modelu s funkcionální závisle proměnnou. Testování významnosti parametrů funkcionální regrese s využitím permutačních testů. A co dál? Intervalový test významnosti regresních parametrů. Model pro v prostoru korelovaná data.

Literatura J.O. Ramsay, B.W. Silverman (2005): Functional Data Analysis. Springer, New York. A. Menafoglio, P. Secchi (2016): Statistical analysis of complex and spatially dependent data: a review of Object Oriented Spatial Statistics, European Journal of Operational Research, 258(2), pages 401 410. A. Pini & S. Vantini (2017): Interval-wise testing for functional data, Journal of Nonparametric Statistics, DOI: 10.1080/10485252.2017.1306627 Abramowicz, K.; Häger, C.; Pini, A.; Schelin, L.; Sjöstedt de Luna, S.; Vantini, S.: Nonparametric inference for functional-on-scalar linear models applied to knee kinematic hop data after injury of the anterior cruciate ligament, MOX technical report 30/2016, Politecnico di Milano