Šárka Došlá. Matematicko-fyzikální fakulta Univerzita Karlova v Praze. Bimodální rozdělení. Šárka Došlá. Motivace. Základní pojmy

Podobné dokumenty
IDENTIFIKACE BIMODALITY V DATECH

Informa ní Bulletin Základní údaje o společnosti. Uplynulý rok byl prvním rokem dvouletého

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

Výběrové charakteristiky a jejich rozdělení

Pravděpodobnost a aplikovaná statistika

PŘEDNÁŠKA 2 POSLOUPNOSTI

Téma 22. Ondřej Nývlt

1 Posloupnosti a řady.

IX. Vyšetřování průběhu funkce

Chyby měření 210DPSM

Limitní věty teorie pravděpodobnosti. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

VII. Limita a spojitost funkce

IV. Základní pojmy matematické analýzy IV.1. Rozšíření množiny reálných čísel

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

Pravděpodobnost a statistika I KMA/K413

Inovace bakalářského studijního oboru Aplikovaná chemie

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

PRAVDĚPODOBNOST A STATISTIKA. Odhady parametrů Postačující statistiky

KGG/STG Statistika pro geografy

KMA/P506 Pravděpodobnost a statistika KMA/P507 Statistika na PC

Rozdělení náhodné veličiny. Distribuční funkce. Vlastnosti distribuční funkce

Mgr. Rudolf Blažek, Ph.D. prof. RNDr. Roman Kotecký Dr.Sc.

Komplexní analýza. Holomorfní funkce. Martin Bohata. Katedra matematiky FEL ČVUT v Praze

Náhodné (statistické) chyby přímých měření

To je samozřejmě základní pojem konvergence, ale v mnoha případech je příliš obecný a nestačí na dokazování některých užitečných tvrzení.

7. Rozdělení pravděpodobnosti ve statistice

3. Přednáška: Line search

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

Intervalové Odhady Parametrů

Kapitola 1: Reálné funkce 1/13

Definice 1.1. Nechť je M množina. Funkci ρ : M M R nazveme metrikou, jestliže má následující vlastnosti:

5. Náhodná veličina. 2. Házíme hrací kostkou dokud nepadne šestka. Náhodná veličina nabývá hodnot z posloupnosti {1, 2, 3,...}.

Definice spojité náhodné veličiny zjednodušená verze

Kapitola 1. Úvod. 1.1 Značení. 1.2 Výroky - opakování. N... přirozená čísla (1, 2, 3,...). Q... racionální čísla ( p, kde p Z a q N) R...

Pravděpodobnost a statistika

1 Množiny, výroky a číselné obory

MATEMATIKA III V PŘÍKLADECH

Text může být postupně upravován a doplňován. Datum poslední úpravy najdete u odkazu na stažení souboru. Veronika Sobotíková

Spojitost a limita funkce

Definice derivace v bodě

PRAVDĚPODOBNOST A STATISTIKA

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN

Přednáška. Další rozdělení SNP. Limitní věty. Speciální typy rozdělení. Další rozdělení SNP Limitní věty Speciální typy rozdělení

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Příklady: - počet členů dané domácnosti - počet zákazníků ve frontě - počet pokusů do padnutí čísla šest - životnost televizoru - věk člověka

Generování pseudonáhodných. Ing. Michal Dorda, Ph.D.

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Kapitola 1: Reálné funkce 1/20

Někdy lze výsledek pokusu popsat jediným číslem, které označíme X (nebo jiným velkým písmenem). Hodíme dvěma kostkami jaký padl součet?

Požadavky k ústní části zkoušky Matematická analýza 1 ZS 2014/15

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

pravděpodobnosti, popisné statistiky

I. D i s k r é t n í r o z d ě l e n í

Matematika III. 4. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Univerzita Karlova v Praze procesy II. Zuzana. funkce

KMA/P506 Pravděpodobnost a statistika KMA/P507 Statistika na PC

p(x) = P (X = x), x R,

STANOVENÍ SPOLEHLIVOSTI GEOTECHNICKÝCH KONSTRUKCÍ. J. Pruška, T. Parák

Derivace a monotónnost funkce

Intervalové Odhady Parametrů II Testování Hypotéz

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Matematicko-fyzikální fakulta Univerzity Karlovy

Fyzikální korespondenční seminář MFF UK

2. FUNKCE JEDNÉ PROMĚNNÉ

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

3 Bodové odhady a jejich vlastnosti

Omezenost funkce. Definice. (shora, zdola) omezená na množině M D(f ) tuto vlastnost. nazývá se (shora, zdola) omezená tuto vlastnost má množina

Matematika 2 Průběh funkce

Náhodné chyby přímých měření

Použití derivací L HOSPITALOVO PRAVIDLO POČÍTÁNÍ LIMIT. Monotónie. Konvexita. V této části budou uvedena některá použití derivací.

Použití derivací. V této části budou uvedena některá použití derivací. LEKCE08-PRU. Použití derivací. l Hospital

STATISTICKÉ ODHADY Odhady populačních charakteristik

LDF MENDELU. Simona Fišnarová (MENDELU) Průběh funkce ZVMT lesnictví 1 / 21

Matematika I A ukázkový test 1 pro 2014/2015

Kapitola 1: Reálné funkce 1/13

Matematika I. Funkce jedné proměnné. Funkce jedné proměnné Matematika I 1 / 212

Statistická teorie učení

prof. RNDr. Roman Kotecký DrSc., Dr. Rudolf Blažek, PhD Pravděpodobnost a statistika Katedra teoretické informatiky Fakulta informačních technologií

LWS při heteroskedasticitě

DRN: Kořeny funkce numericky

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

KGG/STG Statistika pro geografy

8. Normální rozdělení

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Jan Kracík

MATEMATICKÁ STATISTIKA

Literatura: O. Zindulka: Matematika 3 (kapitola 4, kapitola 5)

Charakterizace rozdělení

Spojitost funkce. Spojitost je nejdůležitější obecná vlastnost funkcí. Umožňuje aproximace různých řešení.

Matematická analýza pro informatiky I. Derivace funkce

Charakterizují kvantitativně vlastnosti předmětů a jevů.

terminologie předchozí kapitoly: (ϕ, Ω) - plocha, S - geometrický obraz plochy

Základy počtu pravděpodobnosti a metod matematické statistiky

2. LIMITA A SPOJITOST FUNKCE

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení

Transkript:

Matematicko-fyzikální fakulta Univerzita Karlova v Praze 1/20

Joiner (1975): Histogram výšky studentů, který ilustruje bimodalitu lidské výšky. Schilling a kol. (2002): Ve skutečnosti bylo dané unimodální! 2/20 Výběr pochází z unimodálního nepřesnost. Výběr pochází ze směsi dvou unimodálních bimodalitu očekáváme. Dvouvrcholový histogram možný chybný závěr o bimodálitě.

Cíl a přínos práce Zformulováno kritérium pro bimodalitu směsi dvou unimodálních, aplikace ve. Zkoumána bimodalita histogramů výběrů z unimodálního a pravděpodobnost takového jevu. 3/20

Obsah 1 2 3 4/20

Obsah 1 2 3 5/20

Definice unimodality a 6/20 Definice Řekneme, že s hustotou f vzhledem k Lebesgueově míře je unimodální, existuje-li M R takové, že je hustota f neklesající na intervalu (, M) a nerostoucí na (M, ). Hustotu f v těchto nazveme unimodální, bod M je vrchol tohoto. Definice Řekneme, že se spojitou hustotou f (vzhledem k Lebesgueově míře) je bimodální, jestliže existují body x 1 < x 2 < x 3 takové, že 1. na intervalu (, x 1 ) je hustota f neklesající, na intervalu (x 1, x 2 ) je nerostoucí, na (x 2, x 3 ) je neklesající a na (x 3, ) je opět nerostoucí; 2. f (x 1 ) > f (x 2 ) a f (x 2 ) < f (x 3 ). V takovém případě nazveme f bimodální hustotou.

Definice směsi dvou Definice Necht náhodná veličina X nabývá hodnot z výběrového prostoru X a její má hustotu f vzhledem k σ-konečné míře µ a f (x) = pf 1 (x) + (1 p)f 2 (x), x X, kde p [0, 1] a f 1 a f 2 jsou hustoty na prostoru X vzhledem k míře µ. Pak řekneme, že je veličiny X směsí dvou a hustota f je směsí hustot f 1, f 2. Parametr p [0, 1] se nazývá váha směsi. 7/20

Obsah 1 2 3 8/20

Kritéria pro unimodalitu směsi dvou 9/20 Směs dvou normálních úplná klasifikace modality již známa - Robertson, Fryer (1969) Směs dvou obecných unimodálních nutné a postačující podmínky pro unimodalitu - Kemperman (1991). Směs dvou unimodálních hustot, která není unimodální, nemusí být bimodální. 0.00 0.05 0.10 0.15 0.20 g(x) = 1 2 g 1(x) + 1 2 g 2(x) 5 0 5 10 x g 1(x) g 2(x) g(x)

Tvrzení o bimodalitě směsi Kritérium pro bimodalitu směsi dvou unimodálních. Lemma Necht f 1, f 2 jsou unimodální hustoty, f 1 má jediný vrchol v bodě M 1 a f 2 má jediný vrchol v bodě m 2, kde M 1 < m 2. Necht jsou f 1 i f 2 spojité a diferencovatelné na nějakém otevřeném intervalu I, [M 1, m 2 ] I. Necht je funkce φ(x) = f 1 (x) f 2 (x) spojitá na intervalu (M 1, m 2 ) a lim x M1 + φ(x) = 0 a lim x m2 φ(x) =. Dále necht existují body M 1 < x 1 < x 2 < m 2 takové, že je funkce φ rostoucí na intervalu (M 1, x 1 ), klesající na (x 1, x 2 ) a opět rostoucí na (x 2, m 2 ). Pak je směs g = pf 1 + (1 p)f 2 bimodální právě tehdy, když je p (p 1, p 2 ), kde 1 p i = 1 + φ(x i ), i = 1, 2. 10/20

Kritéria odvozena pro následující Kritéria pro bimodalitu směsi dvou byla odvozena pro následující : Cauchyho Studentovo Logistické Laplaceovo Gama, χ 2 Logaritmicko-normální Rayleighovo Maxwellovo Gumbelovo ( extrémních hodnot) 11/20

Cauchyho Necht je f 1 hustota Cauchyho C(a 1, b) a f 2 je hustota C(a 2, b), tj. f 1 (x) = 1 b π b 2 + (x a 1 ) 2, f 2(x) = 1 b π b 2 + (x a 2 ) 2, x R. Směs těchto dvou Cauchyho C(a 1, b) a C(a 2, b) s váhou p [0, 1] je bimodální právě tehdy, když je a zároveň p (p 1, p 2 ), kde a 1 a 2 > 2 3 b 1 = 1 + x i[1 + (x i c) 2 ] 2 p i (c x i )(1 + x 2 a c = a1 a2 b a 0 < x 1 < x 2 < c jsou níže uvedeného tvaru. Jinak je tato směs unimodální. x 1 = 1 c 4 + c 2 2 4 4 + c 2, x 2 = 1 c + 4 + c 3 2 2 4 4 + c 2. 3 i ) 2 12/20

Cauchyho II 0.0 0.2 0.4 0.6 0.8 1.0 p 2 p 1 0.05 0.10 0.15 0.20 0.25 0.30 c 2 4 6 8 10 1 0 1 2 Závislost hodnot p 1 a p 2 na hodnotě c = a 1 a 2 b. Směs dvou Cauchyho C(0, 1) a C(c, 1) pro c = 2 3 s váhou p = 1 2. 13/20

Obsah 1 2 3 14/20

Omezení na prostřední třídy histogramu Často jsou četnosti několika prostředních tříd histogramu výrazně vyšší než četnosti zbývajících tříd. Při modality histogramu si budeme všímat pouze vrcholů v prostředních třídách. 15/20 Proto se dále omezíme na zkoumání pouze několika prostředních tříd histogramů.

Rozdělení s tupým vrcholem Rozdělení s dostatečně tupým vrcholem v okolí vrcholu přibližně rovnoměrné. Omezili jsme se na zkoumání několika prostředních tříd histogramu stačí nám dívat se pouze na okolí vrcholu. 0.05 0.10 0.15 0.20 0.25 0.30 2 1 0 1 2 3 4 16/20 Zjednodušení: Odhad pravděpodobnosti, s jakou je histogram výběru z rovnoměrného s N třídami bimodální.

Odhad pro rovnoměrné Věta Necht je X 1,..., X M náhodný výběr z rovnoměrného na intervalu [a, b], a, b R, a necht N N. Potom pro M se pravděpodobnost, že je histogram tohoto náhodného výběru s N třídami bimodální, blíží k pravděpodobnosti, že je náhodná permutace čísel 1,..., N bimodální. Algoritmy pro zjišt ování zadané posloupnosti. Generování všech permutací čísel 1,..., N a zjišt ování. Simulace výběrů z rovnoměrného a zjišt ování histogramů. 17/20

Závěr 18/20 Četnosti bimodálních permutací N 4 5 6 7 8 počet všech permutací 24 120 720 5040 40320 počet bimodálních permutací 16 88 416 1824 7680 podíl bimodálních permutací 0.6667 0.7333 0.5778 0.3619 0.1905 Pro N = 5 je relativní četnost bimodálních permutací 0.73 pravděpodobnost, že bude histogram výběru z rovnoměrného s 5 třídami bimodální je téměř 3 4 Pravděpodobnost, že prostředních 5 tříd histogramu z s tupým vrcholem indikuje dva vrcholy, je dosti vysoká. Posuzování na základě histogramu není vhodné. Použití odvozených kritérií pro bimodalitu. Program R: dip test pro testování unimodality náhodného výběru.

Děkuji za pozornost. 19/20

Kemperman J. H. B. (1991): Mixture with a limited number of modal intervals. Annal. Stat. 19, 2120 2144. Joiner B. L. (1975): Living Histograms. Int. Stat. Rev. 43, 339 340. Robertson C. A., Fryer J. G. (1969): Some descriptive properties of normal mixtures. Skand. Aktuarietidskr. 52, 137 146. Schilling M. F., Watkins A. E., Watkins W. (2002): Is human height bimodal? Amer. Statist. 56, 223 229. 20/20