Modelování heterogenity ročních příjmů českých domácností Modeling Heterogeinity in the Czech Household Incomes

Rozměr: px
Začít zobrazení ze stránky:

Download "Modelování heterogenity ročních příjmů českých domácností Modeling Heterogeinity in the Czech Household Incomes"

Transkript

1 Modelování heterogenity ročních přímů českých domácností Modeling Heterogeinity in the Czech Household Incomes Marie Forbelská Abstract: The distribution of income in most populations is heterogeneous, with several modes and highly skewed, with a long right-hand-side tail and high density at the lower percentiles. Mixture-model-based clustering has become a popular approach of modeling heterogeinity for its statistical properties and the implementation simplicity of the EM algorithm. We focused on the partitions of household incomes into homogeneous subgroups via mixture models. Key words: Household income, Finite mixture models, EM algorithm, Generalized lambda distribution. Úvod Analýza rozdělení přímů domácností e důležitým ukazatelem pro posuzování životní úrovně obyvatelstva. Příspěvek e zaměřen na stochastické modelování heterogenity ročních přímů domácností pomocí konečných směsí. Podrobně sou popsány postupy při vytváření stochastických modelů s využitím normálních směsí pro logaritmy ročních přímů domácností. Pozornost e také věnována inému typu směsí, a to GLD směsím, kde GLD značí zobecněné lambda rozdělení. Na závěr e zmíněn mnohem obecněší přístup založený na GLM modelech.. Modely konečných směsí Roční přímy domácností maí rozdělení, které e silně zešikmené a e vícemodální, ak e názorně vidět z obrázků a, b, c, kde sou vykresleny ádrové odhady hustot dané vzorcem n x xi f ˆ n( x) = K nh i= h, kde x,...,x n sou pozorování, K e tzv. ádro, h e vyhlazovací parametr (více lze naít například v monografii Silverman, 978, [], popř. v práci Horová, Zelinka, 000, []). Obrázek a: Jádrový odhad hustoty ročních přímů českých domácností v roce 005 (zdro: EU SILC 005)

2 Obrázek b: Jádrový odhad hustoty ročních přímů českých domácností v roce 006 (zdro: EU SILC 006) Obrázek c: Jádrový odhad hustoty ročních přímů českých domácností v roce 007 (zdro: EU SILC 007) Za těchto okolností se přímo nabízí modelovat rozdělení ročních přímů domácností pomocí konečných směsí. Jestliže náhodná veličina X má hustotu tvaru kde π f ( x) = π f ( x) + + π k fk ( x), 0, =,, k, π + + π = > k a f (x) sou hustoty, pak řekneme, že hustota náhodné veličiny X e konečnou směsí k hustot. Pravděpodobnosti π ( =,, k) se nazývaí váhy směsí (proporce směsí nebo apriorní pravděpodobnosti). Více lze naít v monografii McLachlan and Peel (000, viz [7]). Abychom mohli rozčlenit směs f x; Ψ) = π f ( x; θ ) + + π f ( x; θ ), kde ( k k k Ψ = ( π,, π k, θ,, θk ) sou neznámé parametry, e třeba neprve určit typ rozdělení a následně odhadnout vektor neznámých parametrů Ψ. Standardní metodou odhadu neznámých parametrů na základě náhodného výběru x,...,x n e tzv. EM algoritmus (Dempster et al., 977, viz []), který ve dvou krocích, E a M, nabízí maximálně věrohodné odhady. Klasifikace, t. určení příslušnosti edince či obektu charakterizovaného veličinou x k edné z konečného počtu tříd, se děe pomocí aposteriorních pravděpodobností π f ( xi; θ ) ω ( xi) =, f ( x ; Ψ) a to tak, že edinec či obekt e přiřazen do té třídy, pro kterou e aposteriorní pravděpodobnost maximální. i

3 S ohledem na tvar rozdělení ročních přímů domácností lze postupovat dvoím způsobem a) buď modelovat hustotu přímů ako směs logaritmicko normálních rozdělení b) nebo hustotu logaritmu přímů modelovat ako směs normálních rozdělení, neboť náhodná veličina X má logaritmicko normální rozdělení LN ( µ, σ ) s hustotou tvaru ( log( x) µ ) f ( x) = exp > 0,, > 0 x µ R σ, x πσ σ pokud náhodná veličina Y = log(x ) má normální rozdělení N ( µ, σ ). Pro modelování ročních přímů domácností e výhodněší zvolit postup b). V dalším tedy budeme pracovat už en s logaritmy ročních přímů domácností. Obecně, estliže chceme použít konečné směsi hustot, musíme neprve určit parametr k počtu komponent. Pro tento účel e opět výhodné využít ádrové odhady hustot. Obrázek a: Jádrový odhad hustoty logaritmů ročních přímů českých domácností v roce 005 (zdro: EU SILC 005) Obrázek b: Jádrový odhad hustoty logaritmů ročních přímů českých domácností v roce 006 (zdro: EU SILC 006) Obrázek c: Jádrový odhad hustoty logaritmů ročních přímů českých domácností v roce 007 (zdro: EU SILC 007)

4 Ze tvarů odhadnutých hustot e zřemé, že směs bude obsahovat neméně tři komponenty. Výpočet provedeme pomocí EM algoritmu. Grafické znázornění výsledků e na obrázcích a, b, c a konkrétní maximálně věrohodné odhady vektoru neznámých parametrů Ψ ˆ MLE = ( ˆ π ˆ θˆ sou pro k= uvedeny v tabulce č.. ( ˆ π,, ˆ π, ˆ µ,, ˆ µ, ˆ σ,, σ ),, ˆ π ˆ k, θ,, k ) = k k k Obrázek a: Výsledky EM algoritmu pro - složkovou směs logaritmů ročních přímů českých domácností v roce 005(zdro: EU SILC 005). Zelená přerušovaná čára značí ádrový odhad hustoty. Obrázek b: Výsledky EM algoritmu pro - složkovou směs logaritmů ročních přímů českých domácností v roce 006(zdro: EU SILC 006). Zelená přerušovaná čára značí ádrový odhad hustoty. Obrázek c: Výsledky EM algoritmu pro - složkovou směs logaritmů ročních přímů českých domácností v roce 007(zdro: EU SILC 007). Zelená přerušovaná čára značí ádrový odhad hustoty.

5 Tabulka : Výsledné maximálně věrohodné odhady parametrů ve složkové směsi logaritmů ročních přímů českých domácností (zdro: EU SILC 005, 006, 007). Rok Komponenta Proporce π Střední hodnota μ Rozptyl σ Není bez zaímavosti, že ve všech třech případech edna komponenta, eíž podíl e kolem edné třetiny, má vysokou variabilitu a v podstatě pokrývá všechny hodnoty logaritmů ročních přímů domácností. Tuto skupinu domácností lze také interpretovat ako nerozlišitelnou z hlediska výšky ročních přímů. Podíl takto nerozlišitelných domácností e příliš vysoký. Navíc z obrázků a, b a c e zřemé, že pouze komponenty k modelování logaritmů ročních přímů českých domácností v letech 005, 006 a 007 nesou postačuící. Chceme-li naít něaký optimální počet složek směsi, nabízí se velmi ednoduchý postup. Provedeme rozčlenění směsi postupně pro ednotlivá k a vybereme takové, které maximalizue logaritmus sdružené hustoty. Ovšem tento postup nevede k cíli, neboť s přidáním každé další složky se hodnota logaritmu sdružené hustoty neustále zvyšue. Proto se pro výběr optimálního počtu komponent používaí různá penalizovaná kritéria, například BIC kritérium (Bayesian Information Criterion) BIC = log(maximized likelihood) m log(n), kde m e počet neznámých parametrů (v našem případě m=k-) a n e počet pozorování (více např. Schwarz,978, viz [0]), popř. McLachlan and Peel, 000, viz [7]). Obrázek. Hodnoty BIC kritéria pro logaritmy ročních přímů v letech 005, 006, 007.

6 Na obrázku sou znázorněny hodnoty BIC kritéria pro různé volby parametru k (k=,...,9). Funkce Mclust z balíku mclust programovacího azyka R (viz [] a [9]) navrhue volbu k=6 pro všechny roky. Grafické výsledky sou opět prezentovány na obrázcích 5a, 5b, 5c a maximálně věrohodné odhady Ψˆ MLE vektoru neznámých parametrů Ψ pro k=6 sou uvedeny v tabulce č.. Obrázek 5a: Výsledky EM algoritmu pro 6ti - složkovou směs logaritmů ročních přímů českých domácností v roce 005 (zdro: EU SILC 005). Zelená přerušovaná čára značí ádrový odhad hustoty. Obrázek 5b: Výsledky EM algoritmu pro 6ti - složkovou směs logaritmů ročních přímů českých domácností v roce 006 (zdro: EU SILC 006). Zelená přerušovaná čára značí ádrový odhad hustoty. Obrázek 5c: Výsledky EM algoritmu pro 6ti - složkovou směs logaritmů ročních přímů českých domácností v roce 007 (zdro: EU SILC 007). Zelená přerušovaná čára značí ádrový odhad hustoty.

7 Tabulka : Maximálně věrohodné odhady parametrů v 6ti složkové směsi logaritmů ročních přímů českých domácností (zdro: EU SILC 005, 006, 007). Rok Komponenta Proporce π Střední hodnota μ Rozptyl σ Podíváme-li se podrobněi na obrázky 5a, 5b, 5c a tabulku č., vidíme, že opět existue složka, eíž variabilita e výrazně větší. Tentokrát však tyto nerozlišitelné složky tvoří 5ti až 0ti procentní podíl. I když 6ti-složková směs věrně popisue celkové rozdělení logaritmů přímů domácnosti, z hlediska interpretace není příliš vhodná. Vraťme se proto znovu k obrázku č. s hodnotami BIC kritéria pro ednotlivá k. Vidíme, že pro roky 005 a 006 stačí uvažovat pouze směs se komponentami. Grafické výsledky EM algoritmu pro tyto dva roky sou znázorněny na obrázcích 6a a 6b, maximálně věrohodné odhady Ψˆ MLE vektoru neznámých parametrů Ψ sou uvedeny v tabulce č.. Pro dokreslení sou uvedeny i výsledky roku 007 (na obrázku 6c a odhady parametrů v tabulce č. ), i když z hlediska BIC kritéria se směs se komponentami eví ako výrazně horší. Obrázek 6a: Výsledky EM algoritmu pro - složkovou směs logaritmů ročních přímů českých domácností v roce 005 (zdro: EU SILC 005). Zelená přerušovaná čára značí ádrový odhad hustoty.

8 Obrázek 6b: Výsledky EM algoritmu pro - složkovou směs logaritmů ročních přímů českých domácností v roce 006 (zdro: EU SILC 006). Zelená přerušovaná čára značí ádrový odhad hustoty. Obrázek 6c: Výsledky EM algoritmu pro - složkovou směs logaritmů ročních přímů českých domácností v roce 007 (zdro: EU SILC 007). Zelená přerušovaná čára značí ádrový odhad hustoty. Tabulka : Maximálně věrohodné odhady parametrů ve - složkové směsi logaritmů ročních přímů českých domácností (zdro: EU SILC 005, 006, 007). Rok Komponenta Proporce π Střední hodnota μ Rozptyl σ Modelueme-li logaritmy ročních přímů pomocí komponent, opět v roce 005 a 006 dostaneme složku, která má vysokou variabilitu a eví se z pohledu logaritmů ročních přímů ako nerozlišitelná a tvoří opět dosti vysoký podíl (7 a 9 procent). V roce 007 tuto složku nenalezneme, což e ovšem na úkor modelování nenižší přímové skupiny.

9 Chceme-li modelovat heterogenitu ročních přímů domácností, nesme odkázáni pouze na logaritmicko normální či normální rozdělení, ale existue celá řada dalších systémů, které dokáží velmi efektivně modelovat rozdělení podobného typu. Jako příklad můžeme uvést Pearsonův či Johnsonův systém křivek. Nevýhodou těchto systémů e ovšem nesnadná interpretace výsledných křivek. V posledních desetiletích se začal využívat další systém rozdělení, a to systém založený na tzv. zobecněném lambda rozdělení (GLD rozdělení), který se prosadil mimo iné také díky snadné interpretaci parametrů a možnosti efektivně generovat pseudonáhodná čísla při Monte Carlo studiích. GLD rozdělení e zobecněním Tukeova symetrického lambda rozdělení definovaného pomocí kvantilové funkce takto Kvantilová funkce e definovaná vztahem kde F (x) e distribuční funkce. u ( u ) 0 Q ( u; ) = pro 0 u. log( u) = 0 u { x R : F( x u} Q( u) = inf ), a) rovnoměrné rozdělení b) přibližně Cauchyovo rozdělení c) přibližně normální rozdělení Obrázek 7: Ukázky Tukeova symetrického lambda rozdělení při různé volbě parametru. Zobecněné lambda rozdělení (GLD rozdělení) e pak definováno pomocí čtyř parametrů, přičemž se používá dvoí parametrizace Ramberg and Schmeiser (97, viz [9]) RS GLD rozdělení Freimer, Mudholkar, Kollia, Lin (988, viz []) FMKL GLD rozdělení RS GLD rozdělení e definováno pomocí kvantilové funkce takto u ( u ) Q( u;,,, ) = + pro 0 u.

10 Pokud chceme explicitně vyádřit hustotu RS GLD rozdělení, použieme vzorec f ( Q( u) ) =. Q'( u) Pak hustota má pak tvar f ( ) = RS GLD x, u + ( u) kde Obrázek 8: Ukázky RS GLD rozdělení se stenými momenty. e parametr polohy a platí R, e parametr měřítka, > 0, sou parametry tvaru a eich parametrický prostor e tvořen 6 oblastmi, S S 5 6 = = (, ) (, ) S S S = = = {(, ):, } {(, ):, } {(, ): 0, 0} {(, ): 0, 0} S = ( ) : < 0, >, ( ) ( ) : >, < 0, ( ) ( ) ( ) < < Aby se zednodušil parametrický prostor pro a byla navržena iná parametrizace a FMKL GLD rozdělení e pomocí kvantilové funkce definováno takto u ( u) Q ( u; = +,,, ) pro 0 u, > 0.. Obrázek 9: Ukázky FMKL GLD rozdělení Pokud = 0, pak výraz u e nahrazen výrazem log(u ), obdobně pokud = 0, pak ( u) e nahrazeno log( u).

11 Na příkladu ročních přímů domácností důchodců bez ekonomicky aktivních členů budeme (s využitím balíčku GLDEX v programovacích prostředí R, viz []) demonstrovat modelování dvousložkové FMKL GLD směsi pomocí EM algoritmu neprve pro původní data a taká pro logaritmovaná data, viz obrázky 0a, 0b, 0c a a, b, c. Obrázek 0a: Výsledky EM algoritmu pro - složkovou FMKL GLD směs ročních přímů domácností důchodců bez ekonomicky aktivních členů v roce 005 (zdro: EU SILC 005) Obrázek 0b: Výsledky EM algoritmu pro - složkovou FMKL GLD směs ročních přímů domácností důchodců bez ekonomicky aktivních členů v roce 006 (zdro: EU SILC 006) Obrázek 0c: Výsledky EM algoritmu pro - složkovou FMKL GLD směs ročních přímů domácností důchodců bez ekonomicky aktivních členů v roce 007 (zdro: EU SILC 007)

12 Obrázek a: Výsledky EM algoritmu pro - složkovou FMKL GLD směs logaritmů ročních přímů domácností důchodců bez ekonomicky aktivních členů v roce 005 (zdro: EU SILC 005) Obrázek b: Výsledky EM algoritmu pro - složkovou FMKL GLD směs logaritmů ročních přímů domácností důchodců bez ekonomicky aktivních členů v roce 006 (zdro: EU SILC 006) Obrázek c: Výsledky EM algoritmu pro - složkovou FMKL GLD směs logaritmů ročních přímů domácností důchodců bez ekonomicky aktivních členů v roce 007 (zdro: EU SILC 007) Roční přímy domácností důchodců bez ekonomicky aktivních členů sou asnou směsí dvou skupin, a to skupiny, kde hlavou domácností e žena a skupiny, kde hlavou domácností e muž (rozlišení hodnot e provedeno modrou a zelenou barvou). Z hlediska grafické interpretace výsledků e výhodněší modelovat logaritmy ročních přímů domácností.

13 Na závěr se en velmi krátce zmiňme o možnosti modelovat roční přímy domácností pomocí konečných směsí regresních GLM modelů. Tento přístup však předpokládá hluboké znalosti vnitřní struktury modelu, neboť nepopisue rozdělení ročních přímů osamoceně, ale s ohledem na další, například sociální, demografické či geografické charakteristiky domácností. Směsi GLM modelů předpokládaí, že podmíněné hustoty f,, f sou exponenciálního typu, t. lze e napsat ve tvaru { a( y) b( θ ) + c( ) d( )} k f ( y; θ ) = exp θ y, kde a ( ), b ( ), c ( ) a d ( ) sou známé funkce + θ ( x,, x m a parametr θ = ) závisí na něakých regresorech x,, x. m neznámé pravděpodobnosti π,,π opět záviseí na obecně iných regresorech k u,,u p, t. π = π ( u,, u p ). V této GLM směsi se pomocí ryze monotonních linkovacích funkcí g a g modeluí podmíněné střední hodnoty a pravděpodobnosti,, xm ) g ( β x + β x ) µ ( x = +,, u p ) g m m ( α u + α u ) π ( u = +, kde linkovací funkcí g může být π logit linkovací funkce: g = log, π probit linkovací funkce: g = Φ ( π ), kde Φ značí kvantilovou funkci N (0,), log-log linkovací funkce: g = log( log( π )), komplementární log-log linkovací funkce: g = log( log( )). π Připomeňme, že mezi rozdělení exponenciálního typu patří ze spoitých například normální a gama rozdělení, z diskrétních například alternativní, binomické, Poissonovo, negativně binomické rozdělení. Více podrobností o GLM modelech lze naít např. v práci McCullagh a Nelder (99, viz [6]), a regresní směsi GLM modelů sou podrobně popsané v monografii McLachlan a Peel (000, viz [7]).. Závěr Shrneme-li předchozí úvahy, e vidět, že pomocí EM algoritmu dokážeme díky vhodně zvolenému modelu konečných směsí provádět bayesovskou klasifikaci, a to na základě aposteriorních pravděpodobností. Následně e pak možné vypracovat podrobnou analýzu struktury ednotlivých komponent směsi, a to ak z hlediska sociálního složení domácností, tak i demografického či geografického. Konečné směsi sou tedy vhodným stochastickým nástroem pro provádění tzv. klasifikace bez učitele, někdy se také mluví o stochastické klastrové analýze (stochastic cluster analysis, popř. mixture-model-based clustering). p p

14 . Literatura [] DEMPSTER, A. P., LAIRD, N. M. RUBIN, D. B.: Likelihood from Incomplete Data via the EM Algorithm. In Journal of the Royal Statistical Society. Series B (Methodological) 9 (), pp. 8, 977. [] FRALEY, C., RAFTERY, A. E.: MCLUST: Normal Mixture Modeling and Model- Based Clustering. R package version.0-0; 006. [] FREIMER, M., MUDHOLKAR, G.S, KOLLIA, G, LIN, C.T. A study of the generalized Tukey lambda family. In Communications in Statistics Theory and Methods, 7, pp , 988. [] HOROVÁ, I., ZELINKA, J. Contribution to the bandwidth choice for kernel density estimates. In Computational Statistics, Springer,,, pp. -7, 007. [5] JOHNSON, N. L., KOTZ, S, BALAKRISHAN, N.: Continuous univariate distributions, Vol., nd edition.new York: Wiley & Sons, 99. [6] MCCULLAGH, P., NELDER, J.A.: Generalized Linear Models. Chapman and Hall, London 99. [7] MCLACHLAN, G. J., PEEL, D.: Finite mixture models. New York: Wiley & Sons, 000. [8] R Development Core Team: R: A language and environment for statistical computing. R. Foundation for Statistical Computing, Vienna, Austria URL [9] RAMBERG, J.S, SCHMEISER, B.W. : An approximate method for generating asymmetric random variables, In Communications of the Associaion for Computing Machinery, 7, pp. 78-8, 97. [0] SCHWARTZ, G.: Estimating the Dimension of a Model. In The Annals of Statistics, 6 (), pp. 6-6, 978. [] SILVERMAN, B. W.: Density Estimation for Statistics and Data Analysis. Chapman and Hall, New York, 986. [] SU, S.: GLDEX: Fitting Single and Mixture of Generalized Lambda Distributions (RS and FMKL) Using Discretized and Maximum Likelihood Methods. R package version.0.., 007. Kontakt: Marie Forbelská, RNDr., PhD. Ústav matematiky a statistiky, Přírodovědecká fakulta Masarykovy univerzity Kotlářská 6 7 Brno Česká republika forbel@math.muni.cz

Pravděpodobnostní model rozdělení příjmů v České republice

Pravděpodobnostní model rozdělení příjmů v České republice Jitka Bartošová Pravděpodobnostní model rozdělení příjmů v České republice # Jitka Bartošová * Úvod Zkoumání rozdělení příjmů a jeho porovnávání z různých sociálně-ekonomických a časově-prostorových hledisek

Více

ROBUST 2014 Jetřichovice ledna

ROBUST 2014 Jetřichovice ledna ROBUST 2014 Jetřichovice 19. 24. ledna Jitka Bartošová katedra exaktních metod Vysoká škola ekonomická v Praze Fakulta managementu Jindřichův Hradec Abstrakt Snahy o modelování velkých náhodných výběrů

Více

Pravděpodobnost a statistika

Pravděpodobnost a statistika Pravděpodobnost a statistika Bodové odhady a intervaly spolehlivosti Vilém Vychodil KMI/PRAS, Přednáška 10 Vytvořeno v rámci projektu 963/011 FRVŠ V. Vychodil (KMI/PRAS, Přednáška 10) Bodové odhady a intervaly

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Náhodný výběr Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

AVDAT Mnohorozměrné metody, metody klasifikace

AVDAT Mnohorozměrné metody, metody klasifikace AVDAT Mnohorozměrné metody, metody klasifikace Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Mnohorozměrné metody Regrese jedna náhodná veličina je vysvětlována pomocí jiných

Více

2 Hlavní charakteristiky v analýze přežití

2 Hlavní charakteristiky v analýze přežití 2 Hlavní charakteristiky v analýze přežití Předpokládané výstupy z výuky: 1. Student umí definovat funkci přežití, rizikovou funkci a kumulativní rizikovou funkci a zná funkční vazby mezi nimi 2. Student

Více

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní ..08 8cv7.tex 7. cvičení - transformace náhodné veličiny Definice pojmů a základní vzorce Je-li X náhodná veličina a h : R R je měřitelná funkce, pak náhodnou veličinu Y, která je definovaná vztahem X

Více

Odhady Parametrů Lineární Regrese

Odhady Parametrů Lineární Regrese Odhady Parametrů Lineární Regrese Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké

Více

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času Testování hypotéz 1 Jednovýběrové testy 90/ odhad času V podmínkách naprostého odloučení má voák prokázat schopnost orientace v čase. Úkolem voáka e provést odhad časového intervalu 1 hodiny bez hodinek

Více

Department of Mathematical Analysis and Applications of Mathematics Faculty of Science, Palacký University Olomouc Czech Republic

Department of Mathematical Analysis and Applications of Mathematics Faculty of Science, Palacký University Olomouc Czech Republic ROBUST 13. září 2016 regression regresních modelů Categorical Continuous - explanatory, Eva Fišerová Department of Mathematical Analysis and Applications of Mathematics Faculty of Science, Palacký University

Více

Apriorní rozdělení. Jan Kracík.

Apriorní rozdělení. Jan Kracík. Apriorní rozdělení Jan Kracík jan.kracik@vsb.cz Apriorní rozdělení Apriorní rozdělení (spolu s modelem) reprezentuje informaci o neznámém parametru θ, která je dostupná předem, tj. bez informace z dat.

Více

Ústav matematiky a statistiky Masarykova univerzita Brno. workshopy Finanční matematika v praxi III Matematické modely a aplikace Podlesí

Ústav matematiky a statistiky Masarykova univerzita Brno. workshopy Finanční matematika v praxi III Matematické modely a aplikace Podlesí Ústav matematiky a statistiky Masarykova univerzita Brno workshopy Finanční matematika v praxi III Matematické modely a aplikace Podlesí 3. 6. září 2013 Obsah 1 2 3 4 y Motivace y 10 0 10 20 30 40 0 5

Více

7 Regresní modely v analýze přežití

7 Regresní modely v analýze přežití 7 Regresní modely v analýze přežití Předpokládané výstupy z výuky: 1. Student rozumí významu regresního modelování dat o přežití 2. Student dokáže definovat pojmy poměr rizik a základní riziková funkce

Více

PRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady

PRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady PRAVDĚPODOBNOST A STATISTIKA Bayesovské odhady Bayesovské odhady - úvod Klasický bayesovský přístup: Klasický přístup je založen na opakování pokusech sledujeme rekvenci nastoupení zvolených jevů Bayesovský

Více

4 Parametrické odhady

4 Parametrické odhady 4 Parametrické odhady Předpokládané výstupy z výuky: 1. Student zná základní rozdělení pravděpodobnosti dat přežití 2. Student rozumí principu odhadu funkce přežití a rizikové funkce s využitím metody

Více

Bayesovské metody. Mnohorozměrná analýza dat

Bayesovské metody. Mnohorozměrná analýza dat Mnohorozměrná analýza dat Podmíněná pravděpodobnost Definice: Uvažujme náhodné jevy A a B takové, že P(B) > 0. Podmíněnou pravěpodobností jevu A za podmínky, že nastal jev B, nazýváme podíl P(A B) P(A

Více

Klasická a robustní ortogonální regrese mezi složkami kompozice

Klasická a robustní ortogonální regrese mezi složkami kompozice Klasická a robustní ortogonální regrese mezi složkami kompozice K. Hrůzová, V. Todorov, K. Hron, P. Filzmoser 13. září 2016 Kompoziční data kladná reálná čísla nesoucí pouze relativní informaci, x = (x

Více

Eva Fišerová a Karel Hron. Katedra matematické analýzy a aplikací matematiky Přírodovědecká fakulta Univerzity Palackého v Olomouci.

Eva Fišerová a Karel Hron. Katedra matematické analýzy a aplikací matematiky Přírodovědecká fakulta Univerzity Palackého v Olomouci. Ortogonální regrese pro 3-složkové kompoziční data využitím lineárních modelů Eva Fišerová a Karel Hron Katedra matematické analýzy a aplikací matematiky Přírodovědecká fakulta Univerzity Palackého v Olomouci

Více

Odhady - Sdružené rozdělení pravděpodobnosti

Odhady - Sdružené rozdělení pravděpodobnosti Odhady - Sdružené rozdělení pravděpodobnosti 4. listopadu 203 Kdybych chtěl znát maximum informací o náhodné veličině, musel bych znát všechny hodnoty, které mohou padnout, a jejich pravděpodobnosti. Tedy

Více

Testování změn v binárnách autoregresních modelech Šárka Hudecová 1/ 36

Testování změn v binárnách autoregresních modelech Šárka Hudecová 1/ 36 Testování změn v binárnách autoregresních modelech Šárka Hudecová KPMS MFF UK ROBUST 2012 Němčičky 9. 14.9.2012 Testování změn v binárnách autoregresních modelech Šárka Hudecová 1/ 36 Uvažovaná situace

Více

Téma 22. Ondřej Nývlt

Téma 22. Ondřej Nývlt Téma 22 Ondřej Nývlt nyvlto1@fel.cvut.cz Náhodná veličina a náhodný vektor. Distribuční funkce, hustota a pravděpodobnostní funkce náhodné veličiny. Střední hodnota a rozptyl náhodné veličiny. Sdružené

Více

Charakterizace rozdělení

Charakterizace rozdělení Charakterizace rozdělení Momenty f(x) f(x) f(x) μ >μ 1 σ 1 σ >σ 1 g 1 g σ μ 1 μ x μ x x N K MK = x f( x) dx 1 M K = x N CK = ( x M ) f( x) dx ( xi M 1 C = 1 K 1) N i= 1 K i K N i= 1 K μ = E ( X ) = xf

Více

EKONOMICKÁ APLIKACE KOMPOZIČNÍHO REGRESNÍHO MODELU

EKONOMICKÁ APLIKACE KOMPOZIČNÍHO REGRESNÍHO MODELU EKONOMICKÁ APLIKACE KOMPOZIČNÍHO REGRESNÍHO MODELU Klára Hrůzová 1,2, Karel Hron 1,2 1 Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, Univerzita Palackého v Olomouci 2 Katedra

Více

Obr. 1: Vizualizace dat pacientů, kontrolních subjektů a testovacího subjektu.

Obr. 1: Vizualizace dat pacientů, kontrolních subjektů a testovacího subjektu. Řešení příkladu - klasifikace testovacího subjektu pomocí Bayesova klasifikátoru: ata si vizualizujeme (Obr. ). Objem mozkových komor 9 8 7 6 5 pacienti kontroly testovací subjekt 5 6 Objem hipokampu Obr.

Více

8 Coxův model proporcionálních rizik I

8 Coxův model proporcionálních rizik I 8 Coxův model proporcionálních rizik I Předpokládané výstupy z výuky: 1. Student umí formulovat Coxův model proporcionálních rizik 2. Student rozumí významu regresních koeficientů modelu 3. Student zná

Více

POUŽITÍ KONEČNÝCH SMĚSÍ LOGARITMICKO-NORMÁLNÍCH ROZDĚLENÍ PRO MODELOVÁNÍ PŘÍJMŮ ČESKÝCH DOMÁCNOSTÍ

POUŽITÍ KONEČNÝCH SMĚSÍ LOGARITMICKO-NORMÁLNÍCH ROZDĚLENÍ PRO MODELOVÁNÍ PŘÍJMŮ ČESKÝCH DOMÁCNOSTÍ POUŽITÍ ONEČNÝCH SMĚSÍ LOGARITMICO-NORMÁLNÍCH ROZDĚLENÍ PRO MODELOVÁNÍ PŘÍJMŮ ČESÝCH DOMÁCNOSTÍ Ivana Malá, Vysoká škola ekonomická v Praze Úvod Zkoumání a modelování pravděpodobnostního rozdělení mezd

Více

AVDAT Klasický lineární model, metoda nejmenších

AVDAT Klasický lineární model, metoda nejmenších AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i

Více

Kredibilitní pojistné v pojištění automobilů. Silvie Zlatošová září 2016, Robust

Kredibilitní pojistné v pojištění automobilů. Silvie Zlatošová září 2016, Robust Silvie Zlatošová 11. - 16. září 2016, Robust Obsah 1 Motivace a cíl 2 Tvorba apriorních tarifních skupin 3 Teorie kredibility 4 Aplikace aposteriorních korekcí Motivace a cíl Obsah 1 Motivace a cíl 2 Tvorba

Více

PRAVDĚPODOBNOST A STATISTIKA. Testování hypotéz o rozdělení

PRAVDĚPODOBNOST A STATISTIKA. Testování hypotéz o rozdělení PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz o rozdělení Testování hypotéz o rozdělení Nechť X e náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládeme, že neznáme tvar distribuční funkce

Více

MATEMATICKÁ STATISTIKA - XP01MST

MATEMATICKÁ STATISTIKA - XP01MST MATEMATICKÁ STATISTIKA - XP01MST 1. Úvod. Matematická statistika (statistics) se zabývá vyšetřováním zákonitostí, které v sobě obsahují prvek náhody. Zpracováním hodnot, které jsou výstupem sledovaného

Více

AVDAT Náhodný vektor, mnohorozměrné rozdělení

AVDAT Náhodný vektor, mnohorozměrné rozdělení AVDAT Náhodný vektor, mnohorozměrné rozdělení Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Opakování, náhodná veličina, rozdělení Náhodná veličina zobrazuje elementární

Více

Lineární a logistická regrese

Lineární a logistická regrese Lineární a logistická regrese Martin Branda Univerzita Karlova v Praze Matematicko-fyzikální fakulta Katedra pravděpodobnosti a matematické statistiky Výpočetní prostředky finanční a pojistné matematiky

Více

oddělení Inteligentní Datové Analýzy (IDA)

oddělení Inteligentní Datové Analýzy (IDA) Vytěžování dat Filip Železný Katedra počítačů oddělení Inteligentní Datové Analýzy (IDA) 22. září 2014 Filip Železný (ČVUT) Vytěžování dat 22. září 2014 1 / 25 Odhad rozdělení Úloha: Vstup: data D = {

Více

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1 Minikurz aplikované statistiky Marie Šimečková, Petr Šimeček Minikurz aplikované statistiky p.1 Program kurzu základy statistiky a pravděpodobnosti regrese (klasická, robustní, s náhodnými efekty, ev.

Více

3 Bodové odhady a jejich vlastnosti

3 Bodové odhady a jejich vlastnosti 3 Bodové odhady a jejich vlastnosti 3.1 Statistika (Skripta str. 77) Výběr pořizujeme proto, abychom se (více) dověděli o souboru, ze kterého jsme výběr pořídili. Zde se soustředíme na situaci, kdy známe

Více

Intervalové Odhady Parametrů

Intervalové Odhady Parametrů Parametrů Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení technické v Praze

Více

Robustní statistické metody

Robustní statistické metody Populární úvod Ústav teoretické fyziky a astrofyziky, MU Brno 28. říjen 2006, Vlašim O co jde? Robustní znamená: necitlivý k malým odchylkám od ideálních předpokladů na který je metoda odhadu optimalizována.

Více

Hodnocení vlastností materiálů podle ČSN EN 1990, přílohy D

Hodnocení vlastností materiálů podle ČSN EN 1990, přílohy D Hodnocení vlastností materiálů podle ČSN EN 1990, přílohy D Miroslav Sýkora Kloknerův ústav, ČVUT v Praze 1. Úvod 2. Kvantil náhodné veličiny 3. Hodnocení jedné veličiny 4. Hodnocení modelu 5. Příklady

Více

velkou variabilitou: underdispersion, overdispersion)

velkou variabilitou: underdispersion, overdispersion) RNDr. Marie Forbelská, Ph.D. 1 M7222 4. cvičení : GLM04a (Problémy s příliš malou či příliš velkou variabilitou: underdispersion, overdispersion) Mějme náhodný výběry n =(Y 1,...,Y n ) T z rozdělení exponenciálního

Více

Základní statistické modely Statistické vyhodnocování exp. dat M. Čada ~ cada

Základní statistické modely Statistické vyhodnocování exp. dat M. Čada   ~ cada Základní statistické modely 1 Statistika Matematická statistika se zabývá interpretací získaných náhodných dat. Snažíme se přiřadit statistickému souboru vhodnou distribuční funkci a najít základní číselné

Více

Metoda backward výběru proměnných v lineární regresi a její vlastnosti

Metoda backward výběru proměnných v lineární regresi a její vlastnosti Metoda backward výběru proměnných v lineární regresi a její vlastnosti Aktuárský seminář, 13. dubna 2018 Milan Bašta 1 / 30 1 Metody výběru proměnných do modelu 2 Monte Carlo simulace, backward metoda

Více

STANOVENÍ SPOLEHLIVOSTI GEOTECHNICKÝCH KONSTRUKCÍ. J. Pruška, T. Parák

STANOVENÍ SPOLEHLIVOSTI GEOTECHNICKÝCH KONSTRUKCÍ. J. Pruška, T. Parák STANOVENÍ SPOLEHLIVOSTI GEOTECHNICKÝCH KONSTRUKCÍ J. Pruška, T. Parák OBSAH: 1. Co je to spolehlivost, pravděpodobnost poruchy, riziko. 2. Deterministický a pravděpodobnostní přístup k řešení problémů.

Více

Pravděpodobnost a statistika

Pravděpodobnost a statistika Pravděpodobnost a statistika Normální rozdělení a centrální limitní věta Vilém Vychodil KMI/PRAS, Přednáška 9 Vytvořeno v rámci projektu 2963/2011 FRVŠ V. Vychodil (KMI/PRAS, Přednáška 9) Normální rozdělení

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné

Více

Regresní analýza 1. Regresní analýza

Regresní analýza 1. Regresní analýza Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému

Více

5. B o d o v é o d h a d y p a r a m e t r ů

5. B o d o v é o d h a d y p a r a m e t r ů 5. B o d o v é o d h a d y p a r a m e t r ů Na základě hodnot náhodného výběru z rozdělení určitého typu odhadujeme parametry tohoto rozdělení, tak aby co nejlépe odpovídaly hodnotám výběru. Formulujme

Více

BAYESOVSKÉ ODHADY. Michal Friesl V NĚKTERÝCH MODELECH. Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni

BAYESOVSKÉ ODHADY. Michal Friesl V NĚKTERÝCH MODELECH. Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni BAYESOVSKÉ ODHADY V NĚKTERÝCH MODELECH Michal Friesl Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni Slunce Řidiči IQ Regrese Přežití Obvyklý model Pozorování X = (X 1,..., X

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Statistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I

Statistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I Statistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I Příklad Tahová síla papíru používaného pro výrobu potravinových sáčků je důležitá charakteristika kvality. Je známo, že síla

Více

Neparametrické odhady hustoty pravděpodobnosti

Neparametrické odhady hustoty pravděpodobnosti Neparametrické odhady hustoty pravděpodobnosti Václav Hlaváč Elektrotechnická fakulta ČVUT Katedra kybernetiky Centrum strojového vnímání 121 35 Praha 2, Karlovo nám. 13 hlavac@fel.cvut.cz Statistické

Více

Šárka Došlá. Matematicko-fyzikální fakulta Univerzita Karlova v Praze. Bimodální rozdělení. Šárka Došlá. Motivace. Základní pojmy

Šárka Došlá. Matematicko-fyzikální fakulta Univerzita Karlova v Praze. Bimodální rozdělení. Šárka Došlá. Motivace. Základní pojmy Matematicko-fyzikální fakulta Univerzita Karlova v Praze 1/20 Joiner (1975): Histogram výšky studentů, který ilustruje bimodalitu lidské výšky. Schilling a kol. (2002): Ve skutečnosti bylo dané unimodální!

Více

IDENTIFIKACE BIMODALITY V DATECH

IDENTIFIKACE BIMODALITY V DATECH IDETIFIKACE BIMODALITY V DATECH Jiří Militky Technická universita v Liberci e- mail: jiri.miliky@vslib.cz Milan Meloun Universita Pardubice, Pardubice Motto: Je normální předpokládat normální data? Zvláštnosti

Více

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457. 0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti

Více

6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový.

6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový. 6. ZÁKLADY STATIST. ODHADOVÁNÍ X={X 1, X 2,..., X n } výběr z rozdělení s F (x, θ), θ={θ 1,..., θ r } - vektor reálných neznámých param. θ Θ R k. Θ parametrický prostor. Dva základní způsoby odhadu neznámého

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

VLIV STATISTICKÉ ZÁVISLOSTI NÁHODNÝCH VELIČIN NA SPOLEHLIVOST KONSTRUKCE

VLIV STATISTICKÉ ZÁVISLOSTI NÁHODNÝCH VELIČIN NA SPOLEHLIVOST KONSTRUKCE IV. ročník celostátní konference SPOLEHLIVOST KONSTRUKCÍ Téma: Posudek - poruchy - havárie 25 23.až 24.4.2003 Dům techniky Ostrava ISBN 80-02-055-7 VLIV STATISTICKÉ ZÁVISLOSTI NÁHODNÝCH VELIČIN NA SPOLEHLIVOST

Více

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY Statistická hypotéza je určitá domněnka (předpoklad) o vlastnostech ZÁKLADNÍHO SOUBORU. Test statistické hypotézy je pravidlo (kritérium), které na základě

Více

správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B.

správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B. Zkouška z předmětu KMA/PST. Anotace předmětu Náhodné jevy, pravděpodobnost, podmíněná pravděpodobnost. Nezávislé náhodné jevy. Náhodná veličina, distribuční funkce. Diskrétní a absolutně spojitá náhodná

Více

pravděpodobnosti, popisné statistiky

pravděpodobnosti, popisné statistiky 8. Modelová rozdělení pravděpodobnosti, popisné statistiky Rozdělení pravděpodobnosti Normální rozdělení jako statistický model Přehled a aplikace modelových rozdělení Popisné statistiky Anotace Klasickým

Více

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D. Střední hodnota a rozptyl náhodné veličiny, vybraná rozdělení diskrétních a spojitých náhodných veličin, pojem kvantilu Ing. Michael Rost, Ph.D. Príklad Předpokládejme že máme náhodnou veličinu X která

Více

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina. Parametrické metody odhadů z neúplných výběrů 2 1 Metoda maximální věrohodnosti pro cenzorované výběry 11 Náhodné cenzorování Při sledování složitých reálných systémů často nemáme možnost uspořádat experiment

Více

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D. Ing. Michal Dorda, Ph.D. Př. : Ve vjezdové skupině kolejí byly sledovány počty přijíždějících vlaků za hodinu. Za 5 dní (tedy 360 hodin) přijelo celkem 87 vlaků. Výsledky sledování jsou uvedeny v tabulce.

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

TLOUŠŤKOVÁ A VÝŠKOVÁ STRUKTURA A JEJÍ MODELOVÁNÍ

TLOUŠŤKOVÁ A VÝŠKOVÁ STRUKTURA A JEJÍ MODELOVÁNÍ TLOUŠŤKOVÁ A VÝŠKOVÁ STRUKTURA A JEJÍ MODELOVÁNÍ 1 Vlastnosti tloušťkové struktury porostu tloušťky mají vyšší variabilitu než výšky světlomilné dřeviny mají křivku početností tlouštěk špičatější a s menší

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou

Více

LWS při heteroskedasticitě

LWS při heteroskedasticitě Stochastické modelování v ekonomii a financích Petr Jonáš 7. prosince 2009 Obsah 1 2 3 4 5 47 1 Předpoklad 1: Y i = X i β 0 + e i i = 1,..., n. (X i, e i) je posloupnost nezávislých nestejně rozdělených

Více

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ Michal Kořenář 1 Abstrakt Rozvoj výpočetní techniky v poslední době umožnil také rozvoj výpočetních metod, které nejsou založeny na bázi

Více

ACTA UNIVERSITATIS AGRICULTURAE ET SILVICULTURAE MENDELIANAE BRUNENSIS SBORNÍK MENDELOVY ZEMĚDĚLSKÉ A LESNICKÉ UNIVERZITY V BRNĚ

ACTA UNIVERSITATIS AGRICULTURAE ET SILVICULTURAE MENDELIANAE BRUNENSIS SBORNÍK MENDELOVY ZEMĚDĚLSKÉ A LESNICKÉ UNIVERZITY V BRNĚ ACTA UNIVERSITATIS AGRICULTURAE ET SILVICULTURAE MENDELIANAE BRUNENSIS SBORNÍK MENDELOVY ZEMĚDĚLSKÉ A LESNICKÉ UNIVERZITY V BRNĚ Ročník LII 6 Číslo 3, 2004 Gasser-Müllerův odhad J. Poměnková Došlo: 8.

Více

Stavový model a Kalmanův filtr

Stavový model a Kalmanův filtr Stavový model a Kalmanův filtr 2 prosince 23 Stav je veličina, kterou neznáme, ale chtěli bychom znát Dozvídáme se o ní zprostředkovaně prostřednictvím výstupů Příkladem může býapř nějaký zašuměný signál,

Více

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace Jan Slovák Masarykova univerzita Fakulta informatiky 28. 11 2. 12. 2016 Obsah přednášky 1 Literatura 2 Střední

Více

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin Příklady k procvičení z Matematické statistiky Poslední úprava. listopadu 207. Konvergence posloupnosti náhodných veličin. Necht X, X 2... jsou nezávislé veličiny s rovnoměrným rozdělením na [0, ]. Definujme

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními

Více

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =

E(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) = Základní rozdělení pravděpodobnosti Diskrétní rozdělení pravděpodobnosti. Pojem Náhodná veličina s Binomickým rozdělením Bi(n, p), kde n je přirozené číslo, p je reálné číslo, < p < má pravděpodobnostní

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D. Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost

Více

1 Klasická pravděpodobnost. Bayesův vzorec. Poslední změna (oprava): 11. května 2018 ( 6 4)( 43 2 ) ( 49 6 ) 3. = (a) 1 1 2! + 1 3!

1 Klasická pravděpodobnost. Bayesův vzorec. Poslední změna (oprava): 11. května 2018 ( 6 4)( 43 2 ) ( 49 6 ) 3. = (a) 1 1 2! + 1 3! Výsledky příkladů na procvičení z NMSA0 Klasická pravděpodobnost. 5. ( 4( 43 ( 49 3. 8! 3! 0! = 5 Poslední změna (oprava:. května 08 4. (a! + 3! + ( n+ n! = n k= ( k+ /k! = n k=0 ( k /k!; (b n k=0 ( k

Více

Charakteristika datového souboru

Charakteristika datového souboru Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

EM algoritmus. Proč zahrnovat do modelu neznámé veličiny

EM algoritmus. Proč zahrnovat do modelu neznámé veličiny EM algoritmus používá se pro odhad nepozorovaných veličin. Jde o iterativní algoritmus opakující dva kroky: Estimate, který odhadne hodnoty nepozorovaných dat, a Maximize, který maximalizuje věrohodnost

Více

Vybraná rozdělení náhodné veličiny

Vybraná rozdělení náhodné veličiny 3.3 Vybraná rozdělení náhodné veličiny 0,16 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0 Rozdělení Z 3 4 5 6 7 8 9 10 11 12 13 14 15 Život je umění vytvářet uspokojivé závěry na základě nedostatečných předpokladů.

Více

Rovnovážné modely v teorii portfolia

Rovnovážné modely v teorii portfolia 3. září 2013, Podlesí Obsah Portfolio a jeho charakteristiky Definice portfolia Výnosnost a riziko aktiv Výnosnost a riziko portfolia Klasická teorie portfolia Markowitzův model Tobinův model CAPM - model

Více

MATEMATICKÁ STATISTIKA

MATEMATICKÁ STATISTIKA MATEMATICKÁ STATISTIKA 1. Úvod. Matematická statistika se zabývá vyšetřováním zákonitostí, které v sobě obsahují prvek náhody. Zpracováním hodnot, které jsou výstupem sledovaného procesu, se snažíme popsat

Více

1/30. Mgr. Jan Šváb Zobecněný lineární model a jeho použití v povinném ručení. 31.3.2006 Seminář z aktuárských věd. Slides by LATEX.

1/30. Mgr. Jan Šváb Zobecněný lineární model a jeho použití v povinném ručení. 31.3.2006 Seminář z aktuárských věd. Slides by LATEX. 1/30 31.3.2006 Seminář z aktuárských věd Slides by LATEX Mgr. Jan Šváb Zobecněný lineární model a jeho použití v povinném ručení 2/30 Obsah 1 Zobecněné lineární modely (GLZ 1 ) Obecný lineární model (GLM)

Více

Fyzikální korespondenční seminář MFF UK

Fyzikální korespondenční seminář MFF UK Úloha I.S... náhodná 10 bodů; průměr 7,04; řešilo 45 studentů a) Zkuste vlastními slovy popsat, co je to náhodná veličina a jaké má vlastnosti (postačí vlastními slovy objasnit následující pojmy: náhodná

Více

NEPARAMETRICKÁ DISKRIMINAČNÍ ANALÝZA

NEPARAMETRICKÁ DISKRIMINAČNÍ ANALÝZA ROBUST, 5 58 c JČMF NEPARAMETRICKÁ DISKRIMINAČNÍ ANALÝZA MARIE FORBELSKÁ Abstrakt. In the paper the attention is focused to the application of kernel density estimators to statistical discrimination. After

Více

Vlastnosti odhadů ukazatelů způsobilosti

Vlastnosti odhadů ukazatelů způsobilosti Vlastnosti odhadů ukazatelů způsobilosti Jiří Michálek CQR při Ústavu teorie informace a automatizace AV ČR v Praze Úvod Ve výzkumné zprávě č 06 Odhady koeficientů způsobilosti a jejich vlastnosti viz

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a báli jste se zeptat Jedinečnou funkcí statistiky je, že umožňuje vědci číselně vyjádřit nejistotu v jeho závěrech. (G. W. Snedecor)

Více

Alternativní přístup k analýze vícefaktorových dat

Alternativní přístup k analýze vícefaktorových dat Alternativní přístup k analýze vícefaktorových dat Kamila Fačevicová 1, Peter Filzmoser 2, Karel Hron 1 1 Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta Univerzity Palackého

Více

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y 9. T r a n s f o r m a c e n á h o d n é v e l i č i n y Při popisu procesů zpracováváme vstupní údaj, hodnotu x tak, že výstupní hodnota y závisí nějakým způsobem na vstupní, je její funkcí y = f(x).

Více

Bootstrap - konfidenční intervaly a testy

Bootstrap - konfidenční intervaly a testy 9. prosince 2008 Konfidenční intervaly obecně Máme data X 1...X n F,(iid), kde F neznáme. Konfidenční intervaly obecně Máme data X 1...X n F,(iid), kde F neznáme. Chceme odhadnout θ = t(f), např. t(f)

Více

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

MATEMATICKÁ STATISTIKA.   Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci Matematická statistika Matematická statistika se zabývá matematickým

Více

Základy počtu pravděpodobnosti a metod matematické statistiky

Základy počtu pravděpodobnosti a metod matematické statistiky Errata ke skriptu Základy počtu pravděpodobnosti a metod matematické statistiky K. Hron a P. Kunderová Autoři prosí čtenáře uvedeného studijního textu, aby případné další odhalené chyby nad rámec tohoto

Více

Základy teorie odhadu parametrů bodový odhad

Základy teorie odhadu parametrů bodový odhad Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Odhady parametrů Úkolem výběrového šetření je podat informaci o neznámé hodnotě charakteristiky základního souboru

Více

KVADRATICKÁ KALIBRACE

KVADRATICKÁ KALIBRACE Petra Širůčková, prof. RNDr. Gejza Wimmer, DrSc. Finanční matematika v praxi III. a Matematické modely a aplikace 4. 9. 2013 Osnova Kalibrace 1 Kalibrace Pojem kalibrace Cíle kalibrace Předpoklady 2 3

Více

PRAVDĚPODOBNOST A STATISTIKA. Metoda momentů Metoda maximální věrohodnosti

PRAVDĚPODOBNOST A STATISTIKA. Metoda momentů Metoda maximální věrohodnosti SP3 Odhady arametrů PRAVDĚPODOBNOST A STATISTIKA Metoda momentů Metoda maimální věrohodnosti SP3 Odhady arametrů Metoda momentů Vychází se z: - P - ravděodobnostní rostor - X je náhodná roměnná s hustotou

Více

Patrice Marek. Západočeská univerzita v Plzni. * Podpořeno z OPVK CZ.1.07/2.2.00/

Patrice Marek. Západočeská univerzita v Plzni. * Podpořeno z OPVK CZ.1.07/2.2.00/ Patrice Marek Západočeská univerzita v Plzni * Podpořeno z OPVK CZ.1.07/2.2.00/15.0377 OBSAH Předmět modelování Přehled modelů Vlastní model Data Experimenty Výsledky a budoucí práce PŘEDMĚT MODELOVÁNÍ

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 4. Teoretická rozdělení Mgr. David Fiedor 9. března 2015 Osnova Úvod 1 Úvod 2 3 4 5 Vybraná rozdělení náhodných proměnných normální rozdělení normované normální rozdělení

Více