Modelování heterogenity ročních příjmů českých domácností Modeling Heterogeinity in the Czech Household Incomes
|
|
- Dominik Kašpar
- před 7 lety
- Počet zobrazení:
Transkript
1 Modelování heterogenity ročních přímů českých domácností Modeling Heterogeinity in the Czech Household Incomes Marie Forbelská Abstract: The distribution of income in most populations is heterogeneous, with several modes and highly skewed, with a long right-hand-side tail and high density at the lower percentiles. Mixture-model-based clustering has become a popular approach of modeling heterogeinity for its statistical properties and the implementation simplicity of the EM algorithm. We focused on the partitions of household incomes into homogeneous subgroups via mixture models. Key words: Household income, Finite mixture models, EM algorithm, Generalized lambda distribution. Úvod Analýza rozdělení přímů domácností e důležitým ukazatelem pro posuzování životní úrovně obyvatelstva. Příspěvek e zaměřen na stochastické modelování heterogenity ročních přímů domácností pomocí konečných směsí. Podrobně sou popsány postupy při vytváření stochastických modelů s využitím normálních směsí pro logaritmy ročních přímů domácností. Pozornost e také věnována inému typu směsí, a to GLD směsím, kde GLD značí zobecněné lambda rozdělení. Na závěr e zmíněn mnohem obecněší přístup založený na GLM modelech.. Modely konečných směsí Roční přímy domácností maí rozdělení, které e silně zešikmené a e vícemodální, ak e názorně vidět z obrázků a, b, c, kde sou vykresleny ádrové odhady hustot dané vzorcem n x xi f ˆ n( x) = K nh i= h, kde x,...,x n sou pozorování, K e tzv. ádro, h e vyhlazovací parametr (více lze naít například v monografii Silverman, 978, [], popř. v práci Horová, Zelinka, 000, []). Obrázek a: Jádrový odhad hustoty ročních přímů českých domácností v roce 005 (zdro: EU SILC 005)
2 Obrázek b: Jádrový odhad hustoty ročních přímů českých domácností v roce 006 (zdro: EU SILC 006) Obrázek c: Jádrový odhad hustoty ročních přímů českých domácností v roce 007 (zdro: EU SILC 007) Za těchto okolností se přímo nabízí modelovat rozdělení ročních přímů domácností pomocí konečných směsí. Jestliže náhodná veličina X má hustotu tvaru kde π f ( x) = π f ( x) + + π k fk ( x), 0, =,, k, π + + π = > k a f (x) sou hustoty, pak řekneme, že hustota náhodné veličiny X e konečnou směsí k hustot. Pravděpodobnosti π ( =,, k) se nazývaí váhy směsí (proporce směsí nebo apriorní pravděpodobnosti). Více lze naít v monografii McLachlan and Peel (000, viz [7]). Abychom mohli rozčlenit směs f x; Ψ) = π f ( x; θ ) + + π f ( x; θ ), kde ( k k k Ψ = ( π,, π k, θ,, θk ) sou neznámé parametry, e třeba neprve určit typ rozdělení a následně odhadnout vektor neznámých parametrů Ψ. Standardní metodou odhadu neznámých parametrů na základě náhodného výběru x,...,x n e tzv. EM algoritmus (Dempster et al., 977, viz []), který ve dvou krocích, E a M, nabízí maximálně věrohodné odhady. Klasifikace, t. určení příslušnosti edince či obektu charakterizovaného veličinou x k edné z konečného počtu tříd, se děe pomocí aposteriorních pravděpodobností π f ( xi; θ ) ω ( xi) =, f ( x ; Ψ) a to tak, že edinec či obekt e přiřazen do té třídy, pro kterou e aposteriorní pravděpodobnost maximální. i
3 S ohledem na tvar rozdělení ročních přímů domácností lze postupovat dvoím způsobem a) buď modelovat hustotu přímů ako směs logaritmicko normálních rozdělení b) nebo hustotu logaritmu přímů modelovat ako směs normálních rozdělení, neboť náhodná veličina X má logaritmicko normální rozdělení LN ( µ, σ ) s hustotou tvaru ( log( x) µ ) f ( x) = exp > 0,, > 0 x µ R σ, x πσ σ pokud náhodná veličina Y = log(x ) má normální rozdělení N ( µ, σ ). Pro modelování ročních přímů domácností e výhodněší zvolit postup b). V dalším tedy budeme pracovat už en s logaritmy ročních přímů domácností. Obecně, estliže chceme použít konečné směsi hustot, musíme neprve určit parametr k počtu komponent. Pro tento účel e opět výhodné využít ádrové odhady hustot. Obrázek a: Jádrový odhad hustoty logaritmů ročních přímů českých domácností v roce 005 (zdro: EU SILC 005) Obrázek b: Jádrový odhad hustoty logaritmů ročních přímů českých domácností v roce 006 (zdro: EU SILC 006) Obrázek c: Jádrový odhad hustoty logaritmů ročních přímů českých domácností v roce 007 (zdro: EU SILC 007)
4 Ze tvarů odhadnutých hustot e zřemé, že směs bude obsahovat neméně tři komponenty. Výpočet provedeme pomocí EM algoritmu. Grafické znázornění výsledků e na obrázcích a, b, c a konkrétní maximálně věrohodné odhady vektoru neznámých parametrů Ψ ˆ MLE = ( ˆ π ˆ θˆ sou pro k= uvedeny v tabulce č.. ( ˆ π,, ˆ π, ˆ µ,, ˆ µ, ˆ σ,, σ ),, ˆ π ˆ k, θ,, k ) = k k k Obrázek a: Výsledky EM algoritmu pro - složkovou směs logaritmů ročních přímů českých domácností v roce 005(zdro: EU SILC 005). Zelená přerušovaná čára značí ádrový odhad hustoty. Obrázek b: Výsledky EM algoritmu pro - složkovou směs logaritmů ročních přímů českých domácností v roce 006(zdro: EU SILC 006). Zelená přerušovaná čára značí ádrový odhad hustoty. Obrázek c: Výsledky EM algoritmu pro - složkovou směs logaritmů ročních přímů českých domácností v roce 007(zdro: EU SILC 007). Zelená přerušovaná čára značí ádrový odhad hustoty.
5 Tabulka : Výsledné maximálně věrohodné odhady parametrů ve složkové směsi logaritmů ročních přímů českých domácností (zdro: EU SILC 005, 006, 007). Rok Komponenta Proporce π Střední hodnota μ Rozptyl σ Není bez zaímavosti, že ve všech třech případech edna komponenta, eíž podíl e kolem edné třetiny, má vysokou variabilitu a v podstatě pokrývá všechny hodnoty logaritmů ročních přímů domácností. Tuto skupinu domácností lze také interpretovat ako nerozlišitelnou z hlediska výšky ročních přímů. Podíl takto nerozlišitelných domácností e příliš vysoký. Navíc z obrázků a, b a c e zřemé, že pouze komponenty k modelování logaritmů ročních přímů českých domácností v letech 005, 006 a 007 nesou postačuící. Chceme-li naít něaký optimální počet složek směsi, nabízí se velmi ednoduchý postup. Provedeme rozčlenění směsi postupně pro ednotlivá k a vybereme takové, které maximalizue logaritmus sdružené hustoty. Ovšem tento postup nevede k cíli, neboť s přidáním každé další složky se hodnota logaritmu sdružené hustoty neustále zvyšue. Proto se pro výběr optimálního počtu komponent používaí různá penalizovaná kritéria, například BIC kritérium (Bayesian Information Criterion) BIC = log(maximized likelihood) m log(n), kde m e počet neznámých parametrů (v našem případě m=k-) a n e počet pozorování (více např. Schwarz,978, viz [0]), popř. McLachlan and Peel, 000, viz [7]). Obrázek. Hodnoty BIC kritéria pro logaritmy ročních přímů v letech 005, 006, 007.
6 Na obrázku sou znázorněny hodnoty BIC kritéria pro různé volby parametru k (k=,...,9). Funkce Mclust z balíku mclust programovacího azyka R (viz [] a [9]) navrhue volbu k=6 pro všechny roky. Grafické výsledky sou opět prezentovány na obrázcích 5a, 5b, 5c a maximálně věrohodné odhady Ψˆ MLE vektoru neznámých parametrů Ψ pro k=6 sou uvedeny v tabulce č.. Obrázek 5a: Výsledky EM algoritmu pro 6ti - složkovou směs logaritmů ročních přímů českých domácností v roce 005 (zdro: EU SILC 005). Zelená přerušovaná čára značí ádrový odhad hustoty. Obrázek 5b: Výsledky EM algoritmu pro 6ti - složkovou směs logaritmů ročních přímů českých domácností v roce 006 (zdro: EU SILC 006). Zelená přerušovaná čára značí ádrový odhad hustoty. Obrázek 5c: Výsledky EM algoritmu pro 6ti - složkovou směs logaritmů ročních přímů českých domácností v roce 007 (zdro: EU SILC 007). Zelená přerušovaná čára značí ádrový odhad hustoty.
7 Tabulka : Maximálně věrohodné odhady parametrů v 6ti složkové směsi logaritmů ročních přímů českých domácností (zdro: EU SILC 005, 006, 007). Rok Komponenta Proporce π Střední hodnota μ Rozptyl σ Podíváme-li se podrobněi na obrázky 5a, 5b, 5c a tabulku č., vidíme, že opět existue složka, eíž variabilita e výrazně větší. Tentokrát však tyto nerozlišitelné složky tvoří 5ti až 0ti procentní podíl. I když 6ti-složková směs věrně popisue celkové rozdělení logaritmů přímů domácnosti, z hlediska interpretace není příliš vhodná. Vraťme se proto znovu k obrázku č. s hodnotami BIC kritéria pro ednotlivá k. Vidíme, že pro roky 005 a 006 stačí uvažovat pouze směs se komponentami. Grafické výsledky EM algoritmu pro tyto dva roky sou znázorněny na obrázcích 6a a 6b, maximálně věrohodné odhady Ψˆ MLE vektoru neznámých parametrů Ψ sou uvedeny v tabulce č.. Pro dokreslení sou uvedeny i výsledky roku 007 (na obrázku 6c a odhady parametrů v tabulce č. ), i když z hlediska BIC kritéria se směs se komponentami eví ako výrazně horší. Obrázek 6a: Výsledky EM algoritmu pro - složkovou směs logaritmů ročních přímů českých domácností v roce 005 (zdro: EU SILC 005). Zelená přerušovaná čára značí ádrový odhad hustoty.
8 Obrázek 6b: Výsledky EM algoritmu pro - složkovou směs logaritmů ročních přímů českých domácností v roce 006 (zdro: EU SILC 006). Zelená přerušovaná čára značí ádrový odhad hustoty. Obrázek 6c: Výsledky EM algoritmu pro - složkovou směs logaritmů ročních přímů českých domácností v roce 007 (zdro: EU SILC 007). Zelená přerušovaná čára značí ádrový odhad hustoty. Tabulka : Maximálně věrohodné odhady parametrů ve - složkové směsi logaritmů ročních přímů českých domácností (zdro: EU SILC 005, 006, 007). Rok Komponenta Proporce π Střední hodnota μ Rozptyl σ Modelueme-li logaritmy ročních přímů pomocí komponent, opět v roce 005 a 006 dostaneme složku, která má vysokou variabilitu a eví se z pohledu logaritmů ročních přímů ako nerozlišitelná a tvoří opět dosti vysoký podíl (7 a 9 procent). V roce 007 tuto složku nenalezneme, což e ovšem na úkor modelování nenižší přímové skupiny.
9 Chceme-li modelovat heterogenitu ročních přímů domácností, nesme odkázáni pouze na logaritmicko normální či normální rozdělení, ale existue celá řada dalších systémů, které dokáží velmi efektivně modelovat rozdělení podobného typu. Jako příklad můžeme uvést Pearsonův či Johnsonův systém křivek. Nevýhodou těchto systémů e ovšem nesnadná interpretace výsledných křivek. V posledních desetiletích se začal využívat další systém rozdělení, a to systém založený na tzv. zobecněném lambda rozdělení (GLD rozdělení), který se prosadil mimo iné také díky snadné interpretaci parametrů a možnosti efektivně generovat pseudonáhodná čísla při Monte Carlo studiích. GLD rozdělení e zobecněním Tukeova symetrického lambda rozdělení definovaného pomocí kvantilové funkce takto Kvantilová funkce e definovaná vztahem kde F (x) e distribuční funkce. u ( u ) 0 Q ( u; ) = pro 0 u. log( u) = 0 u { x R : F( x u} Q( u) = inf ), a) rovnoměrné rozdělení b) přibližně Cauchyovo rozdělení c) přibližně normální rozdělení Obrázek 7: Ukázky Tukeova symetrického lambda rozdělení při různé volbě parametru. Zobecněné lambda rozdělení (GLD rozdělení) e pak definováno pomocí čtyř parametrů, přičemž se používá dvoí parametrizace Ramberg and Schmeiser (97, viz [9]) RS GLD rozdělení Freimer, Mudholkar, Kollia, Lin (988, viz []) FMKL GLD rozdělení RS GLD rozdělení e definováno pomocí kvantilové funkce takto u ( u ) Q( u;,,, ) = + pro 0 u.
10 Pokud chceme explicitně vyádřit hustotu RS GLD rozdělení, použieme vzorec f ( Q( u) ) =. Q'( u) Pak hustota má pak tvar f ( ) = RS GLD x, u + ( u) kde Obrázek 8: Ukázky RS GLD rozdělení se stenými momenty. e parametr polohy a platí R, e parametr měřítka, > 0, sou parametry tvaru a eich parametrický prostor e tvořen 6 oblastmi, S S 5 6 = = (, ) (, ) S S S = = = {(, ):, } {(, ):, } {(, ): 0, 0} {(, ): 0, 0} S = ( ) : < 0, >, ( ) ( ) : >, < 0, ( ) ( ) ( ) < < Aby se zednodušil parametrický prostor pro a byla navržena iná parametrizace a FMKL GLD rozdělení e pomocí kvantilové funkce definováno takto u ( u) Q ( u; = +,,, ) pro 0 u, > 0.. Obrázek 9: Ukázky FMKL GLD rozdělení Pokud = 0, pak výraz u e nahrazen výrazem log(u ), obdobně pokud = 0, pak ( u) e nahrazeno log( u).
11 Na příkladu ročních přímů domácností důchodců bez ekonomicky aktivních členů budeme (s využitím balíčku GLDEX v programovacích prostředí R, viz []) demonstrovat modelování dvousložkové FMKL GLD směsi pomocí EM algoritmu neprve pro původní data a taká pro logaritmovaná data, viz obrázky 0a, 0b, 0c a a, b, c. Obrázek 0a: Výsledky EM algoritmu pro - složkovou FMKL GLD směs ročních přímů domácností důchodců bez ekonomicky aktivních členů v roce 005 (zdro: EU SILC 005) Obrázek 0b: Výsledky EM algoritmu pro - složkovou FMKL GLD směs ročních přímů domácností důchodců bez ekonomicky aktivních členů v roce 006 (zdro: EU SILC 006) Obrázek 0c: Výsledky EM algoritmu pro - složkovou FMKL GLD směs ročních přímů domácností důchodců bez ekonomicky aktivních členů v roce 007 (zdro: EU SILC 007)
12 Obrázek a: Výsledky EM algoritmu pro - složkovou FMKL GLD směs logaritmů ročních přímů domácností důchodců bez ekonomicky aktivních členů v roce 005 (zdro: EU SILC 005) Obrázek b: Výsledky EM algoritmu pro - složkovou FMKL GLD směs logaritmů ročních přímů domácností důchodců bez ekonomicky aktivních členů v roce 006 (zdro: EU SILC 006) Obrázek c: Výsledky EM algoritmu pro - složkovou FMKL GLD směs logaritmů ročních přímů domácností důchodců bez ekonomicky aktivních členů v roce 007 (zdro: EU SILC 007) Roční přímy domácností důchodců bez ekonomicky aktivních členů sou asnou směsí dvou skupin, a to skupiny, kde hlavou domácností e žena a skupiny, kde hlavou domácností e muž (rozlišení hodnot e provedeno modrou a zelenou barvou). Z hlediska grafické interpretace výsledků e výhodněší modelovat logaritmy ročních přímů domácností.
13 Na závěr se en velmi krátce zmiňme o možnosti modelovat roční přímy domácností pomocí konečných směsí regresních GLM modelů. Tento přístup však předpokládá hluboké znalosti vnitřní struktury modelu, neboť nepopisue rozdělení ročních přímů osamoceně, ale s ohledem na další, například sociální, demografické či geografické charakteristiky domácností. Směsi GLM modelů předpokládaí, že podmíněné hustoty f,, f sou exponenciálního typu, t. lze e napsat ve tvaru { a( y) b( θ ) + c( ) d( )} k f ( y; θ ) = exp θ y, kde a ( ), b ( ), c ( ) a d ( ) sou známé funkce + θ ( x,, x m a parametr θ = ) závisí na něakých regresorech x,, x. m neznámé pravděpodobnosti π,,π opět záviseí na obecně iných regresorech k u,,u p, t. π = π ( u,, u p ). V této GLM směsi se pomocí ryze monotonních linkovacích funkcí g a g modeluí podmíněné střední hodnoty a pravděpodobnosti,, xm ) g ( β x + β x ) µ ( x = +,, u p ) g m m ( α u + α u ) π ( u = +, kde linkovací funkcí g může být π logit linkovací funkce: g = log, π probit linkovací funkce: g = Φ ( π ), kde Φ značí kvantilovou funkci N (0,), log-log linkovací funkce: g = log( log( π )), komplementární log-log linkovací funkce: g = log( log( )). π Připomeňme, že mezi rozdělení exponenciálního typu patří ze spoitých například normální a gama rozdělení, z diskrétních například alternativní, binomické, Poissonovo, negativně binomické rozdělení. Více podrobností o GLM modelech lze naít např. v práci McCullagh a Nelder (99, viz [6]), a regresní směsi GLM modelů sou podrobně popsané v monografii McLachlan a Peel (000, viz [7]).. Závěr Shrneme-li předchozí úvahy, e vidět, že pomocí EM algoritmu dokážeme díky vhodně zvolenému modelu konečných směsí provádět bayesovskou klasifikaci, a to na základě aposteriorních pravděpodobností. Následně e pak možné vypracovat podrobnou analýzu struktury ednotlivých komponent směsi, a to ak z hlediska sociálního složení domácností, tak i demografického či geografického. Konečné směsi sou tedy vhodným stochastickým nástroem pro provádění tzv. klasifikace bez učitele, někdy se také mluví o stochastické klastrové analýze (stochastic cluster analysis, popř. mixture-model-based clustering). p p
14 . Literatura [] DEMPSTER, A. P., LAIRD, N. M. RUBIN, D. B.: Likelihood from Incomplete Data via the EM Algorithm. In Journal of the Royal Statistical Society. Series B (Methodological) 9 (), pp. 8, 977. [] FRALEY, C., RAFTERY, A. E.: MCLUST: Normal Mixture Modeling and Model- Based Clustering. R package version.0-0; 006. [] FREIMER, M., MUDHOLKAR, G.S, KOLLIA, G, LIN, C.T. A study of the generalized Tukey lambda family. In Communications in Statistics Theory and Methods, 7, pp , 988. [] HOROVÁ, I., ZELINKA, J. Contribution to the bandwidth choice for kernel density estimates. In Computational Statistics, Springer,,, pp. -7, 007. [5] JOHNSON, N. L., KOTZ, S, BALAKRISHAN, N.: Continuous univariate distributions, Vol., nd edition.new York: Wiley & Sons, 99. [6] MCCULLAGH, P., NELDER, J.A.: Generalized Linear Models. Chapman and Hall, London 99. [7] MCLACHLAN, G. J., PEEL, D.: Finite mixture models. New York: Wiley & Sons, 000. [8] R Development Core Team: R: A language and environment for statistical computing. R. Foundation for Statistical Computing, Vienna, Austria URL [9] RAMBERG, J.S, SCHMEISER, B.W. : An approximate method for generating asymmetric random variables, In Communications of the Associaion for Computing Machinery, 7, pp. 78-8, 97. [0] SCHWARTZ, G.: Estimating the Dimension of a Model. In The Annals of Statistics, 6 (), pp. 6-6, 978. [] SILVERMAN, B. W.: Density Estimation for Statistics and Data Analysis. Chapman and Hall, New York, 986. [] SU, S.: GLDEX: Fitting Single and Mixture of Generalized Lambda Distributions (RS and FMKL) Using Discretized and Maximum Likelihood Methods. R package version.0.., 007. Kontakt: Marie Forbelská, RNDr., PhD. Ústav matematiky a statistiky, Přírodovědecká fakulta Masarykovy univerzity Kotlářská 6 7 Brno Česká republika forbel@math.muni.cz
Pravděpodobnostní model rozdělení příjmů v České republice
Jitka Bartošová Pravděpodobnostní model rozdělení příjmů v České republice # Jitka Bartošová * Úvod Zkoumání rozdělení příjmů a jeho porovnávání z různých sociálně-ekonomických a časově-prostorových hledisek
VíceROBUST 2014 Jetřichovice ledna
ROBUST 2014 Jetřichovice 19. 24. ledna Jitka Bartošová katedra exaktních metod Vysoká škola ekonomická v Praze Fakulta managementu Jindřichův Hradec Abstrakt Snahy o modelování velkých náhodných výběrů
VícePravděpodobnost a statistika
Pravděpodobnost a statistika Bodové odhady a intervaly spolehlivosti Vilém Vychodil KMI/PRAS, Přednáška 10 Vytvořeno v rámci projektu 963/011 FRVŠ V. Vychodil (KMI/PRAS, Přednáška 10) Bodové odhady a intervaly
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Náhodný výběr Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr
VíceAVDAT Mnohorozměrné metody, metody klasifikace
AVDAT Mnohorozměrné metody, metody klasifikace Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Mnohorozměrné metody Regrese jedna náhodná veličina je vysvětlována pomocí jiných
Více2 Hlavní charakteristiky v analýze přežití
2 Hlavní charakteristiky v analýze přežití Předpokládané výstupy z výuky: 1. Student umí definovat funkci přežití, rizikovou funkci a kumulativní rizikovou funkci a zná funkční vazby mezi nimi 2. Student
VíceX = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní
..08 8cv7.tex 7. cvičení - transformace náhodné veličiny Definice pojmů a základní vzorce Je-li X náhodná veličina a h : R R je měřitelná funkce, pak náhodnou veličinu Y, která je definovaná vztahem X
VíceOdhady Parametrů Lineární Regrese
Odhady Parametrů Lineární Regrese Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké
VíceTestování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času
Testování hypotéz 1 Jednovýběrové testy 90/ odhad času V podmínkách naprostého odloučení má voák prokázat schopnost orientace v čase. Úkolem voáka e provést odhad časového intervalu 1 hodiny bez hodinek
VíceDepartment of Mathematical Analysis and Applications of Mathematics Faculty of Science, Palacký University Olomouc Czech Republic
ROBUST 13. září 2016 regression regresních modelů Categorical Continuous - explanatory, Eva Fišerová Department of Mathematical Analysis and Applications of Mathematics Faculty of Science, Palacký University
VíceApriorní rozdělení. Jan Kracík.
Apriorní rozdělení Jan Kracík jan.kracik@vsb.cz Apriorní rozdělení Apriorní rozdělení (spolu s modelem) reprezentuje informaci o neznámém parametru θ, která je dostupná předem, tj. bez informace z dat.
VíceÚstav matematiky a statistiky Masarykova univerzita Brno. workshopy Finanční matematika v praxi III Matematické modely a aplikace Podlesí
Ústav matematiky a statistiky Masarykova univerzita Brno workshopy Finanční matematika v praxi III Matematické modely a aplikace Podlesí 3. 6. září 2013 Obsah 1 2 3 4 y Motivace y 10 0 10 20 30 40 0 5
Více7 Regresní modely v analýze přežití
7 Regresní modely v analýze přežití Předpokládané výstupy z výuky: 1. Student rozumí významu regresního modelování dat o přežití 2. Student dokáže definovat pojmy poměr rizik a základní riziková funkce
VícePRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady
PRAVDĚPODOBNOST A STATISTIKA Bayesovské odhady Bayesovské odhady - úvod Klasický bayesovský přístup: Klasický přístup je založen na opakování pokusech sledujeme rekvenci nastoupení zvolených jevů Bayesovský
Více4 Parametrické odhady
4 Parametrické odhady Předpokládané výstupy z výuky: 1. Student zná základní rozdělení pravděpodobnosti dat přežití 2. Student rozumí principu odhadu funkce přežití a rizikové funkce s využitím metody
VíceBayesovské metody. Mnohorozměrná analýza dat
Mnohorozměrná analýza dat Podmíněná pravděpodobnost Definice: Uvažujme náhodné jevy A a B takové, že P(B) > 0. Podmíněnou pravěpodobností jevu A za podmínky, že nastal jev B, nazýváme podíl P(A B) P(A
VíceKlasická a robustní ortogonální regrese mezi složkami kompozice
Klasická a robustní ortogonální regrese mezi složkami kompozice K. Hrůzová, V. Todorov, K. Hron, P. Filzmoser 13. září 2016 Kompoziční data kladná reálná čísla nesoucí pouze relativní informaci, x = (x
VíceEva Fišerová a Karel Hron. Katedra matematické analýzy a aplikací matematiky Přírodovědecká fakulta Univerzity Palackého v Olomouci.
Ortogonální regrese pro 3-složkové kompoziční data využitím lineárních modelů Eva Fišerová a Karel Hron Katedra matematické analýzy a aplikací matematiky Přírodovědecká fakulta Univerzity Palackého v Olomouci
VíceOdhady - Sdružené rozdělení pravděpodobnosti
Odhady - Sdružené rozdělení pravděpodobnosti 4. listopadu 203 Kdybych chtěl znát maximum informací o náhodné veličině, musel bych znát všechny hodnoty, které mohou padnout, a jejich pravděpodobnosti. Tedy
VíceTestování změn v binárnách autoregresních modelech Šárka Hudecová 1/ 36
Testování změn v binárnách autoregresních modelech Šárka Hudecová KPMS MFF UK ROBUST 2012 Němčičky 9. 14.9.2012 Testování změn v binárnách autoregresních modelech Šárka Hudecová 1/ 36 Uvažovaná situace
VíceTéma 22. Ondřej Nývlt
Téma 22 Ondřej Nývlt nyvlto1@fel.cvut.cz Náhodná veličina a náhodný vektor. Distribuční funkce, hustota a pravděpodobnostní funkce náhodné veličiny. Střední hodnota a rozptyl náhodné veličiny. Sdružené
VíceCharakterizace rozdělení
Charakterizace rozdělení Momenty f(x) f(x) f(x) μ >μ 1 σ 1 σ >σ 1 g 1 g σ μ 1 μ x μ x x N K MK = x f( x) dx 1 M K = x N CK = ( x M ) f( x) dx ( xi M 1 C = 1 K 1) N i= 1 K i K N i= 1 K μ = E ( X ) = xf
VíceEKONOMICKÁ APLIKACE KOMPOZIČNÍHO REGRESNÍHO MODELU
EKONOMICKÁ APLIKACE KOMPOZIČNÍHO REGRESNÍHO MODELU Klára Hrůzová 1,2, Karel Hron 1,2 1 Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, Univerzita Palackého v Olomouci 2 Katedra
VíceObr. 1: Vizualizace dat pacientů, kontrolních subjektů a testovacího subjektu.
Řešení příkladu - klasifikace testovacího subjektu pomocí Bayesova klasifikátoru: ata si vizualizujeme (Obr. ). Objem mozkových komor 9 8 7 6 5 pacienti kontroly testovací subjekt 5 6 Objem hipokampu Obr.
Více8 Coxův model proporcionálních rizik I
8 Coxův model proporcionálních rizik I Předpokládané výstupy z výuky: 1. Student umí formulovat Coxův model proporcionálních rizik 2. Student rozumí významu regresních koeficientů modelu 3. Student zná
VícePOUŽITÍ KONEČNÝCH SMĚSÍ LOGARITMICKO-NORMÁLNÍCH ROZDĚLENÍ PRO MODELOVÁNÍ PŘÍJMŮ ČESKÝCH DOMÁCNOSTÍ
POUŽITÍ ONEČNÝCH SMĚSÍ LOGARITMICO-NORMÁLNÍCH ROZDĚLENÍ PRO MODELOVÁNÍ PŘÍJMŮ ČESÝCH DOMÁCNOSTÍ Ivana Malá, Vysoká škola ekonomická v Praze Úvod Zkoumání a modelování pravděpodobnostního rozdělení mezd
VíceAVDAT Klasický lineární model, metoda nejmenších
AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i
VíceKredibilitní pojistné v pojištění automobilů. Silvie Zlatošová září 2016, Robust
Silvie Zlatošová 11. - 16. září 2016, Robust Obsah 1 Motivace a cíl 2 Tvorba apriorních tarifních skupin 3 Teorie kredibility 4 Aplikace aposteriorních korekcí Motivace a cíl Obsah 1 Motivace a cíl 2 Tvorba
VícePRAVDĚPODOBNOST A STATISTIKA. Testování hypotéz o rozdělení
PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz o rozdělení Testování hypotéz o rozdělení Nechť X e náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládeme, že neznáme tvar distribuční funkce
VíceMATEMATICKÁ STATISTIKA - XP01MST
MATEMATICKÁ STATISTIKA - XP01MST 1. Úvod. Matematická statistika (statistics) se zabývá vyšetřováním zákonitostí, které v sobě obsahují prvek náhody. Zpracováním hodnot, které jsou výstupem sledovaného
VíceAVDAT Náhodný vektor, mnohorozměrné rozdělení
AVDAT Náhodný vektor, mnohorozměrné rozdělení Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Opakování, náhodná veličina, rozdělení Náhodná veličina zobrazuje elementární
VíceLineární a logistická regrese
Lineární a logistická regrese Martin Branda Univerzita Karlova v Praze Matematicko-fyzikální fakulta Katedra pravděpodobnosti a matematické statistiky Výpočetní prostředky finanční a pojistné matematiky
Víceoddělení Inteligentní Datové Analýzy (IDA)
Vytěžování dat Filip Železný Katedra počítačů oddělení Inteligentní Datové Analýzy (IDA) 22. září 2014 Filip Železný (ČVUT) Vytěžování dat 22. září 2014 1 / 25 Odhad rozdělení Úloha: Vstup: data D = {
VíceMinikurz aplikované statistiky. Minikurz aplikované statistiky p.1
Minikurz aplikované statistiky Marie Šimečková, Petr Šimeček Minikurz aplikované statistiky p.1 Program kurzu základy statistiky a pravděpodobnosti regrese (klasická, robustní, s náhodnými efekty, ev.
Více3 Bodové odhady a jejich vlastnosti
3 Bodové odhady a jejich vlastnosti 3.1 Statistika (Skripta str. 77) Výběr pořizujeme proto, abychom se (více) dověděli o souboru, ze kterého jsme výběr pořídili. Zde se soustředíme na situaci, kdy známe
VíceIntervalové Odhady Parametrů
Parametrů Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení technické v Praze
VíceRobustní statistické metody
Populární úvod Ústav teoretické fyziky a astrofyziky, MU Brno 28. říjen 2006, Vlašim O co jde? Robustní znamená: necitlivý k malým odchylkám od ideálních předpokladů na který je metoda odhadu optimalizována.
VíceHodnocení vlastností materiálů podle ČSN EN 1990, přílohy D
Hodnocení vlastností materiálů podle ČSN EN 1990, přílohy D Miroslav Sýkora Kloknerův ústav, ČVUT v Praze 1. Úvod 2. Kvantil náhodné veličiny 3. Hodnocení jedné veličiny 4. Hodnocení modelu 5. Příklady
Vícevelkou variabilitou: underdispersion, overdispersion)
RNDr. Marie Forbelská, Ph.D. 1 M7222 4. cvičení : GLM04a (Problémy s příliš malou či příliš velkou variabilitou: underdispersion, overdispersion) Mějme náhodný výběry n =(Y 1,...,Y n ) T z rozdělení exponenciálního
VíceZákladní statistické modely Statistické vyhodnocování exp. dat M. Čada ~ cada
Základní statistické modely 1 Statistika Matematická statistika se zabývá interpretací získaných náhodných dat. Snažíme se přiřadit statistickému souboru vhodnou distribuční funkci a najít základní číselné
VíceMetoda backward výběru proměnných v lineární regresi a její vlastnosti
Metoda backward výběru proměnných v lineární regresi a její vlastnosti Aktuárský seminář, 13. dubna 2018 Milan Bašta 1 / 30 1 Metody výběru proměnných do modelu 2 Monte Carlo simulace, backward metoda
VíceSTANOVENÍ SPOLEHLIVOSTI GEOTECHNICKÝCH KONSTRUKCÍ. J. Pruška, T. Parák
STANOVENÍ SPOLEHLIVOSTI GEOTECHNICKÝCH KONSTRUKCÍ J. Pruška, T. Parák OBSAH: 1. Co je to spolehlivost, pravděpodobnost poruchy, riziko. 2. Deterministický a pravděpodobnostní přístup k řešení problémů.
VícePravděpodobnost a statistika
Pravděpodobnost a statistika Normální rozdělení a centrální limitní věta Vilém Vychodil KMI/PRAS, Přednáška 9 Vytvořeno v rámci projektu 2963/2011 FRVŠ V. Vychodil (KMI/PRAS, Přednáška 9) Normální rozdělení
VíceTestování statistických hypotéz
Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné
VíceRegresní analýza 1. Regresní analýza
Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému
Více5. B o d o v é o d h a d y p a r a m e t r ů
5. B o d o v é o d h a d y p a r a m e t r ů Na základě hodnot náhodného výběru z rozdělení určitého typu odhadujeme parametry tohoto rozdělení, tak aby co nejlépe odpovídaly hodnotám výběru. Formulujme
VíceBAYESOVSKÉ ODHADY. Michal Friesl V NĚKTERÝCH MODELECH. Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni
BAYESOVSKÉ ODHADY V NĚKTERÝCH MODELECH Michal Friesl Katedra matematiky Fakulta aplikovaných věd Západočeská univerzita v Plzni Slunce Řidiči IQ Regrese Přežití Obvyklý model Pozorování X = (X 1,..., X
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza
VíceStatistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I
Statistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I Příklad Tahová síla papíru používaného pro výrobu potravinových sáčků je důležitá charakteristika kvality. Je známo, že síla
VíceNeparametrické odhady hustoty pravděpodobnosti
Neparametrické odhady hustoty pravděpodobnosti Václav Hlaváč Elektrotechnická fakulta ČVUT Katedra kybernetiky Centrum strojového vnímání 121 35 Praha 2, Karlovo nám. 13 hlavac@fel.cvut.cz Statistické
VíceŠárka Došlá. Matematicko-fyzikální fakulta Univerzita Karlova v Praze. Bimodální rozdělení. Šárka Došlá. Motivace. Základní pojmy
Matematicko-fyzikální fakulta Univerzita Karlova v Praze 1/20 Joiner (1975): Histogram výšky studentů, který ilustruje bimodalitu lidské výšky. Schilling a kol. (2002): Ve skutečnosti bylo dané unimodální!
VíceIDENTIFIKACE BIMODALITY V DATECH
IDETIFIKACE BIMODALITY V DATECH Jiří Militky Technická universita v Liberci e- mail: jiri.miliky@vslib.cz Milan Meloun Universita Pardubice, Pardubice Motto: Je normální předpokládat normální data? Zvláštnosti
Více10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.
0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti
Více6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový.
6. ZÁKLADY STATIST. ODHADOVÁNÍ X={X 1, X 2,..., X n } výběr z rozdělení s F (x, θ), θ={θ 1,..., θ r } - vektor reálných neznámých param. θ Θ R k. Θ parametrický prostor. Dva základní způsoby odhadu neznámého
VíceNormální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký
VíceOdhad parametrů N(µ, σ 2 )
Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný
VíceVLIV STATISTICKÉ ZÁVISLOSTI NÁHODNÝCH VELIČIN NA SPOLEHLIVOST KONSTRUKCE
IV. ročník celostátní konference SPOLEHLIVOST KONSTRUKCÍ Téma: Posudek - poruchy - havárie 25 23.až 24.4.2003 Dům techniky Ostrava ISBN 80-02-055-7 VLIV STATISTICKÉ ZÁVISLOSTI NÁHODNÝCH VELIČIN NA SPOLEHLIVOST
VíceTESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY
TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY Statistická hypotéza je určitá domněnka (předpoklad) o vlastnostech ZÁKLADNÍHO SOUBORU. Test statistické hypotézy je pravidlo (kritérium), které na základě
Vícesprávně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B.
Zkouška z předmětu KMA/PST. Anotace předmětu Náhodné jevy, pravděpodobnost, podmíněná pravděpodobnost. Nezávislé náhodné jevy. Náhodná veličina, distribuční funkce. Diskrétní a absolutně spojitá náhodná
Vícepravděpodobnosti, popisné statistiky
8. Modelová rozdělení pravděpodobnosti, popisné statistiky Rozdělení pravděpodobnosti Normální rozdělení jako statistický model Přehled a aplikace modelových rozdělení Popisné statistiky Anotace Klasickým
VíceStřední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.
Střední hodnota a rozptyl náhodné veličiny, vybraná rozdělení diskrétních a spojitých náhodných veličin, pojem kvantilu Ing. Michael Rost, Ph.D. Príklad Předpokládejme že máme náhodnou veličinu X která
Vícejevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.
Parametrické metody odhadů z neúplných výběrů 2 1 Metoda maximální věrohodnosti pro cenzorované výběry 11 Náhodné cenzorování Při sledování složitých reálných systémů často nemáme možnost uspořádat experiment
VícePearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.
Ing. Michal Dorda, Ph.D. Př. : Ve vjezdové skupině kolejí byly sledovány počty přijíždějících vlaků za hodinu. Za 5 dní (tedy 360 hodin) přijelo celkem 87 vlaků. Výsledky sledování jsou uvedeny v tabulce.
VíceOdhad parametrů N(µ, σ 2 )
Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný
VíceTLOUŠŤKOVÁ A VÝŠKOVÁ STRUKTURA A JEJÍ MODELOVÁNÍ
TLOUŠŤKOVÁ A VÝŠKOVÁ STRUKTURA A JEJÍ MODELOVÁNÍ 1 Vlastnosti tloušťkové struktury porostu tloušťky mají vyšší variabilitu než výšky světlomilné dřeviny mají křivku početností tlouštěk špičatější a s menší
Více1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou
VíceLWS při heteroskedasticitě
Stochastické modelování v ekonomii a financích Petr Jonáš 7. prosince 2009 Obsah 1 2 3 4 5 47 1 Předpoklad 1: Y i = X i β 0 + e i i = 1,..., n. (X i, e i) je posloupnost nezávislých nestejně rozdělených
VíceVYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ
VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ Michal Kořenář 1 Abstrakt Rozvoj výpočetní techniky v poslední době umožnil také rozvoj výpočetních metod, které nejsou založeny na bázi
VíceACTA UNIVERSITATIS AGRICULTURAE ET SILVICULTURAE MENDELIANAE BRUNENSIS SBORNÍK MENDELOVY ZEMĚDĚLSKÉ A LESNICKÉ UNIVERZITY V BRNĚ
ACTA UNIVERSITATIS AGRICULTURAE ET SILVICULTURAE MENDELIANAE BRUNENSIS SBORNÍK MENDELOVY ZEMĚDĚLSKÉ A LESNICKÉ UNIVERZITY V BRNĚ Ročník LII 6 Číslo 3, 2004 Gasser-Müllerův odhad J. Poměnková Došlo: 8.
VíceStavový model a Kalmanův filtr
Stavový model a Kalmanův filtr 2 prosince 23 Stav je veličina, kterou neznáme, ale chtěli bychom znát Dozvídáme se o ní zprostředkovaně prostřednictvím výstupů Příkladem může býapř nějaký zašuměný signál,
VíceMatematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace
Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace Jan Slovák Masarykova univerzita Fakulta informatiky 28. 11 2. 12. 2016 Obsah přednášky 1 Literatura 2 Střední
Vícez Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin
Příklady k procvičení z Matematické statistiky Poslední úprava. listopadu 207. Konvergence posloupnosti náhodných veličin. Necht X, X 2... jsou nezávislé veličiny s rovnoměrným rozdělením na [0, ]. Definujme
VíceNormální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními
VíceE(X) = np D(X) = np(1 p) 1 2p np(1 p) (n + 1)p 1 ˆx (n + 1)p. A 3 (X) =
Základní rozdělení pravděpodobnosti Diskrétní rozdělení pravděpodobnosti. Pojem Náhodná veličina s Binomickým rozdělením Bi(n, p), kde n je přirozené číslo, p je reálné číslo, < p < má pravděpodobnostní
VícePRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr
VíceÚvod do teorie odhadu. Ing. Michael Rost, Ph.D.
Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost
Více1 Klasická pravděpodobnost. Bayesův vzorec. Poslední změna (oprava): 11. května 2018 ( 6 4)( 43 2 ) ( 49 6 ) 3. = (a) 1 1 2! + 1 3!
Výsledky příkladů na procvičení z NMSA0 Klasická pravděpodobnost. 5. ( 4( 43 ( 49 3. 8! 3! 0! = 5 Poslední změna (oprava:. května 08 4. (a! + 3! + ( n+ n! = n k= ( k+ /k! = n k=0 ( k /k!; (b n k=0 ( k
VíceCharakteristika datového souboru
Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická
VíceEM algoritmus. Proč zahrnovat do modelu neznámé veličiny
EM algoritmus používá se pro odhad nepozorovaných veličin. Jde o iterativní algoritmus opakující dva kroky: Estimate, který odhadne hodnoty nepozorovaných dat, a Maximize, který maximalizuje věrohodnost
VíceVybraná rozdělení náhodné veličiny
3.3 Vybraná rozdělení náhodné veličiny 0,16 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0 Rozdělení Z 3 4 5 6 7 8 9 10 11 12 13 14 15 Život je umění vytvářet uspokojivé závěry na základě nedostatečných předpokladů.
VíceRovnovážné modely v teorii portfolia
3. září 2013, Podlesí Obsah Portfolio a jeho charakteristiky Definice portfolia Výnosnost a riziko aktiv Výnosnost a riziko portfolia Klasická teorie portfolia Markowitzův model Tobinův model CAPM - model
VíceMATEMATICKÁ STATISTIKA
MATEMATICKÁ STATISTIKA 1. Úvod. Matematická statistika se zabývá vyšetřováním zákonitostí, které v sobě obsahují prvek náhody. Zpracováním hodnot, které jsou výstupem sledovaného procesu, se snažíme popsat
Více1/30. Mgr. Jan Šváb Zobecněný lineární model a jeho použití v povinném ručení. 31.3.2006 Seminář z aktuárských věd. Slides by LATEX.
1/30 31.3.2006 Seminář z aktuárských věd Slides by LATEX Mgr. Jan Šváb Zobecněný lineární model a jeho použití v povinném ručení 2/30 Obsah 1 Zobecněné lineární modely (GLZ 1 ) Obecný lineární model (GLM)
VíceFyzikální korespondenční seminář MFF UK
Úloha I.S... náhodná 10 bodů; průměr 7,04; řešilo 45 studentů a) Zkuste vlastními slovy popsat, co je to náhodná veličina a jaké má vlastnosti (postačí vlastními slovy objasnit následující pojmy: náhodná
VíceNEPARAMETRICKÁ DISKRIMINAČNÍ ANALÝZA
ROBUST, 5 58 c JČMF NEPARAMETRICKÁ DISKRIMINAČNÍ ANALÝZA MARIE FORBELSKÁ Abstrakt. In the paper the attention is focused to the application of kernel density estimators to statistical discrimination. After
VíceVlastnosti odhadů ukazatelů způsobilosti
Vlastnosti odhadů ukazatelů způsobilosti Jiří Michálek CQR při Ústavu teorie informace a automatizace AV ČR v Praze Úvod Ve výzkumné zprávě č 06 Odhady koeficientů způsobilosti a jejich vlastnosti viz
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
VícePravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza
VíceVšechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a
Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a báli jste se zeptat Jedinečnou funkcí statistiky je, že umožňuje vědci číselně vyjádřit nejistotu v jeho závěrech. (G. W. Snedecor)
VíceAlternativní přístup k analýze vícefaktorových dat
Alternativní přístup k analýze vícefaktorových dat Kamila Fačevicová 1, Peter Filzmoser 2, Karel Hron 1 1 Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta Univerzity Palackého
Více9. T r a n s f o r m a c e n á h o d n é v e l i č i n y
9. T r a n s f o r m a c e n á h o d n é v e l i č i n y Při popisu procesů zpracováváme vstupní údaj, hodnotu x tak, že výstupní hodnota y závisí nějakým způsobem na vstupní, je její funkcí y = f(x).
VíceBootstrap - konfidenční intervaly a testy
9. prosince 2008 Konfidenční intervaly obecně Máme data X 1...X n F,(iid), kde F neznáme. Konfidenční intervaly obecně Máme data X 1...X n F,(iid), kde F neznáme. Chceme odhadnout θ = t(f), např. t(f)
VíceMATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci
MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci Matematická statistika Matematická statistika se zabývá matematickým
VíceZáklady počtu pravděpodobnosti a metod matematické statistiky
Errata ke skriptu Základy počtu pravděpodobnosti a metod matematické statistiky K. Hron a P. Kunderová Autoři prosí čtenáře uvedeného studijního textu, aby případné další odhalené chyby nad rámec tohoto
VíceZáklady teorie odhadu parametrů bodový odhad
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Odhady parametrů Úkolem výběrového šetření je podat informaci o neznámé hodnotě charakteristiky základního souboru
VíceKVADRATICKÁ KALIBRACE
Petra Širůčková, prof. RNDr. Gejza Wimmer, DrSc. Finanční matematika v praxi III. a Matematické modely a aplikace 4. 9. 2013 Osnova Kalibrace 1 Kalibrace Pojem kalibrace Cíle kalibrace Předpoklady 2 3
VícePRAVDĚPODOBNOST A STATISTIKA. Metoda momentů Metoda maximální věrohodnosti
SP3 Odhady arametrů PRAVDĚPODOBNOST A STATISTIKA Metoda momentů Metoda maimální věrohodnosti SP3 Odhady arametrů Metoda momentů Vychází se z: - P - ravděodobnostní rostor - X je náhodná roměnná s hustotou
VícePatrice Marek. Západočeská univerzita v Plzni. * Podpořeno z OPVK CZ.1.07/2.2.00/
Patrice Marek Západočeská univerzita v Plzni * Podpořeno z OPVK CZ.1.07/2.2.00/15.0377 OBSAH Předmět modelování Přehled modelů Vlastní model Data Experimenty Výsledky a budoucí práce PŘEDMĚT MODELOVÁNÍ
VíceKGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 4. Teoretická rozdělení Mgr. David Fiedor 9. března 2015 Osnova Úvod 1 Úvod 2 3 4 5 Vybraná rozdělení náhodných proměnných normální rozdělení normované normální rozdělení
Více