Asymptotické testy. Univerzita Karlova v Praze Matematicko-fyzikální fakulta. Katedra pravděpodobnosti a matematické statistiky

Rozměr: px
Začít zobrazení ze stránky:

Download "Asymptotické testy. Univerzita Karlova v Praze Matematicko-fyzikální fakulta. Katedra pravděpodobnosti a matematické statistiky"

Transkript

1 Univerzita Karlova v Praze Matematicko-fyzikální fakulta BAKALÁŘSKÁ PRÁCE Jakub Pečánka Asymptotické testy Katedra pravděpodobnosti a matematické statistiky Vedoucí bakalářské práce: Prof. RNDr. Marie Hušková, DrSc. Studijní program: Matematika Studijní obor: Obecná matematika 2006

2 Na tomto místě bych rád poděkoval prof. Huškové za její laskavé vedení, pomoc a rady, které mi poskytla při vytváření této práce. Ke studiu jsem využil vícero literárních pramenů, které jsou uvedeny na konci práce v seznamu literatury. Zvláště rád bych chtěl poděkovat autorům publikací [1] a [2], jejichž díla jsem při psaní této práce používal nejvíce. Prohlašuji, že jsem svou bakalářskou práci napsal samostatně a výhradně s použitím citovaných pramenů. Souhlasím se zapůjčováním práce. V Praze dne 29. května 2006 Jakub Pečánka

3 Název práce: Asymptotické testy Autor: Jakub Pečánka Katedra: Katedra pravděpodobnosti a matematické statistiky Vedoucí bakalářské práce: Prof. RNDr. Marie Hušková, DrSc. vedoucího: huskova@karlin.mff.cuni.cz Abstrakt: Tato práce se zaměřuje na problematiku intervalových odhadů a testů hypotéz založených na centrální limitní větě (CLV). Výsledky z této oblasti se téměř výhradně zaměřují na intervalové odhadování a testování střední hodnoty a rozptylu náhodného výběru. Konstrukce intervalových odhadů na základě CLV umožňuje užít tyto odhady na široké množství náhodných výběrů. V první a druhé kapitole práce jsou formulovány základní teoretické poznatky, které jsou později využity při konstrukci CLV intervalových odhadů a CLV testových kriterií. Jsou uvedeny výsledky jako Ljapunova a Lindebergova centrální limitní věta nebo zákon velkých čísel pro stejně rozdělené náhodné veličiny. Třetí kapitola se soustředí na vlastní sestrojení CLV intervalových odhadů a z nich plynoucích CLV testových kritérií. V závěru práce pak ilustrujeme užití získaných výsledků na čtyřech různých souborech dat. Nejprve na třech generovaných datových souborech pocházejících jednou z normálního a dvakrát z Laplaceova rozdělení porovnáme CLV intervalové odhady a intervalové odhady pro náhodné výběry z normálního rozdělení. Na čtvrtém souboru reálných dat jsou pak testovány hypotézy o střední hodnotě a rozptylu na základě CLV testových kritérií. Klíčová slova: asymptotické testy hypotéz, asymptotické intervalové odhady, normální rozdělení, centrální limitní věty Title: Asymptotic Tests Author: Jakub Pečánka Department: Department of Probability and Mathematical Statistics Supervisor: Prof. RNDr. Marie Hušková, DrSc. Supervisor s address: huskova@karlin.mff.cuni.cz Abstract: Presented thesis deals with problems concerning confidence intervals and test of significance criteria that are based on central limit theorems (CLV). The results almost exclusively regard confidence intervals and test criteria for mean and variance of random samples. The use of CLV when deriving confidence intervals assures large number of applications for the gained results. First two chapters concentrate on formulating theoretical tools that are later used for constructing the CLV confidence intervals and CLV test criteria, which are presented in the third chapter. The last chapter of this paper illustrates the use of the gained results on four particular sets of data. On first three sets of data, one of which is generated from normal distribution and two of which are generated from Laplace distribution, the difference between confidence intervals for normally distributed random samples and CLV confidence intervals is discussed. Then the use of CLV test criteria for tests of mean and variance is demonstrated on the fourth real-life set of data. Keywords: Asymptotic Tests of Significance, Asymptotic Confidence Intervals, Central Limit Theorems, Normal Distribution

4 Obsah Úvod 4 1 Teoretické základy Pojmy a značení Normální rozdělení Kvantily Zákon velkých čísel Centrální limitní věty Testování hypotéz a statistické odhady Náhodný výběr Pojmy testování hypotéz Výběrové charakteristiky při rozdělení N(µ, σ 2 ) Bodový odhad Intervalový odhad Intervalové odhady parametrů N(µ, σ 2 ) Intervalový odhad střední hodnoty Intervalový odhad rozptylu Intervalové odhady a testy hypotéz založené na CLV CLV intervalové odhady CLV intervalový odhad střední hodnoty CLV intervalový odhad rozptylu CLV testování hypotéz CLV testy o střední hodnotě CLV testy o rozptylu Užití CLV intervalových odhadů a CLV testů Data z normálního rozdělení Data z Laplaceova rozdělení s parametry 0 a 1/ Data z Laplaceova rozdělení s parametry 0 a Reálná data Závěr 28 Přílohy 29 Literatura 32

5 Úvod Předložená práce se zabývá problematikou testování hypotéz s důrazem položeným na asymptotické chování posloupností náhodných veličin a na tzv. asymptotické testy. Výsledky zde uvedené se týkají především intervalových odhadů a testů hypotéz o střední hodnotě a rozptylu veličin náhodného výběru. První kapitola je věnována základním pojmům, užitému značení a vybraným tvrzením teorie pravděpodobnosti a matematické statistiky, které jsou v dalším textu užívány. Protože v problematice asymptotického chování náhodného výběru hraje velkou důležitost normální rozdělení, je uvedena jeho definice a základní vztah k dalším důležitým statistickým rozdělením. Asymptotické chování posloupnosti náhodných veličin stojí na dvou základních pilířích - zákonech velkých čísel a centrálních limitních větách. Tato základní tvrzení jsou v úvodní kapitole uvedena v několika formulacích, na nichž se staví v třetí kapitole. Druhá kapitola uvádí přehled některých důležitých pojmů z oblasti intervalových odhadů a testování hypotéz. Jsou zde uvedeny také poznatky o těchto pojmech, které jsou podstatné z hlediska dalšího textu. Ve třetí kapitole se zaměříme na problematiku asymptotických testů vycházejících z poznatků o asymptotickém chování posloupností náhodných veličin. Jsou v ní zkonstruována testová kritéria a asymptotické intervalové odhady veličin náhodného výběru, který není nutně výběrem z normálního rozdělení, avšak pro rostoucí rozsah výběru se mu svým chování přibližuje. Čtvrtá kapitola ilustruje použití sestrojených asymptotických intervalových odhadů a testových kritérií na konkrétních datech. Na generovaných datech, u kterých známe střední hodnotu a rozptyl, jsou studovány odlišnosti CLV intervalových odhadů a odhadů při normálním rozdělení. Na reálných datech pak aplikujeme asymptotická testová kritéria. V této práci jsem většinu tradičních vět matematické statistiky a teorie pravděpodobnosti uvedených v prvních dvou kapitolách nedokazoval. Místo důkazů těchto tvrzení jsou uvedeny odkazy na literaturu, kde lze příslušné důkazy nalézt. Dokázány jsou však tvrzení uvedená v kapitole o asymptotických testech, která je pro tuto práci ústřední.

6 1 Teoretické základy V této kapitole zavedeme základní pojmy teorie pravděpodobnosti a matematické statistiky, které v dalším textu použijeme. Uvedeme základní teoretické poznatky, jako jsou zákony velkých čísel a centrální limitní věty. Mnoho důležitých pojmů a poznatků z teorie pravděpodobnosti a statistiky, které v dalších textu použijeme, však nebudeme uvádět. Jsou obecně známé a v literatuře snadno dohledatelné. 1.1 Pojmy a značení V celém textu pracujeme pouze s reálnými náhodnými veličinami a reálnými náhodnými vektory, které jsou definovány na klasickém pravděpodobnostním prostoru (Ω, A, P). Náhodné veličiny značíme X, Y,... zatímco pro náhodné vektory používáme tučné písmo X, Y,... Necht X je náhodná veličina. Pak symbolem P X označujeme rozdělení náhodné veličiny X, tj. pravděpodobnostní míru indukovanou náhodnou veličinou X definovanou vztahem P X (B) = P(X 1 (B)) pro všechny B R. Skutečnost, že náhodná veličina má rozdělení P X značíme X P X, kde P X většinou nahrazujeme symbolem pro konkrétní rozdělení. Distribuční funkci náhodné veličiny X rozumíme funkci F X : R [0, 1], která je definována vztahem F X (x) = P(X x), x R. Symbolem EX (nebo také µ) označujeme střední hodnotu náhodné veličiny X a varx značí její rozptyl. Rozptyl často značíme také σ 2 a směrodatnou odchylku varx značíme σ. 1.2 Normální rozdělení Tématem práce jsou asymptotické testy a s těmi se úzce váže normální rozdělení. Uved me jeho definici pomocí hustoty: { } 1 f(x) = exp (x µ)2, x R. 2πσ 2 2σ 2 Skutečnost, že náhodná veličina má normální rozdělení s parametry µ a σ 2 značíme X N(µ, σ 2 ). Pokud je µ = 0 a σ 2 = 1, mluvíme o normovaném normálním rozdělení N(0, 1) a jeho hustotu značíme ϕ(x) a distribuční funkci Φ(x). Lze ukázat, že náhodná veličina X N(µ, σ 2 ) má střední hodnotu µ a rozptyl σ 2. Pro účely testování hypotéz a intervalové odhady jsou velmi důležitá i některá další rozdělení. Jedná se především o χ 2 -rozdělení a Studentovo t-rozdělení. Zaved me značení

7 1.3. KVANTILY 6 G n (x) pro distribuční funkci χ 2 n-rozdělení o n stupních volnosti a H n (x) pro distribuční funkci t n -rozdělení o n stupních volnosti. Mezi normálním rozdělením a χ 2 n resp. t n rozděleními platí důležité vztahy popsané v následujících dvou větách. Věta 1.1. Necht X 1,..., X n jsou nezávislé náhodné veličiny s normovaným normálním rozdělením. Pak Z = n X2 k má χ2 n-rozdělení. Důkaz. Viz [1], str. 67, věta Věta 1.2. Necht X a Z jsou nezávislé náhodné veličiny, X N(0, 1), Z χ 2 k. Pak Y = X Z k má tk -rozdělení. Důkaz. Viz [1], str. 74, věta Kvantily Necht F je distribuční funkce nějaké náhodné veličiny. Zaved me na otevřeném intervalu (0, 1) funkci F 1 předpisem F 1 (u) = inf{x : F (x) u}. Tuto funkci budeme nazývat kvantilová funkce odpovídající distribuční funkci F. Hodnotám F 1 (u) se říká kvantily. Je-li F rostoucí funkce, je F 1 obyčejná inverzní funkce. Zaved me nyní symboliku pro označení kvantilů nejdůležitějších rozdělení. Budeme se zabývat normovaným normálním rozdělením, χ 2 n-rozdělením a t n -rozdělením. Normální a t n rozdělení mají nenulové a spojité hustoty na celé reálné ose a proto jsou distribuční funkce Φ(x) a H n (x) spojité a ryze monotónní funkce. Distribuční funkce G n (x) je ryze monotónní na [0, ). Budeme používat následující značení: u α := Φ 1 (α) pro α-kvantil normovaného normálního rozdělení χ α,n := G 1 n (α) pro α-kvantil χ 2 n-rozdělení t α,n := H 1 n (α) pro α-kvantil t n -rozdělení Protože hustoty normálního a t n rozdělení jsou sudé funkce, dostáváme pro jejich kvantily vztahy u α = u 1 α, α (0, 1), t α,n = t 1 α,n, α (0, 1). Pro normální, t n a χ 2 n rozdělení navíc platí následující věta, která nám dává možnost aproximovat distribuční funkce G n (x) a H n (x) pomocí Φ(x).

8 1.4. ZÁKON VELKÝCH ČÍSEL 7 Věta 1.3. Pro distribuční funkce χ 2 n a t n rozdělení platí následující vztahy. Důkaz. Viz [2], str. 108, věta 5.5. lim n(n + x 2n) = Φ(x), x R lim n(x) = Φ(x), x R. χ 2 α,n Důsledkem věty 1.3 je, že pro kvantily při velkých n platí aproximace t. α,n = n + u α 2n.. = uα a 1.4 Zákon velkých čísel Tzv. zákony velkých čísel (ZVČ) jsou důležitým teoretickým nástrojem a my je užijeme při odvozování asymptotických intervalových odhadů. Uved me nejprve definici konvergence skoro jistě a konvergenci v pravděpodobnosti posloupnosti náhodných veličin. Definice 1.4. Necht je dán pravděpodobnostní prostor (Ω, A, P) a necht posloupnost náhodných veličin {X n } n=1 a náhodná veličina X jsou definovany na (Ω, A, P). i) Řekneme, že X n konvergují skoro jistě (s.j.) k X, jestliže lim X n (ω) = X(ω) s.j. pro všechna ω A, kde A A taková, že P (A) = 1. Značíme X n X. ii) Řekneme, že X n konvergují k X v pravděpodobnosti, jestliže pro každé P ɛ > 0 platí lim P( X n X > ɛ) = 0. Značíme X n X. Věta 1.5. Jsou-li X a X n, n N náhodné veličiny, pak platí X n Důkaz. Viz [3], str. 34, věta 6.7. s.j. X X P n X. Platí následující věty, které říkají, že spojité transformace náhodných veličin zachovávají konvergenci v pravděpodobnosti a konvergenci skoro jistě. Analogické věty lze formulovat i pro náhodné vektory. Věta 1.6. Necht T n, n N je posloupnost náhodných veličin a necht tato posloupnost konverguje v pravděpodobnosti k η. Necht h : R R je spojitá funkce. Pak platí h(t n ) Důkaz. Viz [4], str. 433, lemma 1.9. P h(η).

9 1.5. CENTRÁLNÍ LIMITNÍ VĚTY 8 Důsledek 1.7. Necht U n, n N je posloupnost náhodných veličin a necht U n konverguje skoro jistě k η. Necht h : R R je spojitá funkce. Pak platí h(t n ) s.j. h(η). (1.1) Důkaz. Protože podle věty 1.5 každá posloupnost náhodných veličin, která konverguje skoro jistě, konverguje i v pravděpodobnosti, plyne tvrzení (1.1) z věty 1.6. Věta 1.8 (Silný zákon velkých čísel). Necht X n, n N je posloupnost nezávislých náhodných veličin s konečným rozptylem. Necht jsou dána čísla 0 < b 1 b 2..., pro která platí b n a varx k b 2 k <. Potom 1 b n s.j. (X k EX k ) 0. Důkaz. Viz [3], str. 70, věta 12.1 Věta 1.9 (Silný zákon pro stejně rozdělené náhodné veličiny). Necht {X n } n=1 je posloupnost nezávislých stejně rozdělených náhodných veličin. Pak X n s.j. µ pro nějaké µ R, právě tehdy, když E X 1 <. Potom také platí µ = EX 1. Důkaz. Viz [5], str. 336, věta Centrální limitní věty Centrální limitní věty (CLV) formulujeme pomocí konvergence posloupnosti náhodných vektorů (veličin) v distribuci. Definice Označme F n, n N distribuční funkce náhodných veličin X n, n N. Řekneme, že náhodné veličiny X n, n N konvergují v distribuci k náhodné veličině X s distribuční funkcí F, jestliže F n (x) konvergují k F (x) bodově v každém bodě D spojitosti funkce F. Tuto skutečnost pak značíme X n X. CLV se týkají konvergence v distribuci k náhodné veličině s normálním rozdělením. Protože distribuční funkce normálního rozdělení Φ(x) je spojitá v každém bodě x R,

10 1.5. CENTRÁLNÍ LIMITNÍ VĚTY 9 jedná se o konvergenci distribučních funkcí bodově na celém R. Pokud posloupnost náhodných veličin {X n } n=1 konverguje k náhodné veličině s normálním rozdělením o parametrech µ a σ 2, pak říkáme, že má asymptotické normální rozdělení a budeme používat značení D X n N(µ, σ2 ). Uved me nejprve obecnou verzi CLV. Věta 1.11 (Ljapunovova CLV). Necht X n1,...,x nkn n N; označme jsou nezávislé náhodné veličiny, EX ni = µ ni, varx ni = σ 2 ni, E X ni EX ni 3 = ρ 3 ni, i = 1,..., k n Z n = kn i=1 (X ni µ ni ) kn i=1 σ2 ni Necht je splněno ( k n i=1 lim ρ3 ni) 1/3 ( k n = 0. i=1 σ2 ni )1/2 Potom platí Z n D N(0, 1). Důkaz. Viz [2], str. 81, věta 4.9. Následující větu použijeme při konstrukci intervalového odhadu střední hodnoty. Věta Necht Z n D {Y n } n N, pro niž existuje a R takové, že platí Pak platí Je-li navíc a > 0, pak N(0, 1) a necht je dána posloupnost náhodných veličin Y n Z n + Y n Z n Y n P a. (1.2) D N(a, 1). (1.3) D N(0, a2 ). (1.4)

11 1.5. CENTRÁLNÍ LIMITNÍ VĚTY 10 Důkaz. Viz [2], str , věta Uved me ještě jednu verzi CLV. Tato formulace pocházející od finského matematika J.W. Lindeberga se uplatňuje především ve statistice při práci s posloupností stejně rozdělených nezávislých veličin. Věta 1.13 (Lindebergova CLV). Necht X n, n N jsou nezávislé stejně rozdělené náhodné veličiny se střední hodnotou µ a s konečným rozptylem σ 2. Označme Z n = n (X k µ) σ. n Potom platí Z n Důkaz. Viz [3], str. 101, věta D N(0, 1).

12 2 Testování hypotéz a statistické odhady 2.1 Náhodný výběr Při testování hypotéz o parametrech rozdělení pracujeme se souborem dat. Tato data se nejčastěji reprezentují pomocí náhodných veličin respektive náhodných vektorů, u nichž předpokládáme stejné rozdělení a nezávislost. Definice 2.1. Náhodný výběr je n-tice nezávislých náhodných veličin (resp. vektorů) X 1,..., X n se stejným rozdělením a tedy se stejnou distribuční funkcí F. Číslo n se nazývá rozsah výběru. Dále definujme veličiny výběrový průměr a výběrový rozptyl, které nám poslouží při odhadování střední hodnoty a rozptylu veličin náhodného výběru. Definice 2.2. Necht je dán náhodný výběr X 1,..., X n. Položme X n = 1 n X k, S 2 = 1 n 1 (X k X n ) 2. Veličinu X n nazýváme výběrový průměr a S 2 nazýváme výběrový rozptyl. 2.2 Pojmy testování hypotéz Předpokládejme, že X 1,..., X n je náhodný výběr z rozdělení, které je prvkem rodiny {F θ ; θ Θ}, kde Θ B(R k ). Dále předpokládejme, že o parametru θ tohoto rozdělení existují dvě konkurující si hypotézy. Nulová hypotéza H 0 říká, že θ Θ 0 (Θ 0 Θ), a podle alternativní hypotézy H 1 platí θ Θ 1 (Θ 1 = Θ Θ 0 ). Testem nulové hypotézy H 0 proti alternativní hypotéze H 1 rozumíme rozhodovací postup založený na náhodném výběru X = (X 1,..., X n ) T, na jehož základě zamítneme nebo nezamítneme platnost hypotézy H 0. Kritických oborem testu je množina W R n, kterou volíme tak, aby pro předem zvolené α (0, 1) platilo P θ (X W ) α pro všechna θ Θ 0. Hypotézu H 0 zamítáme platí-li X W. Jinak hypotézu H 0 nezamítáme. Hodnota sup θ Θ0 P(X W ) se nazývá hladina testu.

13 2.3. VÝBĚROVÉ CHARAKTERISTIKY PŘI ROZDĚLENÍ N(µ, σ2 ) Výběrové charakteristiky při rozdělení N(µ, σ 2 ) Vlastnosti plynoucí z následující věty mají zásadní význam pro testování hypotéz o střední hodnotě a rozptylu rozdělení veličin náhodného výběru z normálního rozdělení. Věta 2.3. Necht X 1,..., X n je náhodný výběr z N(µ, σ 2 ). Potom platí: i) X n N(µ, σ2 n ); ii) je-li n > 1 a σ 2 > 0, pak (n 1)S 2 /σ 2 χ 2 n 1; iii) je-li n > 2 a σ 2 > 0, pak X n µ S n n tn 1. Důkaz. Viz [1], tvrzení i), ii) viz str. 70, věta 4.21 a tvrzení iii) viz str. 74, věta Bodový odhad Předpokládáme, že X = X 1,..., X n je náhodný vektor, jehož složky tvoří náhodný výběr z rozdělení, které závisí na parametru θ. Parametrickou funkcí nazveme každou borelovsky měřitelnou funkci g : Θ R. Bodový odhad parametrické funkce g(θ) je jakákoliv borelovská funkce φ(x), jejíž funkční předpis nezávisí na parametru θ. Definice 2.4. Odhad φ(x 1,..., X n ) parametrické funkce g(θ) nazveme nestranným, jestliže E θ φ(x 1,..., X n ) = g(θ) pro všechna θ. Odhad φ n (X 1,..., X n ) parametrické funkce g(θ) nazveme konzistentním odhadem, jestliže pro všechna θ Θ platí P θ ( lim φ n (X 1,..., X n ) = g(θ)) = 1. (2.1) Konzistence bodového odhadu znamená, že odhad φ n s rostoucím n konverguje k odhadovanému parametru. Konzistence odhadu zaručuje, že jsme schopni zvětšováním počtu měření zpřesňovat naše znalosti o odhadovaném parametru θ a že jsme schopni dalšími měřeními snížit chybu odhadu pod libovolně malou předem stanovenou mez. Pro nás jsou důležité především odhady X n a Sn. 2 Je-li X 1,..., X n náhodný výběr z rozdělení s konečným rozptylem, pak výběrový průměr X n je nestranným a konzistentním odhadem střední hodnoty náhodného výběru a výběrový rozptyl Sn 2 je nestranným a konzistentním odhadem rozptylu náhodného výběru. (Viz [2], str. 95, věta 5.1) 2.5 Intervalový odhad Mějme náhodný výběr X 1,..., X n, jehož rozdělení závisí na parametru θ a necht je dáno α (0, 1). Řekneme, že (φ L, φ U ) je intervalový odhad g(θ) o spolehlivosti 1 α, jestliže platí P θ (φ L (X 1,..., X n ) < g(θ) < φ U (X 1,..., X n )) = 1 α, θ Θ.

14 2.6. INTERVALOVÉ ODHADY PARAMETRŮ N(µ, σ2 ) 13 Intervalové odhady parametrů náhodného výběru můžeme použít při konstruování testových kritérií pro testy hypotéz o těchto parametrech. Necht X = (X 1,..., X n ) je náhodný výběr z rozdělení, které závisí na parametru θ Θ R k a necht g(θ) je parametrická funkce. Necht jsou dále dány hypotézy H 0 : g(θ) = γ 0 a H 1 : g(θ) γ 0. Je-li (φ L (X), φ U (X)) intervalový odhad parametrické funkce g(θ) o spolehlivosti 1 α, pak pro W := {X R n ; γ 0 / (φ L (X), φ U (X))} platí P θ (X W ) = α a W je tedy kritický obor testu hypotézy H 0 proti H 1 na hladině α. Hypotézu H 0 proto zamítáme, pokud platí γ 0 / (φ L (X), φ U (X)). 2.6 Intervalové odhady parametrů N(µ, σ 2 ) Předpokládejme, že X 1,..., X n je náhodný výběr z normálního rozdělení N(µ, σ 2 ). V definici normálního rozdělení vystupují dva parametry: µ (střední hodnota) a σ 2 (rozptyl). Nyní uvedeme intervalové odhady pro parametry µ a σ Intervalový odhad střední hodnoty Intervalový odhad střední hodnoty µ konstruujeme bud za předpokládané znalosti parametru σ 2, nebo v situaci, kdy σ 2 je neznámá veličina. Intervalový odhad µ při známém σ 2 Pokud známe parametr σ 2, pak aplikací věty 2.3, tvrzení i) sestrojíme intervalový odhad parametru µ o spolehlivosti 1 α ve tvaru: ( ) σ X n u 1 α/2 n, X σ n + u 1 α/2 n (2.2) Dolní intervalový odhad µ je X n u 1 α σ/ n a horní intervalový odhad je X n + u 1 α σ/ n. Spolehlivost obou těchto jednostranných intervalových odhadů je 1 α. Intervalový odhad µ při neznámém σ 2 Předpokládáme-li, že je σ 2 neznámá veličina, použijeme jako její odhad výběrový rozptyl Sn 2 a na základě bodu iii) věty 2.3 sestavíme intervalový odhad parametru µ o spolehlivosti 1 α ve tvaru: ( ) S n X n t 1 α/2,n 1, X S n n + t 1 α/2,n 1. (2.3) n n Dolní intervalový odhad a horní intervalový odhad se z (2.3) lehce odvodí a nebudeme je proto uvádět.

15 2.6. INTERVALOVÉ ODHADY PARAMETRŮ N(µ, σ2 ) Intervalový odhad rozptylu Máme-li sestrojit intervalový odhad rozptylu náhodného výběru z normálního rozdělení, podobně jako u intervalových odhadů střední hodnoty, i zde pracujeme se dvěma různými situacemi - bud µ známe nebo µ neznáme. Intervalový odhad σ 2 při neznámém µ Předpokládáme-li neznalost parametru µ, užitím bodu ii) věty 2.3 dostáváme pro σ 2 intervalový odhad o spolehlivosti 1 α ve tvaru ( ) (n 1)Sn 2, (n 1)S2 n. (2.4) χ 2 1 α/2,n 1 χ 2 α/2,n 1 Intervalový odhad σ 2 při známém µ V případě, že parametr µ známe, můžeme při odhadování σ 2 namísto statistiky Sn 2 využít přesnější odhad rozptylu ve tvaru Kn 2 = 1 n n (X k µ) 2 a dostáváme pro σ 2 intervalový odhad o spolehlivosti 1 α ve tvaru ( ) nk 2 n χ 2 1 α/2,n, nkn 2 χ 2 α/2,n. (2.5)

16 3 Intervalové odhady a testy hypotéz založené na CLV V předcházející kapitole jsme uvedli intervalové odhady střední hodnoty a rozptylu veličin náhodného výběru z normálního rozdělení. V této kapitole sestavíme intervalové odhady pro střední hodnoty a rozptyl obecnějších náhodných výběrů, u nichž vypustíme předpoklad normality jejich rozdělení. Při sestavování těchto intervalových odhadů využijeme limitního chování náhodných výběrů, které plyne z CLV, a proto jim budeme říkat CLV intervalové odhady. 3.1 CLV intervalové odhady Mějme dán náhodný výběr X = (X 1,..., X n ) z rozdělení s distribuční funkcí F µ,σ 2, která závisí na parametrech µ a σ 2, kde µ je střední hodnota a σ 2 je rozptyl. Necht navíc σ 2 (0, ). Poznamenejme, že toto rozdělení nemusí splňovat ani požadavek spojitosti a ryzí monotonie distribuční funkce, může být i diskrétní. Stejně jako u intervalových odhadů pro parametry normálního rozdělení, i v případě CLV intervalových odhadů parametrů µ a σ 2 budeme rozlišovat mezi situací, kdy při odhadování jednoho z parametrů předpokládáme znalost druhého z nich, a situací, kdy tuto znalost nepředpokládáme. CLV intervalové odhady, které v této kapitole uvedeme, budou mít na rozdíl od intervalových odhadů získaných za předpokladu normality hladinu spolehlivosti rovnou 1 α pouze přibližně. Řekneme, že (φ L n(x 1,..., X n ), φ U n (X 1,..., X n )) je intervalový odhad parametrické funkce g(θ) o asymptotické spolehlivosti 1 α, jestliže platí P θ ( φ L n (X 1,..., X n ) < g(θ) < φ U n (X 1,..., X n ) ) 1 α, θ Θ CLV intervalový odhad střední hodnoty Uved me nejprve CLV intervalový odhad pro parametr µ. CLV intervalový odhad µ při známém σ 2 Předpokládáme-li, že rozptyl náhodného výběru je známá konstanta, můžeme na základě věty 1.13 pro výběry velkého rozsahu použít přímo intervalový odhad střední hodnoty normálního rozdělení (2.2) a dostáváme pro parametr µ CLV intervalový odhad o asymptotické spolehlivosti 1 α ve tvaru ( Xn u 1 α/2 σ/ n, X n + u 1 α/2 σ/ n ). (3.1)

17 3.1. CLV INTERVALOVÉ ODHADY 16 CLV intervalový odhad µ při neznámém σ 2 Necht je nyní σ 2 neznámá konstanta. Na základě následující věty můžeme v intervalovém odhadu (3.1) nahradit parametr σ jeho konzistentním odhadem S n = S 2 n. Věta 3.1. Necht X 1, X 2, X 3,... je náhodný výběr se střední hodnotou EX 1 konečným rozptylem varx 1 = σ 2. Pak = µ a Z n = X n µ D n N(0, 1). (3.2) S n Důkaz. Označme θ = (µ, σ 2 ) a definujme náhodné veličiny W n = X n µ σ n, n N. Podle věty 1.13 mají W n asymptoticky normální rozdělení. Výběrový rozptyl Sn 2 je konzistentním odhadem parametru σ 2 a proto podle (2.1) platí Y n = σ/s n Tvrzení (1.4) věty 1.12 dává platnost 1 P θ s.j. Z n = W n Y n = X n µ D n N(0, 1). S n Na základě věty 3.1 a intervalového odhadu (2.2) dostáváme CLV intervalový odhad pro µ o asymptotické spolehlivosti 1 α ve tvaru ( Xn u 1 α/2 S n / n, X n + u 1 α/2 S n / n ). (3.3) Pokud by nás zajímaly jednostranné intervalové odhady pro parametr µ (o asymptotické spolehlivosti 1 α), lehce se odvodí dolní intervalový odhad ve tvaru X n u 1 α S n / n a horní intervalový odhad ve tvaru X n + u 1 α S n / n. Z našeho postupu odvození intervalového odhadu (3.3) je jasné, že obecně bychom mohli za odhad parametru σ 2 vzít jakýkoliv konzistentní odhad, nikoliv pouze Sn. 2 Toho využijeme v následujících odstavcích, v kterých uvedeme dva důležité speciální případy užití asymptotického chování posloupnosti náhodných veličin k odhadování parametrů alternativního a Poissonova rozdělení. Alternativní rozdělení Mějme náhodný výběr X 1,..., X n z alternativního rozdělení A(p). Pro X A(p) platí EX = p a varx = p(1 p). Výběrový průměr X n je konzistentním odhadem parametru p. Proto je X n (1 X n ) konzistentní odhad rozptylu p(1 p) a můžeme jej použít v CLV intervalovém odhadu (3.3) místo S n a dostaneme intervalový odhad parametr p o asymptotické spolehlivosti 1 α ve tvaru ( Xn (1 X n u X n ) 1 α/2, n X Xn (1 n + u X n ) 1 α/2 n ). (3.4)

18 3.1. CLV INTERVALOVÉ ODHADY 17 Použijme výsledek (3.4) k intervalovému odhadnutí hodnoty P(Y > t 0 ), t 0 R, kde Y je nějaká náhodná veličina. Necht Y 1,..., Y n je náhodný výběr ze stejného rozdělení jako má náhodná veličina Y. Definujme náhodné veličiny X i, i = 1,..., n vztahem { 1, když Yi > t X i = 0 0, když Y i t 0. Z nezávislosti veličin náhodného výběru Y 1,..., Y n plyne, že náhodné veličiny X 1,..., X n jsou také nezávislé a všechny mají alternativní rozdělení se stejným parametrem p, kde p = P(Y 1 > t 0 ) =... = P(Y n > t 0 ) = P(Y > t 0 ). Jako intervalový odhad o asymptotické spolehlivosti 1 α pro hodnotu P(Y > t 0 ) můžeme pro velká n použít intervalový odhad pro parametr p alternativního rozdělení náhodného výběru X 1,..., X n ve tvaru (3.4). Poissonovo rozdělení Necht je nyní X 1,..., X n náhodný výběr z Poissonova rozdělení Po(λ). Pro X Po(λ) platí EX = λ a varx = λ. Xn je konzistentním odhadem střední hodnoty náhodného výběru i rozptylu λ. Podobně jako v předchozím odstavci dostáváme pro λ CLV intervalový odhad o asymptotické spolehlivosti 1 α ve tvaru ( X n u 1 α/2 Xn n, X n + u 1 α/ CLV intervalový odhad rozptylu Xn n ). (3.5) Budeme předpokládat, že X 1,..., X n je náhodný výběr z rozdělení o neznámých parametrech µ a σ 2 > 0, kde µ je střední hodnota a σ 2 je rozptyl. Necht dále platí EX 4 <. Označme ν := var(x 1 µ) 2, τ 4 := E(X 1 µ) 4 a S 4 n = (S 2 n) 2. Veličiny X 1,..., X n jsou nezávislé a stejně rozdělené a tedy i ([X 1 µ] 2,..., [X k µ] 2 ) jsou nezávislé a stejně rozdělené se střední hodnotou σ 2 a rozptylem ν. Použijeme-li známý vzorec varx = EX 2 (EX) 2, dostaneme ν = τ 4 σ 4. Z předpokladu EX 4 < plyne konečnost τ 4, tedy i rozptylu ν. Můžeme aplikovat větu 1.13 a dostaneme n (X k µ) 2 nσ 2 nν D N(0, 1). (3.6) Vztah (3.6) nám poslouží jako výchozí bod našich snah odvodit CLV intervalové odhady rozptylu. Budeme postupovat tak, že v (3.6) nahradíme neznámé veličiny jejich vhodnými odhady.

19 3.1. CLV INTERVALOVÉ ODHADY 18 CLV intervalový odhad σ 2 při známém µ Nejprve při intervalovém odhadování σ 2 předpokládejme znalost parametru µ. Abychom získali CLV intervalový odhad σ 2, pozměníme levou stanu (3.6) tak, aby neobsahovala neznámou veličinu ν. Jako odhad momentu ν použijeme statistiku ˆν n = 1 (X k µ) 4 S 4 n n. s.j. Z konvergence Sn 2 σ2 dostaneme užitím důsledku 1.7 platnost Sn 4 Protože také platí 1 n n (X k µ) 4 s.j. τ 4, plyne z věty 1.9, že ˆν n s.j. σ4. s.j. ν. (3.7) Na levé straně (3.6) můžeme podle věty 1.12 nahradit ν odhadem ˆν n a konvergence levé strany v distribuci k normálnímu rozdělení bude zachována. Úpravou (3.6) dostaneme CLV intervalový odhad σ 2 o asymptotické spolehlivosti 1 α při známém µ ve tvaru ( ) 1 (X k µ) 2 u 1 α/2 ˆνn /n, 1 (X k µ) 2 + u 1 α/2 ˆνn /n. (3.8) n n CLV intervalový odhad σ 2 při neznámém µ Pokud předpokládáme, že µ je neznámý parametr, musíme v intervalovém odhadu (3.6) kromě ν nahradit vhodnou statistikou také n (X k µ) 2. Věta 3.2. Necht je dáno m N a X 1,..., X n je náhodný výběr, kde EX1 m platí 1 (X k n X n ) m s.j. E(X 1 µ) m. Důkaz. Platí 1 (X k n X n ) m = 1 n = 1 n = 1 n [(X k µ) ( X n µ)] m j=0 m ( m ( 1) j j (X k µ) m + 1 n = A n + m ( m ( 1) j j j=1 ) (X k µ) m j ( X n µ) j m j=1 ) B jn C jn, ( m ( 1) j j <. Potom ) (X k µ) m j ( X n µ) j

20 3.1. CLV INTERVALOVÉ ODHADY 19 kde A n = 1 n (X k µ) m, B jn = ( X n µ) j, C jn = 1 n (X k µ) m j Protože X 1,..., X n jsou nezávislé a stejně rozdělené, jsou nezávislé a stejně rozdělené také ([X 1 µ] m,..., [X k µ] m ) a podle zákona velkých čísel (věta 1.9) dostáváme, že s.j. A n E(X 1 µ) m s.j. R, C jn E(X 1 µ) m j R, pro všechna j = 1,..., m a B jn = ( 1 ) j n n (X s.j. k µ) 0, pro všechna j = 1,..., m. Zbytek je důsledkem zachování konvergence skoro jistě při spojité transformaci. Jako odhad ν použijeme statistiku ˆω n = 1 n (X k X n ) 4 Sn. 4 Abychom tak mohli učinit, musíme ukázat, že platí Protože již víme, že S 4 n ˆω n s.j. ν. (3.9) s.j. σ4, bude stačit, když ukážeme, že platí 1 n (X k X n ) 4 τ 4 s.j. 0. (3.10) Z věty 3.2 dostáváme, že čtvrtý centrální empirický moment 1 n n (X k X n ) 4 konverguje skoro jistě k čtvrtému centrálnímu momentu τ 4, z čehož plyne platnost (3.10) a tedy také (3.9). Z platnosti (3.9) a tvrzení věty 1.12 plyne, že na levé straně (3.6) můžeme nahradit moment ν jeho odhadem ˆω n a konvergence levé strany v distribuci k normálnímu rozdělení bude zachována. Nyní se zaměřme na n (X k µ) 2. Jednoduchou úpravou výběrového rozptylu Sn 2 dostaneme (n 1)Sn 2 = (X k µ) 2 n( X n µ) 2. Vezměme výraz n 1Sn 2 = 1 n n 1 (X k µ) 2 n n 1 ( X n µ) 2 a ukažme, že ζ n = n ( X n µ) 2 s.j. 0. (3.11) n 1

21 3.2. CLV TESTOVÁNÍ HYPOTÉZ 20 Podle věty 1.7 stačí, když ukážeme, že platí ζn = n 4 n 1 ( X n µ) = 1 4 n2 (n 1) s.j. (X k µ) 0. (3.12) Definujme b k = 4 k 2 (k 1), k N. Pak platí varx k b 2 k = σ 2 1 k k 1 < a z věty 1.8 plyne platnost (3.12) a tedy i (3.11). n Tím jsme ukázali, že n 1 ( X n µ) 2 s.j. 0, z čehož plyne (n 1)S 2 n 1 n 1 (X k µ) 2 s.j. 0. nsn Protože dále (triviálně) platí 2 1, můžeme na levé straně (3.6) nahradit (n 1)Sn 2 n (X k µ) 2 výrazem nsn 2 a společně s (3.9) dostáváme platnost Sn 2 σ 2 D n N(0, 1). ˆωn Protože veličina (Sn 2 σ 2 ) n/ˆω n má asymptoticky normální rozdělení, můžeme zkonstruovat CLV intervalový odhad pro parametr σ 2 o asymptotické spolehlivost 1 α ve tvaru ( ) Sn 2 u 1 α/2 ˆωn /n, Sn 2 + u 1 α/2 ˆωn /n. (3.13) 3.2 CLV testování hypotéz Bud X n = (X 1,..., X n ) náhodný výběr z rozdělení, které závisí na parametru θ. Máme-li na základě X n testovat hypotézu H 0 : θ Θ 0 Θ o parametru θ Θ a je-li dán kritický obor testu W n R n a α (0, 1), řekneme, že hladina testu je asymptoticky rovna α, jestliže sup P θ (X n W n ) α. θ Θ 0 Výsledky, které jsme získali v oddílu 3.1, můžeme aplikovat na CLV testování hypotéz o střední hodnotě µ a rozptylu σ 2 náhodného výběru. Podle principu popsaného v oddílu 2.5 můžeme definovat kritické obory jednotlivých testů pomocí doplňků intervalových odhadů (3.1), (3.3), (3.8) a (3.13). S takto definovanými kritickými obory dospějeme jednoduchými úpravami k CLV testovým kritériím, která nyní uvedeme.

22 3.2. CLV TESTOVÁNÍ HYPOTÉZ CLV testy o střední hodnotě Předpokládejme, že X 1,..., X n je náhodný výběr s konečným a nenulovým rozptylem σ 2. Je-li úkolem testovat H 0 : µ = µ 0 oproti H 1 : µ µ 0, z CLV intervalových odhadů (3.1) a (3.3) získáme následující výsledky. Známé σ 2 Známe-li parametr σ 2, vyjdeme z intervalového odhadu (3.1) a hypotézu H 0 zamítáme na asymptotické hladině α, pokud platí µ 0 X n u 1 α/2 σ n nebo µ 0 X n + u 1 α/2 σ n. To je ekvivalentní platnosti což je CLV testové kritérium daného testu. Neznámé σ 2 X n µ 0 n u1 α/2, (3.14) σ Je-li σ 2 neznámé, užijeme intervalového odhadu (3.3) a H 0 zamítneme na asymptotické hladině α, pokud je splněno CLV kritérium X n µ 0 S n n u1 α/2. (3.15) Kromě těchto poměrně obecných závěrů můžeme z výsledků uvedených v 3.1 získat následující závěry o alternativním rozdělení a Poissonově rozdělení. Alternativní rozdělení Necht je dán náhodný výběr z alternativního rozdělení s parametrem p. Při testu o střední hodnotě p, který testuje hypotézu H 0 : p = p 0 oproti H 1 : p p 0, zamítáme hypotézu H 0 na hladině α, jestliže platí X n p 0 Xn (1 X n ) n u1 α. (3.16) Poissonovo rozdělení Nyní bud X 1,..., X n náhodný výběr z Poissonova rozdělení s parametrem λ. Jak víme, λ je zároveň střední hodnotou i rozptylem tohoto výběru. Při testu H 0 : λ = λ 0 oproti H 1 : λ λ 0 hypotézu H 0 zamítáme na hladině α, jestliže platí X n λ 0 Xn n u1 α. (3.17)

23 3.2. CLV TESTOVÁNÍ HYPOTÉZ CLV testy o rozptylu Máme-li dán náhodný výběr X 1,..., X n se střední hodnotou µ a s konečným čtvrtým absolutním momentem E X 1 4, můžeme z CLV intervalových odhadů (3.8) a (3.13) odvodit následující výsledky. Známé µ Testujeme-li H 0 : σ 2 = σ 2 0 oproti H 1 : σ 2 σ 2 0 a známe-li µ, pak na základě CLV intervalového odhadu (3.8) hypotézu H 0 zamítáme na asymptotické hladině α, jestliže platí Neznámé µ 1 n n (X k µ) 2 σ0 2 n u1 α. (3.18) 1 n n (X k µ) 4 Sn 4 Testujeme-li opět H 0 : σ 2 = σ 2 0 oproti H 1 : σ 2 σ 2 0 a µ neznáme, pak užijeme CLV intervalový odhad (3.13) a hypotézu H 0 zamítáme na asymptotické hladině α, jestliže platí Sn 2 σ0 2 n u1 α 1 n n (X k X. (3.19) n ) 4 Sn 4

24 4 Užití CLV intervalových odhadů a CLV testů V této části budeme na konkrétních výběrech ilustrovat užití uvedených CLV intervalových odhadů. Porovnáme také intervalové odhady získané za předpokladu normality náhodného výběru s CLV intervalovými odhady. 4.1 Data z normálního rozdělení Pomocí statistického software R jsme nagenerovali tři náhodné výběry z normovaného normálního rozdělení. První výběr o rozsahu 10 označme X, druhý výběr, jehož rozsah je 30, označme Y a třetí výběr s rozsahem 80 označme Z. Výběry jsme generovali pomocí příkazů: X<-rnorm(10,mean=0,sd=1); Y<-rnorm(30,mean=0,sd=1); Z<-rnorm(80,mean=0,sd=1); Tímto postupem jsme získali tři soubory dat, které pocházejí z rozdělení se střední hodnotou 0 a rozptylem 1 (data viz Přílohy). Spočítali jsme pro ně následující statistiky: X 10 = 0, 191 Ȳ 30 = 0, 052 Z80 = 0, 100 S 2 10,X = 0, 610 S2 30,Y = 1, 360 S2 80,Z = 1, 056, kde X 10, Ȳ30, Z 80 jsou příslušné výběrové průměry a S10,X 2, S2 30,Y, S2 80,Z jsou odpovídající výběrové rozptyly. Spočtěme nyní intervalové odhady za předpokladu normality a CLV intervalové odhady pro parametry náhodných výběrů X, Y, Z a vzájemně je porovnejme. Obdržené výsledky shrnuje Tabulka 1. Odhady jsou počítány při standardní spolehlivosti 95 % a µ značí střední hodnoty a σ 2 značí rozptyly náhodných výběrů. Čtvrtý sloupec tabulky obsahuje příslušné intervalové odhady (2.2)-(2.5) a v pátém sloupci jsou uvedeny odpovídající CLV intervalové odhady (3.1), (3.3), (3.8) a (3.13). Sloupce RL a RP uvádějí vzájemné porovnání intervalových odhadů na daném řádku tabulky pomocí absolutní hodnoty rozdílu krajních hodnot jednotlivých intervalových odhadů. RL je absolutní hodnota rozdílu levých mezí intervalů a RP je absolutní hodnota rozdílu pravých mezí intervalů.

25 4.2. DATA Z LAPLACEOVA ROZDĚLENÍ S PARAMETRY 0 A 1/ 2 24 Výběr Param. Znalosti Norm. odhad CLV odhad RL RP X (n = 10) µ σ 2 = 1 (-0,810 ; 0,429) (-0,810 ; 0,429) 0,000 0,000 µ σ 2 nezn. (-0,749 ; 0,368) (-0,675 ; 0,294) 0,074 0,074 σ 2 µ = 0 ( 0,286 ; 1,803) ( 0,243 ; 0,928) 0,043 0,875 σ 2 µ nezn. ( 0,289 ; 0,679) ( 0,333 ; 0,887) 0,044 0,208 Y (n = 30) µ σ 2 = 1 (-0,306 ; 0,409) (-0,306 ; 0,409) 0,000 0,000 µ σ 2 nezn. (-0,384 ; 0,487) (-0,366 ; 0,469) 0,018 0,018 σ 2 µ = 0 ( 0,841 ; 2,354) ( 0,622 ; 2,013) 0,219 0,341 σ 2 µ nezn. ( 0,863 ; 1,415) ( 0,643 ; 2,077) 0,220 0,662 Z (n = 80) µ σ 2 = 1 (-0,319 ; 0,119) (-0,319 ; 0,119) 0,000 0,000 µ σ 2 nezn. (-0,329 ; 0,129) (-0,325 ; 0,125) 0,004 0,004 σ 2 µ = 0 ( 0,790 ; 1,474) ( 0,742 ; 1,364) 0,048 0,110 σ 2 µ nezn. ( 0,791 ; 1,076) ( 0,755 ; 1,358) 0,036 0,282 Tabulka 1: Intervalové odhady parametrů výběrů X,Y,Z Z uvedených dat vidíme, že s rostoucím rozsahem výběru se odpovídající intervalové odhady obou parametrů k sobě dobře přibližují. Klesající rozdíl krajních bodů intervalových odhadů (2.3) a (3.3) není překvapující, protože oba intervalové odhady střední hodnoty se liší pouze v užití kvantilů (u 1 α/2 v (2.3) oproti t 1 α/2,n 1 v (3.3)), které se k sobě pro velká n přibližují, jak plyne z věty 1.3. Oproti tomu odlišnost konstrukce intervalových odhadů rozptylu (2.4) a (3.8) resp. (2.5) a (3.13) je mnohem výraznější, než je tomu v případě intervalových odhadů střední hodnoty. I u nich je však patrný pokles odchylek odpovídajících krajních hodnot intervalů. Dodejme, že použijeme-li na výběry X, Y, Z Shapirův-Wilkův test normality, dostaneme pro X p-value rovnou 0,84, pro Y p-value 0,01 a pro Z p-value 0,56. Vidíme, že výběr Y testem normality na hladině 5 % neprojde (narozdíl od zbylých dvou výběrů), a proto se spočtené CLV intervalové odhady především rozptylu, liší od odpovídajících intervalových odhadů při normálním rozdělení výrazněji, než je tomu v případě výběrů X a Z. 4.2 Data z Laplaceova rozdělení s parametry 0 a 1/ 2 Nyní budeme pracovat s výběry, které nepochází z normálního rozdělení, ale z Laplaceova rozdělení o střední hodnotě 0 a rozptylu 1. Sestavme stejným způsobem jako v předchozím odstavci tabulku intervalových odhadů při normálním rozdělení a CLV intervalových odhadů pro 3 náhodné výběry, které jsme nagenerovali v R pomocí příkazů: T<-rnormp(10,mu=0,sigmap=1/sqrt(2),p=1); U<-rnormp(30,mu=0,sigmap=1/sqrt(2),p=1); V<-rnormp(80,mu=0,sigmap=1/sqrt(2),p=1);

26 4.2. DATA Z LAPLACEOVA ROZDĚLENÍ S PARAMETRY 0 A 1/ 2 25 Výběry označíme postupně T, U, V (data viz Přílohy). Jejich výběrové průměry a výběrové rozptyly jsou následující: T 10 = 0, 367 Ū 30 = 0, 052 V80 = 0, 148 S 2 10,T = 0, 802 S2 30,U = 1, 258 S2 80,V = 1, 062 Tabulka intervalových odhadů o (asymptotické) spolehlivosti 5 % vypadá takto: Výběr Param. Znalosti Norm. odhad CLV odhad RL RP T (n = 10) µ σ 2 = 1 (-0,987 ; 0,253) (-0,987 ; 0,253) 0,000 0,000 µ σ 2 nezn. (-1,008 ; 0,274) (-0,922 ; 0,188) 0,086 0,086 σ 2 µ = 0 ( 0,418 ; 2,637) ( 0,040 ; 1,672) 0,378 0,965 σ 2 µ nezn. ( 0,379 ; 0,892) ( 0,329 ; 1,274) 0,050 0,382 U (n = 30) µ σ 2 = 1 (-0,306 ; 0,410) (-0,306 ; 0,410) 0,000 0,000 µ σ 2 nezn. (-0,367 ; 0,471) (-0,349 ; 0,453) 0,035 0,035 σ 2 µ = 0 ( 0,778 ; 2,177) ( 0,383 ; 2,054) 0,395 0,123 σ 2 µ nezn. ( 0,798 ; 1,309) ( 0,410 ; 2,106) 0,388 0,797 V (n = 80) µ σ 2 = 1 (-0,367 ; 0,071) (-0,367 ; 0,071) 0,000 0,000 µ σ 2 nezn. (-0,377 ; 0,082) (-0,374 ; 0,079) 0,003 0,003 σ 2 µ = 0 ( 0,803 ; 1,499) ( 0,505 ; 1,636) 0,298 0,137 σ 2 µ nezn. ( 0,796 ; 1,082) ( 0,526 ; 1,598) 0,270 0,516 Tabulka 2: Intervalové odhady parametrů výběrů T,U,V Testujeme-li normalitu výběrů T, U, V, Shapirův-Wilkův test normality vrátí pro T p-value rovnou 0,362, pro U p-value 0,044 a pro V p-value 0,0003. Testem normality na hladině 5 % projde pouze výběr T, zatímco výběry U a V normalitu nesplňují, přičemž zvláště výběr V má dosaženou hladinu testu velmi nízkou. Podobně jako v případě generovaných výběrů z normálního rozdělení, i zde se v případě střední hodnoty s rostoucím rozsahem výběru rychle zmenšují rozdíly mezi intervalovými odhady pro normální rozdělení a CLV intervalovými odhady (což je opět dáno sbližováním hodnot kvantilů normálního a t rozdělení). V případě rozptylu je však odlišnost intervalových odhadů pro normální rozdělení a CLV intervalových odhadů výraznější. Ani v případě výběru V, jehož rozsah 80 je již poměrně velký, není rozdíl v mezích odpovídajících si intervalových odhadů zanedbatelný, což je patrné zvláště při neznalosti střední hodnoty výběru. Částečně lze možná tuto skutečnost vysvětlit slabou normalitou výběru V. Uvědomíme-li si, že skutečná střední hodnota výběrů T, U, V je 0, a budeme-li chtít pro jednotlivé výběry tuto nulovost na základě uvedených intervalových odhadů střední hodnoty otestovat, pak podle žádného z nich hypotézu H 0 : µ = 0 nezamítáme. Stejně tak testujeme-li pro jednotlivé výběry hypotézu H 0 : σ 2 = 1, podle všech uvedených intervalových odhadů rozptylu ji nezamítáme.

27 4.3. DATA Z LAPLACEOVA ROZDĚLENÍ S PARAMETRY 0 A Data z Laplaceova rozdělení s parametry 0 a 1 Nagenerovali jsme výběry z Laplaceova rozdělení o střední hodnotě 0 a rozptylu 2 pomocí příkazů: K<-rnormp(10,mu=0,sigmap=1,p=1); L<-rnormp(30,mu=0,sigmap=1,p=1); M<-rnormp(80,mu=0,sigmap=1,p=1); Získané výběry označíme postupně K, L, M (data viz Přílohy). Jejich výběrové průměry a výběrové rozptyly jsou následující: K 10 = 0, 513 L30 = 0, 271 M80 = 0, 263 S 2 10,K = 2, 944 S2 30,L = 2, 292 S2 80,m = 1, 688 Tabulka intervalových odhadů o (asymptotické) spolehlivosti 5 % vypadá takto: Výběr Param. Znalosti Norm. odhad CLV odhad RL RP K (n = 10) µ σ 2 = 1 (-0,107 ; 1,133) (-0,107 ; 1,133) 0,000 0,000 µ σ 2 nezn. (-0,714 ; 1,741) (-0,550 ; 1,577) 0,164 0,164 σ 2 µ = 0 ( 1,422 ; 8,972) ( 0,682 ; 5,144) 0,740 3,828 σ 2 µ nezn. ( 1,391 ; 3,275) ( 1,792 ; 4,096) 0,399 0,821 L (n = 30) µ σ 2 = 1 (-0,087 ; 0,629) (-0,087 ; 0,629) 0,000 0,000 µ σ 2 nezn. (-0,294 ; 0,836) (-0,271 ; 0,813) 0,023 0,023 σ 2 µ = 0 ( 1,462 ; 4,089) ( 0,120 ; 4,458) 1,342 0,369 σ 2 µ nezn. ( 1,454 ; 2,385) ( 0,313 ; 4,271) 1,141 1,866 M (n = 80) µ σ 2 = 1 (-0,482 ; 0,044) (-0,482 ; 0,044) 0,000 0,000 µ σ 2 nezn. (-0,552 ; 0,026) (-0,547 ; 0,022) 0,004 0,004 σ 2 µ = 0 ( 1,302 ; 2,430) ( 1,034 ; 2,437) 0,268 0,007 σ 2 µ nezn. ( 1,264 ; 1,719) ( 1,076 ; 2,299) 0,188 0,580 Tabulka 3: Intervalové odhady parametrů výběrů K,L,M Zaměřme se nyní na náhodný výběr M. Dosažená hladina Shapirova-Wilkova testu normality je 0,0099 a testem normality rozdělení na hladině 5 % neprojde. Testujme nyní pro M hypotézu H 0 : σ 2 = 2 za předpokladu neznalosti parametru µ. Protože výběr M pochází z Laplaceova rozdělení s rozptylem 2, víme, že hypotéza H 0 je správná. Avšak v případě intervalového odhadu rozptylu pro normální rozdělení ve tvaru (2.5) hypotézu H 0 zamítáme. Naopak na základě CLV intervalového odhadu (3.13) stejnou hypotézu nezamítáme. To nás varuje před používáním intervalových odhadů pro parametry normálního rozdělení na výběry, které nesplňují předpoklad normality. 4.4 Reálná data Nyní ilustrujme užití CLV intervalových odhadů a CLV testů na reálných datech. Byly naměřeny následující hodnoty, které popisují porodní délku novorozenců ve sledovaném období.

28 4.4. REÁLNÁ DATA Tabulka 4: Porodní délka novorozenců (v cm) Uvedená data reprezentujeme jako náhodný vektor W, u kterého neznáme ani střední hodnotu, ani rozptyl. Nejprve testujme hypotézu, že průměrná délka novorozenců je 50 cm, oproti oboustranné hypotéze. Je tedy H 0 : EW = 50, H 1 : EW 50. Poté testujme hypotézu H 0 : var W = 2 oproti H 1 : var W 2. Hladinu obou testů zvolme 5 %. Pokud aplikujeme na výběr W Shapirův-Wilkův test normality, dosažená hladina testu je 0,002. Na hladině 5 % proto zamítáme normalitu výběru W a nemůžeme pro porodní délku novorozenců použít odhady (2.3) a (2.5). Musíme se spolehnout na odhady (3.3) a (3.13). Vzhledem k rozsahu výběru W (n = 99) a skutečnosti, že lze předpokládat konečnost EW 4, můžeme užít CLV intervalového odhady pro testy obou nulových hypotéz. Spočtené CLV intervalové odhady jsou uvedeny v následující tabulce. Parametr Znalosti CLV intervalový odhad µ σ 2 nezn. (50,290 ; 50,902) σ 2 µ nezn. (1,764 ; 3,049) Tabulka 5: CLV intervalové odhady parametrů výběru W Hodnota 50 neleží v intervalu (50,290; 50,902), proto hypotézu H 0 : EW = 50 na asymptotické hladině 5 % zamítáme. Naopak protože platí 2 (1, 764; 3, 049), hypotézu H 0 : varw = 2 na asymptotické hladině 5 % nezamítáme.

29 Závěr Využití asymptotických testů založených na CLV je ve statistice velmi rozsáhlé a problematika je stále živá. Tato práce se věnovala především CLV intervalovým odhadům střední hodnoty a rozptylu a CLV testování hypotéz o těchto veličinách. Získali jsme nástroje, které můžeme užít pro širokou škálu náhodných výběrů pocházejících z různých rozdělení. Užití CLV intervalových odhadů je v podstatě omezeno pouze rozsahem našich náhodných výběrů (samozřejmě za předpokladu konečnosti příslušných momentů). Asymptotické testy hypotéz o střední hodnotě jsou v literatuře řešeny poměrně často, avšak mnohem méně hojně jsou v literatuře uvedeny výsledky týkající se CLV testů rozptylu náhodného výběru. Předložená práce pomáhá tuto mezeru částečně zaplnit.

30 Přílohy Data k sekci 4.1 Příkaz: X<-rnorm(10,0,1); Data výběru X: 0, ; -0, ; -0, ; -0, ; 1,034077; -1,373475; -0, ; -1,111143; 0, ; 0, ; Příkaz: Y<-rnorm(30,0,1); Data výběru Y : -0, ; -2,816289; 2,351662; -0, ; 1, , ; 0, ; -0,071946; 0, ; 0, ; 0, ; 0, ; -2,297145; 1,078493; 0, ; 0, ; 1,276802; 1,14395; -2,039793; 0, , ; -0, ; -1,286931; 0,498902; 1,104748; -2,011512; 0, ; -0, ; -0, ; 0, ; Příkaz: Z<-rnorm(80,0,1); Data výběru Z: 0, ; 0, ; -2,318912; 0, ; -0, ; 0, ; -0, ; 0, ; -1,997424; -0, ; -2,207608; 0, ; 0, ; 1,186631; -2, , ; -0, ; 1,362335; 0, ; 0, , ; 1,103182; 0,36979; -0,802466; 0, ; -1,04662; 0, ; -0, ; -0, ; 0, ,696478; -0,4767; 0, ; 0, ; -0, , ; -0, ; -1,722207; -0,733607; 0, ; -1,088002; 1,595272; 0,54954; -1,423439; 1, ,390103; -0, ; -0,620827; -1,444182; -0,545271; 1,302936; 2,222901; -1,93181; -0,622174; -0,364043; -0,509919; 0, ; 0, ; -0, ; -1,773387; -1,173061; -1,740122; 0, ; 0, ; -1, ,381621; 1,96563; -1,476945; 0, ; -0, ; -0, ; 0, ; -0, ; 0,348879; -0, , ; 1,966011; 0, ; 0, ; 0,040096;

31 Data k sekci 4.2 Příkaz: T<-rnormp(10,mu=0,sigmap=1/sqrt(2),p=1); Data výběru T : 0, ; 0, ; -0, ; -0, ; -0, ; -1, ; -1, ; -0, ; -0, ; 0, ; Příkaz: U<-rnormp(30,mu=0,sigmap=1/sqrt(2),p=1); Data výběru U: 0, ; -0, ; 1, ; -0, ; 1,938774; -3, , ; 1, ; -0, ; -0, ; 0, ; 0, , ; 0, ; -0, ; 1, ; -1, ; 0, , ; 1, ; 0, ; -0, ; -0, ; 0, ,775239; 0, ; -1, ; -0, ; -0, ; 1, Příkaz: V<-rnormp(80,mu=0,sigmap=1/sqrt(2),p=1); Data výběru V : -0, ; -0, ; -0, ; 1, ; -1, ; 0, ,440094; 0, ; 1, ; -0, ; -0,260059; -4, , ; -1, ; -0,826683; 0, ; 0, ; -0, ,130073; 0, ; 1, ; -0, ; 0,458085; -0, , ; -0, ; 0, ; -0, ; 2, ; -0, , ; 1, ; -0, ; 0, ; 0, ; -0, , ; -1, ; 0, ; 0, ; 0, ; -0, , ; 2, ; 0, ; 0, ; -1, ; 0, , ; 1, ; -0, ; -0,459273; -0,064241; 0, , ; -1, ; 0, ; -1, ; -0, ; -0, , ; -1, ; 0, ; -0, ; 0, ; -0, ; -3, ; -0, ; -0, ; -0, ; -0, ; 0, ; -2, ; 0, ; -0, ; -1, ; 0, ; 0, ; 0, ; -0, ;

32 Data k sekci 4.3 Příkaz: K<-rnormp(10,mu=0,sigmap=1,p=1); Data výběru K: -0, ; -1, ; -0, ; 3, ; 3, ; -0, ; 1, ; -0,382179; 1, ; -1, ; Příkaz: L<-rnormp(30,mu=0,sigmap=1,p=1); Data výběru L: 1, ; -4, ; -0, ; -0, ; 0, ; -0, , ; -1, ; 0, ; -0, ; 0, ; -0, , ; -1, ; 2,689944; -0, ; -2, ; 0, ,046505; -0, ; -1, ; 0, ; -0, ; 0, , ; 0, ; 1, ; 0, ; 1, ; -6, Příkaz: M<-rnormp(80,mu=0,sigmap=1,p=1); Data výběru M: -1, ; 1, ; 0, ; -3, ; 1, ; -2, ; -0, ; -0, ; 0, ; 0,271991; -1, ; 0, ; -2,219047; 0, ; -2, ; 0, ; -1, ; -2, ; 0,068451; 0,144782; -1, ; 1, ; 0, ; 1, ; -0, ; -0, ; 0, ; 0, ; -1,871898; 0, ; 0, ; 1,052518; 0, ; 1, ; 1, ; -0, ; 0, ; -0, ; -1,481541; 0, ; 0, ; -0, ; -0, ; -0, ; -0, ; -1, ; 0, ; 0, ; 1, ; -2, ; 0, ; -0, ; 0, ; 0, ; -1, ; 0, ; 1, ; 0, ; 0,670738; -4, ; -0, ; -1, ; 1,395953; 0, ; -2, ; 0, ; -0,986708; 0, ; 0, ; -2, ; -0, ; -1, ; -0, ; 0,144749; -1, ; 1, ; 2, ; 0, ; -0, ; -0, ;

Výběrové charakteristiky a jejich rozdělení

Výběrové charakteristiky a jejich rozdělení Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový

Více

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin Příklady k procvičení z Matematické statistiky Poslední úprava. listopadu 207. Konvergence posloupnosti náhodných veličin. Necht X, X 2... jsou nezávislé veličiny s rovnoměrným rozdělením na [0, ]. Definujme

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz. Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení

Více

Intervalové Odhady Parametrů

Intervalové Odhady Parametrů Parametrů Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení technické v Praze

Více

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné

Více

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D. Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost

Více

1 Klasická pravděpodobnost. Bayesův vzorec. Poslední změna (oprava): 11. května 2018 ( 6 4)( 43 2 ) ( 49 6 ) 3. = (a) 1 1 2! + 1 3!

1 Klasická pravděpodobnost. Bayesův vzorec. Poslední změna (oprava): 11. května 2018 ( 6 4)( 43 2 ) ( 49 6 ) 3. = (a) 1 1 2! + 1 3! Výsledky příkladů na procvičení z NMSA0 Klasická pravděpodobnost. 5. ( 4( 43 ( 49 3. 8! 3! 0! = 5 Poslední změna (oprava:. května 08 4. (a! + 3! + ( n+ n! = n k= ( k+ /k! = n k=0 ( k /k!; (b n k=0 ( k

Více

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013 Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika Podrobnější rozpis okruhů otázek pro třetí část SZZ Verze: 13. června 2013 1 Úvodní poznámky 6 Smyslem SZZ by nemělo být toliko

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak. 8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) e, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá normované

Více

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně

Definice 7.1 Nechť je dán pravděpodobnostní prostor (Ω, A, P). Zobrazení. nebo ekvivalentně 7 Náhodný vektor Nezávislost náhodných veličin Definice 7 Nechť je dán pravděpodobnostní prostor (Ω, A, P) Zobrazení X : Ω R n, které je A-měřitelné, se nazývá (n-rozměrný) náhodný vektor Měřitelností

Více

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. 1 Statistické odhady Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. Odhad lze provést jako: Bodový odhad o Jedna číselná hodnota Intervalový

Více

Pravděpodobnost a statistika

Pravděpodobnost a statistika Pravděpodobnost a statistika Bodové odhady a intervaly spolehlivosti Vilém Vychodil KMI/PRAS, Přednáška 10 Vytvořeno v rámci projektu 963/011 FRVŠ V. Vychodil (KMI/PRAS, Přednáška 10) Bodové odhady a intervaly

Více

prof. RNDr. Roman Kotecký DrSc., Dr. Rudolf Blažek, PhD Pravděpodobnost a statistika Katedra teoretické informatiky Fakulta informačních technologií

prof. RNDr. Roman Kotecký DrSc., Dr. Rudolf Blažek, PhD Pravděpodobnost a statistika Katedra teoretické informatiky Fakulta informačních technologií prof. RNDr. Roman Kotecký DrSc., Dr. Rudolf Blažek, PhD Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení technické v Praze c Rudolf Blažek, Roman Kotecký, 2011 Pravděpodobnost

Více

5. T e s t o v á n í h y p o t é z

5. T e s t o v á n í h y p o t é z 5. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

Základy teorie odhadu parametrů bodový odhad

Základy teorie odhadu parametrů bodový odhad Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Odhady parametrů Úkolem výběrového šetření je podat informaci o neznámé hodnotě charakteristiky základního souboru

Více

5 Parametrické testy hypotéz

5 Parametrické testy hypotéz 5 Parametrické testy hypotéz 5.1 Pojem parametrického testu (Skripta str. 95-96) Na základě výběru srovnáváme dvě tvrzení o hodnotě určitého parametru θ rozdělení f(x, θ). První tvrzení (které většinou

Více

Limitní věty teorie pravděpodobnosti. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Limitní věty teorie pravděpodobnosti. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jestliže opakujeme nezávisle nějaký pokus, můžeme z pozorovaných hodnot sestavit rozdělení relativních četností

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

12. cvičení z PST. 20. prosince 2017

12. cvičení z PST. 20. prosince 2017 1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace

Více

Ing. Michael Rost, Ph.D.

Ing. Michael Rost, Ph.D. Úvod do testování hypotéz, jednovýběrový t-test Ing. Michael Rost, Ph.D. Testovaná hypotéza Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru, např. o parametru Θ, pak takovéto tvrzení

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 8. KAPITOLA STATISTICKÉ TESTOVÁNÍ HYPOTÉZ 22.11.2016 Opakování: CLV příklad 1 Zadání: Před volbami je v populaci státu 52 % příznivců

Více

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D. Střední hodnota a rozptyl náhodné veličiny, vybraná rozdělení diskrétních a spojitých náhodných veličin, pojem kvantilu Ing. Michael Rost, Ph.D. Príklad Předpokládejme že máme náhodnou veličinu X která

Více

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní ..08 8cv7.tex 7. cvičení - transformace náhodné veličiny Definice pojmů a základní vzorce Je-li X náhodná veličina a h : R R je měřitelná funkce, pak náhodnou veličinu Y, která je definovaná vztahem X

Více

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně Testování hypotéz Nechť,, je náhodný výběr z nějakého rozdělení s neznámými parametry. Máme dvě navzájem si odporující hypotézy o parametrech daného rozdělení: Nulová hypotéza parametry (případně jediný

Více

NMSA202 PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA POZNÁMKY O ZKOUŠCE

NMSA202 PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA POZNÁMKY O ZKOUŠCE Datum poslední aktualizace: 13. června 2014 NMSA202 PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA POZNÁMKY O ZKOUŠCE Zkouška má písemnou a ústní část. Nejdříve je písemná část, která se dále dělí na početní

Více

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin EuroMISE Centrum Kontakt: Literatura: Obecné informace Zvárová, J.: Základy statistiky pro biomedicínskéobory I. Vydavatelství

Více

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457. 0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

MATEMATICKÁ STATISTIKA.   Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci Matematická statistika Matematická statistika se zabývá matematickým

Více

Aproximace binomického rozdělení normálním

Aproximace binomického rozdělení normálním Aproximace binomického rozdělení normálním Aproximace binomického rozdělení normálním Příklad Sybilla a Kassandra tvrdí, že mají telepatické schopnosti, a chtějí to dokázat následujícím pokusem: V jedné

Více

Mgr. Rudolf Blažek, Ph.D. prof. RNDr. Roman Kotecký Dr.Sc.

Mgr. Rudolf Blažek, Ph.D. prof. RNDr. Roman Kotecký Dr.Sc. Náhodné veličiny III Mgr. Rudolf Blažek, Ph.D. prof. RNDr. Roman Kotecký Dr.Sc. Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení technické v Praze c Rudolf Blažek, Roman

Více

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY Statistická hypotéza je určitá domněnka (předpoklad) o vlastnostech ZÁKLADNÍHO SOUBORU. Test statistické hypotézy je pravidlo (kritérium), které na základě

Více

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin EuroMISE Centrum I. ÚVOD vv této přednášce budeme hovořit o jednovýběrových a dvouvýběrových testech týkajících se střední hodnoty

Více

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y 9. T r a n s f o r m a c e n á h o d n é v e l i č i n y Při popisu procesů zpracováváme vstupní údaj, hodnotu x tak, že výstupní hodnota y závisí nějakým způsobem na vstupní, je její funkcí y = f(x).

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace Jan Slovák Masarykova univerzita Fakulta informatiky 28. 11 2. 12. 2016 Obsah přednášky 1 Literatura 2 Střední

Více

populace soubor jednotek, o jejichž vlastnostech bychom chtěli vypovídat letní semestr Definice subjektech.

populace soubor jednotek, o jejichž vlastnostech bychom chtěli vypovídat letní semestr Definice subjektech. Populace a Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 1 populace soubor jednotek, o jejichž vlastnostech bychom

Více

I. D i s k r é t n í r o z d ě l e n í

I. D i s k r é t n í r o z d ě l e n í 6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 11. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 27 Obsah 1 Testování statistických hypotéz 2

Více

MATEMATICKÁ STATISTIKA

MATEMATICKÁ STATISTIKA MATEMATICKÁ STATISTIKA 1. Úvod. Matematická statistika se zabývá vyšetřováním zákonitostí, které v sobě obsahují prvek náhody. Zpracováním hodnot, které jsou výstupem sledovaného procesu, se snažíme popsat

Více

Náhodný vektor a jeho charakteristiky

Náhodný vektor a jeho charakteristiky Náhodný vektor a jeho číselné charakteristiky 1 Náhodný vektor a jeho charakteristiky V následující kapitole budeme věnovat pozornost pouze dvourozměřnému náhodnému vektoru, i když uvedené pojmy a jejich

Více

Charakterizace rozdělení

Charakterizace rozdělení Charakterizace rozdělení Momenty f(x) f(x) f(x) μ >μ 1 σ 1 σ >σ 1 g 1 g σ μ 1 μ x μ x x N K MK = x f( x) dx 1 M K = x N CK = ( x M ) f( x) dx ( xi M 1 C = 1 K 1) N i= 1 K i K N i= 1 K μ = E ( X ) = xf

Více

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Statistika, Biostatistika pro kombinované studium. Jan Kracík Statistika, Biostatistika pro kombinované studium Letní semestr 2014/2015 Tutoriál č. 6: ANOVA Jan Kracík jan.kracik@vsb.cz Obsah: Testování hypotéz opakování ANOVA Testování hypotéz (opakování) Testování

Více

p(x) = P (X = x), x R,

p(x) = P (X = x), x R, 6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme

Více

Normální rozložení a odvozená rozložení

Normální rozložení a odvozená rozložení I Normální rozložení a odvozená rozložení I.I Normální rozložení Data, se kterými pracujeme, pocházejí z různých rozložení. Mohou být vychýlena (doleva popř. doprava, nebo v nich není na první pohled vidět

Více

ÚVOD DO TEORIE ODHADU. Martina Litschmannová

ÚVOD DO TEORIE ODHADU. Martina Litschmannová ÚVOD DO TEORIE ODHADU Martina Litschmannová Obsah lekce Výběrové charakteristiky parametry populace vs. výběrové charakteristiky limitní věty další rozdělení pravděpodobnosti (Chí-kvadrát (Pearsonovo),

Více

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 5. Odhady parametrů základního souboru Mgr. David Fiedor 16. března 2015 Vztahy mezi výběrovým a základním souborem Osnova 1 Úvod, pojmy Vztahy mezi výběrovým a základním

Více

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) . Statistika Teorie odhadu statistická indukce Intervalový odhad µ, σ 2 a π Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 21. února 2012 Statistika

Více

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B TESTOVÁNÍ HYPOTÉZ Od statistického šetření neočekáváme pouze elementární informace o velikosti některých statistických ukazatelů. Používáme je i k ověřování našich očekávání o výsledcích nějakého procesu,

Více

správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B.

správně - A, jeden celý příklad správně - B, jinak - C. Pro postup k ústní části zkoušky je potřeba dosáhnout stupně A nebo B. Zkouška z předmětu KMA/PST. Anotace předmětu Náhodné jevy, pravděpodobnost, podmíněná pravděpodobnost. Nezávislé náhodné jevy. Náhodná veličina, distribuční funkce. Diskrétní a absolutně spojitá náhodná

Více

Cvičení ze statistiky - 8. Filip Děchtěrenko

Cvičení ze statistiky - 8. Filip Děchtěrenko Cvičení ze statistiky - 8 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Centrální limitní věta Laplaceho věta (+ korekce na spojitost) Konfidenční intervaly

Více

Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která

Náhodná veličina a její charakteristiky. Před provedením pokusu jeho výsledek a tedy ani sledovanou hodnotu neznáte. Proto je proměnná, která Náhodná veličina a její charakteristiky Náhodná veličina a její charakteristiky Představte si, že provádíte náhodný pokus, jehož výsledek jste schopni ohodnotit nějakým číslem. Před provedením pokusu jeho

Více

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení Způsoby statistického šetření Vyčerpávající šetření prošetření všech jednotek statistického souboru (populace) Výběrové šetření ze základního souboru

Více

Pravděpodobnost a statistika

Pravděpodobnost a statistika Pravděpodobnost a statistika Normální rozdělení a centrální limitní věta Vilém Vychodil KMI/PRAS, Přednáška 9 Vytvořeno v rámci projektu 2963/2011 FRVŠ V. Vychodil (KMI/PRAS, Přednáška 9) Normální rozdělení

Více

y = 0, ,19716x.

y = 0, ,19716x. Grafické ověřování a testování vybraných modelů 1 Grafické ověřování empirického rozdělení Při grafické analýze empirického rozdělení vycházíme z empirické distribuční funkce F n (x) příslušné k náhodnému

Více

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN Rovnoměrné rozdělení R(a,b) rozdělení s konstantní hustotou pravděpodobnosti v intervalu (a,b) f( x) distribuční funkce 0 x a F( x) a x b b a 1 x b b 1 a x a a x b

Více

12. prosince n pro n = n = 30 = S X

12. prosince n pro n = n = 30 = S X 11 cvičení z PSI 1 prosince 018 111 test střední hodnoty normálního rozdělení při známém rozptylu Teploměrem o jehož chybě předpokládáme že má normální rozdělení se směrodatnou odchylkou σ = 3 jsme provedli

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 2. KAPITOLA PODMÍNĚNÁ PRAVDĚPODOBNOST 3. KAPITOLA NÁHODNÁ VELIČINA 9.11.2017 Opakování Uveďte příklad aplikace geometrické definice pravděpodobnosti

Více

Téma 22. Ondřej Nývlt

Téma 22. Ondřej Nývlt Téma 22 Ondřej Nývlt nyvlto1@fel.cvut.cz Náhodná veličina a náhodný vektor. Distribuční funkce, hustota a pravděpodobnostní funkce náhodné veličiny. Střední hodnota a rozptyl náhodné veličiny. Sdružené

Více

Charakteristika datového souboru

Charakteristika datového souboru Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex

Více

Matematika III. Miroslava Dubcová, Daniel Turzík, Drahoslava Janovská. Ústav matematiky

Matematika III. Miroslava Dubcová, Daniel Turzík, Drahoslava Janovská. Ústav matematiky Matematika III Řady Miroslava Dubcová, Daniel Turzík, Drahoslava Janovská Ústav matematiky Přednášky ZS 202-203 Obsah Číselné řady. Součet nekonečné řady. Kritéria konvergence 2 Funkční řady. Bodová konvergence.

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Náhodný výběr Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

Příklad datového souboru. Pravděpodobnost vs. statistika. Formální definice. Teorie odhadu

Příklad datového souboru. Pravděpodobnost vs. statistika. Formální definice. Teorie odhadu Pravděpodobnost vs. statistika Teorie pravděpodobnosti pracuje s jednou nebo více teoretickými náhodnými veličinami, jejichž rozdělení je známo Statistika odvozovali jsme charakteristiky těchto rozdělení

Více

2 ) 4, Φ 1 (1 0,005)

2 ) 4, Φ 1 (1 0,005) Příklad 1 Ze zásilky velkého rozsahu byl náhodně vybrán soubor obsahující 1000 kusů. V tomto souboru bylo zjištěno 26 kusů nekvalitních. Rozhodněte, zda je možné s 99% jistotou tvrdit, že zásilka obsahuje

Více

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Zpracování dat v edukačních vědách - Testování hypotéz Kamila Fačevicová Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Obsah seminářů 5.11. Úvod do matematické

Více

Radka Picková Transformace náhodných veličin

Radka Picková Transformace náhodných veličin Univerzita Karlova v Praze Matematicko-fyzikální fakulta BAKALÁŘSKÁ PRÁCE Radka Picková Transformace náhodných veličin Katedra pravděpodobnosti a matematické statistiky Vedoucí bakalářské práce: Mgr Zdeněk

Více

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y 9. T r a n s f o r m a c e n á h o d n é v e l i č i n Při popisu procesů zpracováváme vstupní údaj, hodnotu x tak, že výstupní hodnota závisí nějakým způsobem na vstupní, je její funkcí = f(x). Pokud

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test) Jarqueův a Beryho test normality (Jarque-Bera Test, JB test) Autoři: Carlos M. Jarque and Anil K. Bera Předpoklady: - Výběrová data mohou obsahovat chybějící pozorování (chybějící hodnoty) vhodné zejména

Více

MATEMATICKÁ STATISTIKA - XP01MST

MATEMATICKÁ STATISTIKA - XP01MST MATEMATICKÁ STATISTIKA - XP01MST 1. Úvod. Matematická statistika (statistics) se zabývá vyšetřováním zákonitostí, které v sobě obsahují prvek náhody. Zpracováním hodnot, které jsou výstupem sledovaného

Více

Vybraná rozdělení náhodné veličiny

Vybraná rozdělení náhodné veličiny 3.3 Vybraná rozdělení náhodné veličiny 0,16 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0 Rozdělení Z 3 4 5 6 7 8 9 10 11 12 13 14 15 Život je umění vytvářet uspokojivé závěry na základě nedostatečných předpokladů.

Více

Základy počtu pravděpodobnosti a metod matematické statistiky

Základy počtu pravděpodobnosti a metod matematické statistiky Errata ke skriptu Základy počtu pravděpodobnosti a metod matematické statistiky K. Hron a P. Kunderová Autoři prosí čtenáře uvedeného studijního textu, aby případné další odhalené chyby nad rámec tohoto

Více

Přednáška. Další rozdělení SNP. Limitní věty. Speciální typy rozdělení. Další rozdělení SNP Limitní věty Speciální typy rozdělení

Přednáška. Další rozdělení SNP. Limitní věty. Speciální typy rozdělení. Další rozdělení SNP Limitní věty Speciální typy rozdělení VI Přednáška Další rozdělení SNP Limitní věty Speciální typy rozdělení Rovnoměrné rozdělení R(a,b) Příklad Obejít celý areál trvá strážnému 30 minut. Jaká je pravděpodobnost, že u vrátnice budete čekat

Více

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 Opakování t- vs. neparametrické Wilcoxonův jednovýběrový test Opakování

Více

Bootstrap - konfidenční intervaly a testy

Bootstrap - konfidenční intervaly a testy 9. prosince 2008 Konfidenční intervaly obecně Máme data X 1...X n F,(iid), kde F neznáme. Konfidenční intervaly obecně Máme data X 1...X n F,(iid), kde F neznáme. Chceme odhadnout θ = t(f), např. t(f)

Více

8. Normální rozdělení

8. Normální rozdělení 8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, 2 ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) 2 e 2 2, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá

Více

Pravděpodobnost a statistika (BI-PST) Cvičení č. 4

Pravděpodobnost a statistika (BI-PST) Cvičení č. 4 Pravděpodobnost a statistika (BI-PST) Cvičení č. 4 J. Hrabáková, I. Petr, F. Štampach, D. Vašata Katedra aplikované matematiky Fakulta informačních technologií České vysoké učení technické v Praze ZS 2014/2015

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie ZS 2015/16 Cvičení 1: Opakování ze statistiky LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE Z čeho studovat 1) Z KNIHY Krkošková,

Více

NMFM301 Statistika pro finanční matematiky. Michal Kulich

NMFM301 Statistika pro finanční matematiky. Michal Kulich NMFM301 Statistika pro finanční matematiky Přehledový větník Michal Kulich Naposledy upraveno dne 27. září 2014. Katedra pravděpodobnosti a matematické statistiky Matematicko-fysikální fakulta University

Více

Přijímací zkouška na navazující magisterské studium 2014

Přijímací zkouška na navazující magisterské studium 2014 Přijímací zkouška na navazující magisterské studium 24 Příklad (25 bodů) Spočtěte Studijní program: Studijní obor: Matematika Finanční a pojistná matematika Varianta A M x 2 dxdy, kde M = {(x, y) R 2 ;

Více

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0. 11 cvičení z PSI 12-16 prosince 2016 111 (Test dobré shody - geometrické rozdělení Realizací náhodné veličiny X jsme dostali následující četnosti výsledků: hodnota 0 1 2 3 4 5 6 pozorovaná četnost 29 15

Více

Riemannův určitý integrál

Riemannův určitý integrál Riemannův určitý integrál 1. Motivační příklad Příklad (Motivační příklad pro zavedení Riemannova integrálu). Nechť,. Vypočtěme obsah vybarvené oblasti ohraničené grafem funkce, osou a svislými přímkami

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními

Více

Pravděpodobnost a matematická statistika

Pravděpodobnost a matematická statistika Pravděpodobnost a matematická statistika Příklady k přijímacím zkouškám na doktorské studium 1 Popisná statistika Určete aritmetický průměr dat, zadaných tabulkou hodnot x i a četností n i x i 1 2 3 n

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1 Testování statistických hypotéz Ing. Michal Dorda, Ph.D. 1 Úvodní poznámky Statistickou hypotézou rozumíme hypotézu o populaci (základním souboru) např.: Střední hodnota základního souboru je rovna 100.

Více

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost

Náhodná veličina Číselné charakteristiky diskrétních náhodných veličin Spojitá náhodná veličina. Pravděpodobnost Pravděpodobnost Náhodné veličiny a jejich číselné charakteristiky Petr Liška Masarykova univerzita 19.9.2014 Představme si, že provádíme pokus, jehož výsledek dokážeme ohodnotit číslem. Před provedením

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická

Více

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Výsledky některých náhodných pokusů jsou přímo vyjádřeny číselně (např. při hodu kostkou padne 6). Náhodnou veličinou

Více

Statistika II. Jiří Neubauer

Statistika II. Jiří Neubauer Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Zaměříme se především na popis dvourozměrných náhodných veličin (vektorů). Definice Nechť X a Y jsou

Více

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina Testování hypotéz Analýza dat z dotazníkových šetření Kuranova Pavlina Statistická hypotéza Možné cíle výzkumu Srovnání účinnosti různých metod Srovnání výsledků různých skupin Tzn. prokázání rozdílů mezi

Více