Odhad parametrů N(µ, σ 2 )

Podobné dokumenty
Odhad parametrů N(µ, σ 2 )

Nestranný odhad Statistické vyhodnocování exp. dat M. Čada

Základní statistické modely Statistické vyhodnocování exp. dat M. Čada ~ cada

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Pravděpodobnost a matematická statistika

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

3 Bodové odhady a jejich vlastnosti

Interval spolehlivosti t rozdělení

PRAVDĚPODOBNOST A STATISTIKA

AVDAT Klasický lineární model, metoda nejmenších

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

KGG/STG Statistika pro geografy

8. Normální rozdělení

Základy teorie odhadu parametrů bodový odhad

Odhady Parametrů Lineární Regrese

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

Normální (Gaussovo) rozdělení

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Výběrové charakteristiky a jejich rozdělení

Přijímací zkouška na navazující magisterské studium 2014

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

Regresní a korelační analýza

Regresní a korelační analýza

Regresní a korelační analýza

Náhodné chyby přímých měření

Regresní analýza 1. Regresní analýza

Regresní a korelační analýza

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Lineární regrese. Komentované řešení pomocí MS Excel

AVDAT Nelineární regresní model

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel

Testování hypotéz o parametrech regresního modelu

Charakterizace rozdělení

Testování hypotéz o parametrech regresního modelu

Interval spolehlivosti velký výběr

Regresní a korelační analýza

Náhodné (statistické) chyby přímých měření

5. Lokální, vázané a globální extrémy

STATISTICKÉ ODHADY Odhady populačních charakteristik

Normální (Gaussovo) rozdělení

Chyby měření 210DPSM

1 Linearní prostory nad komplexními čísly

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Časové řady, typy trendových funkcí a odhady trendů

KGG/STG Statistika pro geografy

Bodové a intervalové odhady parametrů v regresním modelu

STATISTICKÉ ZJIŠŤOVÁNÍ

Intervalové Odhady Parametrů

Regrese. 28. listopadu Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly:

LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica

populace soubor jednotek, o jejichž vlastnostech bychom chtěli vypovídat letní semestr Definice subjektech.

Generování pseudonáhodných. Ing. Michal Dorda, Ph.D.

PRAVDĚPODOBNOST A STATISTIKA

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

Metoda nejmenších čtverců Michal Čihák 26. listopadu 2012

Polynomy a interpolace text neobsahuje přesné matematické definice, pouze jejich vysvětlení

Časové řady, typy trendových funkcí a odhady trendů

8 Střední hodnota a rozptyl

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Statistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I

Cvičení ze statistiky - 7. Filip Děchtěrenko

Charakterizují kvantitativně vlastnosti předmětů a jevů.

Téma 22. Ondřej Nývlt

I. D i s k r é t n í r o z d ě l e n í

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

Charakteristika datového souboru

(Auto)korelační funkce Statistické vyhodnocování exp. dat M. Čada ~ cada

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Testování statistických hypotéz

15. T e s t o v á n í h y p o t é z

p(x) = P (X = x), x R,

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

1. Přednáška. Ing. Miroslav Šulai, MBA

Cvičení ze statistiky - 8. Filip Děchtěrenko

PRAVDĚPODOBNOST A STATISTIKA

Testování statistických hypotéz

Vektorové podprostory, lineární nezávislost, báze, dimenze a souřadnice

4. Aplikace matematiky v ekonomii

Odhady - Sdružené rozdělení pravděpodobnosti

Vlastnosti odhadů ukazatelů způsobilosti

Kalibrace a limity její přesnosti

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Matematika III 10. týden Číselné charakteristiky střední hodnota, rozptyl, kovariance, korelace

Aplikovaná numerická matematika

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Řešení. Označme po řadě F (z) Odtud plyne, že

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Jednofaktorová analýza rozptylu

6 Skalární součin. u v = (u 1 v 1 ) 2 +(u 2 v 2 ) 2 +(u 3 v 3 ) 2

y = 0, ,19716x.

Téma 2: Pravděpodobnostní vyjádření náhodných veličin

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.

7. Rozdělení pravděpodobnosti ve statistice

12. cvičení z PST. 20. prosince 2017

ANALYTICKÁ GEOMETRIE LINEÁRNÍCH ÚTVARŮ V ROVINĚ

Transkript:

Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný odhad pro µ a σ? Parametr θ je vektor = (µ, σ) a věrohodnostní funkce musí být funkcí dvou proměnných: kde každá f µ,σ (x) je hustota pravděpodobnosti rozdělení N(µ, σ 2 ): Musí platit: 1

Odhad parametrů N(µ, σ 2 ) Pak pro logaritmus věrohodnostní funkce můžeme psát: Pak parciální derivace l(µ, σ) jsou: 2

Odhad parametrů N(µ, σ 2 ) Maximum l(µ, σ) bude odpovídat současné nulové hodnotě obou parciálních derivací: Řešením těchto rovnic dostáváme, že: µ = xx n a Již snadno ukážeme, že věrohodnostní funkce L(µ, σ) nabývá maxima pro stejné hodnoty parametrů. Tedy vidíme, že xx n je maximální věrohodný odhad pro µ a je maximální věrohodný odhad pro σ. 3

Vlastnosti věrohodnostních funkcí Pravidlo maximální věrohodnosti poskytuje obecný návod na konstrukci odhadových funkcí. Věrohodnostní odhadové funkce mají několik důležitých vlastností. Neměnnost principu. Jestliže je maximum věrohodnostní funkce parametru σ normálního rozdělení N(µ, σ 2 ), tak potom je D 2 n věrohodnostní funkce pro parametr σ 2? Platí to!!! Navíc je to obecná vlastnost parametru θ s věrohodnostní funkcí T a libovolnou funkci g(θ) s věrohodnostní funkci g(t). 4

Vlastnosti věrohodnostních funkcí Asymptotická nestrannost. Maximum věrohodnostní funkce T může být stranné. Protože, jak plyne z předchozí vlastnosti, lze psát: Vidíme, že D 2 n je stranný odhad parametru σ 2, ale pro n konvergující k nekonečnu střední hodnota D 2 n konverguje k σ 2. Výše uvedené platí obecně: pokud velikost statistického souboru n jde limitně k nekonečnu, potom maximum věrohodnostní funkce je nestranné. Jestliže je maximum věrohodnostní funkce pro parametr θ potom: 5

Vlastnosti věrohodnostních funkcí Asymptotické minimum rozptylu. Platí, že rozptyl nestranné odhadové funkce pro parametr θ je vždy jak nějaké kladné číslo Cramér-Rao spodní mez. Maximum věrohodnostní funkce má asymptoticky nejmenší rozptyl mezi nestrannými odhadovými funkcemi. Tedy pro n konvergující k nekonečnu, rozptyl maxima věrohodnostní funkce pro parametr θ dosahuje Cramér-Rao spodní meze. 6

Metoda nejmenších čtverců

Odhad nejmenších čtverců Princip maximální věrohodnosti nám poskytuje návod jak odhadnout neznámé modelové parametry. Je to v podstatě obvyklá metoda v matematické statistice, ale bohužel není univerzální. Např. pro lineární regresní model je nutné znát distribuční funkci závislé náhodné proměnné Y, abychom našli maximální věrohodný odhad pro regresní parametry α a β. Odhad pomocí nejmenších čtverců nám umožní tyto parametry určit. 8

Odhad nejmenších čtverců Mějme statistický soubor tvořený dvojicí proměnných (x 1, y 1 ), (x 2, y 2 ),, (x n, y n ). Čísla x 1, x 2,, x n nejsou náhodné a čísla y 1, y 2,, y n jsou realizace náhodné proměnné Y 1, Y 2,, Y n, které splňují rovnici: kde nezávislá náhodná proměnná U i má nulovou střední hodnotu s rozptylem σ 2. Naším úkolem je najít odhady pro parametry α, β a σ 2 v tomto lineárním regresním modelu. Nevíme nic o distribuci náhodné proměnné U i a tudíž nic ani o Y i. Nelze tedy použít metody maximálního věrohodného odhadu. Chceme najít takové α a β, aby přímka nejlépe odpovídala statistickému souboru. 9

Odhad nejmenších čtverců Klasický postup spočívá v minimalizaci čtverce vzdálenosti mezi pozorovanou hodnotou y i a hodnotou α + βx i ležící na regresní přímce. Metoda nejmenších čtverců tedy předepisuje vybrat takové parametry α a β, že suma bude nabývat svého minima. 10

Odhad nejmenších čtverců K nalezení odhadu nejmenších čtverců je třeba nalézt minimum funkce S(α, β). Musíme tedy provést parciální derivace funkce S podle parametrů α, β a ty se musí rovnat nule: To lze přepsat na rovnice: 11

Odhad nejmenších čtverců Dostali jsme dvě rovnice o dvou neznámých α a β. Lze najít obecné řešení dvojice lineárních rovnic (odhadových funkcí) pro neznámé parametry α a β. kde sumu pro i od 1 do n jsme nahradili jen znakem suma. Rovnice S(α, β) je v podstatě rovnicí eliptického paraboloidu, který musí mít jen jedno maximum/minimum. Tedy existuje jen jedno řešení soustavy rovnic a tedy α a β jsou určeny jednoznačně. 12

Nestrannost odhadové funkce ββ a αα Odhadové funkce pro parametry α a β se zapisují také pomocí náhodných proměnných: Dá se ukázat, že odhadové funkce αα a ββ jsou nestranné. Platí, že: viz str. 20 přednáška 6. Jestliže je ββ nestranné (tedy E[ ββ] = β), pak pro αα platí, že: 13

Nestrannost odhadové funkce ββ a αα Pro ββ platí, že: Z posledního jednoduše plyne, že E[ ββ] = β. 14

Nestranná odhadová funkce pro σ 2 Náhodné proměnné Y i jsou nezávislé s rozptylem σ 2. Bohužel nemůžeme aplikovat známou odhadovou funkci na odhad rozptylu náhodné proměnné Y i, protože každé Y i má jinou střední hodnotu. Nicméně dá se ukázat, že: je nestranná odhadová funkce pro σ 2. Protože známe jen hodnoty x i a Y i a ne U i, lze užít rovnice k přepsání rovnice pro T na tvar: 15

Nestranná odhadová funkce pro σ 2 Střední hodnota odhadové funkce T se rovná ((n-2)/n)σ 2. Potom jednoduše odhadová funkce pro parametr σ 2 je: 16

Chyba lineárního regresního modelu Pokud chceme studovat, jak dobře jednoduchý lineární regresní model pasuje na daný (x i, y i ) statistický soubor, musíme zkoumat, jak se mění chyba proložené přímky od hodnot y i v závislosti na x i. Fitovací chyba r i je definována jako vertikální vzdálenost mezi i-tým prvkem statistického souboru a odhadnutou regresní přímkou: Pokud je regresní model zvolen vhodně, potom hodnoty r i jako funkce x i musí náhodně fluktuovat kolem nuly a nemůžeme zde pozorovat žádný trend. 17

Chyba lineárního regresního modelu Příklad fitovací chyby správně zvoleného regresního modelu. 18

Chyba lineárního regresního modelu Fitovací chyba pro příklad ze str. 20 přednášky 6. Je vidět, že chyby nejsou rovnoměrně a náhodně rozděleny, ale mají parabolický tvar. Tedy jednoduchý lineární regresní model není vhodný model pro tento statistický soubor 19

Chyba lineárního regresního modelu Lepší regresní model bude, když zvolíme: Fitovací chyba pak bude: kde αα, ββ, γγ jsou odhady parametrů nejmenších čtverců získaných minimalizací odhadové funkce: Opět můžeme do grafu vynést závislost fitovací chyby jako funkce x i a pro výše uvedený regresní model. Už zde není vidět žádný trend ani tvar rozdělení chyb, ale s rostoucím x i se chyba vzdaluje od nuly. 20

Chyba lineárního regresního modelu Tedy rozptyl náhodné proměnné Y i je funkcí x i. Tuto vlastnost nazýváme jako heteroskedasticita. 21

Heteroskedasticita Pokud rozptyl náhodné proměnné Y i (potažmo U i ) se neměnní nazýváme to jako homoskedasticita. Heteroskedasticita se projeví hlavně v těch případech, kdy náhodná proměnná Y i s větší střední hodnotou má rozptyl větší než Y i s menší střední hodnotou. To pak způsobí, že fitovací chyby s rostoucím x i se rozbíhají dál od nulové hodnoty. Tento problém lze odstranit modelem tzv. vážených nejmenších čtverců nebo použitím rozptyl stabilizujících transformací. 22

Obecný model lineární regrese Jak jsme viděli na příkladu z přednášky 6 str. 20, tak pod pojmem (obecná) lineární regrese si lze představit proložení libovolného polynomu skrze naměřený statistický soubor. Jde tedy o lineární kombinaci regresních parametrů αα, ββ, γγ, a prvky statistického souboru x i se mohou vyskytovat libovolně umocněné nebo na ně může být aplikována libovolná funkce. Lineárnost spočívá ve skutečnosti, že odhadová funkce obecného lineárního regresního modelu je lineární pro proměnné αα, ββ, γγ, 23

Lineární regrese a princip maximální věrohodnosti Obecně k použití metody nejmenších čtverců nepotřebujeme znát pravděpodobnostní distribuci náhodné proměnné U i. Pokud distribuci U i známe, pak princip maximální věrohodnosti může být použit. Mějme, že např. U i je popsáno pravděpodobnostní distribucí N(0, σ 2 ). Jaký je maximální věrohodnostní odhad pro parametry α a β? V tomto případě Y i jsou nezávislé a náhodná proměnná Y i musí být popsána distribucí N(α + βx i, σ 2 ). 24

Lineární regrese a princip maximální věrohodnosti Pokud lineární regresní model je správně zvolen pro daný statistický soubor, pak fitovací chyba r i musí být realizací náhodného výběru R i z normálního rozdělení. Histogram četnosti r i z grafu na str. 18. Histogram opravdu připomíná hustotu pravděpodobnosti normálního rozdělení. 25

Lineární regrese a princip maximální věrohodnosti Pokud Y i má N(α + βx i, σ 2 ) distribuci, pak Y i popsána hustotou pravděpodobnosti: je Po zlogaritmování dostaneme: Pak logaritmus věrohodnostní funkce musí být: 26

Lineární regrese a princip maximální věrohodnosti Pokud je σ > 0, pak l(α, β, σ) dosahuje svého maxima právě tehdy, když je minimální. Tedy pokud U i jsou nezávislé náhodné proměnné s N(0, σ 2 ) distribucí, pak princip maximální věrohodnosti a metoda nejmenších čtverců poskytují stejné odhadové funkce!!! Maximální věrohodnostní odhad parametru σ nalezneme derivací l(α, β, σ) podle σ. Maximum funkce nastane tehdy, když bude výše uvedená derivace nulová. Z toho dostaneme maximální věrohodnostní odhadovou funkci pro σ 2 : 27

Intervaly spolehlivosti 28

Interval spolehlivosti Odhadové funkce jsou např. výběrový průměr, výběrový rozptyl atp. Dostaneme odhady µ, σ 2 atp. Strannost a střední kvadratická chyba pak určují účinnost odhadové funkce. Z realizace náhodného výběru aplikovaného na odhadovou funkci T dostaneme odhad t parametru θ bodový odhad. Typicky statistický soubor naměříme několikrát. Pak získáme několik odhadů hledaného parametru pravděpodobnostní distribuce. Každý bude pravděpodobně jiný, i když experiment je stejný. Který odhad je nejblíže zkoumanému parametru? Můžeme říci, že s velkou jistotou hledaný parametr leží v intervalu od do Jak velká je jistota, že θ opravdu leží v tomto intervalu? 29

Interval spolehlivosti Tento interval nazýváme jako interval spolehlivosti. Je nutné si stanovit spolehlivost hledaného parametru na základě výběrové distribuce odpovídající odhadové funkce. Mějme nestrannou odhadovou funkci T pro parametr θ rychlost světla měřená Michelsonem viz přednáška 6 str. 3. Předpokládejme, že směrodatná odchylka σ T odhadové funkce T je 100 km/s. Z Čebyševovy nerovnosti lze odvodit (přednáška 4 str. 42), že: Pokud náš interval zájmu bude 2σ T, pak: 30

Interval spolehlivosti Slovy: s pravděpodobností aspoň 75% odhadová funkce T leží v intervalu 2σ T = 200 km/s kolem hledané hodnoty parametru θ (rychlost světla) -> Pokud je T blízko θ, tak musí být i θ blízko T. Tedy s pravděpodobností 75%. První tvrzení: náhodná proměnná T je v pevném intervalu s pravděpodobností 75%. Druhé tvrzení: náhodný interval s pravděpodobností 75% pokrývá fixní číslo θ. Interval (T 200, T + 200) se nazývá jako interval spolehlivosti. 31

Interval spolehlivosti Z tabulky naměřených dat (přednáška 6 str. 3) získáme odhad rychlosti světla t = 299 852,4 km/s Tedy interval spolehlivosti θ je: Máme tedy dvě tvrzení: i) rychlost světla leží buď v tomto intervalu, ii) nebo v něm neleží. Máme tedy pravdivý nebo nepravdivý výrok a my nevíme, který je správný. Proto můžeme jen říci, že změřená rychlost světla leží se spolehlivostí aspoň 75% ve výše uvedeném intervalu. Takto vytvořené intervaly spolehlivosti zahrnují jenom nestranné odhadové funkce a znalost směrodatné odchylky. 32

Interval spolehlivosti Typické intervaly spolehlivosti mají tvar: kde číslo c je většinou mezi 2 a 3. Existuje tedy mnoho způsobů jak zkonstruovat intervaly spolehlivosti a obecná definice bude: 33

Interval spolehlivosti Často se stane, že odhadové funkce parametrů distribuce L n a U n neexistují tak, jak jsou požadovány v definici. Ale můžeme najít takové L n a U n, jež splňují podmínku Takový interval spolehlivosti (l n, u n ) se nazývá jako konzervativní γ interval spolehlivosti pro parametr θ. Tedy hladina spolehlivosti může být i větší. Žádným způsobem nemůžeme zjistit, zda-li interval spolehlivosti je správný ve smyslu, že opravdu pokrývá parametr θ. Metoda nám jenom garantuje, že kdykoliv vytvoříme interval spolehlivosti, tak s pravděpodobností γ pokrýváme hodnotu parametru θ. Tento fakt si ukážeme na příkladu: 34

Interval spolehlivosti Vygenerujeme x 1,, x 20 z N(0, 1) distribuce. Předstírejme, že víme, že datový soubor je generován z normálního rozdělení, ale neznáme střední hodnotu a směrodatnou odchylku. Generování statistického souboru 50 krát zopakujeme. Zkonstruujeme 90% interval spolehlivosti pro každý generovaný statistický soubor. Budeme zkoumat, zda-li µ = 0 leží v intervalech spolehlivosti. Na obr. jsou zobrazeny intervaly spolehlivosti každého generovaného statistického souboru. 35

Interval spolehlivosti Vidíme, že 4 intervaly spolehlivosti vůbec neobsahují µ = 0. 36

Interval spolehlivosti kritické hodnoty Budeme potřebovat definovat tzv. kritické hodnoty pro standardní normální distribuci. Kritická hodnota z p distribuce N(0, 1) je takové náhodné číslo, které má pravděpodobnost p v pravé části chvostu hustoty pravděpodobnosti: kde Z je náhodná proměnná s N(0, 1). Z tabelovaných hodnot Φ (0, 1) plyne: P(Z 1,96) = 0,025. Tedy z 0,025 = 1,96. Jinými slovy z p je (1-p) kvantil standardního normálního rozdělení: Protože hustota pravděpodobnosti N(0, 1) je symetrická, musí platit: P(Z z p ) = P(Z z p ) = p. Pak P(Z z p ) = 1 p a proto z 1 p = z p. Například: z 0,975 = z 0,025. 37

Interval spolehlivosti kritické hodnoty 38

Interval spolehlivosti normální rozdělení Mějme náhodný výběr X 1,, X n generovaný z rozdělení N(µ, σ 2 ) a hledáme interval spolehlivosti pro konkrétní statistický soubor jako realizaci náhodného výběru a známe rozptyl. Výběrový průměr XX nn má rozdělení N(µ, σ 2 /n). Pokud provedeme transformaci proměnné XX nn : tak nová proměnná Z bude mít distribuci N(0, 1). Vybereme dvě čísla c l a c u tak, aby Potom musí platit: 39

Interval spolehlivosti normální rozdělení Potom lze pro odhadové funkce výběrových parametrů L n a U n nalézt: Tyto parametry splňují podmínku intervalu spolehlivosti: interval (L n, U n ) pokrývá µ s pravděpodobností γ. Tedy interval spolehlivosti se spolehlivostí γ% pro µ je: V praxi γ zvolíme tak, aby interval spolehlivosti se rozdělil rovnoměrně mezi oba chvosty N(0, 1) distribuce. Tedy α = 1 γ. 40

Interval spolehlivosti normální rozdělení Tedy pro parametry c l a c u musí platit: Tedy c u = z α/2 a c l = z 1 α/2 = z α/2. Tedy (1 α) interval spolehlivosti pro µ je dán: Př.: jestliže α = 0,05, pak kritické hodnoty intervalu spolehlivosti budou z 0,025 = 1,96 a 95% interval spolehlivosti bude: 41

Interval spolehlivosti t-rozdělení Předpokládejme nyní, že směrodatnou odchylku neznáme. Potom transformace: nemá pro nás význam, protože vedle µ neznáme také σ, které se vyskytuje ve výpočtu mezí intervalu spolehlivosti. Nicméně můžeme nahradit σ odhadovou funkcí S n a transformace pak bude: Tato nová náhodná proměnná závisí jen na n. Její hustotu pravděpodobnosti navíc můžeme analyticky vyjádřit. 42

Interval spolehlivosti t-rozdělení Funkce gama je definována předpisem: A platí pro ni: 43

Interval spolehlivosti t-rozdělení k m je normalizační konstanta. Pro m = 1 je k 1 = 1/π a výsledná f(x) rovna standardní Cauchy distribuci. Střední hodnota náhodné proměnné s distribucí t(m) je E[X] = 0 pro m 2 a Var[X] = m/(m 2) pro m 2. Hustota pravděpodobnosti t-distribuce se podobá standardnímu normálnímu rozdělení. Pro m hustota pravděpodobnosti t(m) konverguje k hustotě pravděpodobnosti standardního normálního rozdělení. Pro rostoucí x t(m) klesá k nule pomaleji než N(0, 1). 44

Interval spolehlivosti t-rozdělení Tečkovaná křivka je N(0, 1) a plná čára je t(1), t(2) a t(5). 45

Interval spolehlivosti t-rozdělení Potřebujeme ještě stanovit kritické hodnoty pro t(m). Kritická hodnota je číslo t m,p splňující podmínku: Díky symetrii t(m) kolem nuly, ze stejných důvodů jako pro standardní normální rozdělení, dostaneme: Např.: t 10, 0,01 = 2,764 a tedy t 10, 0,99 = 2,764. Nyní můžeme zkonstruovat interval spolehlivosti pro µ náhodné proměnné 46

Interval spolehlivosti t-rozdělení Ze znalosti kritických hodnot t-rozdělení můžeme odvodit: Stejně jako v případě znalosti směrodatné odchylky σ normálního rozdělení, můžeme nyní pro 1 α interval spolehlivosti parametru µ odvodit: 47

Interval spolehlivosti normální rozdělení V praktických aplikacích interval spolehlivosti pro střední hodnotu náhodné proměnné X s N(µ, σ 2 ) v případě neznalosti směrodatné odchylky vyjde širší než v případě znalosti σ. Je to díky tomu, že t(m) rozdělení nabývá vyšších hodnot pro větší hodnoty X. Dále pak obzvláště pro náhodné výběry s malým počtem prvků je směrodatná odchylka určená z odhadové funkce většinou větší. 48