Odhad parametrů N(µ, σ 2 )
|
|
- Sára Bednářová
- před 8 lety
- Počet zobrazení:
Transkript
1 Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný odhad pro µ a σ? Parametr θ je vektor = (µ, σ) a věrohodnostní funkce musí být funkcí dvou proměnných: kde každá f µ,σ (x) je hustota pravděpodobnosti rozdělení N(µ, σ 2 ): Musí platit: 1
2 Odhad parametrů N(µ, σ 2 ) Pak pro logaritmus věrohodnostní funkce můžeme psát: Pak parciální derivace l(µ, σ) jsou: 2
3 Odhad parametrů N(µ, σ 2 ) Maximum l(µ, σ) bude odpovídat současné nulové hodnotě obou parciálních derivací: Řešením těchto rovnic dostáváme, že: µ = n a Již snadno ukážeme, že věrohodnostní funkce L(µ, σ) nabývá maxima pro stejné hodnoty parametrů. Tedy vidíme, že n je maximální věrohodný odhad pro µ a je maximální věrohodný odhad pro σ. 3
4 Vlastnosti věrohodnostních funkcí Pravidlo maximální věrohodnosti poskytuje obecný návod na konstrukci odhadových funkcí. Věrohodnostní odhadové funkce mají několik důležitých vlastností. Neměnnost principu. Jestliže je maximum věrohodnostní funkce parametru σ normálního rozdělení N(µ, σ 2 ), tak potom je D 2 n věrohodnostní funkce pro parametr σ 2? Platí to!!! Navíc je to obecná vlastnost parametru θ s věrohodnostní funkcí T a libovolnou funkci g(θ) s věrohodnostní funkci g(t). 4
5 Vlastnosti věrohodnostních funkcí Asymptotická nestrannost. Maximum věrohodnostní funkce T může být stranné. Protože, jak plyne z předchozí vlastnosti, lze psát: Vidíme, že D 2 n je stranný odhad parametru σ 2, ale pro n konvergující k nekonečnu střední hodnota D 2 n konverguje k σ 2. Výše uvedené platí obecně: pokud velikost statistického souboru n jde limitně k nekonečnu, potom maximum věrohodnostní funkce je nestranné. Jestliže je maximum věrohodnostní funkce pro parametr θ potom: 5
6 Vlastnosti věrohodnostních funkcí Asymptotické minimum rozptylu. Platí, že rozptyl nestranné odhadové funkce pro parametr θ je vždy jak nějaké kladné číslo Cramér Rao spodní mez. Maximum věrohodnostní funkce má asymptoticky nejmenší rozptyl mezi nestrannými odhadovými funkcemi. Tedy pro n konvergující k nekonečnu, rozptyl maxima věrohodnostní funkce pro parametr θ dosahuje Cramér Rao spodní meze. 6
7 Metoda nejmenších čtverců
8 Odhad nejmenších čtverců Princip maximální věrohodnosti nám poskytuje návod jak odhadnout neznámé modelové parametry. Je to v podstatě obvyklá metoda v matematické statistice, ale bohužel není univerzální. Např. pro lineární regresní model je nutné znát distribuční funkci závislé náhodné proměnné Y, abychom našli maximální věrohodný odhad pro regresní parametry α a β. Odhad pomocí nejmenších čtverců nám umožní tyto parametry určit. 8
9 Odhad nejmenších čtverců Mějme statistický soubor tvořený dvojicí proměnných (x 1, y 1 ), (x 2, y 2 ),, (x n, y n ). Čísla x 1, x 2,, x n nejsou náhodné a čísla y 1, y 2,, y n jsou realizace náhodné proměnné Y 1, Y 2,, Y n, které splňují rovnici: kde nezávislá náhodná proměnná U i má nulovou střední hodnotu s rozptylem σ 2. Naším úkolem je najít odhady pro parametry α, β a σ 2 v tomto lineárním regresním modelu. Nevíme nic o distribuci náhodné proměnné U i a tudíž nic ani o Y i. Nelze tedy použít metody maximálního věrohodného odhadu. Chceme najít takové α a β, aby přímka nejlépe odpovídala statistickému souboru. 9
10 Odhad nejmenších čtverců Klasický postup spočívá v minimalizaci čtverce vzdálenosti mezi pozorovanou hodnotou y i a hodnotou α + βx i ležící na regresní přímce. Metoda nejmenších čtverců tedy předepisuje vybrat takové parametry α a β, že suma bude nabývat svého minima. 10
11 Odhad nejmenších čtverců K nalezení odhadu nejmenších čtverců je třeba nalézt minimum funkce S(α, β). Musíme tedy provést parciální derivace funkce S podle parametrů α, β a ty se musí rovnat nule: To lze přepsat na rovnice: 11
12 Odhad nejmenších čtverců Dostali jsme dvě rovnice o dvou neznámých α a β. Lze najít obecné řešení dvojice lineárních rovnic (odhadových funkcí) pro neznámé parametry α a β. kde sumu pro i od 1 do n jsme nahradili jen znakem suma. Rovnice S(α, β) je v podstatě rovnicí eliptického paraboloidu, který musí mít jen jedno maximum/minimum. Tedy existuje jen jedno řešení soustavy rovnic a tedy α a β jsou určeny jednoznačně. 12
13 Nestrannost odhadové funkce a Odhadové funkce pro parametry α a β se zapisují také pomocí náhodných proměnných: Dá se ukázat, že odhadové funkce a jsou nestranné. Platí, že: viz str. 20 přednáška 6. Jestliže je nestranné (tedy E[ ] = β), pak pro platí, že: 13
14 Nestrannost odhadové funkce a Pro platí, že: Z posledního jednoduše plyne, že E[ ] = β. 14
15 Nestranná odhadová funkce pro σ 2 Náhodné proměnné Y i jsou nezávislé s rozptylem σ 2. Bohužel nemůžeme aplikovat známou odhadovou funkci na odhad rozptylu náhodné proměnné Y i, protože každé Y i má jinou střední hodnotu. Nicméně dá se ukázat, že: je nestranná odhadová funkce pro σ 2. Protože známe jen hodnoty x i a Y i a ne U i, lze užít rovnice k přepsání rovnice pro T na tvar: 15
16 Nestranná odhadová funkce pro σ 2 Střední hodnota odhadové funkce T se rovná ((n 2)/n)σ 2. Potom jednoduše odhadová funkce pro parametr σ 2 je: 16
17 Chyba lineárního regresního modelu Pokud chceme studovat, jak dobře jednoduchý lineární regresní model pasuje na daný (x i, y i ) statistický soubor, musíme zkoumat, jak se mění chyba proložené přímky od hodnot y i v závislosti na x i. Fitovací chyba r i je definována jako vertikální vzdálenost mezi i tým prvkem statistického souboru a odhadnutou regresní přímkou: Pokud je regresní model zvolen vhodně, potom hodnoty r i jako funkce x i musí náhodně fluktuovat kolem nuly a nemůžeme zde pozorovat žádný trend. 17
18 Chyba lineárního regresního modelu Příklad fitovací chyby správně zvoleného regresního modelu. 18
19 Chyba lineárního regresního modelu Fitovací chyba pro příklad ze str. 20 přednášky 6. Je vidět, že chyby nejsou rovnoměrně a náhodně rozděleny, ale mají parabolický tvar. Tedy jednoduchý lineární regresní model není vhodný model pro tento statistický soubor 19
20 Chyba lineárního regresního modelu Lepší regresní model bude, když zvolíme: Fitovací chyba pak bude: kde,, jsou odhady parametrů nejmenších čtverců získaných minimalizací funkce odhadové funkce: Opět můžeme do grafu vynést závislost fitovací chyby jako funkce x i a pro výše uvedený regresní model. Už zde není vidět žádný trend ani tvar rozdělení chyb, ale s rostoucím x i se chyba vzdaluje od nuly. 20
21 Chyba lineárního regresního modelu Tedy rozptyl náhodné proměnné Y i je funkcí x i. Tuto vlastnost nazýváme jako heteroskedasticita. 21
22 Heteroskedasticita Pokud rozptyl náhodné proměnné Y i (potažmo U i ) se neměnní nazýváme to jako homoskedasticita. Heteroskedasticita se projeví hlavně v těch případech, kdy náhodná proměnná Y i s větší střední hodnotou má rozptyl větší než Y i s menší střední hodnotou. To pak způsobí, že fitovací chyby s rostoucím x i se rozbíhají dál od nulové hodnoty. Tento problém lze odstranit modelem tzv. vážených nejmenších čtverců nebo použitím rozptyl stabilizujících transformací. 22
23 Obecný model lineární regrese Jak jsme viděli na příkladu z přednášky 6 str. 20, tak pod pojmem (obecná) lineární regrese si lze představit proložení libovolného polynomu skrze naměřený statistický soubor. Jde tedy o lineární kombinaci regresních parametrů,,, a prvky statistického souboru x i se mohou vyskytovat libovolně umocněné nebo na ně může být aplikována libovolná funkce. Lineárnost spočívá ve skutečnosti, že odhadová funkce obecného lineárního regresního modelu je lineární pro proměnné,,, 23
24 Lineární regrese a princip maximální věrohodnosti Obecně k použití metody nejmenších čtverců nepotřebujeme znát pravděpodobnostní distribuci náhodné proměnné U i. Pokud distribuci U i známe, pak princip maximální věrohodnosti může být použit. Mějme, že např. U i je popsáno pravděpodobnostní distribucí N(0, σ 2 ). Jaký je maximální věrohodnostní odhad pro parametry α a β? V tomto případě Y i jsou nezávislé a náhodná proměnná Y i musí být popsána distribucí N(α + βx i, σ 2 ). 24
25 Lineární regrese a princip maximální věrohodnosti Pokud lineární regresní model je správně zvolen pro daný statistický soubor, pak fitovací chyba r i musí být realizací náhodného výběru R i z normálního rozdělení. Histogram četnosti r i z grafu na str. 18. Histogram opravdu připomíná hustotu pravděpodobnosti normálního rozdělení. 25
26 Lineární regrese a princip maximální věrohodnosti Pokud Y i má N(α + βx i, σ 2 ) distribuci, pak Y i je popsána hustotou pravděpodobnosti: Po zlogaritmování dostaneme: Pak logaritmus věrohodnostní funkce musí být: 26
27 Lineární regrese a princip maximální věrohodnosti Pokud je σ > 0, pak l(α, β, σ) dosahuje svého maxima právě tehdy, když je minimální. Tedy pokud U i jsou nezávislé náhodné proměnné s N(0, σ 2 ) distribucí, pak princip maximální věrohodnosti a metoda nejmenších čtverců poskytují stejné odhadové funkce!!! Maximální věrohodnostní odhad parametru σ nalezneme derivací l(α, β, σ) podle σ. Maximum funkce nastane tehdy, když bude výše uvedená derivace nulová. Z toho dostaneme maximální věrohodnostní odhadovou funkci pro σ 2 : 27
28 Intervaly spolehlivosti 28
29 Interval spolehlivosti Odhadové funkce jsou např. výběrový průměr, výběrový rozptyl atp. Dostaneme odhady µ, σ 2 atp. Strannost a střední kvadratická chyba pak určují účinnost odhadové funkce. Z realizace náhodného výběru aplikovaného na odhadovou funkci T dostaneme odhad t parametru θ bodový odhad. Typicky statistický soubor naměříme několikrát. Pak získáme několik odhadů hledaného parametru pravděpodobnostní distribuce. Každý bude pravděpodobně jiný, i když experiment je stejný. Který odhad se je nejblíže zkoumanému parametru? Můžeme říci, že s velkou jistotou hledaný parametr leží v intervalu od do Jak velká je jistota, že θ opravdu leží v tomto intervalu? 29
30 Interval spolehlivosti Tento interval nazýváme jako interval spolehlivosti. Je nutné si stanovit spolehlivost hledaného parametru na základě výběrové distribuce odpovídající odhadové funkce. Mějme nestrannou odhadovou funkci T pro parametr θ rychlost světla měřená Michelsonem viz přednáška 6 str. 3. Předpokládejme, že směrodatná odchylka σ T odhadové funkce T je 100 km/s. Z Čebyševovy nerovnosti lze odvodit (přednáška 4 str. 42), že: Pokud náš interval zájmu bude 2σ T, pak: 30
31 Interval spolehlivosti Slovy: s pravděpodobností aspoň 75% odhadová funkce T leží v intervalu 2σ T = 200 km/s kolem hledané hodnoty parametru θ (rychlost světla) > Pokud je T blízko θ, tak musí být i θ blízko T. Tedy s pravděpodobností 75%. První tvrzení: náhodná proměnná T je v pevném intervalu s pravděpodobností 75%. Druhé tvrzení: náhodný interval s pravděpodobností 75% pokrývá fixní číslo θ. Interval (T 200, T + 200) se nazývá jako interval spolehlivosti. 31
32 Interval spolehlivosti Z tabulky naměřených dat (přednáška 6 str. 3) získáme odhad rychlosti světla t = ,4 km/s Tedy interval spolehlivosti θ je: Nemůžeme říci, že rychlost světla leží buď v tomto intervalu s pravděpodobností 75% nebo tam neleží. Máme tedy pravdivý nebo nepravdivý výrok a mi nevíme, který je správný. Proto můžeme jen říci, že změřená rychlost světla leží se spolehlivostí aspoň 75% ve výše uvedeném intervalu. Takto vytvořené intervaly spolehlivosti zahrnují jenom nestranné odhadové funkce a znalost směrodatné odchylky. 32
33 Interval spolehlivosti Typické intervaly spolehlivosti mají tvar: kde číslo c je většinou mezi 2 a 3. Existuje tedy mnoho způsobů jak zkonstruovat intervaly spolehlivosti a obecná definice bude: 33
34 Interval spolehlivosti Často se stane, že odhadové funkce parametrů distribuce L n a U n neexistují tak, jak jsou požadovány v definici. Ale můžeme najít takové L n a U n, jež splňují podmínku Takový interval spolehlivosti (l n, u n ) se nazývá jako konzervativní γ interval spolehlivosti pro parametr θ. Tedy hladina spolehlivosti může být i větší. Žádným způsobem nemůžeme zjistit, zda li interval spolehlivosti je správný ve smyslu, že opravdu pokrývá parametr θ. Metoda nám jenom garantuje, že kdykoliv vytvoříme interval spolehlivosti, tak s pravděpodobností γ pokrýváme hodnotu parametru θ. Tento fakt si ukážeme na příkladu: 34
35 Interval spolehlivosti Vygenerujeme x 1,, x 20 z N(0, 1) distribuce. Předstírejme, že víme, že datový soubor je generován z normálního rozdělení, ale neznáme střední hodnotu a směrodatnou odchylku. Generování statistického souboru 50 krát zopakujeme. Zkonstruujeme 90% interval spolehlivosti pro každý generovaný statistický soubor. Budeme zkoumat, zda li µ = 0 leží v intervalech spolehlivosti. Na obr. jsou zobrazeny intervaly spolehlivosti každého generovaného statistického souboru. 35
36 Interval spolehlivosti Vidíme, že 4 intervaly spolehlivosti vůbec neobsahují µ = 0. 36
37 Interval spolehlivosti kritické hodnoty Budeme potřebovat definovat tzv. kritické hodnoty pro standardní normální distribuci. Kritická hodnota z p distribuce N(0, 1) je takové číslo, které má pravděpodobnost p v pravé části chvostu hustoty pravděpodobnosti: kde Z je náhodná proměnná s N(0, 1). Z tabelovaných hodnot Φ (0, 1) plyne: P(Z 1,96) = 0,025. Tedy z 0,025 = 1,96. Jinými slovy z p je (1 p) kvantil standardního normálního rozdělení: Protože hustota pravděpodobnosti N(0, 1) je symetrická, musí platit: P(Z z p ) = P(Z z p ) = p. Pak P(Z z p ) = 1 p a proto z 1 p = z p. Například: z 0,975 = z 0,
38 Interval spolehlivosti kritické hodnoty 38
39 Interval spolehlivosti normální rozdělení Mějme náhodný výběr X 1,, X n generovaný z rozdělení N(µ, σ 2 ) a hledáme interval spolehlivosti pro konkrétní statistický soubor jako realizaci náhodného výběru a známe rozptyl. Výběrový průměr má rozdělení N(µ, σ 2 /n). Pokud provedeme transformaci proměnné : tak nová proměnná Z bude mít distribuci N(0, 1). Vybereme dvě čísla c l a c u tak, aby Potom musí platit: 39
40 Interval spolehlivosti normální rozdělení Potom lze pro odhadové funkce výběrových parametrů L n a U n nalézt: Tyto parametry splňují podmínku intervalu spolehlivosti: interval (L n, U n ) pokrývá µ s pravděpodobností γ. Tedy interval spolehlivosti se spolehlivostí γ% pro µ je: V praxi γ zvolíme tak, aby interval spolehlivosti se rozdělil rovnoměrně mezi oba chvosty N(0, 1) distribuce. Tedy α = 1 γ. 40
41 Interval spolehlivosti normální rozdělení Tedy pro parametry c l a c u musí platit: Tedy c u = z α/2 a c l = z 1 α/2 = z α/2. Tedy (1 α) interval spolehlivosti pro µ je dán: Př.: jestliže α = 0,05, pak kritické hodnoty intervalu spolehlivosti budou z 0,025 = 1,96 a 95% interval spolehlivosti bude: 41
Odhad parametrů N(µ, σ 2 )
Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný
Nestranný odhad Statistické vyhodnocování exp. dat M. Čada
Nestranný odhad 1 Parametr θ Máme statistický (výběrový) soubor, který je realizací náhodného výběru 1, 2, 3,, n z pravděpodobnostní distribuce, která je kompletně stanovena jedním nebo více parametry
10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.
0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti
Základní statistické modely Statistické vyhodnocování exp. dat M. Čada ~ cada
Základní statistické modely 1 Statistika Matematická statistika se zabývá interpretací získaných náhodných dat. Snažíme se přiřadit statistickému souboru vhodnou distribuční funkci a najít základní číselné
AVDAT Klasický lineární model, metoda nejmenších
AVDAT Klasický lineární model, metoda nejmenších čtverců Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Lineární model y i = β 0 + β 1 x i1 + + β k x ik + ε i (1) kde y i
3 Bodové odhady a jejich vlastnosti
3 Bodové odhady a jejich vlastnosti 3.1 Statistika (Skripta str. 77) Výběr pořizujeme proto, abychom se (více) dověděli o souboru, ze kterého jsme výběr pořídili. Zde se soustředíme na situaci, kdy známe
1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.
Prostá regresní a korelační analýza 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Problematika závislosti V podstatě lze rozlišovat mezi závislostí nepodstatnou, čili náhodnou
2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení
2 Zpracování naměřených dat Důležitou součástí každé experimentální práce je statistické zpracování naměřených dat. V této krátké kapitole se budeme věnovat určení intervalů spolehlivosti získaných výsledků
Základy teorie odhadu parametrů bodový odhad
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Odhady parametrů Úkolem výběrového šetření je podat informaci o neznámé hodnotě charakteristiky základního souboru
KGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 5. Odhady parametrů základního souboru Mgr. David Fiedor 16. března 2015 Vztahy mezi výběrovým a základním souborem Osnova 1 Úvod, pojmy Vztahy mezi výběrovým a základním
Pravděpodobnost a matematická statistika
Pravděpodobnost a matematická statistika Příklady k přijímacím zkouškám na doktorské studium 1 Popisná statistika Určete aritmetický průměr dat, zadaných tabulkou hodnot x i a četností n i x i 1 2 3 n
Odhady Parametrů Lineární Regrese
Odhady Parametrů Lineární Regrese Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké
8. Normální rozdělení
8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, 2 ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) 2 e 2 2, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá
Výběrové charakteristiky a jejich rozdělení
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový
X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní
..08 8cv7.tex 7. cvičení - transformace náhodné veličiny Definice pojmů a základní vzorce Je-li X náhodná veličina a h : R R je měřitelná funkce, pak náhodnou veličinu Y, která je definovaná vztahem X
PRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Náhodný výběr Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr
Interval spolehlivosti t rozdělení
Interval spolehlivosti t rozdělení Předpokládejme nyní, že směrodatnou odchylku neznáme. Potom transformace: nemá pro nás význam, protože vedle µ neznáme také σ, které se vyskytuje ve výpočtu mezí intervalu
Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1
Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu
Přijímací zkouška na navazující magisterské studium 2014
Přijímací zkouška na navazující magisterské studium 24 Příklad (25 bodů) Spočtěte Studijní program: Studijní obor: Matematika Finanční a pojistná matematika Varianta A M x 2 dxdy, kde M = {(x, y) R 2 ;
Normální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký
Regresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
Regresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
Regresní analýza 1. Regresní analýza
Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému
8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.
8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) e, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá normované
Interval spolehlivosti velký výběr
Interval spolehlivosti velký výběr Z centrální limitní věty vyplývá, že pro n konvergující k nekonečnu, distribuce náhodné proměnné Z (t-průměr) konverguje ke standardnímu normálnímu rozdělení. Nechť X
Regresní analýza. Ekonometrie. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel
Regresní analýza Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Regresní analýza 1 / 23
Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.
Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení
Regresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
Testování hypotéz o parametrech regresního modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,
Testování hypotéz o parametrech regresního modelu
Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO
Regresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.
Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost
AVDAT Nelineární regresní model
AVDAT Nelineární regresní model Josef Tvrdík Katedra informatiky Přírodovědecká fakulta Ostravská univerzita Nelineární regresní model Ey i = f (x i, β) kde x i je k-členný vektor vysvětlujících proměnných
Náhodné chyby přímých měření
Náhodné chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně pravděpodobná.
STATISTICKÉ ODHADY Odhady populačních charakteristik
STATISTICKÉ ODHADY Odhady populačních charakteristik Jak stanovit charakteristiky rozložení sledované veličiny v základní populaci? Populaci většinou nemáme celou k dispozici, musíme se spokojit jen s
1 Linearní prostory nad komplexními čísly
1 Linearní prostory nad komplexními čísly V této přednášce budeme hledat kořeny polynomů, které se dále budou moci vyskytovat jako složky vektorů nebo matic Vzhledem k tomu, že kořeny polynomu (i reálného)
Lineární regrese. Komentované řešení pomocí MS Excel
Lineární regrese Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A1:B11 (viz. obrázek) na listu cela data Postup Základní výpočty - regrese Výpočet základních
Intervalové Odhady Parametrů
Parametrů Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení technické v Praze
Bodové a intervalové odhady parametrů v regresním modelu
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model Mějme lineární regresní model (LRM) Y = Xβ + e, kde y 1 e 1 β y 2 Y =., e
Náhodné (statistické) chyby přímých měření
Náhodné (statistické) chyby přímých měření Hodnoty náhodných chyb se nedají stanovit předem, ale na základě počtu pravděpodobnosti lze zjistit, která z možných naměřených hodnot je více a která je méně
Metoda nejmenších čtverců Michal Čihák 26. listopadu 2012
Metoda nejmenších čtverců Michal Čihák 26. listopadu 2012 Metoda nejmenších čtverců Matematicko-statistická metoda používaná zejména při zpracování nepřesných dat (typicky experimentálních empirických
LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica
LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná
Regresní a korelační analýza
Regresní a korelační analýza Mějme dvojici proměnných, které spolu nějak souvisí. x je nezávisle (vysvětlující) proměnná y je závisle (vysvětlovaná) proměnná Chceme zjistit funkční závislost y = f(x).
Charakteristika datového souboru
Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex
PRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr
Testování statistických hypotéz
Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné
I. D i s k r é t n í r o z d ě l e n í
6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme
y = 0, ,19716x.
Grafické ověřování a testování vybraných modelů 1 Grafické ověřování empirického rozdělení Při grafické analýze empirického rozdělení vycházíme z empirické distribuční funkce F n (x) příslušné k náhodnému
Normální (Gaussovo) rozdělení
Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními
Vektorové podprostory, lineární nezávislost, báze, dimenze a souřadnice
Vektorové podprostory, lineární nezávislost, báze, dimenze a souřadnice Vektorové podprostory K množina reálných nebo komplexních čísel, U vektorový prostor nad K. Lineární kombinace vektorů u 1, u 2,...,u
Generování pseudonáhodných. Ing. Michal Dorda, Ph.D.
Generování pseudonáhodných čísel při simulaci Ing. Michal Dorda, Ph.D. 1 Úvodní poznámky V simulačních modelech se velice často vyskytují náhodné proměnné. Proto se budeme zabývat otázkou, jak při simulaci
Matematické modelování Náhled do ekonometrie. Lukáš Frýd
Matematické modelování Náhled do ekonometrie Lukáš Frýd Výnos akcie vs. Výnos celého trhu - CAPM model r it = r ft + β 1. (r mt r ft ) r it r ft = α 0 + β 1. (r mt r ft ) + ε it Ekonomický (finanční model)
PRAVDĚPODOBNOST A STATISTIKA
PRAVDĚPODOBNOS A SAISIKA Regresní analýza - motivace Základní úlohou regresní analýzy je nalezení vhodného modelu studované závislosti. Je nutné věnovat velkou pozornost tomu aby byla modelována REÁLNÁ
p(x) = P (X = x), x R,
6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme
Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.
1 Statistické odhady Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. Odhad lze provést jako: Bodový odhad o Jedna číselná hodnota Intervalový
Časové řady, typy trendových funkcí a odhady trendů
Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Stochastický proces Posloupnost náhodných veličin {Y t, t = 0, ±1, ±2 } se nazývá stochastický proces
Testování statistických hypotéz
Testování statistických hypotéz Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 11. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 27 Obsah 1 Testování statistických hypotéz 2
5. Lokální, vázané a globální extrémy
5 Lokální, vázané a globální extrémy Studijní text Lokální extrémy 5 Lokální, vázané a globální extrémy Definice 51 Řekneme, že f : R n R má v bodě a Df: 1 lokální maximum, když Ka, δ Df tak, že x Ka,
Téma 22. Ondřej Nývlt
Téma 22 Ondřej Nývlt nyvlto1@fel.cvut.cz Náhodná veličina a náhodný vektor. Distribuční funkce, hustota a pravděpodobnostní funkce náhodné veličiny. Střední hodnota a rozptyl náhodné veličiny. Sdružené
Regrese. 28. listopadu Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly:
Regrese 28. listopadu 2013 Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly: 1. Ukázat, že data jsou opravdu závislá. 2. Provést regresi. 3. Ukázat, že zvolená křivka
Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.
Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině
UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.
UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace
z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin
Příklady k procvičení z Matematické statistiky Poslední úprava. listopadu 207. Konvergence posloupnosti náhodných veličin. Necht X, X 2... jsou nezávislé veličiny s rovnoměrným rozdělením na [0, ]. Definujme
STATISTICKÉ ZJIŠŤOVÁNÍ
STATISTICKÉ ZJIŠŤOVÁNÍ ÚVOD Základní soubor Všechny ryby v rybníce, všechny holky/kluci na škole Cílem určit charakteristiky, pravděpodobnosti Průměr, rozptyl, pravděpodobnost, že Maruška kápne na toho
Časové řady, typy trendových funkcí a odhady trendů
Časové řady, typy trendových funkcí a odhady trendů Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Jiří Neubauer (Katedra ekonometrie UO Brno) Časové
Charakterizace rozdělení
Charakterizace rozdělení Momenty f(x) f(x) f(x) μ >μ 1 σ 1 σ >σ 1 g 1 g σ μ 1 μ x μ x x N K MK = x f( x) dx 1 M K = x N CK = ( x M ) f( x) dx ( xi M 1 C = 1 K 1) N i= 1 K i K N i= 1 K μ = E ( X ) = xf
Aplikovaná numerická matematika
Aplikovaná numerická matematika 6. Metoda nejmenších čtverců doc. Ing. Róbert Lórencz, CSc. České vysoké učení technické v Praze Fakulta informačních technologií Katedra počítačových systémů Příprava studijních
12. cvičení z PST. 20. prosince 2017
1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace
KGG/STG Statistika pro geografy
KGG/STG Statistika pro geografy 4. Teoretická rozdělení Mgr. David Fiedor 9. března 2015 Osnova Úvod 1 Úvod 2 3 4 5 Vybraná rozdělení náhodných proměnných normální rozdělení normované normální rozdělení
Tomáš Karel LS 2012/2013
Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není
Vlastnosti odhadů ukazatelů způsobilosti
Vlastnosti odhadů ukazatelů způsobilosti Jiří Michálek CQR při Ústavu teorie informace a automatizace AV ČR v Praze Úvod Ve výzkumné zprávě č 06 Odhady koeficientů způsobilosti a jejich vlastnosti viz
jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.
Parametrické metody odhadů z neúplných výběrů 2 1 Metoda maximální věrohodnosti pro cenzorované výběry 11 Náhodné cenzorování Při sledování složitých reálných systémů často nemáme možnost uspořádat experiment
1. Přednáška. Ing. Miroslav Šulai, MBA
N_OFI_2 1. Přednáška Počet pravděpodobnosti Statistický aparát používaný ve financích Ing. Miroslav Šulai, MBA 1 Počet pravděpodobnosti -náhodné veličiny 2 Počet pravděpodobnosti -náhodné veličiny 3 Jevy
KVADRATICKÁ KALIBRACE
Petra Širůčková, prof. RNDr. Gejza Wimmer, DrSc. Finanční matematika v praxi III. a Matematické modely a aplikace 4. 9. 2013 Osnova Kalibrace 1 Kalibrace Pojem kalibrace Cíle kalibrace Předpoklady 2 3
Kalibrace a limity její přesnosti
Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie Kalibrace a limity její přesnosti Semestrální práce Licenční studium GALILEO Interaktivní statistická analýza dat Brno, 2015
Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)
Lékařská biofyzika, výpočetní technika I Biostatistika Josef Tvrdík (doc. Ing. CSc.) Přírodovědecká fakulta, katedra informatiky josef.tvrdik@osu.cz konzultace úterý 14.10 až 15.40 hod. http://www1.osu.cz/~tvrdik
7. Analýza rozptylu.
7. Analýza rozptylu. Uvedeme obecnou ideu, která je založena na minimalizaci chyby metodou nejmenších čtverců. Nejdříve uvedeme několik základních tvrzení. Uvažujeme náhodný vektor Y = (Y, Y,..., Y n a
Jednofaktorová analýza rozptylu
I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých
MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci
MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci Matematická statistika Matematická statistika se zabývá matematickým
Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci
Zpracování dat v edukačních vědách - Testování hypotéz Kamila Fačevicová Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Obsah seminářů 5.11. Úvod do matematické
Ing. Michael Rost, Ph.D.
Úvod do testování hypotéz, jednovýběrový t-test Ing. Michael Rost, Ph.D. Testovaná hypotéza Pokud nás zajímá zda platí, či neplatí tvrzení o určitém parametru, např. o parametru Θ, pak takovéto tvrzení
INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ. Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.
INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ Modernizace studijního programu Matematika na PřF Univerzity Palackého v Olomouci CZ.1.07/2.2.00/28.0141 Báze vektorových prostorů, transformace souřadnic Michal Botur Přednáška
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická
PRAVDĚPODOBNOST A STATISTIKA. Bayesovské odhady
PRAVDĚPODOBNOST A STATISTIKA Bayesovské odhady Bayesovské odhady - úvod Klasický bayesovský přístup: Klasický přístup je založen na opakování pokusech sledujeme rekvenci nastoupení zvolených jevů Bayesovský
Normální rozložení a odvozená rozložení
I Normální rozložení a odvozená rozložení I.I Normální rozložení Data, se kterými pracujeme, pocházejí z různých rozložení. Mohou být vychýlena (doleva popř. doprava, nebo v nich není na první pohled vidět
Odhady - Sdružené rozdělení pravděpodobnosti
Odhady - Sdružené rozdělení pravděpodobnosti 4. listopadu 203 Kdybych chtěl znát maximum informací o náhodné veličině, musel bych znát všechny hodnoty, které mohou padnout, a jejich pravděpodobnosti. Tedy
8 Střední hodnota a rozptyl
Břetislav Fajmon, UMAT FEKT, VUT Brno Této přednášce odpovídá kapitola 10 ze skript [1]. Také je k dispozici sbírka úloh [2], kde si můžete procvičit příklady z kapitol 2, 3 a 4. K samostatnému procvičení
Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel
Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,
Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .
Statistika Teorie odhadu statistická indukce Intervalový odhad µ, σ 2 a π Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 21. února 2012 Statistika
Inovace bakalářského studijního oboru Aplikovaná chemie
http://aplchem.upol.cz CZ.1.07/2.2.00/15.0247 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Regrese Závislostproměnných funkční y= f(x) regresní y= f(x)
JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica
JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu
15. T e s t o v á n í h y p o t é z
15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.
Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza
Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.
Ing. Michal Dorda, Ph.D. Př. : Ve vjezdové skupině kolejí byly sledovány počty přijíždějících vlaků za hodinu. Za 5 dní (tedy 360 hodin) přijelo celkem 87 vlaků. Výsledky sledování jsou uvedeny v tabulce.
Cvičení ze statistiky - 8. Filip Děchtěrenko
Cvičení ze statistiky - 8 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Centrální limitní věta Laplaceho věta (+ korekce na spojitost) Konfidenční intervaly
populace soubor jednotek, o jejichž vlastnostech bychom chtěli vypovídat letní semestr Definice subjektech.
Populace a Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 1 populace soubor jednotek, o jejichž vlastnostech bychom
Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace
Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje
676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368
Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540