Příklady - Bodový odhad

Podobné dokumenty
Odhady - Sdružené rozdělení pravděpodobnosti

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

3 Bodové odhady a jejich vlastnosti

Statistika a spolehlivost v lékařství Charakteristiky spolehlivosti prvků I

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

Odhady Parametrů Lineární Regrese

KGG/STG Statistika pro geografy

Základy teorie odhadu parametrů bodový odhad

Definice spojité náhodné veličiny zjednodušená verze

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

AVDAT Klasický lineární model, metoda nejmenších

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

Pravděpodobnost a statistika (BI-PST) Cvičení č. 9

Odhad parametrů N(µ, σ 2 )

PRAVDĚPODOBNOST A STATISTIKA

Odhad parametrů N(µ, σ 2 )

4. Aplikace matematiky v ekonomii

VYBRANÁ ROZDĚLENÍ. SPOJITÉ NÁH. VELIČINY Martina Litschmannová

STATISTICKÉ ODHADY Odhady populačních charakteristik

Normální (Gaussovo) rozdělení

PRAVDĚPODOBNOST A STATISTIKA

Testy. Pavel Provinský. 19. listopadu 2013

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

Nestranný odhad Statistické vyhodnocování exp. dat M. Čada

Cvičení 11. Přednášející: Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc.

Minikurz aplikované statistiky. Minikurz aplikované statistiky p.1

Pravděpodobnost a matematická statistika

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

Praktická statistika. Petr Ponížil Eva Kutálková

Vícerozměrná rozdělení

oddělení Inteligentní Datové Analýzy (IDA)

Obecné, centrální a normované momenty

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Normální (Gaussovo) rozdělení

Test z teorie VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Mgr. Rudolf Blažek, Ph.D. prof. RNDr. Roman Kotecký Dr.Sc.

Funkce jedné proměnné

Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Vybraná rozdělení náhodné veličiny

AVDAT Nelineární regresní model

Semestrální písemka BMA3 - termín varianta A13 vzorové řešení

Řešení. Označme po řadě F (z) Odtud plyne, že

Výběrové charakteristiky a jejich rozdělení

6. ZÁKLADY STATIST. ODHADOVÁNÍ. Θ parametrický prostor. Dva základní způsoby odhadu neznámého vektoru parametrů bodový a intervalový.

, 1. skupina (16:15-17:45) Jméno: se. Postup je třeba odůvodnit (okomentovat) nebo uvést výpočet. Výsledek bez uvedení jakéhokoliv

Náhodné chyby přímých měření

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

Regresní a korelační analýza

Teorie náhodných matic aneb tak trochu jiná statistika

12. cvičení z PST. 20. prosince 2017

Věta 12.3 : Věta 12.4 (princip superpozice) : [MA1-18:P12.7] rovnice typu y (n) + p n 1 (x)y (n 1) p 1 (x)y + p 0 (x)y = q(x) (6)

Aproximace binomického rozdělení normálním

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

Kvantily a písmenové hodnoty E E E E-02

Jednofaktorová analýza rozptylu

AVDAT Náhodný vektor, mnohorozměrné rozdělení

Regresní a korelační analýza

Přednáška. Další rozdělení SNP. Limitní věty. Speciální typy rozdělení. Další rozdělení SNP Limitní věty Speciální typy rozdělení

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

Charakteristika datového souboru

Regresní a korelační analýza

I. D i s k r é t n í r o z d ě l e n í

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu.

Pravděpodobnost a statistika I KMA/K413

Testování statistických hypotéz

Definice globální minimum (absolutní minimum) v bodě A D f, jestliže X D f

Náhodné (statistické) chyby přímých měření

Téma 22. Ondřej Nývlt

MATEMATIKA II - vybrané úlohy ze zkoušek v letech

Regresní a korelační analýza

p(x) = P (X = x), x R,

4EK211 Základy ekonometrie

Relativní chybu veličiny τ lze určit pomocí relativní chyby τ 1. Zanedbáme-li chybu jmenovatele ve vzorci (2), platí *1+:

STATISTICKÉ ZJIŠŤOVÁNÍ

Matematika II, úroveň A ukázkový test č. 1 (2016) 1. a) Napište postačující podmínku pro diferencovatelnost funkce n-proměnných v otevřené

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

5. B o d o v é o d h a d y p a r a m e t r ů

Stochastické signály (opáčko)

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

NMAF 051, ZS Zkoušková písemná práce 26. ledna x. x 1 + x dx. q 1. u = x = 1 u2. = 1 u. u 2 (1 + u 2 ) (1 u 2 du = 2.

NÁHODNÁ VELIČINA. 3. cvičení

MATEMATIKA II - vybrané úlohy ze zkoušek ( 2015)

5 ZÁKLADNÍ TYPY ROZDĚLENÍ PRAVDĚPODOBNOSTI SPOJITÉ NÁHODNÉ VELIČINY

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN

Zápočtová práce STATISTIKA I

Stavový model a Kalmanův filtr

Bodové odhady parametrů a výstupů

4EK211 Základy ekonometrie

Chyby měření 210DPSM

KGG/STG Statistika pro geografy

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Matematika II, úroveň A ukázkový test č. 1 (2017) 1. a) Napište postačující podmínku pro diferencovatelnost funkce n-proměnných v otevřené

TEST 1 (40 bodů) (9 4)! 2. Nejméně kolikrát musíme hodit kostkou, abychom měli alespoň 80% pravděpodobnost, že padne alespoň jedna šestka?

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Transkript:

Příklady - odový odhad 5. října 03 Pražské metro Přijdu v pražském metru na nástupiště a tam zjistím, že metro v mém směru jelo před :30 a metro v opačném směru před 4:0. Udělejte bodový odhad, jak dlouho budu čekat na metro. ) Metoda momentů Označím si: X : 30 50s, Y 4 : 0 60s. Předpokládejme, že metra jezdí v pravidelných intervalech po sekundách. Pokud přijdu v náhodný okamžik, má doba, jakou budu čekat, rovnoměrné spojité rozdělení od 0 do. Odhaduji jeden parametr, bude mi tedy stačit první moment, tedy střední hodnota. Zjistím tedy střední hodnotu, jak dlouho bych čekal na metro a střední hodnotu z rovnoměrného spojitého rozdělení. Obojí porovnám. Podle zadání budu v jednom směru čekat x X a v druhém směru x Y. Střední hodnota těchto časů je: X+ Y X+Y 50+60 05. Střední hodnota pro rovnoměrné rozdělení od 0 do je: µ 0+. Porovnáme: µ x 05 40 40 Máme tedy bodový odhad pro dobu, po jaké jezdí metra. odový odhad pro dobu, jakou budu čekat v prvním směru je tedy: T X 40 50 60. Můžeme si všimnout, že nám vyšla stejná hodnota jako je Y. Není to náhoda, protože když příklad necháme v písmenkách X a Y, vyjde nám X + Y X + Y

T X Y Získáváme tedy poněkud paradoxní výsledek, že nejlepší bodový odhad doby, jakou budu čekat na metro, získám tak, že se podívám na hodiny v opačném směru. Je tento podivný výsledek správně? Ano, je. Musíme si ale uvědomit, že děláme bodový odhad, který nám nic neříká o přesnosti odhadu. A protože celou metodu nasazujeme jen na dva údaje, je odhad velmi, velmi nepřesný. ) Metoda maximální věrohodnosti Vyřešíme stejný příklad metodou maximální věrohodnosti. Pro rovnoměrné rozdělení se to dělá spíše úvahou než výpočtem, což si ukážeme. Metra jezdí v pravidelných intervalech délky. Pro dobu, před jakou odjelo metro, mám opět rovnoměrné rozdělení od 0 do. Znám dvě hodnoty pro doby, před jakou odjelo metro: X : 30 50s, Y 4 : 0 60s. Určitě chci, aby tyto hodnoty ležely v intervalu 0,. Pak bude hustota pravděpodobnosti pro obě hodnoty rovna: f (50), f (60). (Hustota pravděpodobnosti má tvar obdélníku. Jeho délka je. Integrál přes def. obor musí být, takže výška obdélníku je.) Chci mít co největší věrohodnostní funkci, což je: V () f (50) f (60). Proto musí být co nejmenší. A přesto se obě hodnoty musí do intervalu vejít. To mejlépe udělám tak, že bude rovno největší hodnotě z dat. Tedy max (X i ) 60. Odhad pro dobu čekání je tedy 60 50 0. Shrnutí a porovnání metod Obě metody nám tedy dávají různé odhady. A mají také různé statistiky pro odhad parametru : X + Y, max (X i ). Která z těchto statistik je lepší? Soustřeďme se na druhou statistiku. Pokud bychom znali skutečnou hodnotu a pak ji odhadovali největší hodnotou, která padla, pak bude odhad vždy menší než skutečná hodnota. Takže statistika nebude nestranná!!! (ude tzv. vychýlená.) Takže to není dobrá statistika a dáme přednost první metodě momentů. Udělejme si takové porovnání obou metod: Rovnoměrné rozdělení: Lepší je metoda momentů. Exponenciální rozdělení: Obě metody dávají stejné výsledky. Metoda momentů bývá jednodušší. Normální Gaussovo rozdělení: Metoda momentů je jednodušší a dává lepší výsledky.

Složité několikarozměrné rozdělení: Lepší je metoda maximální věrohodnosti. Normální Gaussovo rozdělení Naměřili jsme tato data:, 8, 8, 4. Předpokládáme, že tato data mají normální rozdělení. Jaké konkrétní Gaussově křivce nejlépe odpovídají? ) Metoda maximální věrohodnosti Tato metoda je poměrně pracná a pro normální rozdělení nedává příliš dobrý odhad pro rozptyl. Přesto jsem ji tu ukázal, abyste se s ní seznámili. Gaussova křivka je dána parametry µ a σ. Tyto parametry tedy odhadneme. Hustota pravděpodobnosti normálního rozdělení je dána vzorcem: Věrohodnostní funkce je tedy dána vzorcem: f (x) σ π (x µ) e σ. V (µ, σ) σ π ( µ) e σ σ π (8 µ) e σ ( ) 4 σ e ( µ) +(8 µ) +(8 µ) +(4 µ) σ π 4π σ 4 e σ σ π (8 µ) e σ [( µ) +(8 µ) +(8 µ) +(4 µ) ]. σ π (4 µ) e σ Hledáme maximum funkce, tedy body, v nichž jsou obě parciální derivace podle µ i podle σ rovny 0. Spočtěme první parciální derivaci: V µ 4π σ 4 e σ [( µ) +(8 µ) +(8 µ) +(4 µ) ] ( ) σ [ ( µ) (8 µ) (8 µ) (4 µ)] 4π σ 6 e σ [( µ) +(8 µ) +(8 µ) +(4 µ) ] [( µ) + (8 µ) + (8 µ) + (4 µ)]. Kdy se tento výraz rovná nule? Tehdy, když je nulová hranatá závorka napravo. Máme tedy rovnici: [( µ) + (8 µ) + (8 µ) + (4 µ)] 0 3 4µ 0 µ 8. Spočtěme ještě druhou parciální derivaci: V σ [ 4π 4σ 5 e σ [( µ) +(8 µ) +(8 µ) +(4 µ) ] + 3

+σ 4 e σ [( µ) +(8 µ) +(8 µ) +(4 µ) ] ( ) ( σ 3) [ ( µ) + (8 µ) + (8 µ) + (4 µ) ]] 4π e σ [( µ) +(8 µ) +(8 µ) +(4 µ) ] σ 7 [ 4σ + ( µ) + (8 µ) + (8 µ) + (4 µ) ]. tedy: Kdy se tento výraz rovná nule? Když je nulová hranatá závorka na posledním řádku. Máme 4σ + ( µ) + (8 µ) + (8 µ) + (4 µ) 0 4σ + ( 8) + (8 8) + (8 8) + (4 8) 0 4σ + 36 + 0 + 0 + 36 0 σ 8. Hledané rozdělení je tedy: N (8, 8). Můžeme si všimnout, že získaný rozptyl je rozptyl, jako kdyby data byla základním souborem. To je chybička, která s rostoucím počtem dat mizí. Odhad rozptylu je vychýlený, proto dáme přednost metodě momentů. ) Metoda momentů Střední hodnota dat je: x 8. Výběrový rozptyl dat je: s 4. Střední hodnotu a rozptyl základního souboru odhadneme střední hodnotou a rozptylem výběrového souboru: µ x 8, σ s 4. Hledané rozdělení je: N (8, 4). Metoda je podstatně jednodušší a dává pro rozptyl správný výsledek. Příklady ke spočtení ) Několik atomových jader zkoumaného prvku se rozpadlo po 8, 4,,, 9, 3 minutách. Odhadněte funkci, která udává pravděpodobnost, že se jádro v určitém čase rozpadne. Exponenciální rozdělení, f (t) 8 e t 8 ) Hmotnost myší má normální rozdělení. Získali jsme následující hmotnosti myší: 6,, 7, 0, 8, 9,, 0, 5. Odhadněte rozdělení hmotnosti myší. Metoda momentů, f (m) N (; 4, 5) 4

3) Má tramvaj jezdí ráno v pravidelných intervalech. Zlý vandal ale strhl jízdní řád. Na tramvaj jsem minulý týden čekal, 4, 8, a 5 minut. Odhadněte, v jakém intervalu jezdí tramvaj. Metoda momentů, rovnoměrné spojité rozdělení, 6 minut. 4) Jsem opravář na železniční trati. Ráno jsem zjistil, že musím provést opravu na., 3. a 89. kilometru. Odhadněte, jaký úsek trati mám na starosti. Metoda momentů, rovnoměrné spojité rozdělení, 75. až 39. kilometr. 5