Pravděpodobnost a statistika (BI-PST) Cvičení č. 9 R. Blažek, M. Jiřina, J. Hrabáková, I. Petr, F. Štampach, D. Vašata Katedra aplikované matematiky Fakulta informačních technologií České vysoké učení technické v Praze ZS 2014/2015 Hrabáková, Petr, Štampach, Vašata BI-PST, Cvičení č. 9 ZS 2014/2015 1 / 10
Opakování teorie Definice: Odhad ˆθ n parametru θ se nazývá nestranný (nevychýlený), jestliže E ˆθ n (X 1,..., X n ) = θ, pro všechna θ Θ. Nestrannost znamená, že odhad není zatížen systematickou chybou. Definice: Odhad ˆθ n parametru θ se nazývá konzistentní, jestliže pro každé ɛ > 0 a θ Θ lim P ( ˆθn (X 1,..., X n ) θ ɛ ) = 0. n + Konzistence znamená, že volbou velkého n lze učinit chybu dostatečně malou. Hrabáková, Petr, Štampach, Vašata BI-PST, Cvičení č. 9 ZS 2014/2015 2 / 10
Nejužívanější bodové odhady Výběrový průměr Výběrový rozptyl X n = 1 n s 2 n = 1 n 1 Výběrová směrodatná odchylka k-tý výběrový moment Výběrová kovarinace n X i. n (X i X n ) 2. s n = s 2 n. m k = 1 n ĉov(x, Y ) = 1 n 1 n Xi k. n (X i X n )(Y i Ȳn). Hrabáková, Petr, Štampach, Vašata BI-PST, Cvičení č. 9 ZS 2014/2015 3 / 10
Příklad 9.1 Ukažte, že výběrový průměr je nestranným odhadem střední hodnoty a výběrový rozptyl je nestranným odhadem rozptylu. Hrabáková, Petr, Štampach, Vašata BI-PST, Cvičení č. 9 ZS 2014/2015 4 / 10
Opakování teorie - momentová metoda Napočítáme teoretické momenty jako funkce parametrů θ 1,..., θ d µ j = µ j (θ 1,..., θ d ) = E X j i, pro j = 1,..., k. Číslo k volíme, abychom pokryli všechny parametry θ 1,..., θ d. Z dat spočteme výběrové momenty m j pro j = 1,..., k, jakožto odhady momentů µ j. Ze soustavy rovnic vyjádříme odhady µ j (θ 1,..., θ d ) = m j ˆθ j = ˆθ j (m 1,..., m k ). Smysluplnost metody je založená na faktu, že zákony velkých čísel implikují m j µ j pro n +. Hrabáková, Petr, Štampach, Vašata BI-PST, Cvičení č. 9 ZS 2014/2015 5 / 10
Příklad 9.2 Předpokládejme, že délka transakce databázového serveru je náhodná veličina s exponenciálním rozdělením s parametrem θ. Doby transakcí jsou nezávislé. a) Odvoďte odhad θ momentovou metodou. b) Z logu jsme zjistili, že délky posledních 5 transakcí byli: 5.4, 15.6, 9.3, 0.5, 2.6 ms. Určete číselnou hodnotu předchozího odhadu. Hrabáková, Petr, Štampach, Vašata BI-PST, Cvičení č. 9 ZS 2014/2015 6 / 10
Opakování teorie - metoda maximální věrohodnosti Dobré a konzistentní odhady je možné získat metodou maximální věrohodnosti. Cílem je maximalizovat věrohodnostní funkci pro dané naměřené hodnoty. Definice: Nechť náhodný výběr X 1,..., X n má rozdělení určené sdruženou hustotu n f (x; θ) = f θ (x i ) pro spojité rozdělení, resp. p(x; θ) = n P θ (X i = x i ) pro diskrétní rozdělení. Při pevné hodnotě x = (x 1,..., x n ) se funkce f (x; θ) resp. p(x; θ) jakožto funkce θ nazývá věrohodnostní funkce a značí L(θ; x). Věrohodnostní funkce závisí pouze na parametru θ. Hodnoty x 1,..., x n jsou známé a pevné. Hrabáková, Petr, Štampach, Vašata BI-PST, Cvičení č. 9 ZS 2014/2015 7 / 10
Opakování teorie - metoda maximální věrohodnosti Postup metody: Spočteme věrohodnostní funkci a najdeme hodnotu parametru θ, která ji maximalizuje. Často je výhodné maximalizovat funkci ln L(θ; x) - protože se produkt změní na sumu. V případě k-rozměrného parametru θ = (θ 1,..., θ k ) tak obvykle řešíme soustavu rovnic ln L(θ 1,..., θ k ; x) θ j = 0, pro j = 1,..., k. Jako maximálně věrohodný odhad funkce g(θ) bereme g(ˆθ). Hrabáková, Petr, Štampach, Vašata BI-PST, Cvičení č. 9 ZS 2014/2015 8 / 10
Příklad 9.3 Předpokládejme, že délka transakce databázového serveru je náhodná veličina s exponenciálním rozdělením s parametrem θ. Doby transakcí jsou nezávislé. a) Odvoďte odhad θ metodou maximální věrohodnosti. b) Z logu jsme zjistili, že délky posledních 5 transakcí byli: 5.4, 15.6, 9.3, 0.5, 2.6 ms. Určete číselnou hodnotu předchozího odhadu. Hrabáková, Petr, Štampach, Vašata BI-PST, Cvičení č. 9 ZS 2014/2015 9 / 10
Příklad 9.4 Rybáři v rybářství Kapřík a Štička s.r.o. potřebují před vánoci odhadnout počet kaprů v relativně velkém rybníku. Postupují takto: Chytí a označí 100 kaprů a vypustí je zpět do rybníka. Za měsíc opět chytí 100 kaprů a zjistí, že 10 jich má značku. a) Najděte prvotní hrubý odhad počtu kaprů v rybníku (bez výpočtů). b) Nechť N je skutečný počet kaprů v rybníku. najděte výraz pro pravděpodobnost, že 10 ze 100 chycených kaprů má značku. c) Najděte hodnotu N, která maximalizuje předchozí výraz, tj. odhad metodou maximální věrohodnosti. d) Zkuste rozmyslet jakým dodatečným postupem bychom mohli odhad zpřesnit. Hrabáková, Petr, Štampach, Vašata BI-PST, Cvičení č. 9 ZS 2014/2015 10 / 10