ÚVOD DO TEORIE ODHADU. Martina Litschmannová

Rozměr: px
Začít zobrazení ze stránky:

Download "ÚVOD DO TEORIE ODHADU. Martina Litschmannová"

Transkript

1 ÚVOD DO TEORIE ODHADU Martina Litschmannová

2 Obsah lekce Výběrové charakteristiky parametry populace vs. výběrové charakteristiky limitní věty další rozdělení pravděpodobnosti (Chí-kvadrát (Pearsonovo), Studentovo, Fisherovo - Snedecorovo) Úvod do teorie odhadu bodové odhady vs. intervalové odhady vlastnosti bodových odhadů intervalové odhady jednovýběrové rozdílů, resp. podílů, parametrů dvou populací

3 Princip statistické indukce

4 Výběrové charakteristiky vs. parametry populace Parametry populace (obvykle pro jejich značení používáme symboly řecké abecedy) jsou konstanty. Charakteristiky výběru (obvykle značíme latinkou) jsou obvykle různé v závislosti na pořízeném výběru. Jsou to náhodné veličiny. Základní soubor (populace) Výběrový soubor (výběr) stř. hodnota E X, resp. μ (výběrový) průměr തX medián x 0,5 výběrový medián X 0,5 rozptyl D X, resp. σ výběrový rozptyl S směr. odchylka σ výběrová směr. odchylka S pravděpodobnost π rel. četnost p

5 Limitní věty aneb popis pravděpodobnostních modelů pro případ rostoucího počtu realizací náhodného pokusu

6 Slabý zákon velkých čísel Mějme nekonečný náhodný výběr X 1, X, z rozdělení se střední hodnotou μ X a konečným rozptylem, kde X 1, X, jsou nekorelované náhodné veličiny. Potom platí, že výběrový průměr തX n vypočítaný z prvních n pozorování se pro n blíží ke střední hodnotě μ X, což zapisujeme lim P തX n μ X > ε = 0 pro každé ε > 0. n Zjednodušeně: průměr se s rostoucím rozsahem výběru blíží střední hodnotě nebo relativní četnost se s rostoucím rozsahem výběru blíží pravděpodobnosti

7 Centrální limitní věta Jsou-li X i nezávislé náhodné veličiny se stejnou střední hodnotou μ X a se stejným konečným rozptylem, σ X pak výběrový průměr má při dostatečně velkém počtu pozorování přibližně normální rozdělení, ať už X i pocházejí z libovolného rozdělení. Centrální limitní větu zapisujeme തX~N μ X, σ X n nebo തX μ X σ X n~n 0,1. Předpoklady CLV: X i nezávislé náhodné veličiny, E X 1 = E X = = E X n = μ X, D X 1 = D X = = D X n = σ X ; σ X <, n (v praxi: n > 30, výběr neobsahuje odlehlé pozorování).

8 Centrální limitní věta Vlastnosti výběrového průměru തX~N μ X, σ X n f(x) 1, 1 0,8 0,6 0,4 0, n=1 n=5 n=10 n= x Vliv rozsahu výběru na graf hustoty pravděpodobnosti výběrového průměru

9 1 Doba přežití jistého typu pacientů má exponenciální rozdělení se střední hodnotou roky. Určete pravděpodobnost, že a) doba přežití pacienta bude vyšší než 7 měsíců, Řešení: X doba přežití pacienta (měs.) X~Exp λ = 1 4 P X > 7 = 1 F 7 = e 7 4 0,35

10 1 Doba přežití jistého typu pacientů má exponenciální rozdělení se střední hodnotou roky. Určete pravděpodobnost, že b) průměrná doba přežití 150 pacientů bude vyšší než 7 měsíců. Řešení: തX 150 průměrná doba přežití 150 pacientů (měs.) X i doba přežití pacienta (měs.), E X i = 1 λ = 4, D X i = 1 λ = 576 തX 150 ~N μ = E X i, σ = D X i 150 തX 150 ~N μ = 4, σ = 3,84 P തX 150 > 7 = 1 F 7 = 1 Φ 7 4 3,84 = 1 Φ 1,53 = 0,063

11 Doba přežití jistého typu pacientů má střední hodnotu roky a směrodatnou odchylku roky. Určete pravděpodobnost, že a) doba přežití pacienta bude vyšší než 7 měsíců, Řešení: X doba přežití pacienta (měs.) X~? Nelze určit, protože neznáme rozdělení doby přežití pacienta.

12 Doba přežití jistého typu pacientů má střední hodnotu roky a směrodatnou odchylku roky. Určete pravděpodobnost, že b) průměrná doba přežití 150 pacientů bude vyšší než 7 měsíců. Řešení: തX 150 průměrná doba přežití 150 pacientů (měs.) X i doba přežití pacienta (měs.), E X i = 4, D X i = 576 തX 150 ~N μ = E X i, σ = D X i 150 തX 150 ~N μ = 4, σ = 3,84 P തX 150 > 7 = 1 F 7 = 1 Φ 7 4 3,84 = 1 Φ 1,53 = 0,063

13 Důsledky centrální limitní věty rozdělení součtu NV Nechť: X i nezávislé náhodné veličiny, E X 1 = E X = = E X n = μ X, D X 1 = D X = = D X n = σ X ; σ X <, n (v praxi: n > 30, výběr neobsahuje odlehlé pozorování), pak σ n i=1 X i ~N nμ X, nσ X.

14 Důsledky centrální limitní věty rozdělení rel. četnosti p~n π; π 1 π n nebo p π π 1 π n~n 0; 1 Relativní četnost p má pro dostatečně velké výběry přibližně normální rozdělení se střední hodnotou π a rozptylem π 1 π Výběry považujeme obvykle za dostatečně velké v případě, že n > 9 p 1 p. n. Důkaz: Nechť X i ~A π, pak 1 σ n i=1 X i = p. Dle CLV: 1 σ n i=1 n X i ~N E X i ; D X i n n, tj. p~n π; π 1 π n.

15 Důsledky centrální limitní věty rozdělení rozdílu průměrů Mějme náhodný výběr X 11,, X 1n1 z rozdělení se střední hodnotou μ 1 a náhodný výběr X 1,, X n z rozdělení se střední hodnotou μ. Dále nechť jsou splněny následující předpoklady: Rozsah každé z populací je dostatečně velký vzhledem k rozsahu příslušného výběru n i < 0,05N i. Platí předpoklady CLV, zejména to, že každý z výběrů pochází z normálního rozdělení nebo je dostatečně velký (za dostatečně velké obvykle považujeme výběry s rozsahem větším než 30). Pak തX 1 തX ~N μ 1 μ, σ 1 n 1 + σ n nebo തX 1 തX μ 1 μ σ 1 n1 +σ n ~N 0, 1.

16 Důsledky centrální limitní věty rozdělení rozdílu rel. četností Výběrový průměr തX 1 vypočítaný z prvních n 1 pozorování náhodného výběru z A π 1 udává relativní četnost jevu A a značíme ji p 1. Obdobně തX vypočítaný z prvních n pozorování náhodného výběru z A π udává relativní četnost jevu B a značíme ji p. Dále nechť: Rozsah každé z populací je dostatečně velký vzhledem k rozsahu příslušného výběru n i < 0,05N i. Výběry z obou populací jsou dostatečně velké na to, aby pro modelování rozdílu mezi relativními četnostmi mohlo být použito normální rozdělení. Výběry jsou obvykle považovány za dostatečně 9 9 velké v případě, že n 1 > n p 1 1 p >. Pak 1 p 1 p p 1 p ~N π 1 π, π 1 1 π 1 n 1 + π 1 π n nebo p 1 p π 1 π π1 1 π1 n1 + π 1 π n ~N 0, 1.

17 Spojitá rozdělení náhodné veličiny mající využití v metodách statistické indukce

18 K čemu potřebujeme znát výběrová rozdělení? Výběrová rozdělení nacházejí uplatnění při odhadech střední hodnoty a pravděpodobnosti, resp. jejich rozdílů nebo při testování hypotéz o těchto parametrech. Při odhadech rozptylu, poměru rozptylů, odhadech střední hodnoty v případě, že máme k dispozici pouze malý výběr, který nepochází z normálního rozdělení, a v dalších metodách statistické indukce nacházejí uplatnění tři důležitá spojitá rozdělení: χ - rozdělení, Studentovo rozdělení, Fisherovo Snedecorovo rozdělení.

19 χ - rozdělení (Pearsonovo rozdělení) Mějme nezávislé náhodné veličiny Z 1, Z,, Z ν, z nichž každá má normované normální rozdělení. Součet čtverců těchto náhodných veličin, tj. náhodná veličina X má rozdělení χ (čteme chíkvadrát ) s ν stupni volnosti, což značíme χ ν. i = 1,, n: Z i ~ N 0; 1, pak X = σν i=1 Z i ~ χ ν Sledujte vliv stupňů volnosti na tvar rozdělení NV s rozdělením χ ν, její střední hodnotu a rozptyl. (Spojitá rozdělení excel)

20 χ - rozdělení (Pearsonovo rozdělení) X~χ ν stupně volnosti (parametr rozdělení)

21 χ - rozdělení (Pearsonovo rozdělení) Vlastnosti χ - rozdělení: 1. E X = ν; D X = ν. Pro ν : X~ N ν; ν. Předpokládejme, že provedeme náhodný pokus spočívající v náhodném výběru o rozsahu n z populace podléhající normálnímu rozdělení s rozptylem σ. Pro uvedený výběr určíme výběrovou směrodatnou odchylku s. Lze ukázat, že : n 1 S σ ~ χ n 1.

22 χ - rozdělení (Pearsonovo rozdělení) Použití χ - rozdělení: 1. Vlastnosti, že n 1 S σ χ n 1 se využívá k testování toho, zda rozptyl základního souboru s normálním rozdělením je roven σ 0, resp. k odhadování směrodatné odchylky základního souboru s norm. rozdělením.. χ - rozdělení se používá pro ověření nezávislosti kategoriálních proměnných (test nezávislosti v kontingenční tabulce). 3. Pokud testujeme, zda náhodné veličiny (naměřená data) pocházejí z určitého rozdělení, můžeme také s úspěchem použít χ - rozdělení. Tento test je znám pod názvem "test dobré shody".

23 Firma Edison vyrábí žárovky Ed. Životnost těchto žárovek je průměrně 5 let se směrodatnou odchylkou 6 měsíců. Pro ověřování kvality výroby bude testováno 0 žárovek. Jaká je pravděpodobnost, že při tomto testu bude zjištěna směrodatná odchylka životnosti vyšší než 7 měsíců? Řešení: S výběrová směrodatná odchylka P S > 7 =? Neznáme rozdělení S! X = n 1 S σ X~χ n 1 V našem případě: X = 0 1 S = S ~χ 19 ALE! P S > 7 = P X > = P X > 5,86 = 0,134 3

24 Studentovo (t) rozdělení Uvažujme dvě nezávislé náhodné veličiny: Z a V. Náhodná veličina Z má normované normální rozdělení, náhodná veličina V má χ rozdělení s ν stupni volnosti. Potom náhodná veličina T, T = Z, V ν má Studentovo t rozdělení s ν stupni volnosti, což značíme T ~t ν. Sledujte vliv stupňů volnosti na tvar rozdělení NV s rozdělením t ν, její střední hodnotu a rozptyl. (Spojitá rozdělení excel)

25 Studentovo (t) rozdělení X~t ν stupně volnosti (parametr rozdělení)

26 Studentovo (t) rozdělení Vlastnosti Studentova rozdělení: 1. E X = 0; D X = ν ν pro ν >. Pro ν : X~N 0; 1. Pokud náhodné veličiny X 1, X,, X n mají normální rozdělení N μ, σ a jsou navzájem nezávislé, lze ukázat, že ത X μ S n ~ t n Mějme dva výběry z normálního rozdělení se stejným rozptylem. Pak തX 1 തX μ 1 μ S 1 n 1 1 +S n 1 n 1 n n 1 +n n 1 +n ~ t n1 +n. 4. Mějme dva výběry z normálního rozdělení s různými rozptyly. Pak തX 1 തX μ 1 μ S 1 n1 +S n ~ t ν, kde ν = S 1 n1 S 1 n1 +S n 1 n1+1 + S n. 1 n+1

27 Studentovo (t) rozdělení Použití Studentova rozdělení: 1. modelování založené na analýze malých výběrů n < 30,. testování hypotéz o střední hodnotě, pokud je rozptyl základního souboru neznámý a výběr pochází z normálního rozdělení, 3. testování hypotéz o shodě středních hodnot, 4. analýza výsledků regresní analýzy.

28 4 Útvar kontroly podniku Edison testoval životnost žárovek. Kontroloři vybrali z produkce podniku náhodně 50 žárovek a došli k závěru, že průměrná doba života (přesněji řečeno výběrový průměr doby života) těchto 50 žárovek je 950 hodin. Zároveň předpokládají, že směrodatná odchylka životnosti žárovek je 100 hodin. Odhadněte interval, v němž s pravděpodobností 0,95 leží střední životnost testovaných žárovek. (Předpokládejte, že životnost žárovek lze modelovat normálním rozdělením.)

29 4 Útvar kontroly podniku Edison testoval životnost žárovek. Kontroloři vybrali z produkce podniku náhodně 50 žárovek a došli k závěru, že průměrná doba života (přesněji řečeno výběrový průměr doby života) těchto 50 žárovek je 950 hodin. Zároveň předpokládají, že směrodatná odchylka životnosti žárovek je 100 hodin. Odhadněte interval, v němž s pravděpodobností 0,95 leží střední životnost testovaných žárovek. (Předpokládejte, že životnost žárovek lze modelovat normálním rozdělením.) Řešení: P x 0,05 < X < x 0,975 = 0,95 Důkaz: P x 0,05 < X < x 0,975 = F x 0,975 F x 0,05 = 0,975 0,05 = 0,95

30 4 Útvar kontroly podniku Edison testoval životnost žárovek. Kontroloři vybrali z produkce podniku náhodně 50 žárovek a došli k závěru, že průměrná doba života (přesněji řečeno výběrový průměr doby života) těchto 50 žárovek je 950 hodin. Zároveň předpokládají, že směrodatná odchylka životnosti žárovek je 100 hodin. Odhadněte interval, v němž s pravděpodobností 0,95 leží střední životnost testovaných žárovek. (Předpokládejte, že životnost žárovek lze modelovat normálním rozdělením.) Řešení: തX n průměrná životnost n žárovek (h), μ X střední životnost žárovek (h) P P P P തX n ~N μ = μ X, σ = σ X n ത X n μ X σ X z 0,05 < ത X n μ X σ X n < z 0,975 = 0,95 n ~N(μ = 0, σ = 1) തX n + z 0,05 σ X n < μ X < തX n + z 0,975 σ X n = 0,95 തX n z 0,05 σ X > μ n X > തX n z 0,975 σ X < μ n X < തX n z 0,975 σ X n = 0,95 തX n z 0,05 σ X n = 0,95 ത X n μ X σ X n~n(μ = 0, σ = 1)

31 4 Útvar kontroly podniku Edison testoval životnost žárovek. Kontroloři vybrali z produkce podniku náhodně 50 žárovek a došli k závěru, že průměrná doba života (přesněji řečeno výběrový průměr doby života) těchto 50 žárovek je 950 hodin. Zároveň předpokládají, že směrodatná odchylka životnosti žárovek je 100 hodin. Odhadněte interval, v němž s pravděpodobností 0,95 leží střední životnost testovaných žárovek. (Předpokládejte, že životnost žárovek lze modelovat normálním rozdělením.) Řešení: തX n průměrná životnost n žárovek (h), μ X střední životnost žárovek (h) P P P തX n ~N μ = μ X, σ = σ X n ത X n μ X σ X z 0,05 < ത X n μ X σ X n < z 0,975 = 0,95 തX n z 0,975 σ X n < μ X < തX n z 0,975 σ X n < μ X < n ~N(μ = 0, σ = 1) തX n z 0,05 σ X n = 0,95 തX n +z 0,975 σ X n = 0,95 ത X n μ X σ X n~n(μ = 0, σ = 1)

32 4 Útvar kontroly podniku Edison testoval životnost žárovek. Kontroloři vybrali z produkce podniku náhodně 50 žárovek a došli k závěru, že průměrná doba života (přesněji řečeno výběrový průměr doby života) těchto 50 žárovek je 950 hodin. Zároveň předpokládají, že směrodatná odchylka životnosti žárovek je 100 hodin. Odhadněte interval, v němž s pravděpodobností 0,95 leží střední životnost testovaných žárovek. (Předpokládejte, že životnost žárovek lze modelovat normálním rozdělením.) Řešení: തX n průměrná životnost n žárovek (h), μ X střední životnost žárovek (h) P P തX n ~N μ = μ X, σ = σ X n ത X n μ X σ X z 0,05 < ത X n μ X σ X n < z 0,975 = 0,95 തX n z 0,975 σ X n < μ X < n ~N(μ = 0, σ = 1) തX n +z 0,975 σ X n = 0,95 P 950 1, < μ X < , = 0,95 ത X n μ X σ X n~n(μ = 0, σ = 1)

33 4 Útvar kontroly podniku Edison testoval životnost žárovek. Kontroloři vybrali z produkce podniku náhodně 50 žárovek a došli k závěru, že průměrná doba života (přesněji řečeno výběrový průměr doby života) těchto 50 žárovek je 950 hodin. Zároveň předpokládají, že směrodatná odchylka životnosti žárovek je 100 hodin. Odhadněte interval, v němž s pravděpodobností 0,95 leží střední životnost testovaných žárovek. (Předpokládejte, že životnost žárovek lze modelovat normálním rozdělením.) Řešení: തX n průměrná životnost n žárovek (h), μ X střední životnost žárovek (h) P തX n ~N μ = μ X, σ = σ X n ത X n μ X σ X z 0,05 < ത X n μ X σ X n < z 0,975 = 0,95 n ~N(μ = 0, σ = 1) P തX n z 0,975 σ X < μ n X < തX n +z 0,975 σ X = 0,95 n P 9 < μ X < 978 = 0,95 ത X n μ X σ X n~n(μ = 0, σ = 1)

34 Fisherovo - Snedecorovo (F) rozdělení Mějme dvě nezávislé náhodné veličiny V a W s rozdělením χ. První z nich má počet stupňů volnosti m, druhá má počet stupňů volnosti n (obecně mají různý počet stupňů volnosti). Pak má náhodná veličina V F = m W n Fisherovo-Snedecorovo rozdělení o m a n stupních volnosti, což značíme F ~ F m,n. Sledujte vliv stupňů volnosti na tvar rozdělení NV s rozdělením F m,n, její střední hodnotu a rozptyl. (Spojitá rozdělení excel)

35 Fisherovo - Snedecorovo (F) rozdělení X~F m,n stupně volnosti pro jmenovatele (parametr rozdělení) stupně volnosti pro čitatele (parametr rozdělení)

36 Fisherovo - Snedecorovo (F) rozdělení Vlastnosti Fisherova-Snedecorova rozdělení: 1. Mějme dva výběry z normálního rozdělení (X 1i ~N μ 1 ; σ 1, X j ~N μ ; σ ). S 1 a S jsou příslušné výběrové rozptyly. Pak S 1 Τ σ 1 Τ S Τσ ~F n1 1,n 1.

37 Fisherovo - Snedecorovo (F) rozdělení Použití Fisherova-Snedecorova rozdělení: 1. K testu o shodě rozptylů dvou základních souborů,. k testům o shodě středních hodnot více než dvou základních souborů, v tzv. analýze rozptylu, 3. k testům v regresní analýze.

38 5 Firma Edison vyrábí žárovky Ed. Životnost těchto žárovek je průměrně 5 let se směrodatnou odchylkou 6 měsíců. Uvedené informace specifikujeme: Žárovky jsou vyráběny na dvou linkách. Předpokládejme, že obě linky mají srovnatelné parametry, tj. že průměrná životnost a variabilita životnosti žárovek Ed vyrobených ve firmě Edison nezávisí na tom, na jaké lince byly vyrobeny. Pro ověření kvality výroby bude testována životnost 0 žárovek z linky 1 a 30 žárovek z linky. Jaká je pravděpodobnost, že u vzorku z linky 1 bude zjištěn více než dvojnásobný rozptyl oproti rozptylu zjištěnému u vzorku z linky? Řešení: S 1 výběrový rozptyl na lince 1, S výběrový rozptyl na lince S 1 Τ σ 1 Τ S Τσ ~F n1 1,n 1 σ 1 = σ S 1 ΤS ~F n1 1,n 1 P S 1 S > = 1 F = 0,045 (V R: 1-pf(,19,9))

39 Úvod do teorie odhadu

40 Lze určit střední hodnotu životnosti el. součástek? Lze určit účinnost léku? Lze určit, který výrobce vyrábí kvalitněji? Neznáme-li rozdělení náhodné veličiny X, pak parametry náhodné veličiny X nelze většinou přesně určit, lze je jen odhadnout.

41 Jak odhadnout parametry populace? Bodový odhad - parametr základního souboru aproximujeme jediným číslem Intervalový odhad parametr populace aproximujeme intervalem, v němž s velkou pravděpodobností příslušný populační parametr leží.

42 Bodový odhad Mějme náhodný výběr X 1, X,, X n z určitého rozdělení, které závisí na neznámém parametru θ. Odhadem T parametru θ je pak výběrová charakteristika T X 1, X,, X n, která nabývá hodnot blízkých neznámému parametru θ. Vybrané populační parametry a jejich bodové odhady: konstanty obecně značíme θ Základní soubor (populace) Výběrový soubor (výběr) stř. hodnota E X, resp. μ (výběrový) průměr തX medián x 0,5 výběrový medián X 0,5 rozptyl D X, resp. σ výběrový rozptyl S směr. odchylka σ výběrová směr. odchylka S pravděpodobnost π rel. četnost p náhodné veličiny obecně značíme T X

43 Interval spolehlivosti vs. intervalový odhad Interval spolehlivosti (konfidenční interval) pro parametr θ se spolehlivostí 1 α, kde α 0; 1, je taková dvojice statistik T D, T H, že Intervalový odhad t D, t H P T D θ T H = 1 α. je jednou z realizací intervalu spolehlivosti. V čem spočívá výhoda intervalových odhadů vůči bodovým odhadům? Přinášejí informaci o nejistotě (nepřesnosti) odhadu.

44 Co je co v terminologii intervalových odhadů? P T D θ T H = 1 α hledaný parametr (konstanta, kterou nejsme schopni přesně určit) spolehlivost odhadu, tj. pravděpodobnost s níž hledaný parametr θ leží v intervalu T D ; T H meze intervalu spolehlivosti (náhodné veličiny)

45 odhad Co to znamená, že spolehlivost odhadu je 1-α? realizace Simulace 100 intervalových odhadů střední hodnoty (spolehlivost 0,95) získaných na základě opakovaných výběrů o rozsahu 30 z populace se střední hodnotou intervalů ze 100 neobsahuje skutečnou střední hodnou.

46 Jaké máme požadavky na interval spolehlivosti? P T D θ T H = 1 α hladina významnosti Co největší spolehlivost odhadu. Co nejmenší šířka intervalu spolehlivosti. (S rostoucí šířkou intervalového odhadu klesá významnost získané informace.) Závěr: S rostoucí spolehlivostí se zvětšuje šířka intervalového odhadu a tím klesá významnost takto získané informace. Nutnost kompromisu α = 05, resp. 0,01 nebo 0,10 S rostoucím rozsahem výběru se šířka intervalového odhadu snižuje.

47 Jaké jsou typy intervalů spolehlivosti? oboustranné P θ < T D = P θ > T H = α Tyto dvě podmínky zaručují, že P T D θ T H = 1 α. jednostranné (odhadujeme-li například délku života nějakého zařízení, je pro nás důležitá pouze dolní mez) levostranné: P θ T D = 1 α pravostranné : P θ T H = 1 α

48 Jak najít intervalový odhad parametru θ? Obecně: 1) Zvolíme vhodnou výběrovou charakteristiku T X, jejíž rozdělení známe. (Nechť x p jsou p- kvantily spojité náhodné veličiny T X.) ) P xα T X x 1 α P T X x 1 α = 1 α, P T X x α = 1 α. = 1 α Proč to tak je? 1 α = 1 α α = F x 1 α F xα = P xα T X x 1 α 1 α = 1 F x α = P T X x α 1 α = F x 1 α = P T X < x 1 α = P T X x 1 α

49 Vybrané intervalové odhady parametrů rozdělení náhodné veličiny

50 Intervalový odhad střední hodnoty náhodné veličiny s normálním rozdělením a) známe-li rozptyl σ Předpokládejme, že sledovaná náhodná veličina X má normální rozdělení s neznámou střední hodnotou μ a známým rozptylem σ. Vyberme vzorek z dané populace. Nechť má tento výběrový soubor rozsah n a průměr x. ҧ Dle CLV: തX N μ; σ Označme T X n = ത X μ σ, tj. ത X μ σ n. Oboustranný interval spolehlivosti P P xα zα T X ത X μ σ P തX σ n z 1 α x 1 α n z 1 α = 1 α μ തX + σ n z 1 α n N 0; 1 = 1 α, kde z p jsou p-kvantily N 0; 1 = 1 α

51 Intervalový odhad střední hodnoty náhodné veličiny s normálním rozdělením a) známe-li rozptyl σ Předpokládejme, že sledovaná náhodná veličina X má normální rozdělení s neznámou střední hodnotou μ a známým rozptylem σ. Vyberme vzorek z dané populace. Nechť má tento výběrový soubor rozsah n a průměr x. ҧ Dle CLV: തX N μ; σ Označme T X n = ത X μ σ, tj. ത X μ σ n. Levostranný interval spolehlivosti P T X x 1 α = 1 α P ത X μ σ n z 1 α = 1 α P μ തX σ n z 1 α = 1 α n N 0; 1

52 Intervalový odhad střední hodnoty náhodné veličiny s normálním rozdělením a) známe-li rozptyl σ Předpokládejme, že sledovaná náhodná veličina X má normální rozdělení s neznámou střední hodnotou μ a známým rozptylem σ. Vyberme vzorek z dané populace. Nechť má tento výběrový soubor rozsah n a průměr x. ҧ Dle CLV: തX N μ; σ Označme T X n = ത X μ σ, tj. ത X μ σ n. Pravostranný interval spolehlivosti P x α T X P z α ത X μ σ n = 1 α = 1 α P μ തX + σ n z 1 α = 1 α n N 0; 1

53 Intervalový odhad střední hodnoty náhodné veličiny s normálním rozdělením a) známe-li rozptyl σ Předpokládejme, že sledovaná náhodná veličina X má normální rozdělení s neznámou střední hodnotou μ a známým rozptylem σ. Vyberme vzorek z dané populace. Nechť má tento výběrový soubor rozsah n n < 0,05N a průměr x. ҧ Intervalový odhad střední hodnoty μ se spolehlivostí 1 α při známém rozptylu σ Oboustranný xҧ σ n z 1 α x ҧ + ; σ n z 1 α Levostranný Pravostranný xҧ σ n z 1 α x ҧ + σ n z 1 α kde z p jsou p-kvantily N(0; 1)

54 Intervalový odhad střední hodnoty náhodné veličiny s normálním rozdělením a) známe-li rozptyl σ Předpokládejme, že sledovaná náhodná veličina X má normální rozdělení s neznámou střední hodnotou μ a známým rozptylem σ. Vyberme vzorek z dané populace. Nechť má tento výběrový soubor rozsah n n < 0,05N a průměr x. ҧ (Vzorce a tabulky)

55 Intervalový odhad střední hodnoty náhodné veličiny s normálním rozdělením b) neznáme-li rozptyl σ Předpokládejme, že sledovaná náhodná veličina X má normální rozdělení s neznámou střední hodnotou μ a neznámým rozptylem σ. Vyberme vzorek z dané populace. Nechť má tento výběrový soubor rozsah n, průměr xҧ a výběrovou směrodatnou odchylku s. Dle vlastností Studentova rozdělení: Označme T X = ത X μ S തX μ S n ~ t n 1 n a dále můžeme pokračovat obdobně jako v předchozím případě.

56 Intervalový odhad střední hodnoty náhodné veličiny s normálním rozdělením b) neznáme-li rozptyl σ Předpokládejme, že sledovaná náhodná veličina X má normální rozdělení s neznámou střední hodnotou μ a neznámým rozptylem σ. Vyberme vzorek z dané populace. Nechť má tento výběrový soubor rozsah n n < 0,05N, průměr xҧ a výběrovou směrodatnou odchylku s. Intervalový odhad střední hodnoty μ se spolehlivostí 1 α při neznámém rozptylu σ Oboustranný xҧ s n t 1 α x ҧ + ; s n t 1 α Levostranný Pravostranný xҧ s n t 1 α x ҧ + s n t 1 α kde t p jsou p-kvantily Studentova rozdělení s n 1 stupni volnosti

57 Intervalový odhad střední hodnoty náhodné veličiny s normálním rozdělením b) neznáme-li rozptyl σ Předpokládejme, že sledovaná náhodná veličina X má normální rozdělení s neznámou střední hodnotou μ a neznámým rozptylem σ. Vyberme vzorek z dané populace. Nechť má tento výběrový soubor rozsah n n < 0,05N, průměr xҧ a výběrovou směrodatnou odchylku s. (Vzorce a tabulky)

58 Intervalový odhad střední hodnoty - obecně V obecném případě, kdy neznáme typ rozdělení, používáme tzv. robustní (neparametrické) postupy. Robustní postupy hodnocení náhodné veličiny typicky používáme v případech, kdy výběrový soubor obsahuje odlehlá pozorování, která nemohou být opravena a není vhodné je vyloučit, výběrový soubor nepochází z normálního rozdělení, výběrový soubor má velké rozptýlení dat. Výklad robustních přístupů není součástí základního kurzu statistiky. Zájemci najdou základní informace v kapitole 4.4 (Úvod do statistiky).

59 Intervalový odhad rozptylu (sm. odchylky) normálního rozdělení Předpokládejme, že sledovaná náhodná veličina X má normální rozdělení s neznámou střední hodnotou μ a neznámým rozptylem σ. Vyberme vzorek z dané populace. Nechť má tento výběrový soubor rozsah n a výběrovou směrodatnou odchylku s. Dle vlastností Pearsonova (χ ) rozdělení: n 1 S σ ~ χ n 1 Označme T X = n 1 S. Jednoduše lze ukázat, že σ

60 Intervalový odhad rozptylu (sm. odchylky) normálního rozdělení Předpokládejme, že sledovaná náhodná veličina X má normální rozdělení s neznámou střední hodnotou μ a neznámým rozptylem σ. Vyberme vzorek z dané populace. Nechť má tento výběrový soubor rozsah n n < 0,05N a výběrovou směr. odchylku s. Intervalový odhad rozptylu σ se spolehlivostí 1 α při neznámé střední hodnotě μ Oboustranný n 1 s χ 1 α ; n 1 s χα Levostranný Pravostranný n 1 S χ 1 α n 1 s χ α kde χ p jsou p-kvantily Chí kvadrát rozdělení s n 1 stupni volnosti

61 Intervalový odhad rozptylu (sm. odchylky) normálního rozdělení Předpokládejme, že sledovaná náhodná veličina X má normální rozdělení s neznámou střední hodnotou μ a neznámým rozptylem σ. Vyberme vzorek z dané populace. Nechť má tento výběrový soubor rozsah n n < 0,05N a výběrovou směr. odchylku s. (Vzorce a tabulky)

62 Intervalový odhad parametru binom. rozdělení (máme-li k dispozici dostatečně velký výběr) Mějme k dispozici výběrový soubor, jehož rozsah je dostatečně velký n > 30, je menší než 5% rozsahu základního souboru n < 0,05N, splňuje podmínku n > 9 p 1 p. Dle CLV: p ~ N π; π 1 π n, tj. p π π 1 π n ~ N 0; 1 Označme T X = p π π 1 π n. Lze ukázat, že

63 Intervalový odhad parametru binom. rozdělení (máme-li k dispozici dostatečně velký výběr) Intervalový odhad relativní četnosti π se spolehlivostí 1 α n > 30, n N < 0,05, n > 9 p 1 p standardní (Waldův) odhad Oboustranný p z 1 α p 1 p n ; p +z 1 α p 1 p n Levostranný p z 1 α p 1 p Pravostranný p +z 1 α p 1 p n n kde z p jsou p-kvantily normovaného normálního rozdělení

64 Intervalový odhad parametru binom. rozdělení (máme-li k dispozici dostatečně velký výběr) (Vzorce a tabulky)

65 6 Při kontrole data spotřeby určitého druhu masové konzervy ve skladech produktů masného průmyslu bylo náhodně vybráno 30 z konzerv a zjištěno, že 59 z nich má prošlou záruční lhůtu. Stanovte se spolehlivostí 95% intervalový odhad podílu konzerv s prošlou záruční lhůtou. Řešení:

66 6 Při kontrole data spotřeby určitého druhu masové konzervy ve skladech produktů masného průmyslu bylo náhodně vybráno 30 z konzerv a zjištěno, že 59 z nich má prošlou záruční lhůtu. Stanovte se spolehlivostí 95% intervalový odhad podílu konzerv s prošlou záruční lhůtou. Řešení: π podíl konzerv s prošlou záruční lhůtou mezi všemi konzervami Předpoklady: n > 30 n < 0,05N n > 9 p(1 p)

67 6 Při kontrole data spotřeby určitého druhu masové konzervy ve skladech produktů masného průmyslu bylo náhodně vybráno 30 z konzerv a zjištěno, že 59 z nich má prošlou záruční lhůtu. Stanovte se spolehlivostí 95% intervalový odhad podílu konzerv s prošlou záruční lhůtou. Řešení: π podíl konzerv s prošlou záruční lhůtou mezi všemi konzervami Předpoklady: n > 30 (OK, n = 30) n < 0,05N (OK, n = 30, 0,05N = 0, = 1 000) n > 9 p(1 p) (OK, n = 30, p = ,184 9 p(1 p) 59,8) Výpočet: P p z 0,975 p 1 p n < π < p + z 0,975 p 1 p n = 0,95

68 6 Při kontrole data spotřeby určitého druhu masové konzervy ve skladech produktů masného průmyslu bylo náhodně vybráno 30 z konzerv a zjištěno, že 59 z nich má prošlou záruční lhůtu. Stanovte se spolehlivostí 95% intervalový odhad podílu konzerv s prošlou záruční lhůtou. Řešení: π podíl konzerv s prošlou záruční lhůtou mezi všemi konzervami Předpoklady: n > 30 (OK, n = 30) n < 0,05N (OK, n = 30, 0,05N = 0, = 1 000) n > 9 p(1 p) (OK, n = 30, p = ,184 9 p(1 p) 59,8) Výpočet: P , < π < , = 0,95

69 6 Při kontrole data spotřeby určitého druhu masové konzervy ve skladech produktů masného průmyslu bylo náhodně vybráno 30 z konzerv a zjištěno, že 59 z nich má prošlou záruční lhůtu. Stanovte se spolehlivostí 95% intervalový odhad podílu konzerv s prošlou záruční lhůtou. Řešení: π podíl konzerv s prošlou záruční lhůtou mezi všemi konzervami Předpoklady: n > 30 (OK, n = 30) n < 0,05N (OK, n = 30, 0,05N = 0, = 1 000) n > 9 p(1 p) (OK, n = 30, p = ,184 9 p(1 p) 59,8) Výpočet: P 0,14 < π < 0,7 = 0,95

70 Intervalový odhad parametru binom. rozdělení (máme-li k dispozici dostatečně velký výběr) POZOR! Relativní četnost π je z intervalu 0; 1. Je tedy zřejmé, že dolní mez intervalových odhadů relativní četnosti nemůže klesnout pod 0 a horní mez těchto odhadů nemůže být větší než 1! Bylo ukázáno, že standardní (Waldův) odhad není optimální, existuje spousta vhodnějších alternativ (např. Wilsonův odhad, Clopperův-Pearsonův odhad, Agresti-Coullův odhad ).

71 Odhad rozsahu výběru v případě, že odhadujeme střední hodnotu nebo parametr binom. rozdělení chyba odhadu polovina šířky oboustranného intervalu spolehlivosti Požadovanou přesnost výpočtu vyjadřujeme pomocí tzv. přípustné chyby odhadu max, tj. hodnoty o kterou jsme ochotni se zmýlit oproti skutečné hodnotě odhadovaného parametru při dané spolehlivosti odhadu (hladině významnosti).

72 Odhad rozsahu výběru v případě, že odhadujeme střední hodnotu nebo parametr binom. rozdělení Oboustranný intervalový odhad střední hodnoty pro případ, že neznáme rozptyl σ je xҧ σ z n 1 α x ҧ + ; σ z n 1 α. Přípustná chyba odhadu je = σ n z 1 α. Požadujeme-li, aby přípustná chyba odhadu max, pak: σ n z 1 α n max σ max z 1 α

73 Odhad rozsahu výběru v případě, že odhadujeme střední hodnotu nebo parametr binom. rozdělení Odhad rozsahu výběru potřebného pro nalezení interval. odhadu se spolehlivostí 1 α a maximální přípustnou chybou max Požadovaný Odhadovaný populační parametr rozsah výběru Střední hodnota μ (známe σ) Střední hodnota μ (neznáme σ) n n σ max z 1 α s 1 max t 1 α Parametr binom. rozdělení π n n z 1 α z 1 α p 1 1 p 1 max 1 4 max

74 7 Výběrovým šetřením bychom chtěli odhadnout průměrnou mzdu pracovníků určitého výrobního odvětví. Z vyčerpávajícího šetření, které probíhalo před několika měsíci, víme, že směrodatná odchylka mezd byla 750,- Kč. Odhad chceme provést s 95% spolehlivostí a jsme ochotni připustit maximální chybu ve výši 50,-Kč. Jak velký musíme provést výběr, abychom zajistili požadovanou přesnost a spolehlivost?

75 7 Výběrovým šetřením bychom chtěli odhadnout průměrnou mzdu pracovníků určitého výrobního odvětví. Z vyčerpávajícího šetření, které probíhalo před několika měsíci, víme, že směrodatná odchylka mezd byla 750,- Kč. Odhad chceme provést s 95% spolehlivostí a jsme ochotni připustit maximální chybu ve výši 50,-Kč. Jak velký musíme provést výběr, abychom zajistili požadovanou přesnost a spolehlivost? Odhad rozsahu výběru potřebného pro nalezení interval. odhadu se spolehlivostí 1 α a maximální přípustnou chybou max Řešení: n σ max z 1 α Odhadovaný populační parametr Střední hodnota μ (známe σ) Střední hodnota μ (neznáme σ) Požadovaný rozsah výběru σ n z α 1 max n s 1 max t 1 α Parametr binom. rozdělení π n n z 1 α z 1 α p 1 1 p 1 max 1 4 max

76 7 Výběrovým šetřením bychom chtěli odhadnout průměrnou mzdu pracovníků určitého výrobního odvětví. Z vyčerpávajícího šetření, které probíhalo před několika měsíci, víme, že směrodatná odchylka mezd byla 750,- Kč. Odhad chceme provést s 95% spolehlivostí a jsme ochotni připustit maximální chybu ve výši 50,- Kč. Jak velký musíme provést výběr, abychom zajistili požadovanou přesnost a spolehlivost? Řešení: n σ max z 1 α n ,96 n 864,4

77 Intervalový odhad poměru rozptylů dvou náhodných veličin s normálním rozdělením Mějme dva výběry z normálního rozdělení, tj. i = 1,,, n 1, kde n 1 je rozsah prvního výběru: X 1i ~N μ 1 ; σ 1, j = 1,,, n, kde n je rozsah prvního výběru: X j ~N μ ; σ. Nechť S 1 a S jsou výběrové rozptyly daných výběrů. Dle vlastností Fisherova-Snedecorova rozdělení: Označme T X = S 1 Τ σ 1 Τ Τσ, pak je zřejmé, že S S 1 Τ σ 1 Τ S Τσ ~F n1 1,n 1

78 Intervalový odhad poměru rozptylů dvou náhodných veličin s normálním rozdělením Intervalový odhad poměru rozptylů σ 1 σ se spolehlivostí 1 α Oboustranný Levostranný Pravostranný 1 f 1 α S 1 S ; 1 S 1 fα S 1 S 1 f 1 α S 1 S 1 f α S kde f p jsou p-kvantily Fisherova Snedecorova rozdělení s n 1 1 stupni volnosti v čitateli a n 1 stupni volnosti ve jmenovateli (Vzorce a tabulky)

79 Intervalový odhad rozdílů středních hodnot dvou náhodných veličin s normálním rozdělením Intervalový odhad rozdílu středních hodnot dvou populací s normálním rozdělením, z nichž byly pořízeny náhodné výběry, lze provádět za trojího předpokladu. Známe rozptyly σ 1 a σ obou populací. Neznáme rozptyly obou populací, ale lze předpokládat, že jsou shodné. Neznáme rozptyly obou populací a nelze předpokládat, že jsou shodné.

80 Intervalový odhad rozdílů středních hodnot dvou náhodných veličin s normálním rozdělením a) známe rozptyly σ 1 a σ obou populací Mějme dvě populace s normálním rozdělením, jejichž rozptyly σ 1 a σ známe. Z těchto populací jsme provedli dva nezávislé náhodné výběry o rozsahu n 1 a n n 1 < 0,05N, n < 0,05N, a určili jejich průměry xҧ 1 a xҧ. Oboustranný Levostranný Pravostranný Intervalový odhad rozdílu středních hodnot μ 1 μ se spolehlivostí 1 α (známe σ 1, σ ) xҧ 1 xҧ z 1 α xҧ 1 xҧ 1 σ 1 + σ ; n 1 n xҧ 1 xҧ σ xҧ z 1 1 α σ xҧ + z 1 1 α + σ n 1 + z 1 α n + σ n 1 kde z p jsou p-kvantily normovaného normálního rozdělení n σ 1 n 1 + σ n (Vzorce a tabulky)

81 Intervalový odhad rozdílů středních hodnot dvou náhodných veličin s normálním rozdělením b) neznáme jejich rozptyly σ 1 a σ, ale víme, že σ 1 = σ Mějme dvě populace s normálním rozdělením, jejichž rozptyly neznáme, ale víme, že jsou shodné. Z těchto populací jsme provedli dva nezávislé náhodné výběry o rozsahu n 1 a n (n 1 < Oboustranný Levostranný Intervalový odhad rozdílu středních hodnot μ 1 μ se spolehlivostí 1 α (neznáme σ 1, σ, ale víme, že σ 1 = σ ) xҧ 1 xҧ t 1 α n 1 1 s 1 + n 1 s n 1 +n 1 n n ; xҧ 1 xҧ + t 1 α n xҧ 1 xҧ t 1 1 s 1 + n 1 s 1 α n 1 +n n 1 1 s 1 + n 1 s 1 n 1 +n n n 1 n n Pravostranný n xҧ 1 xҧ + t 1 1 s 1 + n 1 s 1 α n 1 +n 1 n n kde t p jsou p-kvantily Studentova rozdělení s n 1 + n stupni volnosti (Vzorce a tabulky)

82 Intervalový odhad rozdílů středních hodnot dvou náhodných veličin s normálním rozdělením c) neznáme jejich rozptyly σ 1 a σ, a nelze předpokládat, že σ 1 = σ Mějme dvě populace s normálním rozdělením, jejichž rozptyly neznáme a nelze předpokládat, že jsou shodné. Z těchto populací jsme provedli dva nezávislé náhodné výběry o rozsahu n 1 a n n 1 < 0,05N, n < 0,05N, a určili jejich průměry xҧ 1 a xҧ a výběrové směrodatné odchylky s 1 a s. Oboustranný Levostranný Pravostranný Intervalový odhad rozdílu středních hodnot μ 1 μ se spolehlivostí 1 α (neznáme σ 1, σ, a nelze předpokládat, že σ 1 = σ ) xҧ 1 xҧ t 1 α xҧ 1 xҧ 1 s 1 + s ; n 1 n xҧ 1 xҧ s xҧ t 1 1 α s xҧ + t 1 1 α + s n 1 + t 1 α n + S n 1 n s 1 n 1 + s n kde t p jsou p-kvantily Studentova rozdělení s S 1 n1 S 1 n1 +S n 1 n1+1 + S n stupni volnosti 1 n+1 (Vzorce a tabulky)

83 Intervalový odhad pro rozdíl parametrů binom. rozdělení dvou náhodných veličin Mějme dvě populace. Z těchto populací jsme provedli dva nezávislé náhodné výběry o rozsahu n 1 a n. Výběr z první populace obsahoval x 1 prvků se sledovanou vlastností, výběr z druhé populace obsahoval x prvků se sledovanou vlastností. Výběrové relativní četnosti p 1, p jsme pak určili dle vztahů p 1 = x 1, p n = x. 1 n Mají-li výběrové soubory rozsahy, které jsou dostatečně velké n 1 > 30, n > 30, jsou menší než 5% rozsahu základního souboru n 1 < 0,05N, n < 0,05N, splňují podmínky n 1 > pak 9 p 1 1 p 1, n > 9 p 1 p,

84 Intervalový odhad pro rozdíl parametrů binom. rozdělení dvou náhodných veličin Mějme dvě populace. Z těchto populací jsme provedli dva nezávislé náhodné výběry o rozsahu n 1 a n n 1 < 0,05N, n < 0,05N. Výběr z první populace obsahoval x 1 prvků se sledovanou vlastností, výběr z druhé populace obsahoval x prvků se sledovanou vlastností. Výběrové relativní četnosti p 1, p jsme pak určili dle vztahů p 1 = x 1, p n = x. 1 n Intervalový odhad rozdílu relativních četností π 1 π se spolehlivostí 1 α 9 i 1, : n i > 30, n i < 0,05N i, n i > p i 1 p i Oboustranný p 1 p z 1 α p 1 p 1 n n ; p 1 p + z 1 α Levostranný p 1 p z 1 α p 1 p Pravostranný p 1 p + z 1 α p 1 p 1 n n 1 n n p 1 p 1 n n kde z p jsou p-kvantily normovaného normálního rozdělení (Vzorce a tabulky)

85 DĚKUJI ZA POZORNOST!

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení

LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení LIMITNÍ VĚTY DALŠÍ SPOJITÁ ROZDĚLENÍ PR. 8. cvičení Způsoby statistického šetření Vyčerpávající šetření prošetření všech jednotek statistického souboru (populace) Výběrové šetření ze základního souboru

Více

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz. Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení

Více

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D. Úvod do teorie odhadu Ing. Michael Rost, Ph.D. Náhodný výběr Náhodným výběrem ze základního souboru populace, která je popsána prostřednictvím hustoty pravděpodobnosti f(x, θ), budeme nazývat posloupnost

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Náhodný výběr Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

Statistika. Teorie odhadu statistická indukce. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) . Statistika Teorie odhadu statistická indukce Intervalový odhad µ, σ 2 a π Roman Biskup (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at)email.cz 21. února 2012 Statistika

Více

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová VYBRANÉ DVOUVÝBĚROVÉ TESTY Martina Litschmannová Obsah přednášky Vybrané dvouvýběrové testy par. hypotéz test o shodě rozptylů (F-test), testy o shodě středních hodnot (t-test, Aspinové-Welchův test),

Více

Výběrové charakteristiky a jejich rozdělení

Výběrové charakteristiky a jejich rozdělení Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistické šetření úplné (vyčerpávající) neúplné (výběrové) U výběrového šetření se snažíme o to, aby výběrový

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 5. Odhady parametrů základního souboru Mgr. David Fiedor 16. března 2015 Vztahy mezi výběrovým a základním souborem Osnova 1 Úvod, pojmy Vztahy mezi výběrovým a základním

Více

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady

PSY117/454 Statistická analýza dat v psychologii přednáška 8. Statistické usuzování, odhady PSY117/454 Statistická analýza dat v psychologii přednáška 8 Statistické usuzování, odhady Výběr od deskripce k indukci Deskripce dat, odhad parametrů Usuzování = inference = indukce Počítá se s náhodným

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 11. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 27 Obsah 1 Testování statistických hypotéz 2

Více

Charakteristika datového souboru

Charakteristika datového souboru Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

STATISTICKÉ ZJIŠŤOVÁNÍ

STATISTICKÉ ZJIŠŤOVÁNÍ STATISTICKÉ ZJIŠŤOVÁNÍ ÚVOD Základní soubor Všechny ryby v rybníce, všechny holky/kluci na škole Cílem určit charakteristiky, pravděpodobnosti Průměr, rozptyl, pravděpodobnost, že Maruška kápne na toho

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 4. Teoretická rozdělení Mgr. David Fiedor 9. března 2015 Osnova Úvod 1 Úvod 2 3 4 5 Vybraná rozdělení náhodných proměnných normální rozdělení normované normální rozdělení

Více

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru.

Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. 1 Statistické odhady Určujeme neznámé hodnoty parametru základního souboru. Pomocí výběrové charakteristiky vypočtené z náhodného výběru. Odhad lze provést jako: Bodový odhad o Jedna číselná hodnota Intervalový

Více

Test z teorie VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY

Test z teorie VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY Test z teorie 1. Střední hodnota pevně zvolené náhodné veličiny je a) náhodná veličina, b) konstanta, c) náhodný jev, d) výběrová charakteristika. 2. Výběrový

Více

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica JEDNOVÝBĚROVÉ TESTY Komentované řešení pomocí programu Statistica Vstupní data Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu

Více

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a

Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a Všechno, co jste chtěli vědět z teorie pravděpodobnosti, z teorie informace a báli jste se zeptat Jedinečnou funkcí statistiky je, že umožňuje vědci číselně vyjádřit nejistotu v jeho závěrech. (G. W. Snedecor)

Více

Cvičení ze statistiky - 8. Filip Děchtěrenko

Cvičení ze statistiky - 8. Filip Děchtěrenko Cvičení ze statistiky - 8 Filip Děchtěrenko Minule bylo.. Dobrali jsme normální rozdělení Tyhle termíny by měly být známé: Centrální limitní věta Laplaceho věta (+ korekce na spojitost) Konfidenční intervaly

Více

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead PSY117/454 Statistická analýza dat v psychologii Přednáška 8 Statistické usuzování, odhady Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead Barevná srdíčka kolegyně

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457. 0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti

Více

12. cvičení z PST. 20. prosince 2017

12. cvičení z PST. 20. prosince 2017 1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

Vybraná rozdělení náhodné veličiny

Vybraná rozdělení náhodné veličiny 3.3 Vybraná rozdělení náhodné veličiny 0,16 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0 Rozdělení Z 3 4 5 6 7 8 9 10 11 12 13 14 15 Život je umění vytvářet uspokojivé závěry na základě nedostatečných předpokladů.

Více

Pravděpodobnost a aplikovaná statistika

Pravděpodobnost a aplikovaná statistika Pravděpodobnost a aplikovaná statistika MGR. JANA SEKNIČKOVÁ, PH.D. 8. KAPITOLA STATISTICKÉ TESTOVÁNÍ HYPOTÉZ 22.11.2016 Opakování: CLV příklad 1 Zadání: Před volbami je v populaci státu 52 % příznivců

Více

Definice spojité náhodné veličiny zjednodušená verze

Definice spojité náhodné veličiny zjednodušená verze Definice spojité náhodné veličiny zjednodušená verze Náhodná veličina X se nazývá spojitá, jestliže existuje nezáporná funkce f : R R taková, že pro každé a, b R { }, a < b, platí P(a < X < b) = b a f

Více

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540

Více

STATISTICKÉ ODHADY Odhady populačních charakteristik

STATISTICKÉ ODHADY Odhady populačních charakteristik STATISTICKÉ ODHADY Odhady populačních charakteristik Jak stanovit charakteristiky rozložení sledované veličiny v základní populaci? Populaci většinou nemáme celou k dispozici, musíme se spokojit jen s

Více

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11. UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace

Více

ROZDĚLENÍ NÁHODNÝCH VELIČIN

ROZDĚLENÍ NÁHODNÝCH VELIČIN ROZDĚLENÍ NÁHODNÝCH VELIČIN 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č. CZ.1.07/2.2.00/28.0021)

Více

VŠB-TU OSTRAVA, FAKULTA ELEKTROTECHNIKY A INFORMATIKY, KATEDRA APLIKOVANÉ MATEMATIKY. Statistika. Vzorce a tabulky

VŠB-TU OSTRAVA, FAKULTA ELEKTROTECHNIKY A INFORMATIKY, KATEDRA APLIKOVANÉ MATEMATIKY. Statistika. Vzorce a tabulky VŠB-TU OSTRAVA, FAKULTA ELEKTROTECHNIKY A INFORMATIKY, KATEDRA APLIKOVANÉ MATEMATIKY Statistia Vzorce a tabuly Martina Litschmannová 3. března 05 Oficiální vzorce a tabuly KOMBINATORIKA Bez opaování Uspořádané

Více

Pravděpodobnost a matematická statistika

Pravděpodobnost a matematická statistika Pravděpodobnost a matematická statistika Příklady k přijímacím zkouškám na doktorské studium 1 Popisná statistika Určete aritmetický průměr dat, zadaných tabulkou hodnot x i a četností n i x i 1 2 3 n

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení f x = 1 2 exp x 2 2 2 f(x) je funkce hustoty pravděpodobnosti, symetrická vůči poloze maxima x = μ μ střední hodnota σ směrodatná odchylka (tzv. pološířka křivky mezi inflexními

Více

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B TESTOVÁNÍ HYPOTÉZ Od statistického šetření neočekáváme pouze elementární informace o velikosti některých statistických ukazatelů. Používáme je i k ověřování našich očekávání o výsledcích nějakého procesu,

Více

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak. 8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) e, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá normované

Více

Cvičení ze statistiky - 7. Filip Děchtěrenko

Cvičení ze statistiky - 7. Filip Děchtěrenko Cvičení ze statistiky - 7 Filip Děchtěrenko Minule bylo.. Probrali jsme spojité modely Tyhle termíny by měly být známé: Rovnoměrné rozdělení Střední hodnota Mccalova transformace Normální rozdělení Přehled

Více

Přednáška. Další rozdělení SNP. Limitní věty. Speciální typy rozdělení. Další rozdělení SNP Limitní věty Speciální typy rozdělení

Přednáška. Další rozdělení SNP. Limitní věty. Speciální typy rozdělení. Další rozdělení SNP Limitní věty Speciální typy rozdělení VI Přednáška Další rozdělení SNP Limitní věty Speciální typy rozdělení Rovnoměrné rozdělení R(a,b) Příklad Obejít celý areál trvá strážnému 30 minut. Jaká je pravděpodobnost, že u vrátnice budete čekat

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D. Střední hodnota a rozptyl náhodné veličiny, vybraná rozdělení diskrétních a spojitých náhodných veličin, pojem kvantilu Ing. Michael Rost, Ph.D. Príklad Předpokládejme že máme náhodnou veličinu X která

Více

Aproximace binomického rozdělení normálním

Aproximace binomického rozdělení normálním Aproximace binomického rozdělení normálním Aproximace binomického rozdělení normálním Příklad Sybilla a Kassandra tvrdí, že mají telepatické schopnosti, a chtějí to dokázat následujícím pokusem: V jedné

Více

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. Testování statistických hypotéz Ing. Michal Dorda, Ph.D. Testování normality Př. : Při simulaci provozu na křižovatce byla získána data o mezerách mezi přijíždějícími vozidly v [s]. Otestujte na hladině

Více

populace soubor jednotek, o jejichž vlastnostech bychom chtěli vypovídat letní semestr Definice subjektech.

populace soubor jednotek, o jejichž vlastnostech bychom chtěli vypovídat letní semestr Definice subjektech. Populace a Šárka Hudecová Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy letní semestr 2012 1 populace soubor jednotek, o jejichž vlastnostech bychom

Více

Testy. Pavel Provinský. 19. listopadu 2013

Testy. Pavel Provinský. 19. listopadu 2013 Testy Pavel Provinský 19. listopadu 2013 Test a intervalový odhad Testy a intervalové odhady - jsou vlastně to samé. Jiný je jen úhel pohledu. Lze přecházet od jednoho k druhému. Například: Při odvozování

Více

4EK211 Základy ekonometrie

4EK211 Základy ekonometrie 4EK211 Základy ekonometrie ZS 2015/16 Cvičení 1: Opakování ze statistiky LENKA FIŘTOVÁ KATEDRA EKONOMETRIE, FAKULTA INFORMATIKY A STATISTIKY VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE Z čeho studovat 1) Z KNIHY Krkošková,

Více

Normální rozložení a odvozená rozložení

Normální rozložení a odvozená rozložení I Normální rozložení a odvozená rozložení I.I Normální rozložení Data, se kterými pracujeme, pocházejí z různých rozložení. Mohou být vychýlena (doleva popř. doprava, nebo v nich není na první pohled vidět

Více

Charakterizace rozdělení

Charakterizace rozdělení Charakterizace rozdělení Momenty f(x) f(x) f(x) μ >μ 1 σ 1 σ >σ 1 g 1 g σ μ 1 μ x μ x x N K MK = x f( x) dx 1 M K = x N CK = ( x M ) f( x) dx ( xi M 1 C = 1 K 1) N i= 1 K i K N i= 1 K μ = E ( X ) = xf

Více

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr

Intervalový odhad. Interval spolehlivosti = intervalový odhad nějakého parametru s danou pravděpodobností = konfidenční interval pro daný parametr StatSoft Intervalový odhad Dnes se budeme zabývat neodmyslitelnou součástí statistiky a to intervaly v nejrůznějších podobách. Toto téma je také úzce spojeno s tématem testování hypotéz, a tedy plynule

Více

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013

Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika. 1 Úvodní poznámky. Verze: 13. června 2013 Bakalářské studium na MFF UK v Praze Obecná matematika Zaměření: Stochastika Podrobnější rozpis okruhů otázek pro třetí část SZZ Verze: 13. června 2013 1 Úvodní poznámky 6 Smyslem SZZ by nemělo být toliko

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné

Více

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní ..08 8cv7.tex 7. cvičení - transformace náhodné veličiny Definice pojmů a základní vzorce Je-li X náhodná veličina a h : R R je měřitelná funkce, pak náhodnou veličinu Y, která je definovaná vztahem X

Více

Intervalové Odhady Parametrů

Intervalové Odhady Parametrů Parametrů Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení technické v Praze

Více

Přednáška X. Testování hypotéz o kvantitativních proměnných

Přednáška X. Testování hypotéz o kvantitativních proměnných Přednáška X. Testování hypotéz o kvantitativních proměnných Testování hypotéz o podílech Kontingenční tabulka, čtyřpolní tabulka Testy nezávislosti, Fisherůvexaktní test, McNemarůvtest Testy dobré shody

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu I I.I Jednofaktorová analýza rozptylu Úvod Jednofaktorová analýza rozptylu (ANOVA) se využívá při porovnání několika středních hodnot. Často se využívá ve vědeckých a lékařských experimentech, při kterých

Více

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Statistika, Biostatistika pro kombinované studium. Jan Kracík Statistika, Biostatistika pro kombinované studium Letní semestr 2014/2015 Tutoriál č. 6: ANOVA Jan Kracík jan.kracik@vsb.cz Obsah: Testování hypotéz opakování ANOVA Testování hypotéz (opakování) Testování

Více

Zápočtová práce STATISTIKA I

Zápočtová práce STATISTIKA I Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru

Více

Odhad parametrů N(µ, σ 2 )

Odhad parametrů N(µ, σ 2 ) Odhad parametrů N(µ, σ 2 ) Mějme statistický soubor x 1, x 2,, x n modelovaný jako realizaci náhodného výběru z normálního rozdělení N(µ, σ 2 ) s neznámými parametry µ a σ. Jaký je maximální věrohodný

Více

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin

z Matematické statistiky 1 1 Konvergence posloupnosti náhodných veličin Příklady k procvičení z Matematické statistiky Poslední úprava. listopadu 207. Konvergence posloupnosti náhodných veličin. Necht X, X 2... jsou nezávislé veličiny s rovnoměrným rozdělením na [0, ]. Definujme

Více

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II Základy biostatistiky II Veřejné zdravotnictví 3.LF UK - II Teoretické rozložení-matematické modely rozložení Naměřená data Výběrové rozložení Teoretické rozložení 1 e 2 x 2 Teoretické rozložení-matematické

Více

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod.

P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod. P13: Statistické postupy vyhodnocování únavových zkoušek, aplikace normálního, Weibullova rozdělení, apod. Matematický přístup k výsledkům únavových zkoušek Náhodnost výsledků únavových zkoušek. Únavové

Více

Pravděpodobnost a statistika

Pravděpodobnost a statistika Pravděpodobnost a statistika Bodové odhady a intervaly spolehlivosti Vilém Vychodil KMI/PRAS, Přednáška 10 Vytvořeno v rámci projektu 963/011 FRVŠ V. Vychodil (KMI/PRAS, Přednáška 10) Bodové odhady a intervaly

Více

4ST201 STATISTIKA CVIČENÍ Č. 7

4ST201 STATISTIKA CVIČENÍ Č. 7 4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické

Více

Intervalové Odhady Parametrů II Testování Hypotéz

Intervalové Odhady Parametrů II Testování Hypotéz Parametrů II Testování Hypotéz Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení

Více

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

Matematické modelování Náhled do ekonometrie. Lukáš Frýd Matematické modelování Náhled do ekonometrie Lukáš Frýd Výnos akcie vs. Výnos celého trhu - CAPM model r it = r ft + β 1. (r mt r ft ) r it r ft = α 0 + β 1. (r mt r ft ) + ε it Ekonomický (finanční model)

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

Limitní věty teorie pravděpodobnosti. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Limitní věty teorie pravděpodobnosti. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jestliže opakujeme nezávisle nějaký pokus, můžeme z pozorovaných hodnot sestavit rozdělení relativních četností

Více

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistickou hypotézou se rozumí určité tvrzení o parametrech rozdělení zkoumané náhodné veličiny (µ, σ 2, π,

Více

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina Testování hypotéz Analýza dat z dotazníkových šetření Kuranova Pavlina Statistická hypotéza Možné cíle výzkumu Srovnání účinnosti různých metod Srovnání výsledků různých skupin Tzn. prokázání rozdílů mezi

Více

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.) Lékařská biofyzika, výpočetní technika I Biostatistika Josef Tvrdík (doc. Ing. CSc.) Přírodovědecká fakulta, katedra informatiky josef.tvrdik@osu.cz konzultace úterý 14.10 až 15.40 hod. http://www1.osu.cz/~tvrdik

Více

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně Testování hypotéz Nechť,, je náhodný výběr z nějakého rozdělení s neznámými parametry. Máme dvě navzájem si odporující hypotézy o parametrech daného rozdělení: Nulová hypotéza parametry (případně jediný

Více

VYBRANÁ ROZDĚLENÍ. SPOJITÉ NÁH. VELIČINY Martina Litschmannová

VYBRANÁ ROZDĚLENÍ. SPOJITÉ NÁH. VELIČINY Martina Litschmannová VYBRANÁ ROZDĚLENÍ SPOJITÉ NÁH. VELIČINY Martina Litschmannová Opakování hustota pravděpodobnosti f(x) Funkce f(x) je hustotou pravděpodobností (na intervalu a x b), jestliže splňuje následující podmínky:

Více

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY Statistická hypotéza je určitá domněnka (předpoklad) o vlastnostech ZÁKLADNÍHO SOUBORU. Test statistické hypotézy je pravidlo (kritérium), které na základě

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 7. Testování statistických hypotéz Mgr. David Fiedor 30. března 2015 Osnova 1 2 3 Dělení testů parametrické - o parametrech rozdělení základního souboru (průměr, rozptyl,

Více

Test z teorie VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY

Test z teorie VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY VÝBĚROVÉ CHARAKTERISTIKY A INTERVALOVÉ ODHADY Test z teorie 1. Střední hodnota pevně zvolené náhodné veličiny je a) náhodná veličina, b) konstanta, c) náhodný jev, d) výběrová charakteristika. 2. Výběrový

Více

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze

Dobývání znalostí. Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Doc. RNDr. Iveta Mrázová, CSc. Katedra teoretické informatiky Matematicko-fyzikální fakulta Univerzity Karlovy v Praze Dobývání znalostí Pravděpodobnost a učení Doc. RNDr. Iveta Mrázová,

Více

8. Normální rozdělení

8. Normální rozdělení 8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, 2 ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) 2 e 2 2, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá

Více

Inovace bakalářského studijního oboru Aplikovaná chemie

Inovace bakalářského studijního oboru Aplikovaná chemie http://aplchem.upol.cz CZ.1.07/2.2.00/15.0247 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Základy zpracování dat chemometrie, statistika Doporučenáliteratura

Více

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Zpracování dat v edukačních vědách - Testování hypotéz Kamila Fačevicová Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci Obsah seminářů 5.11. Úvod do matematické

Více

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D. Ing. Michal Dorda, Ph.D. Př. : Ve vjezdové skupině kolejí byly sledovány počty přijíždějících vlaků za hodinu. Za 5 dní (tedy 360 hodin) přijelo celkem 87 vlaků. Výsledky sledování jsou uvedeny v tabulce.

Více

MATEMATICKÁ STATISTIKA

MATEMATICKÁ STATISTIKA MATEMATICKÁ STATISTIKA 1. Úvod. Matematická statistika se zabývá vyšetřováním zákonitostí, které v sobě obsahují prvek náhody. Zpracováním hodnot, které jsou výstupem sledovaného procesu, se snažíme popsat

Více

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com) Testování statistických hypotéz Testování statistických hypotéz Princip: Ověřování určitého předpokladu zjišťujeme, zda zkoumaný výběr pochází ze základního souboru, který má určité rozdělení zjišťujeme,

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů 1 1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Testy hypotéz na základě více než 2 výběrů Na analýzu rozptylu lze pohlížet v podstatě

Více

Regresní analýza 1. Regresní analýza

Regresní analýza 1. Regresní analýza Regresní analýza 1 1 Regresní funkce Regresní analýza Důležitou statistickou úlohou je hledání a zkoumání závislostí proměnných, jejichž hodnoty získáme při realizaci experimentů Vzhledem k jejich náhodnému

Více

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) cvičení z PSI 0-4 prosince 06 Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) Z realizací náhodných veličin X a Y s normálním rozdělením) jsme z výběrů daného rozsahu obdrželi

Více

7. Analýza rozptylu.

7. Analýza rozptylu. 7. Analýza rozptylu. Uvedeme obecnou ideu, která je založena na minimalizaci chyby metodou nejmenších čtverců. Nejdříve uvedeme několik základních tvrzení. Uvažujeme náhodný vektor Y = (Y, Y,..., Y n a

Více

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

MATEMATICKÁ STATISTIKA.   Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci Matematická statistika Matematická statistika se zabývá matematickým

Více

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení

2 Zpracování naměřených dat. 2.1 Gaussův zákon chyb. 2.2 Náhodná veličina a její rozdělení 2 Zpracování naměřených dat Důležitou součástí každé experimentální práce je statistické zpracování naměřených dat. V této krátké kapitole se budeme věnovat určení intervalů spolehlivosti získaných výsledků

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 010 1.týden (0.09.-4.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Lineární regresní model kde Y = Xβ + e, y 1 e 1 β y 2 Y =., e = e 2 x 11 x 1 1k., X =....... β 2,

Více

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu Testování hypotéz o parametrech regresního modelu Ekonometrie Jiří Neubauer Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra UO

Více

ÚVOD DO TESTOVÁNÍ HYPOTÉZ. Martina Litschmannová

ÚVOD DO TESTOVÁNÍ HYPOTÉZ. Martina Litschmannová ÚVOD DO TESTOVÁNÍ HYPOTÉZ Martina Litschmannová Základní metody statistické indukce Intervalové odhady (angl. confidence intervals) umožňují odhadnout nejistotu v odhadu parametru náhodné veličiny Testování

Více

Poznámky k předmětu Aplikovaná statistika, 5.téma

Poznámky k předmětu Aplikovaná statistika, 5.téma Poznámky k předmětu Aplikovaná statistika, 5.téma 5. Některá významná rozdělení A. Diskrétní rozdělení (i) Diskrétní rovnoměrné rozdělení na množině {,..., n} Náhodná veličina X, která má diskrétní rovnoměrné

Více

Náhodné veličiny, náhodné chyby

Náhodné veličiny, náhodné chyby Náhodné veličiny, náhodné chyby Máme náhodnou veličinu X, jejíž vlastnosti zkoumáme. Pokud známe její rozložení (např. z nějaké dřívější studie) nebo alespoň předpokládáme znalost rozložení, můžeme ji

Více

Příklady na testy hypotéz o parametrech normálního rozdělení

Příklady na testy hypotéz o parametrech normálního rozdělení Příklady na testy hypotéz o parametrech normálního rozdělení. O životnosti 75W žárovky (v hodinách) je známo, že má normální rozdělení s = 5h. Pro náhodný výběr 0 žárovek byla stanovena průměrná životnost

Více

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů 1) Test na velikost rozptylu Test na velikost rozptylu STATISTICA nemá. 2) Test na velikost střední hodnoty V menu Statistika zvolíme nabídku Základní

Více

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina. Parametrické metody odhadů z neúplných výběrů 2 1 Metoda maximální věrohodnosti pro cenzorované výběry 11 Náhodné cenzorování Při sledování složitých reálných systémů často nemáme možnost uspořádat experiment

Více