6. T e s t o v á n í h y p o t é z

Rozměr: px
Začít zobrazení ze stránky:

Download "6. T e s t o v á n í h y p o t é z"

Transkript

1 6. T e s t o v á n í h y p o t é z Na základě hodnot z realizace náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Používáme k tomu vhodně zvolené funkce náhodného výběru (statistiky), jejíž rozdělení známe a na jejíchž hodnotách se projevují sledované vlastnosti. Rozeznáváme dva základní typy testů: Parametrické testy jsou testy o hodnotách parametrů rozdělení, ze kterého je proveden náhodný výběr. Neparametrické testy jsou testy o vlastnostech rozdělení, např. typ rozdělení, shoda dvou a více rozdělení, či symetrie rozdělení. Strategie testování. 1. Na základě hodnot náhodného výběru a charakteru úlohy zvolíme: nulovou hypotézu H 0 a alternativní hypotézu H 1, kterou příjímáme v případě odmítnutí nulové hypotézy.. Volíme testovací kritérium. Vybereme statistiku, funkci náhodného výběru, jejíž rozdělení známe a která charakterizuje testovanou vlastnost rozdělení. 3. Stanovíme hladinu významnosti testu jako hodnotu α, číslo α je blízké nule. Obvykle z intervalu (0, 01; 0, 1), nejčastěji 0, 05, která bývá zadavaná ve statistických programech. 4. Na základě hodnoty hladiny, stanovíme kritický obor W α testu, kdy v případě, že zvolená statistika má hodnotu z kritického oboru zamítneme nulovou hypotézu H 0 a přijmeme alternativní hypotézu H 1. Chyby testu. Je-li T testovací statistika, α je hladina významnosti testu a W α je kritický obor testu, pak při rozhodovaní nastanou následující situace. S k u t e č n o s t H 0 H 1 H 0 T / W α T / W α, správně chyba. druhu β H 1 T W α, T W α chyba 1. druhu α správně Stanovení kritického oboru. Požadujeme, aby chyba 1. druhu, kdy odmítneme nulovou hypotézu H 0, ačkoliv platí, byla menší než α. K 83

2 tomu stačí, aby byl kritický obor W α doplňkem k (1 α)0% intervalu spolehlivosti pro testovaný parametr rozdělení. Chybu. druhu můžeme pouze ve většině případů alespoň odhadnout. Při této volbě kritického oboru jsou chyby 1. a. druhu na sobě závislé. Je-li zvolená chyba 1. druhu α příliš malá, může být chyba. druhu velká. Na obrázku Obr. 6.1 znázorníme jednoduchou situaci, která ilustruje závislost velikostí chyb. W α t α µ 0 T µ 1 Obr Znázorníme si vztah chyby 1. druhu α a chyby. druhu β. Testujeme nulovou hypotézu H 0 : µ = µ 0 na hladině významnosti α pro případ výběru z normálního rozdělení N(µ; σ ). Použijeme testovací statistiku T = (X µ) n/s, o které víme, že má Studentovo rozdělení t(n 1). Označme T hodnotu testovací statistiky, t α je hranicekritického oboru W α (kritická hodnota.) Jestliže je ale ve skutečnosti µ = µ 1, pak nulová hypotéza H 0 neplatí. Chyba. druhu β odpovídá ploše obrazce \\\\ a hodnota chyby 1. druhu α odpovídá ploše obrazce ////. Je vidět, že pokud budeme hodnotu α zmenšovat, pak se bude hranice t α kritického oboru posunovat doprava a hodnota chyby. druhu β se bude zvětšovat. Proto v praxi volíme hodnotu α podle charakteru úlohy. Musíme se rozhodnout, zda je pro nás přijatelnější odmítnou testovanou hypotézu H 0 i když je ve skutečnosti pravdivá a nebo zda je přijatelnější ji přijmout, i když ve skutečnosti platí alternativní hypotéza. Poznámka: p hodnota testu. V současné době se používá místo popsaného rozhodovacího procesu rozhodovaní na základě p hodnoty testu. Je to umožněno tím, že pro většinu používaných statistik známe jeich rozdělení a dovedene určit pravděpodobnosti a kvantily v celém rozsahu a nejsme odkázáni na několik tabulkových hodnot pro vybrané hladiny významnosti. p hodnota testu je definována jako hodnota hladiny významnosti, při které se hodnota testovací statistiky stává hraniční hodnotou kritického oboru. Situaci si znázorníme na obrázku pro jednotlivé varianty testu. Symboly t β jsou označeny β kvantily rozdělení 84 x

3 testovací statistiky T, které tvoří hranice kritického oboru testu. Je-li T testovací statistika a t 0 je její hodnota, pak je p hodnota testu definována jako: p = min{p (T t 0 ), P (T t 0 )} pro oboustranný test; W α t α 0 t 0 p = P (T t 0 ) pro pravostranný test; p = P (T t 0 ) pro levostranný test. p = P (T t 0 ) p/ = P (T t 0 ) t1 α p = P (T t 0 ) W α 0 t 0 W α t1 α W α tα t 0 0 Nulovou hypotézu H 0 zamítáme na hladině významnosti α, jestliže je p < α. Velikost pravděpodobnosti p je přesnějším popisem rozhodovacího procesu, než je minimální vzdálenost bodu t 0 od hranice kritického oboru. Testy o parametrech rozdělení Test o střední hodnotě, jednovýběrový t-test. Předpokládáme, X 1, X,... X n je náhodný výběr z normálního rozdělení N(µ; σ ). Jako odhad střední hodnoty µ použijeme výběrový průměr X a jako odhad rozptylu σ použijeme výběrový rozptyl S. a) Testujeme nulovou hypotézu (oboustranný test) H 0 : µ = µ 0 proti alternativní hypotéze H 1 : µ µ 0. Za testovou statistiku volíme T = X µ 0 n, S 85

4 o které je známo, že má Studentovo t(n 1) rozdělení. Je totiž T = X µ 0 σ 0 / n X µ0 S = σ 0 / n n ) / = n 1 ( Xi X kde U N(0; 1) a Z χ (n 1). Kritickým oborem je σ 0 W α = {T ; T > t 1 α(n 1)} U Z/(n 1), doplněk k (1 α)0% intervalu spolehlivosti pro parametr µ. Při této volbě je chyba 1. druhu menší než α. To znamená, že ve 0α% případů odmítneme pravdivou skutečnost a příjmeme alternativní hypotézu, ačkoliv neplatí. Situace je znázorněná na obrázku. W α t α 0 W α t 1 α Obdobně provádíme test jednostranných hypotéz: b) H 0 : µ µ 0, H 1 : µ > µ 0, pak 0 W α = {T ; T > t 1 α (n)}; t 1 α W α c) H 0 : µ µ 0, H 1 : µ < µ 0, pak W α = {T ; T < t α (n)}. W α t α 0 Kritické hodnoty testu. Krajní body intervalů, které tvoří kritické obory se nazývají kritické hodnoty testu. Označují se symbolem t(α), ačkoliv jsou to 1 α kvantily. Při práci s tabulkami je třeba dávat pozor, jak je přesně kritická hodnota definována. V záhlaví tabulky je toto vždy uvedeno. Poznamenejme, že pro rozsahy výběru n 30 můžeme nahradit kvantily, či kritické hodnoty Studentova t rozdělení hodnotami z normovaného normálního rozdělení. Obvykle bývají označeny symbolem u(α). 86

5 Příklad: Soubor {X i, 1 i n} je náhodným výběrem z normálního rozdělení N(µ; σ ). Testovaná hypotéza: H 0 : µ = µ 0, alternativní hypotéza H 1 : µ µ 0. a) VS-1: n = 35, X = 18, 11, S = 61, 1, S = 7, Testujeme hypotézu H 0 : µ = µ 0 = 180, proti alternativě H 1 : µ 180. Potom je 18, T = 35 = 1, , Kritické hodnoty t(0, 1) = 1, 64449, t(0, 05) = 1, 96, t(0, 01) =, Protože je T / W α pro všechny hladiny, přijmeme nulovou hypotézu H 0. p hodnota testu je p = 0, 1, je tedy rozhodování blízké hladině významnosti. b) VH-4: n = 7, X = 76, 74, S = 59, 74, S = 7, Testujeme hypotézu H 0 : µ = µ 0 = 75, proti alternativě H 1 : µ 75. Potom je 76, T = 7 = 1, , 7916 Kritické hodnoty t(0, 1) = 1, 7056, t(0, 05) =, 0555, t(0, 01) =, Protože je T / W α pro všechny hladiny, přijmeme nulovou hypotézu H 0. p hodnota testu je p = 0, 53, můžeme tedy považovat chybu. druhu za malou ve srovnání s hodnotou α. 6.. Test o rozptylu normálního rozdělení jednovýběrový F test. Pro náhodný výběr X 1, X,... X n je náhodný výběr z normálního rozdělení N(µ; σ ) hledáme hodnotu rozptylu σ. Jako jeho odhad použijeme výběrový rozptyl S. a) Testujeme nulovou hypotézu H 0 : σ = σ 0 proti alternativní hypotéze H 1 : σ σ 0. Za testovou statistiku volíme V = (n 1)S σ 0 = n 87 X i X σ 0,

6 o které je známo, že má χ (n 1) rozdělení. Kritickým oborem je množina W α = {V ; V < χ α(n 1) nebo V > χ 1 (n 1)}, α která je doplňkem k (1 α)0% intervalu spolehlivosti pro parametr σ. Při této volbě je chyba 1. druhu menší než α. To znamená, že ve 0α% případů odmítneme pravdivou skutečnost a příjmeme alternativní hypotézu, ačkoliv neplatí. Situace je znázorněná na obrázku. 0 W α χ α χ 1 α W α Obdobně provádíme test jednostranných hypotéz: b) H 0 : σ σ 0, H 1 : σ > σ 0, pak W α = {V ; V > χ 1 α(n 1)}; 0 χ 1 α W α c) H 0 : σ σ 0, H 1 : σ < σ 0, pak W α = {V ; V < χ α(n 1)}. 0 W α χ α Kritické hodnoty testu. Krajní body intervalů, které tvoří kritické obory se nazývají kritické hodnoty testu. Označují se symbolem χ α, ačkoliv jsou to 1 α kvantily. Při práci s tabulkami je třeba dávat pozor, jak je přesně kritická hodnota definována. V záhlaví tabulky je toto vždy uvedeno. Příklad: Soubor {X i, 1 i n} je náhodným výběrem z normálního rozdělení N(µ; σ ). a) VS-: n = 30, X = 183, S = 64, 97. Testujeme hypotézu H 0 : σ = σ0 = 70, proti alternativě H 1 : σ 70. Potom je 9.64, 97 V = = 6,

7 Kritické hodnoty α = 0, 1 : 17, 708, 4, 557; α = 0, 05 : 16, 047, 45, 7; α = 0, 01 : 13, 11, 5, 336. Protože je V / W α pro všechny hladiny, přijmeme nulovou hypotézu H 0. p hodnota testu je p = 0, 848. Je p >> α, tedy závěr je poměrně spolehlivý, chyba. druhu je velice malá. b) VH-4: n = 7, X = 76, 74, S = 59, 74. Testujeme hypotézu H 0 : σ = σ0 = 0, proti alternativě H 1 : σ 0. Potom je V = 6.59, 74 0 = 15, 53. Kritické hodnoty α = 0, 1 : 15, 375, 38, 885; α = 0, 05 : 13, 844, 41, 93; α = 0, 01 : 11, 160, 48, 90. Protože je V / W α pro všechny hladiny, přijmeme nulovou hypotézu H 0. p hodnota testu je p = 0, 6 a hodnota je velice blízká uvažovaným hladinám významnosti α = 0, 1, resp. α = 0, 05. Chyba. druhu může být významná Test pro parametr δ exponenciálního rozdělení Exp(0; δ). Pomocí hodnot náhodného výběru X 1, X,..., X n z exponenciálního rozdělení Exp(0; δ) testujeme hypotézu o střední hodnotě δ. Nulovou hypotézou je H 0 : δ = δ 0 proti alternativě H 1 : δ δ 0. Za testovou statistiku volíme náhodnou veličinu T = nx δ 0, o níž jsme ukázali, že má rozdělení χ (n). Kritickým oborem je W α = {T ; T < χ α(n 1) nebo T > χ 1 (n 1)}, α což je doplněk k (1 α)0% intervalu spolehlivosti pro parametr δ. Příklad: Soubor {X i ; 1 i n} je výběrem s exponenciálního rozdělení Exp(0; 1, 5), kde n =

8 Testujeme hypotézu H 0 : δ = δ 0 = 1, 3 proti alternativní hypotéze H 1 : δ δ 0. Pro data jsme dostali X = 60, Pro testovací statistiku dostaneme hodnotu T = nx = 9, 98. δ 0 Kritický obor na hladině významnosti α = 0, 1 získáme z kvantilů rozdělení χ (80). Je W = {T ; T < χ 0,05(80) = 60, 391, nebo T > χ 0,95(80) = 1, 88}. Protože je T / W nezamítáme nulovou hypotézu H 0. Z kvantilové funkce získáme p hodnotu testu p = 0, 304, což je přijatelná hodnota, která signalizuje menší hodnoty chyby. druhu. Pro zajímavost uvedeme interval spolehlivosti (δ 1 ; δ ) pro parametr δ, kdy jeho hranice dostaneme z rovnic T =, 873 δ 1 = 1, 88, resp. T =, 873 δ 60, 391. Odtud plyne, že pro hodnoty δ 0 (1, 19; ) nebudou hodnoty testovací statistiky v kritickém oboru, tedy nulovou hypotézu nezamítneme Test o rovnosti středních hodnot, dvouvýběrový t-test. Předpokládáme, že X 1, X,..., X n je náhodný výběr z normálního rozdělení N(µ 1 ; σ1) a Y 1, Y,..., Y m je náhodný výběr z normálního rozdělení N(µ ; σ). Jako odhady středních hodnot µ 1 a µ použijeme výběrové průměry X a Y a jako odhady rozptylů σ1 a σ použijeme výběrové rozptyly SX a SY. Předpokládáme, že jsou výběry nezávislé a že se rozptyly rovnají, tedy σ1 = σ = σ. Testujeme nulovou hypotézu H 0 : µ 1 µ =, obvykle = 0, proti alternativní hypotéze H 1 : µ 1 µ. A) Dvouvýběrový t-test. Za testovou statistiku volíme T = X Y (µ 1 µ ) (n 1)S X + (m 1)S Y nm(n + m ), n + m o které je známo, že má Studentovo t(n + m ) rozdělení. K odvození této skutečnosti postupně použijeme vlastností: X N µ 1, σ n, 90 Y N µ, σ m.

9 Dále je E(X Y ) = E(X) E(Y ) = µ 1 µ. Z nezávislosti výběrů plyne, že D(X Y ) = D(X) + D(Y ) = σ 1 n + σ ( 1 m = σ n m) + 1 = σ n + m nm. Výraz pro S je odhadem rozptylu obou souborů. Náhodná veličina Z = (n 1)S X + (m 1)S Y σ Potom je kde = n X i X σ + m χ (n 1) + χ (m 1) = χ (n + m ). T = U Z/(n + m ), U = X Y (µ 1 µ ) σ N(0; 1) n+m nm a tedy statistika T má Studentovo rozdělení t(n + m ). Kritickým oborem testu je množina W α = {T ; T > t 1 α(n + m )}, Y i Y σ která je doplňkem k (1 α)0% intervalu spolehlivosti pro parametr = µ 1 µ. Při této volbě je chyba 1. druhu menší než α. To znamená, že ve 0α% případů odmítneme pravdivou skutečnost a příjmeme alternativní hypotézu, ačkoliv neplatí. Porušení normality výběru se ve výsledcích testů výrazněji neprojeví. Shodu rozptylů před výpočtem ověříme testem pro jejich rovnost. Pokud nám test pro rovnost rozptylů dá negativní výsledek, použijeme pro ověření hypotézy některou z uvedených variant testu, např. Cochranův- Coxův test nebo neparametrické testy, např. dvouvýběrový Wilcoxonův test, či Kolmogorovův-Smirnovův test, nebo test dobré shody. B) Cochranův-Coxův test volíme v případě, že není splněn předpoklad o rovnosti rozptylů. Za testovou statistiku volíme T = X Y, S = v X + v Y, v X = S X S n, v Y = S Y m. 91

10 Je pak T = X Y = S X n + S Y m X Y ms X +ns Y nm = X Y nm σ n+m ms X +nsy σ(n+m) Náhodná veličina v čitateli má normované normální rozdělení a ve jmenovateli χ. Ve jmenovateli představuje vážený průměr odhad rozptylu. Kritickým oborem je W α = {T ; T > t }, t = v Xt n 1 (α) + v Y t m 1 (α) v X + v Y, kde t k (α) je kritická hodnota jednovýběrového t testu. Kritickou hodnotu t dostaneme jako vážený průměr kritických hodnot jednovýběrových testů. Uvedený test má ještě některé jiné varianty, které pro menší rozsahy výběrů dávají poněkud jiné kritické obory. Uvedeme si na ukázku dvě z nich. C) Satterthwaite (1946). Při použití statistiky T stanovujeme kritický obore jako W α = {T ; T > t f (α)}, f = S 4 v X n 1 + v Y m 1 kde t k (α) je kritická hodnota jednovýběrového t testu. D) Welch (1947). Pro statistiku T je kritickým oborem W α = {T ; T > t h (α)}, h = S4 v X n + v Y m, kde t k (α) je kritická hodnota jednovýběrového t testu. Varianty majípraktické využití při menších rozsazích výběrů. Je-li m+ n > 30 dávají všechny stejné výsledky. Kritické hodnoty se při změně počtu stupňů volnosti již nemění. Příklad: Soubor {X i, 1 i n} je náhodným výběrem z normálního rozdělení N(µ 1 ; σ 1) a soubor {Y i, 1 i m} je náhodným výběrem z normálního rozdělení N(µ ; σ ). 9,.

11 a) VS-: n = 30, X = 183, SX = 64, 97; VS-4: m = 7, Y = 181, SY = 74, 77. Testujeme hypotézu H 0 : µ 1 = µ, proti alternativě H 1 : µ 1 µ. Potom je T = 7, 9567 = 0, , 87 Kritické hodnoty t(0, 1) = 1, 64449, t(0, 05) = 1, 96, t(0, 01) =, Protože je T / W α pro všechny hladiny, přijmeme nulovou hypotézu H 0. Pro test dostaneme p hodnotu rovnu p = 0, 37, která je výrazně větší než uvažované hladiny významnosti testu. b) VH-1: n = 35, X = 75, 4, S X = 1, 78; VH-3: m = 34, Y = 77, 53, S Y = 134, 6. Testujeme hypotézu H 0 : µ 1 = µ, proti alternativě H 1 : µ 1 µ. Potom je T = 75, 4 77, , 997 = 0, , 6034 Kritické hodnoty t(0, 1) = 1, 64449, t(0, 05) = 1, 96, t(0, 01) =, Protože je T / W α pro všechny hladiny, přijmeme nulovou hypotézu H 0. Pro test dostaneme p hodnotu rovnu p = 0, 4, která je výrazně větší než uvažované hladiny významnosti testu Test o rovnosti rozptylů, dvouvýběrový F-test. Předpokládáme, že X 1, X,..., X n je náhodný výběr z normálního rozdělení N(µ 1 ; σ1) a Y 1, Y,..., Y m je náhodný výběr z normálního rozdělení N(µ ; σ). Jako odhady středních hodnot µ 1 a µ použijeme výběrové průměry X a Y a jako odhady rozptylů σ1 a σ použijeme výběrové rozptyly SX a SY. Předpokládáme, že jsou náhodné výběry nezávislé. Testujeme nulovou hypotézu H 0 : σ1 = σ proti alternativě H 1 : σ1 σ. Jako výběr X i označíme ten, pro který je SX > SY. Za testovou statistiku volíme F = S X SY, 93

12 o které je známo, že má F n 1,m 1 rozdělení. Kritickým oborem je W α = {F ; F > F n 1,m 1 (α), } kde F n 1,m 1 (α) je kritická hodnota z tabulek, která je (1 α/) kvantilem rozdělení F n 1,m 1. Poznamenejme, že při této volbě označení výběrů vyjde vždy hodnota testovací statistiky větší než jedna. Kritický obor je tedy volen tak, že tento poměr nesmí přesáhnout kritickou hodnotu. Pro obecnou situaci by měl kritický obor ještě část hodnot blízkých nule. To ve zvolené variantě testu ale nemůže nastat. Testy ve statistických softwarových produktech někdy předpokládají volbu této varianty a testují obvykle pouze překročení horní kritické hodnoty. Při této volbě je chyba 1. druhu menší než α. To znamená, že ve 0α% případů odmítneme pravdivou skutečnost a příjmeme alternativní hypotézu, ačkoliv neplatí. Příklad: Soubor {X i, 1 i n} je náhodným výběrem z normálního rozdělení N(µ 1 ; σ 1) a soubor {Y i, 1 i m} je náhodným výběrem z normálního rozdělení N(µ ; σ ). a) VH-1: X n = 35, X = 75, 4, SX = 1, 78; VH-: Y n = 30, Y = 77, 4, SY =, 59. Testujeme hypotézu H 0 : σ1 = σ, proti alternativě H 1 : σ1 σ. Potom je 1, 78 F = = 1, , 59 Kritické hodnoty α = 0, 1 : 1, 79; α = 0, 05 :, 01. Protože je F / W α pro všechny hladiny, přijmeme nulovou hypotézu H 0. Pro test dostaneme p hodnotu p = 0, 8, tedy odmítnutí alternativní hypotézy je oprávněné. b) VH-3: X n = 30, X = 77, 53, SX = 134, 6; VH-4: Y n = 7, Y = 76, 74, SY = 59, 74. Testujeme hypotézu H 0 : σ1 = σ, proti alternativě H 1 : σ1 σ. Potom je 134, 6 F = =, , 74 Kritické hodnoty 94

13 α = 0, 1 : 1, 89; α = 0, 05 :, 14. Protože je F W α pro všechny hladiny, zamítneme nulovou hypotézu H 0 a přijmeme hypotézu H 1. Pro test dostaneme p hodnotu rovnu p = 0, 04, což potvrzuje odmítnutí nulové hypotézy. Neparametrické testy V neparametrických testech má hypotéza charakter tvrzení o vlastnostech rozdělení, které nejsou odvozeny od hodnot parametrů. Testujeme hodnotu mediánu, symetrii rozdělení, shodu dvou a více rozdělení, či typ rozdělení a to nejčastěji normalitu. Uvedeme některé z nejčastěji používaných testů Znaménkový test je testem o mediánu rozdělení. Používáme jej jako velice jednoduchou variantu testu na symetrii rozdělení, kdy by se měl medián rovnat střední hodnotě. Test má velmi malou vypovídací hodnotu, uvádíme jej jako příklad neparametrického testu. na kterém ukážeme principy testování tohoto druhu. Předpokládáme, že X 1, X,..., X n je náhodný výběr ze spojitého rozdělení jehož medián je x 0,5 = x. Testujeme nulovou hypotézu H 0 : x = x 0, proti alternativě H 1 : x x 0. Označme si Y i = X i x 0. Pokud je nulová hypotéza platná, pak by měl být počet kladných a záporných hodnot souboru Y i stejný. Označímeli Y počet kladných hodnot v souboru Y i, je pak Y realizací náhodné veličiny, která má binomické rozdělení Bi(n, 1 ). Ta nabývá hodnot z množiny {0, 1,,..., n} a hodnoty blízké nule a n se vyskytují s velmi malou pravděpodobností. Kritický obor testu je W α = {Y ; Y k 1 nebo Y k }, kde hodnoty k 1 a k nalezneme v tabulkách. Pro zvolenou hladinu testu je nalezneme tak, že je k 1 největší z hodnot a k je nejmenší z hodnot, pro které platí P (Y k 1 ) α, P (Y k ) α, jestliže má Y zmiňované binomické rozdělení Bi(n, 1 ). Pokud má výběr větší rozsah, n > 36, můžeme nahradit binomické rozdělení Bi(n, 1 ) normálním rozdělením N(n, n 4 ). Obě rozdělení mají 95

14 shodné střední hodnoty n a shodné rozptyly n 4. Potom má normalizovaná náhodná veličina U = Y n n = Y n n normované normální rozdělení N(0; 1). Kritický obor je roven W α = {U; U u(α), } kde u(α) je kritická hodnota pro normální rozdělení, kterou nalezneme z tabulek. Poznamenejme, že je tato kritická hodnota u(α) = u 1 α rovna 1 α kvantilu normovaného normálního rozdělení. Snadno odvodíme i jednostranné varianty testu. Test má poměrně malou sílu a k věrohodnotnějšímu výsledku je potřeba poměrně velký rozsah náhodného výběru, v řádu n > Příklad: Soubor dat {X i ; 1 i 6} je počet, kolikrát padne číslo {i; 1 i 6} při 150 hodech hrací kostkou. Je X i {4,, 5,, 8, 9}. Testujeme nulovou hypotézu H 0 : x = x 0,5 = 5 proti alternativní hypotéze H 1 : x 5. Pro uvedená dat je Y i { 1, 3, 0, 3, 3, 4}. Počet kladných hodnot je Y =. Z tabulek dostaneme kritické hodnoty testu na hladině významnosti α = 0, 05 a z nich kritický obor W = {Y ; Y k 1 = 0, nebo Y k = 6}. Protože je Y / W nezámítáme nulovou hypotézu H 0. Příklad: Soubor dat {X i ; 1 i 6} je počet, kolikrát padne číslo {i; 1 i 6} při 300 hodech hrací kostkou. Je X i {48, 5, 51, 40, 51, 48}. Testujeme nulovou hypotézu H 0 : x = x 0,5 = 50 proti alternativní hypotéze H 1 : x 50. Pro uvedená dat je Y i {,, 1,, 1, }. Počet kladných hodnot je Y = 3. Z tabulek dostaneme kritické hodnoty testu na hladině významnosti α = 0, 05 a z nich kritický obor W = {Y ; Y k 1 = 0, nebo Y k = 6}. 96

15 Protože je Y / W nezámítáme nulovou hypotézu H 0. Jeste jeden p5iklad 6.7. Jednovýběrový Wilcoxonův test je testem symetrie rozdělení. Testujeme symetrii rozdělení vzhledem k hodnotě x 0, za kterou obvykle volime odhad mediánu či střední hodnoty. Testujeme skutečnost, že pro hustotu či pravděpodobnostní funkci platí f(x x 0 ) = f(x + x 0 ). Nulovou hypotézu zapisujeme ve tvaru podmínky pro medián x 0,5 = x : H 0 : x = x 0, proti alternativě H 1 : x x 0. Pro náhodný výběr X 1, X,..., X n utvoříme soubor Y i = X i x 0, ve kterém vypustíme případné nulové hodnoty. Hodnoty Y i uspořádáme podle velikosti a označíme R i + jejich pořadí. Nyní je S + = Y i >0 R + i, S = Y i <0 R + i. Poznamenejme, že S + + S = 1 n(n + 1). Pokud je rozdělení symetrické, budou se vyskytovat kladné a záporné hodnoty souměrně kolem hodnoty x 0, tedy součty pořadí kladných a záporných hodnot se od sebe budou málo lišit. Kritický obor testu je stanoven jako W α : min(s +, S ) < w(α), kde w(α) je kritická hodnota testu, kterou nalezneme v tabulkách. Je-li splněna podmínka pro kritický obor zamítneme nulovou hypotézu, že rozdělení je symetrické. Poznamenejme, že pro náhodné veličiny S + a S je E(S + ) = E(S ) = 1 4 n(n + 1), a D(S+ ) = D(S ) = 1 n(n + 1)(n + 1). 4 Pro větší hodnoty rozsahu výběru nahradíme rozdělení rozdělením normálním, tedy skutečností, že má náhodná veličina U = S+ 1 4n(n + 1) n(n + 1)(n + 1) 1 4 normované normální rozdělení N(0; 1). Kritický obor testu je pak W α = {U; U > u(α), } 97

16 kde u α je kritická hodnota testu pro normální rozdělení, která je rovna u(α) = u 1 α, tedy (1 α/ kvantilu normovaného normálního rozdělení. Příklad: Budeme testovat symetrii souboru dat, která jsou počtem studentů, kteří získali u testu stejného bodového ohodnocení. Datový soubor je X i {, 3,, 8, 5, 6, 7, 6, 4, 3, 4}. Jestliže spočteme aritmetický průměr, dostaneme x = = 4, 55. Budeme testovat symetrii rozdělení kolem této hodnoty, tedy nulovou hypotézu H 0 : x = 4, 55 proti alternativní hypotéze H 1 : x 4, 55. Pro hodnoty X i x určíme součet pořadí kladných a záporných hodnot a dostaneme, že S + = 9, S = 37. (S + + S = 66) Odtud je min{s +, S } = 9. Pro kritické hodnoty w(α) testu dostaneme z tabulek hodnoty w(0, 05) =, w(0, 01) = 5. Pro obě hladiny významnosti je min{s +, S } > w(α), tedy nulovou hypotézu nezamítáme. Rozdělení je symetrické kolem hodnoty x = 4, Dvouvýběrový Wilcoxonův test slouží k porovnání výběrů, kdy testujeme hypotézu, že jsou oba výběry ze stejného rozdělení. Předpokládáme, že náhodný výběr {X 1, X,..., X n } je výběrem z rozdělení s distribuční funkcí F a náhodný výběr {Y 1, Y,..., Y m } je výběrem z rozdělení s distribuční funkcí G. Testujeme hypotézu H 0 : F = G proti alternativě H 1 : F G. Test je založen na skutečnosti, že pokud jsou obě rozdělení stejná, pak se v obou výběrech budou vyskytovat hodnoty shodné velikosti ve stejném počtu. Uvedený algoritmus je známý jako test. Algoritmus testu: 1. Vytvoříme sdružený soubor {Z 1, Z,..., Z n+m } = {X 1, X,..., X n } {Y 1, Y,..., Y m }.. Stanovíme pořadí prvků souboru, který uspořádáme podle velikosti, přičemž prvkům, které mají stejnou velikost přiřadíme průměr jejich pořadí. Označme 98

17 T 1 je součet pořadí prvků z prvního souboru; T je součet pořadí prvků z druhého souboru. Poznamenejme, že T 1 + T = 1 (n + m)(n + m + 1). 3. Položme U 1 = nm + 1 n(n + 1) T 1 a U = nm + 1 m(m + 1) T. Poznamenejme pro kontrolu, že U 1 + U = nm. Testovací kritérium: Kritický obor W α : min{u 1, U } w(α), kde kritickou hodnotu w(α) testu nalezneme v tabulkách. Poznámka: Pořadí souborů volíme tak, aby n m, tabulky bývají pro rozsahy m 0, 5 n 30. Pro větší rozsahy výběrů využíváme skutečnosti, že za platnosti hypotézy H 0 je E(U 1 ) = E(U ) = 1 nm a D(U 1) = D(U ) = 1 nm(n + m + 1). 1 Rozdělení obou veličin můžeme pak považovat za normální a tedy náhodná veličina U = U 1, 1 nm 1 1nm(n + m)(n + m + 1) má normované normální rozdělení N(0; 1). Kritický obor testu je W α = {U; U > u(α)}, kde u(α) je kritická hodnota pro normální rozdělení, tedy u 1 α kvantil normálního rozdělení. Příklad: Budeme testovat shodu rozdělení pro datové soubory {X i ; 1 i } a {Y i ; 1 i }, které jsou počty výskytů 1, resp. 6 v seriích po 30 hodech hrací kostkou. Dostaneme X i {4, 3, 3, 7, 7, 7,, 6, 1, 7} a Y i {6, 6, 4, 5, 8, 5, 1, 4, 4, 5}. Pro sdružené pořadí dostaneme T 1 = T = 5, tedy U 1 = U = 50. Kritické hodnoty w(α) testu nalezneme v tabulkách. Z nich dostaneme, 99

18 že w(0, 05) = 3 a w(0, 01) = 16. Protože min{u 1 ; U } = 50 > w(α), tedy hodnota statistiky nepatří do kritického oboru, nezamítáme nulovou hypotézu H 0 na obou hladinách významnosti. Poznámka. Test je citlivý na posun, tedy na situaci, kdy je F (x) = G(x ). Pořadí jednotlivých dat souborů jsou vůči sobě posunuta a v součtu je pak jejich rozdíl velký. Dochází tak k zamítnutí hypotézy o shodě. Pro tyto situace a případy, kdy se soubory liší spíše rozptylem či tvarem je doporučován Kolmogorovův-Smirnovův test Kruskalův-Wallisův test je neparametrickou obdobou analýzy rozptylu a je rozšířením Wilcoxonova testu na větší počet výběrů. Máme k, k 3 nezávislých výběrů X i1, X i,..., X ini, 1 i k. Označme n = n 1 + n n k počet všech prvků ve výběrech. Předpokládáme, že výběry jsou po řadě z rozdělení se spojitými distribučními funkcemi F 1, F,..., F k. Testujeme nulovou hypotézu proti alternativě H 0 : F 1 = F =... = F k H 1 : H 0 neplatí. Algoritmus testu: 1. Srovnáme všechny prvky výběrů podle velikosti a určíme pořadí R ij, 1 j n i, 1 i k každého z nich.. Určíme součet pořadí T i = n i j=1 R ij, 1 i k prvků z každého z výběrů. Pro kontrolu je T 1 +T +...+T k = 1 n(n+1). 3. Vypočteme hodnotu testovací statistiky Q = 4. Kritický obor testu je 1 n(n + 1) k T i n i 3(n + 1). W α = {Q; Q > h k 1 (α)}, kde kritické hodnoty h k 1 (α) nalezneme pro menší rozsahy výběrů ve statistických tabulkách. Při větších rozsazích využíváme skutečnosti, že 0

19 pro n i má statistika Q v limitě rozdělení χ (k 1). Použijeme tedy aproximace h k 1 (α). = χ α(k 1). Jedná se o (1 α) kvantil rozdělení χ (k 1). Test je citlivý na posun, podobně jako při porovnávání dvou výběrů. V takovém případě volíme porovnávání metodou analýzy rozptylu. V případě zamítnutí nás zajímá, pro které z dvojic je rozdíl mezi F i a F j signifikantní. Pokud jsou rozsahy výběrů různé pak je podstatný rozdíl pro dvojice i a j, pro které je t i t j > n i n j n(n + 1)h k 1 (α), kde t i = T i n i, 1 i k a h k 1 (α) je kritická hodnota testu. Šetření je nutné provést pro všech 1 k(k 1) dvojic výběrů. V případě stejného rozsahu výběrů používáme citlivější Neményiovy metody, která je obdobou Tukeyovy metody z analýzy rozptylu pro vyvážená třídění. Položme m = n 1 = n =... = n k a n = mk. Rozdílné jsou dvojice, pro které je rozdíl T i T j větší než kritická hodnota z tabulek. Ty uvadí hodnoty pro m 5 a k. Pro větší rozsahy výběrů používáme kritické hodnoty pro rozpětí. Je-li Y 1, Y,..., Y k náhodný výběr z rozdělení N(0; 1) a Y (1) Y ()... Y (k) je uspořádaný výběr, pak náhodná veličina R = Y (k) Y (1) je rozpětí. Kritická hodnota q k, (α) je definována jako P (R q k, (α)) = α. Rozdíl je signifikantní pro dvojice, pro které je t i t j > q k, (α) 1 k(mk + 1). 1 Příklad: 6.. Kolmogorovův-Smirnovův test. Test je založen na porovnávání maximální odchylky distribučních funkcí. Porovnáváme empirickou distribuční funkci, kterou získáme z datového souboru s teoretickou distribuční funkcí předpokládaného rozdělení. Nebo při porovnávání dvou výběrů srovnáváme obě empirické 1

20 distribuční funkce. Test je odvozen za předpokladu, že se jedná o výběry z normálního rozdělení. Pro jiná rozdělení, která se výrazně od něj odlišují (exponenciální) jsou v literatuře uvedeny modifikace testu. Nejprve popíšeme empirickou distribuční funkci, která se v testu používá. Je-li {X 1, X,..., X n } náhodný výběr z rozdělení, které má distribuční funkci F, pak empirickou distribuční funkcí nazýváme funkci F n, která je definována předpisem: F n (x) = 1 n n ξ i (x), kde ξ i (x) = 0, x < Xi, 1, x X i. Potom je lim F n n(x) = F (x), x R. Poznámka. Empirická distribuční funkce je po úsecích konstantní a má skoky velikosti 1 v bodech x = X i, 1 i n. Znázorníme si průběh empirické distribuční funkce pro náhodný výběr, pro který platí: X 1 < X < X 3 = X 4 < X 5. y F 5 (x) X 1 X X 3 = X 4 X 5 x Obr Jednovýběrový test Předpokládáme, že náhodný výběr X i, 1 i n je výběrem z rozdělení s distribuční funkcí F. Testujeme hypotézu: H 0 : výběr je z rozdělení s distribuční funkcí F proti alternativní hypotéze H 1 : výběr není z rozdělení s distribuční funkcí F. Algoritmus testu: 1. Vypočteme empirickou distribuční funkce F n a teoretickou dostribuční funkce F.. Určíme maximální rozdíl těchto funkcí, D n = sup{ F n (x) F (x) ; x R}.

21 Platí-li hypotéza H 0 je lim D n,m n = Určíme testovací statistiku ndn, která má rozdělení určené distribuční funkcí K(λ), kde tj. 4. Kritický obor testu je K(λ) = 1 ( 1) k+1 e k λ, k=1 lim P ( ndn < λ ) = K(λ), λ > 0. n,m W α : ndn λ α D n λ α n, kde kritickou hodnotu testu Dn = λ α n nalezneme v tabulkách pro hodnoty n 0. Pro větší rozsahy výběrů použijeme aproximace K(λ). = 1 e λ a kritickou hodnotu λ α určíme z podmínky: P D n < λ α = K(λ) = 1 α 1 α = 1 e λ α λα = n Pro kritický obor dostaneme W α : D n D n = 1 n ln α. 1 ln α. Příklad: Pro soubor dat {, 1, 5, 1, 0, 7, 0, 1, 0, 5, 1, 1, 1, 6,, 3} testujeme hypotézu H 0 : výběr je z rovnoměrného rozdělení v intervalu (, 3). Podle algoritmu testu dostaneme: max{ F n (x) F (x) ; x, 3 }. = 0, 1667; hodnota statistiky D n. = 0, 577; kritická hodnota D n (0, 05) = 1, 358. Protože je D n < D n (0, 05) nezamítáme hypotézu H 0 na hladině významnosti α = 0, 05. Pro p hodnotu testu dostaneme p. = 0,

22 Dvouvýběrový test Předpokládáme, že náhodný výběr {X 1, X,..., X n } je výběrem z rozdělení s distribuční funkcí F a náhodný výběr {Y 1, Y,..., Y m } je výběrem z rozdělení s distribuční funkcí G. Testujeme hypotézu H 0 : F = G proti alternativě H 1 : F G. Test je založen na skutečnosti, že pokud jsou obě rozdělení stejná, pak se v obou výběrech budou vyskytovat hodnoty shodné velikosti ve stejném počtu. Algoritmus testu: 1. Vypočteme empirické distribuční funkce F n a G m.. Určíme maximální rozdíl těchto funkcí, D n,m = sup{ F n (x) G m (x) ; x R}. Platí-li hypotéza H 0 je lim D n,m n,m = Určíme testovací statistiku MDn,m, M = nm n + m, která má rozdělení určené distribuční funkcí K(λ), kde tj. K(λ) = 1 ( 1) k+1 e k λ, k=1 ( ) lim P MDn,m < λ = K(λ), λ > 0. n,m 4. Kritický obor testu je W α : MDn,m λ α D n,m λ α M, kde kritickou hodnotu testu Dn,m = λ α M nalezneme v tabulkách pro hodnoty n 0, 4 m 0, n + m 8. Pro větší rozsahy výběrů použijeme aproximace K(λ). = 1 e λ a kritickou hodnotu λ α určíme z podmínky: P ( D n,m < λ α M ) = K(λ) = 1 α 1 α = 1 e λ α 4

23 Pro kritický obor dostaneme λ α = 1 ln α. W α : D n,m D n,m = 1 M ln α. Příklad: Porovnáme shodu rozdělení, ze kterého pocházejí datové soubory, které jsou počtem 6, resp. 1 v seriích po 30 hodech hrací kostkou. Je X i {1, 4, 4, 4, 5, 5, 5, 6, 6, 8} a Y i {1,, 3, 3, 4, 6, 7, 7, 7, 7}. Pro empirické distribuční funkce dostaneme: x F 1 G Odtud dostaneme, že hodnota testovací statistiky je D, = 3. Kritické hodnoty nalezneme v tabulkách, kde je D,(0, 05) = 0, 7 a D,(0, 01) = 0, 8. Protože je D, < D,, tedy hodnota D, / W α pro obě hodnoty hladiny významnosti, nezamítáme nulovou hypotézu H 0 na žádné z hladin. Pro výpočet přibližné kritické hodnoty dostaneme, že M = 0 0 = 5 a D 1 M ln α : D 0, 607, α = 0, 05; D 0, 78, α = 0, Test shody pro binomické rozdělení. Máme dány hodnoty nezávislých náhodných veličin X Bi(n, p 1 ) a Y Bi(m, p ). Testujeme nulovou hypotézu H 0 : p 1 = p proti alternativě H 1 : p 1 p. Algoritmus testu. 1. Vypočteme hodnoty x = X n a y = Y m, které jsou odhady parametrů p 1 x a p y. 5

24 . Má-li výběr dostatečně velký rozsah, pak mají náhodné veličiny x a y po řadě normální rozdělení x N p 1 ; p 1(1 p 1 ) n a y N p ; p (1 p ) m 3. Protože jsou náhodné veličiny x a y nezávislé má náhodná veličina U = (x y) (p 1 p ) p1 (1 p 1 ) n + p (1 p ) m normované normální rozdělení N(0; 1). 4. Pokud platí nulová hypotéza H 0, je p 1 p = 0 a jestliže použijeme aproximací p 1 = x, p = y, má náhodná veličina U a = x y x(1 x) normované normální rozdělení N(0; 1). 5. Kritický obor testu je pak n + y(1 y) m W α = {U a ; U a u( α )}, kde kritická hodnota u( α ) je rovna 1 α kvantilu normálního rozdělení N(0; 1). Alternativní varianta testu je založena na skutečnosti, že společnou hodnotu p 1 = p odhadujeme pomocí hodnoty z = X+Y n+m = nx+my n+m. Potom má náhodná veličina U b = x y z(1 z) ( 1 n + 1 m normované normální rozdělení N(0; 1). Kritický obor testu je pak W α = {U b ; U b u( α )}. Protože je pro n = m hodnota U b U a dává tato varianta častěji jako výsledek testu přijetí nulové hypotézy H 0. 6 ).

25 Příklad: Budeme testovat shodu parametru v binomickém rozdělení pro soubory, které jsou počtem hodů s předepsaným počtem bodů v serii 300 hodů hrací kostkou. Je n = m = 300 a počet hodů je Největší rozdíl dostaneme pro 1 a 5. Volíme tedy X = 47 a Y = 61. Potom je x = 0, 15666, y = 0, 033 a z = 0, 18. Je tedy U a = 1, 491, U b = 1, Kritické hodnoty u(α) najdeme v tabulkách kvantilů normovaného normálního rozdělení. Je u(0, 1) = 1, 645 a u(0, 05) = 1, 96. Protože je U a < u(α), resp. U b < u(α) pro obě hodnoty α nezamítáme nulovou hypotézu H 0 na obou hladinách významnosti Multinomické rozdělení. Rozdělení je zobecněním binomického rozdělení, kde uvažujeme více alternativních výsledků náhodného pokusu. Jako možné výsledky uvažujeme náhodné jevy A i, 1 i k, které jsou po dvou disjunktní, P (A i ) = p i, A 1 A... A k = U, tedy p 1 +p +...+p k = 1. Opakujeme n krát pokus, který jako výsledek dává posloupnost jevů A i nebo A i a sledujeme kolikrát se na i tém místě objeví jev A i, 1 i k, přičemž jsou jednotlivá opakování na sobě nezávislá. Je-li Y i počet výskytů náhodného jevu A i, 1 i k, pak říkáme,že náhodný vektor (Y 1, Y,..., Y k ) má multinomické rozdělení s parametry n a (p 1, p,..., p k ). Náhodný vektor má diskrétní rozdělení a pro jeho sdruženou pravděpodobnostní funkci p dostaneme vzorec p(i 1, i,..., i k ) = P (Y 1 = i 1, Y = i,..., Y k = i k ) = n! = i 1!.i!... i k! pi 1 1 p i... p i k k, 0 i j, 1 j k, i 1 + i +... i k = n. 7

26 Marginální rozdělení každé z náhodných veličin Y j je binomické rozdělení Bi(n, p j ) a E(Y j ) = np j, D(Y j ) = np j (1 p j ), 1 j k. Dále je koeficient korelace cov(y i, Y j ) = np i p j, i j, 1 i, j k. Takové rozdělení dostaneme, jestliže pro náhodný výběr provedeme diskretizaci jeho hodnot pomocí zvolené škály. Parametry p i rozdělení pak odpovídají pravděpodobnostem výskytu hodnoty náhodné veličiny v příslušném intervalu škály. Nechť je X náhodná veličina, jejíž rozdělení je určeno distribuční funkcí F a X 1, X,... X n je náhodný výběr z rozdělení s danou distribuční funkcí. Rozdělíme interval, ve kterém se může daná náhodná veličina X vyskytovat na systém k disjunktních intervalů (škálu) tvaru (a 0, a 1, (a 1, a,... (a k 1, a k ). Dále označme p i = P (a i 1 < X a i ) = F (a i ) F (a i 1 ), 1 i k pravděpodobnosti výskytu náhodné veličiny X v i tém intervalu škály. Potom je np i teoretická četnost výskytu hodnot náhodného výběru v i tém intervalu škály. Jestliže si označíme n i, 1 i k empirickou četnost výskytu, t.j. počet hodnot X j z náhodného výběru, které leží v i tém intervalu škály, pak platí tvrzení: Věta: Náhodná veličina ( ) χ = k (n i np i ) má přibližně rozdělení χ (k 1). Poznámka: Hodnota χ je vlastně vážený součet čtverců odchylek empirické a teoretické četnosti, kdy je každá odchylka vážena proti své teoretické hodnotě. Pokud je náhodný výběr z rozdělení se zadanou distribuční funkcí F, pak se má tato hodnota, náhodná veličina, řídit uvedeným zákonem rozdělení. Na této skutečnosti je založen test dobré shody o druhu rozdělení, tedy o typu distribuční funkce. Uvedeme vzorec, který se někdy lépe hodí k výpočtu hodnoty χ. Je totiž χ = k (n i np i ) = k n i n i np i + (np i ) = np i np i = k n i np i k n i + k np i np i = k n i np i n. 8

27 6.13. Test dobré shody, test χ (chí kvadrát). Testujeme, že daný náhodný výběr je výběrem ze známého rozdělení. Pokud jsou parametry rozdělení (hustoty či pravděpodobnostní funkce) známy, počítáme uvedené veličiny z rozdělení, které je určeno jejich hodnotami. Pokud tyto parametry neznáme, použijeme pro ně odhady získané některou z metod hledání bodových odhadů (metoda maximální věrohodnosti či metoda momentů). Máme dán náhodný výběr X 1, X,..., X n z rozdělení se známým typem distribuční funkce (hustoty). Testujeme nulovou hypotézu H 0 : náhodný výběr je výběrem s daným rozdělením proti alternativě H 1 : náhodný výběr je výběrem z jiného rozdělení. Algoritmus testu. 1. Definiční obor náhodné veličiny X rozdělíme pomocí dělících bodů na škálu k intervalů tvaru (, a 1, (a 1, a,... (a k, a k 1, (a k 1, a k = ).. Vypočteme teoretické četnosti p i = P (a i 1 < X a i ), 1 i k a ověříme podmínku použitelnosti testu: np i 5, 1 i k, nebo np i 5q, kde q je podíl tříd, pro které je np i < 5, v případech kdy k Určíme empirické četnosti n i jako počty hodnot X j z náhodného výběru, které leží v intervalu (a i 1, a i, 1 i k a vypočteme hodnotu statistiky χ = k (n i np i ). np i 4. Pro zvolenou hladinu významnosti testu stanovíme kritický obor testu W α = {χ ; χ χ k 1(α)}, kde χ k 1(α) je kritická hodnota testu, která je rovna 1 α kvantilu rozdělení χ (k 1). 5. Je-li hodnota χ W α zamítneme nulovou hypotézu H 0 ve prospěch alternativní hypotézy H 1. V opačném případě, kdy je χ < χ k 1(α) nulovou hypotézu H 0 přijmeme. 9

28 Poznámka: Pokud použijeme místo skutečných hodnot parametrů rozdělení jejich odhadů, pak místo k 1 stupňů volnosti rozdělení χ volíme rozdělení s k m 1 stupni volnosti, kde m je počet neznámých parametrů rozdělení. Poznámka: Metoda minimálního χ se používá k zpřesnění výsledku v případě, kdy parametry roazdělení odhadujeme. Její princip je založen na tom, že hledáme hodnoty neznámých parametrů tak, aby hodnota náhodné veličiny χ ze vzorce ( ) byla minimální. Pravděpodobnosti p i jsou funkcemi parametrů rozdělení. Hodnota náhodné veličiny χ také. Hledáme, podobně jako při metodě maximální věrohodnosti, jejich hodnoty tak, aby měla funkce χ minimum. Řešení této úlohy je poměrně komplikované, zájemce odkazujeme na podrobnější učebnice matematické statistiky. Příklad: Budeme testovat hypotézu, že soubor dat pochází z rovnoměrného rozdělení. Datový soubor má hodnoty a je to počet studentů, kteří získali stejné bodové ohodnocení ve škále (0, 1,..., 1) : 158, 76, 6, 130, 135,, 8, 138, 14, 14, 111, , tedy 13 dat a v případě rovnoměrného rozdělení je p i = 1 13 = 0, a np i = = 11, 77. Pro hodnotu statistiky χ dostaneme χ = 36, 38. Pro kritické hodnoty testu z tabulek odečteme: χ (0, 05) = 1, 03, χ (0, 05) = 3, 34, χ (0, 01) = 6,. Pro všechny hladiny významnosti je hodnota testovací statistiky větší než kritická hodnota, patří tedy do kritického oboru a tudíž nulovou hypotézu H 0 zamítáme na všech hladinách. Jestliže uvažujeme podobný soubor 6, 130, 135,, 8, 138, 14, 14, 111, , pak máme skupinu 11 dat. Pro ně je p i = 1 11 = 0, a np i = = 1, 64. V tomto případě dostaneme χ = 8, 68. Kritické hodnoty testu z tabulek jsou: χ (0, 05) = 18, 31, atd. Protože je hodnota testovací statistiky χ menší než kritická hodnota testu nezamítáme hypotézu H 0 na žádné z hladin. Příklad: Testujeme pomocí testu dobré shody hypotézu H 0 : výběr je z normálního rozdělení proti alternativě H 1 : výběr není z normálního rozdělení pro soubor dat 1

29 X = {165, 170, 173, 178, 189, 176, 180, 175, 187, 184, 18, 00, 179, 18, 178, 175, 176, 176, 185, 185, 178, 183, 181, 175}; Pro výpočet teoretických četností použijeme odhady parametrů µ = X = 181, 64 a σ = s = 9, 766. Jako odhad pro interval hodnot dostaneme (147, 46; 15, 8). Pro počet dat n = 4 dostaneme pro počet tříd k = 6. Testovací statistika a kritická hodnota mají hodnoty: χ = 0, 835 a kr = χ 3(0, 05) = 7, Protože je χ < kr, hypotézu H 0 nezamítáme. Pro test dostaneme p hodnotu p = 0, Test závislosti a nezávislosti. Pro náhodné veličiny X a Y se nejčastěji k popisu závislosti používá koeficient korelace ρ(x, Y ), který je definován vztahem ρ(x, Y ) = E((X E(X))(Y E(Y ))) D(X)D(Y ) = E(XY ) E(X)E(Y ) D(X)D(Y ). Koeficient je roven nule pro nezávislé náhodné veličiny a je roven ±1 v případě lineární závislosti Y = ax + b. Pro normální rozdělení je úplnou charakteristikou závislosti náhodných veličin. Platí totiž: Jestliže má náhodný vektor (X, Y ) normální rozdělení, pak je jeho sdružená hustota dána vzorcem f(x, y) = 1 πσ 1 σ exp 1 ρ (x µ 1 ) σ 1 + (y µ ) σ (1 ρ ) ρ(x µ 1)(y µ ) σ 1 σ kde náhodná veličina X má marginální rozdělení N(µ 1 ; σ 1) a Y má marginální rozdělení N(µ 1 ; σ ) a ρ je koeficient korelace mezi X a Y. Náhodné veličiny X a Y jsou nezávislé právě když je ρ = 0. Podmíněné náhodné veličiny X y, resp.y x mají také normální rozdělení se středními hodnotami, resp. a rozptyly E(X y) = µ 1 + β 1, (y µ ), β 1 = ρ σ 1 σ E(Y x) = µ + β 1 (x µ 1 ), β 1 = ρ σ σ 1 D(X y) = σ 1(1 ρ ), resp. D(Y x) = σ (1 ρ ). 111

30 Podmíněná střední hodnota je lineární funkcí y, resp. x, a její směrnice β 1, resp. β 1, je regresní koeficinet. Podmíněný rozptyl je konstantní. Odhad závislosti či nezávislosti pro náhodné výběry provádíme pomocí výběrového koeficientu korelace, který je obdobou výběrových momentů. Výběrový koeficient korelace je definován pro dvourozměrný náhodný výběr (X i, Y i ), 1 i n jako kde S X = 1 n 1 n r(x, Y ) = S XY S X S Y, (X i X), SY = 1 n 1 S XY = 1 n 1 n n (X i X)(Y i Y ). (Y i Y ), Vztah lze úpravami, kterými jsme odvodili vyjádření pro výběrový rozptyl upravit na tvar r(x, Y ) = ( n n (X iy i ) nxy X i n(x) ) ( n Y i n(y ) ) Test závislosti či nezávislosti je založen na tomto tvrzení: Je-li (X i, Y i ), 1 i n náhodný výběr z dvourozměrného normálního rozdělení, pak má náhodná veličina (statistika) T = r 1 r n t(n ) t rozdělení s n stupni volnosti. Algoritmus testu Testovaná hypotéza: H 0 : ρ = 0 nezávislost; H 1 : ρ 0 závislost. Kritický obor W α = {T ; T > t n (α)}, kde t n (α) je kritická hodnota t testu, tedy 1 α kvantil Studentova t rozdělení o n stupních volnosti. Existují tabulky, které uvadějí kritické hodnoty r n (α) přímo pro hodnoty statistiky r. Kritický obor je pak 11

31 W α = {r; r > r n (α)}. Příklad: Pro soubory X výšek a Y vah testujme lineární závislost, jestliže: X = {165, 170, 173, 178, 189, 176, 180, 175, 187, 184, 18, 00, 179, 18, 178, 175, 176, 176, 185, 185, 178, 183, 181, 175}; Y = {7, 60, 65, 75, 9, 7, 73, 65, 70, 83, 85, 93, 70, 80, 68, 75, 78, 63, 75, 87, 61, 74, 69, 75}; Podle algoritmu testu dostaneme: koeficient korelace r XY = 0, 6883; hodnota testovací statistiky T = 4, 4499; kritická hodnota t(0, 05) =, 073, p hodnota testu p =. 4. Protože je T > t(0, 05) hypotézu o nezávislosti zamítáme a přijímáme očekávanou hypotézu, že jsou náhodné veličiny závislé Testy normality Náhodný výběr {X i ; 1 i n} je výběrem z normálního rozdělení. Uvedeme test normality rozdělení, který je založen na výběrové šikmosti a špičatosti, nebo na jejich kombinaci. Vycházíme z porovnání odhadů koeficientů šikmosti a špičatosti s jejich teoretickou hodnotou. Připomeneme: a M k = 1 n n (X i X) k, 1 k je k tý výběrový moment. A 3 = M 3 (M ) 3/ je výběrová šikmost; A 4 = M 4, resp. A 4 = M 4 3 M Pro ně platí: M E(A 3 ) = 0, D(A 3 ) = je výběrová špičatost. 6(n ) (n + 1)(n + 3) E(A 4) = 3 6 n + 1, resp. E(A 4) = 6 n + 1, D(A 4 ) = 4n(n )(n 3) (n + 1) (n + 3)(n + 5). Pro menší rozsahy výběru jsou kritické hodnoty pro statistiky A 3 a A 4 uvedeny v tabulkách. Pro větší rozsahy výběrů, n > 00 pro A 3 a 113

32 n > 500 pro A 4, lze použít aproximace normálním rozdělením, které vychází z centrální limitní věty. Počítáme s tím, že náhodné veličiny U 3 = A 3 D(A3 a U 4 = A 4 E(A 4 ) D(A 4 ) mají normované normální rozdělení. Kritické hodnoty testu nalezneme pomocí kvantilů normálního rozdělení. Kritickým oborem testů je nebo W α = {U 3 ; U 3 > u α/ }, W α {U 4 ; U 4 > u α/, kde u α je α kvantil nornálního rozdělení N(0; 1). Existuje podstatné vylepšení postupu, které se dá použít v případě výběrů menšího rozsahu. Test založený na šikmosti: Postupně vypočteme b = 3(n + 7n 70)(n + 1)(n + 3) (n )(n + 5)(n + 7)(n + 9), W = (b 1) 1, δ = a = W 1, Z 3 = δ ln U 3 a + ) ( U3 a ln W Potom má náhodná veličina Z 3 přibližně normální rozdělení N(0; 1) a hypotézu o normalitě rozdělení zamítáme v případě, že Z 3 u α/. Test se dá použít pro n > 8. Test založený na špičatosti: Postupně vypočteme B = 6(n 5n + ) (n + 7)(n + 9) 6(n + 3)(n + 5) n(n )(n 3), Z 4 = 1 9A 1 3 A 9A A = 6+ 8 B B B 1+U 4 A 4 Náhodná veličina Z 4 má přibližně normální rozdělení N(0; 1) a hypotézu o normalitě zamítáme, pokud je Z 4 u α/. Aproximace je použitelná pro n ,

33 Testy založené současně na šikmosti a špičatosti: Pro výběry kde je rozsah n > 00 můžeme použít skutečnosti, že náhodná veličina U 3 + U 4 χ má rozdělení χ o dvou stupních volnosti. Hypotézu o normalitě zamítáme, pokud je U 3 + U 4 χ (α). Pro menší rozsahy, kde n 0 lze použít skutečnosti, že má náhodná veličina Z 3 + Z 4 χ přibližně rozdělení χ o dvou stupních volnosti. Hypotézu o normalitě zamítáme, pokud je Z 3 + Z 4 χ (α). Příklad: Testujeme pomocí popsaných algoritmů normalitu rozdělení pro náhodný výběr X výšek skupiny studentu. Je Testujeme nulovou hypotézu H 0 : výběr je z normálního rozdělení proti alternativě H 1 : výběr není z normálního rozdělení. Pomocí algoritmů dostaneme: n = 4- počet dat; Pro test založený na koeficientu šikmosti: U 3 = 1, 547, Z 3 = 1, 5663, kritická hodnota u(0, 05) = 1, 96. Je U 3 < u(0, 05) a Z 3 < u(0, 05), tedy v obou případech hypotézu H 0 nezamítáme. Pro test založený na koeficientu špičatosti: U 4 =, 535 Z 4 = 1, 973, kritická hodnota u(0, 05) = 1, 96. V obou případech jsou hodnoty v kritickém oboru, tedy hypotézu H 0 zamítáme. V prvním případě máme příliš málo hodnot, pro druhou variantu vidíme, že je hodnota testovací statistiky těsně u kritické hodnoty. Pro test založený na kombinaci obou hodnot dostaneme: U 3 +U 4 = 8, 81, Z 3 +Z 4 = 6, 345 a kritická hodnota χ (0, 05) = 5, 99. Obě hodnoty přesahují kritickou hodnotu, hypotézu H 0 zamítáme. 115

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

15. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z 15. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

5. T e s t o v á n í h y p o t é z

5. T e s t o v á n í h y p o t é z 5. T e s t o v á n í h y p o t é z Na základě hodnot náhodného výběru činíme rozhodnutí o platnosti hypotézy o hodnotách parametrů rozdělení nebo o jeho vlastnostech. Rozeznáváme dva základní typy testů:

Více

1. Alternativní rozdělení A(p) (Bernoulli) je diskrétní rozdělení, kdy. p(0) = P (X = 0) = 1 p, p(1) = P (X = 1) = p, 0 < p < 1.

1. Alternativní rozdělení A(p) (Bernoulli) je diskrétní rozdělení, kdy. p(0) = P (X = 0) = 1 p, p(1) = P (X = 1) = p, 0 < p < 1. 2. Některá důležitá rozdělení Diskrétní rozdělení. Alternativní rozdělení Ap) Bernoulli) je diskrétní rozdělení, kdy náhodná veličina X nabývá pouze dvou hodnot a a pro její pravděpodobnostní funkci platí:

Více

Regresní a korelační analýza

Regresní a korelační analýza Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Regresní analýza Cíl regresní analýzy: stanovení formy (trendu, tvaru, průběhu)

Více

1. Pravděpodobnost a statistika (MP leden 2010)

1. Pravděpodobnost a statistika (MP leden 2010) 1. Pravděpodobnost a statistika (MP leden 2010) Pravděpodobnost pojmy 1. Diskrétní pravděpodobnostní prostor(definice, vlastnosti, příklad). Diskrétní pravděpodobnostní prostor je trojice(ω, A, P), kde

Více

UNIVERSITA PALACKÉHO V OLOMOUCI PŘÍRODOVĚDECKÁ FAKULTA. KATEDRA MATEMATICKÉ ANALÝZY A APLIKACÍ MATEMATIKY školní rok 2009/2010 BAKALÁŘSKÁ PRÁCE

UNIVERSITA PALACKÉHO V OLOMOUCI PŘÍRODOVĚDECKÁ FAKULTA. KATEDRA MATEMATICKÉ ANALÝZY A APLIKACÍ MATEMATIKY školní rok 2009/2010 BAKALÁŘSKÁ PRÁCE UNIVERSITA PALACKÉHO V OLOMOUCI PŘÍRODOVĚDECKÁ FAKULTA KATEDRA MATEMATICKÉ ANALÝZY A APLIKACÍ MATEMATIKY školní rok 2009/2010 BAKALÁŘSKÁ PRÁCE Testy dobré shody Vedoucí diplomové práce: RNDr. PhDr. Ivo

Více

Tématické celky { kontrolní otázky.

Tématické celky { kontrolní otázky. Tématické celky kontrolní otázky. Základy teorie pravdìpodobnosti..pravdìpodobnostní míra základní pojmy... Vysvìtlete pojem náhody, náhodného pokusu, náhodného jevu a jeho mno- ¾inovou interpretaci. Popi¹te

Více

V praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více

V praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více 9 Vícerozměrná data a jejich zpracování 9.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat, hledáme souvislosti mezi dvěmi, případně více náhodnými veličinami. V praxi pracujeme

Více

Poznámky k předmětu Aplikovaná statistika, 9.téma

Poznámky k předmětu Aplikovaná statistika, 9.téma Poznámky k předmětu Aplikovaná statistika, 9téma Princip testování hypotéz, jednovýběrové testy V minulé hodině jsme si ukázali, jak sestavit intervalové odhady pro některé číselné charakteristiky normálního

Více

2. Je dáno jevové pole (Ω;A) a na něm nezáporná normovaná funkce. Definujte distrubuční funkci náhodného vektoru.

2. Je dáno jevové pole (Ω;A) a na něm nezáporná normovaná funkce. Definujte distrubuční funkci náhodného vektoru. Varianta I 1. Definujte pravděpodobnostní funkci. 2. Je dáno jevové pole (Ω;A) a na něm nezáporná normovaná funkce. Definujte distrubuční funkci náhodného vektoru. 3. Definujte Fisher-Snedecorovo rozdělení.

Více

7. Analýza rozptylu.

7. Analýza rozptylu. 7. Analýza rozptylu. Uvedeme obecnou ideu, která je založena na minimalizaci chyby metodou nejmenších čtverců. Nejdříve uvedeme několik základních tvrzení. Uvažujeme náhodný vektor Y = (Y, Y,..., Y n a

Více

NEPARAMETRICKÉ TESTY

NEPARAMETRICKÉ TESTY NEPARAMETRICKÉ TESTY Výhodou neparametrických testů je jejich použitelnost bez ohledu na typ rozdělení, z něhož výběr pochází. K testování se nepoužívají parametry výběru (např.: aritmetický průměr či

Více

STP022 PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA

STP022 PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA Poslední aktualizace: 29. května 200 STP022 PRAVDĚPODOBNOST A MATEMATICKÁ STATISTIKA PŘÍKLADY Pro zdárné absolvování předmětu doporučuji věnovat pozornost zejména příkladům označenými hvězdičkou. Příklady

Více

(Auto)korelační funkce. 2. 11. 2015 Statistické vyhodnocování exp. dat M. Čada www.fzu.cz/ ~ cada

(Auto)korelační funkce. 2. 11. 2015 Statistické vyhodnocování exp. dat M. Čada www.fzu.cz/ ~ cada (Auto)korelační funkce 1 Náhodné procesy Korelace mezi náhodnými proměnnými má široké uplatnění v elektrotechnické praxi, kde se snažíme o porovnávání dvou signálů, které by měly být stejné. Příkladem

Více

Přehled pravděpodobnostních rozdělení

Přehled pravděpodobnostních rozdělení NSTP097Statistika Zima009 Přehled pravděpodobnostních rozdělení Diskrétní rozdělení. Alternativní(Bernoulliovo, nula-jedničkové) rozdělení X Alt(p) p (0, ) X {0,} Hustota: P[X= j]=p j ( p) j, j {0,} Středníhodnota:

Více

Teoretická rozdělení

Teoretická rozdělení Teoretická rozdělení Diskrétní rozdělení Obsah kapitoly Studijní cíle Doba potřebná ke studiu Pojmy k zapamatování Úvod Některá teoretická rozdělení diskrétních veličin: Alternativní rozdělení Binomické

Více

12. TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ

12. TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ 1. TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ Průvodce studiem Navážeme na předchozí kapitolu 11 a vysvětlíme některé statistické testy. Předpokládané znalosti Pojmy z předchozích kapitol. Cíle Cílem této kapitoly

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 10. Mgr. David Fiedor 27. dubna 2015 Nelineární závislost - korelační poměr užití v případě, kdy regresní čára není přímka, ale je vyjádřena složitější matematickou funkcí

Více

Biostatistika a matematické metody epidemiologie- stručné studijní texty

Biostatistika a matematické metody epidemiologie- stručné studijní texty Biostatistika a matematické metody epidemiologie- stručné studijní texty Bohumír Procházka, SZÚ Praha 1 Co můžeme sledovat Pro charakteristiku nebo vlastnost, kterou chceme sledovat zvolíme termín jev.

Více

12. cvičení z PST. 20. prosince 2017

12. cvičení z PST. 20. prosince 2017 1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace

Více

Rozptyl. Pozn.: rozptyl je nezávislý na posunu hustoty pravděpodobnosti na ose x, protože Var(X) mi určuje jen šířku rozdělení.

Rozptyl. Pozn.: rozptyl je nezávislý na posunu hustoty pravděpodobnosti na ose x, protože Var(X) mi určuje jen šířku rozdělení. Rozptyl Základní vlastnosti disperze Var(konst) = 0 Var(X+Y) = Var(X) + Var(Y) (nezávislé proměnné) Lineární změna jednotek Y = rx + s, například z C na F. Jak vypočítám střední hodnotu a rozptyl? Pozn.:

Více

VÍCEROZMĚRNÝ STATISTICKÝ SOUBOR

VÍCEROZMĚRNÝ STATISTICKÝ SOUBOR KORELACE A REGRESE 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č. CZ.1.07/..00/8.001)

Více

a) Základní informace o souboru Statistika: Základní statistika a tabulky: Popisné statistiky: Detaily

a) Základní informace o souboru Statistika: Základní statistika a tabulky: Popisné statistiky: Detaily Testování hypotéz Testování hypotéz jsou klasické statistické úsudky založené na nějakém apriorním předpokladu. Vyslovíme-li předpoklad o hodnotě neznámého parametru nebo o zákonu rozdělení sledované náhodné

Více

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457. 0 cvičení z PST 5 prosince 208 0 (intervalový odhad pro rozptyl) Soubor (70, 84, 89, 70, 74, 70) je náhodným výběrem z normálního rozdělení N(µ, σ 2 ) Určete oboustranný symetrický 95% interval spolehlivosti

Více

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé. 1. Korelační analýza V životě většinou nesledujeme pouze jeden statistický znak. Sledujeme více statistických znaků zároveň. Kromě vlastností statistických znaků nás zajímá také jejich těsnost (velikost,

Více

FAKULTA STAVEBNÍ MATEMATIKA II MODUL 2 STUDIJNÍ OPORY PRO STUDIJNÍ PROGRAMY S KOMBINOVANOU FORMOU STUDIA

FAKULTA STAVEBNÍ MATEMATIKA II MODUL 2 STUDIJNÍ OPORY PRO STUDIJNÍ PROGRAMY S KOMBINOVANOU FORMOU STUDIA VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FAKULTA STAVEBNÍ MATEMATIKA II MODUL KŘIVKOVÉ INTEGRÁLY STUDIJNÍ OPORY PRO STUDIJNÍ PROGRAMY S KOMBINOVANOU FORMOU STUDIA Typeset by L A TEX ε c Josef Daněček, Oldřich Dlouhý,

Více

Analýza rozptylu. Statistika II. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.

Analýza rozptylu. Statistika II. Jiří Neubauer. Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob. ANOVA Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz ANOVA ANOVA je nástroj pro zkoumání vztahu mezi vysvětlovanými a vysvětlujícími proměnnými.

Více

Funkce zadané implicitně

Funkce zadané implicitně Kapitola 8 Funkce zadané implicitně Začneme několika příklady. Prvním je známá rovnice pro jednotkovou kružnici x 2 + y 2 1 = 0. Tato rovnice popisuje křivku, kterou si však nelze představit jako graf

Více

5 Parametrické testy hypotéz

5 Parametrické testy hypotéz 5 Parametrické testy hypotéz 5.1 Pojem parametrického testu (Skripta str. 95-96) Na základě výběru srovnáváme dvě tvrzení o hodnotě určitého parametru θ rozdělení f(x, θ). První tvrzení (které většinou

Více

2 Spojité modely rozhodování

2 Spojité modely rozhodování 2 Spojité modely rozhodování Jak již víme z přednášky, diskrétní model rozhodování lze zapsat ve tvaru úlohy hodnocení variant: f(a i ) max, a i A = {a 1, a 2,... a p }, kde f je kriteriální funkce a A

Více

BAKALÁŘSKÁ PRÁCE. Numerické metody jednorozměrné minimalizace

BAKALÁŘSKÁ PRÁCE. Numerické metody jednorozměrné minimalizace UNIVERZITA PALACKÉHO V OLOMOUCI PŘÍRODOVĚDECKÁ FAKULTA KATEDRA MATEMATICKÉ ANALÝZY A APLIKACÍ MATEMATIKY BAKALÁŘSKÁ PRÁCE Numerické metody jednorozměrné minimalizace Vedoucí bakalářské práce: RNDr. Horymír

Více

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz. Pravděpodobnost a statistika, Biostatistika pro kombinované studium Letní semestr 2015/2016 Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz Jan Kracík jan.kracik@vsb.cz Obsah: Výběrová rozdělení

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

2 ) 4, Φ 1 (1 0,005)

2 ) 4, Φ 1 (1 0,005) Příklad 1 Ze zásilky velkého rozsahu byl náhodně vybrán soubor obsahující 1000 kusů. V tomto souboru bylo zjištěno 26 kusů nekvalitních. Rozhodněte, zda je možné s 99% jistotou tvrdit, že zásilka obsahuje

Více

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1 PRAVDĚPODOBNOST A STATISTIKA Neparametrické testy hypotéz čast 1 Neparametrické testy hypotéz - úvod Neparametrické testy statistických hypotéz se používají v případech, kdy neznáme rozdělení pozorované

Více

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace Intervalové odhady Interval spolehlivosti pro střední hodnotu v Nµ, σ 2 ) Situace: X 1,..., X n náhodný výběr z Nµ, σ 2 ), kde σ 2 > 0 známe měli jsme: bodové odhady odhadem charakteristiky je číslo) nevyjadřuje

Více

Skalární součin je nástroj, jak měřit velikost vektorů a úhly mezi vektory v reálných a komplexních vektorových prostorech.

Skalární součin je nástroj, jak měřit velikost vektorů a úhly mezi vektory v reálných a komplexních vektorových prostorech. Kapitola 9 Skalární součin Skalární součin je nástroj, jak měřit velikost vektorů a úhly mezi vektory v reálných a komplexních vektorových prostorech. Definice 9.1 Je-li x = (x 1,..., x n ) T R n 1 reálný

Více

10. N á h o d n ý v e k t o r

10. N á h o d n ý v e k t o r 10. N á h o d n ý v e k t o r 10.1. Definice: Náhodný vektor. Uspořádanou n tici (X 1, X 2,..., X n ) náhodných veličin X i, 1 i n, nazýváme náhodným vektorem. Poznámka: Pro jednoduchost budeme zavádět

Více

FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ. Matematika 3. RNDr. Břetislav Fajmon, PhD. Autoři textu:

FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ. Matematika 3. RNDr. Břetislav Fajmon, PhD. Autoři textu: FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Matematika 3 Garant předmětu: RNDr. Břetislav Fajmon, PhD Autoři textu: Mgr. Irena Růžičková RNDr. Břetislav Fajmon, PhD

Více

PRAVDĚPODOBNOST A STATISTIKA

PRAVDĚPODOBNOST A STATISTIKA PRAVDĚPODOBNOST A STATISTIKA Testování hypotéz Nechť X je náhodná proměnná, která má distribuční funkci F(x, ϑ). Předpokládejme, že známe tvar distribuční funkce (víme jaké má rozdělení) a neznáme parametr

Více

0. Lineární rekurence Martin Mareš, 2010-07-04

0. Lineární rekurence Martin Mareš, 2010-07-04 0 Lineární rekurence Martin Mareš, 2010-07-04 V tomto krátkém textu se budeme zabývat lineárními rekurencemi, tj posloupnostmi definovanými rekurentní rovnicí typu A n+k = c 0 A n + c 1 A n+1 + + c k 1

Více

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak.

8.1. Definice: Normální (Gaussovo) rozdělení N(µ, σ 2 ) s parametry µ a. ( ) ϕ(x) = 1. označovat písmenem U. Její hustota je pak. 8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) e, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá normované

Více

Testování statistických hypotéz

Testování statistických hypotéz Testování statistických hypotéz 1 Testování statistických hypotéz 1 Statistická hypotéza a její test V praxi jsme nuceni rozhodnout, zda nějaké tvrzeni o parametrech náhodných veličin nebo o veličině samotné

Více

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Statistika, Biostatistika pro kombinované studium. Jan Kracík Statistika, Biostatistika pro kombinované studium Letní semestr 2014/2015 Tutoriál č. 6: ANOVA Jan Kracík jan.kracik@vsb.cz Obsah: Testování hypotéz opakování ANOVA Testování hypotéz (opakování) Testování

Více

Téma 22. Ondřej Nývlt

Téma 22. Ondřej Nývlt Téma 22 Ondřej Nývlt nyvlto1@fel.cvut.cz Náhodná veličina a náhodný vektor. Distribuční funkce, hustota a pravděpodobnostní funkce náhodné veličiny. Střední hodnota a rozptyl náhodné veličiny. Sdružené

Více

Jazyk matematiky. 2.1. Matematická logika. 2.2. Množinové operace. 2.3. Zobrazení. 2.4. Rozšířená číslená osa

Jazyk matematiky. 2.1. Matematická logika. 2.2. Množinové operace. 2.3. Zobrazení. 2.4. Rozšířená číslená osa 2. Jazyk matematiky 2.1. Matematická logika 2.2. Množinové operace 2.3. Zobrazení 2.4. Rozšířená číslená osa 1 2.1 Matematická logika 2.1.1 Výrokový počet logická operace zapisujeme čteme česky negace

Více

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}. VIII. Náhodný vektor. Náhodný vektor (X, Y má diskrétní rozdělení s pravděpodobnostní funkcí p, kde p(x, y a(x + y +, x, y {,, }. a Určete číslo a a napište tabulku pravděpodobnostní funkce p. Řešení:

Více

17. Statistické hypotézy parametrické testy

17. Statistické hypotézy parametrické testy 7. Statistické hypotézy parametrické testy V této části se budeme zabývat statistickými hypotézami, pomocí vyšetřujeme jedotlivé parametry populace. K takovýmto šetřeím většiou využíváme ám již dobře zámé

Více

Prognóza poruchovosti vodovodních řadů pomocí aplikace Poissonova rozdělení náhodné veličiny

Prognóza poruchovosti vodovodních řadů pomocí aplikace Poissonova rozdělení náhodné veličiny Prognóza poruchovosti vodovodních řadů pomocí aplikace Poissonova rozdělení náhodné veličiny Ing. Jana Šenkapoulová VODÁRENSKÁ AKCIOVÁ SPOLEČNOST, a.s. Brno, Soběšická 156, 638 1 Brno ÚVOD Každé rekonstrukci

Více

Jednofaktorová analýza rozptylu

Jednofaktorová analýza rozptylu Jednofaktorová analýza rozptylu David Hampel Ústav statistiky a operačního výzkumu, Mendelova univerzita v Brně Kurz pokročilých statistických metod Global Change Research Centre AS CR, 5 7 8 2015 Tato

Více

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D.

Střední hodnota a rozptyl náhodné. kvantilu. Ing. Michael Rost, Ph.D. Střední hodnota a rozptyl náhodné veličiny, vybraná rozdělení diskrétních a spojitých náhodných veličin, pojem kvantilu Ing. Michael Rost, Ph.D. Príklad Předpokládejme že máme náhodnou veličinu X která

Více

n = 2 Sdružená distribuční funkce (joint d.f.) n. vektoru F (x, y) = P (X x, Y y)

n = 2 Sdružená distribuční funkce (joint d.f.) n. vektoru F (x, y) = P (X x, Y y) 5. NÁHODNÝ VEKTOR 5.1. Rozdělení náhodného vektoru Náhodný vektor X = (X 1, X 2,..., X n ) T n-rozměrný vektor, složky X i, i = 1,..., n náhodné veličiny. Vícerozměrná (n-rozměrná) náhodná veličina n =

Více

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y 9. T r a n s f o r m a c e n á h o d n é v e l i č i n y Při popisu procesů zpracováváme vstupní údaj, hodnotu x tak, že výstupní hodnota y závisí nějakým způsobem na vstupní, je její funkcí y = f(x).

Více

Příklady na testy hypotéz o parametrech normálního rozdělení

Příklady na testy hypotéz o parametrech normálního rozdělení Příklady na testy hypotéz o parametrech normálního rozdělení. O životnosti 75W žárovky (v hodinách) je známo, že má normální rozdělení s = 5h. Pro náhodný výběr 0 žárovek byla stanovena průměrná životnost

Více

I. D i s k r é t n í r o z d ě l e n í

I. D i s k r é t n í r o z d ě l e n í 6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme

Více

Charakterizace rozdělení

Charakterizace rozdělení Charakterizace rozdělení Momenty f(x) f(x) f(x) μ >μ 1 σ 1 σ >σ 1 g 1 g σ μ 1 μ x μ x x N K MK = x f( x) dx 1 M K = x N CK = ( x M ) f( x) dx ( xi M 1 C = 1 K 1) N i= 1 K i K N i= 1 K μ = E ( X ) = xf

Více

MSI LS 2006/2007 Ing. Pavla Hošková, Ph.D., 2. test

MSI LS 2006/2007 Ing. Pavla Hošková, Ph.D., 2. test c 2007 Kompost 1 MSI LS 2006/2007 Ing. Pavla Hošková, Ph.D., 2. test Jestliže při testování výsledek (hodnota testového kritéria) padne do kritického oboru: a) musíme nově formulovat nulovou hypotézu,

Více

Pravděpodobnost a statistika

Pravděpodobnost a statistika Pravděpodobnost a statistika Diskrétní rozdělení Vilém Vychodil KMI/PRAS, Přednáška 6 Vytvořeno v rámci projektu 2963/2011 FRVŠ V. Vychodil (KMI/PRAS, Přednáška 6) Diskrétní rozdělení Pravděpodobnost a

Více

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz Pravděpodobnost a matematická statistika 2010 1.týden (20.09.-24.09. ) Data, typy dat, variabilita, frekvenční analýza

Více

p(x) = P (X = x), x R,

p(x) = P (X = x), x R, 6. T y p y r o z d ě l e n í Poznámka: V odst. 5.5-5.10 jsme uvedli příklady náhodných veličin a jejich distribučních funkcí. Poznali jsme, že se od sebe liší svým typem. V příkladech 5.5, 5.6 a 5.8 jsme

Více

MATEMATIKA IV - PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE - ZÁPISKY Z. Obsah. 1. Parciální diferenciální rovnice obecně. 2. Kvaazilineární rovnice prvního řádu

MATEMATIKA IV - PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE - ZÁPISKY Z. Obsah. 1. Parciální diferenciální rovnice obecně. 2. Kvaazilineární rovnice prvního řádu MATEMATIKA IV - PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE - ZÁPISKY Z PŘEDNÁŠEK JAN MALÝ Obsah 1. Parciální diferenciální rovnice obecně 1. Kvaazilineární rovnice prvního řádu 1 3. Lineární rovnice druhého řádu

Více

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) cvičení z PSI 0-4 prosince 06 Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem) Z realizací náhodných veličin X a Y s normálním rozdělením) jsme z výběrů daného rozsahu obdrželi

Více

Kapitola 11. Vzdálenost v grafech. 11.1 Matice sousednosti a počty sledů

Kapitola 11. Vzdálenost v grafech. 11.1 Matice sousednosti a počty sledů Kapitola 11 Vzdálenost v grafech V každém grafu lze přirozeným způsobem definovat vzdálenost libovolné dvojice vrcholů. Hlavním výsledkem této kapitoly je překvapivé tvrzení, podle kterého lze vzdálenosti

Více

Skupina Testování obsahuje následující moduly: Síla a rozsah výběru, Testy a Kontingenční tabulka.

Skupina Testování obsahuje následující moduly: Síla a rozsah výběru, Testy a Kontingenční tabulka. Testování Menu: QCExpert Testování Skupina Testování obsahuje následující moduly: Síla a rozsah výběru, Testy a Kontingenční tabulka. Síla a rozsah výběru Menu: QCExpert Testování Síla a rozsah výběru

Více

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com) Testování statistických hypotéz Testování statistických hypotéz Princip: Ověřování určitého předpokladu zjišťujeme, zda zkoumaný výběr pochází ze základního souboru, který má určité rozdělení zjišťujeme,

Více

Náhodný pokus každá opakovatelná činnost, prováděná za stejných nebo přibližně stejných podmínek, jejíž výsledek je nejistý a závisí na náhodě.

Náhodný pokus každá opakovatelná činnost, prováděná za stejných nebo přibližně stejných podmínek, jejíž výsledek je nejistý a závisí na náhodě. Základy teorie pravděpodobnosti Náhodný pokus každá opakovatelná činnost, prováděná za stejných nebo přibližně stejných podmínek, jejíž výsledek je nejistý a závisí na náhodě. Náhodný jev jakékoli tvrzení

Více

Masarykova univerzita. Základy konvexní analýzy a optimalizace v R n.

Masarykova univerzita. Základy konvexní analýzy a optimalizace v R n. Masarykova univerzita Ondřej Došlý Základy konvexní analýzy a optimalizace v R n. První vydání Brno 2004 Došlý Ondřej Název knihy c prof. RNDr. Ondřej Došlý, DrSc., 2005 Největší životní umění je neoptimalizovat

Více

z možností, jak tuto veličinu charakterizovat, je určit součet

z možností, jak tuto veličinu charakterizovat, je určit součet 6 Charakteristiky áhodé veličiy. Nejdůležitější diskrétí a spojitá rozděleí. 6.1. Číselé charakteristiky áhodé veličiy 6.1.1. Středí hodota Uvažujme ejprve diskrétí áhodou veličiu X s rozděleím {x }, {p

Více

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004. Náhodá veličia Tyto materiály byly vytvořey za pomoci gratu FRVŠ číslo 45/004. Náhodá veličia Většia áhodých pokusů má jako výsledky reálá čísla. Budeme tedy dále áhodou veličiou rozumět proměou, která

Více

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal Základy navrhování průmyslových experimentů DOE II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal! Testování statistických hypotéz kvalitativní odezva kvantitativní chí-kvadrát test homogenity,

Více

MATEMATICKÁ STATISTIKA - XP01MST

MATEMATICKÁ STATISTIKA - XP01MST MATEMATICKÁ STATISTIKA - XP01MST 1. Úvod. Matematická statistika (statistics) se zabývá vyšetřováním zákonitostí, které v sobě obsahují prvek náhody. Zpracováním hodnot, které jsou výstupem sledovaného

Více

Analýza rozptylu. Přednáška STATISTIKA II - EKONOMETRIE. Jiří Neubauer

Analýza rozptylu. Přednáška STATISTIKA II - EKONOMETRIE. Jiří Neubauer ANOVA Přednáška STATISTIKA II - EKONOMETRIE Katedra ekonometrie FEM UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz ANOVA ANOVA je nástroj pro zkoumání vztahu mezi vysvětlovanými a vysvětlujícími

Více

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368

676 + 4 + 100 + 196 + 0 + 484 + 196 + 324 + 64 + 324 = = 2368 Příklad 1 Je třeba prověřit, zda lze na 5% hladině významnosti pokládat za prokázanou hypotézu, že střední doba výroby výlisku je 30 sekund. Přitom 10 náhodně vybraných výlisků bylo vyráběno celkem 540

Více

Lineární Regrese Hašovací Funkce

Lineární Regrese Hašovací Funkce Hašovací Funkce Mgr. Rudolf B. Blažek, Ph.D. prof. RNDr. Roman Kotecký, DrSc. Katedra počítačových systémů Katedra teoretické informatiky Fakulta informačních technologií České vysoké učení technické v

Více

Přijímací zkouška na navazující magisterské studium 2017

Přijímací zkouška na navazující magisterské studium 2017 Přijímací zkouška na navazující magisterské studium 27 Studijní program: Studijní obor: Matematika Finanční a pojistná matematika Varianta A Řešení příkladů pečlivě odůvodněte. Věnujte pozornost ověření

Více

Některé zákony rozdělení pravděpodobnosti. 1. Binomické rozdělení

Některé zákony rozdělení pravděpodobnosti. 1. Binomické rozdělení Přednáška 5/1 Některé zákony rozdělení pravděpodobnosti 1. Binomické rozdělení Předpoklady: (a) pst výskytu jevu A v jediném pokuse P (A) = π, (b) je uskutečněno n pokusů, (c) pokusy jsou nezávislé, tj.

Více

Normální (Gaussovo) rozdělení

Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení Normální (Gaussovo) rozdělení popisuje vlastnosti náhodné spojité veličiny, která vzniká složením různých náhodných vlivů, které jsou navzájem nezávislé, kterých je velký

Více

SEMESTRÁ LNÍ PRÁ CE. Licenč ní studium STATISTICKÉZPRACOVÁ NÍ DAT PŘ I KONTROLE A Ř ÍZENÍ JAKOSTI

SEMESTRÁ LNÍ PRÁ CE. Licenč ní studium STATISTICKÉZPRACOVÁ NÍ DAT PŘ I KONTROLE A Ř ÍZENÍ JAKOSTI SEMESTRÁ LNÍ PRÁ CE Licenč ní studium STATISTICKÉZPRACOVÁ NÍ DAT PŘ I KONTROLE A Ř ÍZENÍ JAKOSTI Předmě t STATISTICKÁ ANALÝ ZA JEDNOROZMĚ RNÝ CH DAT (ADSTAT) Ú stav experimentá lní biofarmacie, Hradec

Více

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky) 1) Význam a využití statistiky v biologických vědách a veterinárním lékařství ) Rozdělení znaků (veličin) ve statistice 3) Základní a

Více

MATEMATICKÁ STATISTIKA

MATEMATICKÁ STATISTIKA MATEMATICKÁ STATISTIKA 1. Úvod. Matematická statistika se zabývá vyšetřováním zákonitostí, které v sobě obsahují prvek náhody. Zpracováním hodnot, které jsou výstupem sledovaného procesu, se snažíme popsat

Více

Drsná matematika IV 7. přednáška Jak na statistiku?

Drsná matematika IV 7. přednáška Jak na statistiku? Drsná matematika IV 7. přednáška Jak na statistiku? Jan Slovák Masarykova univerzita Fakulta informatiky 2. 4. 2012 Obsah přednášky 1 Literatura 2 Co je statistika? 3 Popisná statistika Míry polohy statistických

Více

Kapka kapaliny na hladině kapaliny

Kapka kapaliny na hladině kapaliny JEVY NA ROZHRANÍ TŘÍ PROSTŘEDÍ Kapka kapaliny na hladině kapaliny Na hladinu (viz obr. 11) kapaliny (1), nad níž je plynné prostředí (3), kápneme kapku jiné kapaliny (2). Vzniklé tři povrchové vrstvy (kapalina

Více

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0. 11 cvičení z PSI 12-16 prosince 2016 111 (Test dobré shody - geometrické rozdělení Realizací náhodné veličiny X jsme dostali následující četnosti výsledků: hodnota 0 1 2 3 4 5 6 pozorovaná četnost 29 15

Více

Literatura učebnice z minulého semestru Jarošová, Pecáková sbírka příkladů pro statistiku B (2000 a novější)

Literatura učebnice z minulého semestru Jarošová, Pecáková sbírka příkladů pro statistiku B (2000 a novější) 1. přednáška Literatura učebnice z minulého semestru Jarošová, Pecáková sbírka příkladů pro statistiku B (2000 a novější) 1. Testování hypotéz H0 testovaná (nulová) hypotéza H1 alternativní hypotéza (dvoustranná,

Více

Univerzita Pardubice Fakulta Ekonomicko- správní. Testy hypotéz s využitím programu MS EXCEL. Tomáš Borůvka

Univerzita Pardubice Fakulta Ekonomicko- správní. Testy hypotéz s využitím programu MS EXCEL. Tomáš Borůvka Univerzita Pardubice Fakulta Ekonomicko- správní Testy hypotéz s využitím programu MS EXCEL Tomáš Borůvka Bakalářská práce 010 Prohlašuji: Tuto práci jsem vypracoval samostatně. Veškeré literární prameny

Více

FAKULTA STAVEBNÍ VUT V BRNĚ PŘIJÍMACÍ ŘÍZENÍ DO MNSP STAVEBNÍ INŽENÝRSTVÍ PRO AKADEMICKÝ ROK 2008 2009

FAKULTA STAVEBNÍ VUT V BRNĚ PŘIJÍMACÍ ŘÍZENÍ DO MNSP STAVEBNÍ INŽENÝRSTVÍ PRO AKADEMICKÝ ROK 2008 2009 FAKULTA STAVEBNÍ VUT V BRNĚ PŘIJÍMACÍ ŘÍZENÍ DO MNSP STAVEBNÍ INŽENÝRSTVÍ PRO AKADEMICKÝ ROK 2008 2009 OBOR: POZEMNÍ STAVBY (S) A. MATEMATIKA TEST. Hladina významnosti testu α při testování nulové hypotézy

Více

Testy. Pavel Provinský. 19. listopadu 2013

Testy. Pavel Provinský. 19. listopadu 2013 Testy Pavel Provinský 19. listopadu 2013 Test a intervalový odhad Testy a intervalové odhady - jsou vlastně to samé. Jiný je jen úhel pohledu. Lze přecházet od jednoho k druhému. Například: Při odvozování

Více

TEORIE MATIC. Tomáš Vondra

TEORIE MATIC. Tomáš Vondra TEORIE MATIC Tomáš Vondra 2 Obsah 1 Opakování 5 1.1 Základní operace s maticemi..................... 5 1.2 Determinant matice......................... 7 1.2.1 Cauchyův-Binedův vzorec..................

Více

4ST201 STATISTIKA CVIČENÍ Č. 7

4ST201 STATISTIKA CVIČENÍ Č. 7 4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické

Více

Soustavy lineárních rovnic

Soustavy lineárních rovnic 7 Matice. Determinant Soustavy lineárních rovnic 7.1 Matice Definice 1. Matice typu (m, n) jesoustavam n reálných čísel uspořádaných do m řádků a n sloupců a 11, a 12, a 13,..., a 1n a 21, a 22, a 23,...,

Více

Modely diskrétní náhodné veličiny. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.

Modely diskrétní náhodné veličiny. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Po(λ) je možné použít jako model náhodné veličiny, která nabývá hodnot 0, 1, 2,... a udává buď počet událostí,

Více

Diskrétní rozdělení Náhodná veličina má diskrétní rozdělení pravděpodobnosti, jestliže existuje seznam hodnot

Diskrétní rozdělení Náhodná veličina má diskrétní rozdělení pravděpodobnosti, jestliže existuje seznam hodnot Rozdělení Náhodná veličina Náhodná veličina je vyjádření výsledku náhodného pokusu číselnou hodnotou. Jde o reálnou funkci definovanou na množině. Rozdělení náhodné veličiny udává jakých hodnot a s jakou

Více

Využití statistických metod v medicíně (teorie informace pro aplikace VaV, vícerozměrné metody, atd.)

Využití statistických metod v medicíně (teorie informace pro aplikace VaV, vícerozměrné metody, atd.) Operační program Vzdělávání pro konkurenceschopnost Masarykova univerzita Brno Využití statistických metod v medicíně (teorie informace pro aplikace VaV, vícerozměrné metody, atd.) doc. RNDr. PhMr. Karel

Více

Zpracování a vyhodnocování analytických dat

Zpracování a vyhodnocování analytických dat Zpracování a vyhodnocování analytických dat naměřená data Zpracování a statistická analýza dat analytické výsledky Naměř ěřená data jedna hodnota 5,00 mg (bod 1D) navážka, odměřený objem řada dat 15,8;

Více

Součin matice A a čísla α definujeme jako matici αa = (d ij ) typu m n, kde d ij = αa ij pro libovolné indexy i, j.

Součin matice A a čísla α definujeme jako matici αa = (d ij ) typu m n, kde d ij = αa ij pro libovolné indexy i, j. Kapitola 3 Počítání s maticemi Matice stejného typu můžeme sčítat a násobit reálným číslem podobně jako vektory téže dimenze. Definice 3.1 Jsou-li A (a ij ) a B (b ij ) dvě matice stejného typu m n, pak

Více

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN

ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN ROZDĚLENÍ SPOJITÝCH NÁHODNÝCH VELIČIN Rovnoměrné rozdělení R(a,b) rozdělení s konstantní hustotou pravděpodobnosti v intervalu (a,b) f( x) distribuční funkce 0 x a F( x) a x b b a 1 x b b 1 a x a a x b

Více

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y

9. T r a n s f o r m a c e n á h o d n é v e l i č i n y 9. T r a n s f o r m a c e n á h o d n é v e l i č i n Při popisu procesů zpracováváme vstupní údaj, hodnotu x tak, že výstupní hodnota závisí nějakým způsobem na vstupní, je její funkcí = f(x). Pokud

Více

8. Normální rozdělení

8. Normální rozdělení 8. Normální rozdělení 8.. Definice: Normální (Gaussovo) rozdělení N(µ, 2 ) s parametry µ a > 0 je rozdělení určené hustotou ( ) f(x) = (x µ) 2 e 2 2, x (, ). Rozdělení N(0; ) s parametry µ = 0 a = se nazývá

Více