11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Podobné dokumenty
12. cvičení z PST. 20. prosince 2017

= = 2368

12. prosince n pro n = n = 30 = S X

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

4ST201 STATISTIKA CVIČENÍ Č. 7

Testy. Pavel Provinský. 19. listopadu 2013

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

PRAVDĚPODOBNOST A STATISTIKA

Testování statistických hypotéz

You created this PDF from an application that is not licensed to print to novapdf printer (

prosince oboustranný symetrický 95% interval spolehlivosti pro střední hodnotu životnosti τ. X i. X = 1 n.. Podle CLV má veličina

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

Normální (Gaussovo) rozdělení

15. T e s t o v á n í h y p o t é z

Příklady na testy hypotéz o parametrech normálního rozdělení

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

5. T e s t o v á n í h y p o t é z

15. T e s t o v á n í h y p o t é z

Testování statistických hypotéz

Poznámky k předmětu Aplikovaná statistika, 11. téma

Cvičení ze statistiky - 8. Filip Děchtěrenko

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Statistika, Biostatistika pro kombinované studium. Jan Kracík

McNemarův test, Stuartův test, Test symetrie

Testování hypotéz. 4. přednáška

Normální (Gaussovo) rozdělení

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Aproximace binomického rozdělení normálním

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Jana Vránová, 3. lékařská fakulta UK

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

2 ) 4, Φ 1 (1 0,005)

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Přednáška X. Testování hypotéz o kvantitativních proměnných

7. Analýza rozptylu.

Charakteristika datového souboru

5 Parametrické testy hypotéz

STATISTICKÉ TESTY VÝZNAMNOSTI

Stručný úvod do testování statistických hypotéz

Tomáš Karel LS 2012/2013

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Testy statistických hypotéz

Cvičení ze statistiky - 9. Filip Děchtěrenko

Test dobré shody v KONTINGENČNÍCH TABULKÁCH

PRAVDĚPODOBNOST A STATISTIKA. Testování hypotéz o rozdělení

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

ADDS cviceni. Pavlina Kuranova

Testování statistických hypotéz. Obecný postup

TECHNICKÁ UNIVERZITA V LIBERCI. Statistický rozbor dat z dotazníkového šetření

Kontingenční tabulky, korelační koeficienty

Statistické metody uţívané při ověřování platnosti hypotéz

Regrese. 28. listopadu Pokud chceme daty proložit vhodnou regresní křivku, musíme obvykle splnit tři úkoly:

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Úvod do analýzy rozptylu

STATISTICKÉ HYPOTÉZY

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Regresní analýza 1. Regresní analýza

STATISTICKÉ TESTY VÝZNAMNOSTI

V praxi pracujeme s daty nominálními (nabývají pouze dvou hodnot), kategoriálními (nabývají více

6. Testování statistických hypotéz. KGG/STG Zimní semestr 6. Testování statistických hypotéz

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Pravděpodobnost a matematická statistika

Testování statistických hypotéz

KGG/STG Statistika pro geografy

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

SEMESTRÁLNÍ PRÁCE Z PŘEDMĚTU STATISTIKY

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

KONTINGENČNÍ TABULKY Komentované řešení pomocí programu Statistica

TECHNICKÁ UNIVERZITA V LIBERCI

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Pravděpodobnost a aplikovaná statistika

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Náhodné veličiny, náhodné chyby

Výběrové charakteristiky a jejich rozdělení

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.

4EK211 Základy ekonometrie

Jednostranné intervaly spolehlivosti

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

INDUKTIVNÍ STATISTIKA

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Přijímací zkouška na navazující magisterské studium 2017

Transkript:

11 cvičení z PSI 12-16 prosince 2016 111 (Test dobré shody - geometrické rozdělení Realizací náhodné veličiny X jsme dostali následující četnosti výsledků: hodnota 0 1 2 3 4 5 6 pozorovaná četnost 29 15 10 5 3 0 2 Posud te na hladině významnosti α 005 hypotézu že náhodná veličina X má geometrické rozdělení s parametrem q 1/2 tj pravděpodobnostní funkce je p X (i q i (1 q i N 0 Veličina s geometrickým rozdělením nabývá nekonečně mnoha hodnot Test dobré shody je ale možné dělat jen s veličinou s konečně mnoha hodnotami Proto musíme některé hodnoty sloučit do jediné skupiny Zde se přirozeně nabízí udělat to pro hodnoty 6 a výše Pravděpodobnost pro tuto skupinu je pak součet pravděpodobností jednotlivých hodnot v této skupině V našem případě je P (X 6 1 P (X < 6 1 5 i0 p X (i 1 2 1 4 1 8 1 16 1 32 1 1 64 64 Při testu dobré shody porovnáváme naměřené četnosti s očekávanými četnostmi Rozsah souboru (tj počet měření je N 2915105302 64 Naší tabulku tedy zpřesníme a doplníme o teoretické pravděpodobnosti p i a teoretické (tj očekávané četnosti N p i : položka i 0 1 2 3 4 5 6 pozorovaná četnost n i 29 15 10 5 3 0 2 teoretická pravděpodobnost p i 1/2 1/4 1/8 1/16 1/32 1/64 1/64 teoretická četnost N p i 32 16 8 4 2 1 1 Další podmínkou pro test dobré shody je to aby jednotlivé položky měly TEORETICKÉ četnosti N p i 5 Pokud tomu tak není je potřeba položky vhodně sloučit tak abychom této hranice dosáhli Zde se opět nabízí udělat to pro hodnoty i 3 Původní veličinu X tedy nakonec nahradíme veličinou X popsanou následující tabulkou: položka i 0 1 2 3 pozorovaná četnost n i 29 15 10 10 teoretická pravděpodobnost p i 1/2 1/4 1/8 1/8 teoretická četnost N p i 32 16 8 8 Nyní už můžeme zformulovat naši nulovou hypotézu H 0 : pro pravděpodobnosti hodnot veličiny X platí ( p 0 p 1 p 2 p 3 2 1 4 1 8 1 8

kterou budeme testovat proti alternativní hypotéze: H 1 : pro pravděpodobnosti hodnot veličiny X platí ( p 0 p 1 p 2 p 3 2 1 4 1 8 1 8 Pro test dobré shody používáme určitou statistiku T jejíž realizace t se počítá vzorcem t i K (n i N p i 2 N p i kde K je množina položek veličiny X a k K je jejich počet Rozdělení statistiky T se pro N blíží k χ 2 (k 1-rozdělení s k 1 stupni volnosti (právě kvůli přibližnosti jsme také potřebovali teoretické četnosti 5 Kritérium pro ZAMÍTNUTÍ bude podobné jako u jednostranného testu rozptylu (protože jde opět o χ 2 -rozdělení Je tedy tvaru t > q χ 2 (k 1 (1 α zamítáme H 0 (na dané hladině α Zdůvodnění tvaru zamítacího kritéria: Máme-li správné rozdělení měly by být odchylky teoretických a naměřených četností malé a proto i hodnota statistiky T bude spíše menší Jako kritický obor si tudíž volíme opět W : (u 1 kde má platit že P (u 1 < T α Dostaneme tak že u 1 q χ 2 (k 1 (1 α protože předpokládáme že T má přibližně χ 2 -rozdělení V našem případě máme k 4 Hodnota statistiky je t a hodnota kvantilu je (29 322 32 (15 162 16 (10 82 8 (10 82 8 q χ(k 1 (1 α q χ(3 (095 7815 t 134375 7815 q χ(3 (095 134375 nulovou hypotézu H 0 pro veličinu X NEZAMÍTÁME Tento výsledek interpretujeme tak že hypotézu X má geometrické rozdělení s parametrem q 1/2 rovněž NEZAMÍTÁME 112 (Test dobré shody - rovnoměrné rozdělení Účastníci konference budou ubytováni ve čtyřpatrovém penziónu se 12 pokoji v každém patře jsou tři pokoje se dvěma lůžky Každý z N 20 účastníků poslal organizátorům nezávisle svůj požadavek čísla pokoje kde by chtěl být ubytovaný Čísla byla následující (8 12 5 4 3 5 6 12 11 2 6 4 2 12 11 9 6 7 9 9 Otestujte na hladině významnosti α 005 hypotézu H 0 : rozdělení účastníků do pater je rovnoměrné proti alternativě H 1 : rozdělení účastníků do pater není rovnoměrné Page 2

patro 1 2 3 4 čísla pokojů 1 3 4 6 7 9 10 12 Veličina X která přiřazuje účastníkovi patro ve kterém bude bydlet má 4 položky Požadavek rovnoměrného rozdělení znamená že pravděpodobnosti p i těchto položek (tj patra očíslovaná pomocí i 1 4 budou (p 1 p 2 p 2 p 4 4 1 4 1 4 4 1 Hypotézu tedy vyjádříme konkrétně: H 0 : pro pravděpodobnosti hodnot veličiny X platí (p 1 p 2 p 2 p 4 4 1 4 1 4 1 4 a alternativní hypotéza bude: H 1 : pro pravděpodobnosti hodnot veličiny X platí (p 1 p 2 p 2 p 4 4 1 4 1 4 1 4 K rozhodování použijeme χ 2 -test dobré shody Setřídíme data do skupin a vypočteme empirické četnosti n i které zapíšeme spolu s teoretickými četnostmi N p i do tabulky Ze zadání máme N 20 počet dat k 4 počet tříd a p i 1 4 1 i 4 pro rovnoměrné rozdělení číslo patra i 1 2 3 4 čísla pokojů 1 3 4 6 7 9 10 12 n i 3 7 5 5 N p i 5 5 5 5 Podmínka na teoretické četnosti 5 je splněna takže položky nemusíme slučovat Dosadíme do vzorce pro realizaci t statistiky T která má v tomto případě rozdělení přibližně χ 2 (k 1 χ 2 (3 t a porovnáme ji s kvantilem 4 (n i N p i 2 i1 N p i 1 5 (22 2 2 0 2 0 2 16 q χ 2 (k 1(1 α q χ 2 (3(095 7815 t 16 7815 q χ(3 (095 nulovou hypotézu H 0 že rozdělení účastníků do pater je rovnoměrné NEZAMÍTÁME 113 (Test dobré shody - nezávislost veličin Na N 100 lidech byla pozorována barva očí a vlasů Data jsou shrnuta v tabulce Na hladině α 5% testujte hypotézu o nezávislosti barvy očí a vlasů Oči Vlasy tmavé světlé modré 10 20 šedé 10 10 hnědé 40 10 Označme si X veličinu která přiřazuje danému člověku barvu vlasů a Y veličinu která přiřazuje témuž člověku barvu očí Budeme testovat hypotézu: Page 3

H 0 : rozdělení veličin X a Y jsou nezávislá proti alternativní hypotéze: H 1 : rozdělení veličin X a Y jsou závislá na hladině významnosti α 5% Označme si ještě pro jednoduchost obor hodnot veličiny X jako A {modré šedé hnědé} a obor veličiny Y jako B {tmavé světlé} Četnosti pro (i j A B z tabulky označme jako n ij Rozdělení veličin X ani Y neznáme a proto je odhadneme jako kde jsou marginální četnosti n ij n i j B (X i p X (i n i N p Y (j n j N n ij a n j i A n ij (Y j tmavé světlé n i modré 10 20 30 šedé 10 10 20 hnědé 40 10 50 n j 60 40 100 Za předpokladu nezávislosti veličin X a Y máme p XY (i j p X (i p Y (j Hypotézu o nezávislosti tedy můžeme přeformulovat takto H 0 : p XY (i j p X (i p Y (i pro všechna (i j A B a alternativní hypotézu jako H 1 : p XY (i j p X (i p Y (i pro alespoň jedno (i j A B Otestování hypotézy H 0 tak bude TÉMĚŘ odpovídat obvyklému testu dobré shody s předepsaným rozdělením (tentokrát pracujeme s diskrétním náhodným vektorem (X Y ale s tím rozdílem že počet stupňů volnosti bude (kvůli odhadu marginálních pravděpodobností JINÝ než by tomu bylo u obvyklého testu dobré shody se 6 položkami Počet stupňů volnosti je v tomto případě ( A 1 ( B 1 (3 1 (2 1 2 Za předpokladu H 0 pro očekávané četnosti pro jednotlivé hodnoty (i j náhodného vektoru (X Y pak bude platit že N p XY (i j N p X (i p Y (j n i n j N Tabulka pro pro tyto četnosti bude: N p XY (i j (X i (Y j tmavé světlé n i 30 60 modré 100 18 30 40 100 12 30 20 60 šedé 100 12 20 40 100 8 20 50 60 hnědé 100 30 50 40 100 20 50 n j 60 40 100 Page 4

Podmínka na teoretické (tj očekávané četnosti 5 je splněna takže položky nemusíme slučovat Pro realizaci testovací statistiky dostaneme (10 182 18 t ij ( 2 n ij N p XY (i j N p XY (i j (10 122 (40 302 (20 122 (10 82 (10 202 18 1 18056 12 30 12 8 20 18 a porovnáme ji s hodnotou kvantilu χ 2 pro (3 1 (2 1 2 stupňů volnosti q χ 2 (2(1 α q χ 2 (2(095 5992 t 18056 > 5992 q χ 2 (2(095 hypotézu o nezávislosti proto ZAMÍTÁME Page 5