12. cvičení z PST. 20. prosince 2017

Podobné dokumenty
11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

12. prosince n pro n = n = 30 = S X

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

= = 2368

prosince oboustranný symetrický 95% interval spolehlivosti pro střední hodnotu životnosti τ. X i. X = 1 n.. Podle CLV má veličina

PRAVDĚPODOBNOST A STATISTIKA

Testy. Pavel Provinský. 19. listopadu 2013

Testování statistických hypotéz

15. T e s t o v á n í h y p o t é z

5. T e s t o v á n í h y p o t é z

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Příklady na testy hypotéz o parametrech normálního rozdělení

15. T e s t o v á n í h y p o t é z

Normální (Gaussovo) rozdělení

4ST201 STATISTIKA CVIČENÍ Č. 7

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

7. Analýza rozptylu.

Normální (Gaussovo) rozdělení

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Testování hypotéz o parametrech regresního modelu

Testování hypotéz o parametrech regresního modelu

Cvičení ze statistiky - 8. Filip Děchtěrenko

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

Statistika, Biostatistika pro kombinované studium. Jan Kracík

4EK211 Základy ekonometrie

You created this PDF from an application that is not licensed to print to novapdf printer (

Regresní analýza 1. Regresní analýza

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

Aproximace binomického rozdělení normálním

Charakteristika datového souboru

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Testování statistických hypotéz. Obecný postup

Testování statistických hypotéz

STATISTICKÉ TESTY VÝZNAMNOSTI

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Jana Vránová, 3. lékařská fakulta UK

Testování statistických hypotéz

Stručný úvod do testování statistických hypotéz

X = x, y = h(x) Y = y. hodnotám x a jedné hodnotě y. Dostaneme tabulku hodnot pravděpodobnostní

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

t-test, Studentův párový test Ing. Michael Rost, Ph.D.

Téma 22. Ondřej Nývlt

Cvičení ze statistiky - 9. Filip Děchtěrenko

ADDS cviceni. Pavlina Kuranova

Testy statistických hypotéz

5 Parametrické testy hypotéz

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

2 ) 4, Φ 1 (1 0,005)

Poznámky k předmětu Aplikovaná statistika, 11. téma

Přednáška X. Testování hypotéz o kvantitativních proměnných

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

Úvod do analýzy rozptylu

Tomáš Karel LS 2012/2013

Jednofaktorová analýza rozptylu

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

KGG/STG Statistika pro geografy

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Pravděpodobnost a matematická statistika

Výběrové charakteristiky a jejich rozdělení

Tomáš Karel LS 2012/2013

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

1. Náhodný vektor (X, Y ) má diskrétní rozdělení s pravděpodobnostní funkcí p, kde. p(x, y) = a(x + y + 1), x, y {0, 1, 2}.

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

Matematické modelování Náhled do ekonometrie. Lukáš Frýd

Testování hypotéz. 4. přednáška

TECHNICKÁ UNIVERZITA V LIBERCI

STATISTICKÉ TESTY VÝZNAMNOSTI

6. T e s t o v á n í h y p o t é z

Neparametrické metody

Vybrané partie z biostatistiky

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

Náhodné veličiny, náhodné chyby

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

McNemarův test, Stuartův test, Test symetrie

Úvod do teorie odhadu. Ing. Michael Rost, Ph.D.

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

jevu, čas vyjmutí ze sledování byl T j, T j < X j a T j je náhodná veličina.

Kontingenční tabulky, korelační koeficienty

Zápočtová práce STATISTIKA I

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Statistické metody uţívané při ověřování platnosti hypotéz

Ing. Michael Rost, Ph.D.

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

STATISTICKÉ HYPOTÉZY

KGG/STG Statistika pro geografy

Transkript:

1 cvičení z PST 0 prosince 017 11 test rozptylu normálního rozdělení Do laboratoře bylo odesláno n = 5 stejných vzorků krve ke stanovení obsahu alkoholu X v promilích alkoholu Výsledkem byla realizace x = 08 1 06 14 09 Posud te na hladině významnosti α = 005 zda směrodatná odchylka měření je nejvýše σ 0 = 01 promile alkoholu Předpokládejte že obsah alkoholu X má normální rozdělení a jednotlivá měření jsou nezávislá Naše veličina X udávající obsah alkoholu v krvi v promilích má normální rozdělení Nµ σ Místo testu směrodatné odchylky σ budeme ekvivalentně testovat rozptyl σ a sice nulovou hypotézu tvaru H 0 : σ 01 = σ 0 proti alternativní hypotéze: H 1 : σ > 01 na hladině významnosti α = 005 Tentokrát budeme používat statistiku T = n 1 S X σ 0 která má pro případ σ = σ 0 tzv χ -rozdělení s n 1 stupni volnosti Obecněji teprve veličina σ 0 σ T bude mít χ -rozdělení Za předpokladu nulové hypotézy tj pro 0 σ σ 0 budou očekávané hodnoty statistiky T především v intervalu 1 ve skutečnosti to bude jen interval 0 1 protože T je nezáporná veličina Kritický obor tak bude W : q χ n 11 α a kritérium pro ZAMÍTNUTÍ proto bude tvaru t > q χ n 1 1 α zamítáme H 0 na dané hladině α Dosadíme opět konkrétní hodnoty: s x = 1 n 1 x = Realizace testovací statistiky je 08 + 1 + 06 + 14 + 09 5 = 47 5 = 094 x i x = 014 + 006 + 034 + 046 + 004 4 = 035 4 = 0088 t = n 1 s x σ 0 = 4 0088 01 = 35

a hodnota kvantilu je q χ n 1 1 α = q χ 4095 = 949 t = 35 949 = q χ 4095 nulovou hypotézu ZAMÍTÁME Zdůvodnění tvaru kritického oboru: Opět si vyznačme závislost X a T na parametru σ jako Kritický obor má být tvaru T σ = n 1S X σ σ 0 W : u 1 kde požadujeme aby u 1 R bylo nejmenší takové aby chyba 1 druhu byla nejvýše α tj 0 σ σ 0 P T σ W = P u 1 < T σ α Opět případ σ = σ 0 je za předpokladu H 0 ten nejhorší možný jak je vidět z následujícího: σ σ 0 T σ = σ σ 0 }{{} 1 P u 1 < T σ P u 1 < n 1S X σ n 1S X σ σ n 1S X σ σ }{{ } χ rozdělení = 1 F χ n 1 u 1 = P u 1 < T σ0 σ Vidíme tedy že P u 1 < T σ P u 1 < T σ0 a hledané u 1 tak musí splňovat P u 1 < T σ0 = α tedy a kritický obor je tak skutečně tvaru W : u 1 = q χ n 11 α q χ n 1 1 α 1 test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem Z realizací náhodných veličin X a Y s normálním rozdělením jsme z výběrů daného rozsahu obdrželi tyto realizace odhadů: X Y m = 11 n = 1 x = 10 y = 1 s x = s y = 3 Posud te na hladině významnosti α = 005 hypotézu že střední hodnoty náhodných veličin X a Y jsou stejné Současně zkontrolujte zda je možné použít potřebné předpoklady Abychom mohli použít test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem měli bychom nejdříve otestovat zda obě veličiny stejný rozptyl skutečně mají Test stejného rozptylu: Předpokládáme že veličiny X a Y jsou nezávislé s normálními rozděleními po řadě Nµ 1 σ 1 s Nµ σ Jednotlivá měření pro X a Y považujeme všechna navzájem za nezávislá Page

Budeme testovat nulovou hypotézu o rovnosti rozptylů H 0 : σ1 = σ proti alternativní hypotéze H 1 : σ1 σ Testovací statistika je T = S X S Y a má za předpokladu σ 1 = σ tzv Fisherovo-Snedecorovo F m 1 n 1 - rozdělení s m 1 a n 1 stupni volnosti v tomto pořadí! Za předpokladu nulové hypotézy H 0 je očekávaná hodnota statistiky T rovna 1 a kritický obor tak podobně jako v některých předchozích příkladech bude W : α q F m 1n 1 q F m 1n 1 1 α Kritérium pro ZAMÍTNUTÍ je proto tvaru [ α t < q F m 1n 1 nebo q F m 1n 1 1 α ] < t zamítáme H 0 na dané hladině α Realizace testovací statistiky je t = s x s y = 4 9 = 0 444 a hodnoty kvantilů jsou α q F m 1n 1 = q F 100 005 = 1 q F 010 0975 = 1 34 = 094 a q F m 1n 1 1 α = q F 100 0975 = 77 t = 0444 094 77 hypotézu H 0 že X a Y mají stejný rozptyl NEZAMÍTÁME Test rovnosti středních hodnot se stejným neznámým rozptylem: Předpokládáme že veličiny X a Y jsou nezávislé s normálními rozděleními po řadě Nµ 1 σ s Nµ σ Tento předpoklad je podložen předchozím testem rovnosti rozptylů který jsme nezamítli Jednotlivá měření pro X a Y považujeme opět všechna navzájem za nezávislá Budeme testovat nulovou hypotézu o rovnosti středních hodnot H 0 : µ 1 = µ proti alternativní hypotéze H 1 : µ 1 µ Page 3

Testovací statistika je kde T = X Y S 1/m + 1/n S = m 1 m + n S X + n 1 m + n S Y je vážený odhad rozptylu Za předpokladu nulové hypotézy H 0 tj µ 1 = µ má statistika T Studentovo tm + n -rozděleni s m + n stupni volnosti Kritérium pro ZAMÍTNUTÍ bude proto očekávatelně tvaru t > q tm+n 1 α zamítáme H 0 na dané hladině α a Po dosazení máme Hodnota kvantilu je s = m 1s x + n 1s y m + n x y t = s 1/m + 1/n = 10 1 3 = 10 + 0 3 10 + 0 1 11 + 1 1 = 3 = 3 4 7 = 1984 q tm+n 1 α = q t30 0975 = 04 t = 1984 04 = q tm+n 1 α hypotézu H 0 ze X a Y mají stejnou střední hodnotu také NEZAMÍTÁME 13 párový pokus U n = 8 praváků jsme změřili délku prostředníčku na pravé a levé ruce hodnoty v milimetrech uvádí tabulka Levá 81 74 90 84 77 67 59 70 Pravá 84 76 89 85 80 69 58 68 Na hladině významnosti α = 5% posud te hypotézu že praváci mají delší prostředníček na levé ruce a uved te předpoklady Označme si jako veličinu X délku prostředníčku na levé ruce a jako veličinu Y délku prostředníčku na pravé ruce u téhož člověka zde navíc praváka Pokud na jednom subjektu provádíme měření více veličin zde X a Y pak už jejich vzájemné hodnoty nemůžeme považovat za nezávislé Za nezávislá ovšem samozřejmě považujeme měření dvojice veličin X Y tj náhodného vektoru u různých lidí U veličiny := X Y která představuje rozdíly mezi veličinami můžeme přirozeně předpokládat normální rozdělení Nµ σ nebot jde o odchylky které obvykle tuto vlastnost mají Máme tedy nezávislá měření s hodnotami δ = x 1 y 1 x n y n a naše původní hypotéza EX EY lze ekvivalentně vyjádřit pomocí 0 EX EY = E = µ jako nulová hypotéza Page 4

H 0 : µ 0 kterou otestujeme proti alternativní hypotéze H 1 : µ < 0 na hladině významnosti α = 5% Půjde tedy o obvyklý test střední hodnoty veličiny s normálním rozdělením při neznámém rozptylu Použijeme tudíž statistiku T = S n a kritérium pro ZAMÍTNUTÍ bude tvaru t < q tn 1 α zamítáme H 0 na dané hladině α Určíme si hodnoty realizace δ veličiny = X Y x 81 74 90 84 77 67 59 70 y 84 76 89 85 80 69 58 68 δ = x y -3-1 -1-3 - 1 Spočteme její výběrový průměr a rozptyl pro n = 8: δ = 7 8 = 0875 s δ = 1 n 1 15 δ i δ = = 38393 56 určíme realizaci statistiky t = δ s δ n = 7 7 15 = 163 a příslušný kvantil q tn 1 α = q tn 1 1 α = q t7 095 = 1895 t = 163 1895 = q t7 005 nulovou hypotézu že praváci mají delší levý prostředníček než pravý NEZAMÍTÁME 14 test nekorelovanosti dvou výběrů z normálních rozdělení Pro realizace X 15 30 7 9 Y 10 6 8 4 8 náhodných výběrů z veličin X Y testujte na hladině významnosti α = 5 % jejich korelovanost Testujeme hypotézu o koeficientu korelace ϱx Y mezi náhodnými veličinami X a Y H 0 : ϱx Y = 0 tj náhodné veličiny X a Y jsou nekorelované proti alternativní hypotéze Page 5

H 1 : ϱx Y 0 tj náhodné veličiny X a Y jsou korelované K testování použijeme výběrový koeficient korelace RX Y a testovou statistiku T = RX Y n 1 R X Y která má Studentovo rozdělení tn kde n je rozsah výběrů Realizaci rx y výběrového koeficientu korelace RX Y vypočteme ze vzorce n n x i y i x i y i rx y = n n x i x i n n yi y i Za předpokladu nulové hypotézy H 0 tj ϱx Y = 0 je očekávaná hodnota statistiky T rovna 0 Kritérium pro ZAMÍTNUTÍ proto podobně jako pro některé předchozí testy bude tvaru t > q tn 1 α zamítáme H 0 na dané hladině α Je n = 5 x i = 13 y i = 36 x i = 3 179 yi = 80 x i y i = 890 Po dosazení hodnot dostaneme rx y = 4450 448 766 104 = 11 4979 = 007794 t = rx y n 363 1 r x y = = 01354 19795 Z tabulek nalezneme kvantil q tn 1 α = q t3 0975 = 318 t = 01354 318 = q t3 0975 hypotézu H 0 NEZAMÍTÁME 15 test dobré shody - geometrické rozdělení Realizací náhodné veličiny X jsme dostali následující četnosti výsledků: hodnota 0 1 3 4 5 6 pozorovaná četnost 9 15 10 5 3 0 Posud te na hladině významnosti α = 005 hypotézu že náhodná veličina X má geometrické rozdělení s parametrem q = 1/ tj pravděpodobnostní funkce je p X i = q i 1 q i N 0 Page 6

Veličina s geometrickým rozdělením nabývá nekonečně mnoha hodnot Test dobré shody je ale možné dělat jen s veličinou s konečně mnoha hodnotami Proto musíme některé hodnoty sloučit do jediné skupiny Zde se přirozeně nabízí udělat to pro hodnoty 6 a výše Pravděpodobnost pro tuto skupinu je pak součet pravděpodobností jednotlivých hodnot v této skupině V našem případě je P X 6 = 1 P X < 6 = 1 5 i=0 1 p X i = 1 + 1 4 + 1 8 + 1 16 + 1 3 + 1 = 1 64 64 Při testu dobré shody porovnáváme naměřené četnosti s očekávanými četnostmi Rozsah souboru tj počet měření je N = 9+15+10+5+3+0+ = 64 Naší tabulku tedy zpřesníme a doplníme o teoretické pravděpodobnosti p i a teoretické tj očekávané četnosti N p i : položka i 0 1 3 4 5 6 pozorovaná četnost n i 9 15 10 5 3 0 teoretická pravděpodobnost p i 1/ 1/4 1/8 1/16 1/3 1/64 1/64 teoretická četnost N p i 3 16 8 4 1 1 Další podmínkou pro test dobré shody je to aby jednotlivé položky měly TEORETICKÉ četnosti N p i 5 Pokud tomu tak není je potřeba položky vhodně sloučit tak abychom této hranice dosáhli Zde se opět nabízí udělat to pro hodnoty i 3 Původní veličinu X tedy nakonec nahradíme veličinou X popsanou následující tabulkou: položka i 0 1 3 pozorovaná četnost n i 9 15 10 10 teoretická pravděpodobnost p i 1/ 1/4 1/8 1/8 teoretická četnost N p i 3 16 8 8 Nyní už můžeme zformulovat naši nulovou hypotézu H 0 : pro pravděpodobnosti hodnot veličiny X platí p 0 p 1 p p 3 = 1 1 4 1 8 1 8 kterou budeme testovat proti alternativní hypotéze: H 1 : pro pravděpodobnosti hodnot veličiny X platí p 0 p 1 p p 3 1 1 4 1 8 1 8 Pro test dobré shody používáme určitou statistiku T jejíž realizace t se počítá vzorcem t = i K n i N p i N p i kde K je množina položek veličiny X a k = K je jejich počet Rozdělení statistiky T se pro N blíží k χ k 1-rozdělení s k 1 stupni volnosti právě kvůli přibližnosti jsme také potřebovali teoretické četnosti 5 Kritérium pro ZAMÍTNUTÍ bude podobné jako u jednostranného testu rozptylu protože jde opět o χ -rozdělení Je tedy tvaru t > q χ k 1 1 α zamítáme H 0 na dané hladině α Page 7

Zdůvodnění tvaru zamítacího kritéria: Máme-li správné rozdělení měly by být odchylky teoretických a naměřených četností malé a proto i hodnota statistiky T bude spíše menší Jako kritický obor si tudíž volíme opět W : u 1 kde má platit že P u 1 < T = α Dostaneme tak že u 1 = q χ k 1 1 α protože předpokládáme že T má přibližně χ -rozdělení V našem případě máme k = 4 Hodnota statistiky je t = a hodnota kvantilu je 9 3 3 + 15 16 16 + 10 8 8 + 10 8 8 q χk 1 1 α = q χ3 095 = 7815 t = 134375 7815 = q χ3 095 = 134375 nulovou hypotézu H 0 pro veličinu X NEZAMÍTÁME Tento výsledek interpretujeme tak že hypotézu X má geometrické rozdělení s parametrem q = 1/ rovněž NEZAMÍTÁME 16 test dobré shody - rovnoměrné rozdělení Účastníci konference budou ubytováni ve čtyřpatrovém penziónu se 1 pokoji v každém patře jsou tři pokoje se dvěma lůžky Každý z N = 0 účastníků poslal organizátorům nezávisle svůj požadavek čísla pokoje kde by chtěl být ubytovaný Čísla byla následující 8 1 5 4 3 5 6 1 11 6 4 1 11 9 6 7 9 9 Otestujte na hladině významnosti α = 005 hypotézu H 0 : rozdělení účastníků do pater je rovnoměrné proti alternativě H 1 : rozdělení účastníků do pater není rovnoměrné patro 1 3 4 čísla pokojů 1 3 4 6 7 9 10 1 Veličina X která přiřazuje účastníkovi patro ve kterém bude bydlet má 4 položky Požadavek rovnoměrného rozdělení znamená že pravděpodobnosti p i těchto položek tj patra očíslovaná pomocí i = 1 4 budou p 1 p p p 4 = 1 4 1 4 1 4 4 1 Hypotézu tedy vyjádříme konkrétně: H 0 : pro pravděpodobnosti hodnot veličiny X platí p 1 p p p 4 = 1 4 1 4 1 4 1 4 a alternativní hypotéza bude: H 1 : pro pravděpodobnosti hodnot veličiny X platí p 1 p p p 4 1 4 1 4 1 4 1 4 K rozhodování použijeme χ -test dobré shody Setřídíme data do skupin a vypočteme empirické četnosti n i které zapíšeme spolu s teoretickými četnostmi N p i do tabulky Ze zadání máme N = 0 počet dat k = 4 počet tříd a p i = 1 4 1 i 4 pro rovnoměrné rozdělení Page 8

číslo patra i 1 3 4 čísla pokojů 1 3 4 6 7 9 10 1 n i 3 7 5 5 N p i 5 5 5 5 Podmínka na teoretické četnosti 5 je splněna takže položky nemusíme slučovat Dosadíme do vzorce pro realizaci t statistiky T která má v tomto případě rozdělení přibližně χ k 1 = χ 3 t = a porovnáme ji s kvantilem 4 n i N p i N p i = 1 5 + + 0 + 0 = 16 q χ k 11 α = q χ 3095 = 7815 t = 16 7815 = q χ3 095 nulovou hypotézu H 0 že rozdělení účastníků do pater je rovnoměrné NEZAMÍTÁME 17 test dobré shody - nezávislost veličin Na N = 100 lidech byla pozorována barva očí a vlasů Data jsou shrnuta v tabulce Na hladině α = 5% testujte hypotézu o nezávislosti barvy očí a vlasů Vlasy Oči tmavé světlé modré 10 0 šedé 10 10 hnědé 40 10 Označme si X veličinu která přiřazuje danému člověku barvu očí a Y veličinu která přiřazuje témuž člověku barvu vlasů Budeme testovat hypotézu: H 0 : rozdělení veličin X a Y jsou nezávislá proti alternativní hypotéze: H 1 : rozdělení veličin X a Y jsou závislá na hladině významnosti α = 5% Označme si ještě pro jednoduchost obor hodnot veličiny X jako A = {modré šedé hnědé} a obor veličiny Y jako B = {tmavé světlé} Četnosti pro i j A B z tabulky označme jako n ij Rozdělení veličin X ani Y neznáme a proto je odhadneme jako p X i = n i N kde n i = j B p Y j = n j N n ij a n j = i A n ij Page 9

jsou marginální četnosti n ij X = i Y = j tmavé světlé n i modré 10 0 30 šedé 10 10 0 hnědé 40 10 50 n j 60 40 100 Za předpokladu nezávislosti veličin X a Y máme p XY i j = p X i p Y j Hypotézu o nezávislosti tedy můžeme přeformulovat takto H 0 : p XY i j = p X i p Y i pro všechna i j A B a alternativní hypotézu jako H 1 : p XY i j p X i p Y i pro alespoň jedno i j A B Otestování hypotézy H 0 tak bude TÉMĚŘ odpovídat obvyklému testu dobré shody s předepsaným rozdělením tentokrát pracujeme s diskrétním náhodným vektorem X Y ale s tím rozdílem že počet stupňů volnosti bude kvůli odhadu marginálních pravděpodobností JINÝ než by tomu bylo u obvyklého testu dobré shody se 6 položkami Počet stupňů volnosti je v tomto případě A 1 B 1 = 3 1 1 = Za předpokladu H 0 pro očekávané četnosti pro jednotlivé hodnoty i j náhodného vektoru X Y pak bude platit že N p XY i j = N p X i p Y j = n i n j N Tabulka pro pro tyto četnosti bude: N p XY i j X = i Y = j tmavé světlé n i 30 60 modré 100 = 18 30 40 100 = 1 30 0 60 šedé 100 = 1 0 40 100 = 8 0 50 60 hnědé 100 = 30 50 40 100 = 0 50 n j 60 40 100 Podmínka na teoretické tj očekávané četnosti 5 je splněna takže položky nemusíme slučovat Pro realizaci testovací statistiky dostaneme t = ij n ij N p XY i j N p XY i j = = 10 18 18 10 1 40 30 0 1 10 8 10 0 + + + + + = 18+ 1 = 18056 1 30 1 8 0 18 Page 10

a porovnáme ji s hodnotou kvantilu χ pro 3 1 1 = stupňů volnosti q χ 1 α = q χ 095 = 599 t = 18056 > 599 = q χ 095 hypotézu o nezávislosti proto ZAMÍTÁME Page 11