0. Kotigečí tabulky 0.1 Úvodí ifomace V axi e velmi častá situace, kdy vyšetřueme aedou dva statistické zaky, kteé sou svou ovahou diskétí kvatitativí( maí řesě staoveý koečý očet všech možostí ); soité kvatitativí, ale s hodotami sloučeými do skui ebo kvalitativí. Po účely této kaitoly eí odstaté, zda de o zaky tyu kvatitativího ebo kvalitativího. Takováto situace vziká aříklad tehdy, když a edom obektu sledueme aedou dva zaky. Jestliže e aříklad základím souboem možia studetů, otom ede zak může být ohlaví ( možosti ), duhý zak zalosti z matematiky ( tyto zalosti oisueme slově icméě teto ois e tyu odiáího ). Po další otřebu oíšeme aši situaci ásledově : Máme k disozici výbě o vcích. Předokládeme, že zkoumáme teto výbě omocí statistického zaku X, kteý může abývat hodot 1,,,c a statistického zaku Y, kteý může abývat hodot 1,,,. Ozačíme P i = P(X=i;Y=) (0.1) Dále ozačíme i. = P(X=i) = i = 1,. = c i i= 1 (0.) Výše uvedeý výbě lze osat multiomickým ozděleím ( viz kaitola o chi kvadát metodě ) o x c třídách tvořeých dvoicemi ( i, ). Ozačíme li i ako očet těch říadů, kdy v ašem výběu e X = i a záoveň Y =, můžeme výsledky výběu shout do íže uvedeé tabulky : Y X 1 c 1 11 1 1c 1. 1 c. 1 c. Tabulka 1 - Rozvžeí statistických zaků X, Y.1..c V osledí řádce a osledím slouci sou uvedey ásleduící hodoty c c c i. = i. =, = 1 i= 1 i= 1 = 1 i= 1 = 1 i = i. =. =, (0.3) výše uvedeé hodoty i. a. se azývaí magiálí četosti.po další áci eí odstaté, že máme edotlivé třídy ozačey čísly. Tato čísla maí e omocý chaakte. V obecém říadě mohou mít edotlivé třídy běžé ázvy, začeí čísly odžíme z důvodů větší řehledosti. Při áci s kotigečími tabulkami se velmi často setkáváme s oblémy, kdy e třeba ozhodout o ezávislosti obou statistických zaků, o říadé shodosti stuktuy i
obou zaků ( homogeitě ) ebo o symetii stuktuy u čtvecových kotigečích tabulek. Pávě tyto základí oblémy budeme řešit v ásleduících edotlivých částech. 0. Test o ezávislosti edotlivých statistických zaků Jedou z ečastěších úloh e ovedeí testu hyotézy, že áhodé veličiy X a Y sou a sobě ezávislé. Základím tvzeím, kteé budeme dále využívat e ásleduící. Věta 0.1 Veličiy X a Y sou ezávislé ávě, když latí hodoty i,. Důkaz : Poechávám čteáři. i i. =.., o všechy říusté Zameá to, že hyotéza o ezávislosti e tedy ekvivaletí s hyotézou: H 0 : i i. =.., i = 1,,c ; = 1,, (0.4) Celkový očet ezámých aametů eí tedy x c, ale e meší ež toto číslo, e ove + c. Ovšem edotlivé avděodobosti i.;. esou ezávislé viz (0.).Je tedy celkový očet ezámých aametů ove + c, otože ede z říslušých ezámých aametů lze ze vztahu (0.) sočítat! Přitom se samozřemě omezueme a říady, že hodota magiálích avděodobostí e kladá, kdyby tomu tak ebylo, mohli bychom takové řádky ebo slouce vyechat. Za ředokladu latosti hyotézy H 0 e možo odvodit, že mezi edotlivými magiálími četostmi a magiálími avděodobostmi latí ásleduící vztahy i. i... c. c... = 0, = 0, i = 1,, c i = 1,, (0.5) Z těchto vztahů e možo odvodit, že c.. =, = (0.6) c.. Odtud získáme odhad o a ^ c.. ^ c.. c. = a. (0.7) Z odhadů (0.7) získáme dosazeím do (0.5) odhady o edotlivé avděodobosti ^. ^ i. i. =. =, = 1,,, i = 1,, c (0.8)
Podle kaitoly o testech tyu chí kvadát, e ásleduící áhodá veličia i... ( ) c i ozoovaáčetost očekávaáčetost = χ = (0.9) očekávaáčetost i= = i 1 1... asymtoticky ozděleí χ, ehož očet stuňů volosti e ove x c - (+c-) 1 = x c c 1 = ( 1) x (c 1). Tedy závěem : Při zišťováí ezávislosti dvou statistických zaků ( áhodých veliči ) oužíváme χ - test, estliže e hodota testové veličiy χ χ ( 1).( c 1) ( α), zamítáme hyotézu H 0 o ezávislosti áhodých veliči X a Y. Potože teto oces fugue asymtoticky, ožadueme odobě ako v klasickém χ - testu, aby všechy očekávaé i... četosti ( teoetické četosti) byly větší ež 5. Neí li tato odmíka slěa, soueme řádky a slouce tak, abychom tuto odmíku slili. Příklad 0. U 6800 mužů byla zišťováa bava očí a bava vlasů ( viz Yule a Kedall 1950 ). Výsledky sou uvedey v ásleduící tabulce: Bava očí Bava vlasů Svělá Kaštaová Čeá Zzavá Světle modá 1768 807 189 47 811 Šedá ebo zeleá 946 1387 746 53 313 Tmavohědá 115 438 88 16 857 Celkem 89 63 13 116 6800 Tabulka - Bava očí a vlasů Zistěte, zda bava očí a vlasů u mužů sou ezávislé statistické zaky! Řešeí: K tabulce vytvoříme tabulku teoetických ( očekávaých četostí ): Bava očí Bava vlasů Svělá Kaštaová Čeá Zzavá Světle modá 1169,459 1088,04 505,5666 47,9535 811 Šedá ebo zeleá 1303,004 11,68 563,994 53,484 313 Tmavohědá 356,537 331,70941 154,134 14,61941 857 Celkem 89 63 13 116 6800 Tabulka 3 - Očekávaé četosti Potože žádá z očekávaých četostí eí meší ež 5, můžeme řistouit k výočtu edotlivých čleů v součtu (0.9). Po edoduchost e oět uvedeme v tabulce:
Bava očí Bava vlasů Svělá Kaštaová Čeá Zzavá Světle modá 306,33978 7,584504 198, 0,018914 Šedá ebo zeleá 97,8139 5,185177 59,5713 0,00343 Tmavohědá 163,63011 34,058995 116,63 0,130376 1073,5076 χ = Tabulka 4 - Vyočteé hodoty testové statistiky Hodota testové statistiky χ =1073,507564. Hodota kitická e ova 1,591577. Potože hodota testové statistiky leží v kitickém obou zamítáme hyotézu H 0 o ezávislosti obou statistických zaků. Příklad 0.3 V áhodém výběu 50 studetů byl zišťová vztah mezi zámkou ze statistiky a zalostí áce a očítači. Výsledky sou oět o řehledost uvedey v ásleduící tabulce: Zámka ze statistiky 1 3 4 Ovládáí výočetí techiky Tabulka 5 - Data o říklad 0.3 vyikaící 7 3 0 1 11 ůměé 5 6 15 odůměé 1 3 7 0 11 žádé 1 0 4 8 13 Celkem 11 11 17 11 50 Řešeí: Oět odobě ako v ředchozím říadě vytvoříme ostuě dvě tabulky s omocými výočty: Ovládáí výočetí techiky Zámka ze statistiky 1 3 4 vyikaící,4,4 3,74,4 11 ůměé 3,3 3,3 5,1 3,3 15 odůměé,4,4 3,74,4 11 žádé,86,86 4,4,86 13 Celkem 11 11 17 11 50 Tabulka 6 - Očekávaé četosti v tabulce 5 Posledí tabulkou, kteou vytvoříme o teto říklad e tabulka hodot, kteé se obevuí v součtu (0.9). Tetokát ale e zřemé, že hodoty očekávaé sou meší ež 5, oto budeme ěkteé slouce a řádky sedocovat.
Nedříve sme sloučili e hodoty slouců 1, a dále hodoty slouců 3,4. Tím sme získali íže uvedeou tabulku. Zámka ze statistiky 1-3 - 4 Ovládáí výočetí techiky vyikaící 4,84 6,16 11 ůměé 6,6 8,4 15 odůměé 4,84 6,16 11 žádé 5,7 7,8 13 Celkem 8 50 Tabulka 7 - Sloučeí dvou slouců Potože však hodoty očekávaých četostí v této tabulce 7 i adále v ěkteých buňkách eřesahuí 5, musíme eště ovést sloučeí řádek kokétě řádky vyikaící a ůměé, a dále řádek odůměé a žádé. Získáme ásleduící tabulku: Zámka ze statistiky 1-3 - 4 Ovládáí výočetí techiky vy - ům Tabulka 8 - Maximálí sloučeí tříd 11,44 14,56 10,56 13,44 od - žádé 4 Celkem 8 50 Nyí iž můžeme sočítat hodotu testové fukce, eště uvedeme tabulku skutečých četostí o sloučeí: 6 Zámka ze statistiky 1-3 - 4 Ovládáí výočetí techiky vy - ům 17 9 5 19 od - žádé 4 Celkem 8 50 Tabulka 9 - Skutečé četosti o sloučeí Nyí iž můžeme sado zistit hodotu testové statistiky χ =10, 0597, otože hodota 5% kvatilu ozděleí chí kvadát o edom stui volosti e ove 3,8415. 6 0.3 Testy o shodosti stuktuy edotlivých statistických zaků V moha říadech se zaímáme o možost vyšetřovat shodost stuktuy edoho statistického zaku ( aříklad X )za ůzých odmíek, kteé sou vyádřey třídami ( kategoiemi ) duhého statistického zaku Y. Naříklad vyšetřueme soubo mužů a že v secifických odmíkách a studueme možost steé eakce u edoho statistického zaku. I v tomto říadě lze dokázat, že výaz (0.9) e za ředokladu hyotézy o shodosti stuktuy daého statistického zaku asymtoticky ove ozděleí χ o ( 1 ). ( c 1 ) stuích volosti. Tedy estliže e hodota testové veličiy χ χ ( 1).( c 1) ( α), zamítáme hyotézu H 0 o shodosti stuktuy áhodé veličiy X.
Příklad 0.4 V ůběhu sociologického výzkumu byla dotázáa skuia 40 lidí a oblematiku životího ostředí. Statistický zak X, byl ozděle a třídy edosělí ( 10 18 let ), mladí lidé ( 19 34 let ), oduktiví ( 35 60 let), ost oduktiví ( > 60 let ). Statistický zak výzam životího ostředí byl ozčleě a ioití, vysoký, ůměý, malý, žádý ( teto osto byl hodoce dotazíkem a ak řefomulová do této odovědi ). Zistěte, zda se liší ostoe edotlivých ových skui lidí k životímu ostředí! výzam edosělí mladí lidé oduktiví ostoduktiví ioití 1 8 6 6 7 vysoký 18 3 35 6 10 ůměý 18 15 1 6 51 malý 3 6 9 0 žádý 0 7 1 1 40 50 76 91 68 85 Tabulka 10 - Výsledky šetřeí Řešeí: Nedříve ako u říkladů z ředchozí části zistíme očekávaé četosti edotlivých ostoů ových skui. Postuovat budeme steě ako v ředchozí části, výsledkem e ásleduící tabulka očekávaých četostí : výzam edosělí mladí lidé oduktiví ostoduktiví ioití 1,6315789 19,,9894737 17,17894737 7 vysoký 17,8947368 7, 3,568411 4,3368411 10 ůměý 8,9473684 13,6 16,84105 1,1684105 51 malý 3,50877193 5,33333333 6,38596491 4,7719985 0 žádý 7,01754386 10,6666667 1,771998 9,543859649 40 50 76 91 68 85 Tabulka 11 - Teoetické - očekávaé četosti Potože a řádce malý sou četosti meší ež 5, ovedeme sloučeí tříd malý a žádý. Výsledá tabulka sloučeých četostí e uvedea dále : výzam edosělí mladí lidé oduktiví ostoduktiví ioití 1,6315789 19,,9894737 17,17894737 7 vysoký 17,8947368 7, 3,568411 4,3368411 10 ůměý 8,9473684 13,6 16,84105 1,1684105 51 malý-žádý 10,563158 16 19,1578947 14,31578947 60 50 76 91 68 85 Tabulka 1 - Sloučeé teoetické četosti Z těchto hodot budeme yí očítat hodotu testové statistiky chí kvadát, o aše otřeby uvedeme tabulku ak s hodotami edotlivých sčítaců (0.9), tak i s hodotou testové statistiky a kitickou hodotou ozděleí chí kvadát s 9 stui volosti.
výzam edosělí mladí lidé oduktiví ostoduktiví ioití 0,03157895 4,03333333 0,3943559 7,74535604 vysoký 0,000619 0,6485941 0,181543 0,113658714 ůměý 9,15913313 0,14411765 1,171331 3,16898561 malý-žádý 6,90631579 5 33,0370156 48,374613 testová statistika= 139,5536 hodota chi - kvadát : 16,918960 Tabulka 13 - Vyočítaé hodoty testové statistiky Ve seciálím říadě čtyřolí tabulky ( tabulka, kde = c = ), uvedeou a obázku íže : 11 1 1. 1..1. Tabulka 14 - Čtyřolí kotigečí tabulka Ve čtyřolí tabulce latí: χ =. (. -. ) 11 1 1... 1...1. (0.10) Důkaz si oveďte dosazeím hodot z tabulky 14 do vztahu (0.9). Při říadých testech v čtyřolí tabulce budeme tedy hodotu testové statistiky očítat odle vztahu (0.10). Tuto hodotu budeme oovávat hodotou kvatitu a chí kvadát ozděleí s 1 stuěm volosti. Výaz (0.10) lze eště dále uavit a ásleduící tva 1.... 11 1 χ =. - (0.11).1.. 1.. Z tohoto vzoce římo vylývá vztah χ testu vzhledem k zhodoceí homogeity dvou biomických ozděleí. Platí tedy ásleduící tvzeí Věta 0.5 Test χ v čtyřolí tabulce e ekvivaletí s oboustaým testem homogeity dvou biomických ozděleí, kteý e založe a statistice zomalizováí. Důkaz : Je zřemý. Na datech usořádaých do čtyřolí tabulky můžeme oto ověřovat záoveň hyotézu o ezávislosti, tak i hyotézu o homogeitě stuktuy. Poblémy s užitím χ testu astávaí odobě ako v obecém oužití tohoto testu, estliže sou ěkteé z očekávaých
četostí v čtyřolí tabulce meší ež 5. Navíc se ásobí tím, že v říadě takovéto tabulky iž emůže ovádět slučováí edotlivých tříd. Budeme oto ožadovat v říadě čtyřolí tabulky, aby žádá očekávaá četost ebyla meší ež 5 a ozsah výběu byl asoň 40. V říadě, že esou tyto ředoklady slěy, ovádíme fomálě dva zůsoby řešeí. Pví zůsob oužívá koekci a soitost ozděleí chí kvadát, de o tzv. Yatesovu koekci χ =...... 1...1. 11 1 1 (0.1) Výsledkem této koekce e zmešeí hodoty testové statistiky. Tím se součastě zmeší iziko chyby vího duhu, ale záoveň se zvětšue chyba duhého duhu. Duhou možostí e ovedeí tzv. Fischeova exaktího testu ( faktoiálový test ), kteý se oužívá v říadě, že v čtyřolí tabulce sou velmi malé četosti. Hyotézu H 0 staovueme steě ako v (0.4) tedy i = i.... Alteativí hyotéza H 1 e staovea buď edostaá ebo oboustaá omocí tzv. logaitmické iteakce. Ta e staovea ako 11. logaitmický omě šací δ = l, kde l e řiozeý logaitmus.odhad této 1. 1 11. hodoty se staovue ako d = l. Tedy hyotéza H 1 e staovea buď ako d > 0 1. 1 ( es. d < 0 ) ak e edostaá, ebo ako H 1 : d 0, ak e oboustaá. Vlastí výočet sočívá v tom, že zistíme všechy tabulky, kteé maí steé magiálí četosti ako tabulka 0. Po tyto tabulky vyšetříme hodotu logaitmické iteakce a avděodobosti, za akých e ich abýváo. Tato avděodobost e o tabulku tyu tabulka 14 ova!.!.!.! 1...1. P= (0.13)!. 11!. 1!. 1!.! Podle tyu hyotézy H 1 sčítáme avděodobosti těch tabulek, kteé této hyotéze vyhovuí. Tedy o říad d > 0 sčítáme avděodobosti těch tabulek, eichž logaitmické iteakce sou větší ebo ovy hodotě d. V říadě d < 0 sčítáme hodoty avděodobostí těch tabulek, kteé maí logaitmické iteakce meší ebo ovy d. V říadě oboustaé alteativí hyotézy H 1 sčítáme avděodobosti těch tabulek, kteé maí logaitmické iteakce v absolutí hodotě větší ebo ovy číslu d. Příklad 0.6 Výbě 5 studetů ( 0 děvčat a 5 chlaců ) zaualo osto k zůsobu řešeí učitého oblému. Odověď Tabulka 15 data o říklad 0.6 chlaci děvčata ao 1 15 16 e 4 5 9 5 0 5 Ověřte, zda ohlaví a zůsob řešeí oblému v tomto říadě a sobě ezáleží.
Řešeí: V tomto říadě existue šest ůzých tabulek se steými magiálími četostmi. V ásleduícím textu sou tyto tabulky uvedey solu s eich logaitmickou iteakcí a avděodobostí sočteou odle vztahu (0.13). 1 15 16 d= -1,07918 14 16 d= -0,54407 4 5 9 P= 0,037945 3 6 9 P= 0,18973 5 0 5 5 0 5 0 16 16 d= -ek. 3 13 16 d= -0,0975 5 4 9 P= 0,0037 7 9 P= 0,379447 5 0 5 5 0 5 4 1 16 d= 0,45969 1 8 9 P= 0,3083 součet= 0,084585 5 0 5 5 11 16 d= +ek. 0 9 9 P= 0,0813 5 0 5 tabulka 16 Tabulky se steými magiálími četostmi Potože alteativí hyotéza e staovea ako oboustaá, musíme zistit součet avděodobostí u těch tabulek, kteé maí absolutí hodotu logaitmické iteakce větší ež tabulka 15. Jde tedy o duhou a čtvtou tabulku, součet avděodobostí e v tomto říadě ove 0,084585. Na hladiě výzamosti 0,05 bychom tedy zamítli ezávislost zůsobu řešeí a ohlaví. 0.4 Testy o symetii kotigečí tabulky V říadě, že e daá kotigečí tabulka čtvecová, zaímáme se mohdy o symetii avděodobostí. Staovueme tedy hyotézu H 0 : i = i, o všechy hodoty i, = 1,,. Za ředokladu latosti hyotézy H 0 e očet ezámých aametů v matici ( i ) ove očtu čleů a diagoále + vky, kteé leží ad diagoálou, s výimkou aříklad vku, kteý lze doočítat ze symetie a zalosti ostatích vků. Celkově e. ( 1) oto očet ezámých aametů ove N = + 3+ + =. Jako testovou statistiku zvolíme řiozeě χ = ( i -i ) + i< i i (0.14)
( ). 1, tato statistika e asymtoticky ozděleí chí kvadát s stui volosti. Hyotézu symetie kotigečí tabulky a hladiě výzamosti a zamítáme, estliže χ χ α..( 1) ( ) V říadě čtyřolí tabulky se test symetie azývá Mc Nemaův. V součtu (0.14) se vyskytue e ede, kteý e ove χ = ( ) 1 1 + 1 1 (0.15) Tato statistika e asymtoticky ozděleí chí kvadát s 1 stuěm volosti. Příklad 0.7 Při výuce aglického azyka byla oužita seciálí metoda o zychleí eakce v kovezaci. Tato metoda byla alikováa a vzoek 100 studetů a osléze vyhodocea do tabulky: Po seciálí metodě Celkem Ihed ůměě Před seciálí ihed 4 8 5 metodou ůměě 1 36 48 Celkem 36 64 100 Tabulka 17 - Data říkladu 0.7 Řešeí: Jde o čtyřolí tabulku, oužieme oto MC Nemaův test, hodotu testové statistiky sočteme odle (0.15), ta e ova 6,4. Kitická hodota chí kvadát o 1 stui volosti a hladiě výzamosti a = 0,05 e ova 3,841455. Zamítáme tedy a hladiě výzamosti 0,05, že seciálí metoda emá vliv a zychleí eakce ři kovezaci. Příklad 0.8 Aglický říodovědec F.Galto sledoval v 1000 říadech bavu očí otce a sya. Výsledky šetřeí sou uvedey v ásleduící tabulce: Bava očí otce světle modá modozeleá ebo šedá tmavě šedá ebo světle hědá tmavě zědá Celkem Bava očí sya světle modá modozeleá ebo šedá 194 70 41 30 335 83 14 41 36 84 tmavě šedá ebo světle hědá 5 34 55 3 137 tmavě zědá 56 36 43 109 44 Celkem 358 64 180 198 1000 tabulka 18 - Data říkladu 0.8
Zistěte, zda bava očí otce ovlivňue bavu očí sya. Řešeí: Uvedeé hodoty dosadíme do vztahu (0.14). Tím získáme hodotu testové statistiky, v tomto říadě e ova číslu 19,55777. Potože e kitická hodota chí kvadát s 6 stui volosti ova 1,59 zamítáme a hladiě výzamosti 0,05 hyotézu o symetii v tomto říadě.