Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13



Podobné dokumenty
= = 2368

Parametry hledáme tak, aby součet čtverců odchylek byl minimální. Řešením podle teorie je =

Korelační a regresní analýza

4ST201 STATISTIKA CVIČENÍ Č. 7

12. cvičení z PST. 20. prosince 2017

2 ) 4, Φ 1 (1 0,005)

Náhodné veličiny jsou nekorelované, neexistuje mezi nimi korelační vztah. Když jsou X; Y nekorelované, nemusí být nezávislé.

KGG/STG Statistika pro geografy

You created this PDF from an application that is not licensed to print to novapdf printer (

Příklad 1. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 11

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Jana Vránová, 3. lékařská fakulta UK

Kontingenční tabulky, korelační koeficienty

Testování statistických hypotéz

Kontingenční tabulky, korelační koeficienty

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

4EK211 Základy ekonometrie

PRAVDĚPODOBNOST A STATISTIKA

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

INDUKTIVNÍ STATISTIKA

Test dobré shody v KONTINGENČNÍCH TABULKÁCH

Tomáš Karel LS 2012/2013

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

Tomáš Karel LS 2012/2013

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

12. prosince n pro n = n = 30 = S X

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Regresní a korelační analýza

Mannův-Whitneyův(Wilcoxonův) test pořadová obdoba dvouvýběrového t-testu. Statistika (MD360P03Z, MD360P03U) ak. rok 2007/2008

Testy statistických hypotéz

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Statistické metody uţívané při ověřování platnosti hypotéz

Testování statistických hypotéz

Zápočtová práce STATISTIKA I

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Úvod do analýzy rozptylu

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

Regresní a korelační analýza

Cvičení ze statistiky - 9. Filip Děchtěrenko

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Aproximace binomického rozdělení normálním

STATISTICKÉ TESTY VÝZNAMNOSTI

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

STATISTICKÉ TESTY VÝZNAMNOSTI

5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Porovnání dvou výběrů

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Příklad: Test nezávislosti kategoriálních znaků

15. T e s t o v á n í h y p o t é z

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

PRAVDĚPODOBNOST A STATISTIKA. Testování hypotéz o rozdělení

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Normální (Gaussovo) rozdělení

MATEMATIKA III V PŘÍKLADECH

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

Příklady na testy hypotéz o parametrech normálního rozdělení

Testování hypotéz Biolog Statistik: Matematik: Informatik:

Regresní analýza 1. Regresní analýza

Normální (Gaussovo) rozdělení

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

Neparametrické metody

6. Testování statistických hypotéz. KGG/STG Zimní semestr 6. Testování statistických hypotéz

5. T e s t o v á n í h y p o t é z

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

Stručný úvod do testování statistických hypotéz

Analýza rozptylu. Podle počtu analyzovaných faktorů rozlišujeme jednofaktorovou, dvoufaktorovou a vícefaktorovou analýzu rozptylu.

ADDS cviceni. Pavlina Kuranova

Korelace. Komentované řešení pomocí MS Excel

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Přednáška X. Testování hypotéz o kvantitativních proměnných

Regresní a korelační analýza

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Kontrola: Sečteme-li sloupec,,četnost výskytu musí nám vyjít hodnota rozsahu souboru (našich 20 žáků)

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Testování hypotéz a měření asociace mezi proměnnými

V roce 1998 se v Liberci oženili muži a vdaly ženy v jednotlivých věkových skupinách v následujících počtech:

Testování hypotéz o parametrech regresního modelu

Cvičení ze statistiky - 8. Filip Děchtěrenko

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Charakteristika datového souboru

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Testování hypotéz o parametrech regresního modelu

Analýza dat z dotazníkových šetření

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Protokol č. 1. Tloušťková struktura. Zadání:

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

6. Lineární regresní modely

KORELACE. Komentované řešení pomocí programu Statistica

Transkript:

Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test : 9, 7, 12, 6, 15, 6, 8, 4, 11, 8 Řešení 1 V tomto případě můžeme z charakteru dat předpokládat normální rozdělení obou náhodných veličin a. Budeme testovat nulovou hypotézu (výsledky obou testů jsou nezávislé proti jednostranné alternativní hypotéze (výsledky testů jsou kladně korelované. :=0, : >0 Ze zadání úlohy máme =10. Obrázek nám představuje data v grafické podobě. Vodorovná osa je pro náhodnou veličinu neboli výsledky prvního testu a svislá osa pro náhodnou veličinu neboli výsledky druhého testu. 16 14 12 10 8 6 4 2 Korelační pole 0 0 2 4 6 8 10 12 14 16 Nejprve budeme počítat výběrový korelační koeficient Pearsonův (jak bylo uvedeno výše, předpokládáme normalitu dat podle vzorce z teorie.! = " #$ %" & # " & $ Pro výpočet podle tohoto vzorce potřebujeme vypočítat průměry, výběrové rozptyly a výběrovou kovarianci podle vzorců. ' = 1 10 ( ' = 1 10 ( 1

Po dosazení dostaneme " # & = 1 1 (+ ', & " $ & = 1 1 (+ ', & " #$ = 1 1 (+ ',+ ', ' = 1 10 +7+8+10+4+14+9+6+2+13+5,=78 10 =7,8 ' = 1 10 +9+7+12+6+15+6+8+4+11+8,=86 10 =8,6 " # & = 1 9 /+7 7,8,& ++8 7,8, & ++10 7,8, & ++4 7,8, & ++14 7,8, & ++9 7,8, & ++6 7,8, & ++2 7,8, & ++13 7,8, & ++5 7,8, & 0 = 1 9 /+ 0,8,& ++0,2, & ++2,2, & ++ 3,8, & ++6,2, & ++1,2, & ++ 1,8, & ++ 5,8, & ++5,2, & ++ 2,8, & 0 = 1 9 /0,64+0,04+4,84+14,44+38,44+1,44+3,24+33,64+27,04+7,840 = 131,6 9 =14,62222 " $ & = 1 9 /+9 8,6,& ++7 8,6, & ++12 8,6, & ++6 8,6, & ++15 8,6, & ++6 8,6, & ++8 8,6, & ++4 8,6, & ++11 8,6, & ++8 8,6, & 0 = 1 9 /+0,4,& ++ 1,6, & ++3,4, & ++ 2,6, & ++6,4, & ++ 2,6, & ++ 0,6, & ++ 4,6, & ++2,4, & ++ 0,6, & 0 = 1 9 /0,16+2,56+11,56+6,76+40,96+6,76+0,36+21,16+5,76+0,360 = 96,4 9 =10,71111 " #$ = 1 9 /+7 7,8,+9 8,6,++8 7,8,+7 8,6,++10 7,8,+12 8,6,++4 7,8,+6 8,6, ++14 7,8,+15 8,6,++9 7,8,+6 8,6,++6 7,8,+8 8,6, ++2 7,8,+4 8,6,++13 7,8,+11 8,6,++5 7,8,+8 8,6,0 = 1 9 /+ 0,8, 0,4+0,2 + 1,6,+2,2 3,4++ 3,8, + 2,6,+6,2 6,4+1,2 + 2,6,++ 1,8, + 0,6,++ 5,8, + 4,6,+5,2 2,4++ 2,8, + 0,6,0 = 1 9 / 0,32 0,32+7,48+9,88+39,68 3,12+1,08+26,68+12,48+1,680 = 95,2 9 =10,57778 Nyní se můžeme vrátit k výpočtu výběrového Pearsonova korelačního koeficientu. Dosadíme do výše uvedeného vzorce a dostaneme 10,57778! = 14,62222 10,71111 = 10,57778 %156,62025 =10,57778 12,51480 =0,84522 2

Podle hodnoty výběrového Pearsonova korelačního koeficientu je zřejmé, že lze očekávat zamítnutí nulové hypotézy. Přesvědčíme se o tom výpočtem testové statistiky podle vzorce z teorie! 3 = 2 1! & Po dosazení 0,84522 0,84522 0,84522 2,390647 3 = %1 0,84522 & 10 2= 8= 2,828427= 1 0,7143992 %0,2856008 0,5344163 =4,47338 Podle teorie hypotézu nezávislosti veličin a na hladině 4 zamítáme, jeli 3 7 8& 91 4 2 : Připomínáme, že 7 8& +1 4 2, označuje 1 4 2 kvantil Studentova trozdělení o 2 stupních volnosti (ten najdeme ve statistických tabulkách. Dosadíme a dostaneme 4,47338 =4,47338 2,306=7 8& <1 0,05 2 = Je zřejmé, že uvedená nerovnost platí. Proto na hladině 0,05 zamítáme nulovou hypotézu. Můžeme konstatovat, že na hladině významnosti 0,05 jsou výsledky testů kladně korelované. 3

Příklad 2 V tabulce je uvedena spotřeba alkoholu a úmrtnost na cirhózu jater a alkoholismus v některých vybraných zemích. Určete na hladině významnosti 0,05, zda úmrtnost na cirhózu jater a alkoholismus na spotřebě alkoholu závisí. Země Spotřeba alkoholu [l/osoba] Úmrtnost na cirhózu jater a alkoholismus [zemřelí na 100000 obyvatel] Finsko 3,9 3,6 Norsko 4,2 4,3 Irsko 5,6 3,4 Holandsko 5,7 3,7 Švédsko 6,0 7,2 Anglie 7,2 3,0 Belgie 10,8 12,3 Rakousko 10,9 7,0 Německo 12,3 23,7 Itálie 15,7 23,6 Francie 24,7 46,1 Řešení 2 Označme náhodnou veličinu udávající spotřebu alkoholu na osobu a náhodnou veličinu udávající počet zemřelých na cirhózu jater a alkoholismus na 100 000 obyvatel. Ze vstupních dat máme 11 a z požadavku úlohy 4 0,05. Obrázek nám představuje data v grafické podobě. Vodorovná osa je pro náhodnou veličinu neboli výsledky prvního testu a svislá osa pro náhodnou veličinu neboli výsledky druhého testu. V tomto případě nemůžeme předpokládat normalitu dat. Je to zřejmé hlavně pro veličinu již z tohoto obrázku. Proto nemůžeme k výpočtu použít výběrový korelační koeficient Pearsonův. V této situaci je nutné vypočítat výběrový korelační koeficient Spearmanův. Tento koeficient je nazýván koeficient pořadové korelace, protože nepracuje přímo s danými hodnotami, ale jejich pořadím. 4

Tabulku ze zadání upravíme tak, aby obsahovala pořadí veličin X a Y, rozdíly těchto pořadí a druhé mocniny těchto rozdílů. Dostaneme (součet obou pořadí je jen kontrolní údaj i Xi Yi Rx Ry RxRy (RxRy2 1 3,9 3,6 1 3 2 4 2 4,2 4,3 2 5 3 9 3 5,6 3,4 3 2 1 1 4 5,7 3,7 4 4 0 0 5 6 7,2 5 7 2 4 6 7,2 3 6 1 5 25 7 10,8 12,3 7 8 1 1 8 10,9 7 8 6 2 4 9 12,3 23,7 9 10 1 1 10 15,7 23,6 10 9 1 1 11 24,7 46,1 11 11 0 0 Suma 66 66 50 Nyní můžeme vypočítat Spearmanův výběrový korelační koeficient, který podle teorie je! > =1 6 + & 1, (+? @, & Dosadíme a dostaneme 6! > =1 11+11 & 1, 50=1 300 300 300 =1 =1 11+121 1, 11 120 1320 =1 0,227273 =0,772727 Podle teorie testové kritérium (testovou statistiku počítáme jako A = 1! > Hypotézu nezávislosti veličin a na hladině 4 zamítáme, jeli! >! > + ;4, Kritické hodnoty Spearmanova korelačního koeficientu najdeme ve statistických tabulkách. Vypočteme si nyní testovou statistiku dosazením do vzorce A = 11 1 0,772727=3,162278 0,772727=2,443578 Tuto statistiku ovšem pro následující závěrečné porovnání vůbec nepotřebujeme. 0,772727 =0,772727 0,6091=! > +11;0,05, Je zřejmé, že nerovnost platí. Tedy na hladině významnosti 0,05 nulovou hypotézu zamítáme. Můžeme konstatovat, že na hladině významnosti 0,05 byla prokázána závislost mezi spotřebou alkoholu a úmrtností na cirhózu jater a alkoholismus. 5

Příklad 3 Byly naměřeny následující hodnoty veličin a. Na hladině významnosti 0,05 prověřte, zda jsou naměřené hodnoty kladně korelované. : 55, 55, 55, 65, 65, 65, 75, 75, 75, 85, 85, 95, 95, 95 : 3, 3.6, 4.2, 1.8, 2.4, 3, 1.8, 2.4, 3, 1.8, 2.4, 1.8, 2.4, 3 Řešení 3 Ze vstupních dat máme 14 a z požadavku úlohy 4 0,05. Nulová hypotéza předpokládá nezávislost naměřených dat, alternativní hypotéza předpokládá jejich závislost. Obrázek nám představuje data v grafické podobě. Vodorovná osa je pro náhodnou veličinu a svislá osa pro náhodnou veličinu. V tomto případě nemůžeme předpokládat normalitu dat. Proto nemůžeme k výpočtu použít výběrový korelační koeficient Pearsonův. V této situaci je nutné vypočítat výběrový korelační koeficient Spearmanův. Tento koeficient je nazýván koeficient pořadové korelace, protože nepracuje přímo s danými hodnotami, ale jejich pořadím. Tabulku ze zadání upravíme tak, aby obsahovala pořadí veličin X a Y, rozdíly těchto pořadí a druhé mocniny těchto rozdílů. Dostaneme (součet obou pořadí je jen kontrolní údaj i Xi Yi Rx Ry RxRy (RxRy2 1 55 3 1 9 8 64 2 55 3,6 2 13 11 121 3 55 4,2 3 14 11 121 4 65 1,8 4 1 3 9 5 65 2,4 5 5 0 0 6 65 3 6 10 4 16 7 75 1,8 7 2 5 25 6

i Xi Yi Rx Ry RxRy (RxRy2 8 75 2,4 8 6 2 4 9 75 3 9 11 2 4 10 85 1,8 10 3 7 49 11 85 2,4 11 7 4 16 12 95 1,8 12 4 8 64 13 95 2,4 13 8 5 25 14 95 3 14 12 2 4 Suma 105 105 522 Nyní můžeme vypočítat Spearmanův výběrový korelační koeficient, který podle teorie je! > =1 6 + & 1, (+? @, & Dosadíme a dostaneme 6! > =1 14+14 & 1, 522=1 3132 3132 =1 14+196 1, 14 195 =1 3132 2730 =1 1,147253 = 0,147253 Podle teorie testové kritérium (testovou statistiku počítáme jako A = 1! > Hypotézu nezávislosti veličin a na hladině 4 zamítáme, jeli! >! > + ;4, Kritické hodnoty Spearmanova korelačního koeficientu najdeme ve statistických tabulkách. Vypočteme si nyní testovou statistiku dosazením do vzorce A = 14 1 + 0,147253,=3,605551 + 0,147253,= 0,53093 Tuto statistiku ovšem pro následující závěrečné porovnání vůbec nepotřebujeme. 0,147253 =0,147253 0,5341=! > +14;0,05, Je zřejmé, že nerovnost neplatí. Tedy na hladině významnosti 0,05 nulovou hypotézu nemůžeme zamítnout. Můžeme konstatovat, že na hladině významnosti 0,05 byla prokázána nezávislost naměřených dat. 7

Příklad 4 Bylo zjišťováno, zda u souboru chlapců je závislost mezi počtem provedených shybů a kliků. Byly zjištěny hodnoty uvedené v tabulce. Závislost testujte na hladině významnosti 0,05. shyby: 1, 3, 2, 0, 5, 6, 1, 4, 3, 5, 6, 2, 1, 1, 8 kliky: 10, 15, 15, 0, 40, 25, 7, 31, 30, 35, 41, 10, 14, 9, 64 Řešení 4 V tomto případě můžeme z charakteru dat předpokládat normální rozdělení obou náhodných veličin a. Budeme testovat nulovou hypotézu (výsledky obou testů jsou nezávislé proti jednostranné alternativní hypotéze (výsledky testů jsou kladně korelované. :0, : 0 Ze zadání úlohy máme 15 a 4 0,05. Obrázek nám představuje data v grafické podobě. Vodorovná osa je pro náhodnou veličinu neboli výsledky prvního testu a svislá osa pro náhodnou veličinu neboli výsledky druhého testu. Nejprve budeme počítat výběrový korelační koeficient Pearsonův (jak bylo uvedeno výše, předpokládáme normalitu dat podle vzorce z teorie.! " #$ %" & # " & $ Pro výpočet podle tohoto vzorce potřebujeme vypočítat průměry, výběrové rozptyly a výběrovou kovarianci podle vzorců. ' 1 10 ( ' 1 10 ( 8

" # & = 1 1 (+ ', & " $ & = 1 1 (+ ', & " #$ = 1 1 (+ ',+ ', Pro provedení výpočtů si připravíme tabulku v MS Excel obsahující kromě hodnot náhodných veličin i jejich rozdíly od jejich průměru, druhé mocniny těchto rozdílů a součin těchto rozdílů. i X Y XPrX (XPrX2 YPrY (YPrY2 (XPrX(YPrY 1 1 10 2,2 4,84 13,0667 170,7378 28,74666667 2 3 15 0,2 0,04 8,06667 65,07111 1,613333333 3 2 15 1,2 1,44 8,06667 65,07111 9,68 4 0 0 3,2 10,24 23,0667 532,0711 73,81333333 5 5 40 1,8 3,24 16,93333 286,7378 30,48 6 6 25 2,8 7,84 1,933333 3,737778 5,413333333 7 1 7 2,2 4,84 16,0667 258,1378 35,34666667 8 4 31 0,8 0,64 7,933333 62,93778 6,346666667 9 3 30 0,2 0,04 6,933333 48,07111 1,386666667 10 5 35 1,8 3,24 11,93333 142,4044 21,48 11 6 41 2,8 7,84 17,93333 321,6044 50,21333333 12 2 10 1,2 1,44 13,0667 170,7378 15,68 13 1 14 2,2 4,84 9,06667 82,20444 19,94666667 14 1 9 2,2 4,84 14,0667 197,8711 30,94666667 15 8 64 4,8 23,04 40,93333 1675,538 196,48 Pruměr 3,2 23,06667 Součet 78,4 4082,933 524,8 Pomocí této tabulky dostaneme ' =3,2 ' =23,06667 " & # = 78,4 14 =5,6 " & $ = 4082,933 =291,6381 14 " #$ = 524,8 14 =37,48571 Nyní se můžeme vrátit k výpočtu výběrového Pearsonova korelačního koeficientu. Dosadíme do výše uvedeného vzorce a dostaneme 37,48571! = %5,6 291,6381 = 37,48571 1633,173 =37,48571 40,41254 =0,927576 Podle hodnoty výběrového Pearsonova korelačního koeficientu je zřejmé, že lze očekávat zamítnutí nulové hypotézy. Přesvědčíme se o tom výpočtem testové statistiky podle vzorce z teorie! 3 = 2 1! & Po dosazení 9

0,927576 0,927576 0,927576 3 = %1 0,927576 & 15 2= 13= 1 0,86039782 0,13960218 3,605551 = 3,344424 0,373634 =8,951075628 Podle teorie hypotézu nezávislosti veličin a na hladině 4 zamítáme, jeli 3 7 8& 91 4 2 : Připomínáme, že 7 8& +1 4 2, označuje 1 4 2 kvantil Studentova trozdělení o 2 stupních volnosti (ten najdeme ve statistických tabulkách. Dosadíme a dostaneme 8,951075628 =8,951075628 2,160=7 I8& <1 0,05 2 = Je zřejmé, že uvedená nerovnost platí. Proto na hladině 0,05 zamítáme nulovou hypotézu. Můžeme konstatovat, že na hladině významnosti 0,05 jsou výsledky měření počtu shybů a počtu kliků kladně korelované. 10

Příklad 5 V tabulce jsou uvedeny údaje z výběrového souboru 269 studentů jisté fakulty, které jsou tříděné podle oboru studia a podle jimi subjektivně hodnocené prestiže studovaného oboru. Na hladině významnosti 0,01 prokažte závislost mezi těmito dvěma proměnnými. Obor Prestiž vysoká Prestiž průměrná Prestiž nízká Celkem A 4 29 36 69 B 2 34 36 72 C 48 67 13 128 Celkem 54 130 85 269 Řešení 5 Jedním ze zkoumaných znaků je studovaný obou, druhým je subjektivně vnímaná prestiž studovaného obou. Nulovou hypotézou je nezávislost těchto zkoumaných znaků, alternativní hypotézou je závislost zkoumaných znaků. V zadání úlohy je stanovena hladina významnosti 4 =0,01. Tato situace vede k využití takzvaného chí kvadrát testu nezávislosti v kontingenční tabulce. Tento test porovnává napozorované četnosti s očekávanými četnostmi za předpokladu nezávislosti znaků. Podle zadání máme =269, J =3, K =3 Označme L,M =1,,J,O =1,,K četnost v M=tém řádku a O=tém sloupci naší tabulky. Dále označme P součet četností v Mtém řádku a PL součet četností v Otém sloupci tabulky. Konkrétně tedy máme P =69, &P =72, QP =128 P =54, P& =130, PQ =85 Využijeme MS Excel a data si uspořádáme do tabulky. 1 2 3 Suma A 4 29 36 69 B 2 34 36 72 C 48 67 13 128 Suma 54 130 85 269 Očekávaná četnost v Mtém řádku a Otém sloupci tabulky za hypotézy nezávislosti mezi těmito dvěma znaky je R L = P PL Vypočteme jednotlivé hodnoty podle tohoto vzorce. Dostaneme tabulku 1 2 3 Suma A 13,85 33,35 21,80 69 B 14,45 34,80 22,75 72 C 25,70 61,86 40,45 128 Suma 54 130 85 269 11

Z této tabulky můžeme počítat testovou statistiku vyjadřující míru shody mezi stejnolehlými prvky předchozích tabulek. Podle teorie budeme tuto statistiku počítat podle vzorce W V S & =(( T L R L U & L Sčítané členy si vypočteme v MS Excel ve třetí tabulce. Tyto členy pak sečteme do řádkových a sloupcových součtů, vpravo dole bude součet celkový. Dostaneme R L 1 2 3 Suma A 7,01 0,57 9,24 16,82 B 10,73 0,02 7,72 18,46 C 19,36 0,43 18,62 38,41 Suma 37,10 1,01 35,58 73,69 V tabulce jsou již provedeny potřebné součty, takže S & =73,69 Podle teorie hypotézu nezávislosti vyšetřovaných dvou znaků na hladině 4 zamítáme, jeli S & S & +W8, +V8, +1 4, Kritické hodnoty S & testu najdeme ve statistických tabulkách. V tabulkách tedy budeme hledat hodnotu S & +Q8, +Q8, +1 0,01,=S& & & +1 0,01,=S& X +1 0,01,=13,28 Dosadíme do testovací nerovnosti a dostaneme S & =73,69 =13,28=S & +Q8, +Q8, +1 0,01, Je zřejmé, že testovací nerovnost platí. Tedy nulovou hypotézu o nezávislosti testovaných znaků na hladině 0,01 zamítáme. Na hladině významnosti 0,01 pokládáme závislost mezi studovaným oborem a úrovní jeho prestiže za prokázanou. 12