Vzorová prezentace do předmětu Statistika

Podobné dokumenty
Jednofaktorová analýza rozptylu

Cvičení 12: Binární logistická regrese

Cvičení 9: Neparametrické úlohy o mediánech

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

Jednovýběrový Wilcoxonův test a jeho asymptotická varianta (neparametrická obdoba jednovýběrového t-testu)

5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)

KORELACE. Komentované řešení pomocí programu Statistica

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

KGG/STG Statistika pro geografy

= = 2368

TECHNICKÁ UNIVERZITA V LIBERCI

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Zápočtová práce STATISTIKA I

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Jednostranné intervaly spolehlivosti

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Technická univerzita v Liberci

Dvouvýběrové a párové testy. Komentované řešení pomocí MS Excel

, Brno Hanuš Vavrčík Základy statistiky ve vědě

TECHNICKÁ UNIVERZITA V LIBERCI. Statistický rozbor dat z dotazníkového šetření

Návrhy dalších možností statistického zpracování aktualizovaných dat

4ST201 STATISTIKA CVIČENÍ Č. 7

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.

Přednáška č. 1.: Tabulkové a grafické zpracování vícerozměrných dat

Testy. Pavel Provinský. 19. listopadu 2013

1 Tyto materiály byly vytvořeny za pomoci grantu FRVŠ číslo 1145/2004.

ADDS cviceni. Pavlina Kuranova

Charakteristika datového souboru

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD

Univerzita Pardubice Fakulta chemicko-technologická Katedra analytické chemie ANOVA. Semestrální práce

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky

TECHNICKÁ UNIVERZITA V LIBERCI

Tomáš Karel LS 2012/2013

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

KGG/STG Statistika pro geografy

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

Statistická analýza jednorozměrných dat

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

NEPARAMETRICKÉ TESTY

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

You created this PDF from an application that is not licensed to print to novapdf printer (

4. Zpracování číselných dat

TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta

Průzkumová analýza dat

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Řešení: máme diskrétní N.V. vzdělání bez maturity, s maturitou, vysokoškoláci, PhD.

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Porovnání dvou výběrů

Opakování. Neparametrické testy. Pořadí. Jednovýběrový Wilcoxonův test. t-testy: hypotézy o populačním průměru (střední hodnoty) předpoklad normality

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Neparametrické metody

Tabulka 1. Výběr z datové tabulky

Kapitola 2.: Diagnostické grafy a testy normality dat

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Grafický a číselný popis rozložení dat 3.1 Způsoby zobrazení dat Metody zobrazení kvalitativních a ordinálních dat Metody zobrazení kvan

Jednofaktorová analýza rozptylu

INDUKTIVNÍ STATISTIKA

STATISTICA Téma 7. Testy na základě více než 2 výběrů

TEST Z TEORIE EXPLORAČNÍ ANALÝZA DAT

12. cvičení z PST. 20. prosince 2017

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Normální (Gaussovo) rozdělení

VYBRANÉ DVOUVÝBĚROVÉ TESTY. Martina Litschmannová

Úvod do analýzy rozptylu

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Úkol 1.: Testování nezávislosti nominálních veličin V roce 1950 zkoumali Yule a Kendall barvu očí a vlasů u 6800 mužů.

Pohlédněte si základní charakteristiky polohy jednotlivých veličin pomocí funkce summary.

Statistická analýza dat podzemních vod. Statistical analysis of ground water data. Vladimír Sosna 1

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

STATISTICKÉ TESTY VÝZNAMNOSTI

SAMOSTATNÁ STUDENTSKÁ PRÁCE ZE STATISTIKY

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

SOFTWARE STAT1 A R. Literatura 4. kontrolní skupině (viz obr. 4). Proto budeme testovat shodu středních hodnot µ 1 = µ 2 proti alternativní

LINEÁRNÍ REGRESE Komentované řešení pomocí programu Statistica

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

Předpoklad o normalitě rozdělení je zamítnut, protože hodnota testovacího kritéria χ exp je vyšší než tabulkový 2

Vysoká škola ekonomická v Praze

Návod na vypracování semestrálního projektu

15. T e s t o v á n í h y p o t é z

Transkript:

Vzorová prezentace do předmětu Statistika Popis situace: U 3 náhodně vybraných osob byly zjišťovány hodnoty těchto proměnných: SEX - muž, žena PUVOD Skandinávie, Středomoří, 3 západní Evropa IQ hodnota inteligenčního kvocientu v bodech VYSKA tělesná výška v cm HMOTNOST tělesná hmotnost v kg hmotnost (v kg) BMI Body Mass Index, BMI = vyska (v m) PRIJEM roční příjem (v tisících euro) Cílem výzkumu je porovnat, zda v proměnných IQ, BMI a PRIJEM existují rozdíly mezi pohlavími a mezi oblastmi původu.

Základní charakteristiky datového souboru Tabulka četností variant proměnné SEX: Kategorie Četnost Rel.četnost 6 50,0 6 50,0 V souboru je stejný počet mužů i žen. Výsečový diagram proměnné SEX ; 50% ; 50% Sex

Tabulka četností proměnné PUVOD Kategorie Skandinavie Stredomori Zapadni Evropa Četnost Rel.četnost 34,4 3 40,6 8 5,0 Nevíce jsou v našem souboru zastoupeni lidé ze Středomoří (40,6%), méně často ze Skandinávie (34,4%)a nejméně ze západní Evropy (5%). Sloupkový diagram proměnné PUVOD 4 0 Počet pozorování 8 6 4 0 Skandinavie Stredomori Zapadni Evropa

Číselné charakteristiky proměnných IQ, BMI, PRIJEM Proměnná N platných Průměr Minimum Maximum Sm.odch. Koef.prom. IQ 3 5, 96,0 40, 0,6 BMI 3, 7, 5,7 3,0 Prijem 3 7,4,0 45 8,9 3,5 Průměrné IQ činí 5,, průměrné BMI, a průměrný příjem 7 000 euro ročně. Největší proměnlivost vykazuje příjem (koeficient variace je 3,5%), nejmenší IQ (koeficient variace je 0,6%).

Kontingenční tabulka absolutních a relativních četností proměnných SEX a PUVOD Četnost Celková četn. Četnost Celková četn. Četnost Celková četn. Sex Puvod Skandinavie Puvod Stredomori Puvod Zapadni Evropa Řádk. součty 5 7 4 6 5,63%,88%,50% 50,00% 6 6 4 6 8,75% 8,75%,50% 50,00% Vš.skup. 3 8 3 34,38% 40,63% 5,00% V našem souboru jsou nejvíce zastoupeni muži ze Středomoří (7 osob, tj.,9%), nejméně muži ze západní Evropy (4 osoby, tj.,5%) a ženy ze západní Evropy (4 osoby, tj.,5%). Grafické znázornění absolutních četností proměnných SEX a PUVOD

Porovnání proměnné IQ z hlediska pohlaví Nulová hypotéza tvrdí, že střední hodnoty proměnné IQ jsou stejné pro muže a ženy, tj. H = µ 0 : µ proti H : µ µ K testování použijeme dvouvýběrový t-test. Nejprve ověříme normalitu proměnné IQ ve skupině mužů a ve skupině žen pomocí S-W testu a pomoci normálního pravděpodobnostního grafu:,0,5,0 Oček. normál. hodnoty 0,5 0,0-0,5 -,0 -,5 -,0 90 95 00 0 0 30 40 05 5 5 35 45 90 95 00 0 0 30 40 05 5 5 35 45 Sex: IQ: SW-W = 0,9686; Sex: p = 0,853 Sex: IQ: SW-W = 0,905; p = 0,77 Pozorovaný kvantil Sex: Hypotézu o normalitě proměnné IQ nelze na hladině významnosti 0,05 zamítnout ani pro muže, ani pro ženy.

Vypočítáme číselné charakteristiky proměnné IQ ve skupinách mužů a žen: Sex IQ průměr IQ N IQ Sm.odch. 5,00 6, 5,5 6,6 Vš.skup. 5,3 3,6 Vidíme, že rozdíl v průměrném IQ je velmi malý, pouhá čtvrtina bodu. Krabicové diagramy: 50 40 30 0 IQ 0 00 90 80 Průměr Průměr±SmOdch Průměr±,96*SmOdch Hypotézu o shodě rozptylů proměnné IQ v daných dvou skupinách ověříme pomocí F-testu: Proměnná Průměr Průměr t sv p Poč.plat Poč.plat. Sm.odch. Sm.odch. F-poměr Rozptyly p Rozptyly IQ 5,500 5,0000 0,05785 30 0,954777 6 6,6095,60,08306 0,87969 Testová statistika F-testu nabývá hodnoty,083, odpovídající p-hodnota je 0,879, tedy na hladině významnosti 0,05 nezamítáme hypotézu o shodě rozptylů. Současně z tabulky plyne, že testová statistika dvouvýběrového t-testu se realizuje hodnotou 0,057, odpovídající p-hodnota je 0,9548, tedy na hladině významnosti 0,05 nezamítáme hypotézu o shodě středních hodnot. Neprokázali jsme tedy, že by se lišily střední hodnoty IQ mužů a žen. Cohenův koeficient věcného účinku je 0,0, tedy vliv proměnné SEX na IQ je zcela zanedbatelný.

Porovnání proměnné IQ z hlediska původu Nulová hypotéza tvrdí, že střední hodnoty proměnné IQ jsou stejné pro obyvatele Skandinávie, Středomoří a západní Evropy, tj. H = µ = µ 0 : µ proti H : aspoň jedna dvojice středních hodnot se liší 3 K testování použijeme jednofaktorovou analýzu rozptylu. Nejprve ověříme normalitu proměnné IQ ve skupinách obyvatel Skandinávie, Středomoří a západní Evropy pomocí S-W testu a pomoci normálního pravděpodobnostního grafu: Oček. normál. hodnoty,0,5,0 0,5 0,0-0,5 -,0 -,5 -,0 90 95 00 05 0 5 0 5 30 35 40 45,0,5,0 0,5 0,0-0,5 -,0 -,5 Puvod: Skandinavie -,0 90 95 00 05 0 5 0 5 30 35 40 45 Puvod: Skandinavie IQ: SW-W = 0,8438; p = 0,0354 Puvod: Zapadni Evropa Puvod: Stredomori IQ: SW-W = 0,965; p = 0,899 Puvod: Zapadni Evropa IQ: SW-W = 0,974; Pozorovaný p = 0,979 kvantil 90 95 00 05 0 5 0 5 30 35 40 45 Puvod: Stredomori Hypotézu o normalitě proměnné IQ zamítáme na hladině významnosti 0,05 pro obyvatele ze Skandinávie, zde je p-hodnota S-W testu 0,0354. Porušení však není příliš výrazné, proměnnou IQ budeme považovat za normálně rozloženou i ve skupině obyvatel Skandinávie.

Spočteme číselné charakteristiky proměnné IQ v daných třech skupinách: Puvod IQ průměr IQ N IQ Sm.odch. Skandinavie,0,09 Stredomori 4,6 3 0,46 Zapadni Evropa,6 8 3,54 Vš.skup. 5, 3,6 Průměrné nejvyšší IQ mají obyvatelé západní Evropy (a současně vykazují největší variabilitu), nejnižší obyvatelé Skandinávie. Nakreslíme krabicové diagramy: 60 50 40 30 IQ 0 0 00 90 80 Skandinavie Stredomori Zapadni Evropa Průměr Průměr±SmOdch Průměr±,96*SmOdch Hypotézu o shodě rozptylů proměnné IQ v daných třech skupinách ověříme pomocí Brownova Forsytheova testu: Proměnná SČ SV PČ SČ SV PČ F IQ 39,5944 9,7970 507,8 9 5,9759 0,380897 0,68666 Testová statistika Brownova Forsytheova testu nabývá hodnoty 0,3809, odpovídající p-hodnota je 0,6866, tedy na hladině významnosti 0,05 nezamítáme hypotézu o shodě rozptylů. p

Nyní provedeme test hypotézy o shodě středních hodnot. SČ SV PČ SČ SV PČ F p Proměnná IQ 58,548 64,740 4058,95 9 39,9639,88859 0,6949 Testová statistika jednofaktorové analýzy rozptylu se realizuje hodnotou,888, odpovídající p-hodnota je 0,695, tedy na hladině významnosti 0,05 nezamítáme hypotézu o shodě středních hodnot. Neprokázali jsme tedy, že by se lišily střední hodnoty IQ obyvatel Skandinávie, Středomoří a západní Evropy.

Porovnání proměnné BMI z hlediska pohlaví Nulová hypotéza tvrdí, že střední hodnoty proměnné BMI jsou stejné pro muže a ženy. H = µ 0 : µ proti H : µ µ K testování bychom rádi použili dvouvýběrový t-test. Nejprve ověříme normalitu proměnné BMI ve skupině mužů a ve skupině žen pomocí S-W testu a pomoci normálního pravděpodobnostního grafu:,0,5,0 Oček. normál. hodnoty 0,5 0,0-0,5 -,0 -,5 -,0 6 7 8 9 0 3 4 5 6 6 7 8 9 0 3 4 5 6 Sex: BMI: SW-W = Sex: 0,936; p = 0,930 Sex: BMI: SW-W = 0,8537; p = 0,054 Pozorovaný kvantil Sex: Hypotézu o normalitě proměnné BMI zamítáme na hladině významnosti 0,05 pro ženy. Porušení normality je výraznější, proto použijeme neparametrický test, konkrétně dvouvýběrový Wilcoxonův test.

Vypočítáme číselné charakteristiky proměnné BMI pro muže a pro ženy: Sex BMI průměr BMI N BMI Sm.odch. 3,6 6,3 8,7 6, Vš.skup., 3,75 Je patrný výrazný rozdíl v průměrném BMI mužů a žen. Data ještě znázorníme graficky pomocí krabicových diagramů: 6 5 4 3 BMI 0 9 8 7 6 Medián 5%-75% Rozsah neodleh. Odlehlé Extrémy Je patrný značný rozdíl v mediánech BMI mužů a žen. U žen se vyskytuje jedna odlehlá a jedna extrémní hodnota BMI. Nyní provedeme dvouvýběrový Wilcoxonův test: Proměnná Sčt poř. Sčt poř. U Z p-hodn. Z upravené p-hodn. N platn. N platn. *str. přesné p BMI 390,0000 38,0000,000000 4,79959 0,00000 4,79959 0,00000 6 6 0,000000 Vidíme, že p-hodnota je velice blízká 0, tedy na hladině významnosti 0,05 zamítáme hypotézu, že BMI mužů a žen se neliší.

Porovnání proměnné BMI z hlediska původu Nulová hypotéza tvrdí, že střední hodnoty proměnné BMI jsou stejné pro obyvatele Skandinávie, Středomoří a západní Evropy. H = µ = µ 0 : µ proti H : aspoň jedna dvojice středních hodnot se liší 3 K testování použijeme jednofaktorovou analýzu rozptylu. Nejprve ověříme normalitu proměnné BMI ve skupinách obyvatel Skandinávie, Středomoří a západní Evropy pomocí S-W testu a pomoci normálního pravděpodobnostního grafu: Oček. normál. hodnoty,0,5,0 0,5 0,0-0,5 -,0 -,5 -,0 6 7 8 9 0 3 4 5 6,0,5,0 0,5 0,0-0,5 -,0 -,5 Puvod: Skandinavie -,0 6 7 8 9 0 3 4 5 6 Puvod: Skandinavie BMI: SW-W = 0,8665; p = 0,0698 Puvod: Zapadni Evropa Puvod: Stredomori BMI: SW-W = 0,893; p = 0,07 Puvod: Zapadni Evropa BMI: SW-W = 0,838; Pozorovaný p = 0,07 kvantil 6 7 8 9 0 3 4 5 6 Puvod: Stredomori Hypotézu o normalitě proměnné BMI nezamítáme na hladině významnosti 0,05 ani v jednom případě.

Spočteme číselné charakteristiky proměnné IQ v daných třech skupinách: Puvod BMI průměr BMI N BMI Sm.odch. Skandinavie,4 3,9 Stredomori 0,7 3,0 Zapadni Evropa,7 8 3, Vš.skup., 3,75 Průměrné nejvyšší BMI mají obyvatelé západní Evropy, nejnižší obyvatelé Středomoří, u nichž je současně nejnižší variabilita. Nakreslíme krabicové diagramy: 4,5 4,0 3,5 3,0,5 BMI,0,5,0 0,5 0,0 9,5 9,0 Skandinavie Stredomori Zapadni Evropa Puvod Průměr Průměr±SmCh Průměr±,96*SmCh Hypotézu o shodě rozptylů proměnné BMI v daných třech skupinách ověříme pomocí Brownova Forsytheova testu: Proměnná SČ SV PČ SČ SV PČ F BMI 5,9667,963336 3,80450 9,390,69664 0,08998 Testová statistika Brownova Forsytheova testu nabývá hodnoty,697, odpovídající p-hodnota je 0,09, tedy na hladině významnosti 0,05 nezamítáme hypotézu o shodě rozptylů. p

Nyní provedeme test hypotézy o shodě středních hodnot. SČ SV PČ SČ SV PČ F p Proměnná BMI 6,6344 3,0587 8,304 9 7,866565 0,388756 0,68380 Testová statistika jednofaktorové analýzy rozptylu se realizuje hodnotou 0,3888, odpovídající p-hodnota je 0,684, tedy na hladině významnosti 0,05 nezamítáme hypotézu o shodě středních hodnot. Neprokázali jsme, že by se lišily střední hodnoty BMI obyvatel Skandinávie, Středomoří a západní Evropy.

Porovnání proměnné PRIJEM z hlediska pohlaví Nulová hypotéza tvrdí, že střední hodnoty proměnné PRIJEM jsou stejné pro muže a ženy. H = µ 0 : µ proti H : µ µ K testování použijeme dvouvýběrový t-test. Nejprve ověříme normalitu proměnné PRIJEM ve skupině mužů a ve skupině žen pomocí S-W testu a pomoci normálního pravděpodobnostního grafu:,0,5,0 Oček. normál. hodnoty 0,5 0,0-0,5 -,0 -,5 -,0 5 0 5 0 5 30 35 40 45 50 5 0 5 0 5 30 35 40 45 50 Sex: Prijem: SW-W Sex: = 0,935; p = 0,670 Sex: Prijem: SW-W = 0,93; p = 0,309 Pozorovaný kvantil Sex: Hypotézu o normalitě proměnné PRIJEM nelze na hladině významnosti 0,05 zamítnout ani pro muže, ani pro ženy.

Vypočítáme číselné charakteristiky proměnné PRIJEM ve skupinách mužů a žen: Sex Prijem průměr Prijem N Prijem Sm.odch. 30,8 6 9, 4,59 6 8,03 Vš.skup. 7,44 3 8,93 Vidíme, že rozdíl v průměrném ročním příjmu mužů a žen činí téměř 6 000 euro. Krabicové diagramy: 50 45 40 35 Prijem 30 5 0 5 0 5 Průměr Průměr±SmOdch Průměr±,96*SmOdch Hypotézu o shodě rozptylů proměnné PRIJEM v daných dvou skupinách ověříme pomocí F-testu: Proměnná Průměr Průměr t sv p Poč.plat Poč.plat. Sm.odch. Sm.odch. F-poměr Rozptyly p Rozptyly Prijem 30,85 4,59375,87954 30 0,070849 6 6 9,769 8,0545,9078 0,67395 Testová statistika F-testu nabývá hodnoty,907, odpovídající p-hodnota je 0,674, tedy na hladině významnosti 0,05 nezamítáme hypotézu o shodě rozptylů. Současně z tabulky plyne, že testová statistika dvouvýběrového t-testu se realizuje hodnotou,873, odpovídající p-hodnota je 0,0708, tedy na hladině významnosti 0,05 nezamítáme hypotézu o shodě středních hodnot. Neprokázali jsme, že by se lišily střední hodnoty proměnné PRIJEM mužů a žen. Cohenův koeficient věcného účinku je 0,3, tedy vliv proměnné SEX na příjem je pouze malý.

Porovnání proměnné PRIJEM z hlediska původu Nulová hypotéza tvrdí, že střední hodnoty proměnné PRIJEM jsou stejné pro obyvatele Skandinávie, Středomoří a západní Evropy. H = µ = µ 0 : µ proti H : aspoň jedna dvojice středních hodnot se liší 3 K testování použijeme jednofaktorovou analýzu rozptylu. Nejprve ověříme normalitu proměnné PRIJEM ve skupinách obyvatel Skandinávie, Středomoří a západní Evropy pomocí S- W testu a pomoci normálního pravděpodobnostního grafu: Oček. normál. hodnoty,0,5,0 0,5 0,0-0,5 -,0 -,5 -,0 5 0 5 0 5 30 35 40 45 50,0,5,0 0,5 0,0-0,5 -,0 -,5 Puvod: Skandinavie -,0 5 0 5 0 5 30 35 40 45 50 Puvod: Skandinavie Prijem: SW-W = 0,95; p = 0,657 Puvod: Zapadni Evropa Puvod: Stredomori Prijem: SW-W = 0,966; p = 0,307 Puvod: Zapadni Evropa Prijem: SW-W = 0,969; Pozorovaný p = 0,8377 kvantil 5 0 5 0 5 30 35 40 45 50 Puvod: Stredomori Hypotézu o normalitě proměnné PRIJEM nezamítáme na hladině významnosti 0,05 ani v jednom případě.

Spočteme číselné charakteristiky proměnné PRIJEM v daných třech skupinách: Puvod Prijem průměr Prijem N Prijem Sm.odch. Skandinavie 3,09 6,43 Stredomori,6 3 9,8 Zapadni Evropa 8,88 8 8,38 Vš.skup. 7,44 3 8,93 Průměrný nejvyšší příjem mají obyvatelé Skandinávie, nejnižší obyvatelé Středomoří. Nejnižší variabilitu příjmů vykazují obyvatelé Skandinávie. Nakreslíme krabicové diagramy: 50 45 40 35 30 Prijem 5 0 5 0 5 0 Stredomori Zapadni Evropa Skandinavie Průměr Průměr±SmOdch Průměr±,96*SmOdch Hypotézu o shodě rozptylů proměnné PRIJEM v daných třech skupinách ověříme pomocí Brownova Forsytheova testu: Proměnná SČ SV PČ SČ SV PČ F Prijem 53,6357 6,8785 83,8330 9 8,40804 0,94404 0,40069 Testová statistika Brownova Forsytheova testu nabývá hodnoty 0,944, odpovídající p-hodnota je 0,4, tedy na hladině významnosti 0,05 nezamítáme hypotézu o shodě rozptylů. p

Nyní provedeme test hypotézy o shodě středních hodnot. Proměnná SČ SV PČ SČ SV PČ F Prijem 557,040 78,5070 94,86 9 66,0969 4,7905 0,04666 Testová statistika jednofaktorové analýzy rozptylu se realizuje hodnotou 4,8, odpovídající p-hodnota je 0,047, tedy na hladině významnosti 0,05 zamítáme hypotézu o shodě středních hodnot příjmů obyvatel Skandinávie, Středomoří a západní Evropy. Použijeme Scheffého metodu mnohonásobného porovnávání, abychom našli dvojice zemí s odlišnou střední hodnotou příjmů Puvod Skandinavie {} Stredomori {} Zapadni Evropa {3} {} M=3,09 {} M=,65 {3} M=8,875 0,08087 0,698895 0,08087 0,46690 0,698895 0,46690 Na hladině významnosti 0,05 se liší střední hodnota příjmů obyvatel Skandinávie a Středomoří. p

Závěr Při analýze datového souboru jsme došli k těmto závěrům: V souboru 3 osob je stejný počet mužů a žen. 34,4% osob pochází ze Skandinávie, 40,6% ze Středomoří a 5% ze západní Evropy. Na hladině významnosti 0,05 jsme neprokázali, že by se lišily střední hodnoty IQ mužů (m = 5) a žen (m = 5,5). Na hladině významnosti 0,05 jsme neprokázali, že by se lišily střední hodnoty IQ obyvatel Skandinávie (m = ), Středomoří (4,6) a západní Evropy (,6). Na hladině významnosti 0,05 jsme prokázali, že mediány BMI se liší pro muže (x 0,50 = 3,99) a pro ženy (y 0,50 = 8,63). Na hladině významnosti 0,05 jsme neprokázali, že by se lišily střední hodnoty BMI obyvatel Skandinávie (m =,4), Středomoří (m = 0,7) a západní Evropy (m 3 =,7). Na hladině významnosti 0,05 jsme neprokázali, že by se lišily střední hodnoty příjmů mužů (m = 30 80 euro) a žen (m = 4 594 euro). Na hladině významnosti 0,05 jsme prokázali, že se liší střední hodnoty příjmů obyvatel Skandinávie (m = 3 09 euro), Středomoří (m = 65 euro) a západní Evropy (m 3 = 8 875 euro).