TECHNICKÁ UNIVERZITA V LIBERCI

Podobné dokumenty
TECHNICKÁ UNIVERZITA V LIBERCI

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

TECHNICKÁ UNIVERZITA V LIBERCI. Statistický rozbor dat z dotazníkového šetření

Technická univerzita v Liberci

TECHNICKÁ UNIVERZITA V LIBERCI

TECHNICKÁ UNIVERZITA V LIBERCI

TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

TECHNICKÁ UNIVERZITA V LIBERCI

TECHNICKÁ UNIVERZITA V LIBERCI EKONOMICKÁ FAKULTA

You created this PDF from an application that is not licensed to print to novapdf printer (

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Zápočtová práce STATISTIKA I

Testování hypotéz. 4. přednáška

Jednofaktorová analýza rozptylu

Charakteristika datového souboru

Vzorová prezentace do předmětu Statistika

Korelace. Komentované řešení pomocí MS Excel

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Normální (Gaussovo) rozdělení

= = 2368

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Ing. Michael Rost, Ph.D.

Testování statistických hypotéz

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

12. cvičení z PST. 20. prosince 2017

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.

Příklad: Test nezávislosti kategoriálních znaků

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Stručný úvod do testování statistických hypotéz

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

Intervalové odhady. Interval spolehlivosti pro střední hodnotu v N(µ, σ 2 ) Interpretace intervalu spolehlivosti. Interval spolehlivosti ilustrace

Testování statistických hypotéz. Obecný postup

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Normální (Gaussovo) rozdělení

ADDS cviceni. Pavlina Kuranova

ČESKÉ VYSOKÉ UČENÍ TECHNICKÉ V PRAZE FAKULTA DOPRAVNÍ

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Testy statistických hypotéz

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

Pravděpodobnost a aplikovaná statistika

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování statistických hypotéz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Testy. Pavel Provinský. 19. listopadu 2013

4EK211 Základy ekonometrie

Náhodné veličiny, náhodné chyby

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

4ST201 STATISTIKA CVIČENÍ Č. 7

SOFTWARE STAT1 A R. Literatura 4. kontrolní skupině (viz obr. 4). Proto budeme testovat shodu středních hodnot µ 1 = µ 2 proti alternativní

KONTINGENČNÍ TABULKY Komentované řešení pomocí programu Statistica

Statistické metody uţívané při ověřování platnosti hypotéz

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

STATISTICKÉ HYPOTÉZY

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

6. Testování statistických hypotéz. KGG/STG Zimní semestr 6. Testování statistických hypotéz

Statistika. Testování hypotéz statistická indukce Neparametrické testy. Roman Biskup

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Tomáš Karel LS 2012/2013

Parametrické testy hypotéz o středních hodnotách spojitých náhodných veličin

5. Závislost dvou náhodných veličin různých typů (kategoriální a metrická veličina)

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika

Stav Svobodný Rozvedený Vdovec. Svobodná Rozvedená Vdova 5 8 6

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Jednostranné intervaly spolehlivosti

Opakování: Nominální proměnná více hodnotová odpověď.

Návrh a vyhodnocení experimentu

Neparametrické metody

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

Neparametrické testy

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

ADDS cvičení 7. Pavlína Kuráňová

KORELACE. Komentované řešení pomocí programu Statistica

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Vymezení důležitých pojmů. nulová hypotéza, alternativní hypotéza testování hypotézy hladina významnosti (alfa) chyba I. druhu, chyba II.

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

PRAVDĚPODOBNOST A STATISTIKA

TEHNICKA UNIVERZITA V LIBERCI. Ekonomická fakulta

Aproximace binomického rozdělení normálním

Seminář 6 statistické testy

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.

12. prosince n pro n = n = 30 = S X

Jednovýběrové testy. Komentované řešení pomocí MS Excel

STATISTICKÉ TESTY VÝZNAMNOSTI

Protokol č. 1. Tloušťková struktura. Zadání:

letní semestr 2012 Katedra pravděpodobnosti a matematické statistiky Matematicko-fyzikální fakulta Univerzity Karlovy Matematická statistika t-test

Transkript:

TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce STATISTICKÝ ROZBOR DAT Z DOTAZNÍKOVÉHO ŠETŘENÍ Vypracovaly: Renata Němcová, Andrea Zuzánková, Lenka Vítová, Michaela Ťukalová, Kristýna Žižková Počet stran: 14 Datum odevzdání: 13. 5. 2016

Obsah Úvod... 3 1. Lze přijmout hypotézu, že spotřeba benzínu u modelu Kuga má normální rozdělení? Jaké má tato veličiny charakteristiky úrovně a variability?... 4 2. Je pravda, že naftové motory u modelu Fiesta a Kuga mají stejnou průměrnou spotřebu?... 6 3. Jaký je minimální testovaný rozdíl středních hodnot skutečné spotřeby u benzínových modelů B-Max a Fiesta, kdy nezamítáme nulovou hypotézu o shodě středních hodnot spotřeb? Hodnotu uveďte na 2 desetinná místa.... 9 Seznam obrázků... 14 2

Úvod Tato seminární práce z předmětu Statistický rozbor dat z dotazníkových šetření slouží k procvičení statistických metod, které jsme získaly v průběhu studia. Cílem práce je získání odpovědí na tři výzkumné otázky. K řešení těchto otázek jsme využily statistické metody a program STATGRAPHICS XVII Centurion. V celé práci jsme zjišťovaly odpovědi na tyto úkoly: 1. Lze přijmout hypotézu, že spotřeba benzínu u modelu Kuga má normální rozdělení? Jaké má tato veličiny charakteristiky úrovně a variability? 2. Je pravda, že naftové motory u modelu Fiesta a Kuga mají stejnou průměrnou spotřebu? 3. Jaký je minimální testovaný rozdíl středních hodnot skutečné spotřeby u benzínových modelů B-Max a Fiesta, kdy nezamítáme nulovou hypotézu o shodě středních hodnot spotřeb? 3

1. Lze přijmout hypotézu, že spotřeba benzínu u modelu Kuga má normální rozdělení? Jaké má tato veličiny charakteristiky úrovně a variability? χ 2 test dobré shody/kolmogorovův-smirnovův test V tomto případě se jedná o neúplně specifikovaný test. Formulace hypotéz: H 0 : Skutečná spotřeba má normální rozdělení (μ) H 1 : non H 0 Obrázek 1: Summary Statistics pro benzinový motor modelu Kuga Z tabulky souhrnné statistiky vyplývá, že průměrná skutečná spotřeba benzinu u modelu Kuga je 6,08 l. 50% automobilů Kuga má spotřebu 5,95 l a menší a 50% těchto automobilů má spotřebu 5,95 l a více. Nejčastější spotřeba benzinu je 5,8 l. Rozptyl má hodnotu 0,57 a směrodatná odchylka, tzn. průměrná spotřeba jednotlivých modelů Kuga se průměrně liší od svého aritmetického průměru o zhruba 0,76 l. Počet automobilů Kuga je roven 10, proto nemůžeme použít χ 2 test dobré shody. Tento test je použitelný pouze v případě velkých výběrů. Místo χ 2 testu dobré shody však použijeme Kolmogorovův-Smirnovův test, který je více citlivý. 4

Obrázek 2: Kolmogorovův-Smirnovův test Obrázek 3: Histogram pro benzinový motor modelu Kuga P-Value = 0,780931 > Alpha = 0,05 Na 5% hladině významnosti jsme nezamítly, že skutečná spotřeba benzínu u modelu Kuga má normální rozdělení. Křivka normálního rozdělení je patrná také z histogramu. 5

2. Je pravda, že naftové motory u modelu Fiesta a Kuga mají stejnou průměrnou spotřebu? Test shody středních hodnot dvou normálních rozdělení průměrná skutečná spotřeba naftového motoru modelu Fiesta průměrná skutečná spotřeba naftového motoru modelu Kuga Řešení ve Statgraphics: H 0 : H 1 : Nejdříve musíme zjistit rovnost rozptylů obou proměnných, protože se promítá do H 0 : H 1 : Obrázek 4: Summary Statistics pro naftové motory modelů Fiesta a Kuga Obrázek 5: Hypothesis Tests pro Normal Sigmas 6

P-Value = 0,298388 > Alpha = 0,05 Computed F statistic = 0,519633 Na 5% hladině významnosti nezamítáme, že jsou rozptyly skutečné spotřeby u naftových motorů modelů Kuga a Fiesta stejné. Můžeme pokračovat v testování: Obrázek 6: Hypothesis Tests pro Normal Means P-Value = 0,0162005 < Alpha = 0,05 Computed t statistic = -2,49617 Na 5% hladině významnosti jsme prokázaly, že průměrná spotřeba naftových motorů u modelu Kuga a Fiesta se liší. 7

Řešení početně: 1. H 0 : H 1 : Východisko: známe a (ověřily jsme ve Statgraphics, že se rovnají) 2. Testové kritérium: 3. Kritický obor: 4. 5. H 0 zamítáme H 1 přijímáme Stejně jako ve Statgraphics, na 5% hladině významnosti jsme přijaly alternativní hypotézu a tím prokázaly, že naftové motory u modelu Fiesta a Kuga mají různou průměrnou spotřebu. 8

3. Jaký je minimální testovaný rozdíl středních hodnot skutečné spotřeby u benzínových modelů B-Max a Fiesta, kdy nezamítáme nulovou hypotézu o shodě středních hodnot spotřeb? Hodnotu uveďte na 2 desetinná místa. průměrná skutečná spotřeba benzinového motoru modelu B-Max průměrná skutečná spotřeba benzinového motoru modelu FIesta Řešení ve Statgraphics: Nejdříve ověříme hypotézu, že se střední hodnoty obou výběrů rovnají. H 0 : H 1 : Nejdříve musíme zjistit rovnost rozptylů obou proměnných, protože se promítají do H 0 : H 1 : Obrázek 7: Summary Statisticspro benzínové motory modelů B-Max a Fiesta 9

Obrázek 8: Hypothesis Test pro Normal Sigmas P-Value = 0,957127 > Alpha = 0,05 Computed F statistic = 0,952879 Na 5% hladině významnosti nezamítáme, že se rozptyly skutečné spotřeby u benzínových modelů B-Max a Fiesta shodují. Můžeme pokračovat v testování: 10

Obrázek 9: Hypothesis Tests pro Normal Means P-Value = 2,22045e -16 < Alpha = 0,05 Computed t statistic = -10,1113 Na 5% hladině významnosti zamítáme hypotézu, že střední hodnoty benzínových modelů B-Max a Fiesta jsou stejné. P-Value je příliš malé na to, aby nulová hypotéza mohla být přijata. Je tedy nutné upravovat (snižovat) nulovou hypotézu do té doby, než se P-Value zvýší natolik, aby bylo možné ji přijmout. 11

Obrázek 10: Hypothesis Tests pro Normal Means H0 = -2,32 P-Value = 0,0494457 < Alpha = 0,05 Computed t statistic = -1,99192 Maximální testovaný rozdíl, kdy nulovou hypotézu stále musíme zamítnout 12

Obrázek 11: Hypothesis Tests pro Normal Means H0 = -2,33 P-Value = 0,0534916 > Alpha = 0,05 Computed t statistic = -1,95692 Minimální testovaný rozdíl, kdy nulovou hypotézu nemůžeme zamítnout. Střední hodnota průměrné skutečné spotřeby benzinového motoru modelu M-Max je menší o 2,33 l/100 km než střední hodnota průměrné skutečné spotřeby benzinového motoru modelu Fiesta. 13

Seznam obrázků Obrázek 1: Summary Statistics pro benzinový motor modelu Kuga... 4 Obrázek 2: Kolmogorovův-Smirnovův test... 5 Obrázek 3: Histogram pro benzinový motor modelu Kuga... 5 Obrázek 4: Summary Statistics pro naftové motory modelů Fiesta a Kuga... 6 Obrázek 5: Hypothesis Tests pro Normal Sigmas... 6 Obrázek 6: Hypothesis Tests pro Normal Means... 7 Obrázek 7: Summary Statisticspro benzínové motory modelů B-Max a Fiesta... 9 Obrázek 8: Hypothesis Test pro Normal Sigmas... 10 Obrázek 9: Hypothesis Tests pro Normal Means... 11 Obrázek 10: Hypothesis Tests pro Normal Means H0 = -2,32... 12 Obrázek 11: Hypothesis Tests pro Normal Means H0 = -2,33... 13 14