TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce STATISTICKÝ ROZBOR DAT Z DOTAZNÍKOVÉHO ŠETŘENÍ Vypracovaly: Renata Němcová, Andrea Zuzánková, Lenka Vítová, Michaela Ťukalová, Kristýna Žižková Počet stran: 14 Datum odevzdání: 13. 5. 2016
Obsah Úvod... 3 1. Lze přijmout hypotézu, že spotřeba benzínu u modelu Kuga má normální rozdělení? Jaké má tato veličiny charakteristiky úrovně a variability?... 4 2. Je pravda, že naftové motory u modelu Fiesta a Kuga mají stejnou průměrnou spotřebu?... 6 3. Jaký je minimální testovaný rozdíl středních hodnot skutečné spotřeby u benzínových modelů B-Max a Fiesta, kdy nezamítáme nulovou hypotézu o shodě středních hodnot spotřeb? Hodnotu uveďte na 2 desetinná místa.... 9 Seznam obrázků... 14 2
Úvod Tato seminární práce z předmětu Statistický rozbor dat z dotazníkových šetření slouží k procvičení statistických metod, které jsme získaly v průběhu studia. Cílem práce je získání odpovědí na tři výzkumné otázky. K řešení těchto otázek jsme využily statistické metody a program STATGRAPHICS XVII Centurion. V celé práci jsme zjišťovaly odpovědi na tyto úkoly: 1. Lze přijmout hypotézu, že spotřeba benzínu u modelu Kuga má normální rozdělení? Jaké má tato veličiny charakteristiky úrovně a variability? 2. Je pravda, že naftové motory u modelu Fiesta a Kuga mají stejnou průměrnou spotřebu? 3. Jaký je minimální testovaný rozdíl středních hodnot skutečné spotřeby u benzínových modelů B-Max a Fiesta, kdy nezamítáme nulovou hypotézu o shodě středních hodnot spotřeb? 3
1. Lze přijmout hypotézu, že spotřeba benzínu u modelu Kuga má normální rozdělení? Jaké má tato veličiny charakteristiky úrovně a variability? χ 2 test dobré shody/kolmogorovův-smirnovův test V tomto případě se jedná o neúplně specifikovaný test. Formulace hypotéz: H 0 : Skutečná spotřeba má normální rozdělení (μ) H 1 : non H 0 Obrázek 1: Summary Statistics pro benzinový motor modelu Kuga Z tabulky souhrnné statistiky vyplývá, že průměrná skutečná spotřeba benzinu u modelu Kuga je 6,08 l. 50% automobilů Kuga má spotřebu 5,95 l a menší a 50% těchto automobilů má spotřebu 5,95 l a více. Nejčastější spotřeba benzinu je 5,8 l. Rozptyl má hodnotu 0,57 a směrodatná odchylka, tzn. průměrná spotřeba jednotlivých modelů Kuga se průměrně liší od svého aritmetického průměru o zhruba 0,76 l. Počet automobilů Kuga je roven 10, proto nemůžeme použít χ 2 test dobré shody. Tento test je použitelný pouze v případě velkých výběrů. Místo χ 2 testu dobré shody však použijeme Kolmogorovův-Smirnovův test, který je více citlivý. 4
Obrázek 2: Kolmogorovův-Smirnovův test Obrázek 3: Histogram pro benzinový motor modelu Kuga P-Value = 0,780931 > Alpha = 0,05 Na 5% hladině významnosti jsme nezamítly, že skutečná spotřeba benzínu u modelu Kuga má normální rozdělení. Křivka normálního rozdělení je patrná také z histogramu. 5
2. Je pravda, že naftové motory u modelu Fiesta a Kuga mají stejnou průměrnou spotřebu? Test shody středních hodnot dvou normálních rozdělení průměrná skutečná spotřeba naftového motoru modelu Fiesta průměrná skutečná spotřeba naftového motoru modelu Kuga Řešení ve Statgraphics: H 0 : H 1 : Nejdříve musíme zjistit rovnost rozptylů obou proměnných, protože se promítá do H 0 : H 1 : Obrázek 4: Summary Statistics pro naftové motory modelů Fiesta a Kuga Obrázek 5: Hypothesis Tests pro Normal Sigmas 6
P-Value = 0,298388 > Alpha = 0,05 Computed F statistic = 0,519633 Na 5% hladině významnosti nezamítáme, že jsou rozptyly skutečné spotřeby u naftových motorů modelů Kuga a Fiesta stejné. Můžeme pokračovat v testování: Obrázek 6: Hypothesis Tests pro Normal Means P-Value = 0,0162005 < Alpha = 0,05 Computed t statistic = -2,49617 Na 5% hladině významnosti jsme prokázaly, že průměrná spotřeba naftových motorů u modelu Kuga a Fiesta se liší. 7
Řešení početně: 1. H 0 : H 1 : Východisko: známe a (ověřily jsme ve Statgraphics, že se rovnají) 2. Testové kritérium: 3. Kritický obor: 4. 5. H 0 zamítáme H 1 přijímáme Stejně jako ve Statgraphics, na 5% hladině významnosti jsme přijaly alternativní hypotézu a tím prokázaly, že naftové motory u modelu Fiesta a Kuga mají různou průměrnou spotřebu. 8
3. Jaký je minimální testovaný rozdíl středních hodnot skutečné spotřeby u benzínových modelů B-Max a Fiesta, kdy nezamítáme nulovou hypotézu o shodě středních hodnot spotřeb? Hodnotu uveďte na 2 desetinná místa. průměrná skutečná spotřeba benzinového motoru modelu B-Max průměrná skutečná spotřeba benzinového motoru modelu FIesta Řešení ve Statgraphics: Nejdříve ověříme hypotézu, že se střední hodnoty obou výběrů rovnají. H 0 : H 1 : Nejdříve musíme zjistit rovnost rozptylů obou proměnných, protože se promítají do H 0 : H 1 : Obrázek 7: Summary Statisticspro benzínové motory modelů B-Max a Fiesta 9
Obrázek 8: Hypothesis Test pro Normal Sigmas P-Value = 0,957127 > Alpha = 0,05 Computed F statistic = 0,952879 Na 5% hladině významnosti nezamítáme, že se rozptyly skutečné spotřeby u benzínových modelů B-Max a Fiesta shodují. Můžeme pokračovat v testování: 10
Obrázek 9: Hypothesis Tests pro Normal Means P-Value = 2,22045e -16 < Alpha = 0,05 Computed t statistic = -10,1113 Na 5% hladině významnosti zamítáme hypotézu, že střední hodnoty benzínových modelů B-Max a Fiesta jsou stejné. P-Value je příliš malé na to, aby nulová hypotéza mohla být přijata. Je tedy nutné upravovat (snižovat) nulovou hypotézu do té doby, než se P-Value zvýší natolik, aby bylo možné ji přijmout. 11
Obrázek 10: Hypothesis Tests pro Normal Means H0 = -2,32 P-Value = 0,0494457 < Alpha = 0,05 Computed t statistic = -1,99192 Maximální testovaný rozdíl, kdy nulovou hypotézu stále musíme zamítnout 12
Obrázek 11: Hypothesis Tests pro Normal Means H0 = -2,33 P-Value = 0,0534916 > Alpha = 0,05 Computed t statistic = -1,95692 Minimální testovaný rozdíl, kdy nulovou hypotézu nemůžeme zamítnout. Střední hodnota průměrné skutečné spotřeby benzinového motoru modelu M-Max je menší o 2,33 l/100 km než střední hodnota průměrné skutečné spotřeby benzinového motoru modelu Fiesta. 13
Seznam obrázků Obrázek 1: Summary Statistics pro benzinový motor modelu Kuga... 4 Obrázek 2: Kolmogorovův-Smirnovův test... 5 Obrázek 3: Histogram pro benzinový motor modelu Kuga... 5 Obrázek 4: Summary Statistics pro naftové motory modelů Fiesta a Kuga... 6 Obrázek 5: Hypothesis Tests pro Normal Sigmas... 6 Obrázek 6: Hypothesis Tests pro Normal Means... 7 Obrázek 7: Summary Statisticspro benzínové motory modelů B-Max a Fiesta... 9 Obrázek 8: Hypothesis Test pro Normal Sigmas... 10 Obrázek 9: Hypothesis Tests pro Normal Means... 11 Obrázek 10: Hypothesis Tests pro Normal Means H0 = -2,32... 12 Obrázek 11: Hypothesis Tests pro Normal Means H0 = -2,33... 13 14