TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce Statistický rozbor dat z dotazníkového šetření Analýza výsledků dotazníkového šetření - fakultní dotazník Vypracovaly: Klára Habrová, Jana Vitvarová Kateřina Doulová, Martina Netíková Gabriela Pecháčková, Lenka Kulhánková Počet stran: 10 Datum odevzdání: 11. 5. 2016
Úvod V rámci této práce bude provedena analýza výsledků dotazníkového šetření, ke zpracování údajů bude použit program Statgraphics Centurion XVII. Všechny hypotézy v této semestrální práci budou testovány na hladině významnosti 5 %. Jednotlivé kapitoly práce zodpovídají následující otázky: 1) Má rovnoměrné rozdělení barva auta u vozů s výkonem vyšším než 70 kw? 2) Otestujte, zdali je u naftových modelů skutečná spotřeba vyšší než spotřeba udávaná výrobcem. 3) Navštěvují celkově servis častěji muži, nebo ženy? Otestujte příslušnou hypotézu. 2
1. Má rovnoměrné rozdělení barva auta u vozů s výkonem vyšším než 70 kw? Ke zjištění rovnoměrného rozdělení barev aut u vozů s výkonem vyšším než 70 kw byl využit neparametrický test test dobré shody. Pomocí funkce Sort data byla vybrána z celkového počtu aut ta, která mají výkon vyšší než 70 kw. Celkový počet aut se tedy snížil z 256 jednotek na pouhých 153. Následující histogram rozdělení četností shrnuje počty jednotlivých barev aut. Obr. 1: Rozdělení barev aut Zdroj: vlastní zpracování Hypotéza Nulová hypotéza vyjadřuje předpoklad rovnoměrného rozdělení četností. Alternativní hypotéza tento předpoklad vyučuje. H 0 : π i = π 0,i i = 1, 2,, k H i : non H 0 Testové kritérium Testovým kritériem je taková statistika, která má při platnosti nulové hypotézy známé pravděpodobnostní rozdělení. G = 3
Kritický obor Kritický obor zahrnuje takové hodnoty, které jsou při platnosti nulové hypotézy natolik extrémní, že jejich pravděpodobnost výskytu je velice malá. Je to tedy oblast hodnot, které svědčí pro přijetí hypotézy alternativní. W W W Do kritického oboru tedy spadají hodnoty, které jsou větší nebo rovny hodnotě 11,07. Výpočet testového kritéria Následující tabulka shrnuje výpočty potřebné ke zjištění hodnoty testového kritéria. Tabulka 1: Výpočty x i n i n i ' π 0,i (n i -n i ') 2 Bílá 58 25,5 1/6 1056,25 Černá 37 25,5 1/6 132,25 Červená 17 25,5 1/6 72,25 Modrá 10 25,5 1/6 240,25 Stříbrná 24 25,5 1/6 2,25 Zelená 7 25,5 1/6 342,25 153 153 1 1845,5 Zdroj: vlastní zpracování Podmínka na požadovaný rozsah výběru: n π 0,i > 5 pro i = 1, 2,, k G = 72,37255 Závěr testu G є W H 0 zamítáme, přijímáme H 1 Na hladině významnosti 5 % zamítáme hypotézu o rovnoměrnosti rozdělení barev aut u vozů s výkonem vyšším než 70kW. 4
2. Otestujte, zdali je u naftových modelů skutečná spotřeba vyšší než spotřeba udávaná výrobcem Pro otestování této hypotézy bylo nezbytné nejprve vybrat pouze naftové modely ze základního souboru naftových a benzinových paliv. Na základě těchto hodnot a příslušných hodnot skutečné spotřeby a spotřeby udávané výrobcem bylo možné stanovit hypotézu. Hypotéza Nyní byla formulována hypotéza testu shody středních hodnot dvou normálních rozdělení. Hladina významnosti je stanovena na 5%. µ 1 střední hodnota udávané spotřeby µ 2 střední hodnota skutečné spotřeby n 1 rozsah souboru udávané spotřeby n 2 rozsah souboru skutečné spotřeby Testové kritérium Při volbě testového kritéria je nezbytné ověřit shodu rozptylů. a) Formulace hypotéz b) Testové kritérium Testové kritérium je vhodná statistika, která má při platnosti H 0 známé pravděpodobnostní rozdělení. c) Kritický obor Kritický obor je tvořen množinou hodnot testového kritéria, které jsou při platnosti H 0 tak extrémní, že pravděpodobnost jejich výskytu je velmi malá. n 1 = 113 n 2 = 113 5
d) Výpočet testového kritéria e) Závěr testu Hodnota testového kritéria splňuje podmínku kritického oboru, a tudíž zamítáme nulovou hypotézu a přijímáme alternativní. SGP: P-value = 0,016 0,05 Na hladině významnosti 5 % bylo prokázáno, že rozptyly se nerovnají. V dalších výpočtech tudíž pracujeme s předpokladem neshody rozptylů. Kritický obor Výpočet testového kritéria Závěr testu Hodnota testového kritéria nesplňuje podmínku kritického oboru, a tudíž nezamítáme nulovou hypotézu a nepřijímáme alternativní. 6
t W SGP: P-Value= 0,428919 > 0,05 Na hladině významnosti 5 % jsme neprokázaly, že skutečná hodnota spotřeby je vyšší než hodnota udávaná výrobcem. 7
3. Navštěvují celkově servis častěji muži, nebo ženy? Otestujte příslušnou hypotézu Nejprve bylo nutné stanovit počet žen a počet mužů ve zkoumaném souboru návštěvníků autoservisu. Tyto údaje byly zjištěny v programu Statgraphics za pomocí tabulky rozdělení četností slovní proměnné. Celkem je v souboru návštěvníků servisu 256 osob, z nichž je 142 mužů a 114 žen. Toto rozložení pohlaví zákazníků je znázorněno na obrázku č. 2. Kolacovy graf navstevnosti autoservisu dle pohlavi Pohlavi M Z 114 (44,53%) 142 (55,47%) Obr. 2: Koláčový graf návštěvnosti autoservisu dle pohlaví Zdroj: Vlastní zpracování Pomocí těchto četností je určen podíl mužů a žen na celkovém počtu návštěvníků autoservisu: podíl mužů p 1 : podíl žen p 2 : 8
Hypotéza Následující krok spočívá ve formulování hypotézy testu parametru π alternativního rozdělení v případě velkých výběrů. Určí se H 0 a H 1. Hladina významnosti je stanovena na 5 %. H 0 : π = 0,5 H 1 : π >0,5 Jelikož se jedná o dichotomickou proměnnou lze předpokládat, že muži mají stejné zastoupení v základním souboru jako ženy. Hodnota π 0 tedy odpovídá 0,5. Testové kritérium Testové kritérium je vhodná statistika, která má při platnosti H 0 známé pravděpodobnostní rozdělení. Kritický obor Kritický obor je tvořen množinou hodnot testového kritéria, které jsou při platnosti H 0 tak extrémní, že pravděpodobnost jejich výskytu je velmi malá. Výpočet testového kritéria Pro výpočet testového kritéria byl použit podíl mužů na celkovém počtu návštěvníků servisu p 1. Hodnota π 0 odpovídá 0,5, jak již bylo zmíněno výše. Závěr testu Hodnota testového kritéria splňuje podmínku kritického oboru, a tudíž zamítáme nulovou hypotézu a přijímáme alternativní. í á í á 9
Kontrola v programu Statgraphics: V programu lze provést hypotézu pro binomické rozdělení na hladině významnosti 5 %, z čehož vychází hodnota P - Value = 0,0457534. Jelikož je tato hodnota menší než α = 0,05 zamítáme nulovou hypotézu a přijímáme hypotézu alternativní. Na hladině významnosti 5 % bylo prokázáno, že muži navštěvují servis stejně často jako ženy. V případě potřeby lze snížit hladinu významnosti, kde by se daná nulová hypotéza již zamítla. 10