TECHNICKÁ UNIVERZITA V LIBERCI. Statistický rozbor dat z dotazníkového šetření

Podobné dokumenty
TECHNICKÁ UNIVERZITA V LIBERCI

Technická univerzita v Liberci

TECHNICKÁ UNIVERZITA V LIBERCI

TECHNICKÁ UNIVERZITA V LIBERCI

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta

TECHNICKÁ UNIVERZITA V LIBERCI

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

TECHNICKÁ UNIVERZITA V LIBERCI

TECHNICKÁ UNIVERZITA V LIBERCI EKONOMICKÁ FAKULTA

Aproximace binomického rozdělení normálním

Testy. Pavel Provinský. 19. listopadu 2013

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Příklad: Test nezávislosti kategoriálních znaků

Testování hypotéz. 4. přednáška

Zápočtová práce STATISTIKA I

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

4ST201 STATISTIKA CVIČENÍ Č. 7

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

You created this PDF from an application that is not licensed to print to novapdf printer (

Vzorová prezentace do předmětu Statistika

Testování hypotéz testy o tvaru rozdělení. Jiří Neubauer. Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel

Testování hypotéz. testujeme (většinou) tvrzení o parametru populace. tvrzení je nutno předem zformulovat

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Testování statistických hypotéz

Lékařská biofyzika, výpočetní technika I. Biostatistika Josef Tvrdík (doc. Ing. CSc.)

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.

Ing. Michael Rost, Ph.D.

12. cvičení z PST. 20. prosince 2017

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

Máte rádi kávu? Statistický výzkum o množství vypité kávy napříč věkovým spektrem.

Statistika, Biostatistika pro kombinované studium. Jan Kracík

Problematika analýzy rozptylu. Ing. Michael Rost, Ph.D.

Pravděpodobnost a matematická statistika

PRAVDĚPODOBNOST A STATISTIKA

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

Cvičení ze statistiky - 8. Filip Děchtěrenko

TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ ZÁKLADNÍ POJMY

Statistické metody uţívané při ověřování platnosti hypotéz

Testování statistických hypotéz

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

= = 2368

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Pravděpodobnost a aplikovaná statistika

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

Jednostranné intervaly spolehlivosti

Tomáš Karel LS 2012/2013

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Přednáška X. Testování hypotéz o kvantitativních proměnných

Semestrální práce z předmětu Matematika 6F

Katedra matematické analýzy a aplikací matematiky, Přírodovědecká fakulta, UP v Olomouci

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Tomáš Karel LS 2012/2013

Testování statistických hypotéz. Obecný postup

Testování statistických hypotéz

ANOVA. Semestrální práce UNIVERZITA PARDUBICE. Fakulta chemicko-technologická Katedra analytické chemie

Epidemiologické ukazatele. lních dat. analýza kategoriáln. Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat. a I E

analýza kategoriáln lních dat Prof. RNDr. Jana Zvárová, DrSc. Záznam epidemiologických dat Epidemiologické ukazatele

SEMESTRÁLNÍ PRÁCE. Leptání plasmou. Ing. Pavel Bouchalík

Analýza rozptylu. Ekonometrie. Jiří Neubauer. Katedra kvantitativních metod FVL UO Brno kancelář 69a, tel

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

12. cvičení z PSI prosince (Test střední hodnoty dvou normálních rozdělení se stejným neznámým rozptylem)

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

Návrhy dalších možností statistického zpracování aktualizovaných dat

Rozhodnutí / Skutečnost platí neplatí Nezamítáme správně chyba 2. druhu Zamítáme chyba 1. druhu správně

Charakteristika datového souboru

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

STATISTICKÉ HYPOTÉZY

Testy statistických hypotéz

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Rozdělení přenosové rychlosti disku

MATEMATIKA III V PŘÍKLADECH

PARAMETRICKÉ TESTY. 1) Měření Etalonu. Dataset - mereni_etalonu.sta - 9 měření etalonu srovnáváme s PŘEDPOKLÁDANOU HODNOTOU 10.

Jednofaktorová analýza rozptylu

Testy o proporci a testy v multinomickém rozdělení

Statistika. Testování hypotéz statistická indukce Úvod do problému. Roman Biskup

Náhodné veličiny, náhodné chyby

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

5 Parametrické testy hypotéz

Normální (Gaussovo) rozdělení

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

Návrh a vyhodnocení experimentu

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

DVOUVÝBĚROVÉ A PÁROVÉ TESTY Komentované řešení pomocí programu Statistica

Stav Svobodný Rozvedený Vdovec. Svobodná Rozvedená Vdova 5 8 6

ADDS cviceni. Pavlina Kuranova

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

LIMITY APLIKACE STATISTICKÝCH TESTŮ VÝZNAMNOSTI V PEDAGOGICKÉM VÝZKUMU: SEMINÁŘ PRO NESTATISTIKY

7.1. Podstata testu statistické hypotézy

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

UNIVERZITA PARDUBICE Fakulta chemicko-technologická Katedra analytické chemie. Nám. Čs. Legií 565, Pardubice. Semestrální práce ANOVA 2015

Statistika. Testování hypotéz statistická indukce Neparametrické testy. Roman Biskup

Transkript:

TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce Statistický rozbor dat z dotazníkového šetření Analýza výsledků dotazníkového šetření - fakultní dotazník Vypracovaly: Klára Habrová, Jana Vitvarová Kateřina Doulová, Martina Netíková Gabriela Pecháčková, Lenka Kulhánková Počet stran: 10 Datum odevzdání: 11. 5. 2016

Úvod V rámci této práce bude provedena analýza výsledků dotazníkového šetření, ke zpracování údajů bude použit program Statgraphics Centurion XVII. Všechny hypotézy v této semestrální práci budou testovány na hladině významnosti 5 %. Jednotlivé kapitoly práce zodpovídají následující otázky: 1) Má rovnoměrné rozdělení barva auta u vozů s výkonem vyšším než 70 kw? 2) Otestujte, zdali je u naftových modelů skutečná spotřeba vyšší než spotřeba udávaná výrobcem. 3) Navštěvují celkově servis častěji muži, nebo ženy? Otestujte příslušnou hypotézu. 2

1. Má rovnoměrné rozdělení barva auta u vozů s výkonem vyšším než 70 kw? Ke zjištění rovnoměrného rozdělení barev aut u vozů s výkonem vyšším než 70 kw byl využit neparametrický test test dobré shody. Pomocí funkce Sort data byla vybrána z celkového počtu aut ta, která mají výkon vyšší než 70 kw. Celkový počet aut se tedy snížil z 256 jednotek na pouhých 153. Následující histogram rozdělení četností shrnuje počty jednotlivých barev aut. Obr. 1: Rozdělení barev aut Zdroj: vlastní zpracování Hypotéza Nulová hypotéza vyjadřuje předpoklad rovnoměrného rozdělení četností. Alternativní hypotéza tento předpoklad vyučuje. H 0 : π i = π 0,i i = 1, 2,, k H i : non H 0 Testové kritérium Testovým kritériem je taková statistika, která má při platnosti nulové hypotézy známé pravděpodobnostní rozdělení. G = 3

Kritický obor Kritický obor zahrnuje takové hodnoty, které jsou při platnosti nulové hypotézy natolik extrémní, že jejich pravděpodobnost výskytu je velice malá. Je to tedy oblast hodnot, které svědčí pro přijetí hypotézy alternativní. W W W Do kritického oboru tedy spadají hodnoty, které jsou větší nebo rovny hodnotě 11,07. Výpočet testového kritéria Následující tabulka shrnuje výpočty potřebné ke zjištění hodnoty testového kritéria. Tabulka 1: Výpočty x i n i n i ' π 0,i (n i -n i ') 2 Bílá 58 25,5 1/6 1056,25 Černá 37 25,5 1/6 132,25 Červená 17 25,5 1/6 72,25 Modrá 10 25,5 1/6 240,25 Stříbrná 24 25,5 1/6 2,25 Zelená 7 25,5 1/6 342,25 153 153 1 1845,5 Zdroj: vlastní zpracování Podmínka na požadovaný rozsah výběru: n π 0,i > 5 pro i = 1, 2,, k G = 72,37255 Závěr testu G є W H 0 zamítáme, přijímáme H 1 Na hladině významnosti 5 % zamítáme hypotézu o rovnoměrnosti rozdělení barev aut u vozů s výkonem vyšším než 70kW. 4

2. Otestujte, zdali je u naftových modelů skutečná spotřeba vyšší než spotřeba udávaná výrobcem Pro otestování této hypotézy bylo nezbytné nejprve vybrat pouze naftové modely ze základního souboru naftových a benzinových paliv. Na základě těchto hodnot a příslušných hodnot skutečné spotřeby a spotřeby udávané výrobcem bylo možné stanovit hypotézu. Hypotéza Nyní byla formulována hypotéza testu shody středních hodnot dvou normálních rozdělení. Hladina významnosti je stanovena na 5%. µ 1 střední hodnota udávané spotřeby µ 2 střední hodnota skutečné spotřeby n 1 rozsah souboru udávané spotřeby n 2 rozsah souboru skutečné spotřeby Testové kritérium Při volbě testového kritéria je nezbytné ověřit shodu rozptylů. a) Formulace hypotéz b) Testové kritérium Testové kritérium je vhodná statistika, která má při platnosti H 0 známé pravděpodobnostní rozdělení. c) Kritický obor Kritický obor je tvořen množinou hodnot testového kritéria, které jsou při platnosti H 0 tak extrémní, že pravděpodobnost jejich výskytu je velmi malá. n 1 = 113 n 2 = 113 5

d) Výpočet testového kritéria e) Závěr testu Hodnota testového kritéria splňuje podmínku kritického oboru, a tudíž zamítáme nulovou hypotézu a přijímáme alternativní. SGP: P-value = 0,016 0,05 Na hladině významnosti 5 % bylo prokázáno, že rozptyly se nerovnají. V dalších výpočtech tudíž pracujeme s předpokladem neshody rozptylů. Kritický obor Výpočet testového kritéria Závěr testu Hodnota testového kritéria nesplňuje podmínku kritického oboru, a tudíž nezamítáme nulovou hypotézu a nepřijímáme alternativní. 6

t W SGP: P-Value= 0,428919 > 0,05 Na hladině významnosti 5 % jsme neprokázaly, že skutečná hodnota spotřeby je vyšší než hodnota udávaná výrobcem. 7

3. Navštěvují celkově servis častěji muži, nebo ženy? Otestujte příslušnou hypotézu Nejprve bylo nutné stanovit počet žen a počet mužů ve zkoumaném souboru návštěvníků autoservisu. Tyto údaje byly zjištěny v programu Statgraphics za pomocí tabulky rozdělení četností slovní proměnné. Celkem je v souboru návštěvníků servisu 256 osob, z nichž je 142 mužů a 114 žen. Toto rozložení pohlaví zákazníků je znázorněno na obrázku č. 2. Kolacovy graf navstevnosti autoservisu dle pohlavi Pohlavi M Z 114 (44,53%) 142 (55,47%) Obr. 2: Koláčový graf návštěvnosti autoservisu dle pohlaví Zdroj: Vlastní zpracování Pomocí těchto četností je určen podíl mužů a žen na celkovém počtu návštěvníků autoservisu: podíl mužů p 1 : podíl žen p 2 : 8

Hypotéza Následující krok spočívá ve formulování hypotézy testu parametru π alternativního rozdělení v případě velkých výběrů. Určí se H 0 a H 1. Hladina významnosti je stanovena na 5 %. H 0 : π = 0,5 H 1 : π >0,5 Jelikož se jedná o dichotomickou proměnnou lze předpokládat, že muži mají stejné zastoupení v základním souboru jako ženy. Hodnota π 0 tedy odpovídá 0,5. Testové kritérium Testové kritérium je vhodná statistika, která má při platnosti H 0 známé pravděpodobnostní rozdělení. Kritický obor Kritický obor je tvořen množinou hodnot testového kritéria, které jsou při platnosti H 0 tak extrémní, že pravděpodobnost jejich výskytu je velmi malá. Výpočet testového kritéria Pro výpočet testového kritéria byl použit podíl mužů na celkovém počtu návštěvníků servisu p 1. Hodnota π 0 odpovídá 0,5, jak již bylo zmíněno výše. Závěr testu Hodnota testového kritéria splňuje podmínku kritického oboru, a tudíž zamítáme nulovou hypotézu a přijímáme alternativní. í á í á 9

Kontrola v programu Statgraphics: V programu lze provést hypotézu pro binomické rozdělení na hladině významnosti 5 %, z čehož vychází hodnota P - Value = 0,0457534. Jelikož je tato hodnota menší než α = 0,05 zamítáme nulovou hypotézu a přijímáme hypotézu alternativní. Na hladině významnosti 5 % bylo prokázáno, že muži navštěvují servis stejně často jako ženy. V případě potřeby lze snížit hladinu významnosti, kde by se daná nulová hypotéza již zamítla. 10