TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta

Podobné dokumenty
TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

TECHNICKÁ UNIVERZITA V LIBERCI

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

TECHNICKÁ UNIVERZITA V LIBERCI

Technická univerzita v Liberci

TECHNICKÁ UNIVERZITA V LIBERCI

TECHNICKÁ UNIVERZITA V LIBERCI EKONOMICKÁ FAKULTA

TECHNICKÁ UNIVERZITA V LIBERCI. Statistický rozbor dat z dotazníkového šetření

TECHNICKÁ UNIVERZITA V LIBERCI

TECHNICKÁ UNIVERZITA V LIBERCI

Charakteristika datového souboru

Zápočtová práce STATISTIKA I

Testování hypotéz. 4. přednáška

TEHNICKA UNIVERZITA V LIBERCI. Ekonomická fakulta

12. cvičení z PST. 20. prosince 2017

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

SEMESTRÁLNÍ PRÁCE STATISTIKA

UKAZATELÉ VARIABILITY

4ST201 STATISTIKA CVIČENÍ Č. 7

INDUKTIVNÍ STATISTIKA

Vzorová prezentace do předmětu Statistika

Příklad: Test nezávislosti kategoriálních znaků

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

Tomáš Karel LS 2012/2013

Statistika. cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací!

Kontrola: Sečteme-li sloupec,,četnost výskytu musí nám vyjít hodnota rozsahu souboru (našich 20 žáků)

Statistické vyhodnocování ankety pilotního projektu Kvalita výuky na Západočeské univerzitě v Plzni

SAMOSTATNÁ STUDENTSKÁ PRÁCE ZE STATISTIKY

KGG/STG Statistika pro geografy

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:

Základy popisné statistiky

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Testy. Pavel Provinský. 19. listopadu 2013

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

Sever Jih Západ Plechovka Točené Sever Jih Západ Součty Plechovka Točené Součty

Z mých cvičení dostalo jedničku 6 studentů, dvojku 8 studentů, trojku 16 studentů a čtyřku nebo omluveno 10 studentů.

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

EXPERIMENTÁLNÍ MECHANIKA 2 Přednáška 5 - Chyby a nejistoty měření. Jan Krystek

Metodologie pro ISK II

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

MATEMATIKA III V PŘÍKLADECH

Stručný úvod do vybraných zredukovaných základů statistické analýzy dat

PRAVDĚPODOBNOST A STATISTIKA. Neparametrické testy hypotéz čast 1

Základní statistické charakteristiky

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

= = 2368

Protokol č. 1. Tloušťková struktura. Zadání:

Řešení: máme diskrétní N.V. vzdělání bez maturity, s maturitou, vysokoškoláci, PhD.

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

FORD KUGA KUGA_2014_V2_240x185 Cover.indd /08/ :16:19

, Brno Hanuš Vavrčík Základy statistiky ve vědě

Jarqueův a Beryho test normality (Jarque-Bera Test, JB test)

Výrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

Pearsonůvχ 2 test dobré shody. Ing. Michal Dorda, Ph.D.

Obecné momenty prosté tvary

Diskrétní náhodná veličina

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

Jana Vránová, 3. lékařská fakulta UK

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

VŠB Technická univerzita Ostrava Fakulta elektrotechniky a informatiky SMAD

Cvičení ze statistiky - 9. Filip Děchtěrenko

Číselné charakteristiky

Jednofaktorová analýza rozptylu


FORD MONDEO MON_2012_V3_MASTER_COVER_AW.indd 1 01/08/ :02

SEMESTRÁLNÍ PRÁCE Z PŘEDMĚTU STATISTIKY

Neparametrické metody

FORD FIESTA FIESTA_2013_240x185 Cover_V8.indd /12/ :54

MATEMATICKO STATISTICKÉ PARAMETRY ANALYTICKÝCH VÝSLEDKŮ

České vysoké učení technické v Praze Fakulta dopravní Ústav aplikované matematiky, K611. Semestrální práce ze Statistiky (SIS)

Průzkumová analýza dat

Statistická analýza jednorozměrných dat

Obecné, centrální a normované momenty

STATISTIKA A INFORMATIKA - bc studium OZW, 1.roč. (zkušební otázky)

ADDS cvičení 7. Pavlína Kuráňová

You created this PDF from an application that is not licensed to print to novapdf printer (

Stav Svobodný Rozvedený Vdovec. Svobodná Rozvedená Vdova 5 8 6

Normální (Gaussovo) rozdělení

Tomáš Karel LS 2012/2013

Cvičení ze statistiky - 8. Filip Děchtěrenko

STATISTICKÉ CHARAKTERISTIKY

Nejčastější chyby v explorační analýze

Statistika s Excelem aneb Máme data. A co dál? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

Jevy a náhodná veličina

Normální (Gaussovo) rozdělení

12. prosince n pro n = n = 30 = S X

Analýza dat na PC I.

Tomáš Karel LS 2012/2013

Mann-Whitney U-test. Znaménkový test. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

10. cvičení z PST. 5. prosince T = (n 1) S2 X. (n 1) s2 x σ 2 q χ 2 (n 1) (1 α 2 ). q χ 2 (n 1) 2. 2 x. (n 1) s. x = 1 6. x i = 457.

SOFTWARE STAT1 A R. Literatura 4. kontrolní skupině (viz obr. 4). Proto budeme testovat shodu středních hodnot µ 1 = µ 2 proti alternativní

Transkript:

TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta ANALÝZA VÝSLEDKŮ DOTAZNÍKOVÉHO ŠETŘENÍ (FAKULTNÍ DOTAZNÍK) semestrální práce z předmětu STATISTICKÝ ROZBOR DAT Z DOTAZNÍKOVÉHO ŠETŘENÍ Jan Kubiš, Kateřina Komárková, Jakub Nedorost, Eva Pešková, Adéla Picková, Alena Treperová

Obsah Úvod... 3 1. Charakterizujte variabilitu stáří jednotlivých modelů (absolutně i relativně).... 4 2. Otestujte, zdali jsou barva auta a pohlaví majitele nezávislé veličiny... 6 3. U modelu FIESTA na benzín otestujte shodu rozptylů skutečné spotřeby paliva u mužů a žen... 8 Závěr... 9 2

Úvod Cílem této semestrální práce bylo na základě obdrženého datového souboru provést statistický rozbor dat dle následujícího zadání: 1. Charakterizujte variabilitu stáří jednotlivých modelů (absolutně i relativně). 2. Otestujte, zdali jsou barva auta a pohlaví majitele nezávislé veličiny. 3. U modelu FIESTA na benzín otestujte shodu rozptylů skutečné spotřeby paliva u mužů a žen. 3

1. Charakterizujte variabilitu stáří jednotlivých modelů (absolutně i relativně). V této kapitole je naším cílem charakterizovat variabilitu stáří jednotlivých modelů automobilů značky Ford, a to absolutně i relativně. Charakteristiky variability nám udávají rozptýlení, neboli kolísání hodnot kolem zvoleného středu, např. kolem nějaké střední hodnoty. Zároveň ukazuje, jak kvalitní máme výběrová data čím jsou data kvalitnější, tím je kolísání hodnot kolem zvoleného středu menší. 1.1. Míry absolutní variability Variační rozpětí Označuje se písmenem R. Variační rozpětí vypočítáme pomocí rozdílu maximální a minimální hodnoty. Výsledek může být zkreslený zadanou extrémní hodnotou. Podle výpočtu v programu Statgraphics jsme zjistili, že pro jednotlivé modely je variační rozpětí následující: Tabulka 1: Variační rozpětí Kuga 14,0 Fiesta 18,0 Focus 18,0 Mondeo 9,0 B-Max 15,0 Rozptyl Rozptyl je vždy nezáporný <0, ). Udává rozptýlení hodnot kolem zvoleného středu. Je určen v jednotkách pozorování, ale v druhé mocnině. Výběrový rozptyl jednotlivých modelů získaný ze Statgraphicsu naleznete níže v tabulce. Tabulka 2: Rozptyl Kuga 13,6471 Fiesta 13,2398 Focus 15,0437 Mondeo 7,31667 B-Max 11,7635 4

Směrodatná odchylka Směrodatná odchylka se značí jako Sx a je vždy nezáporná. Vypočítává se jako kladná odmocniny z rozptylu. Je udána v jednotkách pozorování. Přestavuje nám, jak se v průměru liší jednotlivé hodnoty od aritmetického průměru v obou směrech, tedy v kladném i záporném. Následující hodnoty udávají, o kolik let mají jednotlivé modely více nebo méně let od aritmetického průměru. Jedná se o výběrovou směrodatnou odchylku získanou za pomoci programu Statgraphics. Tabulka 3: Směrodatná odchylka Kuga 3,69419 Fiesta 3,63866 Focus 3,87861 Mondeo 2,70493 B-Max 3,4298 1.2. Míry relativní variability Variační koeficient Značí se zkratkou Vx, je to bezrozměrné číslo, což znamená, že nemá měrné jednotky. Umožňuje porovnávat variabilitu souborů s různou úrovní nebo různými měrnými jednotkami. Nabývá hodnot (-, ). Výsledky níže v tabulce nám ukazují, z jaké části se směrodatná odchylka podílí na průměru. Tabulka 4: Variační koeficient Kuga 36,9419% Fiesta 35,4661% Focus 38,5452% Mondeo 29,6431% B-Max 38,4252% 5

2. Otestujte, zdali jsou barva auta a pohlaví majitele nezávislé veličiny Data uspořádáme do přehledné tabulky, jelikož máme dvě slovní proměnné, bude se jednat o kontingenční tabulku. K tomu nám poslouží Χ 2 test o nezávislosti v kontingenční tabulce. Následně sestavíme hypotézy H o a H 1, určíme a vypočítáme testové kritérium a kritický obor a v posledních krocích zhodnotíme přijetí/zamítnutí stanovených hypotéz. Předpokladem použití Χ 2 testu o nezávislosti v kontingenční tabulce je obsazenost políček kontingenční tabulky. Všechna políčka tabulky musí splňovat podmínku 5. Z dat uvedených v tabulce (modrá políčka) je zřejmé, že v tomto případě je podmínka splněna a tudíž můžeme test použít. Tabulka 5: Pohlaví majitele a četnosti jednotlivých barev automobilů Bílá Černá Červená Modrá Stříbrná Zelená Žena 41 25 11 11 19 3 110 41,25 23,20 12,89 11,60 15,90 5,16 Muž 55 29 19 16 18 9 146 54,75 30,80 17,11 15,40 21,10 6,84 96 54 30 27 37 12 256 1. Formulace hypotéz H o : barva auta a pohlaví majitele jsou nezávislé H 1 : non H o 2. Volba testového kritéria = 6

3. Stanovení kritického oboru ; ( 1) ( 1) ;, (5) = ; 11,07 4. Výpočet hodnoty testového kritéria G = 3,43 5. Závěr G W, G V nezamítáme H o, nepřijímáme H 1 Na hladině významnosti 5 % nezamítáme hypotézu o tom, že barva auta a pohlaví majitele jsou nezávislé veličiny. 7

3. U modelu FIESTA na benzín otestujte shodu rozptylů skutečné spotřeby paliva u mužů ažen Náplní této kapitoly je na hladině významnosti 5 % otestovat shodu rozptylů skutečné spotřeby paliva u mužů a žen vlastnících automobil Ford FIESTA.Výběry jsou nezávislé a tak použijeme test shody rozptylů dvou normálních rozdělení.na základě dat, která byla zadána do programu STATGRAPHICS je soubor mužů charakterizován takto: n 1 = 53, s' 2 2 1 = 0,484, zatímco soubor žen následovně: n 2 = 37, s' 2 = 0,609. 1. Formulace hypotéz H 0 : σ 1 2 = σ 2 2 H 1 : σ 1 2 σ 2 2 2. Volba testového kritéria = ( 1; 1) 3. Stanovení kritického oboru ; ( 1; 1) ( 1; 1) ;, (52; 36), (52; 36) ; 0,553 1,871 4. Výpočet hodnoty testového kritéria = 0,484 0,609 = 0,795 5. Závěr F W; F V nezamítáme H 0 a nepřijímáme H 1 Na hladině významnosti 5 % nezamítáme hypotézu o shodě rozptylů skutečné spotřeby paliva u mužů a žen. 8

Závěr V semestrální práci jsme charakterizovali variabilitu stáří jednotlivých modelů aut a to jak absolutně tak i relativně. Dále jsme testovali hypotézu o tom, že barva auta a pohlaví majitele jsou nezávislé veličiny, přičemž na základě provedeného testu jsme tuto hypotézu nezamítli. Nakonec jsme testovali hypotézu o shodě rozptylů skutečné spotřeby paliva u mužů a žen, kterou jsme také nezamítli. 9