TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta ANALÝZA VÝSLEDKŮ DOTAZNÍKOVÉHO ŠETŘENÍ (FAKULTNÍ DOTAZNÍK) semestrální práce z předmětu STATISTICKÝ ROZBOR DAT Z DOTAZNÍKOVÉHO ŠETŘENÍ Jan Kubiš, Kateřina Komárková, Jakub Nedorost, Eva Pešková, Adéla Picková, Alena Treperová
Obsah Úvod... 3 1. Charakterizujte variabilitu stáří jednotlivých modelů (absolutně i relativně).... 4 2. Otestujte, zdali jsou barva auta a pohlaví majitele nezávislé veličiny... 6 3. U modelu FIESTA na benzín otestujte shodu rozptylů skutečné spotřeby paliva u mužů a žen... 8 Závěr... 9 2
Úvod Cílem této semestrální práce bylo na základě obdrženého datového souboru provést statistický rozbor dat dle následujícího zadání: 1. Charakterizujte variabilitu stáří jednotlivých modelů (absolutně i relativně). 2. Otestujte, zdali jsou barva auta a pohlaví majitele nezávislé veličiny. 3. U modelu FIESTA na benzín otestujte shodu rozptylů skutečné spotřeby paliva u mužů a žen. 3
1. Charakterizujte variabilitu stáří jednotlivých modelů (absolutně i relativně). V této kapitole je naším cílem charakterizovat variabilitu stáří jednotlivých modelů automobilů značky Ford, a to absolutně i relativně. Charakteristiky variability nám udávají rozptýlení, neboli kolísání hodnot kolem zvoleného středu, např. kolem nějaké střední hodnoty. Zároveň ukazuje, jak kvalitní máme výběrová data čím jsou data kvalitnější, tím je kolísání hodnot kolem zvoleného středu menší. 1.1. Míry absolutní variability Variační rozpětí Označuje se písmenem R. Variační rozpětí vypočítáme pomocí rozdílu maximální a minimální hodnoty. Výsledek může být zkreslený zadanou extrémní hodnotou. Podle výpočtu v programu Statgraphics jsme zjistili, že pro jednotlivé modely je variační rozpětí následující: Tabulka 1: Variační rozpětí Kuga 14,0 Fiesta 18,0 Focus 18,0 Mondeo 9,0 B-Max 15,0 Rozptyl Rozptyl je vždy nezáporný <0, ). Udává rozptýlení hodnot kolem zvoleného středu. Je určen v jednotkách pozorování, ale v druhé mocnině. Výběrový rozptyl jednotlivých modelů získaný ze Statgraphicsu naleznete níže v tabulce. Tabulka 2: Rozptyl Kuga 13,6471 Fiesta 13,2398 Focus 15,0437 Mondeo 7,31667 B-Max 11,7635 4
Směrodatná odchylka Směrodatná odchylka se značí jako Sx a je vždy nezáporná. Vypočítává se jako kladná odmocniny z rozptylu. Je udána v jednotkách pozorování. Přestavuje nám, jak se v průměru liší jednotlivé hodnoty od aritmetického průměru v obou směrech, tedy v kladném i záporném. Následující hodnoty udávají, o kolik let mají jednotlivé modely více nebo méně let od aritmetického průměru. Jedná se o výběrovou směrodatnou odchylku získanou za pomoci programu Statgraphics. Tabulka 3: Směrodatná odchylka Kuga 3,69419 Fiesta 3,63866 Focus 3,87861 Mondeo 2,70493 B-Max 3,4298 1.2. Míry relativní variability Variační koeficient Značí se zkratkou Vx, je to bezrozměrné číslo, což znamená, že nemá měrné jednotky. Umožňuje porovnávat variabilitu souborů s různou úrovní nebo různými měrnými jednotkami. Nabývá hodnot (-, ). Výsledky níže v tabulce nám ukazují, z jaké části se směrodatná odchylka podílí na průměru. Tabulka 4: Variační koeficient Kuga 36,9419% Fiesta 35,4661% Focus 38,5452% Mondeo 29,6431% B-Max 38,4252% 5
2. Otestujte, zdali jsou barva auta a pohlaví majitele nezávislé veličiny Data uspořádáme do přehledné tabulky, jelikož máme dvě slovní proměnné, bude se jednat o kontingenční tabulku. K tomu nám poslouží Χ 2 test o nezávislosti v kontingenční tabulce. Následně sestavíme hypotézy H o a H 1, určíme a vypočítáme testové kritérium a kritický obor a v posledních krocích zhodnotíme přijetí/zamítnutí stanovených hypotéz. Předpokladem použití Χ 2 testu o nezávislosti v kontingenční tabulce je obsazenost políček kontingenční tabulky. Všechna políčka tabulky musí splňovat podmínku 5. Z dat uvedených v tabulce (modrá políčka) je zřejmé, že v tomto případě je podmínka splněna a tudíž můžeme test použít. Tabulka 5: Pohlaví majitele a četnosti jednotlivých barev automobilů Bílá Černá Červená Modrá Stříbrná Zelená Žena 41 25 11 11 19 3 110 41,25 23,20 12,89 11,60 15,90 5,16 Muž 55 29 19 16 18 9 146 54,75 30,80 17,11 15,40 21,10 6,84 96 54 30 27 37 12 256 1. Formulace hypotéz H o : barva auta a pohlaví majitele jsou nezávislé H 1 : non H o 2. Volba testového kritéria = 6
3. Stanovení kritického oboru ; ( 1) ( 1) ;, (5) = ; 11,07 4. Výpočet hodnoty testového kritéria G = 3,43 5. Závěr G W, G V nezamítáme H o, nepřijímáme H 1 Na hladině významnosti 5 % nezamítáme hypotézu o tom, že barva auta a pohlaví majitele jsou nezávislé veličiny. 7
3. U modelu FIESTA na benzín otestujte shodu rozptylů skutečné spotřeby paliva u mužů ažen Náplní této kapitoly je na hladině významnosti 5 % otestovat shodu rozptylů skutečné spotřeby paliva u mužů a žen vlastnících automobil Ford FIESTA.Výběry jsou nezávislé a tak použijeme test shody rozptylů dvou normálních rozdělení.na základě dat, která byla zadána do programu STATGRAPHICS je soubor mužů charakterizován takto: n 1 = 53, s' 2 2 1 = 0,484, zatímco soubor žen následovně: n 2 = 37, s' 2 = 0,609. 1. Formulace hypotéz H 0 : σ 1 2 = σ 2 2 H 1 : σ 1 2 σ 2 2 2. Volba testového kritéria = ( 1; 1) 3. Stanovení kritického oboru ; ( 1; 1) ( 1; 1) ;, (52; 36), (52; 36) ; 0,553 1,871 4. Výpočet hodnoty testového kritéria = 0,484 0,609 = 0,795 5. Závěr F W; F V nezamítáme H 0 a nepřijímáme H 1 Na hladině významnosti 5 % nezamítáme hypotézu o shodě rozptylů skutečné spotřeby paliva u mužů a žen. 8
Závěr V semestrální práci jsme charakterizovali variabilitu stáří jednotlivých modelů aut a to jak absolutně tak i relativně. Dále jsme testovali hypotézu o tom, že barva auta a pohlaví majitele jsou nezávislé veličiny, přičemž na základě provedeného testu jsme tuto hypotézu nezamítli. Nakonec jsme testovali hypotézu o shodě rozptylů skutečné spotřeby paliva u mužů a žen, kterou jsme také nezamítli. 9