VYSOKÁ ŠKOLA POLYTECHNICKÁ JIHLAVA. Katedra ekonomických studií

Transkript

1 VYSOKÁ ŠKOLA POLYTECHNICKÁ JIHLAVA Katedra ekonomických studií Moţnosti zpracování dat pořízených dotazníkovým šetřením bakalářská práce Autor: Šárka Dubová Vedoucí práce: RNDr. Jana Borůvková, Ph.D. Jihlava 2012

2

3 Anotace Tato bakalářská práce je zaměřena na analýzu dat, která jsou pořízena dotazníkovým šetřením. V teoretické části se práce zabývá druhy proměnných, se kterými je možné se setkat, a metodami analýz, kterými se tyto proměnné zpracovávají. V praktické části je vytvořen modelový dotazník, na kterém je ukázáno, jak má celý průběh dotazníkového šetření probíhat. Je znázorněna analýza proměnných a analýza závislostí, která zkoumá jejich vzájemný vztah. Klíčová slova dotazníkové šetření, druhy proměnných, analýza proměnných, analýza závislostí, data, respondent, dotazník, analýza Annotation This bachelor thesis is aimed to data analysis getting from questionnaire survey. In the theoretic part the thesis is engaged with types of variables which are able to be encountered, and method analysis processing these variables. In the practical part is built a model questionnaire and shown how the whole process of questionnaire survey should proceed. There is shown variables analysis and dependencies analysis that examines their mutual relation. Keywords questionnaire survey, types of variables, variables analysis, dependencies analysis, data, respondent, questionnaire, analysis

4 Ráda bych poděkovala vedoucí práce RNDr. Janě Borůvkové, Ph.D. za její čas, trpělivost a za její odborné rady. Také bych ráda poděkovala svému příteli a mamce za jejich podporu při psaní této práce i při studiu samotném.

5 Prohlašuji, že předložená bakalářská práce je původní a zpracoval jsem ji samostatně. Prohlašuji, že citace použitých pramenů je úplná, že jsem v práci neporušil autorská práva (ve smyslu zákona č. 121/2000 Sb., o právu autorském, o právech souvisejících s právem autorským a o změně některých zákonů, v platném znění, dále též AZ ). Souhlasím s umístěním bakalářské práce v knihovně VŠPJ a s jejím užitím k výuce nebo k vlastní vnitřní potřebě VŠPJ. Byl jsem seznámen s tím, že na mou bakalářskou práci plně vztahuje AZ, zejména 60 (školní dílo). Beru na vědomí, že VŠPJ má právo na uzavření licenční smlouvy o užití mé bakalářské práce a prohlašuji, že s o u h l a s í m s případným užitím mé bakalářské práce (prodej, zapůjčení apod.). Jsem si vědom toho, že užít své bakalářské práce či poskytnout licenci k jejímu využití mohu jen se souhlasem VŠPJ, která má právo ode mne požadovat přiměřený příspěvek na úhradu nákladů, vynaložených vysokou školou na vytvoření díla (až do jejich skutečné výše), z výdělku dosaženého v souvislosti s užitím díla či poskytnutím licence. V Jihlavě dne Podpis

6 Obsah Úvod Teoretická část Základy dotazníkového šetření Analýza proměnných Druhy proměnných Rozdělení četností Graf rozdělení četností Popisné charakteristiky úroveň Popisné charakteristiky variabilita Analýza závislostí Závislost dvou kategoriálních proměnných Závislost dvou kvantitativních proměnných Závislost dvou alternativních proměnných Praktická část Navrţení dotazníku Analýza proměnných Chování respondentů možnost více odpovědí Chování respondentů ordinální proměnná Informovanost respondentů Pohlaví respondentů Nejvyšší dosažené vzdělání Věk Výška Váha Tlak Analýza závislostí Analýza závislosti kategoriálních proměnných Analýza závislosti kvalitativních proměnných Závěr Seznam uţité literatury Seznam tabulek Seznam obrázků Seznam příloh... 56

7 Úvod Téma této bakalářské práce se týká problematiky dotazníkových šetření. V dnešní době se dají najít různé dotazníky skoro ve všech novinách, časopisech, internetových stránkách a dalších médiích, ale ne zcela všechny jsou dobře vymyšlené, správně konstruované a užitečné. Některé dotazníky nemají žádnou vypovídající hodnotu vzhledem k jejich nedostatečné přípravě, nesprávnému zpracování a tím i neadekvátnímu výstupu. Cílem této bakalářské práce je tedy ukázat možnosti analýzy dat pořízených dotazníkovým šetření v závislosti na kvalitě a úplnosti dat a dále v závislosti na stanovení výzkumného záměru. V teoretické části se bakalářská práce nejprve věnuje počátkům dotazníkového šetření, kdy je opravdu nejlepším řešením danou problematiku promyslet a zvážit, co je třeba zkoumat a na které otázky by tazatel chtěl znát odpověď. Tato prvotní část dotazníkového šetření se ale bohužel často vynechává a díky tomu se nepodaří zajistit všechna potřebná data k jejich analyzování a vytvoření závěrů. Také se práce zabývá tím, že všechny metody zpracování dat nejsou vhodné pro všechny druhy proměnných, které dotazník obsahuje, a proto jsou zde popsány druhy jednotlivých proměnných. Dále se řeší zpracování dat pomocí rozdělení četností a popisných charakteristik s ohledem na druh proměnné. Poslední kapitolou teoretické části je analýza závislostí, která může odhalit skutečnost, že některé proměnné jsou na sobě závislé a některé naopak ne. U této analýzy se využívá testování hypotéz o nezávislosti a také koeficienty, které mohou určit sílu závislosti proměnných. Praktická část této bakalářské práce pojednává o tom, jak vhodně sestavit a zpracovat dotazník. K tomuto účelu byl vytvořen modelový dotazník na téma zdravý životní styl populace v České republice, v němž nejde o obsah, ale o průběh jeho vytvoření a zpracování. Tento dotazník je přiložen jako příloha. V znázorněném průběhu dotazníkového šetření je nejprve promyšleno, co by chtěl tazatel z dotazníkového šetření zjistit, a poté jsou voleny otázky do samotného dotazníku. Po vytvoření dotazníku a získání potřebných odpovědí od respondentů se provádí analýza proměnných. Tato analýza obsahuje vytvoření tabulky rozdělení četností a její grafické zobrazení v podobě grafu. Následuje zpracování popisných 7

8 charakteristik, které přibližuje danou proměnnou, a je možné vytvořit první závěry o ní. Na závěr se provádí analýza závislostí mezi proměnnými, která může objasnit závislost či nezávislost mezi nimi. Díky této analýze je možné zjistit zajímavé informace o proměnných, které jsou užitečnější než samotná popisná charakteristika, ale bohužel se na analýzu závislostí často zapomíná. Výsledky z analýzy je nutné interpretovat a zamyslet se, proč tomu tak je. 8

9 1 Teoretická část V této části je teoreticky rozebírána příprava a průběh dotazníkového šetření a představení obvyklých chyb, které vedou k neúplnému využití dat z dotazníku při zpracování. Také se zde řeší druhy proměnných, se kterými se lze při zpracování dat pořízených z dotazníkových šetření setkat, a postupy, které jsou vhodné pro zpracování konkrétních druhů proměnných. 1.1 Základy dotazníkového šetření Data z dotazníků jsou častými doplňky různých článků, průzkumů a dalších písemných prací. Ovšem ne každý výsledek dotazníků poskytne čtenáři hodnotnou výpověď o dané situaci, což může být výsledkem špatného uchopení celého dotazníkového šetření. Častá a také chybná varianta začátku šetření je, že tazatel vybere otázky k danému tématu, které se mu zdají zajímavé, a na ty se poté ptá respondentů. V takovéto variantě tazatel vlastně ani neví, co od výsledků očekává, a proto může očekávat od průzkumu jen základní statistické údaje, ale už není schopen vyvodit závislosti mezi jednotlivými proměnnými. Nejprve tazatel musí začít tím, že si položí výzkumnou otázku, ke které bude zpracovávat příslušný dotazník. Například pro modelový dotazník v praktické části této práce je položena výzkumná otázka: S jakými aspekty souvisí zdravý životní styl lidí v ČR? Poté se určí výzkumné hypotézy, které upřesňují výzkumnou otázku. Jsou to přesné otázky, na které by chtěl znát tazatel odpověď a které bude při zpracování zkoumat. Pro představu, výzkumné hypotézy dle již zmíněné výzkumné otázky jsou například: Závisí životní styl na pohlaví respondenta? Souvisí spolu věk a zdravý životní styl? Podle těchto výzkumných hypotéz se teprve začne sestavovat dotazník. Z otázek se vyberou pojmy, které je potřeba zařadit do dotazníkového šetření. Tímto celým procesem by mělo začínat každé dotazníkové šetření, protože teprve z těchto informací je možné sestavit dobrý dotazník. Při tvorbě otázek je nutné si ujasnit jejich formu jestli se použijí otevřené, zavřené či polouzavřené otázky. Otevřené otázky se užívají především pro kvalitativní výzkumy, polouzavřené pro pilotní ověření dotazníku a konečně uzavřené otázky pro kvantitativní šetření, kterým se zabývá tato bakalářská práce. 9

10 Zpracování jednotlivých odpovědí respondentů se řídí typem otázky, které byly v dotazníku položeny. V dotazníkových šetřeních je možné najít několik základních typů otázek: respondent si může vybrat právě jednu odpověď z nabízených odpovědí respondent vybírá v rámci jedné otázky ze seznamu výroků ty, které pro něj platí v rámci jedné otázky je respondentovi nabízen seznam položek a respondent jednotlivé položky hodnotí na nabízené škále respondent na položenou otázku odpovídá číslem Ve druhém a třetím případě se nejedná o jedinou otázku, ale o skupinu otázek, protože každá z nabízených "odpovědí" je vlastně samostatná otázka. K tomuto sdružování do jedné otázky lze přistoupit proto, aby tazatel usnadnil respondentům vyplnění dotazníku a zkrátil tak čas potřebný na jeho vyplnění. Při vlastním sestavování dotazníku by měl znát tazatel několik pravidel tvorby otázek a odpovědí. Například měl dbát na to, aby byly jasně formulované a respondentovi srozumitelné. Otázky ani odpovědi by neměly obsahovat záporné výrazy, aby to respondenta nemátlo, a také by se neměly pokládat dvě otázky v jedné, aby bylo jasné, na co má respondent odpovídat. Jednotlivé odpovědi by se neměly významově překrývat kvůli přesnému vybrání odpovědi. Poté, co tazatel sestavil dotazník, by měl v ideálním případě provést jeho pilotní ověření. Při pilotním ověření je na místě použít místo uzavřených otázek polouzavřené otázky, ve kterých nechá volně místo pro jiné odpovědi než ty, které vybral. Toto je velmi důležité pro ověření správného výčtu odpovědí, které by měly zahrnovat všechny možnosti, a každý respondent by si měl mezi nimi najít tu, která je nejblíže realitě. Na druhé straně tazatel musí dávat pozor, aby se nabízené odpovědi významově nepřekrývaly. Z pilotního ověření je možné zjistit, zda jsou otázky dobře formulované, zda je respondenti správně chápou a pokud se v pilotním ověření dotazníku ukáže, že otázky nebo nabízené odpovědi nejsou vhodně formulované či vybrané, je nutné je před vlastním dotazníkovým šetřením ještě upravit. 10

11 1.2 Analýza proměnných Po ukončení vlastního dotazování respondentů, může tazatel začít se zpracováváním dat. Nejprve by měl určit druhy proměnných, které bude zpracovávat, a na základě jejich zařazení by měl volit statistické metody: rozdělení četností do tabulky grafické zobrazení četností popisné charakteristiky úrovně a variability Podle druhů proměnných se liší zpracování rozdělení četností i popisné charakteristiky, které budou také popsány v této kapitole. Popisná statistika je ještě rozdělena na charakteristiky úrovně a variability, charakteristikami míry se tato práce zabývat nebude Druhy proměnných Alternativní proměnná se často používá v situaci, kdy je třeba rozdělit respondenty podle jedné vlastnosti a dle tohoto výběru pak budou odpovídat na další otázky. V praktické části dotazníku není například potřeba, aby respondent vyplňoval hodnotu svého krevního tlaku, když ji neví. Proto je použita otázka: Znáte hodnotu vašeho krevního tlaku? Pokud ji zná, pokračuje dalším pokynem, aby vyplnil hodnotu svého tlaku. Alternativní proměnná může být symetrická, kdy obě možnosti jsou pro tazatele stejně důležité, nebo asymetrická, kdy jedna z možných odpovědí je důležitější. Nominální proměnná je proměnná, která nese nejčastěji textový údaj, a lze u ní pouze porovnávat, zda se liší či je stejná. Data u této proměnné nelze tedy sčítat a provádět matematické operace. Nejčastějšími příklady nominální proměnné jsou druh profese, typ absolvované školy, zařazení města, ve kterém respondent žije a další. Ordinální proměnná určuje pořadí či stupeň daného znaku. Je do ní možno zařadit například stupeň vzdělání, stupeň souhlasu s daným výrokem nebo stupeň spokojenosti či nespokojenosti s danou situací. Pokud se jedná o stupeň spokojenosti či stupeň souhlasu, jsou tyto stupně spíše subjektivním pocitem respondenta. S těmito proměnnými nelze provádět matematické operace, ale je možné je porovnávat mezi sebou. V některých typech odpovědí může respondent odpovídat číslovkou. Například v modelovém dotazníku v praktické části je jedna z otázek hodnocení pravdivosti 11

12 výroků podle respondenta, kde je možné odpovídat hodnotami 1 až 5. V další otázce respondent odpovídá pouze z výběru denně/často/občas/výjimečně/nikdy, takže další možností je odpovídat textovým údajem o frekvenci vybraných činností respondenta. Výše zmíněné proměnné se také mohou souhrnně označovat jako kvalitativní proměnné. Kvantitativní neboli numerická proměnná je proměnná, která obsahuje číselný údaj. Tyto proměnné se mohou ještě členit na intervalové či poměrové proměnné, obě dvě varianty v dotaznících zachycují číselné odpovědi jako například výšku, hmotnost či hodnotu krevního tlaku. Intervalová proměnná může nabývat hodnot 0 a více a lze u dvou takovýchto proměnných určit, o kolik je jedna menší či větší než druhá. U poměrové proměnné může zpracovatel ještě navíc určit, kolikrát je jedna hodnota větší či menší než druhá. Poměrová proměnná může tedy nabývat pouze kladných hodnot. Také je možné proměnné dělit na kategoriální a kvantitativní spojité proměnné, kdy do kategoriálních se zahrnují proměnné nominální, ordinální a kvantitativní, které mají menší rozsah variant a jsou vlastně uzavřenými odpověďmi. Kvantitativní spojité označují kvalitativní proměnné, které nabývají většího rozsahu hodnot a jsou otevřenými odpověďmi (například odpovědi týkající se váhy či výšky respondentů) Tabulka rozdělení četností Zpracovávaná data mohou být rozdělena podle množství jejich výskytů, čemuž odpovídá rozdělení jejich četností. Možnost znázornění dat v číslech a přehledné tabulce umožňuje tabulka rozdělení četností a z ní se mohou data zobrazit v grafické podobě v grafu četností. Tabulka četností se častěji používá v případech, kdy je možnost podrobněji sledovat data a je potřeba znát přesně jednotlivá čísla, zatímco graf rozdělení četnosti tato přesná čísla neukazuje, ale je lehčí se v jeho grafickém zobrazení vyznat. Při sestrojení rozdělení četnosti se musí brát v úvahu typ dat. V případě kategoriálních dat se jedná o bodové třídění. Při práci s nominálními, ordinálními či alternativními proměnnými se musí každé proměnné dát kód, který ji bude zastupovat. Rozdělení četností pomocí tabulky rozděluje odpovědi respondentů dle jejich četnosti. Pokud se proměnná nazve X, její jednotlivé odpovědi se označí x i, kde i =1, 2, 3,..., 12

13 a počet respondentů se označí n, vznikne základní tabulka rozdělení četností. V té se nejčastěji uvádí absolutní četnost a její relativní vyjádření relativní četnost. Také je možnost uvádět další charakteristiky jako kumulativní absolutní četnost a kumulativní relativní četnost. Absolutní četnost (n i ) uvádí počet výskytů daného znaku v datovém souboru. Z toho se může určit znak s nejvyšší četností, ale zároveň i s nejnižší četností. Lze ji vypočítat "ručně" sčítáním výskytů znaků, ale snadnější variantou je vypočítání například pomocí programu Excel a funkcí ČETNOSTI. Jako kontrola správnosti výpočtů může sloužit fakt, že součet n i se musí rovnat n, tedy počtu respondentů. Relativní četnost (p i ) je bezrozměrná veličina, ale pokud se vynásobí 100, lze ji uvádět v procentech. V tomto případě je procentuálním vyjádřením absolutní četnosti, která říká, v jakém procentuálním poměru je daný znak zastoupen. Součet p i se musí vždy rovnat 1. Relativní četnost lze vypočítat podle vzorce: p i ni n Kumulativní absolutní četnost (kn i ) vzniká postupným kumulováním absolutních četností. Lze z ní zjistit, jak velkou četnost má více znaků dohromady. Vzorec je následující: kn i n j i j1 Kumulativní relativní četnost (kp i ) vzniká postupným kumulováním relativních četností. Tato veličina je bezrozměrná, ale dá se vyjádřit v procentech. Tato četnost vyjadřuje, kolik procent výskytu má více znaků dohromady. Vzorec je následující: kp i p j i j1 13

14 Tabulka1: Tabulka rozdělení četností (bodové rozdělení) Proměnná X Absolutní četnost (n i ) Relativní četnost (p i ) Kumulativní četnost absolutní (kn i ) relativní (kp i ) x 1 n 1 p 1 kn 1 kp 1 x 1+n n 1+n p 1+n kn 1+n kp 1+n x k n k p k n 1 Součet n 1 х х Pokud je větší množství variant odpovědí, jedná se o intervalové třídění. Toto třídění se používá nejčastěji pro kvantitativní proměnnou s velkým rozsahem hodnot. V případě intervalového třídění je nutné správně vytvořit intervaly. Intervaly by měly mít konstantní délku h, nesmí se překrývat a měl by jich být přiměřený počet k. Za vhodný počet intervalů se uvažuje k 1 + 3,3 log n. Další změnou oproti bodovému třídění je x i, kde místo jednotlivých znaků (odpovědí respondentů), se dosazuje střed daného intervalu. Délku intervalu lze zjistit pomocí vzorce. Pokud se p označí jako počet intervalů, vzorec pro výpočet délky je následující: d x max x p min Intervaly musí obsahovat všechny hodnoty z datového souboru, proto se musí volit vhodné hranice. Buď se použije minimální hodnota ze souboru jako spodní hranice, nebo se použije ještě nižší hodnota než minimální. 14

15 Tabulka2: Tabulka rozdělení četností (intervalové třídění) Intervaly Střed Absolutní četnost (n i ) Relativní četnost (p i ) Kumulativní četnost absolutní relativní (kn i ) (kp i ) (x min; x min +d> x 1 n 1 p 1 kn 1 kp 1 (x min +d; x 1+n n 1+n p 1+n kn 1+n kp 1+n (x +2d) x k n k p k kn k kp k Součet x n 1 х х Graf rozdělení četností Množství výskytu daných znaků je také možné znázornit pomocí grafu rozdělení četností, který dokáže zachytit průběh rozdělení četností. Většinou se vychází z tabulky rozdělení četností, kde se vybere znázorňovaná veličina. Pro zobrazení alternativní či nominální proměnné se používá graf výsečový, pro ostatní proměnné nejčastěji graf sloupcový. Zpracovatel dotazníků, který chce použít pro prezentaci dat grafy, by měl mít na paměti, že by graf měl mít jasné barvy, menší počet objektů a čísel a měl by být především přehledný na první pohled Popisné charakteristiky úroveň Z dotazníkového šetření lze zjistit kromě rozdělení četností další informace, a to například charakteristiky úrovně. Jak bylo již zmíněno v úvodu této kapitoly, u charakteristik se musí brát v úvahu druh zpracovávané proměnné. Pro nominální proměnnou lze počítat z charakteristik úrovně pouze modus, což je nejčastější odpověď respondentů na otázku. Modus lze zjistit například z tabulky rozdělení četností. Případ, kdy vyjde pouze jedna nejčastější hodnota, se nazývá unimodální a další případ, kdy vyjdou dvě hodnoty s tou samou nejvyšší četností, se nazývá bimodální. Pokud relativní četnost této hodnoty je větší než hodnota 0,5, dá se hovořit o majoritním modu. V tomto případě to znamená, že více než polovina 15

16 respondentů uvedla tuto odpověď a je to tedy velmi významná hodnota. Modus se označuje xˆ. V případě ordinální proměnné lze zjistit kromě modu také medián. Medián uvádí hodnotu, která se nachází ve středu všech sebraných dat, je to tedy střední hodnota. Stejně jako modus ani medián není ovlivněn extrémními hodnotami souboru. Pro ordinální proměnnou je nutné v tabulce rozdělení dat přiřadit každé kategorii číselné označení. V případě netříděných dat se dá medián zjistit seřazením dat dle jejich hodnot od nejmenší po největší a poté rozdělit tuto řadu na dvě stejné části. Pokud je součet hodnot lichý, jako medián se bere hodnota v půli souboru, při sudém počtu se ze dvou půlících hodnot vypočítá průměr. V případě tříděných dat lze medián vypočítat z tabulky četností. Medián je možné nalézt pomocí příslušného řádku v tabulce, ve kterém kumulativní relativní četnost (kp i ) poprvé přesáhne hodnotu 0,5. Jestliže kp i > 0,5, medián se rovná příslušnému x i. Pokud ale kp i = 0,5, k příslušnému x i se přičte hodnota 0,5. Další významné hodnoty pro ordinální proměnnou mohou být kvantily. Kvantily označují hodnoty, které dělí soubor seřazených hodnot na určité části. Některé kvantily mají svá jména, například kvantil Q 0,5 se nazývá medián, Q 0,25 dolní kvartil a Q 0,75 horní kvartil. Tyto hodnoty je možné zjistit opět z tabulky rozdělení četností. Pro výpočet dolního kvartilu se opět hledá hodnota, u které kp i 0,25 a zároveň kp i 1 < 0,25. Jestliže kp i > 0,25, pak dolní kvartil se rovná příslušnému x i, ale jestliže kp i = 0,25, pak dolní kvartil se rovná x i + 0,25. Pro výpočet horního kvartilu se hledá hodnota, u které kp i 0,75 a zároveň kp i 1 < 0,75. Jestliže kp i > 0,75, pak horní kvartil se rovná příslušnému x i, ale jestliže kp i = 0,75, pak horní kvartil se rovná x i + 0,75. Kvantitativní proměnnou určují charakteristiky úrovně modus, medián, kvantily a také průměr. V tomto odstavci se budu zabývat kvantitativní proměnnou, která má malé množství variant a tvoří uzavřenou odpověď. Modus, medián a kvantily lze zjistit již zmiňovaným způsobem, průměr lze vypočítat dle vzorce. Existuje více druhů průměrů, ale pro potřeby dotazníkového šetření bude postačující aritmetický průměr ve svých dvou formách prosté a vážené formě. Prostá forma se používá v případech, kdy data nejsou tříděna (například do tabulky). Pokud n je počet všech hodnot datového 16

17 souboru (počet respondentů) a x i jsou jednotlivé odpovědi, vzorec pro aritmetický průměr je následující: x 1 n n x i i1 Vážená forma průměru se používá v případě, pokud jsou data již tříděna. Pokud se dodrží předchozí zápis s tím rozdílem, že n i je počet odpovědí pro dané x i, platí vzorec: x 1 n k i1 x i n i Pokud se popisná charakteristika vztahuje na kvantitativní proměnnou s větším rozsahem hodnot, data jsou většinou tříděna intervalově a lze vypočítat modus, medián, kvantily a průměr. Modus a průměr jsou počítány stejným způsobem jak v předešlé proměnné, medián lze vypočítat podle vzorce. Pokud se nalezne interval, ve kterém poprvé kumulativní relativní četnost přesáhne hodnotu 0,5, v tomto intervalu se nalezne hodnota relativní četnosti p i a hodnota dolní hranice tohoto intervalu a, v předcházejícím intervalu hodnota kumulativní relativní četnosti kp i, délka intervalu h a dosadí se do následujícího vzorce: ~ x 0, 5 kpi p i h a Pro kvantitativní proměnnou s větším rozsahem hodnot lze také vypočítat kvantily podle vzorce z intervalového třídění hodnot v tabulce. Při zachování značení z předcházejícího odstavce vypočítání Q p je nutné dosadit do následujícího vzorce: ~ x p p kpi p i h a 17

18 1.2.3 Popisné charakteristiky variabilita Pro ordinální proměnnou je možné určit například variační rozpětí, které ukazuje rozpětí souboru. Lze jej vypočítat pomocí vzorce: R x max x min Další charakteristikou pro ordinální proměnnou je také mezikvartilové rozpětí, které je možné vypočítat: IQR ~ x ~ x 0,75 0,25 Důležitější jsou popisné charakteristiky variability pro kvantitativní proměnnou. Je možné opět určit variační a mezikvartilové rozpětí, ale lze určit také rozptyl, který uvádí rozdělení hodnot z dotazníkového šetření kolem střední hodnoty. Tento rozptyl lze vypočítat pomocí vzorce: s 2 n ( xi x) i1 n 2 Další charakteristikou variability pro kvantitativní proměnnou může být směrodatná odchylka s a variační koeficient Vx. Směrodatná odchylka je, jak lze ze vzorce usoudit, kvadratický průměr odchylek, zatímco variační koeficient je směrodatnou odchylkou v relativním vyjádření. Jejich vzorce jsou následující: s 2 s V x s x 18

19 1.3 Analýza závislostí S dobře sestaveným dotazníkem nemusí zjistit tazatel pouze popisné charakteristiky, ale může odvozovat závislosti z jednotlivých proměnných. Je tedy třeba se podívat na výzkumné hypotézy, které se stanovují před začátkem dotazníkového šetření, a pomocí testování závislostí a jejich intenzity lze na tyto hypotézy odpovědět. Tato kapitola je zpracována dle Hany Řezankové, která tuto problematiku řeší v knize Analýza dat z dotazníkových šetření, rok Při zjišťování závislosti dvou proměnných se nejprve zavede nulová hypotéza H 0 a alternativní hypotéza H 1, které se porovnávají. Hypotéza H 0 se poté zkoumá pomocí různých koeficientů, které jsou použity v závislosti na druhu zkoumaných proměnných. Také je potřeba zvolit si hladinu významnosti, která udává pravděpodobnost toho, že se H 0 neoprávněně zamítne, přestože platí. Po zjištění koeficientů a rozhodnutí o volbě hladiny významnosti se hypotéza zamítá či nezamítá na základě různých testovacích kritérií, jejichž volba závisí opět na druzích proměnných. Také je možné zjistit míru závislosti pomocí příslušných koeficientů. Při analýze závislostí mezi kategoriálními proměnnými se vychází z již roztříděných dat, která jsou uspořádána do dvourozměrné tabulky četnosti (kontingenční tabulky). Tato tabulka má ve svých řádcích zavedenou jednu zkoumanou proměnnou a v řádcích druhou proměnnou. Jejím obsahem jsou absolutní nebo relativní četnosti těchto proměnných. Pokud je kontingenční tabulka zaváděna pro dvě alternativní proměnné, dá se hovořit o asociační tabulce. Kontingenční i asociační tabulka se dá snadno vytvořit z neuspořádaných dat například v počítačovém programu Excel, který umí spočítat pouze absolutní četnost u dvou proměnných. Také je možné údaje z kontingenční tabulky zobrazit pomocí grafů, v tomto případě se používají grafy sloupcové. Pokud se jedna z proměnných označí X, počet jejích variant (kategorií) R, druhá proměnná Y, počet jejích variant S, rozsah i =1, 2, 3,, R, rozsah j= 1, 2, 3,, S, rozsah souboru n a zjištěné absolutní četnosti n ij, kontingenční tabulka vypadá následovně: 19

20 Tabulka3: Dvourozměrná tabulka četnosti Proměnná Y Proměnná X 1. kategorie j tá kategorie S tá kategorie Celkem 1. kategorie n 11 n 1j n 1S n 1+ i- tá kategorie n i1 n ij n is n i+ R- tá kategorie n R1 n Rj n RS n R+ Součet n +1 n +j n +S n Četnosti n ij se nazývají sdružené absolutní četnosti a četnosti n i+ a n +j se nazývají marginální četnosti. Jestliže se kontingenční tabulka pro relativní četnosti počítá z celého souboru, počítá se pomocí vzorce: p ij n ij n Závislost dvou kategoriálních proměnných Při šetření nejčastěji obsahují dotazníky kategoriální data, proto vypočítání této závislosti je velmi důležité. Pro výpočet této závislosti se používá chí kvadrát test o nezávislosti. Pro testování hypotéz lze využít testové kritérium Pearonova statistika chí kvadrát, která má následující vzorec: R S ( nij mij ) 2 p m i1 j1 ij 2 V tomto vzorci je užita očekávaná četnost v případě nezávislosti, kterou lze vypočíst vzorcem: m ij n i n n j 20

21 Pokud jsou obě dvě proměnné ordinální, je možné použít i Spearmanův korelační koeficient. Ten lze vypočítat pomocí vzorce: r s 2 6 D n( n 1) 1 2 D 2 n l1 ( x l y l ) 2 Tento koeficient leží na intervalu od mínus jedné do jedné Závislost dvou kvantitativních proměnných Pokud tazatel chce zjistit, jestliže jsou na sobě dvě kvantitativní proměnné vzájemně závislé, je to možné pomocí Pearsonova korelačního koeficientu. Vzorec pro jeho výpočet pomocí absolutních četností je následující: r i1 j1 R 2 2 S 2 2 ni xi nx n j y j ny i1 R S n x y ij i j n x y j1 1 x n 1 y n R i 1 S j 1 n i x n i j y j Také je možné vypočítat míru intenzity závislosti těchto proměnných. Pearsonův korelační koeficient se vyskytuje na intervalu 1; 1, kde 0 znamená lineární nezávislost, hodnota 1 je nepřímá závislost (negativní korelace) a hodnota 1 přímá závislost (pozitivní korelace). V případě, že analyzovaná data mají některé hodnoty odlehlé, tento koeficient není přesný, je vhodnější použít Spearmanův korelační koeficient. Zjistit, zda jsou hodnoty odlehlé, jde poměrně snadno pomocí bodového grafu. Pokud jsou hodnoty u sebe, je možné použít Pearsonův korelační koeficient. Pokud jsou některé body mimo oblast, kde jich je většina, použije se pro výpočet závislosti Spearmanův korelační koeficient. 21

22 1.3.3 Závislost dvou alternativních proměnných Speciálním případem kontingenční tabulky je již zmiňovaná asociační tabulka, která obsahuje dvě alternativní proměnné. V modelovém dotazníku se analýza dvou alternativních proměnných nenachází, je zde pouze pro informaci. Asociační tabulka s použitím absolutních četností vypadá následovně: Tabulka4: Asociační tabulka Proměnná Y Proměnná X 0 1 Součet 0 n 11 n 12 n 1+ 1 n 21 n 22 n 2+ Součet n +1 n +2 n Testování závislosti dvou alternativních proměnných lze provést pomocí chí-kvadrát statistiky, která má následující vzorec: 2 2 ( n11n22 n12n21) p n n1 n2n1n2 Hodnota, kdy se při 5% hladině významnosti zamítá nulová hypotéza, je 0,021. Také je možné vypočítat míru intenzity vzájemné závislosti, kdy se používá koeficient asociace, který leží na intervalu < 1;1> a určí nejenom intenzitu, ale i směr závislosti. Koeficient asociace má následující vzorec: r n 11 n n 1 22 n n 2 n 12 1 n n

23 2 Praktická část V praktické části této bakalářské práce je navržen a zpracován modelový dotazník tak, aby bylo možné vypočítat nejen charakteristiky z popisné statistiky, ale také vztahy a souvislosti mezi jednotlivými proměnnými. Nejdříve je nutné dobře promyslet, co tazatel očekává od zjištěných dat a jaké možné souvislosti by mohly nastat. Proto je také třeba, aby tazatel znal všechny aspekty dané problematiky, která je řešena v dotazníkovém šetření. Bez znalostí v oboru není možné správně formulovat otázky a také nemusí tazatel vidět všechny souvislosti, které by se mohly objevit ve zkoumaných datech. V této kapitole je zaměřena pozornost na tvorbu a analýzu dat, obsah dotazníku tedy není důležitý a není samotným cílem této práce. Jako námět na dotazník byla vybrána oblast týkající se zdravého životního stylu v populaci a kompletní dotazník je uveden v příloze. 2.1 Navrţení dotazníku Pokud se tazatel rozhodne, že udělá dotazníkové šetření zaměřené na životní styl populace, nejprve si musí ujasnit, co přesně má zkoumat. Poté je třeba si ujasnit výzkumnou otázku. Výzkumná otázka:s jakými aspekty souvisí zdravý ţivotní styl lidí v ČR? Dalším krokem je definování výzkumných hypotéz, které upřesňují výzkumnou otázku a které budou dotazníkovým šetřením zkoumány. Příklady výzkumných hypotéz Je rozdíl mezi životním stylem mužů a žen? Je rozdílný životní styl mezi mladou, starší a střední generací? Závisí zdravý životní styl na dosaženém vzdělání? Souvisí spolu zdravý životní styl a hodnota BMI respondenta? Souvisí spolu zdravý životní styl a hodnota tlaku respondenta? Jsou rozdíly mezi chováním a informovaností respondentů ohledně zdravého životního stylu? 23

24 Po navržení výzkumných otázek je třeba navrhnout proměnné, které budou použity k analýze proměnných i analýze závislostí. Z výzkumných otázek tedy vyplývají pojmy: životní styl pohlaví věk dosažené vzdělání hodnota BMI hodnota tlaku informovanost o zdravém životním stylu Některé z proměnných jsou jednoznačně určené, například pohlaví respondenta (proměnná pohlaví). Tato proměnná se řadí mezi nominální proměnné. Otázka vypadá takto: Vaše pohlaví o žena o muž Další proměnnou je dosaţené vzdělání respondenta (vzdělání), což je ordinální proměnná, protože je možné rozlišit jednotlivé stupně vzdělání. Otázka vypadá následovně: Vaše nejvyšší dosaţené vzdělání o základní o vyučen o střední s maturitou o vysokoškolské (včetně VOŠ) Další jednoznačně určenou proměnnou je věk respondentů (věk). Je možné použít číselnou proměnnou, která bude obsahovat rok narození či přímo věk respondenta. Tato proměnná je příkladem proměnné, kterou je možné kategorizovat podle potřebného rozdělení věku respondenta a zachází se s ní poté jako s ordinální proměnnou. Otázka na věk vypadá například takto: Rok narození 24

25 Další proměnnou hodnotu BMI nebude každý respondent znát, ale lze ji snadno vypočítat z hmotnosti a výšky respondenta. Je tedy příkladem proměnné, kterou je schopen tazatel dopočítat. Pokud se tazatel navíc bude ptát na hmotnost a výšku, je možné tyto samotné informace použít v analýze dat. Výška a hmotnost (proměnné výška a váha) jsou kvantitativními proměnnými a otázky na ně vypadají následovně: Vaše výška (cm) Vaše váha (kg) Hodnotu tlaku každý respondent také nejspíš nebude znát, ale na rozdíl od BMI ji nelze spočítat. Je tedy vhodné přidat do dotazníku doplňující otázku, jestli respondent zná svoji hodnotu tlaku a při kladné odpovědi teprve položit otázku, jaká je hodnota respondentova tlaku. Krevní tlak má systolickou a diastolickou hodnotu (systolický a diastolický), proto se zařadí dvě kvantitativní proměnné a předřadí se jim doplňující otázka: Znáte hodnotu vašeho krevního tlaku? o ano (pokračujte další otázkou) o ne (ukončení dotazníku) Vaše hodnota krevního tlaku diastolický (nižší) systolický (vyšší) Získat informace o následujících proměnných už není možné položením jedné otázky. Je-li třeba zjistit, zda respondent ţije podle zásad zdravého ţivotního stylu. Tazatel si musí nejprve uvědomit, co všechno toto téma zahrnuje. Tyto informace lze získat položením otázek ohledně zdravého stravování, sportování, míry stresu, kouření atd. V tomto dotazníku je zařazen souhrn výroků, alternativních proměnných (označené S1_1 až S1_10), kde je možné zaškrtnout více tvrzení a které obsahují zásady zdravého životního stylu. 25

26 Respondent pak označí výroky, se kterými souhlasí nebo které pro něj platí. Ve své podstatě se nejedná o jedinou otázku, ale o soubor otázek, na které respondent odpovídá "ano" či "ne" tím, že zatrhne či nezatrhne daný výrok. Skupina otázek je sdružena do jedné pro zjednodušení a zrychlení vyplňování dotazníku. Výsledkem dotazování je 10 alternativních proměnných. Při tvorbě dotazníku je třeba myslet na pozdější zpracování, a proto je vhodnější zařazovat otázky, kde například označení výroku znamená žádoucí chování nebo naopak. Pokud by otázky byli významově opačně, při souhrnném zpracování by se museli překódovat. Vyberte pravdivá tvrzení, která se týkají vašich návyků (lze zaškrtnout více tvrzení) Snídám každý den. Jím pravidelně 4x až 5x denně. Denně sním alespoň 200 g zeleniny. Denně sním alespoň jednu porci ovoce. Každý týden sním alespoň jednu porci ryby. Každý týden sním alespoň jednu porci luštěnin. Upřednostňuji celozrnné výrobky. Alespoň dvě hodiny týdně se věnuji sportu. Spím více než sedm hodin denně. Moje práce (studium) mě nestresuje. V dotazníku je zařazena ještě jedna skupina otázek zjišťující návyky respondentů, jejímž výstupem je ordinální proměnná. V tomto případě respondent odpovídá podle frekvence provádění těchto návyků. Při tvorbě dotazníku je třeba myslet na pozdější zpracování, a proto je vhodnější zařazovat otázky, kde například častější frekvence těchto zvyků znamená méně zdravý životní styl nebo naopak. Pokud by otázky byly významově opačné, při dalším zpracování by se musely překódovat. Při zpracování lze převést ordinální škálu na číselnou, aby bylo možné odpovědi na položené otázky shrnout do jedné proměnné, kterou lze považovat za číselnou proměnnou. 26

27 Proměnné (S2_1 až S2_10) jsou tedy následující: Vyberte z nabízených moţností, které nejlépe vystihují odpověď na danou otázku Jím tučné vepřové maso. о denně о často о občas о výjimečně о nikdy Jím tučné sýry (50 % tuku v sušině a více). о denně о často о občas о výjimečně о nikdy Piji tvrdý alkohol. о denně о často о občas о výjimečně о nikdy Piji víno nebo pivo. о denně о často о občas о výjimečně о nikdy Piji slazené nápoje (typu Coca-Cola, Fanta, Sprite atd.). о denně о často о občas о výjimečně о nikdy Jím knedlíky s omáčkou. о denně о často о občas о výjimečně о nikdy Jím sladké (zákusky, sušenky, oplatky, zmrzlinu, čokoládu). о denně о často о občas о výjimečně о nikdy Vypiji více než tři šálky kávy za den. о denně о často о občas о výjimečně о nikdy Vypiji méně než 1,5 l neslazených tekutin. о denně о často о občas о výjimečně о nikdy Jak často kouříte? о denně о často о občas о výjimečně о nikdy Poslední potřebnou proměnnou je informovanost o zdravém ţivotním stylu. Ten lze zjistit z přidaných výroků o této problematice, kde respondent bude hodnotit míru pravdivosti výroku dle stupnice od 1 do 5, kde 1 znamená "vůbec nesouhlasím" 27

28 a 5 znamená "zcela souhlasím". Je to tedy ordinální proměnná s číselnou škálou odpovědí, které mají své určené pořadí. Opět je třeba zařazovat stejně hodnocené výroky, které obsahují buď pravdivé informace o zdravém životním stylu, či naopak. V této otázce je ukázána situace, kdy vybrané otázky neodpovídají podstatě problému. Výroky, které jsou zařazeny do dotazníku jsou velmi obecné na to, aby mohly vyjadřovat informovanost respondenta o zdravém životním stylu. Cílem tohoto nesprávného výběru výroků je ukázat, jak nevhodně zvolené otázky mohou zkreslit výsledky šetření. Je tedy vhodné pečlivě vybírat otázky, aby byly co nejpřesnější a aby měly opravdový přínos pro dotazníkové šetření. Výroky (V_1 až V_7) jsou následující: Jak souhlasíte s následujícími výroky? (Míru souhlasu vyjádřete na stupnici 1 5, kde 1 znamená "vůbec nesouhlasím" a 5 znamená "zcela souhlasím". Otázku nemusíte vyplňovat, pokud na výrok nemáte názor.) Veselá mysl je půl zdraví. Snídani sněz sám, o oběd se rozděl s přítelem a večeři dej nepříteli. Dodržování pitného režimu má velký vliv na naše zdraví i vzhled. Strava by měla být co nejrozmanitá. Bez pravidelného a intenzivního pohybu není možné redukovat váhu. Dostatek spánku a odpočinku je důležitý pro zdraví člověka. Kouření způsobuje rakovinu. 28

29 2.3 Analýza proměnných Pokud je provedeno dotazníkové šetření a data od respondentů jsou získána, musí se provést jejich kontrola. Některé chyby jsou viditelné na první pohled, například v uvedených datech bylo třeba přidat u roku narození 19 (napsáno bylo pouze 91) nebo byla také někdy přehozena hodnota diastolického a systolického tlaku. Po upravení dat je možné začít se zpracováváním. Lze začít analýzou jednotlivých proměnných, kde je možné sestavit tabulku četností a některé další popisné charakteristiky (dle druhu proměnné). Některé zjištěné skutečnosti mohou pomoci odhalit chování a zvyky respondentů, ale některé další jsou zbytečné z výzkumného hlediska. Důležitější než popisné charakteristiky budou závislosti, které se budou rozebírat následně Chování respondentů moţnost více odpovědí Je možné začít rozebírat jednotlivé proměnné od začátku dotazníku. První je skupina alternativních proměnných, která se ptá na chování respondentů. V tomto případě lze analyzovat otázku z pohledu jednotlivých proměnných, ale také z pohledu jednotlivých respondentů. Pokud chce tazatel zjistit, jaké charakteristiky mají jednotlivé proměnné, je třeba je nejprve označit, v tomto případě pořadí v dotazníku odpovídá pořadí proměnné. Jelikož se jedná o alternativní proměnnou, uvádí se pouze absolutní a relativní četnost, kumulativní četnosti by neměly význam. Rozsah souboru (počet respondentů) je 122. Tabulka rozdělení četností je následující: 29

30 Četnost odpovědí Tabulka5: Zvyky respondentů S1 (Zdroj: vlastní) Proměnné Absolutní četnost (n i ) Relativní četnost (p i ) S1_ % S1_ % S1_ % S1_ % S1_ % S1_ % S1_ % S1_ % S1_ % S1_ % Součet x x Z tabulky je možné zjistit, že 81 % respondentů každý den snídá, zato pouze 16 % oslovených sní každý týden alespoň jednu porci ryby. Pro znázornění této tabulky je možné využít sloupcový graf, kde každé proměnné bude odpovídat jeden sloupec: 100% 80% 60% 40% 20% 0% S1_1 S1_2 S1_3 S1_4 S1_5 S1_6 S1_7 S1_8 S1_9 S1_10 Odpovědi Obrázek 1: Graf četností S1 (Zdroj: vlastní) Protože první otázka v dotazníku má soubor deseti odpovědí, je možné ji analyzovat také z pohledu jednotlivých respondentů a zjistit tak, jaké návyky mají respondenti. Je možné například pro každého respondenta sečíst počet vybraných tvrzení. Tím lze zjistit, kolik každý respondent vybral odpovědí. Čím více jich vybral, tím větší 30

31 je možnost, že žije podle zásad zdravého životního stylu. Také je možné zjistit pro celou tuto první otázku průměrný počet zaškrtnutých odpovědí, čehož lze docílit tím, že se všechny vybrané odpovědi respondentů sečtou a vydělí se počtem respondentů. V tomto případě vyšel průměrný počet zaškrtnutých odpovědí 4,11. Tento údaj je možné interpretovat takto: Průměrně každý respondent vybral 4 z 10 možností Chování respondentů ordinální proměnná Další otázkou v dotazníku je opět chování respondentů, ale tentokrát se jedná o ordinální proměnnou. Jednotlivých výroků je celkem deset, lze tedy udělat tabulku rozdělení četností pro každý zvlášť, ale je možné také vytvořit tabulku četností pro tuto celou otázku dohromady. Pokud tazatel chce analyzovat jednotlivé proměnné, lze to ukázat například na prvním výroku: Jím tučné vepřové maso. Možnosti odpovědí je vhodné překódovat, žádoucí chování je označeno vyšší hodnotou. Tabulka rozdělení četností pro tento výrok, který je označen jako S2_1, je následující: Tabulka 6: Rozdělení četností S2_1 (Zdroj: vlastní) Proměnná S2_1 Kód Absolutní četnost (n i ) Relativní četnost (p i ) Kumulativní četnost absolutní relativní (kn i ) (kp i ) nikdy % % výjimečně % % občas % % často % % denně % % Součet x % х х Z této tabulky je vidět, že 37 % respondentů jí tučné vepřové maso pouze výjimečně, zatímco 1 % respondentů jí tučné vepřové maso denně. Také by se dalo například říci, že 85 % respondentů jí tučné vepřové maso nikdy, výjimečně nebo občas. Grafické vyjádření absolutní četnosti je následující: 31

32 Četnost odpovědí nikdy vyjímečně občas často děnně Obrázek 2: Graf rozdělení četností S2_1 (Zdroj: vlastní) Pro ordinální proměnnou lze vypočítat modus, v tomto případě je nejčastější hodnota 4, což je možné interpretovat takto: Nejčastěji respondenti odpovídali, že tučné maso jí pouze výjimečně. Medián se rovná také hodnotě 4, proto je možné říci, že střední hodnota z tohoto souboru je výjimečně. Toto byla analýza jednotlivých zvyků respondentů, ale také je možné analyzovat návyky jednotlivých respondentů. To lze udělat buď pomocí průměru (jako při analýze předešlé otázky), nebo pomocí součtu. Tazatel si může vybrat jakoukoliv metodu, ale nyní bude ukázán součet. Sečtou-li se hodnoty proměnných u každého z respondentů, zjistí se opět "hodnota životního stylu respondenta". Čím vyšší je tato hodnota, tím více žije respondent v souladu se zdravým životním stylem. Je možné vypočítat průměrnou hodnota z celého datového souboru, což je x 3, Informovanost respondentů Třetí otázka v dotazníku se týká informovanosti respondentů o zdravém životním stylu. Je to skupina výroků, kde respondent hodnotí podle sebe míru pravdivosti výroku. Jde o ordinální proměnnou, kdy respondent odpovídá pomocí číselné škály, ve které hodnota 1 znamená vůbec nesouhlasím a hodnota 5 znamená zcela souhlasím. Opět je možné nahlížet na analýzu této proměnné jako na analýzu jednotlivých proměnných nebo jako na analýzu informovanosti jednoho respondenta. Pokud se bude analyzovat první výrok: Veselá mysl je půl zdraví., označí se jako V_1, tabulka rozdělení četnosti této proměnné je: 32

33 Tabulka 7: Tabulka rozdělení četnosti V_1 (Zdroj: vlastní) Proměnná V_1 Absolutní četnost (n i ) Relativní četnost (p i ) Kumulativní četnost absolutní relativní (kn i ) (kp i ) % 8 7 % % % % 35 29% % % % % Součet % х х Z tabulky je možné určit další charakteristiky: xˆ 5 ~ x 4 Q Q 0,25 0, R 4 IQR 2 Z toho vyplývá, že nejčastěji byl daný výrok hodnocen výrokem: "zcela souhlasím" a střední hodnotou souboru byl výrok hodnocený na číselné škále hodnotou 4. Z kvartilů je zjevné, že 25 % hodnot ze souboru je menších než 3 a 75 % hodnot je menších než hodnota 5. Variační rozpětí souboru je 4 a mezikvartilové rozpětí je 2. Graf pro toto rozdělení četností je: 33

34 Relativní četnost 50% 40% 30% 20% 10% 0% Míra souhlasu s výrokem Obrázek 3: Graf rozdělení četnosti V_1 (Zdroj: vlastní) Další možností, jak analyzovat tuto proměnnou, je nahlížet na ni jako na celek, který informuje o tom, jak jsou respondenti informovaní o dané problematice. Je tedy možné zjistit například průměrnou hodnotu informovanosti jednoho respondenta či vytvořit sumární celkovou průměrnou hodnotu z dat Pohlaví respondentů Další analyzovanou proměnnou je nominální proměnná, která informuje o pohlaví respondentů. Z dat vyplývá, že zastoupení jednotlivých pohlaví v dotazníkovém šetření je následující: Tabulka 8: Rozdělení respondentů dle pohlaví (Zdroj: vlastní) Pohlaví Absolutní četnost Relativní četnost Ţeny % Muţi % Součet % Z tabulky je možné zjistit, že větší zastoupení v dotazníku mají ženy (67 %). Tento fakt nevadí, jelikož pro další účely je tento údaj potřebný pro rozdělení dat na dvě části a jejich další porovnávání. V případě, že by tazatel potřeboval pro svůj dotazník reprezentativní vzorek pro zastoupení pohlaví, poměr by měl odpovídat reálnému zastoupení ve společnosti. Grafické znázornění rozdělení respondentů dle pohlaví je následující: 34

35 žena muž Obrázek 4: Graf rozdělení respondentů dle pohlaví (Zdroj: vlastní) Nejvyšší dosaţené vzdělání Další otázkou v dotazníku je nejvyšší dosažené vzdělání. Je možné ji analyzovat samostatně, ale spíše je potřebnější při porovnávání dalších proměnných dle dosaženého vzdělání. Je to ordinální proměnná, takže je možné zkonstruovat tabulku rozdělení četností: Tabulka 9: Tabulka rozdělení četností Vzdělání (Zdroj: vlastní) Proměnná Vzdělání Kód Absolutní četnost (n i ) Relativní četnost (p i ) Kumulativní četnost absolutní relativní (kn i ) (kp i ) základní % 6 5 % vyučen % % střední s maturitou % 89 73% vysokoškolské (včetně % % Součet x % х х Z tabulky je možné vyčíst tyto charakteristiky: xˆ 3 ~ x 3 Q Q 0,25 0, R 3 IQR 1 35

36 Z těchto charakteristik lze usoudit, že velké množství (62 %) respondentů, má ukončené střední vzdělání s maturitou. Pro grafické zobrazení lze sestrojit sloupcový graf Věk Proměnná věk byl označen jako kvantitativní proměnná, ale lze jej pro přehlednější rozdělení a pro další zpracování rozdělit na jednotlivé kategorie. Poté je možno ho zařadit mezi ordinální proměnnou. Pro tento dotazník bylo zvoleno následující rozdělení: Tabulka 10: Rozdělení věku respondentů do kategorií (Zdroj: vlastní) Kategorie Spodní hranice Horní hranice starší střední mladší Pro toto rozdělení je možné určit tabulku rozdělení četností: Tabulka 11: Tabulka rozdělení četností Věk (Zdroj: vlastní) Proměnná Věk Kód Absolutní četnost (n i ) Relativní četnost (p i ) Kumulativní četnost absolutní relativní (kn i ) (kp i ) mladší % % střední % % starší % % Součet x % х х Popisné charakteristiky pro proměnnou věk jsou následující: xˆ 1 ~ x 1 Q Q 0,25 0, R 2 IQR 1 36

37 Absolutní četnost Z tabulky a popisných charakteristik je možné zjistit, že většina (57 %) respondentů je zařazena do kategorie mladší. Opět by bylo možné použít sloupcový graf pro grafické zobrazení Výška Výška respondentů je kvantitativní proměnná s větším rozsahem hodnot, proto bude muset být použito intervalové rozdělení. Nejprve se určí délka intervalu: ( ) d 9,83 6 Délka intervalu se zaokrouhlí například na 12, aby byly zahrnuty všechny hodnoty, a vyjdou následující intervaly a rozdělení četností: Tabulka 12: Tabulka rozdělení četností Výška (Zdroj: vlastní) Kumulativní četnost Dolní mez Horní mez Střed Absolutní četnost (n i ) Relativní četnost (p i ) absolutní relativní (kn i ) (kp i ) % 1 1 % % 4 3 % % % % % % % % % Součet x x % x x Středy intervalů výšky respondentů Obrázek 5: Graf četnosti Výška (Zdroj: vlastní) 37

38 Z tabulky lze určit průměr, který po dosazení do vzorce pro váženou formu průměru, vyjde 172,67. Z toho se dá usuzovat, že průměrná výška respondenta je 172,67 cm. Také lze zjistit modus, který leží na intervalu 171 ; 183. Protože jde o intervalové rozdělení, medián se vypočítá takto: ~ 0,5 kpi 0,5 0,45 x h a ,4 p 0,43 i Střední hodnota je tedy rovna 172,4 cm. Kvartily lze vypočítat podle jejich vzorce: ~ p kpi 0,75 0,45 x0,75 h a ,37 p 0,43 i ~ p kpi 0,25 0,03 x0,25 h a ,29 p 0,42 i Dle kvartilů lze zjistit, že 75 % respondentů je menších než 179,37 cm, a zároveň, že 25 % respondentů je menších než 165,29. Také je možné vypočítat variační a mezikvartilové rozpětí: R x max x min IQR ~ x ~ 0,75 x0,25 179,37 165,59 13,78 Na základě těchto údajů lze vyvodit, že rozpětí souboru je 59 a rozpětí mezi horním a dolním kvartilem je 13,78. Další známé charakteristiky, které lze vypočítat pro kvantitativní proměnnou, jsou rozptyl, směrodatná odchylka a variační koeficient. s 2 n i1 ( x i n x) ,78 20, s s 2 4,56 V x x s 4,56 172,67 0,03 38

39 2.3.8 Váha Další analyzovanou proměnnou je váha, což je kvantitativní proměnná, proto bude její analýza velmi podobná analýze předchozí proměnné. Nejprve se opět určí délka intervalu: d (121 46) 6 12,5 Délka intervalu se určí například na 15, aby byly zahrnuty i krajní hodnoty, a vyjde následující tabulka rozdělení četností: Tabulka 13: Tabulka rozdělení četností váha (Zdroj: vlastní) Dolní mez Horní mez Střed Absolutní četnost (n i ) Relativní četnost (p i ) Kumulativní četnost absolutní relativní (kn i ) (kp i ) , % % , % % , % % , % % ,5 2 2 % % ,5 1 1 % % Součet x x % x x Opět je možné zobrazit rozdělení četností pomocí sloupcového grafu. Z tabulky je možné určit průměr, který vyjde 70,74, z čehož vyplývá, že průměrná váha respondenta je 70,74 kg. Modus leží na intervalu 55 ; 70. Jelikož jde o intervalové rozdělení, medián a kvartily jsou následující: ~ 0,5 kpi 0,5 0,12 x h a ,25 p 0,4 i 39

Zobrazit více