VYSOKÁ ŠKOLA POLYTECHNICKÁ JIHLAVA. Katedra ekonomických studií

Rozměr: px
Začít zobrazení ze stránky:

Download "VYSOKÁ ŠKOLA POLYTECHNICKÁ JIHLAVA. Katedra ekonomických studií"

Transkript

1 VYSOKÁ ŠKOLA POLYTECHNICKÁ JIHLAVA Katedra ekonomických studií Moţnosti zpracování dat pořízených dotazníkovým šetřením bakalářská práce Autor: Šárka Dubová Vedoucí práce: RNDr. Jana Borůvková, Ph.D. Jihlava 2012

2

3 Anotace Tato bakalářská práce je zaměřena na analýzu dat, která jsou pořízena dotazníkovým šetřením. V teoretické části se práce zabývá druhy proměnných, se kterými je možné se setkat, a metodami analýz, kterými se tyto proměnné zpracovávají. V praktické části je vytvořen modelový dotazník, na kterém je ukázáno, jak má celý průběh dotazníkového šetření probíhat. Je znázorněna analýza proměnných a analýza závislostí, která zkoumá jejich vzájemný vztah. Klíčová slova dotazníkové šetření, druhy proměnných, analýza proměnných, analýza závislostí, data, respondent, dotazník, analýza Annotation This bachelor thesis is aimed to data analysis getting from questionnaire survey. In the theoretic part the thesis is engaged with types of variables which are able to be encountered, and method analysis processing these variables. In the practical part is built a model questionnaire and shown how the whole process of questionnaire survey should proceed. There is shown variables analysis and dependencies analysis that examines their mutual relation. Keywords questionnaire survey, types of variables, variables analysis, dependencies analysis, data, respondent, questionnaire, analysis

4 Ráda bych poděkovala vedoucí práce RNDr. Janě Borůvkové, Ph.D. za její čas, trpělivost a za její odborné rady. Také bych ráda poděkovala svému příteli a mamce za jejich podporu při psaní této práce i při studiu samotném.

5 Prohlašuji, že předložená bakalářská práce je původní a zpracoval jsem ji samostatně. Prohlašuji, že citace použitých pramenů je úplná, že jsem v práci neporušil autorská práva (ve smyslu zákona č. 121/2000 Sb., o právu autorském, o právech souvisejících s právem autorským a o změně některých zákonů, v platném znění, dále též AZ ). Souhlasím s umístěním bakalářské práce v knihovně VŠPJ a s jejím užitím k výuce nebo k vlastní vnitřní potřebě VŠPJ. Byl jsem seznámen s tím, že na mou bakalářskou práci plně vztahuje AZ, zejména 60 (školní dílo). Beru na vědomí, že VŠPJ má právo na uzavření licenční smlouvy o užití mé bakalářské práce a prohlašuji, že s o u h l a s í m s případným užitím mé bakalářské práce (prodej, zapůjčení apod.). Jsem si vědom toho, že užít své bakalářské práce či poskytnout licenci k jejímu využití mohu jen se souhlasem VŠPJ, která má právo ode mne požadovat přiměřený příspěvek na úhradu nákladů, vynaložených vysokou školou na vytvoření díla (až do jejich skutečné výše), z výdělku dosaženého v souvislosti s užitím díla či poskytnutím licence. V Jihlavě dne Podpis

6 Obsah Úvod Teoretická část Základy dotazníkového šetření Analýza proměnných Druhy proměnných Rozdělení četností Graf rozdělení četností Popisné charakteristiky úroveň Popisné charakteristiky variabilita Analýza závislostí Závislost dvou kategoriálních proměnných Závislost dvou kvantitativních proměnných Závislost dvou alternativních proměnných Praktická část Navrţení dotazníku Analýza proměnných Chování respondentů možnost více odpovědí Chování respondentů ordinální proměnná Informovanost respondentů Pohlaví respondentů Nejvyšší dosažené vzdělání Věk Výška Váha Tlak Analýza závislostí Analýza závislosti kategoriálních proměnných Analýza závislosti kvalitativních proměnných Závěr Seznam uţité literatury Seznam tabulek Seznam obrázků Seznam příloh... 56

7 Úvod Téma této bakalářské práce se týká problematiky dotazníkových šetření. V dnešní době se dají najít různé dotazníky skoro ve všech novinách, časopisech, internetových stránkách a dalších médiích, ale ne zcela všechny jsou dobře vymyšlené, správně konstruované a užitečné. Některé dotazníky nemají žádnou vypovídající hodnotu vzhledem k jejich nedostatečné přípravě, nesprávnému zpracování a tím i neadekvátnímu výstupu. Cílem této bakalářské práce je tedy ukázat možnosti analýzy dat pořízených dotazníkovým šetření v závislosti na kvalitě a úplnosti dat a dále v závislosti na stanovení výzkumného záměru. V teoretické části se bakalářská práce nejprve věnuje počátkům dotazníkového šetření, kdy je opravdu nejlepším řešením danou problematiku promyslet a zvážit, co je třeba zkoumat a na které otázky by tazatel chtěl znát odpověď. Tato prvotní část dotazníkového šetření se ale bohužel často vynechává a díky tomu se nepodaří zajistit všechna potřebná data k jejich analyzování a vytvoření závěrů. Také se práce zabývá tím, že všechny metody zpracování dat nejsou vhodné pro všechny druhy proměnných, které dotazník obsahuje, a proto jsou zde popsány druhy jednotlivých proměnných. Dále se řeší zpracování dat pomocí rozdělení četností a popisných charakteristik s ohledem na druh proměnné. Poslední kapitolou teoretické části je analýza závislostí, která může odhalit skutečnost, že některé proměnné jsou na sobě závislé a některé naopak ne. U této analýzy se využívá testování hypotéz o nezávislosti a také koeficienty, které mohou určit sílu závislosti proměnných. Praktická část této bakalářské práce pojednává o tom, jak vhodně sestavit a zpracovat dotazník. K tomuto účelu byl vytvořen modelový dotazník na téma zdravý životní styl populace v České republice, v němž nejde o obsah, ale o průběh jeho vytvoření a zpracování. Tento dotazník je přiložen jako příloha. V znázorněném průběhu dotazníkového šetření je nejprve promyšleno, co by chtěl tazatel z dotazníkového šetření zjistit, a poté jsou voleny otázky do samotného dotazníku. Po vytvoření dotazníku a získání potřebných odpovědí od respondentů se provádí analýza proměnných. Tato analýza obsahuje vytvoření tabulky rozdělení četností a její grafické zobrazení v podobě grafu. Následuje zpracování popisných 7

8 charakteristik, které přibližuje danou proměnnou, a je možné vytvořit první závěry o ní. Na závěr se provádí analýza závislostí mezi proměnnými, která může objasnit závislost či nezávislost mezi nimi. Díky této analýze je možné zjistit zajímavé informace o proměnných, které jsou užitečnější než samotná popisná charakteristika, ale bohužel se na analýzu závislostí často zapomíná. Výsledky z analýzy je nutné interpretovat a zamyslet se, proč tomu tak je. 8

9 1 Teoretická část V této části je teoreticky rozebírána příprava a průběh dotazníkového šetření a představení obvyklých chyb, které vedou k neúplnému využití dat z dotazníku při zpracování. Také se zde řeší druhy proměnných, se kterými se lze při zpracování dat pořízených z dotazníkových šetření setkat, a postupy, které jsou vhodné pro zpracování konkrétních druhů proměnných. 1.1 Základy dotazníkového šetření Data z dotazníků jsou častými doplňky různých článků, průzkumů a dalších písemných prací. Ovšem ne každý výsledek dotazníků poskytne čtenáři hodnotnou výpověď o dané situaci, což může být výsledkem špatného uchopení celého dotazníkového šetření. Častá a také chybná varianta začátku šetření je, že tazatel vybere otázky k danému tématu, které se mu zdají zajímavé, a na ty se poté ptá respondentů. V takovéto variantě tazatel vlastně ani neví, co od výsledků očekává, a proto může očekávat od průzkumu jen základní statistické údaje, ale už není schopen vyvodit závislosti mezi jednotlivými proměnnými. Nejprve tazatel musí začít tím, že si položí výzkumnou otázku, ke které bude zpracovávat příslušný dotazník. Například pro modelový dotazník v praktické části této práce je položena výzkumná otázka: S jakými aspekty souvisí zdravý životní styl lidí v ČR? Poté se určí výzkumné hypotézy, které upřesňují výzkumnou otázku. Jsou to přesné otázky, na které by chtěl znát tazatel odpověď a které bude při zpracování zkoumat. Pro představu, výzkumné hypotézy dle již zmíněné výzkumné otázky jsou například: Závisí životní styl na pohlaví respondenta? Souvisí spolu věk a zdravý životní styl? Podle těchto výzkumných hypotéz se teprve začne sestavovat dotazník. Z otázek se vyberou pojmy, které je potřeba zařadit do dotazníkového šetření. Tímto celým procesem by mělo začínat každé dotazníkové šetření, protože teprve z těchto informací je možné sestavit dobrý dotazník. Při tvorbě otázek je nutné si ujasnit jejich formu jestli se použijí otevřené, zavřené či polouzavřené otázky. Otevřené otázky se užívají především pro kvalitativní výzkumy, polouzavřené pro pilotní ověření dotazníku a konečně uzavřené otázky pro kvantitativní šetření, kterým se zabývá tato bakalářská práce. 9

10 Zpracování jednotlivých odpovědí respondentů se řídí typem otázky, které byly v dotazníku položeny. V dotazníkových šetřeních je možné najít několik základních typů otázek: respondent si může vybrat právě jednu odpověď z nabízených odpovědí respondent vybírá v rámci jedné otázky ze seznamu výroků ty, které pro něj platí v rámci jedné otázky je respondentovi nabízen seznam položek a respondent jednotlivé položky hodnotí na nabízené škále respondent na položenou otázku odpovídá číslem Ve druhém a třetím případě se nejedná o jedinou otázku, ale o skupinu otázek, protože každá z nabízených "odpovědí" je vlastně samostatná otázka. K tomuto sdružování do jedné otázky lze přistoupit proto, aby tazatel usnadnil respondentům vyplnění dotazníku a zkrátil tak čas potřebný na jeho vyplnění. Při vlastním sestavování dotazníku by měl znát tazatel několik pravidel tvorby otázek a odpovědí. Například měl dbát na to, aby byly jasně formulované a respondentovi srozumitelné. Otázky ani odpovědi by neměly obsahovat záporné výrazy, aby to respondenta nemátlo, a také by se neměly pokládat dvě otázky v jedné, aby bylo jasné, na co má respondent odpovídat. Jednotlivé odpovědi by se neměly významově překrývat kvůli přesnému vybrání odpovědi. Poté, co tazatel sestavil dotazník, by měl v ideálním případě provést jeho pilotní ověření. Při pilotním ověření je na místě použít místo uzavřených otázek polouzavřené otázky, ve kterých nechá volně místo pro jiné odpovědi než ty, které vybral. Toto je velmi důležité pro ověření správného výčtu odpovědí, které by měly zahrnovat všechny možnosti, a každý respondent by si měl mezi nimi najít tu, která je nejblíže realitě. Na druhé straně tazatel musí dávat pozor, aby se nabízené odpovědi významově nepřekrývaly. Z pilotního ověření je možné zjistit, zda jsou otázky dobře formulované, zda je respondenti správně chápou a pokud se v pilotním ověření dotazníku ukáže, že otázky nebo nabízené odpovědi nejsou vhodně formulované či vybrané, je nutné je před vlastním dotazníkovým šetřením ještě upravit. 10

11 1.2 Analýza proměnných Po ukončení vlastního dotazování respondentů, může tazatel začít se zpracováváním dat. Nejprve by měl určit druhy proměnných, které bude zpracovávat, a na základě jejich zařazení by měl volit statistické metody: rozdělení četností do tabulky grafické zobrazení četností popisné charakteristiky úrovně a variability Podle druhů proměnných se liší zpracování rozdělení četností i popisné charakteristiky, které budou také popsány v této kapitole. Popisná statistika je ještě rozdělena na charakteristiky úrovně a variability, charakteristikami míry se tato práce zabývat nebude Druhy proměnných Alternativní proměnná se často používá v situaci, kdy je třeba rozdělit respondenty podle jedné vlastnosti a dle tohoto výběru pak budou odpovídat na další otázky. V praktické části dotazníku není například potřeba, aby respondent vyplňoval hodnotu svého krevního tlaku, když ji neví. Proto je použita otázka: Znáte hodnotu vašeho krevního tlaku? Pokud ji zná, pokračuje dalším pokynem, aby vyplnil hodnotu svého tlaku. Alternativní proměnná může být symetrická, kdy obě možnosti jsou pro tazatele stejně důležité, nebo asymetrická, kdy jedna z možných odpovědí je důležitější. Nominální proměnná je proměnná, která nese nejčastěji textový údaj, a lze u ní pouze porovnávat, zda se liší či je stejná. Data u této proměnné nelze tedy sčítat a provádět matematické operace. Nejčastějšími příklady nominální proměnné jsou druh profese, typ absolvované školy, zařazení města, ve kterém respondent žije a další. Ordinální proměnná určuje pořadí či stupeň daného znaku. Je do ní možno zařadit například stupeň vzdělání, stupeň souhlasu s daným výrokem nebo stupeň spokojenosti či nespokojenosti s danou situací. Pokud se jedná o stupeň spokojenosti či stupeň souhlasu, jsou tyto stupně spíše subjektivním pocitem respondenta. S těmito proměnnými nelze provádět matematické operace, ale je možné je porovnávat mezi sebou. V některých typech odpovědí může respondent odpovídat číslovkou. Například v modelovém dotazníku v praktické části je jedna z otázek hodnocení pravdivosti 11

12 výroků podle respondenta, kde je možné odpovídat hodnotami 1 až 5. V další otázce respondent odpovídá pouze z výběru denně/často/občas/výjimečně/nikdy, takže další možností je odpovídat textovým údajem o frekvenci vybraných činností respondenta. Výše zmíněné proměnné se také mohou souhrnně označovat jako kvalitativní proměnné. Kvantitativní neboli numerická proměnná je proměnná, která obsahuje číselný údaj. Tyto proměnné se mohou ještě členit na intervalové či poměrové proměnné, obě dvě varianty v dotaznících zachycují číselné odpovědi jako například výšku, hmotnost či hodnotu krevního tlaku. Intervalová proměnná může nabývat hodnot 0 a více a lze u dvou takovýchto proměnných určit, o kolik je jedna menší či větší než druhá. U poměrové proměnné může zpracovatel ještě navíc určit, kolikrát je jedna hodnota větší či menší než druhá. Poměrová proměnná může tedy nabývat pouze kladných hodnot. Také je možné proměnné dělit na kategoriální a kvantitativní spojité proměnné, kdy do kategoriálních se zahrnují proměnné nominální, ordinální a kvantitativní, které mají menší rozsah variant a jsou vlastně uzavřenými odpověďmi. Kvantitativní spojité označují kvalitativní proměnné, které nabývají většího rozsahu hodnot a jsou otevřenými odpověďmi (například odpovědi týkající se váhy či výšky respondentů) Tabulka rozdělení četností Zpracovávaná data mohou být rozdělena podle množství jejich výskytů, čemuž odpovídá rozdělení jejich četností. Možnost znázornění dat v číslech a přehledné tabulce umožňuje tabulka rozdělení četností a z ní se mohou data zobrazit v grafické podobě v grafu četností. Tabulka četností se častěji používá v případech, kdy je možnost podrobněji sledovat data a je potřeba znát přesně jednotlivá čísla, zatímco graf rozdělení četnosti tato přesná čísla neukazuje, ale je lehčí se v jeho grafickém zobrazení vyznat. Při sestrojení rozdělení četnosti se musí brát v úvahu typ dat. V případě kategoriálních dat se jedná o bodové třídění. Při práci s nominálními, ordinálními či alternativními proměnnými se musí každé proměnné dát kód, který ji bude zastupovat. Rozdělení četností pomocí tabulky rozděluje odpovědi respondentů dle jejich četnosti. Pokud se proměnná nazve X, její jednotlivé odpovědi se označí x i, kde i =1, 2, 3,..., 12

13 a počet respondentů se označí n, vznikne základní tabulka rozdělení četností. V té se nejčastěji uvádí absolutní četnost a její relativní vyjádření relativní četnost. Také je možnost uvádět další charakteristiky jako kumulativní absolutní četnost a kumulativní relativní četnost. Absolutní četnost (n i ) uvádí počet výskytů daného znaku v datovém souboru. Z toho se může určit znak s nejvyšší četností, ale zároveň i s nejnižší četností. Lze ji vypočítat "ručně" sčítáním výskytů znaků, ale snadnější variantou je vypočítání například pomocí programu Excel a funkcí ČETNOSTI. Jako kontrola správnosti výpočtů může sloužit fakt, že součet n i se musí rovnat n, tedy počtu respondentů. Relativní četnost (p i ) je bezrozměrná veličina, ale pokud se vynásobí 100, lze ji uvádět v procentech. V tomto případě je procentuálním vyjádřením absolutní četnosti, která říká, v jakém procentuálním poměru je daný znak zastoupen. Součet p i se musí vždy rovnat 1. Relativní četnost lze vypočítat podle vzorce: p i ni n Kumulativní absolutní četnost (kn i ) vzniká postupným kumulováním absolutních četností. Lze z ní zjistit, jak velkou četnost má více znaků dohromady. Vzorec je následující: kn i n j i j1 Kumulativní relativní četnost (kp i ) vzniká postupným kumulováním relativních četností. Tato veličina je bezrozměrná, ale dá se vyjádřit v procentech. Tato četnost vyjadřuje, kolik procent výskytu má více znaků dohromady. Vzorec je následující: kp i p j i j1 13

14 Tabulka1: Tabulka rozdělení četností (bodové rozdělení) Proměnná X Absolutní četnost (n i ) Relativní četnost (p i ) Kumulativní četnost absolutní (kn i ) relativní (kp i ) x 1 n 1 p 1 kn 1 kp 1 x 1+n n 1+n p 1+n kn 1+n kp 1+n x k n k p k n 1 Součet n 1 х х Pokud je větší množství variant odpovědí, jedná se o intervalové třídění. Toto třídění se používá nejčastěji pro kvantitativní proměnnou s velkým rozsahem hodnot. V případě intervalového třídění je nutné správně vytvořit intervaly. Intervaly by měly mít konstantní délku h, nesmí se překrývat a měl by jich být přiměřený počet k. Za vhodný počet intervalů se uvažuje k 1 + 3,3 log n. Další změnou oproti bodovému třídění je x i, kde místo jednotlivých znaků (odpovědí respondentů), se dosazuje střed daného intervalu. Délku intervalu lze zjistit pomocí vzorce. Pokud se p označí jako počet intervalů, vzorec pro výpočet délky je následující: d x max x p min Intervaly musí obsahovat všechny hodnoty z datového souboru, proto se musí volit vhodné hranice. Buď se použije minimální hodnota ze souboru jako spodní hranice, nebo se použije ještě nižší hodnota než minimální. 14

15 Tabulka2: Tabulka rozdělení četností (intervalové třídění) Intervaly Střed Absolutní četnost (n i ) Relativní četnost (p i ) Kumulativní četnost absolutní relativní (kn i ) (kp i ) (x min; x min +d> x 1 n 1 p 1 kn 1 kp 1 (x min +d; x 1+n n 1+n p 1+n kn 1+n kp 1+n (x +2d) x k n k p k kn k kp k Součet x n 1 х х Graf rozdělení četností Množství výskytu daných znaků je také možné znázornit pomocí grafu rozdělení četností, který dokáže zachytit průběh rozdělení četností. Většinou se vychází z tabulky rozdělení četností, kde se vybere znázorňovaná veličina. Pro zobrazení alternativní či nominální proměnné se používá graf výsečový, pro ostatní proměnné nejčastěji graf sloupcový. Zpracovatel dotazníků, který chce použít pro prezentaci dat grafy, by měl mít na paměti, že by graf měl mít jasné barvy, menší počet objektů a čísel a měl by být především přehledný na první pohled Popisné charakteristiky úroveň Z dotazníkového šetření lze zjistit kromě rozdělení četností další informace, a to například charakteristiky úrovně. Jak bylo již zmíněno v úvodu této kapitoly, u charakteristik se musí brát v úvahu druh zpracovávané proměnné. Pro nominální proměnnou lze počítat z charakteristik úrovně pouze modus, což je nejčastější odpověď respondentů na otázku. Modus lze zjistit například z tabulky rozdělení četností. Případ, kdy vyjde pouze jedna nejčastější hodnota, se nazývá unimodální a další případ, kdy vyjdou dvě hodnoty s tou samou nejvyšší četností, se nazývá bimodální. Pokud relativní četnost této hodnoty je větší než hodnota 0,5, dá se hovořit o majoritním modu. V tomto případě to znamená, že více než polovina 15

16 respondentů uvedla tuto odpověď a je to tedy velmi významná hodnota. Modus se označuje xˆ. V případě ordinální proměnné lze zjistit kromě modu také medián. Medián uvádí hodnotu, která se nachází ve středu všech sebraných dat, je to tedy střední hodnota. Stejně jako modus ani medián není ovlivněn extrémními hodnotami souboru. Pro ordinální proměnnou je nutné v tabulce rozdělení dat přiřadit každé kategorii číselné označení. V případě netříděných dat se dá medián zjistit seřazením dat dle jejich hodnot od nejmenší po největší a poté rozdělit tuto řadu na dvě stejné části. Pokud je součet hodnot lichý, jako medián se bere hodnota v půli souboru, při sudém počtu se ze dvou půlících hodnot vypočítá průměr. V případě tříděných dat lze medián vypočítat z tabulky četností. Medián je možné nalézt pomocí příslušného řádku v tabulce, ve kterém kumulativní relativní četnost (kp i ) poprvé přesáhne hodnotu 0,5. Jestliže kp i > 0,5, medián se rovná příslušnému x i. Pokud ale kp i = 0,5, k příslušnému x i se přičte hodnota 0,5. Další významné hodnoty pro ordinální proměnnou mohou být kvantily. Kvantily označují hodnoty, které dělí soubor seřazených hodnot na určité části. Některé kvantily mají svá jména, například kvantil Q 0,5 se nazývá medián, Q 0,25 dolní kvartil a Q 0,75 horní kvartil. Tyto hodnoty je možné zjistit opět z tabulky rozdělení četností. Pro výpočet dolního kvartilu se opět hledá hodnota, u které kp i 0,25 a zároveň kp i 1 < 0,25. Jestliže kp i > 0,25, pak dolní kvartil se rovná příslušnému x i, ale jestliže kp i = 0,25, pak dolní kvartil se rovná x i + 0,25. Pro výpočet horního kvartilu se hledá hodnota, u které kp i 0,75 a zároveň kp i 1 < 0,75. Jestliže kp i > 0,75, pak horní kvartil se rovná příslušnému x i, ale jestliže kp i = 0,75, pak horní kvartil se rovná x i + 0,75. Kvantitativní proměnnou určují charakteristiky úrovně modus, medián, kvantily a také průměr. V tomto odstavci se budu zabývat kvantitativní proměnnou, která má malé množství variant a tvoří uzavřenou odpověď. Modus, medián a kvantily lze zjistit již zmiňovaným způsobem, průměr lze vypočítat dle vzorce. Existuje více druhů průměrů, ale pro potřeby dotazníkového šetření bude postačující aritmetický průměr ve svých dvou formách prosté a vážené formě. Prostá forma se používá v případech, kdy data nejsou tříděna (například do tabulky). Pokud n je počet všech hodnot datového 16

17 souboru (počet respondentů) a x i jsou jednotlivé odpovědi, vzorec pro aritmetický průměr je následující: x 1 n n x i i1 Vážená forma průměru se používá v případě, pokud jsou data již tříděna. Pokud se dodrží předchozí zápis s tím rozdílem, že n i je počet odpovědí pro dané x i, platí vzorec: x 1 n k i1 x i n i Pokud se popisná charakteristika vztahuje na kvantitativní proměnnou s větším rozsahem hodnot, data jsou většinou tříděna intervalově a lze vypočítat modus, medián, kvantily a průměr. Modus a průměr jsou počítány stejným způsobem jak v předešlé proměnné, medián lze vypočítat podle vzorce. Pokud se nalezne interval, ve kterém poprvé kumulativní relativní četnost přesáhne hodnotu 0,5, v tomto intervalu se nalezne hodnota relativní četnosti p i a hodnota dolní hranice tohoto intervalu a, v předcházejícím intervalu hodnota kumulativní relativní četnosti kp i, délka intervalu h a dosadí se do následujícího vzorce: ~ x 0, 5 kpi p i h a Pro kvantitativní proměnnou s větším rozsahem hodnot lze také vypočítat kvantily podle vzorce z intervalového třídění hodnot v tabulce. Při zachování značení z předcházejícího odstavce vypočítání Q p je nutné dosadit do následujícího vzorce: ~ x p p kpi p i h a 17

18 1.2.3 Popisné charakteristiky variabilita Pro ordinální proměnnou je možné určit například variační rozpětí, které ukazuje rozpětí souboru. Lze jej vypočítat pomocí vzorce: R x max x min Další charakteristikou pro ordinální proměnnou je také mezikvartilové rozpětí, které je možné vypočítat: IQR ~ x ~ x 0,75 0,25 Důležitější jsou popisné charakteristiky variability pro kvantitativní proměnnou. Je možné opět určit variační a mezikvartilové rozpětí, ale lze určit také rozptyl, který uvádí rozdělení hodnot z dotazníkového šetření kolem střední hodnoty. Tento rozptyl lze vypočítat pomocí vzorce: s 2 n ( xi x) i1 n 2 Další charakteristikou variability pro kvantitativní proměnnou může být směrodatná odchylka s a variační koeficient Vx. Směrodatná odchylka je, jak lze ze vzorce usoudit, kvadratický průměr odchylek, zatímco variační koeficient je směrodatnou odchylkou v relativním vyjádření. Jejich vzorce jsou následující: s 2 s V x s x 18

19 1.3 Analýza závislostí S dobře sestaveným dotazníkem nemusí zjistit tazatel pouze popisné charakteristiky, ale může odvozovat závislosti z jednotlivých proměnných. Je tedy třeba se podívat na výzkumné hypotézy, které se stanovují před začátkem dotazníkového šetření, a pomocí testování závislostí a jejich intenzity lze na tyto hypotézy odpovědět. Tato kapitola je zpracována dle Hany Řezankové, která tuto problematiku řeší v knize Analýza dat z dotazníkových šetření, rok Při zjišťování závislosti dvou proměnných se nejprve zavede nulová hypotéza H 0 a alternativní hypotéza H 1, které se porovnávají. Hypotéza H 0 se poté zkoumá pomocí různých koeficientů, které jsou použity v závislosti na druhu zkoumaných proměnných. Také je potřeba zvolit si hladinu významnosti, která udává pravděpodobnost toho, že se H 0 neoprávněně zamítne, přestože platí. Po zjištění koeficientů a rozhodnutí o volbě hladiny významnosti se hypotéza zamítá či nezamítá na základě různých testovacích kritérií, jejichž volba závisí opět na druzích proměnných. Také je možné zjistit míru závislosti pomocí příslušných koeficientů. Při analýze závislostí mezi kategoriálními proměnnými se vychází z již roztříděných dat, která jsou uspořádána do dvourozměrné tabulky četnosti (kontingenční tabulky). Tato tabulka má ve svých řádcích zavedenou jednu zkoumanou proměnnou a v řádcích druhou proměnnou. Jejím obsahem jsou absolutní nebo relativní četnosti těchto proměnných. Pokud je kontingenční tabulka zaváděna pro dvě alternativní proměnné, dá se hovořit o asociační tabulce. Kontingenční i asociační tabulka se dá snadno vytvořit z neuspořádaných dat například v počítačovém programu Excel, který umí spočítat pouze absolutní četnost u dvou proměnných. Také je možné údaje z kontingenční tabulky zobrazit pomocí grafů, v tomto případě se používají grafy sloupcové. Pokud se jedna z proměnných označí X, počet jejích variant (kategorií) R, druhá proměnná Y, počet jejích variant S, rozsah i =1, 2, 3,, R, rozsah j= 1, 2, 3,, S, rozsah souboru n a zjištěné absolutní četnosti n ij, kontingenční tabulka vypadá následovně: 19

20 Tabulka3: Dvourozměrná tabulka četnosti Proměnná Y Proměnná X 1. kategorie j tá kategorie S tá kategorie Celkem 1. kategorie n 11 n 1j n 1S n 1+ i- tá kategorie n i1 n ij n is n i+ R- tá kategorie n R1 n Rj n RS n R+ Součet n +1 n +j n +S n Četnosti n ij se nazývají sdružené absolutní četnosti a četnosti n i+ a n +j se nazývají marginální četnosti. Jestliže se kontingenční tabulka pro relativní četnosti počítá z celého souboru, počítá se pomocí vzorce: p ij n ij n Závislost dvou kategoriálních proměnných Při šetření nejčastěji obsahují dotazníky kategoriální data, proto vypočítání této závislosti je velmi důležité. Pro výpočet této závislosti se používá chí kvadrát test o nezávislosti. Pro testování hypotéz lze využít testové kritérium Pearonova statistika chí kvadrát, která má následující vzorec: R S ( nij mij ) 2 p m i1 j1 ij 2 V tomto vzorci je užita očekávaná četnost v případě nezávislosti, kterou lze vypočíst vzorcem: m ij n i n n j 20

21 Pokud jsou obě dvě proměnné ordinální, je možné použít i Spearmanův korelační koeficient. Ten lze vypočítat pomocí vzorce: r s 2 6 D n( n 1) 1 2 D 2 n l1 ( x l y l ) 2 Tento koeficient leží na intervalu od mínus jedné do jedné Závislost dvou kvantitativních proměnných Pokud tazatel chce zjistit, jestliže jsou na sobě dvě kvantitativní proměnné vzájemně závislé, je to možné pomocí Pearsonova korelačního koeficientu. Vzorec pro jeho výpočet pomocí absolutních četností je následující: r i1 j1 R 2 2 S 2 2 ni xi nx n j y j ny i1 R S n x y ij i j n x y j1 1 x n 1 y n R i 1 S j 1 n i x n i j y j Také je možné vypočítat míru intenzity závislosti těchto proměnných. Pearsonův korelační koeficient se vyskytuje na intervalu 1; 1, kde 0 znamená lineární nezávislost, hodnota 1 je nepřímá závislost (negativní korelace) a hodnota 1 přímá závislost (pozitivní korelace). V případě, že analyzovaná data mají některé hodnoty odlehlé, tento koeficient není přesný, je vhodnější použít Spearmanův korelační koeficient. Zjistit, zda jsou hodnoty odlehlé, jde poměrně snadno pomocí bodového grafu. Pokud jsou hodnoty u sebe, je možné použít Pearsonův korelační koeficient. Pokud jsou některé body mimo oblast, kde jich je většina, použije se pro výpočet závislosti Spearmanův korelační koeficient. 21

22 1.3.3 Závislost dvou alternativních proměnných Speciálním případem kontingenční tabulky je již zmiňovaná asociační tabulka, která obsahuje dvě alternativní proměnné. V modelovém dotazníku se analýza dvou alternativních proměnných nenachází, je zde pouze pro informaci. Asociační tabulka s použitím absolutních četností vypadá následovně: Tabulka4: Asociační tabulka Proměnná Y Proměnná X 0 1 Součet 0 n 11 n 12 n 1+ 1 n 21 n 22 n 2+ Součet n +1 n +2 n Testování závislosti dvou alternativních proměnných lze provést pomocí chí-kvadrát statistiky, která má následující vzorec: 2 2 ( n11n22 n12n21) p n n1 n2n1n2 Hodnota, kdy se při 5% hladině významnosti zamítá nulová hypotéza, je 0,021. Také je možné vypočítat míru intenzity vzájemné závislosti, kdy se používá koeficient asociace, který leží na intervalu < 1;1> a určí nejenom intenzitu, ale i směr závislosti. Koeficient asociace má následující vzorec: r n 11 n n 1 22 n n 2 n 12 1 n n

23 2 Praktická část V praktické části této bakalářské práce je navržen a zpracován modelový dotazník tak, aby bylo možné vypočítat nejen charakteristiky z popisné statistiky, ale také vztahy a souvislosti mezi jednotlivými proměnnými. Nejdříve je nutné dobře promyslet, co tazatel očekává od zjištěných dat a jaké možné souvislosti by mohly nastat. Proto je také třeba, aby tazatel znal všechny aspekty dané problematiky, která je řešena v dotazníkovém šetření. Bez znalostí v oboru není možné správně formulovat otázky a také nemusí tazatel vidět všechny souvislosti, které by se mohly objevit ve zkoumaných datech. V této kapitole je zaměřena pozornost na tvorbu a analýzu dat, obsah dotazníku tedy není důležitý a není samotným cílem této práce. Jako námět na dotazník byla vybrána oblast týkající se zdravého životního stylu v populaci a kompletní dotazník je uveden v příloze. 2.1 Navrţení dotazníku Pokud se tazatel rozhodne, že udělá dotazníkové šetření zaměřené na životní styl populace, nejprve si musí ujasnit, co přesně má zkoumat. Poté je třeba si ujasnit výzkumnou otázku. Výzkumná otázka:s jakými aspekty souvisí zdravý ţivotní styl lidí v ČR? Dalším krokem je definování výzkumných hypotéz, které upřesňují výzkumnou otázku a které budou dotazníkovým šetřením zkoumány. Příklady výzkumných hypotéz Je rozdíl mezi životním stylem mužů a žen? Je rozdílný životní styl mezi mladou, starší a střední generací? Závisí zdravý životní styl na dosaženém vzdělání? Souvisí spolu zdravý životní styl a hodnota BMI respondenta? Souvisí spolu zdravý životní styl a hodnota tlaku respondenta? Jsou rozdíly mezi chováním a informovaností respondentů ohledně zdravého životního stylu? 23

24 Po navržení výzkumných otázek je třeba navrhnout proměnné, které budou použity k analýze proměnných i analýze závislostí. Z výzkumných otázek tedy vyplývají pojmy: životní styl pohlaví věk dosažené vzdělání hodnota BMI hodnota tlaku informovanost o zdravém životním stylu Některé z proměnných jsou jednoznačně určené, například pohlaví respondenta (proměnná pohlaví). Tato proměnná se řadí mezi nominální proměnné. Otázka vypadá takto: Vaše pohlaví o žena o muž Další proměnnou je dosaţené vzdělání respondenta (vzdělání), což je ordinální proměnná, protože je možné rozlišit jednotlivé stupně vzdělání. Otázka vypadá následovně: Vaše nejvyšší dosaţené vzdělání o základní o vyučen o střední s maturitou o vysokoškolské (včetně VOŠ) Další jednoznačně určenou proměnnou je věk respondentů (věk). Je možné použít číselnou proměnnou, která bude obsahovat rok narození či přímo věk respondenta. Tato proměnná je příkladem proměnné, kterou je možné kategorizovat podle potřebného rozdělení věku respondenta a zachází se s ní poté jako s ordinální proměnnou. Otázka na věk vypadá například takto: Rok narození 24

25 Další proměnnou hodnotu BMI nebude každý respondent znát, ale lze ji snadno vypočítat z hmotnosti a výšky respondenta. Je tedy příkladem proměnné, kterou je schopen tazatel dopočítat. Pokud se tazatel navíc bude ptát na hmotnost a výšku, je možné tyto samotné informace použít v analýze dat. Výška a hmotnost (proměnné výška a váha) jsou kvantitativními proměnnými a otázky na ně vypadají následovně: Vaše výška (cm) Vaše váha (kg) Hodnotu tlaku každý respondent také nejspíš nebude znát, ale na rozdíl od BMI ji nelze spočítat. Je tedy vhodné přidat do dotazníku doplňující otázku, jestli respondent zná svoji hodnotu tlaku a při kladné odpovědi teprve položit otázku, jaká je hodnota respondentova tlaku. Krevní tlak má systolickou a diastolickou hodnotu (systolický a diastolický), proto se zařadí dvě kvantitativní proměnné a předřadí se jim doplňující otázka: Znáte hodnotu vašeho krevního tlaku? o ano (pokračujte další otázkou) o ne (ukončení dotazníku) Vaše hodnota krevního tlaku diastolický (nižší) systolický (vyšší) Získat informace o následujících proměnných už není možné položením jedné otázky. Je-li třeba zjistit, zda respondent ţije podle zásad zdravého ţivotního stylu. Tazatel si musí nejprve uvědomit, co všechno toto téma zahrnuje. Tyto informace lze získat položením otázek ohledně zdravého stravování, sportování, míry stresu, kouření atd. V tomto dotazníku je zařazen souhrn výroků, alternativních proměnných (označené S1_1 až S1_10), kde je možné zaškrtnout více tvrzení a které obsahují zásady zdravého životního stylu. 25

26 Respondent pak označí výroky, se kterými souhlasí nebo které pro něj platí. Ve své podstatě se nejedná o jedinou otázku, ale o soubor otázek, na které respondent odpovídá "ano" či "ne" tím, že zatrhne či nezatrhne daný výrok. Skupina otázek je sdružena do jedné pro zjednodušení a zrychlení vyplňování dotazníku. Výsledkem dotazování je 10 alternativních proměnných. Při tvorbě dotazníku je třeba myslet na pozdější zpracování, a proto je vhodnější zařazovat otázky, kde například označení výroku znamená žádoucí chování nebo naopak. Pokud by otázky byli významově opačně, při souhrnném zpracování by se museli překódovat. Vyberte pravdivá tvrzení, která se týkají vašich návyků (lze zaškrtnout více tvrzení) Snídám každý den. Jím pravidelně 4x až 5x denně. Denně sním alespoň 200 g zeleniny. Denně sním alespoň jednu porci ovoce. Každý týden sním alespoň jednu porci ryby. Každý týden sním alespoň jednu porci luštěnin. Upřednostňuji celozrnné výrobky. Alespoň dvě hodiny týdně se věnuji sportu. Spím více než sedm hodin denně. Moje práce (studium) mě nestresuje. V dotazníku je zařazena ještě jedna skupina otázek zjišťující návyky respondentů, jejímž výstupem je ordinální proměnná. V tomto případě respondent odpovídá podle frekvence provádění těchto návyků. Při tvorbě dotazníku je třeba myslet na pozdější zpracování, a proto je vhodnější zařazovat otázky, kde například častější frekvence těchto zvyků znamená méně zdravý životní styl nebo naopak. Pokud by otázky byly významově opačné, při dalším zpracování by se musely překódovat. Při zpracování lze převést ordinální škálu na číselnou, aby bylo možné odpovědi na položené otázky shrnout do jedné proměnné, kterou lze považovat za číselnou proměnnou. 26

27 Proměnné (S2_1 až S2_10) jsou tedy následující: Vyberte z nabízených moţností, které nejlépe vystihují odpověď na danou otázku Jím tučné vepřové maso. о denně о často о občas о výjimečně о nikdy Jím tučné sýry (50 % tuku v sušině a více). о denně о často о občas о výjimečně о nikdy Piji tvrdý alkohol. о denně о často о občas о výjimečně о nikdy Piji víno nebo pivo. о denně о často о občas о výjimečně о nikdy Piji slazené nápoje (typu Coca-Cola, Fanta, Sprite atd.). о denně о často о občas о výjimečně о nikdy Jím knedlíky s omáčkou. о denně о často о občas о výjimečně о nikdy Jím sladké (zákusky, sušenky, oplatky, zmrzlinu, čokoládu). о denně о často о občas о výjimečně о nikdy Vypiji více než tři šálky kávy za den. о denně о často о občas о výjimečně о nikdy Vypiji méně než 1,5 l neslazených tekutin. о denně о často о občas о výjimečně о nikdy Jak často kouříte? о denně о často о občas о výjimečně о nikdy Poslední potřebnou proměnnou je informovanost o zdravém ţivotním stylu. Ten lze zjistit z přidaných výroků o této problematice, kde respondent bude hodnotit míru pravdivosti výroku dle stupnice od 1 do 5, kde 1 znamená "vůbec nesouhlasím" 27

28 a 5 znamená "zcela souhlasím". Je to tedy ordinální proměnná s číselnou škálou odpovědí, které mají své určené pořadí. Opět je třeba zařazovat stejně hodnocené výroky, které obsahují buď pravdivé informace o zdravém životním stylu, či naopak. V této otázce je ukázána situace, kdy vybrané otázky neodpovídají podstatě problému. Výroky, které jsou zařazeny do dotazníku jsou velmi obecné na to, aby mohly vyjadřovat informovanost respondenta o zdravém životním stylu. Cílem tohoto nesprávného výběru výroků je ukázat, jak nevhodně zvolené otázky mohou zkreslit výsledky šetření. Je tedy vhodné pečlivě vybírat otázky, aby byly co nejpřesnější a aby měly opravdový přínos pro dotazníkové šetření. Výroky (V_1 až V_7) jsou následující: Jak souhlasíte s následujícími výroky? (Míru souhlasu vyjádřete na stupnici 1 5, kde 1 znamená "vůbec nesouhlasím" a 5 znamená "zcela souhlasím". Otázku nemusíte vyplňovat, pokud na výrok nemáte názor.) Veselá mysl je půl zdraví. Snídani sněz sám, o oběd se rozděl s přítelem a večeři dej nepříteli. Dodržování pitného režimu má velký vliv na naše zdraví i vzhled. Strava by měla být co nejrozmanitá. Bez pravidelného a intenzivního pohybu není možné redukovat váhu. Dostatek spánku a odpočinku je důležitý pro zdraví člověka. Kouření způsobuje rakovinu. 28

29 2.3 Analýza proměnných Pokud je provedeno dotazníkové šetření a data od respondentů jsou získána, musí se provést jejich kontrola. Některé chyby jsou viditelné na první pohled, například v uvedených datech bylo třeba přidat u roku narození 19 (napsáno bylo pouze 91) nebo byla také někdy přehozena hodnota diastolického a systolického tlaku. Po upravení dat je možné začít se zpracováváním. Lze začít analýzou jednotlivých proměnných, kde je možné sestavit tabulku četností a některé další popisné charakteristiky (dle druhu proměnné). Některé zjištěné skutečnosti mohou pomoci odhalit chování a zvyky respondentů, ale některé další jsou zbytečné z výzkumného hlediska. Důležitější než popisné charakteristiky budou závislosti, které se budou rozebírat následně Chování respondentů moţnost více odpovědí Je možné začít rozebírat jednotlivé proměnné od začátku dotazníku. První je skupina alternativních proměnných, která se ptá na chování respondentů. V tomto případě lze analyzovat otázku z pohledu jednotlivých proměnných, ale také z pohledu jednotlivých respondentů. Pokud chce tazatel zjistit, jaké charakteristiky mají jednotlivé proměnné, je třeba je nejprve označit, v tomto případě pořadí v dotazníku odpovídá pořadí proměnné. Jelikož se jedná o alternativní proměnnou, uvádí se pouze absolutní a relativní četnost, kumulativní četnosti by neměly význam. Rozsah souboru (počet respondentů) je 122. Tabulka rozdělení četností je následující: 29

30 Četnost odpovědí Tabulka5: Zvyky respondentů S1 (Zdroj: vlastní) Proměnné Absolutní četnost (n i ) Relativní četnost (p i ) S1_ % S1_ % S1_ % S1_ % S1_ % S1_ % S1_ % S1_ % S1_ % S1_ % Součet x x Z tabulky je možné zjistit, že 81 % respondentů každý den snídá, zato pouze 16 % oslovených sní každý týden alespoň jednu porci ryby. Pro znázornění této tabulky je možné využít sloupcový graf, kde každé proměnné bude odpovídat jeden sloupec: 100% 80% 60% 40% 20% 0% S1_1 S1_2 S1_3 S1_4 S1_5 S1_6 S1_7 S1_8 S1_9 S1_10 Odpovědi Obrázek 1: Graf četností S1 (Zdroj: vlastní) Protože první otázka v dotazníku má soubor deseti odpovědí, je možné ji analyzovat také z pohledu jednotlivých respondentů a zjistit tak, jaké návyky mají respondenti. Je možné například pro každého respondenta sečíst počet vybraných tvrzení. Tím lze zjistit, kolik každý respondent vybral odpovědí. Čím více jich vybral, tím větší 30

31 je možnost, že žije podle zásad zdravého životního stylu. Také je možné zjistit pro celou tuto první otázku průměrný počet zaškrtnutých odpovědí, čehož lze docílit tím, že se všechny vybrané odpovědi respondentů sečtou a vydělí se počtem respondentů. V tomto případě vyšel průměrný počet zaškrtnutých odpovědí 4,11. Tento údaj je možné interpretovat takto: Průměrně každý respondent vybral 4 z 10 možností Chování respondentů ordinální proměnná Další otázkou v dotazníku je opět chování respondentů, ale tentokrát se jedná o ordinální proměnnou. Jednotlivých výroků je celkem deset, lze tedy udělat tabulku rozdělení četností pro každý zvlášť, ale je možné také vytvořit tabulku četností pro tuto celou otázku dohromady. Pokud tazatel chce analyzovat jednotlivé proměnné, lze to ukázat například na prvním výroku: Jím tučné vepřové maso. Možnosti odpovědí je vhodné překódovat, žádoucí chování je označeno vyšší hodnotou. Tabulka rozdělení četností pro tento výrok, který je označen jako S2_1, je následující: Tabulka 6: Rozdělení četností S2_1 (Zdroj: vlastní) Proměnná S2_1 Kód Absolutní četnost (n i ) Relativní četnost (p i ) Kumulativní četnost absolutní relativní (kn i ) (kp i ) nikdy % % výjimečně % % občas % % často % % denně % % Součet x % х х Z této tabulky je vidět, že 37 % respondentů jí tučné vepřové maso pouze výjimečně, zatímco 1 % respondentů jí tučné vepřové maso denně. Také by se dalo například říci, že 85 % respondentů jí tučné vepřové maso nikdy, výjimečně nebo občas. Grafické vyjádření absolutní četnosti je následující: 31

32 Četnost odpovědí nikdy vyjímečně občas často děnně Obrázek 2: Graf rozdělení četností S2_1 (Zdroj: vlastní) Pro ordinální proměnnou lze vypočítat modus, v tomto případě je nejčastější hodnota 4, což je možné interpretovat takto: Nejčastěji respondenti odpovídali, že tučné maso jí pouze výjimečně. Medián se rovná také hodnotě 4, proto je možné říci, že střední hodnota z tohoto souboru je výjimečně. Toto byla analýza jednotlivých zvyků respondentů, ale také je možné analyzovat návyky jednotlivých respondentů. To lze udělat buď pomocí průměru (jako při analýze předešlé otázky), nebo pomocí součtu. Tazatel si může vybrat jakoukoliv metodu, ale nyní bude ukázán součet. Sečtou-li se hodnoty proměnných u každého z respondentů, zjistí se opět "hodnota životního stylu respondenta". Čím vyšší je tato hodnota, tím více žije respondent v souladu se zdravým životním stylem. Je možné vypočítat průměrnou hodnota z celého datového souboru, což je x 3, Informovanost respondentů Třetí otázka v dotazníku se týká informovanosti respondentů o zdravém životním stylu. Je to skupina výroků, kde respondent hodnotí podle sebe míru pravdivosti výroku. Jde o ordinální proměnnou, kdy respondent odpovídá pomocí číselné škály, ve které hodnota 1 znamená vůbec nesouhlasím a hodnota 5 znamená zcela souhlasím. Opět je možné nahlížet na analýzu této proměnné jako na analýzu jednotlivých proměnných nebo jako na analýzu informovanosti jednoho respondenta. Pokud se bude analyzovat první výrok: Veselá mysl je půl zdraví., označí se jako V_1, tabulka rozdělení četnosti této proměnné je: 32

33 Tabulka 7: Tabulka rozdělení četnosti V_1 (Zdroj: vlastní) Proměnná V_1 Absolutní četnost (n i ) Relativní četnost (p i ) Kumulativní četnost absolutní relativní (kn i ) (kp i ) % 8 7 % % % % 35 29% % % % % Součet % х х Z tabulky je možné určit další charakteristiky: xˆ 5 ~ x 4 Q Q 0,25 0, R 4 IQR 2 Z toho vyplývá, že nejčastěji byl daný výrok hodnocen výrokem: "zcela souhlasím" a střední hodnotou souboru byl výrok hodnocený na číselné škále hodnotou 4. Z kvartilů je zjevné, že 25 % hodnot ze souboru je menších než 3 a 75 % hodnot je menších než hodnota 5. Variační rozpětí souboru je 4 a mezikvartilové rozpětí je 2. Graf pro toto rozdělení četností je: 33

34 Relativní četnost 50% 40% 30% 20% 10% 0% Míra souhlasu s výrokem Obrázek 3: Graf rozdělení četnosti V_1 (Zdroj: vlastní) Další možností, jak analyzovat tuto proměnnou, je nahlížet na ni jako na celek, který informuje o tom, jak jsou respondenti informovaní o dané problematice. Je tedy možné zjistit například průměrnou hodnotu informovanosti jednoho respondenta či vytvořit sumární celkovou průměrnou hodnotu z dat Pohlaví respondentů Další analyzovanou proměnnou je nominální proměnná, která informuje o pohlaví respondentů. Z dat vyplývá, že zastoupení jednotlivých pohlaví v dotazníkovém šetření je následující: Tabulka 8: Rozdělení respondentů dle pohlaví (Zdroj: vlastní) Pohlaví Absolutní četnost Relativní četnost Ţeny % Muţi % Součet % Z tabulky je možné zjistit, že větší zastoupení v dotazníku mají ženy (67 %). Tento fakt nevadí, jelikož pro další účely je tento údaj potřebný pro rozdělení dat na dvě části a jejich další porovnávání. V případě, že by tazatel potřeboval pro svůj dotazník reprezentativní vzorek pro zastoupení pohlaví, poměr by měl odpovídat reálnému zastoupení ve společnosti. Grafické znázornění rozdělení respondentů dle pohlaví je následující: 34

35 žena muž Obrázek 4: Graf rozdělení respondentů dle pohlaví (Zdroj: vlastní) Nejvyšší dosaţené vzdělání Další otázkou v dotazníku je nejvyšší dosažené vzdělání. Je možné ji analyzovat samostatně, ale spíše je potřebnější při porovnávání dalších proměnných dle dosaženého vzdělání. Je to ordinální proměnná, takže je možné zkonstruovat tabulku rozdělení četností: Tabulka 9: Tabulka rozdělení četností Vzdělání (Zdroj: vlastní) Proměnná Vzdělání Kód Absolutní četnost (n i ) Relativní četnost (p i ) Kumulativní četnost absolutní relativní (kn i ) (kp i ) základní % 6 5 % vyučen % % střední s maturitou % 89 73% vysokoškolské (včetně % % Součet x % х х Z tabulky je možné vyčíst tyto charakteristiky: xˆ 3 ~ x 3 Q Q 0,25 0, R 3 IQR 1 35

36 Z těchto charakteristik lze usoudit, že velké množství (62 %) respondentů, má ukončené střední vzdělání s maturitou. Pro grafické zobrazení lze sestrojit sloupcový graf Věk Proměnná věk byl označen jako kvantitativní proměnná, ale lze jej pro přehlednější rozdělení a pro další zpracování rozdělit na jednotlivé kategorie. Poté je možno ho zařadit mezi ordinální proměnnou. Pro tento dotazník bylo zvoleno následující rozdělení: Tabulka 10: Rozdělení věku respondentů do kategorií (Zdroj: vlastní) Kategorie Spodní hranice Horní hranice starší střední mladší Pro toto rozdělení je možné určit tabulku rozdělení četností: Tabulka 11: Tabulka rozdělení četností Věk (Zdroj: vlastní) Proměnná Věk Kód Absolutní četnost (n i ) Relativní četnost (p i ) Kumulativní četnost absolutní relativní (kn i ) (kp i ) mladší % % střední % % starší % % Součet x % х х Popisné charakteristiky pro proměnnou věk jsou následující: xˆ 1 ~ x 1 Q Q 0,25 0, R 2 IQR 1 36

37 Absolutní četnost Z tabulky a popisných charakteristik je možné zjistit, že většina (57 %) respondentů je zařazena do kategorie mladší. Opět by bylo možné použít sloupcový graf pro grafické zobrazení Výška Výška respondentů je kvantitativní proměnná s větším rozsahem hodnot, proto bude muset být použito intervalové rozdělení. Nejprve se určí délka intervalu: ( ) d 9,83 6 Délka intervalu se zaokrouhlí například na 12, aby byly zahrnuty všechny hodnoty, a vyjdou následující intervaly a rozdělení četností: Tabulka 12: Tabulka rozdělení četností Výška (Zdroj: vlastní) Kumulativní četnost Dolní mez Horní mez Střed Absolutní četnost (n i ) Relativní četnost (p i ) absolutní relativní (kn i ) (kp i ) % 1 1 % % 4 3 % % % % % % % % % Součet x x % x x Středy intervalů výšky respondentů Obrázek 5: Graf četnosti Výška (Zdroj: vlastní) 37

38 Z tabulky lze určit průměr, který po dosazení do vzorce pro váženou formu průměru, vyjde 172,67. Z toho se dá usuzovat, že průměrná výška respondenta je 172,67 cm. Také lze zjistit modus, který leží na intervalu 171 ; 183. Protože jde o intervalové rozdělení, medián se vypočítá takto: ~ 0,5 kpi 0,5 0,45 x h a ,4 p 0,43 i Střední hodnota je tedy rovna 172,4 cm. Kvartily lze vypočítat podle jejich vzorce: ~ p kpi 0,75 0,45 x0,75 h a ,37 p 0,43 i ~ p kpi 0,25 0,03 x0,25 h a ,29 p 0,42 i Dle kvartilů lze zjistit, že 75 % respondentů je menších než 179,37 cm, a zároveň, že 25 % respondentů je menších než 165,29. Také je možné vypočítat variační a mezikvartilové rozpětí: R x max x min IQR ~ x ~ 0,75 x0,25 179,37 165,59 13,78 Na základě těchto údajů lze vyvodit, že rozpětí souboru je 59 a rozpětí mezi horním a dolním kvartilem je 13,78. Další známé charakteristiky, které lze vypočítat pro kvantitativní proměnnou, jsou rozptyl, směrodatná odchylka a variační koeficient. s 2 n i1 ( x i n x) ,78 20, s s 2 4,56 V x x s 4,56 172,67 0,03 38

39 2.3.8 Váha Další analyzovanou proměnnou je váha, což je kvantitativní proměnná, proto bude její analýza velmi podobná analýze předchozí proměnné. Nejprve se opět určí délka intervalu: d (121 46) 6 12,5 Délka intervalu se určí například na 15, aby byly zahrnuty i krajní hodnoty, a vyjde následující tabulka rozdělení četností: Tabulka 13: Tabulka rozdělení četností váha (Zdroj: vlastní) Dolní mez Horní mez Střed Absolutní četnost (n i ) Relativní četnost (p i ) Kumulativní četnost absolutní relativní (kn i ) (kp i ) , % % , % % , % % , % % ,5 2 2 % % ,5 1 1 % % Součet x x % x x Opět je možné zobrazit rozdělení četností pomocí sloupcového grafu. Z tabulky je možné určit průměr, který vyjde 70,74, z čehož vyplývá, že průměrná váha respondenta je 70,74 kg. Modus leží na intervalu 55 ; 70. Jelikož jde o intervalové rozdělení, medián a kvartily jsou následující: ~ 0,5 kpi 0,5 0,12 x h a ,25 p 0,4 i 39

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D. Zpracování náhodného výběru popisná statistika Ing. Michal Dorda, Ph.D. Základní pojmy Úkolem statistiky je na základě vlastností výběrového souboru usuzovat o vlastnostech celé populace. Populace(základní

Více

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Vybraná rozdělení spojitých náhodných veličin, deskriptivní statistika Ing. Michael Rost, Ph.D. Třídění Základním zpracováním dat je jejich třídění. Jde o uspořádání získaných dat, kde volba třídícího

Více

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012 Tutoriál č. 4: Exploratorní analýza Jan Kracík jan.kracik@vsb.cz Statistika věda o získávání znalostí z empirických dat empirická

Více

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Studentská 2 461 17 Liberec 1 SEMESTRÁLNÍ PRÁCE STATISTICKÝ ROZBOR DAT Z DOTAZNÍKOVÝCH ŠETŘENÍ Gabriela Dlasková, Veronika Bukovinská Sára Kroupová, Dagmar

Více

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III Vysoká škola báňská - Technická univerzita Ostrava 27. listopadu 2017 Typy statistických znaků (proměnných) Typy proměnných: Kvalitativní proměnná (kategoriální, slovní,... ) Kvantitativní proměnná (numerická,

Více

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Základy popisné statistiky Anotace Realitu můžeme popisovat různými typy dat, každý z nich se specifickými vlastnostmi, výhodami, nevýhodami a vlastní sadou využitelných statistických metod -od binárních

Více

Základy popisné statistiky

Základy popisné statistiky Základy popisné statistiky Michal Fusek Ústav matematiky FEKT VUT, fusekmi@feec.vutbr.cz 8. přednáška z ESMAT Michal Fusek (fusekmi@feec.vutbr.cz) 1 / 26 Obsah 1 Základy statistického zpracování dat 2

Více

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza 5.1 Vícerozměrná data a vícerozměrná rozdělení Při zpracování vícerozměrných dat se hledají souvislosti mezi dvěma, případně

Více

Statistika pro geografy

Statistika pro geografy Statistika pro geografy 2. Popisná statistika Mgr. David Fiedor 23. února 2015 Osnova 1 2 3 Pojmy - Bodové rozdělení četností Absolutní četnost Absolutní četností hodnoty x j znaku x rozumíme počet statistických

Více

Popisná statistika. Statistika pro sociology

Popisná statistika. Statistika pro sociology Popisná statistika Jitka Kühnová Statistika pro sociology 24. září 2014 Jitka Kühnová (GSTAT) Popisná statistika 24. září 2014 1 / 31 Outline 1 Základní pojmy 2 Typy statistických dat 3 Výběrové charakteristiky

Více

Renáta Bednárová STATISTIKA PRO EKONOMY

Renáta Bednárová STATISTIKA PRO EKONOMY Renáta Bednárová STATISTIKA PRO EKONOMY ZÁKLADNÍ STATISTICKÉ POJMY Statistika Statistický soubor Statistická jednotky Statistický znak STATISTIKA Vědní obor, který se zabývá hromadnými jevy Hromadné jevy

Více

Mnohorozměrná statistická data

Mnohorozměrná statistická data Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Statistický znak, statistický soubor Jednotlivé objekty nebo subjekty, které jsou při statistickém

Více

Analýza dat na PC I.

Analýza dat na PC I. CENTRUM BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita Analýza dat na PC I. Popisná analýza v programu Statistica IBA výuka Základní popisná statistika Popisná statistika

Více

Číselné charakteristiky

Číselné charakteristiky . Číselné charakteristiky statistických dat Průměrný statistik se během svého života ožení s 1,75 ženami, které se ho snaží vytáhnout večer do společnosti,5 x týdně, ale pouze s 50% úspěchem. W. F. Miksch

Více

Analýza dat z dotazníkových šetření. Zdrojová data: dotazník http://www.vyplnto.cz/realizovane-pruzkumy/konzumace-ryb-a-rybich-vyrob/

Analýza dat z dotazníkových šetření. Zdrojová data: dotazník http://www.vyplnto.cz/realizovane-pruzkumy/konzumace-ryb-a-rybich-vyrob/ Analýza dat z dotazníkových šetření Cvičení 3. - Jednorozměrné třídění Zdrojová data: dotazník http://www.vyplnto.cz/realizovane-pruzkumy/konzumace-ryb-a-rybich-vyrob/ - Seznamte se s dotazníkem a strukturou

Více

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu K čemu slouží statistika Popisuje velké soubory dat pomocí charakteristických čísel (popisná statistika). Hledá skryté zákonitosti v souborech

Více

TECHNICKÁ UNIVERZITA V LIBERCI

TECHNICKÁ UNIVERZITA V LIBERCI TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce Statistický rozbor dat z dotazníkového šetření Počet stran: 10 Datum odevzdání: 13. 5. 2016 Pavel Kubát Obsah Úvod... 3 1 Charakterizujte

Více

Jana Vránová, 3. lékařská fakulta UK

Jana Vránová, 3. lékařská fakulta UK Jana Vránová, 3. lékařská fakulta UK Vznikají při zkoumání vztahů kvalitativních resp. diskrétních znaků Jedná se o analogii s korelační analýzou spojitých znaků Přitom předpokládáme, že každý prvek populace

Více

Pojem a úkoly statistiky

Pojem a úkoly statistiky Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Pojem a úkoly statistiky Statistika je věda, která se zabývá získáváním, zpracováním a analýzou dat pro potřeby

Více

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11.

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 3. 11. UNIVERZITA OBRANY Fakulta ekonomiky a managementu Aplikace STAT1 Výsledek řešení projektu PRO HORR2011 a PRO GRAM2011 Jiří Neubauer, Marek Sedlačík, Oldřich Kříž 3. 11. 2012 Popis a návod k použití aplikace

Více

Mnohorozměrná statistická data

Mnohorozměrná statistická data Mnohorozměrná statistická data Ekonometrie Jiří Neubauer Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Jiří Neubauer (Katedra ekonometrie UO Brno) Mnohorozměrná

Více

STATISTIKA 1. Adam Čabla Katedra statistiky a pravděpodobnosti VŠE

STATISTIKA 1. Adam Čabla Katedra statistiky a pravděpodobnosti VŠE STATISTIKA 1 Adam Čabla Katedra statistiky a pravděpodobnosti VŠE KONTAKTY WWW: sites.google.com/site/adamcabla E-mail: adam.cabla@vse.cz Telefon: 777 701 783 NB367 na VŠE, konzultační hodiny: Pondělí

Více

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY zhanel@fsps.muni.cz ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY METODY DESKRIPTIVNÍ STATISTIKY 1. URČENÍ TYPU ŠKÁLY (nominální, ordinální, metrické) a) nominální + ordinální neparametrické stat. metody b) metrické

Více

Kontrola: Sečteme-li sloupec,,četnost výskytu musí nám vyjít hodnota rozsahu souboru (našich 20 žáků)

Kontrola: Sečteme-li sloupec,,četnost výskytu musí nám vyjít hodnota rozsahu souboru (našich 20 žáků) Základní výpočty pro MPPZ Teorie Aritmetický průměr = součet hodnot znaku zjištěných u všech jednotek souboru, dělený počtem všech jednotek souboru Modus = hodnota souboru s nejvyšší četností Medián =

Více

Spokojenost se životem

Spokojenost se životem SEMINÁRNÍ PRÁCE Spokojenost se životem (sekundárních analýza dat sociologického výzkumu Naše společnost 2007 ) Předmět: Analýza kvantitativních revize Šafr dat I. Jiří (18/2/2012) Vypracoval: ANONYMIZOVÁNO

Více

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA 2018 4. dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1 Typy proměnných nominální (nominal) o dvou hodnotách lze říci pouze

Více

Popisná statistika kvantitativní veličiny

Popisná statistika kvantitativní veličiny StatSoft Popisná statistika kvantitativní veličiny Protože nám surová data obvykle žádnou smysluplnou informaci neposkytnou, je žádoucí vyjádřit tyto ve zhuštěnější formě. V předchozím dílu jsme začali

Více

TECHNICKÁ UNIVERZITA V LIBERCI

TECHNICKÁ UNIVERZITA V LIBERCI TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta SEMESTRÁLNÍ PRÁCE STATISTICKÝ ROZBOR DAT Z DOTAZNÍKOVÉHO ŠETŘENÍ ANALÝZA VÝSLEDKŮ VYUŢITÍ PROJEKTOVÉHO ŘÍZENÍ V ESN Příjmení a jméno: Hrdá Sabina, Kovalčíková

Více

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability I Přednáška Statistika Diskrétní data Spojitá data Charakteristiky polohy Charakteristiky variability Statistika deskriptivní statistika ˆ induktivní statistika populace (základní soubor) ˆ výběr parametry

Více

Deskriptivní statistika (kategorizované proměnné)

Deskriptivní statistika (kategorizované proměnné) Deskriptivní statistika (kategorizované proměnné) Nejprve malé opakování: - Deskriptivní statistika se zabývá popisem dat, jejich sumarizaci a prezentací. - Kategorizované proměnné jsou všechny proměnné,

Více

Kontingenční tabulky, korelační koeficienty

Kontingenční tabulky, korelační koeficienty Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz Mějme kategoriální proměnné X a Y. Vytvoříme tzv. kontingenční tabulku. Budeme tedy testovat hypotézu

Více

STATISTIKA S EXCELEM. Martina Litschmannová MODAM,

STATISTIKA S EXCELEM. Martina Litschmannová MODAM, STATISTIKA S EXCELEM Martina Litschmannová MODAM, 8. 4. 216 Obsah Motivace aneb Máme data a co dál? Základní terminologie Analýza kvalitativního znaku rozdělení četnosti, vizualizace Analýza kvantitativního

Více

Výrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy

Výrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy Výrobní produkce divizí Ice Cream Polo ha planet Rozložený výsečový 3D graf Bublinový graf Ice Cream 1 15% Ice Cream 2 12% Ice Cream 3 18% Ice Cream 4 20% Statistika 40 30 20 Ice Cream 6 19% Ice Cream

Více

marek.pomp@vsb.cz http://homel.vsb.cz/~pom68

marek.pomp@vsb.cz http://homel.vsb.cz/~pom68 Statistika B (151-0303) Marek Pomp ZS 2014 marek.pomp@vsb.cz http://homel.vsb.cz/~pom68 Cvičení: Pavlína Kuráňová & Marek Pomp Podmínky pro úspěšné ukončení zápočet 45 bodů, min. 23 bodů, dvě zápočtové

Více

Kontingenční tabulky, korelační koeficienty

Kontingenční tabulky, korelační koeficienty Statistika II Katedra ekonometrie FVL UO Brno kancelář 69a, tel 973 442029 email:jirineubauer@unobcz Budeme předpokládat, že X a Y jsou kvalitativní náhodné veličiny, obor hodnot X obsahuje r hodnot (kategorií,

Více

PROHLOUBENÍ NABÍDKY DALŠÍHO VZDĚLÁVÁNÍ NA VŠPJ A SVOŠS V JIHLAVĚ

PROHLOUBENÍ NABÍDKY DALŠÍHO VZDĚLÁVÁNÍ NA VŠPJ A SVOŠS V JIHLAVĚ Projekt č. CZ.1.07/3.2.09/03.0015 PROHLOUBENÍ NABÍDKY DALŠÍHO VZDĚLÁVÁNÍ NA VŠPJ A SVOŠS V JIHLAVĚ http://www.vspj.cz/skola/evropske/opvk Tento projekt je spolufinancován Evropským sociálním fondem a státním

Více

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky Vysoká škola báňská technická univerzita Ostrava Fakulta elektrotechniky a informatiky Bankovní účty (semestrální projekt statistika) Tomáš Hejret (hej124) 18.5.2013 Úvod Cílem tohoto projektu, zadaného

Více

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce Statistický rozbor dat z dotazníkového šetření školní zadání Skupina: 51 Vypracovaly: Pavlína Horná, Nikola Loumová, Petra Mikešová,

Více

STATISTICKÉ CHARAKTERISTIKY

STATISTICKÉ CHARAKTERISTIKY STATISTICKÉ CHARAKTERISTIKY 1 Vytvořeno s podporou projektu Průřezová inovace studijních programů Lesnické a dřevařské fakulty MENDELU v Brně (LDF) s ohledem na discipliny společného základu (reg. č. CZ.1.07/2.2.00/28.0021)

Více

MATEMATICKÁ STATISTIKA. Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci

MATEMATICKÁ STATISTIKA.   Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci MATEMATICKÁ STATISTIKA Dana Černá http://www.fp.tul.cz/kmd/ Katedra matematiky a didaktiky matematiky Technická univerzita v Liberci Matematická statistika Matematická statistika se zabývá matematickým

Více

TEST Z TEORIE EXPLORAČNÍ ANALÝZA DAT

TEST Z TEORIE EXPLORAČNÍ ANALÝZA DAT EXPLORAČNÍ ANALÝZA DAT TEST Z TEORIE 1. Test ze Statistiky píše velké množství studentů. Představte si, že každý z nich odpoví správně přesně na polovinu otázek. V tomto případě bude směrodatná odchylka

Více

Statistika s Excelem aneb Máme data. A co dál? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava

Statistika s Excelem aneb Máme data. A co dál? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava Statistika s Excelem aneb Máme data. A co dál? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava ŠKOMAM 2016 Jak získat data? Primární zdroje dat Vlastní měření (fyzika, biologie,

Více

23. Matematická statistika

23. Matematická statistika Projekt: Inovace oboru Mechatronik pro Zlínský kraj Registrační číslo: CZ.1.07/1.1.08/03.0009 23. Matematická statistika Statistika je věda, která se snaží zkoumat reálná data a s pomocí teorii pravděpodobnosti

Více

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy: Úloha č. 1 - Kvantily a typická hodnota (bodově tříděná data): Určete typickou hodnotu, 40% a 80% kvantil. Tabulka hodnot: Varianta Četnost 0 4 1 14 2 17 3 37 4 20 5 14 6 7 7 11 8 20 Typická hodnota je

Více

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D. Program Statistica Base 9 Mgr. Karla Hrbáčková, Ph.D. OBSAH KURZU obsluha jednotlivých nástrojů, funkce pro import dat z jiných aplikací, práce s popisnou statistikou, vytváření grafů, analýza dat, výstupní

Více

Statistika I (KMI/PSTAT)

Statistika I (KMI/PSTAT) Statistika I (KMI/PSTAT) Cvičení druhé aneb Kvantily, distribuční funkce Statistika I (KMI/PSTAT) 1 / 1 Co se dnes naučíme Po absolvování této hodiny byste měli být schopni: rozumět pojmu modus (modální

Více

INDUKTIVNÍ STATISTIKA

INDUKTIVNÍ STATISTIKA 10. SEMINÁŘ INDUKTIVNÍ STATISTIKA 3. HODNOCENÍ ZÁVISLOSTÍ HODNOCENÍ ZÁVISLOSTÍ KVALITATIVNÍ VELIČINY - Vychází se z kombinační (kontingenční) tabulky, která je výsledkem třídění druhého stupně KVANTITATIVNÍ

Více

Aplikovaná statistika v R

Aplikovaná statistika v R Aplikovaná statistika v R Filip Děchtěrenko Matematicko-fyzikální fakulta filip.dechterenko@gmail.com 15.5.2014 Filip Děchtěrenko (MFF UK) Aplikovaná statistika v R 15.5.2014 1 / 15 Co bude náplní našich

Více

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13 Příklad 1 Máme k dispozici výsledky prvního a druhého testu deseti sportovců. Na hladině významnosti 0,05 prověřte, zda jsou výsledky testů kladně korelované. 1.test : 7, 8, 10, 4, 14, 9, 6, 2, 13, 5 2.test

Více

KGG/STG Statistika pro geografy

KGG/STG Statistika pro geografy KGG/STG Statistika pro geografy 9. Korelační analýza Mgr. David Fiedor 20. dubna 2015 Analýza závislostí v řadě geografických disciplín studujeme jevy, u kterých vyšetřujeme nikoliv pouze jednu vlastnost

Více

Charakteristika datového souboru

Charakteristika datového souboru Zápočtová práce z předmětu Statistika Vypracoval: 10. 11. 2014 Charakteristika datového souboru Zadání: Při kontrole dodržování hygienických norem v kuchyni se prováděl odběr vzduchu a pomocí filtru Pallflex

Více

Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy

Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy Popisná statistika úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy Úvod užívá se k popisu základních vlastností dat poskytuje jednoduché shrnutí hodnot proměnných

Více

Analýza dat z dotazníkových šetření

Analýza dat z dotazníkových šetření Analýza dat z dotazníkových šetření Cvičení 6. Rozsah výběru Př. Určete minimální rozsah výběru pro proměnnou věk v souboru dovolena, jestliže 95% interval spolehlivost průměru proměnné nemá být širší

Více

Statistika. cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací!

Statistika. cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací! Statistika aneb známe tři druhy lži: úmyslná neúmyslná statistika Statistika je metoda, jak vyjádřit nejistá data s přesností na setinu procenta. den..00..00 3..00..00..00..00..00..00..00..00..00..00 3..00..00..00..00..00..00..00

Více

Metodologie pro ISK II

Metodologie pro ISK II Metodologie pro ISK II Všechny hodnoty z daného intervalu Zjišťujeme: Centrální míry Variabilitu Šikmost, špičatost Percentily (decily, kvantily ) Zobrazení: histogram MODUS je hodnota, která se v datech

Více

Zápočtová práce STATISTIKA I

Zápočtová práce STATISTIKA I Zápočtová práce STATISTIKA I Obsah: - úvodní stránka - charakteristika dat (původ dat, důvod zpracování,...) - výpis naměřených hodnot (v tabulce) - zpracování dat (buď bodové nebo intervalové, podle charakteru

Více

TECHNICKÁ UNIVERZITA V LIBERCI

TECHNICKÁ UNIVERZITA V LIBERCI TECHNICKÁ UNIVERZITA V LIBERCI Ekonomická fakulta Semestrální práce z předmětu Statistický rozbor dat z dotazníkového šetření Jméno: Lucie Krechlerová, Karel Kozma, René Dubský, David Drobík Ročník: 2015/2016

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení ze 4ST201. Na případné faktické chyby v této prezentaci mě prosím upozorněte. Děkuji Tyto slidy berte pouze jako doplňkový materiál není v nich obsaženo

Více

2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat

2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat 2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat Anotace Realitu můžeme popisovat různými typy dat, každý z nich se specifickými vlastnostmi,

Více

Základní statistické charakteristiky

Základní statistické charakteristiky Základní statistické charakteristiky Základní statistické charakteristiky slouží pro vzájemné porovnávání statistických souborů charakteristiky = čísla, pomocí kterých porovnáváme Základní statistické

Více

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica Program Statistica I Statistica je velmi podobná Excelu. Na základní úrovni je to klikací program určený ke statistickému zpracování dat.

Více

KLIMA ŠKOLY. Zpráva z evaluačního nástroje Klima školy. Škola Testovací škola - vyzkoušení EN, Praha. Termín

KLIMA ŠKOLY. Zpráva z evaluačního nástroje Klima školy. Škola Testovací škola - vyzkoušení EN, Praha. Termín KLIMA ŠKOLY Zpráva z evaluačního nástroje Klima školy Škola Testovací škola - vyzkoušení EN, Praha Termín 29.9.2011-27.10.2011-1 - Vážená paní ředitelko, vážený pane řediteli, milí kolegové! Dovolte, abychom

Více

Škály podle informace v datech:

Škály podle informace v datech: Škály podle informace v datech: Různé typy dat znamenají různou informaci, resp. různé množství informace Data nominální Rovná se? x 1 = x 2 Data ordinální Větší, menší? x 1 < x 2 Data intervalová O kolik?

Více

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza Korelační a regresní analýza 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza Pearsonův korelační koeficient u intervalových a poměrových dat můžeme jako

Více

Tabulka 1. Výběr z datové tabulky

Tabulka 1. Výběr z datové tabulky 1. Zadání domácího úkolu Vyberte si datový soubor obsahující alespoň jednu kvalitativní a jednu kvantitativní proměnnou s alespoň 30 statistickými jednotkami (alespoň 30 jednotlivých údajů). Zdroje dat

Více

MĚŘENÍ, TYPY VELIČIN a TYPY ŠKÁL

MĚŘENÍ, TYPY VELIČIN a TYPY ŠKÁL MĚŘENÍ, TYPY VELIČIN a TYPY ŠKÁL Matematika a stejně i matematická statistika a biometrie s námi hovoří řečí čísel. Musíme tedy vlastnosti nebo intenzitu vlastností jedinců změřit kvantifikovat. Měřením

Více

Číselné charakteristiky a jejich výpočet

Číselné charakteristiky a jejich výpočet Katedra ekonometrie, FVL, UO Brno kancelář 69a, tel. 973 442029 email:jiri.neubauer@unob.cz charakteristiky polohy charakteristiky variability charakteristiky koncetrace charakteristiky polohy charakteristiky

Více

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou Úvod.................................................................. 11 Kapitola 1 Než začneme.................................................................. 17 1.1 Logika kvantitativního výzkumu...........................................

Více

Výběrové šetření o zdravotním stavu české populace (HIS CR 2002) - Spotřeba alkoholu (VI. díl)

Výběrové šetření o zdravotním stavu české populace (HIS CR 2002) - Spotřeba alkoholu (VI. díl) Aktuální informace Ústavu zdravotnických informací a statistiky České republiky Praha 3. 12. 2002 58 Výběrové šetření o zdravotním stavu české populace (HIS CR 2002) - Spotřeba alkoholu (VI. díl) V této

Více

Korelace. Komentované řešení pomocí MS Excel

Korelace. Komentované řešení pomocí MS Excel Korelace Komentované řešení pomocí MS Excel Vstupní data Tabulka se vstupními daty je umístěna v oblasti A2:B84 (viz. obrázek) Prvotní představu o tvaru a síle závislosti docházky a počtu bodů nám poskytne

Více

Metody sociálních výzkumů. Velmi skromný úvod do statistiky. Motto: Jsou tři druhy lži-lež prostá, lež odsouzeníhodná a statistika.

Metody sociálních výzkumů. Velmi skromný úvod do statistiky. Motto: Jsou tři druhy lži-lež prostá, lež odsouzeníhodná a statistika. Metody sociálních výzkumů Velmi skromný úvod do statistiky. Motto: Jsou tři druhy lži-lež prostá, lež odsouzeníhodná a statistika. Statistika Význam slova-vychází ze slova stát, s jeho administrativou

Více

4. Zpracování číselných dat

4. Zpracování číselných dat 4. Zpracování číselných dat 4.1 Jednoduché hodnocení dat 4.2 Začlenění dat do písemné práce Zásady zpracování vědecké práce pro obory BOZO, PÚPN, LS 2011 4.1 Hodnocení číselných dat Popisná data: střední

Více

ANALÝZA DAT V R 2. POPISNÉ STATISTIKY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

ANALÝZA DAT V R 2. POPISNÉ STATISTIKY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK. ANALÝZA DAT V R 2. POPISNÉ STATISTIKY Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz CO SE SKRÝVÁ V DATECH data sbíráme proto, abychom porozuměli

Více

Metodologie pro Informační studia a knihovnictví 2

Metodologie pro Informační studia a knihovnictví 2 Metodologie pro Informační studia a knihovnictví 2 Modul 5: Popis nekategorizovaných dat Co se dozvíte v tomto modulu? Kdy používat modus, průměr a medián. Co je to směrodatná odchylka. Jak popsat distribuci

Více

Cvičení ze statistiky - 3. Filip Děchtěrenko

Cvičení ze statistiky - 3. Filip Děchtěrenko Cvičení ze statistiky - 3 Filip Děchtěrenko Minule bylo.. Dokončili jsme základní statistiky, typy proměnných a začali analýzu kvalitativních dat Tyhle termíny by měly být známé: Histogram, krabicový graf

Více

Statistické metody. Martin Schindler KAP, tel , budova G. naposledy upraveno: 9.

Statistické metody. Martin Schindler KAP, tel , budova G. naposledy upraveno: 9. Statistické metody Matematika pro přírodní vědy přednášející: konzul. hodiny: e-mail: Martin Schindler KAP, tel. 48 535 2836, budova G po dohodě martin.schindler@tul.cz naposledy upraveno: 9. ledna 2015,

Více

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D. Ing. Michal Dorda, Ph.D. 1 Př. 1: Cestující na vybraném spoji linky MHD byli dotazováni za účelem zjištění spokojenosti s kvalitou MHD. Legenda 1 Velmi spokojen Spokojen 3 Nespokojen 4 Velmi nespokojen

Více

KORELACE. Komentované řešení pomocí programu Statistica

KORELACE. Komentované řešení pomocí programu Statistica KORELACE Komentované řešení pomocí programu Statistica Vstupní data I Data umístěná v excelovském souboru překopírujeme do tabulky ve Statistice a pojmenujeme proměnné, viz prezentace k tématu Popisná

Více

Popisná statistika. Komentované řešení pomocí MS Excel

Popisná statistika. Komentované řešení pomocí MS Excel Popisná statistika Komentované řešení pomocí MS Excel Vstupní data Máme k dispozici data o počtech bodů z 1. a 2. zápočtového testu z Matematiky I v zimním semestru 2015/2016 a to za všech 762 studentů,

Více

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA... 2 2. Sylabus pro předmět STATISTIKA... 3 3. Pomůcky... 7

STATISTIKA. Inovace předmětu. Obsah. 1. Inovace předmětu STATISTIKA... 2 2. Sylabus pro předmět STATISTIKA... 3 3. Pomůcky... 7 Inovace předmětu STATISTIKA Obsah 1. Inovace předmětu STATISTIKA... 2 2. Sylabus pro předmět STATISTIKA... 3 3. Pomůcky... 7 1 1. Inovace předmětu STATISTIKA Předmět Statistika se na bakalářském oboru

Více

31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě

31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě 31. 3. 2014, Brno Hanuš Vavrčík Základy statistiky ve vědě Motto Statistika nuda je, má však cenné údaje. strana 3 Statistické charakteristiky Charakteristiky polohy jsou kolem ní seskupeny ostatní hodnoty

Více

SAMOSTATNÁ STUDENTSKÁ PRÁCE ZE STATISTIKY

SAMOSTATNÁ STUDENTSKÁ PRÁCE ZE STATISTIKY SAMOSTATÁ STUDETSKÁ PRÁCE ZE STATISTIKY Váha studentů Kučerová Eliška, Pazdeříková Jana septima červen 005 Zadání: My dvě studentky jsme si vylosovaly zjistit statistickým šetřením v celém ročníku septim

Více

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK www.biostatisticka.cz POPISNÉ STATISTIKY - OPAKOVÁNÍ jedna kvalitativní

Více

Jak nelhat se statistikou? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava

Jak nelhat se statistikou? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava Jak nelhat se statistikou? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava Co je to statistika? teoretická disciplína, která se zabývá metodami sběru a analýzy dat Jak získat data?

Více

Analýza dat s využitím MS Excel

Analýza dat s využitím MS Excel Analýza dat s využitím MS Excel Seminář aplikované statistiky Martina Litschmannová Několik fíglů na úvod Absolutní vs. relativní adresování změna pomocí F4 =$H$20 =H$20 =$H20 =H20 Posun po souvislé oblasti

Více

EXPERIMENTÁLNÍ MECHANIKA 2 Přednáška 5 - Chyby a nejistoty měření. Jan Krystek

EXPERIMENTÁLNÍ MECHANIKA 2 Přednáška 5 - Chyby a nejistoty měření. Jan Krystek EXPERIMENTÁLNÍ MECHANIKA 2 Přednáška 5 - Chyby a nejistoty měření Jan Krystek 9. května 2019 CHYBY A NEJISTOTY MĚŘENÍ Každé měření je zatíženo určitou nepřesností způsobenou nejrůznějšími negativními vlivy,

Více

Třídění statistických dat

Třídění statistických dat 2.1 Třídění statistických dat Všechny muže ve městě rozdělíme na 2 skupiny: A) muži, kteří chodí k holiči B) muži, kteří se holí sami Do které skupiny zařadíme holiče? prof. Raymond M. Smullyan, Dr. Math.

Více

Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy

Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy Přednáška XI. Asociace ve čtyřpolní tabulce a základy korelační analýzy Relativní riziko a poměr šancí Princip korelace dvou náhodných veličin Korelační koeficienty Pearsonůva Spearmanův Korelace a kauzalita

Více

Průzkumová analýza dat

Průzkumová analýza dat Průzkumová analýza dat Proč zkoumat data? Základ průzkumové analýzy dat položil John Tukey ve svém díle Exploratory Data Analysis (odtud zkratka EDA). Často se stává, že data, se kterými pracujeme, se

Více

Tomáš Karel LS 2012/2013

Tomáš Karel LS 2012/2013 Tomáš Karel LS 2012/2013 Doplňkový materiál ke cvičení z předmětu 4ST201. Na případné faktické chyby v této presentaci mě prosím upozorněte. Děkuji. Tyto slidy berte pouze jako doplňkový materiál není

Více

VYHODNOCOVÁNÍ KVANTITATIVNÍCH DAT (ÚVOD DO PROBLEMATIKY) Metodologie pro ISK

VYHODNOCOVÁNÍ KVANTITATIVNÍCH DAT (ÚVOD DO PROBLEMATIKY) Metodologie pro ISK VYHODNOCOVÁNÍ KVANTITATIVNÍCH DAT (ÚVOD DO PROBLEMATIKY) Metodologie pro ISK 14. 11. 2014 NENÍ STATISTIKA JAKO STATISTIKA Deskriptivní statistika Výzkumné otázky, ne hypotézy (případně deskriptivní hypotézy)

Více

Statistika. pro žáky 8. ročníku. úterý, 26. března 13

Statistika. pro žáky 8. ročníku. úterý, 26. března 13 Statistika pro žáky 8. ročníku Co je to statistika? Statistika je věda, která se snaží zkoumat reálná data a přibližuje nám zkoumaný jev a zákonitosti s ním spojené. Co nám statistika přináší? Co nám statistika

Více

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží

Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží Statistické metody - nástroj poznání a rozhodování anebo zdroj omylů a lží Zdeněk Karpíšek Jsou tři druhy lží: lži, odsouzeníhodné lži a statistiky. Statistika je logická a přesná metoda, jak nepřesně

Více

Metodologie pro Informační studia a knihovnictví 2

Metodologie pro Informační studia a knihovnictví 2 Metodologie pro Informační studia a knihovnictví 2 Modul V: Nekategorizovaná data Metodologie pro ISK 2, jaro 2014. Ladislava Z. Suchá Metodologie pro Informační studia a knihovnictví 2 Modul 5: Popis

Více

Statistické vyhodnocování ankety pilotního projektu Kvalita výuky na Západočeské univerzitě v Plzni

Statistické vyhodnocování ankety pilotního projektu Kvalita výuky na Západočeské univerzitě v Plzni Statistické vyhodnocování ankety pilotního projektu Kvalita výuky na Západočeské univerzitě v Plzni Kvantifikace dat Pro potřeby statistického zpracování byly odpovědi převedeny na kardinální intervalovou

Více

Matematika III. 29. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Matematika III. 29. října Vysoká škola báňská - Technická univerzita Ostrava. Matematika III Vysoká škola báňská - Technická univerzita Ostrava 29. října 2018 Statistika Statistika Statistika je jako bikini. Co odhaluje, je zajímavé, co skrývá, je podstatné. Aaron Levenstein Statistika Statistika

Více

4ST201 STATISTIKA CVIČENÍ Č. 7

4ST201 STATISTIKA CVIČENÍ Č. 7 4ST201 STATISTIKA CVIČENÍ Č. 7 testování hypotéz parametrické testy test hypotézy o střední hodnotě test hypotézy o relativní četnosti test o shodě středních hodnot testování hypotéz v MS Excel neparametrické

Více

Komplexní čísla, Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady

Komplexní čísla, Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady Předmět: Náplň: Třída: Počet hodin: Pomůcky: Matematika Komplexní čísla, Kombinatorika, pravděpodobnost a statistika, Posloupnosti a řady 4. ročník a oktáva 3 hodiny týdně PC a dataprojektor, učebnice

Více

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests) Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, např. hmotnost a pohlaví narozených dětí. Běžný statistický postup pro ověření závislosti dvou veličin je zamítnutí jejich

Více