1. Kategoriální proměnná nominální: (Tabulka a graf četností) Př.: sloupec (PokudanoJakčasto) -> Analyze -> Descriptive statistics -> Frequencies

Podobné dokumenty
Analýza dat z dotazníkových šetření. Zdrojová data: dotazník

Opakování: Nominální proměnná více hodnotová odpověď.

Základy pravděpodobnosti a statistiky. Popisná statistika

Návod pro práci s SPSS

Metodologie pro Informační studia a knihovnictví 2

ÚKOL ,77 5,00 5 2,531,003,056 -,869,113

Metodologie pro Informační studia a knihovnictví 2

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Metodologie pro ISK 2, jaro Ladislava Z. Suchá

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Škály podle informace v datech:

ČETNOSTI A ROZLOŽENÍ ČETNOSTÍ

LEKCE 02a UNIVARIAČNÍ ANALÝZA KATEGORIZOVANÝCH DAT

STATISTICA Téma 1. Práce s datovým souborem

Metodologie pro ISK II

Opakování: Nominální proměnná více hodnotová odpověď.

Spokojenost se životem

Metodologie pro Informační studia a knihovnictví

Metodologie pro Informační studia a knihovnictví 2

Metodologie pro Informační studia a knihovnictví 2

František Hudek. červenec 2012

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Analýza dat z dotazníkových šetření

2. popis prostředí, nastavení pracovní plochy

Základy popisné statistiky

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Metodologie pro Informační studia a knihovnictví 2

Třídění statistických dat

Metody sociálních výzkumů. Velmi skromný úvod do statistiky. Motto: Jsou tři druhy lži-lež prostá, lež odsouzeníhodná a statistika.

LEKCE02a ANALÝZA ROZLOŽENÍ KATEGORIZOVANÝCH DAT vzorový výsledek cvičení

Analýza dat na PC I.

Excel tabulkový procesor

Nejčastější chyby v explorační analýze

Charakteristiky kategoriálních veličin. Absolutní četnosti (FREQUENCY)

Příprava souboru dat a analýza

Excel mini úvod do kontingenčních tabulek

Deskriptivní statistika (kategorizované proměnné)

STATISTIKA 1. Adam Čabla Katedra statistiky a pravděpodobnosti VŠE

KAPITOLA 12 - POKROČILÁ PRÁCE S TABULKOVÝM PROCESOREM

Metodologie pro Informační studia a knihovnictví 2

Statistika s Excelem aneb Máme data. A co dál? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Popisná statistika. Statistika pro sociology

František Hudek. červenec 2012

Renáta Bednárová STATISTIKA PRO EKONOMY

Statistika pro geografy

2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat

Statistika. cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací!

Návod na statistický software PSPP část 1. úvod

INFORMATIKA EXCEL 2007

Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová. 5. Statistica

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

Zdokonalování gramotnosti v oblasti ICT. Kurz MS Excel kurz 6. Inovace a modernizace studijních oborů FSpS (IMPACT) CZ.1.07/2.2.00/28.

František Hudek. srpen 2012

Deskriptivní statistika (kategorizované proměnné)

Výběry z populace, příprava dat, popisné statistiky

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

Statistika. Zpracování informací ze statistického šetření. Roman Biskup

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

Kontingenční tabulky v Excelu. Představení programu Statistica

Zápočtová práce STATISTIKA I

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

Název DUM: VY_32_INOVACE_2B_16_ Tvorba_grafů_v_MS_Excel_2007

ADDS cvičení 7. Pavlína Kuráňová

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

FUNKCE PRO ANALYTICKÉ ZPRACOVÁNÍ DAT

5EN306 Aplikované kvantitativní metody I

1.1 Dva základní typy statistiky Popisná statistika (descriptive statistics) Inferenční statistika (inferential statistics)

STATISTIKA 1. RNDr. K. Hrach, Ph.D. Zápočet: 75% docházka na cvičení. + odevzdání seminární práce (úkoly na PC)

Excel - pokračování. Př. Porovnání cestovních kanceláří ohraničení tabulky, úprava šířky sloupců, sestrojení grafu

Projekt Využití ICT ve výuce na gymnáziích, registrační číslo projektu CZ.1.07/1.1.07/ MS Excel

EXCELentní tipy a triky pro mírně pokročilé. Martina Litschmannová

Časové řady - Cvičení

Aplikovaná statistika v R

Jak nelhat se statistikou? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava

Mnohorozměrná statistická data

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

Kontingenční tabulky v MS Excel 2010

Tabulkový procesor otázka č.17

Elektronické zpracování dotazníků AGEL. Verze

Návod na statistický software PSPP část 2. Kontingenční tabulky

Analýza dat s využitím MS Excel

MĚŘENÍ, TYPY VELIČIN a TYPY ŠKÁL

Tabulka 1. Výběr z datové tabulky

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Zpracování chybějících dat a dat mimo rozsah

Mnohorozměrná statistická data

23. Matematická statistika

7. SEMINÁŘ DESKRIPTIVNÍ STATISTIKA

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Popisná statistika v praxi aneb Je statistika nuda? Martina Litschmannová Katedra aplikované matematiky, FEI, VŠB-TU Ostrava

Databáze v Excelu EU peníze středním školám Didaktický učební materiál

Popisná statistika. Komentované řešení pomocí MS Excel

Číselné charakteristiky

Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy

Microsoft Excel kopírování vzorců, adresování, podmíněný formát. Mgr. Jan Veverka Střední odborná škola sociální Evangelická akademie

Transkript:

Analýza dat z dotazníkových šetření Cvičení 2. - Jednorozměrné třídění Zdrojová data: dotazník http://www.vyplnto.cz/realizovane-pruzkumy/konzumace-ryb-a-rybich-vyrob/ - Seznamte se s dotazníkem a strukturou otázek, zamyslete se nad vhodností jednotlivých odpovědí a škál - Stáhněte si data z dotazníku ve formátu *.csv a otevřete je v aplikaci Excel, zamyslete se, která data by bylo vhodnější upravit přímo v Excelu -> uložte dotazník ve formátu *.xls a otevřete datový soubor v prostředí SPSS Výstupy podle typu proměnné: kategoriální proměnné nominální kategoriální proměnné ordinální diskrétní číselné proměnné a škály spojité číselné proměnné alternativní proměnné baterie škál (alternativních proměnných) tabulka a graf četností (sloupcový, výsečový) modus tabulka a graf četností (sloupcový, spojnicový) modus a medián aritmetický průměr, modus a medián směrodatná odchylka intervaly spolehlivosti, error bar graf intervalových četností (histogram) aritmetický průměr, směrodatná odchylka kvartilové charakteristiky, box-plot intervaly spolehlivosti, error bar graf normality rozdělení (P-P graf) tabulka a graf četností (sloupcový, výsečový) aritmetický průměr, modus směrodatná odchylka intervaly spolehlivosti, error bar tabulka a graf průměrů (sloupcový, spojnicový) intervaly spolehlivosti, error bar Modus = hodnota vyskytující se nejčastěji s největší četností Medián = dělí řadu vzestupně seřazených výsledků na dvě stejně početné poloviny 1. Kategoriální proměnná nominální: (Tabulka a graf četností) - řádky tabulky představují jednotlivé třídy (kategorie) - sloupce tabulky vyjadřují četnosti (počty jednotek) Př.: sloupec (PokudanoJakčasto) -> Analyze -> Descriptive statistics -> Frequencies - Výběr proměnné (proměnných) Pokud ano, jak často? dále výběr co chceme zobrazit tlačítka: Statistics (střední hodnoty, odchylky, kvartily, medián, atd.), Charts (grafy teď vybereme Bar Chart histogram), Format, Style, Bootstrap. - Provedli jsme výběr - výstup tabulka + graf (co je špatně, podezřelé???) Ve sloupci je několikrát uvedena prázdná hodnota (pokud respondent v předchozí otázce odpověděl ne, tato otázka nebyla vůbec položena -> proč jsou tato data vyhodnocena? Tyto prázdné buňky musí z analýzy odstranit:

- Vymažeme celé řádky (velmi nevhodné znehodnotíme část dotazníku a můžeme přijít o cenná data, případně o cenné souvislosti pro další šetření) - Upravím data už v Excelu (formátování přes KDYŽ nebo IF) - Nadefinuji Missing Values přímo v SPSS (v tuto chvíli musím data natvrdo přepsat a do prázdných buněk napsat 0 ), pak přes Variable View, sloupec Missing -> Discrete missing values -> 0 Znovu provedeme vyhodnocení: Analyze -> Descriptive statistics -> Frequencies - Pokud ano, jak často? Co znamenají jednotlivé sloupce tabulky? Pokud ano, jak často? Frequency denně 1,5,5,5 jednou týdně 68 34,0 36,8 37,3 jednou za měsíc 45 22,5 24,3 61,6 několikrát týdně 33 16,5 17,8 79,5 příležitostně 38 19,0 20,5 100,0 Total 185 92,5 100,0 Missing 0 15 7,5 Total 200 100,0 - Missing počet nadefinovaných chybějících hodnot! - Frequency absolutní četnost jednotlivých proměnných - - procentuální zastoupení vzhledem ke VŠEM hodnotám i z neplatných - Relativní četnost z platných () hodnot - percent Kumulativní četnost Grafickým výstupem 2 typy grafů histogram (Bar chart) a koláčový graf (Pie chart). Pozor!!! U Pie chart, vždy mě zajímá, z kolika dat byl graf tvořen a kolik dat (procent) je zastoupeno v jednotlivých výsečích!!! Absolutní a realtivní četnost: rozdělení četností absolutní četnosti (count) n i relativní četnosti (percentage) p i ve výběrových šetřeních se uvádějí relativní četnosti kumulativní četnosti pouze u uspořádaných znaků (ordinální, metrické) např. kolik procent respondentů konzumuje ryby alespoň jednou za měsíc? (61,6)

Transformace vstupních dat filtrace souboru (Select Cases): rozdělení souboru (Split File): zkoumáme pouze jednotky s danou vlastností filtrační proměnná (podle ní vybíráme, např. věk) filtrační podmínka (např. věk 18) příklad: analyzujeme pouze dospělé respondenty rozdělení na podsoubory dvourozměrné třídění porovnání vlastností podsouborů rozdělující proměnná (např. pohlaví) příklad: srovnání odpovědí mužů a žen Př.: Filtrace souboru (Select Cases) Sloupec Jakoučástkujsteochotenzajedenkusrybyutratit -> nejprve nutnost překódovat na numerickou proměnnou (Recode into Different Variables). Zajímají nás respondenti, kteří jsou ochotni utratit za jeden kus ryby více než 100 Kč. Kolik jich je? Kolik z nich je ochotno utratit i více peněz za jeden kus ryby? Data -> Select cases -> If condition is satisfied -> If.. -> kusryby > 100 Filtr zobrazí pouze ty, kteří jsou ochotni dát za rybu více jak 100 Kč. Př.: rozdělení souboru (Split File) Sloupec Dávajípodlevašehonázorulidépřednostspíšekaprůmnebořízkům nejprve proveďme analýzu bez rozdělení souboru (53% řízky; 47% kapr) Analýza v závislosti na pohlaví: Data -> Split file -> Compare groups -> Vaše pohlaví Opět Analyze -> Frequencies -> Dávajípodlevašehonázorulidépřednostspíšekaprůmnebořízkům (muž: 55% kapr, 43 řízek; žena: 44% kapr, 55% řízek) Vyzkoušejte na výsledné tabulce pivotování výměna řádků a sloupců přehození jednotlivých sloupců

po ukončení analýz nezapomenout Split file vypnout nebo budou veškeré analýzy s tímto rozdělením Vyvážení souboru kvótní výběr - známe rozdělení populace podle vybraných znaků (např. podle věku muži : ženy = 1 : 1) - snažíme se, aby výběr dodržoval tyto kvóty někdy se to nepovede -> vyvažování vyvážení souboru (Weight Cases) - vytvoříme váhovou proměnnou např. W - každé jednotce (řádku) souboru přiřadíme váhy příklad: vyvážení odpovědí mužů a žen Vyvážení podle konkrétní proměnné - nerovnoměrné rozdělení -> rovnoměrné - k- počet kategorii proměnné Příklad vyvážení podle pohlaví: - v tomto souboru je 21% mužů a 71% žen - vyvážení pomocí SPSS 1) -> Transform -> Recode into Different Variables (překódujeme muže a ženy; muž=1, žena=2) -> nová proměnná W (jako Weight = váha) 2) Data -> Weight Cases (poslední položka) - > W Příklad: Vyzkoušejme vyvažování na sloupci Jakoučástkujsteochotenzajedenkusrybyutratit? Máme již nastaveno vyvážení, takže provedeme jen analýzu Analyze -> Descriptive statistics -> Frequencies Jakou částku jste ochoten/ochotna za jeden kus ryby utratit? (původní data, bez weight) Jakou částku jste ochoten/ochotna za jeden kus ryby utratit? (s využitím vyvažování) Frequenc Frequenc y y do 100 Kč 78 39,0 39,0 39,0 do 100 Kč 141 39,4 39,4 39,4 do 150 Kč 51 25,5 25,5 64,5 do 150 Kč 93 26,0 26,0 65,4 do 175 Kč 13 6,5 6,5 71,0 do 175 Kč 23 6,4 6,4 71,8 do 50 Kč 19 9,5 9,5 80,5 do 75 Kč 16 8,0 8,0 88,5 do 50 Kč 34 9,5 9,5 81,3 do 75 Kč 29 8,1 8,1 89,4 více než 200 Kč 23 11,5 11,5 100,0 více než 200 Kč 38 10,6 10,6 100,0

Total 200 100,0 100,0 Total 358 100,0 100,0 Všimněte si rozdílných hodnot ve sloupcích, a hlavně rozdílného Total.(je způsobeno vyvažováním, aby byly odpovědi mužů stejně zastoupeny jako odpovědi žen) Příklad: Vyzkoušejme vyvažování na sloupci PokudanoJakčasto? Máme již nastaveno vyvážení, takže provedeme jen analýzu Analyze -> Descriptive statistics -> Frequencies Pokud ano, jak často? (původní data bez vyvažování) Pokud ano, jak často? (s využitím vah) Freque Percen Cumulativ Frequenc ncy t e y denně 1,5,5,5 jednou týdně 68 34,0 36,8 37,3 jednou za 45 22,5 24,3 61,6 měsíc několikrát 33 16,5 17,8 79,5 týdně příležitostně 38 19,0 20,5 100,0 Total 185 92,5 100,0 Missin 0 15 7,5 denně 1,3,3,3 jednou týdně 121 33,8 36,4 36,7 jednou za 80 22,3 24,1 60,8 měsíc několikrát 58 16,2 17,5 78,3 týdně příležitostně 72 20,1 21,7 100,0 Total 332 92,7 100,0 Total 200 100,0 Missing 0 26 7,3 Total 358 100,0 Vypneme vyvažování souboru: Data -> Weight Cases -> Do not weight cases Pivotování - K úpravě tabulek do vhodného tvaru ke zpracování Příklad: Vyhodnoťe (procentualně) sloupec Jste (zaměstnanost) v závislosti na pohlaví respondenta. Řešení: 1) Vyhodnocují na základě znaku Pohlaví Data -> Split file -> Compare groups -> Vaše pohlaví 2) Provedu analýzu zaměstnanosti Analyze -> Descriptive statistics -> Frequencies -> Jste Výsledek velká nepřehledná tabulka, s nevhodnými sloupci a dalšímu nepotřebnými údaji Pomocí menu Pivot a dalšími úpravami tabulky se pokuste dostat výslednou tabulku v tomto tvaru: Jste: Vaše pohlaví: muž důchodce 7,1 žena

na mateřské dovolené 2,4 5,1 nezaměstnaný/á 14,3 3,8 OSVČ 5,1 student 40,5 58,9 zaměstnaný/á 35,7 27,2 Total 100,0 100,0 Příkaz Pivot je v horním menu okna Output (objeví se po vybrání, zvýraznění tabulky). Další úpravy tabulky intuitivně po dvojkliku myší na tabulku odstranění zbytečných řádků a sloupců. Vizuální úpravy přes horní menu Format (např. odstranění nebo přidání dělících řádků Table Properties -> Horizontal category border) Další úkoly a příklady k procvičení: 1. Vyhodnoťte poslední otázku: Podle vašeho názoru je na českém trhu poptávka po rybách a rybích výrobcích. a) Obecně podle názoru respondentů. b) Podle pohlaví mají stejný názor muži i ženy? c) Proveďte vyvážení souboru podle pohlaví a proveďte znovu analýzu 2. Vyhodnoťte otázku: Dáváte přednost spíše tuzemským nebo zahraničním produktům? Co respondenti upřednostňují? Jak toto souvisí s cenou za 1 kus ryby? (vyhodnoťte cenu 1 kusu ryby, otázka: Jakou částku jste ochoten/ochotna za jeden kus ryby utratit?, v závislosti zda se jedná o tuzemskou nebo zahraniční rybu) 3. Jsou respondenti s vyšším příjmem ochotni utratit za jeden kus ryby více peněz? Zamyslete se nad vhodným vyjádřením odpovědi. U všech úkolů dbejte na správné vyjádření, přehlednou prezentaci a vždy si slovně zdůvodněte odpověď na co jsme se ptali jakou jsme dostali odpověď..