Elementární analýza dat

Podobné dokumenty
Kurz SPSS: Jednoduchá analýza dat

Příprava souboru dat a analýza

Výběry z populace, příprava dat, popisné statistiky

Kontingenční tabulky analýza kategoriálních dat: Úvod. Třídění 2. stupně

Excel mini úvod do kontingenčních tabulek

Spokojenost se životem

Metodologie pro ISK II

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

Kvantitativní metody výzkumu v praxi PRAKTIKUM. Příprava výzkumného projektu

Statistika, Biostatistika pro kombinované studium Letní semestr 2011/2012. Tutoriál č. 4: Exploratorní analýza. Jan Kracík

Základy pravděpodobnosti a statistiky. Popisná statistika

Úloha č. 2 - Kvantil a typická hodnota. (bodově tříděná data): (intervalově tříděná data): Zadání úlohy: Zadání úlohy:

Číselné charakteristiky

Náhodná proměnná. Náhodná proměnná může mít rozdělení diskrétní (x 1. , x 2. ; x 2. spojité (<x 1

Praktická statistika. Petr Ponížil Eva Kutálková

Zápočtová práce STATISTIKA I

Sociologický výzkum (stručný úvod) Michal Peliš

Deskriptivní statistika (kategorizované proměnné)

veličin, deskriptivní statistika Ing. Michael Rost, Ph.D.

LEKCE 02a UNIVARIAČNÍ ANALÝZA KATEGORIZOVANÝCH DAT

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

Základy popisné statistiky

ZÁKLADNÍ STATISTICKÉ CHARAKTERISTIKY

TECHNICKÁ UNIVERZITA V LIBERCI SEMESTRÁLNÍ PRÁCE

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Analýza dat na PC I.

Popisná statistika. Komentované řešení pomocí MS Excel

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Popisná statistika. Statistika pro sociology

Základy popisné statistiky. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek

Výzkum sociální změny

Statistika pro geografy

VYHODNOCOVÁNÍ KVANTITATIVNÍCH DAT (ÚVOD DO PROBLEMATIKY) Metodologie pro ISK

Metodologie pro Informační studia a knihovnictví 2

STATISTIKA 1. Adam Čabla Katedra statistiky a pravděpodobnosti VŠE

Statistika. cílem je zjednodušit nějaká data tak, abychom se v nich lépe vyznali důsledkem je ztráta informací!

Otázky k měření centrální tendence. 1. Je dáno rozložení, ve kterém průměr = medián. Co musí být pravdivé o tvaru tohoto rozložení?


STATISTICKÉ CHARAKTERISTIKY

Daně z pohledu veřejného mínění listopad 2014

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

Aplikovaná statistika v R

ANALÝZA DAT V R 3. POPISNÉ STATISTIKY, NÁHODNÁ VELIČINA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK

Třídění statistických dat

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Semestrální projekt. do předmětu Statistika. Vypracoval: Adam Mlejnek Oponenti: Patrik Novotný Jakub Nováček Click here to buy 2

Metodologie pro Informační studia a knihovnictví 2

Charakteristiky kategoriálních veličin. Absolutní četnosti (FREQUENCY)

Zpracování náhodného výběru. Ing. Michal Dorda, Ph.D.

Popisná statistika. Jaroslav MAREK. Univerzita Palackého

Obsah. Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku

Výrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy

Mnohorozměrná statistická data

Analýza dat z dotazníkových šetření. Zdrojová data: dotazník

LEKCE02a ANALÝZA ROZLOŽENÍ KATEGORIZOVANÝCH DAT vzorový výsledek cvičení

Návod na statistický software PSPP část 2. Kontingenční tabulky

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

Metody sociálních výzkumů. Velmi skromný úvod do statistiky. Motto: Jsou tři druhy lži-lež prostá, lež odsouzeníhodná a statistika.

Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy

Pravděpodobnost a statistika

Nejčastější chyby v explorační analýze

Charakteristika datového souboru

Morálka politiků očima veřejnosti - březen 2015

Tisková zpráva. Občané o hospodářské situaci ČR a o životní úrovni svých domácností květen /6

2. Základní typy dat Spojitá a kategoriální data Základní popisné statistiky Frekvenční tabulky Grafický popis dat

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ. FAKULTA STROJNÍHO INŽENÝRSTVÍ Ústav materiálového inženýrství - odbor slévárenství

Kurz SPSS: Jednoduchá analýza dat. Jiří Šafr

KVALITA OČIMA PACIENTŮ psychiatrické léčebny - II. díl

Angažovanost občanů a zájem o politiku - únor 2016

5EN306 Aplikované kvantitativní metody I

0% III/2002 IX/2005 II/2007 II/2008 II/2009 II/2010 II/2011 XI/2012 XI/2013

Daně z pohledu veřejného mínění listopad 2015

ČETNOSTI A ROZLOŽENÍ ČETNOSTÍ

er Jilská 1, Praha 1 Tel.: milan.tucek@soc.cas.cz

Základní statistické charakteristiky

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

, Brno Hanuš Vavrčík Základy statistiky ve vědě

Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy

Zpracovala: Naděžda Čadová Centrum pro výzkum veřejného mínění, Sociologický ústav AV ČR, v.v.i. Tel.:

Analýza dat s využitím MS Excel

Využití software ITEMAN k položkové analýze a analýze výsledků testů

METODOLOGIE I - METODOLOGIE KVANTITATIVNÍHO VÝZKUMU

Mnohorozměrná statistická data

KVALITA OČIMA PACIENTŮ psychiatrické léčebny - III. díl

Varianty výzkumu Kroky výzkumu Výběrový soubor

Spokojenost se životem červen 2019

Postoje českých občanů k NATO a obraně ČR - leden 2015

er Jilská 1, Praha 1 Tel.:

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

SVOBODA ZVÍŘAT. Kožešinová zvířata. Na základě dat CVVM SOÚ AV ČR, v.v.i., pro Svobodu zvířat. Zpracovala: PhDr. Lucie Moravcová

Romové a soužití s nimi očima české veřejnosti duben 2014

TECHNICKÁ UNIVERZITA V LIBERCI

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Spokojenost s životem červen 2015

Úvodní seminář Přehled metod, typy znaků

TISKOVÁ ZPRÁVA. Centrum pro výzkum veřejného mínění CVVM, Sociologický ústav AV ČR, v.v.i. OV.14, OV.15, OV.16, OV.17, OV.18, OV.179, OV.

TEST Z TEORIE EXPLORAČNÍ ANALÝZA DAT

Renáta Bednárová STATISTIKA PRO EKONOMY

Transkript:

UK FHS Řízení a supervize v sociálních a zdravotnických organizacích (LS 2008) Kvantitativní metody výzkumu v praxi PRAKTIKUM část 4. Elementární analýza dat Jiří Šafr jiri.safr@seznam.cz vytvořeno 2. 5. 2008

Obsah části 2 Tabulky Jednorozměrná analýza Dvou a vícerozměrná analýza Uspořádání tabulky a její interpretace Pravidla tvorby tabulek Vlastnosti rozdělení znaků Jednoduché popisné statistiky Střední hodnoty: modus, medián, průměr Směrodatná odchylka Několik rad jak číst statistiky Typy grafů Praktikum KMVP část 2 2

Proces analýzy dat musíme promyslet již ve stadiu plánování dotazníku (modelu vztahů a hypotéz).

Tabulky

Třídění prvního stupně frekvence jedné proměnné VZD4 Vzdelani na 4 kategorie Valid Missin Total FrequencyPercentPercent Valid Percent 1 Zaklad 334 7,0 7,0 7,0 2 Vyuc,S 1571 33,1 33,1 40,2 3 Maturi 1934 40,8 40,8 81,0 4 VS 901 19,0 19,0 100,0 Total 4740 99,9 100,0 0 4,1 4744 100,0 [Zdroj: Deset let transformace, 1999] Praktikum KMVP část 2 5

Třídění druhého stupně absolutní četnosti frekvence jedné vs. druhé proměnné (kategorie příjmu podle vzdělání) PRIJR6 * VZD4 Vzdelani na 4 kategorie Crosstabulation Count PRIJR61,00 2,00 3,00 4,00 5,00 6,00 Total VZD4 Vzdelani na 4 kategorie 1 Zakladni2 Vyuc,SO Maturita 4 VS Total 113 320 250 103 786 127 521 533 134 1315 15 255 341 136 747 10 192 308 186 696 1 51 107 107 266 23 78 91 192 266 1362 1617 757 4002 [Zdroj: Deset let transformace, 1999] Praktikum KMVP část 2 6

Třídění druhého stupně relativní četnosti PRIJR6 * VZD4 Vzdelani na 4 kategorie Crosstabulation % within VZD4 Vzdelani na 4 kategorie VZD4 Vzdelani na 4 kategorie 1 Zakladni2 Vyuc,SO3 Maturita 4 VS Total PRIJR6 1,00 42,5% 23,5% 15,5% 13,6% 19,6% 2,00 47,7% 38,3% 33,0% 17,7% 32,9% 3,00 5,6% 18,7% 21,1% 18,0% 18,7% 4,00 3,8% 14,1% 19,0% 24,6% 17,4% 5,00,4% 3,7% 6,6% 14,1% 6,6% 6,00 1,7% 4,8% 12,0% 4,8% Total 100,0% 100,0% 100,0% 100,0% 100,0% [Zdroj: Deset let transformace, 1999] Praktikum KMVP část 2 7

Tabulky - metoda popisu dat

Tabulky jako metoda popisu Co nám řekne tabulka? Vzorce variace jedné proměnné v čase Vzorce variace dvou (a více) proměnných ve vzájemném vztahu Porovnání mezi skupinami Vzájemný vztah mezi proměnnými Praktikum KMVP část 2 9

Dvourozměrná tabulka příklad Existují dvě nemocnice, které provádí stejný typ operace. Každá při tom používá jiný typ anestetika (A / B). Které anestetikum byste raději dostali? lék A lék B přežili 5950 9005 umřeli 5050 1095 Zdroj: [Campanelli 2007] Praktikum KMVP část 2 10

Kterou nemocnici byste si vybrali? nemocnice 1 nemocnice 2 lék A lék B lék A lék B úmrtnost 95% 90% 50% 5% Zdroj: [Campanelli 2007] Praktikum KMVP část 2 11

Jednorozměrná analýza Distribuce případů pro jednu proměnnou (otázku v dotazníku) pro celkovou populaci

Jednorozměrná analýza tabulka procentní základ a chybějící hodnoty Praktikum KMVP část 2 13 [Babbie 1997: 377]

Dvourozměrná analýza Vztah dvou proměnných: porovnání podskupin (vliv nezávislé na závislou proměnnou)

Nejprve příklad: Procenta v tabulce. Porovnání subpopulací závislá proměnná (genderová rovnost) nezávislá proměnná (pohlaví) [Babbie 1997: 386]

[Babbie 1995: 386-387] Praktikum KMVP část 2 16

Praktikum KMVP část 2 17 [Babbie 1997: 387]

Marginální četnosti Relativní sloupcové četnosti = součet v každém sloupci reprezentuje 100% Relativní řádkové četnosti = součet vkaždém řádku reprezentuje 100% Praktikum KMVP část 2 18

Uspořádání tabulky sloupcová procenta: V kategoriích nezávislé proměnné ukazujeme kompletní (100 %) distribuci závislé proměnné. ZÁVISLÁ - vysvětlovaná NEZÁVISLÁ - vysvětlující Pohlaví Spokojenost Muž Žena Celkový součet 1 (nespokojen) 41 % (5) 22 % (2) 7 2 41 % (5) 11 % (1) 6 3 (spokojen) 16 % (2) 66 % (6) 8 Celkový součet 100 % (12) 100 % (9) 21 Nejčastěji bývá závislá proměnná nalevo v řádcích a nezávislá (vysvětlující) ve sloupcích. Praktikum KMVP část 2 19

Nelogické uspořádání tabulky pohlaví spokojenost muž žena Celkový součet 1 (nespokojen) 5 (71 %) 2 (29 %) 7 (100 %) 2 5 (83 %) 1 (27 %) 6 (100 %) 3 (spokojen) 2 (25 %) 6 (75 %) 8 (100 %) Celkový součet 12 9 21 (100 %) Názory nemohou ovlivňovat pohlaví! Praktikum KMVP část 2 20

Interpretace tabulek závislá proměnná = je v hypotéze ovlivňována, způsobována (nejčastěji je v řádcích) nezávislá(é) proměnná = vysvětluje, ovlivňuje závislou V kategoriích nezávislé proměnné ukazujeme kompletní (100 %) distribuci závislé proměnné. Pozor! Směr kauzality je vždy věcí teorie, nelze ji určit z dat samotných. [Kreidl 2000] Praktikum KMVP část 2 21

Interpretace tabulek Uspořádání procenta dolů 100% je ve sloupci a porovnáváme % (čteme) v řádcích mezi kategoriemi podskupin ŠPATNĚ: z žen pouze 41 % chodí do kostela a 59 uvádí, že chodí častěji. Proto být ženou snižuje pravděpodobnost, že člověk bude chodit do kostela častěji. SPRÁVNĚ: závěr, že pohlaví je proměnná, která ovlivňuje chození do kostela se musí učinit na základě porovnání mezi muži a ženami. Porovnáváme 41 % a 28 %, z čehož činíme závěr: Vyšší pravděpodobnost časté návštěvy kostela (každý týden) lze vysledovat u žen než u mužů. Praktikum KMVP část 2 22 [Babbie 1997]

Dvourozměrná (bivariátní) analýza: čtení tabulky a slučování kategorií 100 % Sloučení kategorií 100 % Praktikum KMVP část 2 23 [Babbie 1997:383-84]

Interpretace tabulek Tabulky skoro vždy dělejte tak, aby vyjadřovaly podmíněnou pravděpodobnost, že respondent (věc) bude patřit do jednotlivých kategorií závislé proměnné, za předpokladu, že patří do dané kategorie nezávislé proměnné(ných). Procento je stým násobkem pravděpodobnosti. [Kreidl 2000] Praktikum KMVP část 2 24

Porovnání podskupin 1. rozdělte případy do adekvátních podskupin (dle hypotéz, např. podle vzdělání) 2. popište proměnnou pro podskupiny pomocí zvolených statistik (např. medián, průměr, procenta) 3. srovnejte tyto údaje pro skupiny Praktikum KMVP část 2 25

Explanační interpretace dvojrozměrné tabulky 1. Případy rozdělíme do podskupin podle vlastností nezávislé proměnné (muži/ženy) 2. Každá podskupina je popsána podle vlastností závislé proměnné (spokojenost) 3. Tabulku čteme tak, že porovnáme navzájem podskupiny nezávislé proměnné (muži/ženy) podle vlastností závislé proměnné (spokojenost) Praktikum KMVP část 2 26 [Babbie 1997]

Souvislost znaků v tabulce Kupení vysokých hodnot na diagonále tabulky naznačuje, že existuje souvislost mezi proměnnými. Souvislost ale může mít i jinou formu, např. v každém sloupci jsou pozorování nahromaděna do jediného pole, jehož pozice je pro každý sloupec jiná. Praktikum KMVP část 2 27 [Kreidl 2000]

Interpretace tabulek Při interpretaci procent obvykle stačí porovnávat extrémní hodnoty a ignorovat střední kategorie. Pokud jde o ordinální proměnné pak není dobré činit obsáhlé závěry na základě % uvnitř jednotlivých kategorií nezávislé proměnné. Smysluplné je dělat porovnání distribucí napříč kategoriemi nezávislé proměnné. Buďte opatrní a neberte názvy kategorií zas tak doslova. [Kreidl 2000] Praktikum KMVP část 2 28

Vícerozměrná analýza: třídění třetího stupně Analyzujeme souběžně vztahy mezi několika proměnnými (nejčastěji více nezávislých vysvětlujících znaků). Princip je stejný jako u dvourozměrné analýzy.

Vícerozměrná analýza: třídění třetího stupně 100 % Jak mezi muži tak ženami starší lidé chodí do kostela častěji než mladí. V každé věkové kategorii ženy navštěvují kostel častěji než muži. Podle tabulky, pohlaví má nepatrně větší efekt na chození do kostela než věk. Věk a pohlaví mají nezávislý vliv na chození do kostela. Uvnitř každé kategorie nezávislé proměnné odlišné vlastnosti té druhé přesto ovlivňují jednání. Podobně obě nezávislé proměnné mají kumulativní efekt na jednání. Starší ženy chodí nejčastěji a mladí muži nejméně často. Praktikum KMVP část 2 30 [Babbie 1997: 391]

Zjednodušení předchozí tabulky: 100 % 70 % méně často Ukazujeme pouze pozitivní kategorie znaku ( do kostela chodí týdně). Při tom neztrácíme žádný údaj. Četnosti v závorkách uvádí procentní základ, z něj lze dopočítat podíl nezobrazené kategorie. Praktikum KMVP část 2 31 [Babbie 1997: 391]

Pravidla pro tvorbu tabulek Samotná procenta říkají málo nebo nic. nezamlčovat absolutní četnosti (stačí marginální = řádkové, sloupcové a celkový počet případů). V prvnířádce či sloupci uvést znak pro %, aby bylo jasné, že se jedná tabulku pro procenta. Praktikum KMVP část 2 32

Pravidla pro tvorbu tabulek Kontrolovat sama sebe tím, že vždy sečtete čísla v jednotlivých řádcích a sloupcích a porovnáte je se skutečnými marginálními četnostmi (z tabulek tř. 1st.). Celáčísla v % v tabulkách většinou bohatě stačí. 23,48 % 23 % [Kreidl 2000] Praktikum KMVP část 2 33

Pravidla pro tvorbu tabulek [Kreidl 2000, Babbie 1997] Tabulka musí mít název a popsané proměnné (řádky a sloupce). Uvést původní obsah proměnné, zejména pokud se jedná o postojové otázky (znění otázky) Vždy uvést zdroj dat. Uvést celkový počet případů (marginální distribuce absolutních četností). Uvést, jak byly spočítány procenta (procentní základ), u % tabulky uvést N Neuvádíme % i absolutní počty současně všude Zmínit pokud byly vynechány některé kategorie (např. nevím). chybějící hodnoty vždy uvést kolik lidí neodpovědělo, ale není nutno vždy zahrnovat do procentního základu Praktikum KMVP část 2 34

V názvu tabulky uvést: typ tabulky např. Procentní distribuce... nebo... (%) proměnné zahrnuté v tabulce, např. Religiozita a Úroveň vzdělání z jakého vzorku pocházejí data rok sběru dat Př. Procento uživatelů marihuany podle dosaženého vzdělání, středoškoláci, 1997. Praktikum KMVP část 2 35

Třídění druhého stupně: průměry a směrodatné odchylky v podskupinách Tabulka 1. Index vysoko kulturních aktivit ve volném čase podle sociální třídy (EGP), průměry a směrodatné odchylky 1993 1999 2006 Průměr SD Průměr SD Průměr SD I. Podnikatelé samostatně činní se zaměstnanci 4,2 2,5 4,6 2,8 4,7 3,0 II. Vyšší odborníci 5,4 2,3 6,3 2,5 5,4 2,6 III. Samostatně činní bez zaměstnanců (živnostníci) 3,6 2,5 4,8 3,2 3,4 2,7 IV. Střední odborníci, vč. mistrů 4,7 2,5 5,5 2,7 4,8 2,6 V. Rutinní nemanuální (řadoví úředníci) 4,1 2,4 4,9 2,6 4,0 2,6 VI. Kvalifikovaní dělníci 2,7 2,0 3,0 2,4 2,5 2,4 VII.Nekvalifikovaní dělníci 2,5 1,8 3,0 2,3 2,5 2,2 Celkem 3,6 2,4 4,6 2,9 3,7 2,7 Zdroj: [Data 1993, 1999, 2006], spojený soubor N =2000 věk 20 až 69 let, ekonomicky aktivní, vážené soubory Praktikum KMVP část 2 36

Baterie otázek (item response battery)

Baterie otázek Stejná obecná otázka např. Jak jste spokojen s následujícími službami? Stejné hodnoty znaků (stejné odpovědi) Analytický přístup k baterii otázek: Lze porovnávat hodnoty (škál) mezi sebou (medián, průměr, rozptyl pořadí) Lze vytvořit nový souhrnný index (např. součtový) vyšší reliabilita i validita měření Lze redukovat komplexitu baterie hledáme dimenze, vzájemné relace (ne/podobnost položek, typologie) Praktikum KMVP část 2 38

Vznikne 12 proměnných Příklad položkové baterie: diverzita v přátelské síti (CVVM 07-04) POKYN: PODEJTE DOTÁZANÉMU KARTU OV.160. OV.160 Do jaké míry pro Vás a Vaše přátele platí následující výroky. Do okruhu Vašich přátel patří lidé: VŮBEC ŽÁDNÍ OJEDINĚLE MÁLO MNOHO SKORO VŠICHNI 1 2 3 4 5 9 NEVÍ a) z jiné generace než jste Vy, 1 2 3 4 5 9 b) jiné národnosti než jste Vy (nezahrnujte sem přátele ze Slovenska), 1 2 3 4 5 9 c) jiného etnika nebo rasy než jste Vy, 1 2 3 4 5 9 d) s odlišnou sexuální orientací než je Vaše, 1 2 3 4 5 9 e) se zcela odlišným povoláním než je Vaše nebo než je běžné ve Vaší rodině? 1 2 3 4 5 9 f) Do okruhu Vašich přátel patří lidé, kteří sledují zcela odlišné TV pořady než sledujete Vy, 1 2 3 4 5 9 g) kteří jsou podstatně chudší než jste Vy, 1 2 3 4 5 9 h) kteří jsou podstatně bohatší než jste Vy, 1 2 3 4 5 9 i) kteří tráví svůj volný čas úplně jinak než ho trávíte Vy, 1 2 3 4 5 9 j) kteří mají úplně jiný kulturní vkus než máte Vy, 1 2 3 4 5 9 k) kteří čtou jiné noviny nebo časopisy než čtete Vy, 1 2 3 4 5 9 l) kteří mají zcela odlišný politický názor než máte Vy? 1 2 3 4 5 9 m) Do okruhu Vašich přátel patří lidé žijící na venkově, žijete-li ve městě. Nebo naopak lidé žijící ve městě, žijete-li na venkově? 1 2 3 4 5 9 Praktikum KMVP část 2 39 n) Do okruhu Vašich přátel patří lidé věřící, pokud Vy jste nevěřící. Nebo naopak lidé nevěřící, pokud Vy jste věřící? 1 2 3 4 5 9 Stejná otázka Stejné odpovědi (škála)

Baterie otázek: diverzita v přátelské síti. Frekvence (%) Tabulka 1. Odpovědi na otázku Do okruhu Vašich přátel patří lidé:, procenta 1. vůbec žádní 2. ojediněle 3. málo 4. mnoho 5. skoro všichni a) z jiné generace 18,1 32,1 35,6 12,4 1,3,4 b) jiné národnosti 65,6 21,8 9,9 1,6,3,8 c) jiného etnika 80,1 13,2 5,0,7,1 1,0 d) jiné sexuální orientace 80,6 7,9 5,3,7,1 5,4 e) jiného povolání 15,3 19,3 25,4 31,2 6,0 2,7 f) sledující jiné TV pořady 10,0 16,5 26,3 28,4 1,5 17,2 g) chudší lidé 20,8 26,3 30,2 9,1,5 13,1 h) bohatší lidé 15,3 25,3 32,3 14,1 2,0 11,1 i) s odlišným trávením volného času n) věřící / nevěřící 23,1 Praktikum 26,2 KMVP část 26,5 9,8 1,5 13,0 40 Neví 9,7 24,6 35,3 21,9 3,1 5,5 j) jiným kulturním vkusem 13,3 23,3 38,6 14,5 1,4 8,9 k) čtoucí jiné noviny 9,2 17,7 28,6 20,5 2,0 22,0 l) s odlišným polit. názorem 11,0 24,0 34,5 16,9 1,5 12,0 m) z venkova / města 19,7 24,9 33,5 16,2 3,2 2,5 Zdroj: Naše společnost, CVVM, duben 2007; věk 21+; N = 911. Chybějící hodnoty (> 5%)

Baterie otázek: diverzita v přátelské síti Popisné statistiky: počet platných odpovědí, minimum/maximum, průměr, směrodatná odchylka Pořadí položek dle průměru na škále 1-5 N Minimum Maximum Průměr Std. Dev. f) jiné TV programy mezi přáteli 830 1 5 2,9 1,0 e) jiné povolání mezi přáteli 977 1 5 2,9 1,2 k) čtou jiné noviny mezi přáteli 789 1 5 2,8 1,0 i) jiné trávení volného času mezi přáteli 956 1 5 2,8 1,0 l) odlišný polit. názor mezi přáteli 860 1 5 2,7 1,0 j) jiný vkus mezi přáteli 924 1 5 2,6 1,0 m) venkov / město mezi přáteli 985 1 5 2,6 1,1 h) bohatší lidé mezi přáteli 892 1 5 2,6 1,0 a) jiná generace mezi přáteli 1005 1 5 2,4 1,0 g) chudší lidé mezi přáteli 870 1 5 2,3 1,0 n) věřící / nevěřící mezi přáteli 869 1 5 2,3 1,0 b) jiné národnosti mezi přáteli 1003 1 5 1,5 0,8 c) jiné etnikum mezi přáteli 1000 1 5 1,3 0,6 d) jiná sexuální orientace mezi přáteli 955 1 5 1,2 0,6 Valid N (listwise) 555 Zdroj. CVVM 2007-04 N=1011 Počet platných odpovědí za všechny Praktikum KMVP část položky 2 baterie (ti, kdo odpověděli na 41 všechny otázky)

Dimenzionalita v baterii otázek: faktorová analýza (rotované řešení, graf faktorových zátěží) Zdroj: Naše společnost 2007-04 Praktikum KMVP část 2 42

Problém nízké variability odpovědí v baterii: Spokojenost klientů DSP Žádná varianace mezi položkami (vzorce odpovědí respondentů) Žádná varianace v položce Chybějící hodnoty (neodpověděli na všechny položky baterie) ot7.1_rozsah ot7.2_pristup ot7.3_prostredi ot7.4_kvalita ot7.5_kom ot7.6_cas ot7.7_doba ot7.8_respekt ot7.9_info 1 2 2 2 2 2 2 2 2 1 2 2 1 2 1 1 2 2 1 2 1 2 2 1 2 1 2 2 2 2 1 2 2 2 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 1 1 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 1 2 1 2 2 1 2 2 2 1 2 2 2 2 2 1 2 2 1 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 1 2 2 2 2 2 2 1 2 1 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 1 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 1 2 1 2 2 2 2 2 2 2 2 2 1 2 2 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 Baterie otázek (9 proměnných) Hodnoty znaků: 1=ne, 2=ano Praktikum KMVP část 2 43

Nízká (nulová) variabilita uvnitř/mezi položkami již ve fázi sběru dat: Zvýšit počet platných odpovědí Zvýšit varianci v odpovědích (formulace otázek + pilotáž)

Snížení počtu položek bez odpovědí (Item non-response) Školení tazatelů: Získat jejich spolupráci Vyzkoušet s nimi kladení otázek Poučit je, jaké strategie pro odlišné typy respondentů Tazatel musí být profesionál: odpovědi neodhaduje nebo si je sám nevymýšlí Pro získání vynechaných odpovědí se lze k vybraným otázkám vrátit na konci rozhovoru Hlídejte kritéria výběru Tazatele dobře odměňte Praktikum KMVP část 2 45

Snížení případů bez odpovědí Zajímavé téma Odpovídající metoda Upomínkování (telefonáty, dopisy) Přesvědčivý úvodní dopis/ oslovení Zpětné volání a přesvědčování o zúčastnění se Praktikum KMVP část 2 46

Které otázky (ne)dát do dotazníku? Po té, co si uděláte seznam indikátorů (proměnných) a začnete formulovat dotazníkové otázky, zjistíte, že jste omezeni prostorem dotazníku (časem dotazovaní): Neptejte se respondentů nadbytečné otázky: - které neodpovídají na výzkumnou otázku (RQ) -u nichžpředem znáte odpověď - o tom, co si myslí jiní lidé Mohou nám respondenti poskytnout informaci, kterou potřebujeme? - Budou všichni rozumět významu otázky? - Není dotaz příliš složitý k rychlému zodpovězení? (např. přesný celkový příjem) Praktikum KMVP část 2 47

Formulace otázek v dotazníku Buďte konkrétní. např. Jak jste spokojen/a s péčí, která vám byla poskytnuta? nespecifikováno Vs. Jak jste spokojen/a s informací, kterou vám o vaší nemoci poskytla vaše ošetřující sestra? specifikováno Vždy jde o Trade off: formulace jednoduchých a srozumitelných otázek vs. získání dat k zodpovězení RQ Praktikum KMVP část 2 48

Vlastnosti rozdělení znaků

Symetrie, variabilita [Hanousek, Charamza 1992: 21] Praktikum KMVP část 2 50

Šikmost a špičatost [Hanousek, Charamza 1992: 21] Praktikum KMVP část 2 51

Jednoduché popisné statistiky

Střední hodnoty: nominální znaky modus ordinální znaky medián (aritmetický průměr) intervalové znaky aritmetický průměr Praktikum KMVP část 2 53

Modus = kategorie s největší četností Medián = hodnota, která je ve prostředku všech pozorování seřazených podle hodnoty Aritmetický průměr = součet hodnot dělený počtem pozorování Praktikum KMVP část 2 54

Modus Praktikum KMVP část 2 [Babbie 1995] 55

Medián Praktikum KMVP část 2 [Babbie 1995] 56

Průměr Praktikum KMVP část 2 [Babbie 1995] 57

Charakteristiky variability Udávají koncentraci nebo rozptýlení kolem střední hodnoty. Ukazují na kvalitu průměru. Rozptyl = součet kvadratických odchylek od průměru dělený rozsahem výběr zmenšeným o 1. Směrodatná odchylka = odmocnina z rozptylu. Směrodatná odchylka je míra rozptýlení hodnot od průměrné (střední) hodnoty. Praktikum KMVP část 2 58

Výpočet směrodatné odchylky Příklad. Máme pozorování: 7 2 5 4 3 1 8 2 6 2 Součet řady = 40; n = 10; průměr = 40/10 = 4 Odchylky: 3-2 1 0-1 -3 4-2 2-2 součet odchylek je 9 9 = 0 čtverce odchylek: 9; 4; 1; 0; 1; 9; 16; 4; 4; 4 součet čtverců odchylek = 52 průměrná čtvercová odchylka tj. rozptyl = 52/10= 5,2 směrodatná odchylka (odmocnina z rozptylu) = 2,28 Praktikum KMVP část 2 59

Směrodatná odchylka v Excelu STDEVPA pro základní soubor STDEVA pro výběrový soubor Praktikum KMVP část 2 60

Další popisné statistiky Minimum / maximum Rozpětí Kvantily: dolní a horní kvartil Koeficienty šikmosti Praktikum KMVP část 2 61

Několik rad jak číst statistiky [Hanousek, Charamza 1993: 34-35]

Při čtení statistik pozor na: přesná čísla ve statistických zprávách procenta versus absolutní čísla srovnatelné údaje nezaměňovat ukazatele je porovnání vhodné? na výběry (nebyly-li provedeny profesionály) podoba otázek vlastní příprava zjišťování (experimentu) v nemocnici umírají lidé častěji než doma [Hanousek, Charamza 1993: 34-35] celé viz soubor Pozor_statistika.pdf Praktikum KMVP část 2 63

Typy grafů Excel viz část b. - grafy

Histogram 1400 Vzdelani na 6 kategorii 1200 1000 800 600 Frequency 400 200 0 1,0 2,0 3,0 4,0 5,0 6,0 Std. Dev = 1,54 Mean = 3,8 N = 4740,00 Vzdelani na 6 kategorii Praktikum KMVP část 2 65

Histogram 1400 PRIJEM89 1200 1000 800 Frequency 600 400 200 0 5000 9000 17500 35000 62500 6500 12500 25000 45000 87500 PRIJEM89 Praktikum KMVP část 2 66

Polygon 1400 PRIJEM89 1200 1000 800 600 Frequency 400 200 0 5000 9000 17500 35000 62500 6500 12500 25000 45000 87500 PRIJEM89 Praktikum KMVP část 2 67

Literatura Babbie, E. (1995). ThePracticeofsocial Research. 7th Edition. Belmont: Wadsworth Disman, M. (1993): Jak se vyrábí sociologická znalost. Praha: Karolinum Hanousek J., Charamza P. (1992). Moderní metody zpracování dat Matematická statistika pro každého. Praha: Grada. Kreidl, M. (2000). Podklady ke kurzu Analýza kvantitativních dat. FSV UK, LS 2000-2001. Jeřábek, H. (1993): Úvod do sociologického výzkumu. Praha: Karolinum Poděkování za cenné konzultace RNDr. L. Gatnarovi. Praktikum KMVP část 2 68