POPULAČNÍ ŠETŘENÍ. Nepravděpodobnostní výběry Pravděpodobnostní výběry Nahodilý výběr

Podobné dokumenty
Metody výběru ve výzkumech veřejného mínění

VÝBĚR VZORKU V KVANTITATIVNÍM

METODY VÝZKUMU GENDEROVÉ PROBLEMATIKY

LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR

Sociologický výzkum (stručný úvod) Michal Peliš

VÝBĚR A JEHO REPREZENTATIVNOST

Marketingový výzkum 5

Sněmovní volební model MEDIAN. (květen-červen 2013) 24. června 2013

Sněmovní volební model MEDIAN (listopad-prosinec 2012)

Sněmovní volební model MEDIAN (říjen-listopad 2012)

Výběry z populace, příprava dat, popisné statistiky

Průzkumy dopravního chování: základní zdroj dat o dopravní poptávce. Petr Šenk Centrum dopravního výzkumu, v.v.i.

Postoj občanů k plýtvání potravinami duben 2014

Sněmovní volební model MEDIAN. DUBEN 2014 (sběr 8. DUBNA 8. KVĚTNA 2014)

Jak získat data z European Working Conditions Survey

STATISTICKÝ SOUBOR. je množina sledovaných objektů - statistických jednotek, které mají z hlediska statistického zkoumání společné vlastnosti

Varianty výzkumu Kroky výzkumu Výběrový soubor

Sněmovní volební model MEDIAN KVĚTEN 2014

Testování. Ing. Michaela Krechovská, Ph.D. Vytvořeno v rámci projektu FRVŠ 1325/2012 Tvorba nového předmětu Finanční audit

Volební model MEDIAN (duben-květen 2012)

Sněmovní volební model MEDIAN KVĚTEN 2015

TISKOVÁ ZPRÁVA. Centrum pro výzkum veřejného mínění, Sociologický ústav

Statistika. Základní pojmy a cíle statistiky. Roman Biskup. (zapálený) statistik ve výslužbě, aktuálně analytik v praxi ;-) roman.biskup(at) .

TISKOVÁ ZPRÁVA. Centrum pro výzkum veřejného mínění, Sociologický ústav

KGG/STG Statistika pro geografy

Sněmovní volební model MEDIAN

Svatby v české společnosti

Konzumace piva v České republice v roce 2007

Sněmovní volební model MEDIAN ÚNOR 2015

Technické parametry výzkumu

Vzorce konzumace piva v České republice v roce 2010

Zpracoval: Matouš Pilnáček Centrum pro výzkum veřejného mínění, Sociologický ústav AV ČR Tel.:

GMO POHLED SOCIÁLNÍCH VĚD

Sněmovní volební model MEDIAN LISTOPAD 2014

Sněmovní volební model MEDIAN. SRPEN 2014 (sběr )

Obavy a příprava na důchod listopad 2016

Sněmovní volební model MEDIAN. (červenec-srpen 2013) 23. srpna 2013

Sněmovní volební model MEDIAN (září-říjen 2012)

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Spokojenost se životem

Názor občanů na drogy květen 2017

Prezidentský volební model (MEDIAN, listopad-prosinec 2012)

Rozdělení Československa

STATISTICKÉ ODHADY Odhady populačních charakteristik

Prezidentský panel Vývoj volebních postojů a vnímání kandidátů v předvolebním týdnu

Zpracoval: Martin Spurný Centrum pro výzkum veřejného mínění, Sociologický ústav AV ČR, v.v.i. Tel.: ,

Praha 10. Průzkum veřejného mínění na téma rekonstrukce Moskevské ulice

KOMUNÁLNÍ VOLBY 2014 PRAHA

Hodnocení činnosti ministerstev květen 2017

FINANČNÍ PROBLÉMY MÁ TŘETINA DOMÁCNOSTÍ

Volební model v květnu 2018

Názor na zadlužení obyvatel a státu březen 2017

Technické parametry výzkumu

Sněmovní volební model MEDIAN

Volební model v dubnu 2019

er Jilská 1, Praha 1 Tel.: milan.tucek@soc.cas.cz

Volební model v lednu 2018

Tolerance k vybraným skupinám obyvatel březen 2017

Názor na zadlužení obyvatel a státu leden 2018

Výzkum znalosti ROP Jihovýchod v Jihomoravském kraji a v kraji Vysočina

Názor občanů na drogy květen 2019

odpovědí: rizikové již při prvním užití, rizikové při občasném užívání, rizikové pouze při pravidelném užívání, není vůbec rizikové.

Technické parametry výzkumu

Občané o hospodářské situaci ČR a o životní úrovni svých domácností listopad 2015

Sněmovní volební model MEDIAN

Sněmovní volební model MEDIAN

Volební model v únoru 2018

Graf 1: Spokojenost se životem v místě svého bydliště (v %) 1 or % 1% % velmi spokojen spíše spokojen % ani spokojen, ani nespokojen spíše nesp

Zpracovala: Naděžda Čadová Centrum pro výzkum veřejného mínění, Sociologický ústav AV ČR, v.v.i. Tel.: ;

TISKOVÁ ZPRÁVA. Centrum pro výzkum veřejného mínění, Sociologický ústav

Sněmovní volební model MEDIAN

Informovanost české veřejnosti o pivu a jeho hodnocení v roce 2013

er Jilská 1, Praha 1 Tel.:

Sněmovní volební model MEDIAN. Září 2017

Názory občanů na sociální zabezpečení v ČR listopad 2013

Sněmovní volební model MEDIAN BŘEZEN 2015

Názory obyvatel na přijatelnost půjček

Hodnocení činnosti ministerstev květen 2019

sněmovní volební model srpen 2018 (sběr 25. července 28. srpna 2018)

Vymezení důležitých pojmů. nulová hypotéza, alternativní hypotéza testování hypotézy hladina významnosti (alfa) chyba I. druhu, chyba II.

er Jilská 1, Praha 1 Tel./fax: milan.tucek@soc.cas.cz

Tolerance k vybraným skupinám obyvatel březen 2018

sněmovní volební model květen 2019 (sběr 24. dubna května 2019)

Sněmovní volební model MEDIAN ŘÍJEN 2014

Statistická analýza dat v psychologii. Věci, které můžeme přímo pozorovat, jsou téměř vždy pouze vzorky. Alfred North Whitehead

Technické parametry výzkumu

duben 2014 MEDIÁLNÍ GRAMOTNOST 2 Analýza modelů sledování televize

BAKALÁŘSKÉ STUDIUM SOCIOLOGIE Tematické okruhy ke státní zkoušce

Výzkum trhu. Tomáš Kravka

Metody sociálního výzkumu. 2. Ročník LS 2010 Jabok, ETF 2. výukový blok

Tolerance k vybraným skupinám obyvatel březen 2019

Zpracovala: Naděžda Čadová Centrum pro výzkum veřejného mínění, Sociologický ústav AV ČR, v.v.i. Tel.:

Spokojenost se životem březen 2018

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Výběrové šetření o zdravotním stavu české populace (HIS CR 2002) - Charakteristika výběrového souboru (II. díl)

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

PROHLOUBENÍ NABÍDKY DALŠÍHO VZDĚLÁVÁNÍ NA VŠPJ A SVOŠS V JIHLAVĚ

Tisková zpráva. Veřejnost o jaderné energetice květen /5

VÝBĚROVÉ ŠETŘENÍ PRACOVNÍCH SIL

Volební model v listopadu 2018

Transkript:

METODY VÝBĚRU VZORKU a VELIKOST VZORKU POPULAČNÍ ŠETŘENÍ Census (vyčerp. šetření) Výběr vzorku Nepravděpodobnostní výběry Pravděpodobnostní výběry Nahodilý výběr Prostý náhodný výběr Výběr na zákl. dostupnosti Systematický výběr Metoda sněhové koule Stratifikovaný náhod. výběr Záměrný (úsudkový) výběr Výběr shluků (skupin. výběr) Kvótní výběr Vícestupňový výběr Náhodná procházka Zdařilá práce se vzorkem: Výsledky předvoleb. průzkumů a výsledek volby presidenta USA (1996) (%) Agentura Bill Clinton Bob Dole Ross Perot Ostatní Hotline/ Battleground 49 40 9 2 CBS/New York Times 54 35 9 2 Pew Research Center 52 38 8 2 Reuter/Zogby 49 41 8 2 Harris 51 39 9 1 ABC 52 39 7 2 NBC/Wall St. Journal 51 38 9 2 Gallup/CNN/USAToday 51 38 9 2 Výsledky voleb 49 41 8 2 Pramen: Babbie, E. 2001 The Practise of Social Research. Belmont: Wadsworth.

Neúspěšná práce se vzorkem: Vítěz presidentských voleb v USA (1948), Harry Truman, ukazuje mylnou předpověď výsledků voleb, otištěnou v Chicago Daily Tribune. Předvolební průzkum (George Gallup) nesprávně určil jako vítěze Thomase Deweyho. Neúspěch Gallupovy předpovědi zapříčinil (také) nepřesně postavený vzorek respondentů. Kroky vytváření vzorku: (a) stanovení cílové populace (=základního souboru) (b) získání opory výběru (1) Nepravděpodobnostní výběry (Nonprobability sampling) Typické: v některé fázi tvorby vzorku obsahují osobní úsudek nemáme plnou kontrolu nad kvalitou vzorku nevíme zdali, nakolik a kterým směrem je vychýlen Kvótní výběr (quota sampling) Kvóty = předem specifikované skupiny zdroje kvót např. SLDB, VŠPS do praxe zavedl: George Gallup zakladatel American Institute of Public Opinion (1936) Kvótní kriteria (zpravidla) - věkové skupiny - pohlaví - vzdělání - region - velikosti obce Předpoklad: shoda složení výběrového souboru se souborem základním z hlediska vybraných identifikačních znaků, zajistí i shodu v rozdělení ostatních znaků

(2) Pravděpodobnostní výběry (probability sampling) = základní metoda výběru velkých reprezentativních vzorků populace Vylučují vliv úsudku na proces výběru (=objektivita) Princip : každá jednotka má stejnou šanci dostat se do vzorku Stratifikovaný náhodný výběr (stratified random sampling) Strata (většinou) = subpopulace Postup: 2 kroky: krok A. základní soubor rozdělíme do strat (strata musí soubor úplně pokrývat) krok B. v každém stratu = prostý náhodný výběr (zpravidla stejnou proporci jednotek) Příklad: Šetření univerzitních studentů (Postoje ke konzumaci alkoholu) Fakulty Populace Stratifikovaný vzorek (1/20 z popul.) Humanities Social Sciences Pure sciences Applied sciences Engineering T O T A L 1 800 1 200 2 000 1 800 2 200 9 000 90 60 100 90 110 450 Převzato z: Babbie, E. 2001 The Practise of Social Research. Belmont, Wadsworth. (str. 90) Pravděpodobný vzorek při užití prostého náhod. výběru 85 70 120 84 91 450 Stratifikovaný výběr vyšší míru reprezentativity, než prostý náhodný výběr = vybíráme správné počty případů z homogenních podsouborů populace Při větší homogenitě souboru: klesá velikost výběrové chyby Výběr shluků (skupinkový výběr) cluster sampling Základní soubor sestává ze shluků = vnitřně heterogenních, ale navzájem podobných skupinek Náhodně vybíráme skupinky / shluky kompletně šetříme Ideální shluk = odráží strukturu názorů celé (šetřené) populace

Vícestupňový výběr (multistage sample) Postupně vybíráme jednotky (např. územní) od velkých k menším Na posledním stupni výběru případy příklad: okresy obce - části obce / ulice dům domácnost / osoby Technika znamená opakování 2 základních kroků (1) soupis jednotek (2) výběr jednotek

Náhodná procházka (random route, random walk) Charakteristika: metoda výběru adres pro terénní šetření, v situacích, kdy není k dispozici seznam adres pro výběr. Ač se hojně užívá, vede se spor, nakolik metoda splňuje kriteria pravděpodobnostních výběrů. Některá šetření ji neakceptují (např. European Social Survey). V přesné definici jejího postupu bývají rozdíly. Postup: tazatel vyjde z předem (náhodně) určeného startovního bodu. Hlavní idea je: pravidlo pravé ruky (popř. levé ruky) a výběr každého x-tého domu. Potenciální problémy: nutno vyloučit zkreslení, např. ignorování bočních uliček. Vyjděte ze startovního bodu. Běžte po pravém chodníku a vyhledejte každý třetí vchod ve vašem směru, znázorněného tučnou šipkou. Narazíte-li na křižovatku, zatočte vpravo, držte se pravého chodníku a pokračujte ve vyhledávání. Naleznete-li v obytném bloku, který vám byl přiřazen, jen malý počet domů, pak poté, co znova dorazíte ke startovnímu bodu, pokračujte v chůzi ve směru tečkované šipky (Moon street). Pokud byste (což je málo pravděpodobné) nenaplnil určenou kvótu respondentů, i přesto že jste využil všech směrů od startovního bodu, jděte opět původní cestou, tentokrát vyberte PRVNÍ vchod a dále každý třetí. Nepomůže-li to, požádejte svého instruktora o další startovní bod. Organizační kroky: Náhodný výběr lokalit Výběr startovních adres v každé lokalitě Zpracování instrukcí pro procházku a výběr domů Kontrola (např. podle kvót a podle výskytu specifických respondentů) VŠECHNY UVEDENÉ TECHNIKY VÝBĚRU SE NĚKDY KOMBINUJÍ S CÍLEM VYVÁŽIT JEJICH VÝHODY A NEVÝHODY. Jak je vybírán konkrétní respondent ve vícečlenné domácnosti? Metoda nejbližších narozenin: z několikačlenné domácnosti je vybrán respondent, jehož narozeniny přijdou nejdříve po datu interview. (alternativa: Metoda posledních narozenin )

VELIKOST VZORKU (Sample Size) U pravděpodobnostních výběrů Determinanty velikosti vzorku: Jak velkou výběrovou chybu hodláme tolerovat Jak heterogenní bude sledovaná populace Jakého typu budou klíčové proměnné Jaké podskupiny vzorku hodláme analyzovat Kolik to bude vše stát (1) Jak velkou výběrovou chybu hodláme tolerovat (Sampling Error) Výběrová chyba = nakolik se může výsledek zjištěný ve výběrovém souboru odchylovat od skutečnosti v základním souboru. Udávána v % na zvolené hladině spolehlivosti (zpravidla 95 %) Stanovíme-li si přípustnou výběrovou chybu, můžeme určit velikost výběrového souboru. Pramen: Gallup Organization Europe (upraveno)

(2) Jak heterogenní bude sledovaná populace (a tedy získané odpovědi) Velikost vzorku podle homogenity odpovědí a požadované přesnosti homogenita heterogenita Přijatelná výběr. chyba 5 : 95 10 : 90 20 : 80 30 : 70 40 : 60 50 : 50 1 % 1 900 3 600 6 400 8 400 9 600 10 000 2 % 479 900 1 600 2 100 2 400 2 500 3 % 211 400 711 933 1 066 1 100 4 % 119 225 400 525 600 625 5 % 76 144 256 336 370 400 6 % - 100 178 233 267 277 7 % - 73 131 171 192 204 8 % - - 100 131 150 156 9 % - - 79 104 117 123 10 % - - - 84 96 100 Pramen: Blaikie, N. 2000 Designing Social Research. Cambridge: Polity. (str. 210) (3) Jakého typu budou klíčové proměnné (intervalové, ordinální,nominální) Čím nižší úroveň měření, tím větší vzorek je potřeba např. při užití neparametrických testů by vzorek měl být cca 10x větší, než je počet políček v kontingenční tabulce Velikost vzorku nutno podřídit té nejnižší úrovní měření (4) Jaké podskupiny vzorku hodláme analyzovat (souvisí s body 2+3) Chceme-li analyzovat podskupiny, rozšiřujeme vzorek Důležitá = velikost nejmenší podskupiny Obecné pravidlo: nejmenší podskupina by měla mít alespoň 50 jedinců (5) Kolik peněz to vše má stát Faktická velikost vzorku bývá kompromisem mezi metodologickými požadavky a dostupnými (finančními) zdroji.