Analýza dat z dotazníkových šetření



Podobné dokumenty
ADDS cvičení 7. Pavlína Kuráňová

Seminář 6 statistické testy

Příklad: Test nezávislosti kategoriálních znaků

Jana Vránová, 3. lékařská fakulta UK

Stav Svobodný Rozvedený Vdovec. Svobodná Rozvedená Vdova 5 8 6

Seminář 6 statistické testy

PSY117/454 Statistická analýza dat v psychologii Přednáška 10

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

Test dobré shody v KONTINGENČNÍCH TABULKÁCH

Statistické metody uţívané při ověřování platnosti hypotéz

Testy dobré shody Máme dvě veličiny, u kterých bychom chtěli prokázat závislost, TESTY DOBRÉ SHODY (angl. goodness-of-fit tests)

Opakování: Nominální proměnná více hodnotová odpověď.

Opakování: Nominální proměnná více hodnotová odpověď.

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Vysoká škola báňská technická univerzita Ostrava. Fakulta elektrotechniky a informatiky

4ST201 STATISTIKA CVIČENÍ Č. 7

Statistika. Semestrální projekt

UNIVERZITA OBRANY Fakulta ekonomiky a managementu. Aplikace STAT1. Výsledek řešení projektu PRO HORR2011 a PRO GRAM

5 Vícerozměrná data - kontingenční tabulky, testy nezávislosti, regresní analýza

IBM SPSS Exact Tests. Přesné analýzy malých datových souborů. Nejdůležitější. IBM SPSS Statistics

You created this PDF from an application that is not licensed to print to novapdf printer (

Testy dobré shody TESTY DOBRÉ SHODY (angl. goodness-of-fit tests), : veličiny X, Y jsou nezávislé nij eij

ADDS cviceni. Pavlina Kuranova

Příklady na testy hypotéz o parametrech normálního rozdělení

Kontingenční tabulky, korelační koeficienty

11. cvičení z PSI prosince hodnota pozorovaná četnost n i p X (i) = q i (1 q), i N 0.

Název testu Předpoklady testu Testová statistika Nulové rozdělení. ( ) (p počet odhadovaných parametrů)

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

KGG/STG Statistika pro geografy

12. cvičení z PST. 20. prosince 2017

Příklad 1. Korelační pole. Řešení 1 ŘEŠENÉ PŘÍKLADY Z MV2 ČÁST 13

Přednáška X. Testování hypotéz o kvantitativních proměnných

Cvičení ze statistiky - 8. Filip Děchtěrenko

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Testování hypotéz. Analýza dat z dotazníkových šetření. Kuranova Pavlina

Sociálně-ekologické a psychologické dopady Jaderné elektrárny Temelín na obyvatelstvo. (Především pak) dotazníkový průzkum

Jana Vránová, 3.lékařská fakulta UK, Praha. Hypotézy o populacích

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

TESTOVÁNÍ HYPOTÉZ STATISTICKÁ HYPOTÉZA Statistické testy Testovací kritérium = B B > B < B B - B - B < 0 - B > 0 oboustranný test = B > B

Testování statistických hypotéz

Základy biostatistiky II. Veřejné zdravotnictví 3.LF UK - II

Statistické testování hypotéz II

Tomáš Karel LS 2012/2013

P íloha č. 1: Dotazník Volnočasové aktivity

Fisherův exaktní test

II. Statistické metody vyhodnocení kvantitativních dat Gejza Dohnal

Testování hypotéz a měření asociace mezi proměnnými

TECHNICKÁ UNIVERZITA V LIBERCI

Tomáš Karel LS 2012/2013

Program Statistica Base 9. Mgr. Karla Hrbáčková, Ph.D.

Normální (Gaussovo) rozdělení

Cvičení ze statistiky - 9. Filip Děchtěrenko

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Testování hypotéz. 1 Jednovýběrové testy. 90/2 odhad času

Tomáš Karel LS 2012/2013

{ } ( 2) Příklad: Test nezávislosti kategoriálních znaků

4EK211 Základy ekonometrie

Testy nezávislosti kardinálních veličin

KONTINGENČNÍ TABULKY Komentované řešení pomocí programu Statistica

ANALÝZA DAT V R 7. KONTINGENČNÍ TABULKA. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

1 Cíl a oblast výzkumu

TECHNICKÁ UNIVERZITA V LIBERCI

1.1 Úvod Data Statistická analýza dotazníkových dat 8. Literatura 10

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

4EK211 Základy ekonometrie

Pravděpodobnost a matematická statistika

Příloha č. 6 Výsledky statistického vyhodnocení dat EVALUACE PROJEKTU VZDĚLÁVEJTE SE PRO RŮST! PRACOVNÍ PŘÍLEŽITOSTI CZ.1.04/2.1.00/03.

Návod na statistický software PSPP část 2. Kontingenční tabulky

MÍRY ZÁVISLOSTI (KORELACE A REGRESE)

Regresní a korelační analýza

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D. 1

Kontingenční tabulky, korelační koeficienty

Testy statistických hypotéz

TECHNICKÁ UNIVERZITA V LIBERCI EKONOMICKÁ FAKULTA

PRAVDĚPODOBNOST A STATISTIKA

= = 2368

JEDNOVÝBĚROVÉ TESTY. Komentované řešení pomocí programu Statistica

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Normální (Gaussovo) rozdělení

Sociologický ústav Akademie věd ČR Jilská 1, , Praha 1

Regresní a korelační analýza

Jste aktivní sportovec?(pravidelně sportuji alespoň 2x týdně) Jakým sportovním činnostem se pravidelně věnujete? (alespoň 1 x za dva týdny v sezóně)

Úkol 1.: Testování nezávislosti nominálních veličin V roce 1950 zkoumali Yule a Kendall barvu očí a vlasů u 6800 mužů.

LEKCE 7 ZÁKLADY BIVARIAČNÍ ANALÝZY

PSY117/454 Statistická analýza dat v psychologii seminář 9. Statistické testování hypotéz

Zápočtová práce STATISTIKA I

SEMINÁRNÍ PRÁCE Analýza kvantitativních dat II. Děti a závislost četby na jejich prospěchu. Revize (opravy a poznámky) Jiří Šafr

Testování hypotéz. 4. přednáška

Jana Zapletalová, Kateřina Langová

Zpracování náhodného vektoru. Ing. Michal Dorda, Ph.D.

Cvičení 12: Binární logistická regrese

Přednáška č. 1.: Tabulkové a grafické zpracování vícerozměrných dat

Testování statistických hypotéz. Ing. Michal Dorda, Ph.D.

Pravděpodobnost a statistika, Biostatistika pro kombinované studium. Tutoriál č. 5: Bodové a intervalové odhady, testování hypotéz.

Přednáška 10. Analýza závislosti

Přednáška 9. Testy dobré shody. Grafická analýza pro ověření shody empirického a teoretického rozdělení

Transkript:

Analýza dat z dotazníkových šetření Cvičení 6. Rozsah výběru Př. Určete minimální rozsah výběru pro proměnnou věk v souboru dovolena, jestliže 95% interval spolehlivost průměru proměnné nemá být širší než 2 roky. Předpokládejme, že směrodatná odchylka Síla testu je pravděpodobnost, s jakou odhalíme statisticky významný rozdíl při platnosti alternativní hypotézy. Jestliže je síla testu příliš nízká, je malá pravděpodobnost odhalení signifikantního rozdílu, i když reálně existuje. Nízkou sílu testu často způsobuje nedostatečný rozsah výběru. Př.: Určeme minimální potřebný rozsah výběru pro provedení jednostranného testu, jestliže = 0,25; = 0,15; α = 0,05; 1 - β = 0,9. ( ( ) ( )) ( ( ) ( )) ( ) ( ) ( )

Analýza závislostí: - Kontingenční tabulka X/Y y 1 y 2 y S celkem x 1 n 11 n 12 n 1S n 10 x 2 n 21 n 22 n 2S n 20 X R n R1 n R2 n RS n R0 celkem n 01 n 02 n 0S N R počet řádků tabulky S počet sloupců tabulky N celkový počet prvků souboru n 01 až n 0S a n 10 až n R0 MARGINÁLNÍ ČETNOSTI (rozdělení znaků X a Y). K analyzování závislostí v kontingenční tabulce se využívá chí-kvadrát test (podle očekávaných četností) Popis testu: Předpokládáme, že jedny z marginálních četností (řádkové nebo sloupcové) jsou pevně dány. Provádíme výběr jednotek z několika populací a u každé statistické jednotky zjišťujeme hodnotu jediného nominálního znaku. Zajímá nás, zda jsou pravděpodobnosti výskytu jednotlivých hodnot ve všech populacích stejné. Hypot_ezy Hypotézy: H 0 : všechny řádky (sloupce) pocházejí ze stejné populace, ekvivalentně: relativní četnosti v každém řádku (sloupci) jsou stejné. Předpoklady testu: - Alespoň 80% očekávaných četností musí být větších než 5. - Všechny očekávané četnosti musí být větší než 1. - Nejsou-li předpoklady splněny, používají se tzv. exaktní testy. Př. Vraťme se k souboru dovolená, analyzujte závislost proměnných, Máte děti a Jste? H 0 : proměnné Máte děti a Jste jsou nezávislé - Ruční výpočet viz přednáška, popř. doporučená literatura k předmětu: ( ) ( ) ( ) ( ) ( ) ( ) ( )

( ) ( ( ) ( )) Při testování na 5% hladině významnosti vypočtenou hodnotu statistiky, resp., porovnáváme s kvantilem [( )( )] [ ] Výpočet viz SPSS: Transform Compute Variable IDF.CHISQ(0.95,2) = 5,99 V obou případech jsme získali hodnotu mnohem vyšší než je vypočtená kritická hodnota. Zamítáme nulovou hypotézu. Kompletní výpočet pomocí SPSS: Rows: Máte děti Culomns: jste Statistics: Chi-square Zaškrtnout: Display cluster bar charts Máte děti? * Jste? Crosstabulation Count Jste? muž žena Total Máte děti? ano - 1 4 9 13 ano - 2-3 14 3 17 nemám 27 45 72 Total 45 57 102 df Chi-Square Tests Máte děti? * Jste? Crosstabulation Expected Count Jste? muž žena Total Máte děti? ano - 1 5,7 7,3 13,0 ano - 2-3 7,5 9,5 17,0 nemám 31,8 40,2 72,0 Total 45,0 57,0 102,0 Asymp. Sig. (2- sided) Pearson Chi-Square 12,299 a 2,002 Likelihood Ratio 12,830 2,002 a. 0 cells (0,0%) have expected count less than 5. The minimum expected count is 5,74. Závěr: Zamítáme nulovou hypotézu o nezávislosti proměnných.

Př. Vraťme se k souboru dovolená, analyzujte závislost proměnných, Kde nejčastěji trávíte dovolenou a Jaký typ ubytování preferujete? H 0 : proměnné Kde nejčastěji trávíte dovolenou a Jaký typ ubytování preferujete jsou nezávislé Rows: Kde nejčastěji trevite dovolenou Culomns: Jaky typ ubytovani preferujete Statistics: Chi-square Zaškrtnout: Display cluster bar charts Count Kde nejčastěji trávíte dovolenou? * Jaký typ ubytování preferujete? Crosstabulation Jaký typ ubytování preferujete? hostely/hotely hotel hotel 4* apartmán/mobilhome 2* a méně 3* a více jiné vlastní Total Kde nejčastěji v ČR (včetně trávíte chalupaření) 13 1 7 9 3 6 39 dovolenou? v zahraničí 12 4 24 19 3 1 63 Total 25 5 31 28 6 7 102 Chi-Square Tests df Asymp. Sig. (2- sided) Pearson Chi-Square 13,400 a 5,020 Likelihood Ratio 13,738 5,017 a. 6 cells (50,0%) have expected count less than 5. The minimum expected count is 1,91. Závěr: nelze rozhodnout o výsledku testu 6 buněk 50% očekávaných četností je menších než 5. Nejsou splněny předpoklady testu.

Př.: Charakterizujme vztah proměnných Máte děti a jste pomocí symetrických koeficientů. Symetrické koeficienty (Pearsonův kontingenční koeficient, koeficient fí, Cramérovo V). V případě nezávislosti nabývají koeficienty hodnoty 0. Pomocí SPSS: Rows: Máte děti Culomns: jste Statistics: Contingency coeficient s Phi and Cramér s Symmetric Measures Approx. Sig. Nominal by Nominal Phi,347,002 Cramer's V,347,002 Contingency Coefficient,328,002 Výstupem je i minimální hladina významnosti, od které zamítáme nulovou hypotézu o nezávislosti proměnných (sloupec Approx.Sig.). Můžeme tedy říct, že ve všech případech usuzujeme na závislost mezi proměnnými Máte děti a Jste a to jak na 5%, tak i na 1% hladině významnosti.