ÚKOL 2 1886 22 5,77 5,00 5 2,531,003,056 -,869,113



Podobné dokumenty
LEKCE02a ANALÝZA ROZLOŽENÍ KATEGORIZOVANÝCH DAT vzorový výsledek cvičení

Jste aktivní sportovec?(pravidelně sportuji alespoň 2x týdně) Jakým sportovním činnostem se pravidelně věnujete? (alespoň 1 x za dva týdny v sezóně)

Opakování: Nominální proměnná více hodnotová odpověď.

LEKCE03 PŘÍKLAD NORMALITA ROZLOŽENÍ A Z SKÓRY; ZOBECŇOVÁNÍ VÝBĚROVÝCH VÝSLEDKŮ NA ZÁKLADNÍ SOUBOR 95 % 68 %

Opakování: Nominální proměnná více hodnotová odpověď.

Lekce 2 ZÁKLADY UNIVARIAČNÍ ANALÝZY A) ROZLOŽENÍ KATEGORIZOVANÝCH DAT

Zpracování studie týkající se průzkumu vlastností statistických proměnných a vztahů mezi nimi.

LEKCE 02a UNIVARIAČNÍ ANALÝZA KATEGORIZOVANÝCH DAT

Metodologie pro ISK II

LEKCE 3 NORMÁLNÍ A STANDARDIZOVANÉ NORMÁLNÍ ROZLOŽENÍ

Seminář 6 statistické testy

1. Kategoriální proměnná nominální: (Tabulka a graf četností) Př.: sloupec (PokudanoJakčasto) -> Analyze -> Descriptive statistics -> Frequencies

Seminář 6 statistické testy

LEKCE 6 ZÁKLADY TESTOVÁNÍ HYPOTÉZ

Návrhy dalších možností statistického zpracování aktualizovaných dat

Analýza dat na PC I.

Přednáška č. 1.: Tabulkové a grafické zpracování vícerozměrných dat

Stav Svobodný Rozvedený Vdovec. Svobodná Rozvedená Vdova 5 8 6

Návod pro práci s SPSS

Ústav matematiky Fakulta chemicko inženýrská Vysoká škola chemicko-technologická v Praze

Datový soubor X1 1, 5, 7, 8, 9, 10, 11, 12, 12.5, 13, 14, 15, 16, 17, 18, 20, 24

LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR

8 ANALÝZA ČASOVÝCH ŘAD SEZÓNNÍ SLOŽKA

Analýza variance (ANOVA) - jednocestná; faktor s pevným efektem; mnohonásobná srovnání

Pomůcka pro cvičení: 3. semestr Bc studia

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc. dohnal@nipax.cz

Uni- and multi-dimensional parametric tests for comparison of sample results

Testování hypotéz. Testování hypotéz o rozdílu průměrů t-test pro nezávislé výběry t-test pro závislé výběry

Analýza dat z dotazníkových šetření. Zdrojová data: dotazník

ADDS cviceni. Pavlina Kuranova

Přednáška 5. Výběrová šetření, Exploratorní analýza

ANALÝZA DAT V R 2. POPISNÉ STATISTIKY. Mgr. Markéta Pavlíková Katedra pravděpodobnosti a matematické statistiky MFF UK.

Analýza dat z dotazníkových šetření

Pravděpodobnost a matematická statistika Doc. RNDr. Gejza Dohnal, CSc.

Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy

VŠB Technická univerzita Ostrava

Testování hypotéz. 1. vymezení základních pojmů 2. testování hypotéz o rozdílu průměrů 3. jednovýběrový t-test

Manuál pro analýzu dat v softwaru SPSS

Metodologie pro Informační studia a knihovnictví 2

Obsah. Pracovní soubory ke stažen í 11. Předm luva 13. Úvod 15. O program u 19. Soubory 31. Případy 61. Před analýzou dat 30

VŠB Technická univerzita Ostrava BIOSTATISTIKA

POPISNÁ STATISTIKA Komentované řešení pomocí programu Statistica

Deskriptivní statistika (kategorizované proměnné)

Karta předmětu prezenční studium

LEKCE12 FAKTOROVÁ ANALÝZA vzorový výsledek cvičení

TECHNICKÁ UNIVERZITA V LIBERCI

Metodologie pro Informační studia a knihovnictví 2

Testy nezávislosti kardinálních veličin

6 TESTY HYPOTÉZ NEPARAMETRICKÉ TESTY

Shluková analýza dat a stanovení počtu shluků

Vymezení důležitých pojmů. nulová hypotéza, alternativní hypotéza testování hypotézy hladina významnosti (alfa) chyba I. druhu, chyba II.

Statgraphics v. 5.0 STATISTICKÁ INDUKCE PRO JEDNOROZMĚRNÁ DATA. Martina Litschmannová 1. Typ proměnné. Požadovaný typ analýzy

MULTIFAKTOROVÁ ANALÝZA DOPRAVNÍ NEHODOVOSTI

Aplikovaná statistika v R

Popisná statistika. úvod rozdělení hodnot míry centrální tendence míry variability míry šikmosti a špičatosti grafy

TEPELNÁ ZÁTĚŽ, TEPLOTNÍ REKORDY A SDĚLOVACÍ PROSTŘEDKY

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Transformace dat: používání syntaxe v SPSS

Statistika. Diskrétní data. Spojitá data. Charakteristiky polohy. Charakteristiky variability

Matematika III. 27. listopadu Vysoká škola báňská - Technická univerzita Ostrava. Matematika III

Základy pravděpodobnosti a statistiky. Popisná statistika

Příklad 2: Určení cihlářských surovin na základě chemické silikátové analýzy

OPTIMALIZACE PŘIJÍMACÍHO ŘÍZENÍ 2008/09

PŘÍLOHA 2. Těším se na spolupráci, Olga Kučerová (studentka psychologie, PedF Cuni)

LEKCE 7 ZÁKLADY BIVARIAČNÍ ANALÝZY

AKDII. - Seminární práce. revize Jiří Šafr (6/2/2014) Sociologie volného času

(motto: An unsophisticated forecaster uses statistics as a drunken man uses lamp-posts - for support rather than for illumination.

Příloha 1 Úvodní text k dotazníku

Statistická analýza volebních výsledk

TECHNICKÁ UNIVERZITA V LIBERCI. Ekonomická fakulta. Semestrální práce. Statistický rozbor dat z dotazníkového šetření školní zadání

1.1 Dva základní typy statistiky Popisná statistika (descriptive statistics) Inferenční statistika (inferential statistics)

TECHNICKÁ UNIVERZITA V LIBERCI EKONOMICKÁ FAKULTA

Mgr. Karla Hrbáčková, Ph.D. Základy kvantitativního výzkumu

Statistická analýza dat v psychologii

Porovnání dvou výběrů

Metodologie pro Informační studia a knihovnictví 2

Univerzita Pardubice Chemicko-technologická fakulta Katedra analytické chemie

MATEMATICKÁ STATISTIKA - XP01MST

Kapitola IV. DESATERO PRO POROVNÁVÁNÍ VÝSLEDKŮ DVOU METOD. Luděk Dohnal. Desatero pro porovnávání výsledků dvou metod 21

Příprava souboru dat a analýza

Matematická statistika

C V I Č E N Í ZE STATISTIKY PRO BIOLOGY:

ADDS cvičení 7. Pavlína Kuráňová

6. Lineární regresní modely

Metodologie pro Informační studia a knihovnictví 2

Statistika. Program R. popisná (deskriptivní) statistika popis konkrétních dat. induktivní (konfirmatorní) statistika. popisná statistika

Semestrální projekt. do předmětu Statistika. Vypracoval: Adam Mlejnek Oponenti: Patrik Novotný Jakub Nováček Click here to buy 2

Korelační a regresní analýza. 1. Pearsonův korelační koeficient 2. jednoduchá regresní analýza 3. vícenásobná regresní analýza

Obsah. Statistika Zpracování informací ze statistického šetření Charakteristiky úrovně, variability a koncentrace kvantitativního znaku

Pokud data zadáme přes "Commands" okno: SDF1$X1<-c(1:15) //vytvoření řady čísel od 1 do 15 SDF1$Y1<-c(1.5,3,4.5,5,6,8,9,11,13,14,15,16,18.

Kurz SPSS: Jednoduchá analýza dat. Jiří Šafr

Me neˇ nezˇ minimum ze statistiky Michaela S ˇ edova KPMS MFF UK Principy medicı ny zalozˇene na du kazech a za klady veˇdecke prˇı pravy 1 / 33

Teorie časových řad Test 2 Varianta A HODNOCENÍ (max. 45 bodů z 50 možných)

1. SEZNAM PŘÍLOH. Příloha 1 Vyjádření žádosti etické komise. Příloha 2. Informovaný souhlas. Příloha 3 Anamnestický dotazník

Metodologie pro ISK 2, jaro Ladislava Z. Suchá

Statistika v současnosti

Pracovní text a úkoly ke cvičením MF002

STATISTIKA MIGRANTŮ PRO REGIONY V MORAVSKOSLEZSKÉM KRAJI A PRO KRAJ V OBDOBÍ

Organizační pokyny k přednášce. Matematická statistika. Přehled témat. Co je statistika?

TESTOVÁNÍ ZNALOSTÍ STŘEDOŠKOLSKÉ FYZIKY U STUDENTŮ 1.ROČNÍKŮ LÉKAŘSKÝCH FAKULT V ČR

Transkript:

ÚKOL 2 Jméno a příjmení: UČO: Imatrik. ročník: Úkol 2.1: V souboru EVS99_cvicny.sav zjistěte, zdali rozložení názoru na to, kdo by měl být odpovědný za zajištění bydlení (proměnná q54h), je normální. Řešte graficky i početně. Řešení: Analyze Descriptive statistics Frequencies Statistics Za bydlení má být zodpovědný: N Valid Missing Mean Median Mode Std. Deviation Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis 1886 22 5,77 5,00 5 2,531,003,056 -,869,113 Hodnoty šikmosti a špičatosti nejsou příliš vzdáleny od 0, tudíž existuje pravděpodobnost, že rozložení této proměnné bude normální. To si ověříme spočítáním z-skórů pomocí směrodatné odchylky šikmosti a špičatosti. Z-skór šikmosti vyšel 0,05, tj. nižší než 2, z-skór špičatosti je však - 2,8, jeho hodnota je vyšší než 2. Z toho lze vyvodit, že šikmost sice odpovídá normálnímu rozložení, ale naše rozdělení je plošší než normální. 500 Za bydlení má být zodpovědný: 400 300 200 Frequency 100 0 1 2 3 4 5 6 7 8 9 10 Std. Dev = 2,53 Mean = 6 N = 1943,82 Za bydlení má být zodpovědný: Cases weighted by VAHA

Okometricky podle grafu proloženého křivkou normálního rozložení neodpovídá naše rozložení zcela Gaussově křivce, i když od ní není příliš vzdáleno. Analyze descriptive statistics explore Za bydlení má být zodpovědný: Tests of Normality Kolmogorov-Smirnov a Statistic df Sig. a. Lilliefors Significance Correction,123 1886,000 Kolmogorov Smirnovův test nám vyšel signifikantní Sig < 0,05, což nám říká, že existuje rozdíl mezi naším rozdělením a rozdělením normálním (zamítáme nulovou hypotézu o neexistenci rozdílu). Podle tohoto testu není naše rozdělení normální. Jelikož však máme velký soubor (mnoho respondentů), je tento test velmi citlivý na jakékoliv odchylky a lze ho pominout. Normal Q-Q Plot of Za bydlení má být zodpovědný: 2 1 Expected Normal 0-1 -2 0 2 4 6 8 10 Observed Value Cases weighted by weight

Tento graf srovnávající naše rozdělení s normálním nám ukazuje, že se rozdělení proměnné q54h se příliš neliší od normálního rozdělení pozorované hodnoty jsou téměř všechny na přímce. Detrended Normal Q-Q Plot of Za bydlení má být zodpovědný: 0,20 0,15 Dev from Normal 0,10 0,05 0,00-0,05-0,10 0 2 4 6 8 10 Observed Value Cases weighted by weight Zde naše hodnoty nevytvářejí shluky a jsou poměrně blízko přímce (hodnoty na ose y jsou malé) jako by tomu mělo být u normálního rozložení. U rozložení proměnné q54h existují určité odchylky od normálního rozdělení, ale celkově ze všech testů můžeme říci, že tyto odchylky nejsou příliš velké a naše rozložení se normálnímu podobá. Proto bychom si při další analýze mohli počínat, jako by se jednalo o normální rozložení. Úkol 2.2: Popište všechny základní charakteristiky věkového rozložení (proměnná vek) v tomto souboru a uveďte, která hodnota věku odděluje 20% nejstarších respondentů. [V souboru EVS99_cvicny.sav by měla být proměnná vek již vytvořena (zjistíte to ve variable view), ale pokud není, budete si ji muset nejdříve vytvořit. Jelikož se jedná o proceduru transformace dat, kterou ještě neumíte, dáme vám nyní návod, jak na to. Využijeme k tomu příkazu syntaxe: COMPUTE vek = 99-rok_nar. EXECUTE. Tento příkaz říká, že abychom vytvořili novou proměnnou vek, musíme hodnoty proměnné rok narození (rok_nar), který je v datech zaznamenán jako poslední dvojčíslí, odečíst od roku, kdy byl

proveden výzkum EVS (což bylo v roce 1999 a my musíme ve výpočtu použít opět pouze poslední dvojčíslí, aby měl výpočet smysl, tedy údaj 99). Co s tím? Nyní dejte SPSS příkaz (předpokládám, že již máte otevřený datový soubor EVS99_cvicny.sav), aby otevřel nové okno, okno pro práci se syntaxem: File New Syntax Do tohoto okna vkopírujte příkaz pro výpočet věku: COMPUTE vek = 99-rok_nar. EXECUTE. V tomto syntaxovém okně pak klikněte na lištu Run a pak na příkaz All. Příkaz se provede a vám se na konci matice objeví sloupec s novou proměnnou vek. Proměnnou vek lze vytvořit i v datovém souboru (bez syntaxe) pomocí příkazu Transform Compute Target variable = vek, Numeric expression = 99-rok_nar. Tuto proměnnou si můžeme dále nadefinovat (label apod.) ve variable view.] Řešení: Analyze descriptive statistics explore Descriptives vek Mean 95% Confidence Interval for Mean Lower Bound Upper Bound Statistic Std. Error 45,6766,38611 44,9194 46,4339 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis 45,4578 45,0000 283,610 16,84074 17,00 88,00 71,00 28,00,142,056-1,030,112 Průměrný věk v našem výběrovém souboru je 46 let. S 95% spolehlivostí můžeme říci, že v základním souboru se průměrný věk pohybuje mezi 45 a 46 lety. Odlehlé hodnoty na průměr nemají vliv, protože ořezaný průměr je téměř shodný s průměrem pro celý soubor. Medián, který náš soubor půlí, dosahuje hodnoty 45. Směrodatná odchylka, která nám ukazuje míru variability je 17. Z ní lze spočítat variační koeficient (vydělíme ji průměrem), který nám vyjde 0,36, tj. 36 %. To

znamená, že rozložení souboru je poměrně široké a hodnoty se nepohybují jen těsně kolem průměru. Minimální věk v našem souboru je 17 a maximální 88 let. Šikmost i špičatost jsou poměrně nízké, z- skór šikmosti je 2,5 a z-skór špičatosti je 3. Rozložení věku tudíž není normální, což nám ukazuje i graf proložený normální křivkou 300 VEK 200 100 Frequency 0 18 28 38 48 23 33 43 58 68 78 53 63 73 83 88 Std. Dev = 17,46 Mean = 48 N = 1959,19 VEK Cases weighted by VAHA Analyze descriptive statistics frequencies percentils - 80 Statistics vek N Mean Median Mode Std. Deviation Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Percentiles Valid Missing 80 1902 6 45,6766 45,0000 18,00 16,84074,142,056-1,030,112 63,0000 Nejstarších 20 % respondentů je ve věkové kategorii nad 63 let. Úkol 2.3: Znázorněte graficky pro jednotlivé vzdělanostní kategorie (proměnná vzdelani) tak, abyste mohli porovnat jejich věkové mediány a interkvartilové rozpětí. Která z nich má nejvyšší medián a která největší interkvartilové rozpětí?

Řešení: Buď Split file compare groups vzdelani A pak : Analyze descriptive statistics explore vek Tím uděláme analýzu věku a vykreslí se nám boxplot pro jednotlivé kategorie vzdělání, z nějž je možné přečíst medián a interkvartilové rozpětí. Nebo Graphs Boxplot Simple Summaries for groups of cases Define Variable = vek, Category axis = vzdelani. V tom případě se nám vykreslí jeden obrázek s boxploty jednotlivých věkových kategorií jako je dole. 80,00 60,00 vek 40,00 20,00 základní vyučen SŠ VŠ kategorizace q94 Cases weighted by weight Nejvyšší věkový medián má kategorie se základním vzděláním: 45,8 let. Největší interkvartilové rozpětí má také kategorie se základním vzděláním: 37 let.