Metodologie pro Informační studia a knihovnictví

Podobné dokumenty
Metodologie pro Informační studia a knihovnictví 2

Metodologie pro Informační studia a knihovnictví 2

Metodologie pro Informační studia a knihovnictví 2

Návod pro práci s SPSS

LEKCE 5: UMĚLÉ PROMĚNNÉ

Metodologie pro ISK 2, jaro Ladislava Z. Suchá

Metodologie pro Informační studia a knihovnictví 2

Metodologie pro Informační studia a knihovnictví 2

1. Kategoriální proměnná nominální: (Tabulka a graf četností) Př.: sloupec (PokudanoJakčasto) -> Analyze -> Descriptive statistics -> Frequencies

Excel mini úvod do kontingenčních tabulek

Analýza dat z dotazníkových šetření. Zdrojová data: dotazník

Excel tabulkový procesor

StatSoft Jak vyzrát na datum

Metodologie pro Informační studia a knihovnictví 2

Kategorická data METODOLOGICKÝ PROSEMINÁŘ II TÝDEN 7 4. DUBNA dubna 2018 Lukáš Hájek, Karel Höfer Metodologický proseminář II 1

KAPITOLA 9 - POKROČILÁ PRÁCE S TABULKOVÝM PROCESOREM

Evidence technických dat

KAPITOLA 11 - POKROČILÁ PRÁCE S TABULKOVÝM PROCESOREM

Vzorce. StatSoft. Vzorce. Kde všude se dá zadat vzorec

II. Vzorce v Excelu Tipy pro práci s Wordem Kontingenční tabulky v Excelu, 1. část

Spokojenost se životem

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

Zdokonalování gramotnosti v oblasti ICT. Kurz MS Excel kurz 3. Inovace a modernizace studijních oborů FSpS (IMPACT) CZ.1.07/2.2.00/28.

STATISTICA Téma 1. Práce s datovým souborem

Obsah Úvod Kapitola 1 Než začneme Kapitola 2 Práce s hromadnými daty před analýzou

Inovace výuky prostřednictvím ICT v SPŠ Zlín, CZ.1.07/1.5.00/ Vzdělávání v informačních a komunikačních technologií

Základy práce s databázemi

Excel tabulkový procesor

Nový způsob práce s průběžnou klasifikací lze nastavit pouze tehdy, je-li průběžná klasifikace v evidenčním pololetí a školním roce prázdná.

HROMADNÉ ÚPRAVY NAJÍT A NAHRADIT

Postup: Nejprve musíme vyplnit tabulku. Pak bude vypadat takto:

František Hudek. červenec 2012

Metodologie pro ISK II

MANUÁL K PROGRAMU JEDNODUCHÝ SKLAD (VER-1.2)

2. popis prostředí, nastavení pracovní plochy

Dotazy tvorba nových polí (vypočítané pole)

Databázové systémy Cvičení 5.2

Vytvoření uživatelské šablony

KONTINGENČNÍ TABULKY CO TO JE

soubor dat uspořádaných do řádků a sloupců

Necht tedy máme přirozená čísla n, k pod pojmem systém lineárních rovnic rozumíme rovnice ve tvaru

Střední škola informačních technologií a sociální péče, Brno, Purkyňova 97. Vybrané části Excelu. Ing. Petr Adamec

Logické proměnné a logické funkce

KIV/ZIS cvičení 5. Tomáš Potužák

PSANÍ VZORCŮ A ROVNIC

Excel 2007 praktická práce

Seznam funkcí pro kurz EXCEL I. Jaroslav Nedoma

Protokol č. 1. Tloušťková struktura. Zadání:

Řazení, filtrování a seskupování, vlastní zobrazení

Microsoft Office. Excel vyhledávací funkce

Microsoft Excel. Základní operace s buňkami. Formát buňky

František Hudek. květen 2012

T6: Program MS Excel II. (standard) Určeno pro získání standardní úrovně znalostí (2 4 hodiny)

STATISTIKA 1. Adam Čabla Katedra statistiky a pravděpodobnosti VŠE

Gymnázium Jana Pivečky a Střední odborná škola Slavičín. III/2 - Inovace a zkvalitnění výuky prostřednictvím ICT

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

Deskriptivní statistika (kategorizované proměnné)

Microsoft Access. Typy objektů databáze: Vytvoření a návrh nové tabulky. Vytvoření tabulky v návrhovém zobrazení

Excel tabulkový procesor

4. Vzorce v Excelu Tipy pro práci s Wordem Kontingenční tabulky v Excelu

Aplikovaná statistika v R

Lineární algebra - I. část (vektory, matice a jejich využití)

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

VYHODNOCOVÁNÍ KVANTITATIVNÍCH DAT (ÚVOD DO PROBLEMATIKY) Metodologie pro ISK

Role statistiky ve výzkumu

Cílem této kapitoly je uvedení pojmu matice a jejich speciálních typů. Čtenář se seznámí se základními vlastnostmi matic a s operacemi s maticemi

Výrobní produkce divizí Ice Cream Po lo ha plane t Rozložený výse ový 3D graf Bublinový graf Histogram t s tn e ídy

Školení obsluhy PC stručný manuál obsluhy pro používání PC

Řešení. ŘEŠENÍ 36 Výsledková listina soutěže

Sběr a administrace dat Online dotazníky Metodologie ISK,

Microsoft Excel 2010 pokročilé metody a funkce

Excel - pokračování. Př. Porovnání cestovních kanceláří ohraničení tabulky, úprava šířky sloupců, sestrojení grafu

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

Vzorce. Suma. Tvorba vzorce napsáním. Tvorba vzorců průvodcem

2. Numerické výpočty. 1. Numerická derivace funkce

Cvičení ze statistiky - 7. Filip Děchtěrenko

EXCELentní tipy a triky pro mírně pokročilé. Martina Litschmannová

STATISTICA Téma 6. Testy na základě jednoho a dvou výběrů

Import a export dat EU peníze středním školám Didaktický učební materiál

Hromadná korespondence

4. Vzorce v Excelu Tipy pro práci s Wordem Kontingenční tabulky v Excelu

Mgr. et Mgr. Jan Petrov, LL.M. Ph.D. BYZNYS A PRÁVO

Obr. P1.1 Zadání úlohy v MS Excel

5EN306 Aplikované kvantitativní metody I

Vzorová písemka č. 1 (rok 2015/2016) - řešení

Tabulkový kalkulátor. Tabulkový kalkulátor. LibreOffice Calc 12.část

Manuál: Editace textů v textovém editoru SINPRO Úprava tabulek a internetových odkazů, řádkování

Základní vzorce a funkce v tabulkovém procesoru

Registrační číslo projektu: CZ.1.07/1.5.00/ Elektronická podpora zkvalitnění výuky CZ.1.07 Vzděláním pro konkurenceschopnost

Tvar dat a nástroj přeskupování

Maticí typu (m, n), kde m, n jsou přirozená čísla, se rozumí soubor mn veličin a jk zapsaných do m řádků a n sloupců tvaru:

Algoritmizace a programování

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

VZORCE A VÝPOČTY. Autor: Mgr. Dana Kaprálová. Datum (období) tvorby: září, říjen Ročník: sedmý

Téma 9: Vícenásobná regrese

Škály podle informace v datech:

Aplikované úlohy Solid Edge. SPŠSE a VOŠ Liberec. Radek Havlík [ÚLOHA 30 KUSOVNÍK]

Číselné charakteristiky

Transkript:

Metodologie pro Informační studia a knihovnictví Transformace proměnných Co se dozvíte v tomto modulu? Jak vytvořit novou proměnnou pomocí rekódování? Jak vytvořit novou proměnnou pomocí aritmetických operací? Jak vytvořit novou proměnnou pomocí sčítání výskytů hodnot proměnné? Jak vytvořit novou proměnnou pomocí seřazení položek? Obsah Vytváření nových proměnných... 2 Rekódování... 2 Aritmetické operace... 5 Aritmetické operace v Excelu... 6 Aritmetické operace v SPSS... 6 Sčítání výskytů... 7 Sčítání výskytů v Excelu... 7 Sčítání výskytů v SPSS... 8 Seřazení položek... 9 Seřazení položek v Excelu... 9 Seřazení položek v SPSS... 10

Vytváření nových proměnných Při analýze někdy potřebujeme zjistit a využít proměnné, které v dotazníku přímo nezkoumáme, ale můžeme si je snadno vytvořit z existujících proměnných. Například pro srozumitelnější analýzu může být výhodné kategorizovat si věkové skupiny. Nebo chceme z proměnné rok narození vytvořit srozumitelnější proměnnou věk. Obecně se s proměnnými dá dělat řada jednoduchých operací, my budeme využívat především: rekódování, aritmetické operace, kategorizace dle percentilů, sčítání výskytů, seřazení položek. POZOR!!! Nové proměnné vždy vytváříme do nového sloupce tak, abychom neztratili původní proměnné, kdybychom je ještě k něčemu potřebovali. Rekódování Rekódování nahrazuje kódy hodnot proměnných jinými kódy. Lze jej využít pro vytváření obecnějších kategorií u nominálních, ordinálních i kardinálních proměnných. Rekódování využíváme i pro otočení škály otázky (ve složitějších dotaznících bývají některé škály otočené, abychom udrželi respondentovu pozornost při výsledné analýze, kdy vytváříme sumační indexy, je nutné reorientovat škály tak, aby byly všechny orientované jedním směrem). Speciální příklad rekódování může být kategorizace dle percentilů. Ta nám umožní rozdělit respondenty na X stejně velkých skupin dle hodnot námi zvolené proměnné například podle výše příjmů nebo dle věku (například bychom si chtěli respondenty rozdělit na bohaté, střední třídu a chudé ). Za bohaté bychom považovali respondenty v horním kvartilu (percentil 75), za chudé respondenty v dolním kvartilu (percentil 25) a za střední třídu respondenty ve středních kvartilech. Příklad: V dotazníku máme otázku zjišťující ekonomickou aktivitu respondentů (otázka č. 15). Třídění v této otázce je však velmi jemné a nás zajímá pouze, zda existují rozdíly v pohledu na knihovníky mezi lidmi, kteří jsou zaměstnáni (do této kategorie si přiřadíme i pracující na částečný úvazek a OSVČ), studenty a ostatními. Potřebujeme proto vytvořit novou proměnnou, která bude rozdělovat respondenty jen na tři kategorie na ty, kteří pracují (plus OSVČ), na studenty a na ostatní. Kategorie tedy bude nabývat nově dvou validních hodnot:

zaměstnán/a anebo OSVČ 1 student 2 ostatní 3 Hodnoty proměnné tedy rekódujeme takto: 1, 2, 3 1 8 2 4, 5, 6, 7, 9 3 Rekódování v Excelu Na rekódování v Excelu existuje řada pluginů, ale je možné využít i běžný postup Najít a nahradit (CTRL+H). V našem příkladu by tedy byl postup následující: Pojďme si připomenout, jak vypadala původní otázka v dotazníku: A nyní můžeme rekódovat: 1. Zkopírujeme si sloupec s proměnnou ekonomická činnost (9_ekcinnost) do nového sloupce, kde bude nová proměnná pojmenujeme si ji třeba 15_ekcinnost-rec 2. Označíme si sloupec (dáváme pozor, abychom neměli označenou celou tabulku či na označení sloupce nezapomněli, v tom případě se nám překódují data z celého souboru). 3. Příkaz CTRL+H nám otevře dialogové okno, kde postupně budeme zadávat hodnoty k nahrazení. Vždy vybereme možnost Nahradit vše. 4. Nahrazujeme v pořadí: a. Kód 1 nahrazovat nemusíme, tady bude platit 1 1 b. 2 1 c. 3 1 d. 4 3 e. 5 3 f. 6 3 g. 7 3 h. 8 2 i. 9 (JIné) 3

Je potřeba však dávat pozor na to, v jakém pořadí rekódujeme, aby nedošlo k dvojitému překódování. Například pokud bychom nejprve rekódovali 8 2 a potom 2 1, kategorie studentů by nám úplně zmizela. Rekódování v SPSS Rekódování v SPSS je snadná operace. V záložce Transform zvolíme položku Recode into different varialbles. V tabulce poté naklikáme jméno a označení nové proměnné a dále staré a nové hodnoty proměnné:

Získáme tím novou proměnnou, kterou je ale potřeba opět popsat, abychom s ní mohli dále pracovat: zaměstnán/a anebo OSVČ 1 student 2 ostatní 3 Aritmetické operace Díky aritmetickým operacím lze snadno vytvářet nové proměnné, ze starých hodnot pomocí zadaného vzorce. Typickým příkladem je vytváření sumačních indexů sčítání prostých nebo vážených hodnot stejných variant různých znaků. Příklad: Pokud bychom chtěli zjišťovat celkovou spokojenost s knihovnou, kterou jsme si operacionalizovali jako sumu různých měr spokojeností (spokojenosti s personálem, spokojenosti s výběrem fondu a spokojenosti s online službami), sumační index bude tvořit průměrná míra spokojenosti v těchto dílčích oblastech (získáme ji součtem hodnot jednotlivých proměnných, který vydělíme jejich počtem). Příklad: Klasickou Likertovou škálou měříme spokojenost s knihovními službami (s personálem, s výběrem fondu, online službami atd.). U každého respondenta chceme ještě určit jeho celkovou spokojenost, kterou vypočteme na základě hodnocení jednotlivých služeb. Lickertova škála: velmi spokojen/a 1 spíše spokojen/a 2

ani spokojen/a, ani nespokojen/a 3 spíše nespokojen/a 4 velmi nespokojen/a 5 Respondent Karel odpovídal v dotazníku takto: spokojenost s personálem: 1 spokojenost s výběrem fondu 3 spokojenost s online službami 2 spokojenost s MVS 2 Jeho celková spokojenost s knihovními službami se dá vyjádřit jako sumační index (1+3+2+2)/4 (suma hodnocení jednotlivých služeb / počet hodnocení) = 2. Aritmetické operace v Excelu V Excelu zapisujeme vzorec přímo do tabulky. Pokud máme např. v řádku 1 (respondent 1) proměnné spokojenost s personálem (sloupec A), spokojenost s výběrem fondu (sloupec B) a spokojenost s online službami (sloupec C), pak vzoreček pro celkovou spokojenost bude =(A1+B1+C1)/3. Aritmetické operace v SPSS V SPSS slouží k vytváření nových proměnných prostřednictvím aritmetických operací příkaz Compute (záložka Transform). Níže je příklad vytvoření nové proměnné věk z proměnné rok narození (v našem případě zadáváme aktuální rok, tedy rok 2014).

Sčítání výskytů Sčítání výskytů je další ze způsobů jak vytvořit novou proměnnou. Někdy nás může zajímat, kolikrát respondenti například na různé otázky odpověděli ano. Příklad: V našem datasetu máme otázku, do jakých knihoven respondenti chodí. Nás jako výzkumníky ale může také zajímat, kolik různých druhů knihoven respondenti navštěvují. Sčítání výskytů v Excelu V Excelu slouží pro sčítání výskytů příkaz COUNTIF.

Zdroj: Nápověda http://office.microsoft.com Sčítání výskytů v SPSS Příkaz COUNT v SPSS najdeme opět v záložce Transform. Tabulka níže ukazuje výpočet počtu zdrojů, ze kterých respondenti získávají knihy (v dotazníku byla baterie otázek zaměřující se na různé zdroje knih, přičemž odpovědi byly vždy ano nebo ne ).

Určení pořadí položek Vytváří novou proměnnou, kde řadí respondenty dle velikosti hodnoty proměnné. Například hledáte TOP 100 největších čtenářů či chcete najít 10 nejúspěšnějších studentů dle percentilu či 20 nejmladších respondentů. Seřazení položek je v tomto případě velmi elegantní řešení. Určení pořadí položek v Excelu V Excelu na seřazení položek používáme příkaz RANK. RANK se zapisuje: RANK(číslo;odkaz;pořadí) Číslo je číslo, jehož pořadí hledáte. Odkaz je matice nebo odkaz na seznam čísel. Nečíselné hodnoty jsou ignorovány. Pořadí je číslo určující, zda se budou hodnoty třídit vzestupně či sestupně. Pokud je pořadí rovno 0 nebo není zadáno, určuje se v aplikaci Microsoft Excel pořadí čísla jako v sestupném seznamu. Pokud je pořadí jakákoliv nenulová hodnota, určuje se v aplikaci Microsoft Excel pořadí čísla jako ve vzestupném seznamu.

Zdroj: http://office.microsoft.com Určení pořadí položek v SPSS V Excelu na seřazení položek používá příkaz Rank Cases (opět v záložce Transform).