Český sociálněvědní datový archiv Sociologického ústavu AV ČR, v.v.i. Jilská 1, Praha 1, Česká republika;

Podobné dokumenty
Vývoj v oblasti zdrojů dat

Vznik a vývoj DDI. Struktura DDI. NESSTAR Systém pro publikování, prezentaci a analýzu dat. PhDr. Martin Vávra, Mgr. Tomáš Čížek

Český sociálněvědní datový archiv a jeho služby

Sociálněvědní datové služby Výzkumný program ISSP

Služby Českého sociálněvědního datového archivu a jejich aplikace na příkladu vnímání hrozeb českou společností

Seminář pro vedoucí knihoven asviústavů AV ČR ASEP

Sekundární analýza socio ekonomických dat a zdroje dat

INFORMAČNÍ SPOLEČNOST V ČESKÉ REPUBLICE

Seminář pro vedoucí knihoven a SVI ústavů AV ČR

Základní uživatelská příručka informační podpory správy Číselníku NIPEZ

ISPOP 2019 MANUÁL PRO PRÁCI V REGISTRU ODBORNĚ ZPŮSOBILÝCH OSOB

1 ZÁKLADNÍ FUNKCE SYSTÉMU

Strategie budování sbírky Webarchiv u

Co všechno znamená NESSTAR?*

Dokumentace. k projektu Czech POINT Provozní řád. Rychlý znalostní kvíz a doplnění informací

1 Příručka používání Google Apps

Registr práv a povinností

Aktuální hlediska a trendy v přístupu k vědeckým informacím a datům. David Novák Archeologický ústav AV ČR, Praha, v. v. i.

MĚŘENÍ CHUDOBY A PŘÍJMOVÁ CHUDOBA V ČESKÉ REPUBLICE

Čelíme společným výzvám České zdravotnictví v evropských souvislostech

Metodika budování sbírky Webarchivu

X. mezinárodní konference o katastru nemovitostí, Karlovy Vary hotel Thermal

Popis a ovládání. Aplikace 602XML Filler

Národní úložiště šedé literatury

Registr práv a povinností

Digitalizace a Digitální archiv Státního oblastního archivu v Třeboni po čtyřech letech. Výsledky a perspektivy dalšího vývoje

Nové internetové stránky asopisu Data a výzkum - SDA Info PLNÉ TEXTY ON-LINE

Grey Literature ve světě

Přidružené publikace v České republice

DOCUMENT MANAGEMENT TOOLKIT

NÁVOD K POUŽITÍ. IP kamerový systém.

INSTITUT PRO TESTOVÁNÍ A CERTIFIKACI, a. s. NÁVOD NA PŘÍSTUP K SEZNAMŮM VYSTAVENÝCH DOKUMENTŮ

Mzdy Optimum základy ovládání

Základy práce s aplikací ecba / ESOP

Soukromá střední odborná škola Frýdek-Místek, s.r.o.

CERTIFIKOVANÉ TESTOVÁNÍ (CT) Výběrové šetření výsledků žáků 2014

Otevřený přístup v evropském kontextu

Akceptační test. Úvod

Část 1 - Začínáme. Instalace

Registrace Vyhledávání Výsledky vyhledávání

InsideBusiness Payments CEE

Strategie ochrany před negativními dopady povodní a erozními jevy přírodě blízkými opatřeními v České republice

Jak stahovat ebooks. 1. Stažení ebook:

Technologické postupy práce s aktovkou IS MPP

EndNote Web. Stručné informace THOMSON SCIENTIFIC

DoplněkCite While You Write pro aplikaci Microsoft Word

PRODUKTY. Tovek Tools

Uživatelská příručka k portálu Společnost pro kvalitu školy, o. s. část třetí. testování žáků

BENCHMARKING VENKOVA. Uživatelská příručka nástroje ehomer.cz. Verze dokumentu: 1.1

JUDr. Štěpán Kalamár, Ph.D. Policejní akademie ČR Praha

Nápověda k webové aplikaci určené k revizi. ochranných pásem vodních zdrojů a vodárenských nádrží

Koncepce rozvoje knihoven ČR na léta Priorita 2: Trvalé uchování digitálních dokumentů

Digitální knihovny v České republice

Názory občanů na úroveň české vědy a podmínky jejího financování leden 2016

er Jilská 1, Praha 1 Tel.: milan.tucek@soc.cas.cz

Modul Kontakt s klientem SSP. OKcentrum. Uživatelská příručka. Poskytování součinnosti ÚP ČR

Office: Mobile: EUREKA. Česká republika v programech EUREKA a Eurostars Ing. Josef Martinec Praha,

Manuál SW lokalizace problémů a hodnot v dynamické mapě

AC FORM FILLER. aplikace pro podání žádosti o poskytnutí finančního příspěvku. Verze z 13

Obsah. Začínáme. 1 Úvod do Adobe Acrobatu. 2 Zkoumáme pracovní plochu

Projekt Digitální knihovna pro šedou literaturu po prvním roce řešení

DOSTUPNÝ. SNADNÝ. ONLINE NÁVOD JE TO JEDNODUCHÉ, ZAČNĚTE UŽ DNES!

Nephele systém. Akademie výtvarných umění v Praze. Ústav teorie informace a automatizace AV ČR, v.v.i. Ústav anorganické chemie AV ČR, v.v.i.

Produktový list Zboží.cz. PPC reklama Internetová reklama placená za proklik

REPORTING. Příručka pro Partnery a zákazníky -1-

Podrobný postup pro doložení příloh k Finančnímu zdraví žadatele prostřednictvím Portálu Farmáře

Individuální (autorský) přístup do myasep

emanuál Rozvoj ICT kompetencí žáků a pedagogů v oblasti zpracování grafiky a předtiskové přípravy pro studenty kurzu v LMS systému Moodle

CzechAdvisor.cz. Návod pro členy AHR

Monitoring mikroregionů a jejich rozvojových dokumentů. imr. On-line systém evidence mikroregionů a jejich rozvojových dokumentů

Návod na používání aplikace TV DIGITAL OnGuide(EPG)

Pilotní řešení. AiP Beroun, autor Mgr. Olga Čiperová

CzechAdvisor.cz. Návod pro členy AHR

Nemo moderní aplikace pro poradce

galerie Hana Vyčítalová Národní technická knihovna Praha

KLÍČOVÉ PROMĚNNÉ OVLIVŇUJÍCÍ PLÁNOVÁNÍ TRASY: KONCEPT MAAS OČIMA UŽIVATELŮ

Národní úložiště šedé literatury Zdroj informací o obtížně dostupných dokumentech

Horizont 2020 a otevřený přístup k vědeckým publikacím a výzkumným datům:

Registrační číslo projektu: Škola adresa:

Základy Remedy. Zákaznický portál. Version 0.1 Status: Released. Konica Minolta Česká republika

Uživatelská dokumentace

Informační manuál IS STUDIUM HROCH.CZU.CZ

Athena Uživatelská dokumentace v

Nápověda 360 Search. Co je 360 Search? Tipy pro vyhledávání

TMEGadget. by TMESolutions

Jednotné portálové řešení práce a sociálních věcí

Výčet strategií a cílů, na jejichž plnění se projektový okruh podílí:

Co je nového v aplikaci PaperPort 12?

Národní úložiště šedé literatury. Česká zemědělská univerzita, Hana Vyčítalová

Otevřený přístup k datům

Moje-Projekty.cz Dokumentace k aplikaci

Digitální knihovny v České republice

ebooks v rozhraní EBSCOhost

Modul Download pro redakční systém Marwel

Aktualizováno ke dni: DISKUSNÍ DATABÁZE PRO ČLENY TNK. Návod k použití. verze 1.1

EUREKA aeurostars: poradenská činnost a služby pro přípravu a podávání projektů

Postup pro doplnění Žádosti o dotaci přes Portál farmáře v operaci

Transkript:

Český sociálněvědní datový archiv Sociologického ústavu AV ČR, v.v.i. Jilská 1, 110 00 Praha 1, Česká republika; http://archiv.soc.cas.cz Datové archivy a jejich využití pro sekundární analýzu dat v sociálních vědách (se zaměřením na Český sociálněvědní datový archiv a jeho online databázi Nesstar) Martin Vávra martin.vavra@soc.cas.cz Prezentace byla vytvořena v rámci Strategie Akademie věd AV21, výzkumného programu "Paměť v digitálním věku"

Zdroje dat pro sekundární analýzu a proč je využívat Provedení vlastního výzkumu je obtížné (u některých témat prakticky nemožné) Vysoké finanční náklady Čas potřebný pro primární výzkum Aktuální nedostupnost subjektů/objektů pro výzkum Záchranou může být využití dat, která sebral někdo jiný (tj. sekundární analýza) Nalezení a získání vhodných dat je usnadněno vytvářením příslušné infrastruktury (datové archivy) a pravidel archivování dat (zejména systematické vytváření metadat, která data popisují)

Přínosy sekundární analýzy a dostupnosti dat pro tuto analýzu Usnadňuje přenos a kumulativní vytváření poznání (archivace -> zabezpečení, zachování) Skrze možnosti kombinovat různé datové zdroje napomáhá zvyšování informační hodnoty, komparace v čase, mezinárodní komparace Dostupnost dat pro sekundární analýzu -> zdokonalování metod analýzy metodologický výzkum, testování nástrojů, vytváření nových projektů systematičnost, prosazování kvality Ustavuje lepší prostředí pro spolupráci týmů (zejména mezinárodních) Usnadňuje dostupnost dat pro výuku a zvyšuje množství sekundárních analýz prováděných studenty Napomáhá ověřování výsledků a obecně transparentnosti výzkumu Z hlediska vědní politiky: efektivita veřejných investic - maximalizace využití

Rizika sekundární analýzy Rizika plynou z oddělení fází produkce a analýzy dat. Známe dostatečně původní koncept a kontext výzkumu? Máme dost informací o průběhu sběru dat? Rozumíme modifikacím provedeným v datech? Při nedostupnosti vhodných dat dat hrozí vynucená modifikace výzkumných záměrů Kvalita dat je u sekundání analýzy méně transparentní a pokud nemáme o kvalitu dat zájem a/nebo nejsme schopni ji vyhodnotit, riziko chyby či dezinterpretace je značné Koncepty výzkumu či jednotlivé proměnné nemusí být zcela srovnatelné s těmi našimi (nebo pokud používáme více zdrojů dat, nemusí být srovnatelné mezi sebou) Riziko chyby vyplývá i z nekompatibility formátů a s nimi spojených technických problémů zpracování

Sekundární analýza není rutinní úloha! koncepce výzkumu vyhledání a identifikace dat studium metadat a širšího kontextu původního výzkumu prozkoumání dat, zhodnocení a verifikace úpravy, transformace dat analýza, interpretace dokumentace použitých dat v publikované práci systematický management dat s ohledem na sekundární využití při realizaci šetření i při sekundární analýze

Co je datový archiv

Sdílení výzkumných dat - standard výměna znalostí -> rozvoj vědy kombinování databází, komparace (mezinárodní) spolupráce odpovědnost k veřejným financím: hodnota zpět až s použitím dat => požadavek maximálního využití OTEVŘENÝ PŘÍSTUP K VÝZKUMNÝM DATŮM otevřenost znamená přístup za rovných podmínek pro mezinárodní vědeckou komunitu za nejnižší možnou cenu, nejlépe nepřesahující mezní náklady distribuce. Otevřený přístup k výzkumným datům z veřejného financování by měl být snadný, časově nenáročný, uživatelsky přívětivý a nejlépe založený na Internetu. (OECD Principles and Guidelines for Access to Research Data... http://www.oecd.org/dataoecd/9/61/38500813.pdf)

Consortium of European Social Science Data Archives Zapojení Českého sociálněvědního archivu do mezinárodní spolupráce sdružení datových archivů CESSDA http://www.cessda.org Nyní se tato spolupráce dostává na vyšší úroveň a v rámci CESSDA vzniká skutečná celoevropská datová infrastruktura Jednotný přístup do národních datových úložišť, standardizace dat a metadat Austria Czech Republic Denmark Finland France Germany Lithuania Netherlands Norway Slovenia Sweden Switzerland United Kingdom Vývoj zdrojů dat, Olomouc 17.-19.10.2013 Snímek 8

V ČSDA používané standardy a nástroje Pro zápis metadat používáme standard DDI (více informací na http://www.ddialliance.org/) Pro zápis klíčových slov používáme European Language Social Science Thesaurus (ELSST) K datových souborům nově připojujeme DOI (Digital Object Identifier), na základě registrace u organizace da ra (součást německého institutu GESIS) Dokumenty k datům ukládáme v databázovém systému DSpace Získali jsme Data Seal of Approval certifikaci důvěryhodnosti digitálního archivu

Co je Nesstar a jak jej ČSDA a další datové archivy využívají Nesstar je software pro webové publikování dat a jejich on-line analýzu. Uživatelé mohou prostřednictvím Nesstaru data prohledávat, on-line analyzovat a stahovat si je do svého počítače. Nesstar využívají všechny archivy sdružené v organizaci CESSDA i některé další. v roce 2016 bylo v systému Nesstar (on-line systém pro prezentaci, analýzu a stahování dat), který ČSDA používá, dostupných 741 datových souborů (v drtivé většině z dotazníkových šetření), došlo k 1535 stažení dat (75% pro účely výuky), měli jsme 2210 registrovaných uživatelů (9,1% zahraničních)

K datům se lze dostat z hlavní stránky ČSDA http://archiv.soc.cas.cz/

Dostaneme se tak do databáze Nesstar ČSDA (http://nesstar.soc.cas.cz/webview/)

ČSDA archivuje i publikuje nejen primární data ze současnosti ale i data ze vzdálenější minulosti ve formě agregovaných dat (tabulek) V roce 1946 zahájil činnost Ústav pro výzkum veřejného mínění. Primární data nemáme, ale pokoušíme se na základě dostupných zpráv z výzkumů publikovat tabulky s důležitými výsledky

Medard - digitální archiv "měkkých", kvalitativních, dat Samostatná knihovna kvalitativních dat částečně dostupná také přes rozhraní Nesstar Kvalitativní data: skoro všechny typy datových souborů Archivace kvalitativních dat vázne Problém ochrany osobních údajů

Stejný systém sloužící pro on-line prezentaci dat výzkumu European Social Survey (http://nesstar.ess.nsd.uib.no/webview/)

Také německý datový archiv (součást institutu GESIS) využívá pro zpřístupňování dat Nesstar http://zacat.gesis.org/webview/index.jsp Tento archiv je z hlediska českého výzkumníka významný proto, že zpřístupňuje mezinárodní datové soubory například z výzkumů ISSP nebo EVS

Jak s daty v databázi Nesstar pracovat Poté co se dostanete na stránku http://nesstar.soc.cas.cz/webview/ už stačí jen postupně rozbalovat nabídku klikáním na názvy sekcí (popřípadě na čtverce vedle těchto názvů). Dostanete se tak až na úroveň konkrétních výzkumů a v rámci zvoleného výzkumu po kliknutí na Popis proměnných (případně na Variable description v závislosti na nastavení jazyků ve vašem prohlížeči) na jednotlivé proměnné. V sekci Metadata můžete procházet informace o výzkumu.

Vyhledávání dat V informacích o výzkumu i v informacích, které se vztahují ke konkrétním proměnným je možno vyhledávat prostřednictvím nástroje na horní liště (podrobnější nabídka vyhledávání pod tlačítkem s lupou a symbolem +).

Další funkce Nesstaru Kromě prohlížení metadat a proměnných Nesstar umožňuje: Vytváření kontingenčních tabulek Provádění korelační a regresní analýzy Výsledky analýz lze zobrazit mnoha typy grafů Vytváření nových a rekódování starých proměnných K využívání těchto funkcí je nutná registrace Stahování datových souborů do počítače uživatele I pro to je nutná registrace

Registrace - http://archivreg.soc.cas.cz/registrace Po odsouhlasení podmínek využívání dat uživatel již pouze vyplní krátký online formulář login a heslo mu pak přijdou na email

On-line analýza vztahu dvou proměnných Na horní liště Nesstaru se uživatel přepne do sekce tabulky Poté již zvolí konkrétní proměnné a to tak, že klikne levým tlačítkem myši nad labelem dané proměnné

Korelační analýza v Nesstaru Uživatel přejde na liště do analýzy, poté zvolí korelaci Do korelační matice se proměnné přidávají znovu pomocí levého tlačítka myši Kromě hodnot samotného koeficientu je možno zobrazit i významnosti a počet jednotek, které do daného korelačního vztahu vstupují

Regresní analýza v Nesstaru Práce s proměnnými je stejná jako u korelací, pouze je pochopitelně nutno zvolit závisle proměnnou a ostatní proměnné jako nezávislé

Stahování dat Pokud se uživatel zaregistroval, ČSDA mu přidělí práva ke stahování všech souborů Samotné stažení souboru je pak velice jednoduché Nejprve si uživatel soubor vybere a rozklikne jej Poté stačí kliknout na tlačítko s disketou V nabídce si vybere formát dat Poté dá stáhnout, zadá uživatelské jméno a heslo a soubor se začne stahovat

Ikony důležitých funkcí Nesstaru Zobrazení tabulek Zobrazení grafů Vymazat tato funkce vyčistí okno s analýzami Váha uložené soubory mohou obsahovat váhy, tato funkce umožňuje jejich použití Podsoubor - tato možnost dovoluje uživateli provádět analýzy nebo zobrazení grafů na podsouboru kategorií proměnných (například pouze za osoby mužského pohlaví)

Ikony důležitých funkcí Nesstaru Stáhnout - systém umožňuje stažení datového souboru do většiny používaných statistických formátů. Export vytvořených objektů (tabulek) do formátu.xls Export vytvořených objektů (tabulek, grafů) do formátu.pdf Kontextuální nápověda