NESSTAR Systém pro publikování, prezentaci a analýzu dat PhDr. Martin Vávra, Mgr. Tomáš Čížek Vznik a vývoj DDI Potřeba standardizace popisu datových souborů v souvislosti s elektronickou archivací dat V roce 1995 vzniká DDI jako standard popisu dat (metadata), první verze v roce 2000 neustálé zdokonalování, několik verzí v současnosti 3.0 Struktura DDI DDI je velkoryse navrženo, obsahuje několik desítek položek Využívána je většinou jen část Technicky je DDI navázáno na programovací jazyk XML 1
Struktura DDI specifikace samotné datové dokumentace kdo a kdy ji vytvořil (obvykle jsou to samotné archivy ukládající data) popis výzkumného projektu, v jehož rámci data vznikla popis datových souborů popis jednotlivých proměnných popis ostatních neuvedených materiálů Co je XML? Jazyk pro vytváření strukturovaných elektronických dokumentů Položky jsou definovány pozicí v rámci dokumentu a vztahem k ostatním položkám Není vázáno na konkrétní software, snadná přenositelnost Nekomerční, otevřený software NESSTAR NESSTAR jako konkrétní příklad programu využívajícího DDI Vznikl v roce 1998 za podpory EU, vyvíjen norským NSD Dnes komerční platforma, užívání na základě placené licence Co všechno NESSTAR obsahuje? Server kde jsou data informace a data uložená Program Publisher k převodu datových souborů do formátu Nesstaru Nesstar WebView webová stránka / program k prohlížení, analýze i stahování datových souborů 2
Vstup do katalogu Informace o výzkumech Study description Popis proměnných Variable description 3
Stažení dotazníku Další funkce Nesstaru Kromě prohlížení metadat a proměnných Nesstar umožňuje: Vytváření kontingenčních tabulek Provádění korelační a regresní analýzy Výsledky lze zobrazit mnoha typy grafů Vytváření nových a rekódování starých proměnných K využívání těchto funkcí je nutná registrace Registrace Registrace Uživatelské jméno a heslo jsou automaticky posílány na uvedenou mailovou adresu 4
Vytváření tabulek Vytváření tabulek Volba Tabulation v menu programu umožňuje vytvářet jednouchou tabulku četností jednotlivé proměnné nebo kontingenční tabulku pro více proměnných Vytváření tabulek Analýza Volba Correlation vyvolá prázdnou korelační tabulku. Proměnné lze do analýzy přidávat ze seznamu v levém sloupci pomocí volby Add to correlation. Regresní analýza se provádí obdobně zvolením Regression. V levém sloupci zobrazujícím proměnné je pak možno vybrat nezávislou proměnnou (Add as independent variable) a proměnné závislé (Add as dependent variable). 5
Analýza Grafické znázornění výsledků Typ grafu lze zvolit pomocí příslušné ikony v pravém horním rohu obrazovky. Typy grafů Bar chart (sloupcový graf), tento typ grafu je dostupný pokud je v tabulce jedna nebo více proměnných ( a nejedná se o jedinou míru) Stacked bar chart (součtový sloupcový graf), dostupný pokud jsou v tabulce dvě a více proměnných (a žádná míra) Pie chart (výsečový graf), dostupný pokud jsou v tabulce dvě a více proměnných (a žádná míra) Box whisker (krabicový graf), dostupný pokud jsou v tabulce dvě a více proměnných z nichž jedna musí být míra. Pokud je v tabulce přítomna pouze míra zobrazí její frekvence s normálním rozdělením a kvartily. Confidence interval graph (graf intervalů spolehlivosti), dostupný pokud jsou v tabulce dvě a více proměnných z nichž jedna musí být míra Typy grafů Bar chart mean (sloupcový graf s průměrem), dostupný pokud jsou v tabulce dvě a více proměnných z nichž jedna musí být míra. Regression chart (regresní graf), dostupný pouze po provedení regresní analýzy, nahrazuje ikonu sloupcového grafu. Time series graph (graf časových řad), dostupný pouze pokud je v tabulce přítomna časová proměnná/dimenze. Scatterplot, dostupný pouze po provedení regresní analýzy, nahrazuje ikonu grafu časových řad. 6
Typy grafů Další funkce Vytváření a rekódování proměnných Systém Nesstar ve své nejnovější verzi umožňuje i vytváření nových uživatelsky definovaných proměnných. To je možné pomocí v programu předem připravených matematických a statistických operací. Po zvolení ikony Compute se rozbalí nabídka jednotlivých operací. Vytváření a rekódování proměnných 7
Vytváření a rekódování proměnných Stahování datových souborů Stahování datových souborů Nesstar ve světě Nesstar se stává univerzální platformou pro online prezentaci dat Všechny významné archivy mají Nesstar v provozu 8
ZACAT UK DA ICPSR European Social Survey 9
Blízká budoucnost Proběhl projekt CESSDA-PPP Přípravná fáze podpořena EU Vytvoření integrovaného datového katalogu, ne jako jednoho velkého archivu, ale jako propojení stávajících datových knihoven 10