Přístup k národnímu webovému archivu Tomáš Síbek a Lukáš Gruber
Archivace webu Proč a jak? Technické řešení Legislativní překážky Návrh zákona o povinných síťových publikacích problematika viděna z pohledu českého projektu WebArchiv WebArchiv je digitální archiv českých webových zdrojů, které jsou zde shromažďovány za účelem jejich dlouhodobého uchování.
Proč? důležitost a množství elektronických dokumentů stále roste velká část vzniká pouze elektronicky eborn dokumenty životnost dokumentů v rámci internetu je krátká okolo 75 dní sledujeme problematiku národního webového archivu česká národní doména.cz
Proč? Srovnání růstu registr národních domén provozuje sdružení září 1999 41 351 registrovaných domén.cz listopad 2008 484 256 registrovaných domén.cz nyní jsme na jedenáctinásobku stavu ze září 1999
Proč? Množství obsahu roste
Jak? výběr webových stránek uložení do archivu zpřístupnění uživatelům
Jak? Typy sklizní celoplošné sklizně (tzv. harvesting) delší interval snaha zachytit bohemika na internetu v co největší úplnosti výběrové sklizně kratší interval výběr hodnotných webových stránek s častými aktualizacemi tematické sklizně výběry materiálů k významným událostem nebo specifickému tématu WebArchiv: Prezidentské volby (2008), Nová budova Národní technické knihovny (2007), Praha olympijská (2007); Nová budova Národní knihovny (2007); Volby (2006); Vysočina (2005); Dalimilova kronika (2005); Povodně (2002)
mezinárodní spolupráce tvorba opensource nástrojů International Internet Preservation Consortium (IIPC) celkem 38 členů z celého světa Internet Archive archive.org nástroje pro ukládání (sklízení) webu Heritrix nástroje pro zpřístupnění WayBack, Wera Jak a kde? Software neumíme kvalitně sklidit vše problém s některými formáty stávající aplikace je třeba inovovat projekt Living Web Archives
Jak? webarchiv.cz/vyhledej Zpřístupnění WebArchivu vyhledávání na základě URL adresy
Jak? Zpřístupnění WebArchivu index data, kdy byla daná URL adresa sklizena
Nejen technickéřešení na první pohled je problematika v uspokojivém stádiu řešení nejedná se ale jen o technické a administrativní otázky zpřístupňování webových archivů musí být v souladu s národní legislativou
Legislativa v ČR Zákon č. 121/2000 Sb. o právu autorském, o právech souvisejících s právem autorským a o změně některých zákonů (autorský zákon), ve znění pozdějších předpisů
Legislativa v ČR Co smíme archivovat český web = vytvořit kopii webové stránky a uložit jí do prostoru zabezpečeného digitálního úložiště upraveno v AutZ, tzv. knihovní licence 37, ods.1 a) do práva autorského nezasahuje knihovna, archiv..zhotoví-li rozmnoženinu díla, která neslouží přímému nebo nepřímému hospodářskému nebo obchodnímu účelu, pro své archivní a konzervační účely. konzervační (depozitní) funkce Národní knihovny celoplošné sklizně
Legislativa v ČR Co dále smíme zpřístupňovat archivované webové stránky v omezeném režimu = pouze pomocí PC umístěných v knihovně bez možnosti vytváření rozmnoženin upraveno v AutZ, tzv. knihovní licence 37, ods.1 c) do práva autorského nezasahuje knihovna, archiv zpřístupňuje-li dílo. jednotlivcům ze strany veřejnosti prostřednictvím k tomu určených technických zařízení umístěných v jeho objektech, a to výhradně pro účely výzkumu nebo soukromého studia takových osob, a zamezí-li takovým osobám zhotovit rozmnoženinu díla v současné době možno využít PC stanice v referenčním centru Národní knihovny ČR
Legislativa v ČR Co ale nesmíme poskytnout veřejný online přístup k archivovaným webovým dokumentům Pro online přístup nutno získat souhlas od držitele autorských práv Možnosti řešení uzavření smlouvy využití veřejné licence (Creative Commons)
Vlastnířešení Uzavření smlouvy smlouva o poskytování elektronických online zdrojů vytvořena v souladu s občanským zákonem uzavírána na konkrétní URL (včetně subdomén) v tištěné formě do budoucna zvažována možnost uzavírání smlouvy online
Vlastnířešení Creative Commons souhlas s online zpřístupňováním na základě vystavení webových stránek pod licenci Creative Commons základní informace a návod na aplikaci na stránkách WebArchivu možnost právoplatně využívat od dubna 2006 (novela AutZ 216/2006 Sb.)
Vlastnířešení Rozšíření institutu povinného výtisku v současné době dva zdroje legislativy povinného výtisku: Zákon č. 37/1995 Sb. o neperiodických publikacích, ve znění zákona č. 320/2002 Sb. Zákon č. 46/2000 Sb., o právech a povinnostech při vydávání periodického tisku a o změně některých dalších zákonů (tiskový zákon), ve znění zákona č. 302/2000 Sb. a zákona 320/2002 Sb. Co třeba ještě.? Zákon č. XXX/XXXX Sb. o povinných síťových publikacích????
Vlastnířešení Návrh zákona o povinných síťových publikacích co řeší: charakteristiku povinných síťových publikací (zahrnuje i síťové publikace s omezeným přístupem) povinnosti vydavatele zdroje instituce, které odpovídají za uchování a zpřístupňování síťových publikací přístup k archivovaným síťovým publikacím současný stav návrhu zákona? návrh předložen ústřední knihovnické radě ČR; nyní v přípravě na legislativním odboru MK ČR
Přístup k webovým archivům v zahraničí Příklady zemí s legislativou povinné síťové publikace: Norsko (1990) Chorvatsko (1997) Island (2003) Nový Zéland (2003) Kanada (2004) Dánsko (2005) Slovinsko (2006) Francie (2007) Finsko (2008)
Děkuji za pozornost Tomáš Síbek Lukáš Gruber Národní knihovna ČR WebArchiv http://www.webarchiv.cz
Více informací najdete CELBOVÁ, Ludmila, et al. Archivace webu. Praha : Národní knihovna ČR, 2008 [vyjde v průběhu prosince]. CELBOVÁ, Ludmila. Český web a povinný výtisk jde to spolu dohromady? Knihovna plus [online]. 2008, č. 1 [vyjde v průběhu prosince]. Dostupný z WWW: <http://knihovna.nkp.cz>. ISSN 1801-5948