Projekt Europeana Newspapers Evropská online brána k digitálním novinovým sbírkám

Podobné dokumenty
AthenaPlus Seminář Národní agregátor ve světě eculture

České digitalizační projekty, jejich výsledky a agregace

Athena a AthenaPlus Populárně-vědecké a vzdělávací projekty Národního muzea

Karel Koucký. Státní oblastní archiv v Praze Národní archiv AKM 2013,

ZPRAVODAJ.

Česká digitální knihovna agregace digitálního obsahu českých knihoven

Projekt Evropská filmová brána: filmové archivy blíže k uživatelům. Tomáš Lachman, NFA Světový den audiovizuálního dědictví Praha, 27.

Využití nástrojů z projektu Česká digitální knihovna při digitalizaci a zpřístupnění digitálních dokumentů

Manuscriptorium. Návaznosti Manuscriptoria na evropské informační prostředí. Inforum Tomáš Psohlavec, AIP Beroun s.r.o

Digitalizace knihovních dokumentů. Jiří Polišenský

Digitalizace a digitální knihovny v České republice

Národní portál pro prezentaci digitalizovaných sbírkových objektů muzeí a galerií. Marie Vítková

Informace k ICT projektům Ministerstva kultury

local content in a Europeana cloud

ICOLC 13 th Fall Meeting

CIP ICT PSP Výzva 7 Ing. Dana Černohousová

Projekt č. TB0500MD017 je realizován za finanční podpory z prostředků státního rozpočtu prostřednictvím TAČR v rámci programu BETA

Portál ebadatelna Zlínského kraje a zpřístupnění map. Prezentace historických map z fondu paměťových institucí Zlínského kraje

Europeana Cloud: nové řešení pro efektivní předávání a využívání dat Petra Pejšová, Národní technická knihovna

Digitalizace a Digitální archiv Státního oblastního archivu v Třeboni po čtyřech letech. Výsledky a perspektivy dalšího vývoje

Digitalizace v ČR a její podchycení v registru digitalizace. Helena Dvořáková Národní knihovna ČR

Kulatý stůl l expertů. Jihlava 20.června 2007

Zpráva ze služební cesty

Z papíru na web a ke čtenáři aneb Digitalizace není jen skenování. Mgr. Monika Oravová Moravskoslezská vědecká knihovna v Ostravě

Digitalizace a zveřejnění sbírkových fondů paměťových institucí Zlínského kraje

EOD Elektronické knihy na objednávku. Rostislav Krušinský

Zpřístupnění kulturního dědictví v digitální podobě v ČR prostřednictvím knihoven

Manuscriptorium v roce 2013

Projekt ORFEUS optimalizovaný georadar pro vyhledávání podzemních inženýrských sítí

Projekt Czechiana. Aleš Vokál Ministerstvo kultury České republiky. Praha, 19. dubna 2017

Dopad fenoménu Industrie 4.0 do finančního řízení

Příspěvek do sborníku. Kamrádková, Kateřina Pospíšilíková, Věra

NOVÝ FONOGRAF MARTIN MEJZR DOMINIKA MORAVČÍKOVÁ FILIP ŠÍR

ProArc. open source řešení pro produkci a archivaci digitálních dokumentů. Martina NEZBEDOVÁ Knihovna AV ČR, v. v. i., Praha nezbedova@knav.

RD.CZ : EVIDENCE DIGITALIZOVANÝCH DOKUMENTŮ A SLEDOVÁNÍ PROCESU ZPRACOVÁNÍ

Digitální mapa veřejné správy

RETROBI Softwarová aplikace pro zpřístupnění digitalizované lístkové kartotéky Retrospektivní bibliografie české literatury

Národní knihovna ČR NEWSLETTER 1/2005

NANOFORCE Nanotechnologie pro chemické podniky

Popis a zpřístupnění záznamů performativního umění - výzvy a možná řešení. Bohuš Získal, CESNET / NFA

Projekt Czechiana. Ing. Josef Praks Ministerstvo kultury České republiky. Praha, 4. listopadu 2016

RDF DSPS ROZVOJ PORTÁLU

Manuscriptorium - 10 let

Evropská digitální knihovna. < Prezentace k eseji pro předmět PV070 Digitální knihovny. Tomáš Drusa

ENArC European Network on Archival Cooperation. Projekt Monasterium v České republice

Implementace egovernment do měst a obcí. Josef Beneš. Úspěšné řízení úspěšných projektů

STRATEGIE A PROJEKTY ODBORU INFORMATIKY MHMP

manuscriptorium Manuscriptorium v Evropě Manuscriptorium.com

Otevřený přístup v evropském kontextu

ebadatelna Zlínského kraje

Možnosti využití metodiky konsorcia NESTOR k certifikaci důvěryhodných digitálních archivů v paměťových institucích

Linked Heritage. Koordinace standardů a technologií za účelem obohacení Europeany. Alena Součková

OpenAIRE & OpenAIREplus

EGOVERNMENT PRO OBČANY A FIRMY

Národní poradenské fórum

Seznámení s přípravou platformy pro zajištění služeb dodávaní dokumentů včetně MVS: ZÍSKEJ

10. setkání interních auditorů v oblasti průmyslu

Seznámení s přípravou platformy pro zajištění služeb dodávaní dokumentů včetně MVS: ZÍSKEJ - I

Výzva I programu podpory Technická pomoc

local content in a Europeana cloud

National exchange workshop

Digitální konkordance a Registr digitalizace v Manuscriptoriu,

Projekt LR 1308 NL 4 HSS Národní knihovna rozvoj informační infrastruktury VaVaI pro humanitní obory

Tzv. životní cyklus dokumentů u původce (Tematický blok č. 4) 1. Správa podnikového obsahu 2. Spisová služba

Newsletter. Číslo 3, prosinec Obsah

Digitální nabídka veřejných knihoven. Frank Daniel Městská knihovna Kolín Praha,

Projekt OpenAIRE výzva a příležitost i pro Českou republiku

1. VZDĚLÁVACÍ POSLÁNÍ UNIVERZITY A PŘÍSTUP ORIENTOVANÝ NA STUDENTA. 1.4 Posílení efektivity a výzkumné činnosti v doktorských studijních programech

Od Integrovaného informačního systému památkové péče k Europeaně. Ing. Alena Šťovíčková Národní památkový ústav

DOMÁCÍ PÉČE A PARTICIPATIVNÍ

Centrální portál knihoven a knihovní systémy. Petr Žabička, Moravská zemská knihovna v Brně

Enterprise Europe Network

Virtuální mapová sbírka Chartae-Antiquae.cz. důležitý výsledek projektu Kartografické zdroje jako kulturní dědictví

Projekt HISPRA aneb Jak využít digitalizaci MKP v dalších knihovnách. 12. Května 2011, Jelení Hora

DATOVÁ ARCHIVACE. Principy datové archivace a její výhody při migraci na SAP HANA. Štěpán Bouda Business Consultant

RD.CZ EVIDENCE DIGITALIZOVANÝCH DOKUMENTŮ A SLEDOVÁNÍ PROCESU ZPRACOVÁNÍ

Infrastruktura pro OA k výsledkům evropského výzkumu a vývoje

Tvůrčí prostředí Pro koho, proč, jak? Tomáš Psohlavec, AiP Beroun s.r.o. Listopad 2014

Dotační zdroje pro paměťové instituce Digitalizace , Praha

EOD - Elektronické knihy na objednávku

Evropská digitální knihovna a autorské právo

Digitální knihovny v České republice

Economists Online: nový portál pro ekonomické vědy

Otevřená data nejen ve vzdělávání

Seznámení s přípravou platformy pro zajištění služeb dodávaní dokumentů včetně MVS: ZÍSKEJ

Virtuální národní fonotéka. Archivy, knihovny, muzea v digitálním světě 2013 Filip Šír a Petr Žabička

Evaluace projektu Národní centrum pro elektronické informační zdroje CzechELib. Prezentace přístupu k evaluaci

Nové nástroje pro staré mapy

INSPIRE. Prováděcí pravidla

Národní autority v prostředí muzeí a galerií interoperabilita s NK ČR

Aktivity NBÚ při zajišťování kybernetické bezpečnosti

SK01-KA O1 Analýza potřeb. Shrnutí. tým BCIME

Setkání zpracovatelů projektů do programu Klastry. Praha 25/1/2006

Grey Literature ve světě

Analýzou dat k efektivnějšímu rozhodování

Horizont 2020 a otevřený přístup k vědeckým publikacím a výzkumným datům:

ROČNÍ ZHODNOCENÍ REGIONÁLNÍHO OPERAČNÍHO PROGRAMU REGIONU SOUDRŽNOSTI SEVEROZÁPAD ZA ROK 2008 Manažerské shrnutí

Univerzální vyhledávací portál jako integrační řešení pro digitální knihovny

Benešov, 22. září 2011 PORTÁL LIDSKÝCH ZDROJŮ

Transkript:

Projekt Europeana Newspapers Evropská online brána k digitálním novinovým sbírkám Aleš Pekárek, Asociace evropských vědeckých knihoven (LIBER) 13. Konference Archívy, knihovny a muzea v digitálním světě, Praha, 28.11.2012

Obsah Cíle a záměry projektu Partnerské instituce Oblasti projektových aktivit Komunikace a diseminace projektu Přidružení partneři projektu 2

Proč zrovna noviny? Noviny jsou bazarem dějin (Die Zeitungen sind der Sekundenzeiger der Geschichte) Arthur Schopenhauer Noviny jsou jedním z nejpopulárnějších materiálů v naší knihovně, protože přímo přetékají informacemi a mají co říci širokému spektru našich návštěvníků. V rámci projektu dodáme do Europeany 2 milliony našich plně digitalizovaných stránek, čímž je zpřístupníme mnohem většímu okruhu uživatelů a v mnohem širším kontextu než doposud. Lily Knibbeler, Ředitelka Marketingu a Služeb Královské (Národní) knihovny Nizozemí V novinách si zkrátka každý něco najde! 3

Cíle & Záměry 1) Výběr, Rafinace ( refinement ) a Agregace obsahu Učinit z Europeany největšího poskytovatele pan-evropské digitální sbírky novin Dodání více než 18 million novinových stránek do Europeany, mnoho z nich společně s vyextrahovaným fulltextem (OCR, OLR, NER) 2) Analýza existujících digitálních novinových sbírek Celoevropský průzkum 3) Kvalita & Doporučení nejlepší praxe Vytvoření optimalizovaného workflow a infrastruktur pro agregaci dat Doporučení nejlepších praxí pro pročištění, workflow, metadata a evaluačních nástrojů v oblasti digitalizace novinových sbírek 4) Prezentace obsahu a fulltextové vyhledávání Vylepšený přístup k novinovým sbírkám v rámci Europeany (Content Browser) 4

Projektové konsorcium & Stakeholdeři 17 partnerů z 12 zemí Národní knihovny obsahoví a techničtí partneři Univerzitní knihovny převážně techničtí partneři Malý a střední podnik (CCS Content Conversion Specialists) Externí partneři a stakeholdeři: Zapojení knihoven vně projektového konsorcia Celkový rámec: Financováno jako Best Practice Network v programu ICT-PSP Evropské komise Trvání projektu: Únor 2012 Leden 2015 5

Partneři projektu Europeana Newspapers TEL LIBER SUB HH NLL USAL CCS NLP BL KB SBB ONB BnF UIBK NLT LFT UB

Partneři projektu 1. Staatsbibliothek zu Berlin (koordinátor projektu) 2. National Library of the Netherlands 3. National Library of Estonia 4. Österreichische Nationalbibliothek 5. National Library of Finland 6. Staats- und Universitätsbibliothek Hamburg 7. Bibliothèque nationale de France 8. National Library of Poland 9. University of Salford 10. CCS Content Conversion Specialists GmbH 11. Stichting LIBER 12. National Library of Latvia 13. National Library of Turkey 14. University Library of Belgrade 15. University of Innsbruck 16. Landesbibliothek Dr. Friedrich Tessmann 17. The British Library

Struktura projektových aktivit (+ koordinátoři) Work Package 1: Koordinace a řízení projektu Berlin State Library (SBB) Work Package 2: Výběr a rafinace digitalizovaných novin National Library of the Netherlands (KB) Work Package 3: Evaluace a hodnocení kvality výběru University of Salford (USAL) Work Package 4: Agregace a příprava novin pro Europeanu The European Library (TEL) Work Package 5: Doporučení Best Practice v oblasti novinových metadat University of Innsbruck (UIBK) Work Package 6: Diseminace a zužitkování projektu Association of European Research Libraries (LIBER)

WP 1: Koordinace a řízení projektu Administrace projektu Řízení všech finančních a organizačních záležitostí Finanční kontrola Projektová komunikace Sharepoint Zajištění kvality projektu monitoring, evaluace a reporting výsledků Risk managament Předcházení konfliktů v rámci konsorcia

WP 2: Rafinace digitalizovaných novin Analýza obsahu a výběr vhodných souborů z digitálních novinových sbírek k zušlechtění (rafinaci) Definice požadavků na minimální kvalitu digitalizovaných novin Koordinace zušlechťování vybraného novinového obsahu novin poskytnutých partnerskými institucemi Doporučení nejlepších praxí v oblasti rafinace digitálních novinových sbírek

WP2: Rafinace OCR and OLR 8 millionů stránek bude do Europeany naagregováno tak jak jsou ================================== 10 millionů zrafinovaných stránek: OCR (UIBK, Rakousko) Z toho: 2 milliony: OCR/OLR (segmentace článků) (CCS, Německo) CCS: Automatické rozpoznávání a segmentace novinových sloupků a článků UIBK obohatí vyextrahovaný obsah strukturálními informacemi z její Platformy porozumění dokumentům, CCS pak informacemi o sloupcích, článcích; zoning; segmentace článků a jejich úrovní CCS zároveň poskytuje knihovnám technologii pro manuální korekci výsledných strukturálních informací UIBK: Detekce titulků a poznámek; Automatické generování obsahu

WP 2: Rafinace Rozpoznávání jmenných entit KB dodala systém rozpoznávání jmenných entit (NER) (pro holandštinu, angličtinu a němčinu)

WP 3: Evaluace a hodnocení kvality Vytvoření uživatelských scénářů se vzorovými profily, datovými sadami, ground truth a nástroji hodnocení kvality výstupů Přehled faktorů využitelnosti, limitů a reálného potenciálu existujících vstupních materiálů Identifikace kritických míst procesu společně s návrhem řešení Evaluace jednotlivých aktivit procesu Doporučení nejlepších praxí pro podobné post-digitalizační pojekty

WP 4: Agregace a příprava pro Europeanu Identifikace a analýza veřejných i soukromých zdigitalizovaných novinových sbírek napříč Evropou Vytvoření reálného časového rámce agregace novinového obsahu Vytvoření celoevropského registru digitalizovaných novinových sbírek Doporučení, jak napasovat existující novinová metadata na EDM (standard Europeany) Agregace novinových metadat partnerů projektu Vytvoření fulltextového indexu novinového obsahu Vývoj a spuštění prohlížeče obsahu (full-text + metadata + originálni skeny či náhledy

WP 4: Agregace obsahu Agregace 18 millionů digitalizovaných novinových stránek do služby Europeana prostřednictvím Evropské knihovny (jednotný portál evropských národních knihoven) Transformace vstupních metadat na bázi EDM www.europeana.eu Distribuce dat do Europeany (po jejich finální transformaci v rámci TEL) www.theeuropeanlibrary.org 15

WP 4: Prezentace & Přístup k plným textům Funkce obsahového browseru: Fulltextové vyhledávání, např. podle klíčového slova, podle jmenných entit podle novinových sbírek podle data vydání novin... Prohlížení naskenovaných novinových stránek Propojení s příbuzným obsahem nenovinového typu (fotky, hudba, pohlednice...)

WP 5: Metadata best practice recommendations Analysis of metadata formats in use by libraries Align metadata models with the METS/ALTO standard and release best practise recommendations Usability of the recommendation will be tested through an evaluation cycle Provide recommendations on best practices for refinement of digitized newspaper collections for Europeana

WP 6: Komunikace a diseminace projektu Cíle Vytvoření celoevropské publicity Větší používanost Europeany Zajištění informovanosti cílových skupin Úkoly 1. Komunikace v mediích 2. Workshopy a účast na konferencích Tři hlavní diseminační workshopy (rafinace, agregace, závěrečný) Národní informační dny (minimálně 10) Rozšíření sítě o další partnery 3. Zužitkování výsledků projektu 18

Hlavní komunikační kanály projektu WWW: http://www.europeana-newspapers.eu/ Twitter: @eurnews Facebook: https://www.facebook.com/europeananewspapers Newsletter: http://bit.ly/tsompy (najdete na webové stránce projektu) Slideshare: http://www.slideshare.net/europeana_newspapers 19

Přidružení partneři projektu Rozšíření sítě o tzv. Přidružené partnery projektu (nefinancované, nepřímé benefity z partnerství) Možnost poskytnutí metadat digitálních novinových sbírek do Europeany v rámci procesů projektu rapidní nárust návštěvníků Využití a přístup k výsledkům projektu (doporučení, dokumentace, SW nástroje, metodika workflow) Hlavně pro držitele obsahu Většina identifikována v rámci průzkumu (40 vyplněných dotazníků, 35 potenciálních přidružených partnerů o metodě výběru se stále diskutuje) Za ČR zájem projevila NK ČR a MZK (i ostatní instituce s digitálními novinovými sbírkami jsou vítány) 20

Děkuji za pozornost pekarek.ales@gmail.com www.europeana-newspapers.eu www.libereurope.eu