Zpráva o zhotoveném plnění

Rozměr: px
Začít zobrazení ze stránky:

Download "Zpráva o zhotoveném plnění"

Transkript

1 Zpráva o zhotoveném plnění Aplikace byla vytvořena v souladu se Smlouvou a na základě průběžných konzultací s pověřenými pracovníky referátu Manuscriptorium. Toto je zpráva o zhotoveném plnění. Autor: Ing. Tomáš Psohlavec, AiP Beroun s.r.o. Obsah Cíle projektu... 1 Dosažená Funkcionalita konvenční hledání... 1 Specifické funkce konvenčního vyhledávání... 3 Výsledky vyhledávání... 3 Dosažená Funkcionalita - porovnávání s uživatelským textem... 4 Technické předpoklady funkčnosti řešení... 4 Interakce s API pro porovnávání plných textů... 4 Požadavky na vstupní data (plné texty)... 5 Dostupnost aplikace... 6 Uživatelské rozhraní... 6 Web Services pro porovnání... 6 Závěr... 6

2 Cíle projektu Cílem projektu bylo vytvoření samostatné on-line prezentační databáze s uživatelským rozhraním, ve kterém budou zajištěny funkce vyhledávání nad plnými texty, jakož i funkce porovnávání uživatelského textu s plnými texty dostupnými v databázi. Záměrem řešení je zapojit do poloprovozu této databáze API projektu porovnávání plných textů historických dokumentů (dále jen API pro porovnávání), které pro tyto potřeby vytvářela v rámci institucionárního výzkumu Národní knihovna České Republiky. Cílem bylo vytvořit samostatně funkční databázi jako integrovanou součást souboru služeb, které Manuscriptorium nabízí koncovým uživatelům. To znamená, že databáze je vytvořena tak, že obslužné aplikace disponují vlastním uživatelským rozhraním a používají databázi struktury optimalizované pro plné texty a oddělené od ostatních databází systému Manuscriptoria. Zároveň to znamená, že uživatelské rozhraní je vizuálně shodné s prostředím Manuscriptoria a že v uživatelském rozhraní bude možno využívat fragmenty obsahu hlavních databází Manuscriptoria (například obrazy), jak je popsáno níže. Dosažená Funkcionalita konvenční hledání Obrázek 1: volba pro konvenční vyhledávání Aplikace zajišťuje vyhledávání na úrovni na úrovni fragmentů textu. Oproti předběžným analýzám, které uvažovaly vyhledávání na úrovni jednotlivých stran textu, je výsdledné řešení schopno vyhledávat na jemnější úrovni na úrovni jednotlivých odstavců textu. Indexovanými záznamy v databázi plných textů jsou tedy odstavce a vyhledaným elementem je odstavec. Odstavce jsou při indexaci sdružovány podle své délky do jednotlivých záznamů. Jedním záznamem je tedy jeden nebo několik málo odstavců. 1

3 Obrázek 2: výsledky vyhledávání Vytvořená aplikace však podporuje také zobrazování typu 1 záznam = 1 odstavec (pokud by data měla být v budoucnu indexována tímto způsobem. Testování aplikace však ukazuje, že aktuální způsob je optimální z hlediska výkonu i srozumitelné z hlediska práce uživatele). Analýza dostupného obsahu vyloučila možnost strukturovat databázi způsobem 1 záznam = 1 dokument, neboť součástí databáze mohou být i extrémně dlouhé dokumenty (například přepis bible). Při předání aplikace je k dispozici plnohodnotné fulltextové vyhledávání. Nicméně aplikace je vytvořena tak, že v případě potřeby lze vyhledávání omezit následujícími položkami (lze v případě potřeby konfigurovat i vytvářet další, zde nevyjmenované, vyhledávací položky). Očekáváme, že tato konfiguraci bude upravována dle zkušeností z poloprovozu (předpokládáme do ). Místní identifikátor Kód fyzického umístění Datum poslední modifikace Cesta k souboru Zkratka profilu Titul, Signatura, Knihovna Kód jazyka Text 2

4 Databáze podporuje vyhledávání ve variantních zápisech textů (různočtení) a to nejen v režimu vyhledávání samostatných slov, ale také v režimu slov v udaném pořadí a vzdálenosti. Obrázek 3: výsledek vyhledání s výskytem různočtení Specifické funkce konvenčního vyhledávání V souladu se zaměřením obsahu databáze a s ohledem na možné způsoby vzniku textových dat (ruční přepis, OCR a podobně) vyhledávání využívá specifické technologie: tolerance chybně přepsaných slov a grafemické vyhledávání. Tyto funkce žádoucím způsobem rozšiřují výsledky vyhledávání tím, že tolerují určitou míru chyb (tolerance - jeden chybný znak) nebo definované grafemické varianty zápisu (grafémy). Grafémy jsou konfigurovatelné a způsob jejich nastavení bude laděn za pomoci zkušeností a zpětné vazby od odborných uživatelů během poloprovozu. Výsledky vyhledávání Výsledkem vyhledávání, jak již bylo uvedeno, je seznam relevantních odstavců, ve kterých se hledané výrazy vyskytují. Možnost prolistovat textová data daného dokumentu jako celku po jednotlivých stránkách je zajištěna kontextovými odkazy, které využívají pokročilé zobrazení textových dokumentů v Manuscriptoriu (včetně například edic, poznámek, různočtení) a při zobrazení plného textu jsou kompletně převzata pravidla zobrazení, jak byla dosud využívána při zobrazení plných textů v Manuscriptoriu (návaznost na prototyp z VaV 2007). Prezentační databáze plných textů je vzájemně propojena s ostatními databázemi systému Manuscriptoria. To umožňuje propojit výsledky vyhledávání s ostatními informacemi v systému. Proto je po vyhledávání, kromě možnosti zobrazit plný text, k dispozici také kontextový odkaz vedoucí na existující popis či digitální kopii relevantního dokumentu. Je tak zajištěno simultánní zobrazení obrazových dat, pokud ta jsou pro daný dokument a jeho zobrazovanou stránku v Manuscriptoriu dostupná. Propojení opačným směrem, pokud jsou k popisům či faksimiliím k dispozici plné texty v databázi fulltextů, je také zajištěno. 3

5 Přestože systém pro dané informace používá oddělené databáze, procesy zpracování i aplikace, podařilo se zachovat podstatnou část vizuální podoby práce s plnými texty, pokud jde o jejich zobrazení a logiku uživatelského interface. Uživatel nepostřehne, že jeho požadavky nad příbuznými informacemi vykonávají dvě nezávislé obslužné aplikace. Dosažená Funkcionalita - porovnávání s uživatelským textem Cílem implementace bylo zprovoznit koncovým uživatelům vybrané základní funkce popsané ve Zprávě ke smlouvě Smlouva o spolupráci ve výzkumu a vývoji Zdokonalení virtuálního badatelského prostředí Manuscriptoria Využití srovnávání fulltextů pro vyhledávání v Manuscriptoriu z roku 2011, konkrétně porovnávání uživatelského textu s fulltexty aktuálně dostupnými v Manuscriptoriu. Aplikace byla vytvořena tak, že využívá API, které je dostupné jako Web Services. Uživatel má k dispozici interface umožňující vložit uživatelský text, který v Manuscriptoriu nemusí být obsažen a může požádat systém o nalezení podobností v plných textech, které v Manuscriptoriu obsaženy jsou. Uživatelským textem může být jak plain-text v UTF-8 vkládaný prostřednictvím formuláře v interface nebo XML validní dle XML schématu TEI P5 ENRICH schema. V souladu s možnostmi API pro porovnání plných textů jsou výsledky porovnání s daným uživatelským textem uživateli přehledně vizualizovány včetně informace o míře vzájemné shody. Pro danou dvojici podobných textů je možno vybrat detailní zobrazení, které srozumitelně vizualizuje podobnou část. Uživatel snadno může posoudit, zda podobný text je hledaným textem a může s ním dále pracovat pomocí obvyklých nástrojů Manuscriptoria. Technické předpoklady funkčnosti řešení Celé řešení předpokládá synchronizaci obsahu databáze plných textů a databáze, se kterou pracuje aplikace pro porovnávání plných textů. Databáze NKCatalog, se kterou pracuje aplikace pro porovnávání plných textů, bude do budoucna vhodnou formou přebírat data z databáze plných textů za účelem předzpracování a to včetně platných identifikátorů. Provoz - přebírání dat a work-flow aktualizace databází obou aplikací, bude dojednán v průběhu poloprovozu. V současnosti jsou připraveny exportní moduly, které fulltextová data připravují k importu do databáze, se kterou pracuje API pro porovnávání plných textů. Synchronizací obou databází je umožněno popsané řešení. Interakce s API pro porovnávání plných textů Mezi oběma aplikacemi jsou během porovnávání předávána nikoliv kompletní XML data, ale pouze identifikátory XML dat obsažených v obou databázích. Komunikace s API pro porovnávání je vedena pomocí Web Services a pro poloprovoz je bezestavová. 4

6 API podporuje dvě funkce: 1. Funkce, která vrací seznam podobných plných textů. Vrácen je seznam identifikátorů používaných v databázi plných textů, informace o míře shody pro každý identifikátor a dále veškeré další informace potřebné pro vizualizaci. Parametry funkce jsou následující: uživatelský text, jazyk, formát, maximální počet shod. 2. Funkce, která vrací informace o míře shody a podklady pro vizualizaci při porovnání dvou konkrétních textů. Není vraceno kompletní XML, ale podklady potřebné pro vizualizaci. Parametry funkce jsou následující: uživatelský text, identifikátor vybraného textu z databáze plných textů, jazyk uživatelského textu. Obrázek 4: Schéma systému Požadavky na vstupní data (plné texty) Aby byla umožněna základní funkčnost celého systému, musí platit následující: Vstupní data jsou předávána ke zpracování do Manuscriptoria ve formě XML, jednotlivé XML soubory jsou validní podle formátu TEI P5 ENRICH schema. Text ve vstupních datech je strukturován v souladu se schématem na úroveň odstavců textu. Každý plný text je opatřen identifikačními informacemi v souladu s obecně platnými minimálními požadavky systému Manuscriptorium (country, settlement, repository, idno v msdesc/msidentifier). Každý plný text je opatřen informací o jazyce textových dat. Pokud je v plném textu použito více jazyků, bude součástí metadat indikace jazyka dané části textu. 5

7 Dostupnost aplikace Uživatelské rozhraní Kompletní systém aplikací je v okamžiku předávání veřejně přístupný také jako služba na Na uvedeném URL bude služba přístupná do K , po zapracování případných připomínek ze strany Zadavatele, přesune Řešitel aplikace i s databázemi na produkční servery systému Manuscriptorium, kde bude systém provozovat v souladu se Smlouvou. Aplikace bude dostupná odkazem z webového rozhraní systému Manuscriptoria. Web Services pro porovnání Web Sservices pro porovnání jsou dostupné pouze na základě domluvy s Národní knihovnou České republiky pro vyprané IP adresy. Závěr Vytvořená aplikace zatím završuje práci předchozích etap vývoje a výzkumu. Během poloprovozu budou sbírány informace, na jejichž základě může dále dojít k další optimalizaci, převedení do plného provozu nebo vývoji, v závislosti na zkušenostech odborných uživatelů aplikace. 6

Koncepce rozvoje Na rodnı knihovny C eske republiky jako vy zkumne organizace na le ta 2010-2015

Koncepce rozvoje Na rodnı knihovny C eske republiky jako vy zkumne organizace na le ta 2010-2015 Koncepce rozvoje Na rodnı knihovny C eske republiky jako vy zkumne organizace na le ta 2010-2015 Zpráva o řešení za r. 2010 Koordinátor: Mgr. Adolf Knoll, ředitel pro vědu, výzkum a mezinárodní vztahy

Více

MULTIFUNKČNÍ WEBOVÁ APLIKACE ČMI

MULTIFUNKČNÍ WEBOVÁ APLIKACE ČMI MULTIFUNKČNÍ WEBOVÁ APLIKACE ČMI uživatelská příručka Verze dokumentu: 1.0 Jazyk dokumentu: český Vytvořeno: Realizační team projektu Datum: 2. 12. 2014 Upraveno: Aktualizace URL Datum: 19. 1. 2015 e-business

Více

Příloha k zadávací dokumentaci a ke smlouvě o poskytování služeb číslo SOAP/002- /2013

Příloha k zadávací dokumentaci a ke smlouvě o poskytování služeb číslo SOAP/002- /2013 Příloha k zadávací dokumentaci a ke smlouvě o poskytování služeb číslo SOAP/002- /2013 TECHNICKÁ SPECIFIKACE POPTÁVKY NA VEŘEJNOU ZAKÁZKU ČESKO-BAVORSKÝ ARCHIVNÍ PRŮVODCE Státní oblastní archiv v Plzni

Více

Funkční analýza webových stránek Knihovny.cz

Funkční analýza webových stránek Knihovny.cz Funkční analýza webových stránek Knihovny.cz Autor: Martin Sládek, Marek Jonák 1 / 43 Verze: 1 Funkční analýza webových stránek Knihovny.cz, jejímiž autory jsou Martin Sládek a Marek Jonák (NETERNITY GROUP,

Více

Vytvoření webových stránek Českého systému kvality služeb včetně komunikačního propojení a následného provozu

Vytvoření webových stránek Českého systému kvality služeb včetně komunikačního propojení a následného provozu Česká republika - Ministerstvo pro místní rozvoj Odbor cestovního ruchu ZADÁVACÍ DOKUMENTACE Vytvoření webových stránek Českého systému kvality služeb včetně komunikačního propojení a následného provozu

Více

Vysoká škola ekonomická v Praze Fakulta informatiky a statistiky Vyšší odborná škola informačních služeb v Praze

Vysoká škola ekonomická v Praze Fakulta informatiky a statistiky Vyšší odborná škola informačních služeb v Praze Vysoká škola ekonomická v Praze Fakulta informatiky a statistiky Vyšší odborná škola informačních služeb v Praze Karolina Kadlecová Návrh architektury sdílení a ukládání informací v prostředí Microsoft

Více

Technická dokumentace

Technická dokumentace Technická dokumentace Příloha č. 1 zadávací dokumentace veřejné zakázky Webový portál Plzeňského kraje 1. Úvod... 4 2. Stávající stav webového portálu... 5 2.1. Postup schvalování a publikování na portálu...

Více

Projekt: Jednotná úroveň IS OŘ a modernizace technologií pro příjem tísňového volání ZS IZS Dodávka technologie

Projekt: Jednotná úroveň IS OŘ a modernizace technologií pro příjem tísňového volání ZS IZS Dodávka technologie Projekt: Jednotná úroveň IS OŘ a modernizace technologií pro příjem tísňového volání ZS IZS Dodávka technologie Technická specifikace předmětu plnění veřejné zakázky Plzeňský kraj Obsah 1 Úvod... 5 2 Okolí

Více

Metodická příručka pro učitele. InspIS ŠVP tvorba ŠVP

Metodická příručka pro učitele. InspIS ŠVP tvorba ŠVP Metodická příručka pro učitele InspIS ŠVP tvorba ŠVP InspIS ŠVP TVORBA A ADMINISTRACE ŠKOLNÍCH VZDĚLÁVACÍCH PROGRAMŮ Tato Metodická příručka pro učitele byla zpracována v rámci projektu Národní systém

Více

Online Autoškola Koncept bakalářské práce VŠE PRAHA. Online Autoškola. Koncept bakalářské práce. Jan Demuth 22.4.2009

Online Autoškola Koncept bakalářské práce VŠE PRAHA. Online Autoškola. Koncept bakalářské práce. Jan Demuth 22.4.2009 Online Autoškola Koncept bakalářské práce VŠE PRAHA Online Autoškola Koncept bakalářské práce Jan Demuth 22.4.2009 Návrh databázového modelu pro informační, komunitní a e-learningový portál se zaměřením

Více

Titul: Projekt pracoviště pro dlouhodobé ukládání a zpřístupňování dokumentů v digitální podobě. Typ dokumentu: Technologický projekt.

Titul: Projekt pracoviště pro dlouhodobé ukládání a zpřístupňování dokumentů v digitální podobě. Typ dokumentu: Technologický projekt. Titul: Projekt pracoviště pro dlouhodobé ukládání a zpřístupňování dokumentů v digitální podobě Typ dokumentu: Verze: 1 revize 05 21. března 2008 ICZ a.s. ID: 20080321_Technologicky_projekt_v1_r05 Změna:

Více

ANALÝZA A ŘEŠENÍ SYSTÉMU PRO MONITORING ISIR A VYBRANÝCH REGISTRŮ ARES

ANALÝZA A ŘEŠENÍ SYSTÉMU PRO MONITORING ISIR A VYBRANÝCH REGISTRŮ ARES Vysoká škola ekonomická v Praze Fakulta informatiky a statistiky Katedra informačních technologií Studijní program : Aplikovaná informatika Obor: Informační systémy a technologie ANALÝZA A ŘEŠENÍ SYSTÉMU

Více

Koncepce katalogizace otevřených dat VS ČR. (zkrácená verze)

Koncepce katalogizace otevřených dat VS ČR. (zkrácená verze) Koncepce katalogizace otevřených dat VS ČR (zkrácená verze) Praha, květen září 2012 Zpracovali: Dušan Chlapek Jan Kučera Martin Nečaský Fakulta informatiky a statistiky, Vysoká škola ekonomická v Praze

Více

Metodický pokyn. Verze 1.10

Metodický pokyn. Verze 1.10 Metodický pokyn k vyhlášce č. 64/2008 Sb., o formě uveřejňování informací souvisejících s výkonem veřejné správy prostřednictvím webových stránek pro osoby se zdravotním postižením (vyhláška o přístupnosti)

Více

Základní uživatelská příručka informační podpory správy číselníku NIPEZ

Základní uživatelská příručka informační podpory správy číselníku NIPEZ Základní uživatelská příručka informační podpory správy číselníku NIPEZ Verze: 2.2 Účinnost od: 10. 3. 2014 Ministerstvo pro místní rozvoj ČR Staroměstské nám. 6 110 15 Praha 1 ID: DUN 004/11 Základní

Více

Informační systém pro základní školy

Informační systém pro základní školy Mendelova univerzita v Brně Provozně ekonomická fakulta Informační systém pro základní školy Bakalářská práce Vedoucí práce: Ing. Pavel Turčínek, Ph.D. Lukáš Dubšík Brno 2015 Rád bych poděkoval Ing. Pavlu

Více

GLOBÁLNÍ ARCHITEKTURA ZÁKLAD- NÍCH REGISTRŮ DOPLNĚK

GLOBÁLNÍ ARCHITEKTURA ZÁKLAD- NÍCH REGISTRŮ DOPLNĚK GLOBÁLNÍ ARCHITEKTURA ZÁKLAD- NÍCH REGISTRŮ DOPLNĚK Projekt Informační systém základních registrů je spolufinancován Evropskou unií z Evropského fondu pro regionální rozvoj. Obsah 1 Cíle dokumentu... 3

Více

Migrace organizace z Microsoft Office na 602Office 1

Migrace organizace z Microsoft Office na 602Office 1 Migrace organizace z Microsoft Office na 602Office 1 Migrace organizace z Microsoft Office na 602Office Migrace organizace z Microsoft Office na 602Office 2 Obsah Záměry a cíle projektu... 4 Podobnosti

Více

Přímý překlad mezi cizími jazyky... 62 Korektorské služby... 63 Doprovodné tlumočení... 65 Konsekutivní tlumočení... 66 Simultánní tlumočení...

Přímý překlad mezi cizími jazyky... 62 Korektorské služby... 63 Doprovodné tlumočení... 65 Konsekutivní tlumočení... 66 Simultánní tlumočení... 1 Obsah Obsah... 2 Úvod... 5 Metodologie... 6 Obsah cenové mapy... 10 Karty činností... 18 Informační technologie: poradenství, vývoj programového vybavení, internet a podpora... 19 Tvorba webových stránek...

Více

WebWorks WebCreator CMS - changelog

WebWorks WebCreator CMS - changelog Jan VOLEJNÍK, DiS. e-mail: jan.volejnik@web-works.cz www: http://www.web-works.cz tel: +420 731 574 999 ICQ: 89-280-876 Informace o změnách mezi jednotlivými verzemi Obsah Obsah... 1 Verze 1.0 beta...

Více

Národní úložiště šedé literatury jako součást Digitální polytematické knihovny vědy, výzkumu a vývoje

Národní úložiště šedé literatury jako součást Digitální polytematické knihovny vědy, výzkumu a vývoje 030 Národní úložiště šedé literatury jako součást Digitální polytematické knihovny vědy, výzkumu a vývoje Petra Pejšová / Národní technická knihovna / e-mail: p.pejsova@stk.cz, nusl@stk.cz Historie a zkušenosti

Více

Softwarová podpora a public relations při projektové činnosti

Softwarová podpora a public relations při projektové činnosti UP E CENTRUM CELOŽIVOTNÍHO VZDĚLÁVÁNÍ JEZERKA O.P.S. Softwarová podpora a public relations při projektové činnosti Studijní text Komplexní vzdělávací program pro lektory zaměřený na Evropskou unii a zpracování

Více

Univerzita Karlova v Praze. Matematicko-fyzikální fakulta DIPLOMOVÁ PRÁCE. Václav Nádraský. Redakční systém s podporou dynamicky generovaného obsahu

Univerzita Karlova v Praze. Matematicko-fyzikální fakulta DIPLOMOVÁ PRÁCE. Václav Nádraský. Redakční systém s podporou dynamicky generovaného obsahu Univerzita Karlova v Praze Matematicko-fyzikální fakulta DIPLOMOVÁ PRÁCE Václav Nádraský Redakční systém s podporou dynamicky generovaného obsahu Katedra softwarového inženýrství Vedoucí diplomové práce:

Více

Vývoj a implementace webové aplikace s podporou notace IFML

Vývoj a implementace webové aplikace s podporou notace IFML Mendelova univerzita v Brně Provozně ekonomická fakulta Vývoj a implementace webové aplikace s podporou notace IFML Diplomová práce Vedoucí práce: doc. Ing. Ivana Rábová, Ph.D. Bc. Jiří Syrový Brno 2015

Více

Metodika publikace otevřených dat veřejné správy ČR. verze 1.0

Metodika publikace otevřených dat veřejné správy ČR. verze 1.0 Metodika publikace otevřených dat veřejné správy ČR verze 1.0 Praha, listopad 2012 Zpracovali: Dušan Chlapek Jan Kučera Martin Nečaský Fakulta informatiky a statistiky, Vysoká škola ekonomická v Praze

Více

Analýza struktury webu a její optimalizace. Jan Koldinský

Analýza struktury webu a její optimalizace. Jan Koldinský České vysoké učení technické v Praze Fakulta elektrotechnická Katedra počítačů Bakalářská práce Analýza struktury webu a její optimalizace Jan Koldinský Vedoucí práce: Ing. David Toth Studijní program:

Více

Dostupnost business intelligence pro všechny

Dostupnost business intelligence pro všechny Dostupnost business intelligence pro všechny Obsah 1. Úvod... 3 2. Předejděte neúspěšné implementaci business intelligence... 4 2.1 Demokratizace business intelligence v praxi...4 3. Poskytnutí obchodního

Více

MPSV, odbor řízení pomoci z ESF ZADÁVACÍ DOKUMENTACE PRO VEŘEJNOU ZAKÁZKU MALÉHO ROZSAHU (VZMR) TVORBA WEBOVÝCH STRÁNEK EVROPSKÉHO SOCIÁLNÍHO FONDU

MPSV, odbor řízení pomoci z ESF ZADÁVACÍ DOKUMENTACE PRO VEŘEJNOU ZAKÁZKU MALÉHO ROZSAHU (VZMR) TVORBA WEBOVÝCH STRÁNEK EVROPSKÉHO SOCIÁLNÍHO FONDU MPSV, odbor řízení pomoci z ESF ZADÁVACÍ DOKUMENTACE PRO VEŘEJNOU ZAKÁZKU MALÉHO ROZSAHU (VZMR) TVORBA WEBOVÝCH STRÁNEK EVROPSKÉHO SOCIÁLNÍHO FONDU Praha, 1. září 2008-1 - 1. Zadavatel Instituce: Ministerstvo

Více

Print2PDF verze 9. Příručka uživatele

Print2PDF verze 9. Příručka uživatele Print2PDF verze 9 Příručka uživatele Obsah 1. Převod do formátu PDF... 6 1.1. PDF... 6 1.2. Print2PDF verze 9... 6 1.3. Bližší charakteristika základních komponent... 6 1.3.1. Tiskový ovladač Print2PDF...

Více