POUŽITÍ DOTAZOVACÍHO JAZYKU PQF V INTERPI INTERPI Interoperabilita v paměťových institucích Program aplikovaného výzkumu a vývoje národní kulturní identity (NAKI) (DF11P01OVV023) Zpracovali: Jana Šubová (Cosmotron Bohemia, s. r. o.)
Struktura PQF dotazu Dotazovací jazyk PQF je pro potřeby INTERPI implementován v následujícím rozsahu: atribut 1 (use vyhledávací kritérium), atribut 4 (fráze), atribut 5 (rozšíření), atribut 6 (úplnost - completeness). Vyhledávací termín je vždy uzavřen v uvozovkách a nejsou rozlišována malá/velká písmena. Atribut 1 (vyhledávací kritérium) Pro INTERPI jsou využívané převážně proprietární use atributy, které zohledňují specifika datové struktury. Atributy mohou být doplňovány nebo jejich obsah může být mírně modifikován na základě potřeb uživatelů. Přehled implementovaných vyhledávacích kritérií: 2050 stav záznamu obsahuje kód pro stav záznamu vzhledem na jeho životný cyklus: nr rozpracovaný návrh nd dokončený návrh rr rozpracovaná revize rd dokončená revize sz schválený záznam zz zrušený záznam ir bez revize INTERPI (záznamy získané importem z jiných systémů) 2051 třída obsahuje jednoznakový kód pro označení třídy entit: o třída osoba/bytost r třída rod/rodina k třída korporace g třída geografický objekt u třída událost d třída dílo/výtvor p třída obecný pojem 2054 preferované označení entity obsahuje všechny preferované označení entity bez ohledu na aplikovaná pravidla a bez ohledu na zařazení do třídy při použití jako kompletního termínu obsahuje hlavní, vedlejší část označení a doplňky 2055 všechny označení entity obsahuje všechny označení entity bez ohledu na aplikovaná pravidla, jazyk nebo preferované/variantní označení a zařazení do třídy použití jako 2056 preferované označení entit třídy osoba/bytost obsahuje všechny preferované 1
2057 všechny označení entity třídy osoba/bytost obsahuje všechny označení entity bez 2058 preferované označení entit třídy rod/rodina obsahuje všechny preferované 2059 všechny označení entity třídy rod/rodina obsahuje všechny označení entity bez 2060 preferované označení entit třídy korporace obsahuje všechny preferované označení entity bez ohledu na aplikovaná pravidla označení použití jako kompletního termínu viz atribut 2054 2061 všechny označení entity třídy korporace obsahuje všechny označení entity bez 2062 preferované označení entit třídy událost obsahuje všechny preferované označení entity bez ohledu na aplikovaná pravidla označení použití jako kompletního termínu viz atribut 2054 2063 všechny označení entity třídy událost obsahuje všechny označení entity bez ohledu na aplikovaná pravidla, jazyk nebo preferované/variantní označení použití jako 2064 preferované označení entit třídy geografický objekt obsahuje všechny preferované 2065 všechny označení entity třídy geografický objekt obsahuje všechny označení entity bez ohledu na aplikovaná pravidla, jazyk nebo preferované/variantní označení použití jako 2066 preferované označení entit třídy dílo/výtvor obsahuje všechny preferované 2067 všechny označení entity třídy dílo/výtvor obsahuje všechny označení entity bez 2068 preferované označení entit třídy obecný pojem obsahuje všechny preferované 2069 všechny označení entity třídy obecný pojem obsahuje všechny označení entity bez 2008 obecný doplněk obsahuje obecný doplněk v označení entit, kde je obecný doplněk využíván 2009 chronologický doplněk obsahuje obecný doplněk v označení entit, kde je chronologický doplněk využíván 2010 geografický doplněk obsahuje obecný doplněk v označení entit, kde je geografický doplněk využíván 2
2011 příslušnost k zemi původu obsahuje hlavní část označení (preferovaných i variantních) entity geografický objekt, která je využita pro vyjádření příslušnosti k zemi původu 2012 obor působnosti obsahuje hlavní část označení (preferovaných i variantních) entity obecný pojem, která je využita pro vyjádření oboru působnosti 2013 kategorie obsahuje hlavní část označení (preferovaných i variantních) entity obecný pojem, která je využita pro vyjádření kategorie entity 2014 jazyková oblast obsahuje kód jazykové oblasti entity 2015 datum vzniku obsahuje datum vzniku entity 2016 datum zániku obsahuje datum zániku entity 2017 místo vzniku obsahuje hlavní část označení (preferovaných i variantních) entity geografický objekt, která je využita pro vyjádření místa vzniku entity 2018 místo zániku obsahuje hlavní část označení (preferovaných i variantních) entity geografický objekt, která je využita pro vyjádření místa zániku entity 2019 sídlo obsahuje hlavní část označení (preferovaných i variantních) entity geografický objekt, která je využita pro vyjádření sídla entity 2020 geografická působnost obsahuje hlavní část označení (preferovaných i variantních) entity geografický objekt, která je využita pro vyjádření geografické působnosti entity 1016 vše obsahuje údaje ze všech částí záznamu 12 INTERPI identifikační číslo záznamu Atribut 4 (fráze) Implementovaná pouze hodnota 1 fráze. Při použití tohoto atributu je možné zadat jako vyhledávácí termín více slov oddělených mezerami. Výsledkem budou ty záznamy, které mají ve vyhledávácím kritériu uvedené všechny zadané slova ve stejném pořadí a bez výskytu jiného slova mezi nimi. Může se před nimi a za nimi vyskytovat jakýkoliv počet jiných slov. Atribut 5 (rozšíření) Implementovaná pouze hodnota 1 pravostranné rozšíření. Při použití tohoto atributu je zadaný vyhledávací termín rozšířen o jakýkoliv počet libovolných znaků. Atribut je možné využít pouze s jednoslovnými termíny tj. není implementován pro použití s frází. Atribut 6 (úplnost - completeness) Implementovaná pouze hodnota 3 kompletní pole (resp. hodnota 2 kompletní podpole, která je používána ve stejném významu). Při použití tohoto atributu jsou výsledkem pouze záznamy, které obsahují v příslušném vyhledávácím kritériu uvedenou hodnotu přesně a úplně. 3
Syntaxe Pro zadávání dotazu platí dědičnost atributů. Atributy uvedené na začátku dotazu platí pro všechny termíny. @attr 1=1016 @and 'xx' 'yy' Atribut 1 s hodnotou "1016" platí pro oba terminy 'xx' i 'yy'. @attr 6=3 @attr 1=1016 @and @and 'xx' 'yy' 'zz' Atribut 6 s hodnotou "3" a atribut 1 s hodnotou "1016" platí pro všechny tři termíny 'xx' i 'yy' i 'zz'. Pro některý z vyhledávacích termínů je možné zděděný atribut libovolně změnit, nebo doplnit jiný. @attr 1=1016 @and 'xx' @attr 5=1 'yy' Atribut 1 s hodnotou "1016" platí pro oba termíny, pro druhý termín platí i atribut 5 s hodnotou "1". Lze kombinovat i více různých hodnot atributů. @attr 1=1016 @and 'xx' @attr 1=2050 'yy' Atribut 1 s hodnotou "1016" platí pro oba termíny, pro druhý termín platí i atribut 5 s hodnotou "1". Pro kombinaci různých vyhledávacích termínů je možné využít operátory AND, OR, NOT. Příklady použití Pro následující příklad předpokládejme následující hodnoty vyhledávacího kritéria 2056 (kompletní termíny): jindrák, františek 1915- (ID 001) jindrák, jindřich 1931-1993 (ID 002) jindra, jan nepomucký 1863-1930 (ID 003) jindra, jan 1877- (ID 004) jindra, jan 1922-1979 (ID 005) jindra, jan 1962- (ID 006) jindr, josef (ID 007) jindrová, zdeňka 1910- (ID 008) nepomucký, jan 1895-1948 (ID 009) Vyhledávací kritérium 2056 (jednotlivé slova): františek (ID 001) jan (ID 003, 004, 005, 006, 009) jindr (ID 007) jindra (ID 003, 004, 005, 006) jindrák (ID 001, 002) jindrová (ID 008) jindřich (ID 002) josef (ID 007) nepomucký (ID 003, 009) zdeňka (ID 008) A hodnoty kritéria 2012: česká literatura (ID 006, ID 008) Příklady použití operátorů: 4
@attr 1=2056 @and 'jindra' 'jan' výsledkem jsou ID: 003, 004, 005, 006 @attr 1=2056 @not 'jindrák' 'františek' výsledkem je ID: 002 @attr 1=2056 @or 'jindra' 'jan' výsledkem jsou ID: 003, 004, 005, 006, 009 Příklady atributu fráze: @attr 1=2056 @attr 4=1 'jindra, jan' výsledkem jsou ID: 003, 004, 005, 006 @attr 1=2056 @attr 4=1 'jan nepomucký' výsledkem je ID: 003 Příklady atributu úplnost: @attr 1=2056 @attr 6=3 'jindra, jan' výsledkem není žádný záznam @attr 1=2056 @attr 6=3 'jindra, jan 1962-' výsledkem je ID: 006 Příklady atributu rozšíření: @attr 1=2056 @attr 5=1 'jindr' výsledkem jsou ID: 001, 002, 003, 004, 005, 006, 007, 008 @attr 1=2056 @attr 5=1 'jindr' 'j' výsledkem jsou ID: 002, 003, 004, 005, 006, 007 Příklady použití více atributů: @and @attr 1=2056 'jindra' @attr 1=2012 @attr 4=1 'česká literatura' výsledkem je ID: 006 5