6 Organizační aspekty vypracování tezauru (s přihlédnutím k tomu, jak jsem postupoval já) 6.1 Metody shromažďování lexikálních jednotek Před samotným shromažďováním lexikálních jednotek by měl mít tvůrce jasno o formě tezauru (tj. abecední soupis nebo systematické uspořádání) a o tom, zda tezaurus bude jednooborový nebo bude zahrnovat více oborů. K zaznamenávání lexikálních jednotek se používají tyto techniky: a) deduktivní metoda Při použití této metody se vybírají lexikální jednotky z pramenů, v nichž je slovní zásoba určité tematické oblasti soustředěna ve více či méně normalizované podobě. Jde například o různé tezaury, encyklopedie, slovníky, učebnice. Nejprve se vyjádří významově nejširší kategorie, k nimž se podle principu od širšího k užšímu přiřadí lexikální jednotky. Kontrola slovníku se realizuje až po konstituování kategorií. b) induktivní metoda Byla-li zvolena tato metoda, nové výrazy jsou zařazovány do tezauru postupně tak, jak se vyskytnou v procesu indexování dokumentů. Před samotným popisem dokumentů se orientačně vytvoří několik širokých kategorií, do kterých jsou lexikální jednotky vřazovány. Tezaurus tedy vzniká podle principu od užšího k širšímu. Kontrola slovníku se provádí od počátku. V praxi se obvykle obě metody navzájem doplňují a kombinují, což byl i můj případ. 33
Já jsem si nejprve nechal vytisknout seznam stávajících deskriptorů resp. klíčových slov, která byla použita při indexování v minulosti. Tato slova byla zaznamenávána v programech pro tezaurus automatizovaného knihovnického systému BIBIS. Jednotky však byly do systému zanášeny v různých variantách, s překlepy a ve tvarech, které jsou při katalogizačním popisu zakázány. V první etapě jsem tedy z vytištěného souboru slov vyloučil nepatřičné jednotky. Orientačně jsem je pak zařadil do čtyř obecných tematických kategorií (vědy, průmysl a služby, vyrábění, ostatní - blíže viz úvod k tezauru). Slova ve skupinách jsem doplnil za pomoci encyklopedií [8,10] o chybějící základní pojmy, které jsem pro jejich obecný a v některých případech i zastřešující charakter (např. druhy průmyslu) postrádal. 6.2 Verifikace a uspořádání lexikálních jednotek do odstavců Správnost lexikální jednotky před jejím zařazením do tezauru je nutno ověřit v autorizovaných pramenech (odborné slovníky a encyklopedie, existující tezaury, klasifikační schémata). S jejich pomocí se také řeší začlenění lexikální jednotky do odpovídajícího hierarchického řetězce. Dále se také provádí úprava lexikálních jednotek podle pravidel pro tvorbu tezaurů, aby byla zaručena kontrola slovníku (viz Všeobecně) a vytvoří se další vztahy mezi pojmy (ekvivalence, asociace). Pro záznam lexikálních jednotek jsem používal program MultiTes od společnosti Multisystem, jehož sharewarovou verzi jsem si stáhl z internetu. K ověřování správnosti lexikálních jednotek jsem používal standardních příruček [1, 6]. Dále jsem vybral de- 34
skriptory a vytvořil vztahy mezi pojmy. Takto vznikly deskriptorové odstavce. Se začleněním deskriptorů do odstavců mi nejvíce pomohl Polytematický strukturovaný heslář, k němuž jsem mohl být kdykoli on-line připojen [12]. Na tento slovník bych si dovolil odkázat indexátory knihovny v případě, kdy chybí v Tezauru technické knihovny lexikální jednotka, bez které by popis pomocí stávajících deskriptorů nebyl možný. Po vyhledání takovéhoto deskriptoru (např. název nově vzniklého oboru) by bylo vhodné podat návrh redakci tezauru o jeho zařazení do slovníku. 6.3 Uspořádání lexikálních jednotek do rejstříků Abecední uspořádání bývá mnohdy ještě hlavní částí tezaurů. Význam tohoto soupisu spočívá podle Kováře [5] v zjištění lexikálních jednotek selekčního jazyka, které odpovídají lexikálním jednotkám přirozeného jazyka užitým v dokumentu nebo dotazu, nahrazení nedeskriptorů příslušnými deskriptory a v doplnění popisu dokumentů a dotazů v selekčním jazyce na základě příslušných odkazů. Systematický rejstřík se hodí pro tezaury s víceúrovňovou tematikou a pro polytematické tezaury. O abecedním a systematickém pořádání se píše více v kapitole Uspořádání lexikálních jednotek a vyjádření vztahů. Abecedním řazením deskriptorových a nedeskriptorových odstavců vznikl abecední rejstřík. Největší problém, se kterým jsem se setkal při tvorbě tezauru, bylo rozdělení deskriptorů do mikrotezaurů. Ve čtyřech základních tematických skupinách se ukázaly některé obory do větší hloubky rozpracovanější. Mezi tyto mikrotezaury logicky patří strojírenství, což vyplývá ze zařazení výroby automobilů do systému průmyslu, a ekonomie, což zase potvrzuje zaměření nově vzniklé vysoké školy při Škodě Auto a. s. Při tvorbě 35
tezauru vyplynula i široká skupina výrobních činností. To se odrazilo i v zařazování příbuzných lexikálních jednotek k těmto činnostem. Pokud příbuzný pojem vznikl od vozením od slovotvorného základu takovéto činnosti a ve fondu knihovny není obsazen dokument, který by takový pojem ke své charakteristice nutně potřeboval, nebyl do tezauru zařazen (např. lepidlo; očekává se, že nebude na škodu k dokumentům o lepidlech přiřadit deskriptor lepení). Obecně platí, že mikrotezaurus neobsahuje méně než 15 deskriptorů. 6.4 Zkušební provoz a aktualizace tezauru Před zveřejněním tezauru se doporučuje ověřit jeho kvality ve zkušebním provozu. Po té může dojít k jeho revizi a následné aktualizaci. Základní druhy změn podle Českého pedagogického tezauru [2] jsou: - doplnění nových deskriptorů na základě zkušeností získaných při indexování; - vyřazení deskriptorů s nedostačující selekční silou (Pokud se lexikální jednotka vyřazená z tezauru použila v dřívějších záznamech dokumentů, označí se poznámkou "pouze pro vyhledávání" a připojí se datum jejího vyřazení.); - změna znění deskriptorů (případně nedeskriptorů) pokud se ukáže, že je pro popis nebo vyhledávání výhodnější deskriptor přeformulovat; - změna statusu deskriptoru (nedeskriptoru), tj. málo používaný deskriptor může být přeřazen mezi nedeskriptory, často používaný nedeskriptor může být povýšen na deskriptor; - změna zařazení deskriptorů do hierarchické struktury a s tím spojené změny hierarchických a asociativních vztahů mezi nimi. 36
Také já očekávám, že před samotným nahrazením stávajících deskriptorů resp. klíčových slov, bude tezaurus testován a jeho možné nedostatky budou před samotným zavedením do praxe odstraněny. 37