Současné možnosti patentových rešerší v chemii a příbuzných oborech

Rozměr: px
Začít zobrazení ze stránky:

Download "Současné možnosti patentových rešerší v chemii a příbuzných oborech"

Transkript

1 102 Současné možnosti patentových rešerší v chemii a příbuzných oborech Ing. Jaroslav Šilhánek, CSc VŠCHT Praha, Technická 5, , Praha 6, silhanek@vscht.cz, tel Úvod Motivem pro tento stručný souhrn současných možností provádění patentových rešerší je především upozornění na situaci, která se v průběhu relativně velmi krátké doby vytvořila jako důsledek elektronických forem informačních zdrojů na straně jedné, tak i možnostem jejich sdílení prostřednictvím sítí na straně druhé. V obecnějším slova smyslu byla tato nová situace předmětem obdobného referátu předneseného na této konferenci v r. 2006, který ale hlavně zdůrazňoval značný rozdíl v možnostech akademické sféry oproti sféře průmyslové, která neměla a stále ve značné míře nemá možnost, profitovat s praxe vydavatelů umožňující vytváření konsorcií univerzit i jiných výhod. Tento referát se soustředí na oblast, která je průmyslové praxi bližší, a to na možnosti současných informačních zdrojů v oblasti patentových informací. Obecně řečeno, patentový spis je z hlediska zdroje informací ekvivalentní článku ve vědeckém časopise, přednášce na konferenci nebo podobnému dokumentu. To, že je to v pravém slova smyslu právní dokument deklarující, že ten či onen subjekt je majitelem určitého duševního vlastnictví, je záležitost, která hraje roli až v konkrétních situacích, kdy už jde o nakládání s tímto duševním majetkem. Pojem patentová rešerše je pak poněkud širší, než jen dotaz, zda ta či ona sloučenina existuje, jak se připraví, nebo jaké má vlastnosti. Připomeňme jen pro úplnost, že v praxi hovoříme o následujících typech patentových rešerší: 1) 2) 3) 4) Informativní rešerše (jinak označované je rešerše na stav techniky) Rešerše na novost Rešerše na patentovatelnost nebo platnost Rešerše na porušování Dále budeme mít na mysli zpravidla jen první případ s tím, že tento krok je tak jako tak ten první a ty další pak mohou následovat. V žádném případě ale není účelem tohoto referátu podat úplný přehled možností patentových rešerší, ale omezíme se právě jen na ilustraci změn, často velmi zásadních, které přináší současné informační technologie. Dostupnost patentových dokumentů Patentové dokumenty jako informační zdroje se zásadně liší od jinak zcela analogických vědeckých článků v tom, že nikdy nebyly předmětem vydavatelských aktivit, tedy předmětem prodeje, předplatného či jiné formy získávání za úplatu vyjma pochopitelně nákladů na pořizování jejich kopií, dříve fotokopií, později xeroxů apod. To je základem skutečnosti, že mohou být dostupné v podstatě zcela zdarma tak, jako byly a stále jsou zcela zdarma dostupné v knihovnách patentových úřadů. Ale i tam jsou dnes dostupné jako materiál na médiu CDROM a díky této své povaze je pak jen otázkou dalších organizačních kroků, aby byly dostupné vzdáleným přístupem prostřednictvím počítačové sítě jako naprosto logický a očekávatelný krok. 1130

2 Jestliže v nedávné minulosti patentové úřady shromažďovaly patentové spisy v tištěné podobě pokud možno z co nejširšího okruhu zemí, pak není překvapující, že dnes např. Evropský patentový úřad1 udržuje takový velmi široký soubor patentových dokumentů prakticky z celého světa, ovšem v digitální podobě. Přidáme-li k tomu zmíněnou skutečnost o principiálně nekomerčním přístupu k patentových spisům, je výsledkem opravdu volný a okamžitý přístup k mimořádně velkému souboru originálních patentových dokumentů z z velké většiny patenty vydávajících zemí. Zcela konkrétně je dnes skutečnost taková, že připojením na servery Evropského patentového úřadu, které jsou snadno dostupné z webovských stránek našeho Úřadu průmyslového vlastnictví2, kde máme možnost získat v plném znění téměř jakýkoliv patentový dokument. Samozřejmě, známe-li jeho identifikaci, tedy kód země a číslo. Zadání je velmi jednoduché, stačí do nabídnutého okna napsat požadovaný kód a číslo patentu a buď získáme skutečně plný text patentového dokumentu, nebo alespoň abstrakt a přehled patentových nároků. Tato možnost je otevřená od počátku vzniku síťových propojení a příslušné servery jsou budovány v souladu s vývojem informačních technologií i technologií síťových v průběhu přibližně let s výsledkem, který je překvapující i pro toho, kdo tento vývoj sleduje a využívá. Zatímco koncem devadesátých let byla možnost získat originální text patentového dokumentu na serveru patentového úřadu, ať již evropského nebo národního, ilustrací budoucích možností s ne vždy úspěšným výsledkem, je dnes otázka otevření téměř jakéhokoliv plného textu patentového dokumentu velmi spolehlivá, a to nejenom u patentů evropských nebo amerických, ale i japonských a dnes i čínských a také u patentů ruských, bulharských a dalších. Jinak řečeno, možnost bezprostředně otevřít a prostudovat prakticky jakýkoliv patent v plném znění a to zcela bezplatně, je výrazně větší, než u obdobných dokumentů jako článků ve vědeckých časopisech, kde musíme mít nějakou formu licence nebo předplatného v původním slova smyslu. Soubory plných textů patentů jako patentové báze dat: Udržuje-li patentový úřad soubor patentových dokumentů v elektronické podobě včetně průběžné aktualizace, vytváří tím automaticky také něco, co je rovněž patentovou bází dat, ve které je možné hledat patenty odpovídající tomu či onomu předmětu. Je potřeba jen jediné, provozovat tento soubor v nějakém databázovém systému, který umožňuje vyhledávání informací zadáváním dotazů. Zde se ale dostáváme do určitého rozporu, protože na jedné straně taková možnost vždy byla samozřejmou součástí funkce patentových úřadů, ale na druhé straně dřívější ukládání (a následné vyhledávání) sestávalo z poměrně jednoduchého fyzického shromažďování dokumentů podle patentových tříd, zatímco ukládání digitalizovaných dokumentů umožňuje mnohem širší možnosti. Současný stav je možno charakterizovat jako takový, kdy především Evropský patentový úřad1 provozuje poměrně velmi silný databázový systém patentových dokumentů, který je možno využívat zcela bezplatně, ale tento systém přece jenom není tak silný jako ryze komerční databázové systémy. Tento databázový systém Evropského patentového úřadu označovaný jako Espacenet (přesněji s využitím síťových znaků jako Esp@cenet), umožňuje jak triviální rešerše využívající textových hesel a Booleovské logiky, tak i náročnější formulace dotazů s využitím patentových tříd, informací o prioritách, datech zveřejnění apod. Tak např. hledáme-li informace o patentech chránících přípravu látky s komerčním označením Moxonidine, můžeme jednoduše zadat tento termín a s velkou pravděpodobností získáme výsledek, který bude požadované patenty obsahovat. 1131

3 Systém (ale obdobně i systémy např. Amerického patentového úřadu a dalších), umožňuje i velmi efektivní využívání klasických nástrojů patentových rešerší, jako je právě patentové třídění. Na rozdíl od situace před nástupem elektronických verzí, kdy práce s tištěnými soubory dokumentů soustředěných podle patentových tříd v knihovnách patentových úřadů vyžadovala značnou praxi a zkušenosti, využívání patentového třídění v elektronických bázích dat situaci podstatně zjednodušuje, i když je nutné zdůraznit, že praxe a zkušenosti hrají stále velmi důležitou roli. V každém případě ale přístup k patentovým bázím dat v patentových úřadech otevírá možnost využití patentových tříd i chemikovi ve výzkumu, který není patentovým rešeršérem, alespoň v případech, kdy se jedná o rešerše informativní, resp. rešerše na stav techniky. V zásadě je možné postupovat dvojím způsobem: Využitím systému patentového třídění, které je rovněž k disposici v elektronické podobě na serveru našeho patentového úřadu1 (tedy na Použitím známého patentu týkajícího se dané problematiky a využitím tam uvedených patentových tříd. Obr. 1 Patentové zatřídění uvedené na konkrétních patentech bývá různě obsáhlé, někdy až příliš bohaté, ale v každém případě může poskytnout řadu zajímavých informací, především o logice zatřiďování a praxi patentových referentů. Je ale přesto nutné připomenout, že se jedná o sice silný nástroj patentových rešerší, ale při občasném využití vyžaduje jak trpělivost, tak i pečlivost a využívání různých kombinací a variant logiky patentového třídění. Ilustrativně je na Obr. 1 ukázána část třídníku pro heterocyklické sloučeniny dostupná na uvedené adrese. V této souvislosti stojí za ilustrativní připomenutí, že patentové báze dat patentových úřadů, tedy státních úřadů fungujících z peněz daňových poplatníků, nejsou až tak nuceny poskytovat co největší komfort pro vyhledávání patentových dokumentů a nabízené nástroje nemusí být ty nejsilnější. Pro ilustraci je možno uvést, že tzv. Advance Search v bázi dat Esp@cenet umožňuje zadat 4 termíny v každém poli, celkem 21 termínů s použitím 20 logických operátorů. Jak je vidět na Obr. 2, kromě předmětové identifikace libovolným textovým výrazem s možností logické kombinace, je možné zadávat patentové třídy a často 1132

4 klíčové údaje patentů, jako jsou prioritní údaje, datum publikování apod. Jsou to nepochybně rozsáhlé možnosti formulace dotazu, ale komerční báze umožňují ještě širší. Obr. 2 Shrneme-li výše uvedený i když jen velmi stručný popis možností patentových rešerší prostřednictvím volného přístupu na server Esp@cenet, můžeme konstatovat, že kombinací politiky Evropské unie otevírat přístupy k informacím pořizované z veřejných prostředků a vlastní povahy patentových dokumentů, vede k nebývalým možnostem získávání patentových informací. Další patentové báze dat: Zatím co výše popsané možnosti jsou volně přístupné, všechny další jsou tak či onak zpoplatněné. Důležitou roli hraje i způsob zpoplatnění, např. platba za dobu práce v bázi nebo platba za každý termín či zobrazení výsledků, což pak může vést k požadavku na rutinu a zkušenost patentového rešeršéra. Následující přehled není v žádném případě vyčerpávající, spíše ilustrativní, dokumentující nejdůležitější a typické možnosti. Báze dat Inpadoc: Tento, mezi patentovými rešeršéry velmi dobře známý zdroj, je ilustrativní ukázkou koexistenci volně dostupných a placených zdrojů. Jedná se totiž o původní patentovou bázi dat vytvářenou Evropským patentovým úřadem, orientovanou především na informace o právním stavu jednotlivých dokumentů, která se postupně jednak uvolnila k volnému použití (viz výše) a jednak přetvořila do obdobných, více na profesionální patentové rešerše orientovaných forem. Ve své původní, i když podstatně zdokonalené verzi je přístupná na databázovém středisku Dialog3, na databázovém středisku STN International4 jsou místo původního Inpadocu dvě úžeji specializované báze. Jednak verze INPADOCDB, což je především co nejúplnější soupis právního stavu patentů od r. 1830, a jednak verzi INPAFAMDB, což je verze sumarizující patentové rodiny. V každém případě je využívání 1133

5 zpoplatněno a více či méně vyžaduje profesionálního patentového rešeršéra včetně praktických zkušeností. Báze dat Derwent World Patent Index Rovněž v tomto případě se jedná o všeobecně velmi dobře známý zdroj, relativně široce využívaný řadou našich institucí hlavně před r. 1990, v té době ale také v různých tištěných verzích včetně katalogizačních nebo děrovaných karet. Připomeňme, že jde o ryze soukromou aktivitu a společnost založenou již v roce 1951 a stále sídlící v Londýně, v první řadě pro chemické patenty, které i dnes zaujímají největší podíl zpracovávaných dokumentů. Zakladatel, anglický chemik Montagu Hyams, si totiž uvědomil, že zájmem přihlašovatelů patentů není to, aby se předmět patentů snadno našel, ale spíše naopak, aby skutečný předmět byl skryt v celkovém, co možno nejširším popisu. Takže prvním krokem zpracovávání patentového dokumentu je upřesnění vlastního názvu, kde je běžné, že názvy jsou velmi obecné a o skutečném předmětu téměř nic neříkající. Např.: Herbicide composites Catalyst and process for its manufacture Dále firma Derwent používá svůj systém třídění založený více na praktických potřebách a hlavně původní a asi stále hlavní zaměření na chemii vedlo ve své době k jedinému částečně strukturnímu záznamu a pak i k vyhledávání struktur chemických sloučenin. Běžná patentové praxe využívá k popisu chemických sloučenin obecné vzorce, tedy vzorce pracující s více či méně přesněji či šířeji definovaným obecnými substituenty jako R1, R2,... Rx, nebo obdobné formy v patentové terminologii charakterizované jako Markushovy vzorce. Derwent zavedl možnost kódování těchto obecných vzorců a jejich zpětné vyhledávání s využitím tehdy používaných děrných štítků a dnes samozřejmě převedených do počítačové reprezentace, což je sice velmi užitečné, ale dostatečná praxe a zkušenosti s využíváním této možnosti je stále velmi nutná. Připočteme-li k této skutečnosti ještě značné poplatky za vstup a využívání bází dat firmy Derwent, dnes patřící společnosti Thompson Scientific5, je zřejmé, že je to zdroj především určený profesionálním patentovým rešeršérům. Nejdůležitější produkt, tzv. World Patent Index, ve zkratce WPINDEX, je přístupný na databázovém středisku STN International4. Chemical Abstracts Chemical Abstracts je pochopitelně asi nejznámější a nutno říci, že nejdůležitější zdroj patentových informací využívaný praktikujícími chemiky, protože principiálně nedělá rozdíl mezi článkem ve vědeckém časopise a patentovým dokumentem, což jsou jako zdroj informací zdroje ekvivalentní. Producent, dnes Chemical Abstracts Service6 (CAS), zpracovává chemické patenty od svého založení v roce 1907, dnes tedy již více než 100 let A protože kvůli nákladnému zpracovávání patentových dokumentů ostatní referátové služby zpracovávání patentů ukočila (typicky Beilstein), CAS vidí v této oblasti vítanou možnost zvýšení své důležitosti a nezastupitelnosti. Proto je možné konstatovat, že zpracovávání a nakonec presentace abstraktového záznamu je neustále zdokonalována a rozšiřována, i když závisí na způsobu, jakým k bázím dat Chemical Abstracts přistupujeme. Dnes už nemá praktický smysl hovořit o tištěné verzi, která podle posledních informací bude ukončena v r Verze CAonCD sice poskytuje sice podrobné informace jak o vlastním patentu, tak i 1134

6 patentových rodinách, ale zobrazení výsledných údajů není souhrnné. Nejbohatší informace o patentové situaci za celé období minulého století včetně patentových rodin poskytne SciFinder, který je ale značně nákladný, především pro komerční instituce, tedy chemický průmysl. Akademická sféra může využívat tento podstatně laciněji, ale i zde jsou náklady velmi vysoké. Ovšem i zde si producent ponechává určité informace pro jinou, ale opět placenou službu. Tak např. záznamy patentových dokumentů neobsahují informace o patentových třídách, i když při zpracovávání jsou tyto údaje zaznamenávány. Stále platí, že nejúplnější a nejpřesnější možnosti patentových rešerší v bázích dat Chemical Abstracts poskytuje přístup k těmto zdrojům na databázovém středisku STN International, tedy opět plně placený zdroj, navíc vyžadující sice ne příliš komplikovaný vyhledávací jazyk, ale přece jenom praxi a zkušenost rešeršéra. Jinými slovy, profesionální patentové rešerše jsou v tomto případě nákladné a zájemce se musí rozhodnout, která forma je pro něj efektivní, resp. v jakém případě dostane za investované prostředky optimální výsledky. Patent Chemistry Database Marketingový rozbor výše stručně popsané situace na poli nástrojů pro vyhledávání informací o patentových dokumentech spolu s pokročilou informační technologií vedl největší světové nakladatelství Elsevier, orientované převážně na vědecké publikace, koncem devadesátých let k rozhodnutí vytvářet novou, výhradně patentovou bázi dat s výše uvedeným názvem. Podle ústních informací měly být vysoké náklady na zpracovávání patentových dokumentů částečně kompenzovány co největším využíváním softwarových nástrojů včetně automatizovaného vyhledávání chemických sloučenin v textech patentů, jejich automatizovaným převodem do grafické podoby, přičemž pouze závěrečná kontrola by zůstala na lidském úsudku. Velkou roli v tom evidentně hrály zkušenosti s informačními technologiemi společnosti MDL, protože oficiální název této báze byl MDL Patent Chemistry Database. Báze byla zaměřena především na průmyslový sektor a nikdy nebyla zveřejněna cena nebo licenční poplatky formou ceníku. Pro práci s touto bází byl využit stávající systém CrossFire, jenž přešel do vlastnictví nakladatelství Elsevier získáním většiny produktů původního Beilstein Institutu. Odchodem společnosti MDL ze svazku nakladatelství Elsevier bylo nutno situaci řešit a výsledkem je zcela nový systém, který v r plně nahradí systém CrossFire. Protože nakladatelství Elsevier nesmí nadále používat názvy Beistein ani Gmelin, které zůstávájí jako chráněné názvy původním majitelům, vedlo to k závěru, že nový systém zahrne jak obě původní báze Beilstein a Gmelin, které nebudou nadále rozlišovány, ale současně bude do systému zahrnuta i patentová báze Patent Chemistry Database. Systém byl oficiálně představen v r pod názvem Reaxys a právě diky tomuto, do jisté míry vynucenému spojení, se tak dostává chemiků do ruky další nástroj pro provádění patentových rešerší. Všeobecné informace je možné získat na webovské stránce: Jak je vidět, jedná se o bázi zpřístupňovanou ve webovském prostředí a tudíž nevyžadující instalaci klienta, VŠCHT Praha, stejně jako ostatní vysoké školy, které tvoří konsorcium pro přístup k bázím Beilstein a Gmelin, mají v roce 2009 příležitost tuto bázi vyzkoušet na základě testovacího přístupu. Zatímní zkušenosti potvrdily výskyt patentových dokumentů ve výsledcích hledání, a to patentů z nedávné doby. Tak např. na dotaz přípravy substance Moxonidin byly získány následující výsledky (na Obr. 3 jsou jen nejnovější odkazy). Pro efektivní práci s patentovými dokumenty je možná nejzajímavější přehledné zobrazení jak všech sloučenin v patentu zmíněných, tak i v patentu uvedená reakční schémata včetně reakčních detailů, jak demonstruje následující ukázka rozbalení jednoho z výše nalezených patentů (Obr. 4). 1135

7 Obr. 3 Bohužel, komerční zájmy se projeví např. v tom, že uvedená číselná identifikace reakčních činidel jsou Beilstein Registry Numbers a nikoliv CAS RN, což je důsledek dlouholetého sporu mezi CAS a nakladatelstvím Elsevier o licenčních poplatcích za využívání registračních čísel CAS. Klíčovou otázkou budou samozřejmě licenční poplatky, které ale v důsledku nemožnosti oddělit přístup k bázím Beilstein a Gmelin nemohou enormně stoupnout oproti stávajícím nákladům na přístup k systému CrossFire, i když je nepochybné, že nový systém Reaxys bude dražší než systém CrossFire. Zkušenosti ukáží, zda zvýšené náklady obhájí investice do zpřístupnění tohoto databázového produktu. V každém případě je to pro chemické disciplíny vítané obohacení palety informačních zdrojů. Obr

8 Reference: 1. European Patent Office, 2. Úřad průmyslového vlastnictví České republiky: 3. Dialog Proquest: 4. STN International: 5. Thompson Reuters: 6. Chemical Abstracts Service (CAS):