Obecné principy chemických strukturních bází dat předmět projektu VaVpI ChemEIZ

Podobné dokumenty
Jaroslav Šilhánek VŠCHT Praha

ší šířen chemická INFORMATIKA TERCIÁLNÍ DOKUMENTY zpracované primární dokumenty

Úkol pro zopakování. ší šířen

Chemické databáze. Bedřich Košata

Univerzita Karlova. Filozofická fakulta


Chemické báze dat. Problematika vyhledávání anorganických sloučenin v bázích Chemical Abstracts a Reaxys. Jaroslav Šilhánek

Chemická informatika

Ontologie Příklady. Přednáška z předmětu Socioekonomická geografie pro geomatiku (KMA/SGG) Otakar Čerba Západočeská univerzita


VYHLEDÁNÍ CH. INFORMACE

Velmi stručný návod jak dostat data z Terminálu Bloomberg do R

součást Americké chemické společnosti ší šířen ší Chemical Abstracts Service

místo, kde se rodí nápady

SciFinder a Reaxys porovnání dvou nejdůležitějších chemických bází dat

I. Obecná část V šeobecný úvod - inform ace a in fo rm atik a Co je inform atika? C o je chem ická inform atika?...

K otázce pokrytí publikační aktivity českých vysokých škol v bibliografických bázích dat

Současné možnosti patentových rešerší v chemii a příbuzných oborech

SROVNÁNÍ VYBRANÝCH DATABÁZÍ Z HLEDISKA ZPRACOVÁNÍ ČESKÝCH INFORMAČNÍCH ZDROJŮ

Databáze Madrid Express (WIPO)

Projekt LR 1308 NL 4 HSS Národní knihovna rozvoj informační infrastruktury VaVaI pro humanitní obory


PŘÍRUČKA K PRÁCI S DATABÁZÍ CAB REVIEWS

ÚSTAV ORGANICKÉ TECHNOLOGIE


Dynamic programming. Optimal binary search tree

Competitive Intelligence v medicínském a farmaceutickém prostředí

Aktivita CLIL Chemie III.

Vyhledávání v citační databázi Web of Science (WOS)

Bezpečnost IT - od technologie k procesům

Bilance prvních deseti let 21. století v oblasti vědeckých informací

Elektronické informační zdroje v AV ČR

STUDIE VYUŽITÍ GENERICKÝCH (MARKUSHOVÝCH) VZORCŮ V CHEMICKÝCH PATENTECH

JIŘÍ JIRÁT ELSEVIER FREELANCE TRAINER

Databáze ROMARIN (WIPO)

CHEMICKÉ INFORMACE. ší šířen NA INTERNETU

VĚTŠINA MEDAILI TENTOKRÁT PRO CHEMICAL ABSTRACTS (POROVNÁNÍ VYBRANÝCH BÁZÍ DAT NA PŘÍKLADU REŠERŠE O FARMACEUTICKÉM PŘÍPRAVKU EPIBATIDIN)

Hmotnostní spektrometrie. Historie MS. Schéma MS

Návrh a prototypová implementace databáze pro

Web of Science. Bibliotheca Academica

Podmínky přijímacího řízení Farmaceutická fakulta UK Akademický rok 2017/2018

Gymnázium, Brno, Elgartova 3

POČÍTAČOVÁ REPREZENTACE STRUKTUR CHEMICKÝCH SLOUČENIN


PRÁCE S ODBORNÝMI INFORMACEMI. Ústřední knihovna PdF MU Mgr. Petra Swaczynová

Plantronics Explorer 50. Návod k obsluze

Katalog kurzů ICT vzdělávání

Elsevier Evidence Based Selection (EBS) na VŠCHT Praha. Jiří Jirát VŠCHT Praha

Plantronics Explorer 10. Návod k obsluze

PŘÍRUČKA K PRÁCI S DATABÁZÍ MAPS OF PLANT DISEASES

Zdeňka Lipovská. This project is implemented through the CENTRAL EUROPE Programme co-financed by the ERDF.

Termochemie. Verze VG

AIC ČESKÁ REPUBLIKA CZECH REPUBLIC

Příloha č. 1 Indikátory

Značí se A r Určí se z periodické tabulky. Jednotkou je 1/12 hmotnosti atomu uhlíku. A r (H) = 1 A r (O) = 16

Právní aspekty uplatnění výsledků v projektech OP VaVpI

Pod patronací. si Vás dovolují pozvat na 14. mezinárodní konferenci. 2. cirkulář

Úpravy chemických rovnic

Podmínky přijímacího řízení Farmaceutická fakulta UK Akademický rok 2018/2019

INSTITUT KLINICKÉ A EXPERIMENTÁLNÍ MEDICÍNY

Jak resetovat heslo administrátora Rychlý průvodce HIKVISION TECHNICAL SUPPORT TEAM

Paid parking zones in the capital city of Prague. Ing. Libor Šíma Prague City Hall Krakow

Optimalizace dotazů a databázové transakce v Oracle

PÍSEMNÁ ČÁST PŘIJÍMACÍ ZKOUŠKY Z CHEMIE bakalářský studijní obor Bioorganická chemie 2011


Výpis z registru doménových jmen.cz

Impaktované časopisy. Citační index

Molekulová spektroskopie 1. Chemická vazba, UV/VIS

Citace hledání / zadávání

PŘÍRUČKA K PRÁCI S DATABÁZÍ DESCRIPTIONS OF FUNGI AND BACTERIA

Veritas Information Governance získejte zpět kontrolu nad vašimi daty

(-NH-CO-) Typy polyamidů

DATABÁZOVÉ ZDROJE V CHEMII. JINDŘICH JINDŘICH a,b. Obsah. 2. Databáze v chemii. 1. Úvod

Přehled a definice seznamů

Spektrální metody NMR I

Elsevier Evidence Based Selection (EBS) na VŠCHT Praha. Jiří Jirát VŠCHT Praha

Ústřední knihovna VŠB-TU Ostrava Zpráva o činnosti za rok 2016

Czech Technical University in Prague DOCTORAL THESIS

Chemické formáty. Bedřich Košata

Vyhledávání podle klíčových slov v relačních databázích. Dotazovací jazyky I ZS 2010/11 Karel Poledna

Program. 13:00 13:05 Úvod. 13:05 14:15 Simatic - Přehled komunikace. 14:15 14:45 Přestávka I. 14:45 15:45 Profinet. 15:45 16:15 Přestávka II


Opatření děkana č. 1/2012 Pokyny pro vypracování bakalářských, diplomových a rigorózních prací na Přírodovědecké fakultě MU

Databázové systémy. Doc.Ing.Miloš Koch,CSc.

Průzkum: Jak školy komunikují online.

Autoři: Pavel Zachař, David Sýkora Ukázky spekter k procvičování na semináři: Tento soubor je pouze prvním ilustrativním seznámením se základními prin

Systém mezinárodního standardního číslování ISBN, ISSN

Výpis z registru doménových jmen.cz

Obsah. 2. Mechanismus a syntetické využití nejdůležitějších organických reakcí Adiční reakce Elektrofilní adice (A E

Metody zpracování informací 1

SEMINÁRNÍ PRÁCE. Jméno: Obor: 1. Pojmenujte následující sloučeniny:

Doplňte počet uhlíků k předponě:

POSTUP PRO VYTVOŘENÍ STRUKTUR PRO UKLÁDÁNÍ RDF DAT V ORACLE

SCIEX. Barbora Veselá. Dům zahraničních služeb Národní agentura pro evropské vzdělávací programy


Repetitorium chemie 2014


Návod uživatele. Obchodní platformy BOSSAFX Multiterminál. Dom Maklerski Banku Ochrony Środowiska S.A.

4. Chemická ionizace. (E el = ev, p CH4 = Pa, p M = 0,05 0,1 Pa) => 0,1 % analytu)

CHEMIE. Pracovní list č. 4 - žákovská verze Téma: Tepelné zabarvení chemických reakcí. Mgr. Kateřina Dlouhá. Student a konkurenceschopnost

Transkript:

Obecné principy chemických strukturních bází dat předmět projektu VaVpI ChemEIZ Jaroslav Šilhánek

Strukturní báze dat = Grafická representace struktur chemických sloučenin (+ další informace) Reakční báze dat = Grafická representace strukturních změn chemických sloučenin (+ plus další údaje)

Výchozí předpoklady pro tvorbu strukturních bází dat: Volba základního pracovního principu Dovedení principu do použitelné podoby Vytvoření pracovních nástrojů pro tvorbu záznamů Motivace, smysl vytváření funkčních strukturních bází dat

Stručný historický exkurs První práce o principu grafické representace: Science 126, 814 (1957) CAS 60. léta, práce na CAS Chemical Registry System Důraz na nalezení schůdného postupu pro substrukturní vyhledávání Vývoj v soukromém sektoru, skupina BASIC = Basel Information Center for Chemistry (Ciba- Geigy, Hoffmann-LaRoche, Sandoz) 70. léta, spolupráce soukromého sektoru s CAS, funkční řešení

CH 2 NH 2 HO CH 2 NH 12 13 7 1 8 6 2 9 11 5 4 3 10

3 2 4 6.mol file 1 5 -ISIS- 02190318482D 6 5 0 0 0 0 0 0 0 0999 V2000-1.1417-2.4333 0.0000 N 0 3 0 0 0 0 0 0 0 0 0 0 0.3917-1.5333 0.0000 C 0 0 1 0 0 0 0 0 0 0 0 0 0.3833 0.2458 0.0000 C 1 0 0 0 0 0 0 0 0 0 0 0 1.9292-2.4250 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0 1.9208-4.2042 0.0000 O 0 0 0 0 0 0 0 0 0 0 0 0 3.4667-1.5250 0.0000 O 0 5 0 0 0 0 0 0 0 0 0 0 1 2 1 0 0 0 0 2 4 1 0 0 0 0 4 5 2 0 0 0 0 2 3 1 1 0 0 0 4 6 1 0 0 0 0 M CHG 2 1 1 6-1 M ISO 1 3 13 M END

Vyhledávání struktur, resp. substruktur 1. krok vytvoření souboru potenciálních kandidátů screening, screens 2. krok atom-by-atom-search

Přehled některých typů screens AA Augmented Atom Rozšíření daného atomu danou vazbou AS Atom Sequence Linearní sekvence atomů a vazeb 4 až 6 BS Bond Sequence Lineární sekvence vazeb od 3 do 5 CS Connectivity Sequence Počet lineárních nevodíkových připojení RC Ring Count Minimální počet kruhů

Augmented Atoms C cyklická vazba C C C necyklická vazba cyklická vazba 1031 AA C *1C *1C -1C 15.38 % Aromatická varianta 1044 AA C *4C *4C -1C 38.04%

Atom Sequence, Bond Sequence 1 367 AS O N C * C * C - N 1,56 % 2 882 BS A 2A 1A * 4A * 4A 1A 5,66 % 3 71 AS C C * C * C N O 0,93 %

Strukturní a reakční báze dat jako pracovní nástroj Prázdné strukturní a reakční báze dat k disposici chemikům systém ISIS (ISIS/Base), systém ChemOffice (ChemFinder) aj. Uzavřené strukturní a reakční báze dat obsahující data báze CAS REGISTRY aj. Systémy s možností otevření pro vlastní data nebo kombinující obě možnosti systém CrossFire pro chemický průmysl, systém ISIS jako prostředí pro některé reakční a strukturní báze dat

Motivace pro vytváření a využívání strukturní representace chemických sloučenin Registrace a evidence chemických sloučenin Nástroj pro studium vztahů mezi strukturou a vlastnostmi v nejširším slova smyslu Reakční báze dat

CAS Chemical Registry System do r. 1967 Author Index Patent Index Subject Index General Subject Index Formula Index Chemical Substance Index od r. 1967 Bibliographic File báze CA, CAplus Registry File, báze REGISTRY

FILE 'REGISTRY' ENTERED AT 10:23:14 ON 18 FEB 2003 COPYRIGHT (C) 2003 American Chemical Society (ACS) Uploading Halopyr2.str L1 STRUCTURE UPLOADED Display Query N X N CO 2 H => S L1 SAMPLE SEARCH INITIATED 10:25:35 FILE 'REGISTRY' SAMPLE SCREEN SEARCH COMPLETED - 19 TO ITERATE 100.0% PROCESSED 19 ITERATIONS 2 ANSWERS SEARCH TIME: 00.00.01 FULL FILE PROJECTIONS: ONLINE **COMPLETE** BATCH **COMPLETE** PROJECTED ITERATIONS: 119 TO 641 PROJECTED ANSWERS: 2 TO 124

FILE 'REGISTRY' ENTERED AT 12:03:45 ON 18 FEB 2003 COPYRIGHT (C) 2003 American Chemical Society (ACS) L1 STRUCTURE UPLOADED => S L1 Ful FULL SEARCH INITIATED 12:04:52 FILE 'REGISTRY' FULL SCREEN SEARCH COMPLETED - 313 TO ITERATE 100.0% PROCESSED 313 ITERATIONS 15 ANSWERS SEARCH TIME: 00.00.01 L2 15 SEA SSS FUL L1 L2 ANSWER 1 OF 15 REGISTRY COPYRIGHT 2003 ACS RN 356783-15-8 REGISTRY CN Pyrazinecarboxylic acid, 3,6-dichloro- (9CI) (CA INDEX NAME) OTHER NAMES: CN 3,6-Dichloro-2-pyrazinecarboxylic acid Cl FS 3D CONCORD MF C5 H2 Cl2 N2 O2 N LC STN Files: CA, CAPLUS N CO 2 H Cl

=> d cost COST IN EUROS SINCE FILE TOTAL ENTRY SESSION CONNECT CHARGES 1,02 1,27 NETWORK CHARGES 0,15 0,20 SEARCH CHARGES 148,30 148,30 DISPLAY CHARGES 8,45 8,45 ------- ------- FULL ESTIMATED COST 157,92 158,22 IN FILE 'REGISTRY' AT 12:05:24 ON 18 FEB 2003 => logoff ALL L# QUERIES AND ANSWER SETS ARE DELETED AT LOGOFF LOGOFF? (Y)/N/HOLD:. COST IN EUROS SINCE FILE TOTAL ENTRY SESSION FULL ESTIMATED COST 157,92 158,22