Registrační systém m chemických látek a sloučenin Jaroslav Šilhánek VŠCHT Praha
Zásadn sadní úkol: Jednoznačně identifikovat jakoukoliv chemickou látku a sloučeninu tak, aby mohla být rozlišena od jiných látek a sloučenin, ať již pro účely badatelské nebo pro jejich praktické používání a případná legislativní opatření.
Výchozí problém: Chemická látka: individuální sloučenina s definovanou strukturou směs sloučenin s definovanou strukturou neznámá nebo neurčitá struktura přírodní látky umělé látky
Látky s nedefinovanou strukturou: Asbestos Chrysotile Serpentine Kaolin Coal Benzine Ligroine Gasoline Emulgátory
Označení chemické látky: triviální název pyrogallol, Oxalsäure... komerční název Igepon T, Bentonit... systematický název Methyl 3-amino-2-thiophenecarboxylate,... linearizovaný vzorec, sumární vzorec CH 3 C 6 H 4 COOC 2 H 5, C 10 H 16 N 5 O 10 P 2...
Sumárn rní vzorce nejjednodušší forma popisu chemické sloučeniny Nemohou být jednoznačné jeden sumární vzorec může odpovídat i několika stům různých sloučenin Zásada uvádění pořadí prvků: - anorganické sloučeniny = striktně abecední pořadí - organické sloučeniny = uhlík, vodík a dále abecední pořadí
Používání sum (anglosaská literatura pou sumárn rních vzorců literatura používá označen ení Molecular Formula ) Je-li známá struktura sloučeniny, je vždy možné sestavit sumární vzorec Použití sumárního vzorce vede k podstatnému omezení počtu v úvahu přicházejících sloučenin Z nabídnutého souboru sloučenin vyhovujících danému vzorci je nutné vybrat na náklady znalosti názvosloví (alespoňčástečné)
Ukázka použití sumárních vzorců v tištěném rejstříku Chemical Abstracts Povšimněme si čísel v hranatých závorkách za názvem jednotlivých sloučenin!!!
Strukturní vzorec konkrétní sloučeniny: N O CH 2 CH 2 CH 2 NH N N CH 3 N NH 2
Různé názvy pro předchozí vzorec: 1-Methyl-N 5 - [3-[3-(1-piperidinyl- methyl)phenoxy]propyl]-1h-1,2,4-triazole- 3,5-diamine 3-Amino-1-methyl-1H-1,2,4-triazol-5-yl-[3- (alfa-piperidino-2-tolyloxy)-propyl]amin 1-[m-[[(3-Amino-1-methyl-1H-1,2,4- triazol-5-yl)amino]propoxy]- benzyl]piperidine
Popis struktury formou grafu:
Ilustrace dalšího zjednodušení vedoucí k číslovanému grafu: H O CH 2 NH CH 2 NH 2 7 1 8 6 2 5 4 3 9 10 12 11 13
Spojovací tabulka Číslo Symbol Druh Číslo Druh Číslo Druh Číslo atomu atomu vazby atomu vazby atomu vazby atomu 1 C 1 2 2 C 1 1 1 3 3 C 1 2 2 4 1 5 4 O 2 3 5 N 1 3
13 C 3 N + 1 2 4 O 5 O 6.mol file -ISIS- 02190318482D 6 5 0 0 0 0 0 0 0 0999 V2000-1.1417-2.4333 0.0000 N 0 3 0 0 0 0 0 0 0 0 0 0 0.3917-1.5333 0.0000 C 0 0 1 0 0 0 0 0 0 0 0 0 0.3833 0.2458 0.0000 C 1 0 0 0 0 0 0 0 0 0 0 0 1.9292-2.4250 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0 1.9208-4.2042 0.0000 O 0 0 0 0 0 0 0 0 0 0 0 0 3.4667-1.5250 0.0000 O 0 5 0 0 0 0 0 0 0 0 0 0 1 2 1 0 0 0 0 2 4 1 0 0 0 0 4 5 2 0 0 0 0 2 3 1 1 0 0 0 4 6 1 0 0 0 0 M CHG 2 1 1 6-1 M ISO 1 3 13 M END Jiná forma spojovací tabulky
Zásady zpracovávání primárních dokumentů v Chemical Abstracts Service: primární dokument (článek, patent) je zpracován jako bibliografická citace je připraven abstrakt a soubor klíčových slov a předmětových hesel z každého dokumentu jsou zaznamenány všechny chemické sloučeniny (látky), o kterých je v dané práci zmínka
do r. 1967... každá sloučenina je identifikována svým sumárním vzorcem rejstřík sumárních vzorců = Formula Index každé sloučenině je přiřazen systematický název dle nomenklatury CAS rejstřík chemických názvů = Chemical Substance Index
od r. 1967... od r. 1967... každá sloučenina je zaznamenána formou spojovací tabulky a uložena do počítačového souboru každý záznam dostává pořadové identifikační číslo = adresa v paměti na základě grafického zobrazení struktury je jednoznačně rozhodováno o identitě každé další sloučeniny veškeré informace o identifikaci sloučenin jsou ukládány do báze dat = REGISTRY
V Registračním systému identifikace chemických látek a sloučenin je klíčovým prvkem Registrační číslo: CAS Registry Number - jeho původ, p smysl, charakteristika a problematika nalezení
CAS Chemical Registry System do r. 1967 Author Index Patent Index Subject Index General Subject Formula Index Index Chemical Substance Index od r. 1967 Bibliographic File báze CA, CAplus Registry File, báze REGISTRY
Pořadové identifikační číslo záznamu = adresa v paměti počítače Chemical Abstracts Service Registry Number CAS RN
Formát CAS RN: 78692-67-4 78692-67-4 kontrolní (paritní) číslo, vypočtené ze všech předchozích čísel podle vzorce... formální oddělení pro snadnější rozpoznání Skutečné numerické pořadí je tedy...7, 869.267
Možné zdroje pro získání CAS RN: tištěné sešity a rejstříky elektronická verze CA on CD - koncepční ekvivalent tištěné verze elektronické verze tzv. Collective Indexes (stejné pracovní prostředí jako CA on CD, ale daleko větší šance na nalezení CAS RN)
Další důležité zdroje: souhrnná elektronická báze CA zahrnující veškerý materiál od r. 1907 přístupná v databázovém středisku STN International souhrnná elektronická báze všech sloučenin REGISTRY, přístupná pouze ve středisku STN International souhrnná elektronická báze kombinující obě předchozí, SciFinder, od r. 1998 pro university jako SciFinder Scholar
Kde je autoritativní seznam CAS RN? v tištěné podobě jako rejstřík The Registry Handbook - Number Section, více než 100 svazků, je průběžně vydáván (v ČR je částečně k disposici v Ústřední knihovně VŠCHT Praha, jeho odběr byl ukončen) v elektronické verzi jako báze dat REGISTRY, přístupná pouze prostřednictvím databázového střediska STN International
Jak získat CAS RN? Z oficiálních zdrojů, systematická cesta vedoucí jak k registračnímu číslu, tak i k poznatku, že daná látka nebo sloučenina registrační číslo nemá a s velkou pravděpodobností není dosud známá Z neoficiálních zdrojů, tedy více méně náhodně
Jediným oficiálním zdrojem registračních čísel jsou materiály Chemical Abstracts Service, především báze dat REGISTRY nebo jiné báze CA Neoficiální zdroje mohou být např. katalogy chemikálií, báze dat nebezpečných látek a nejrůznější zdroje na Internetu
Vyhledávání v tištěných zdrojích CA: The Registry Handbook = je možná pouze identifikace známého CAS RN, nikoliv obráceně!!! příklad: 93-89-0 Benzoic acid, ethyl ester C 9 H 10 O 2 standardní postup pro vyhledání CAS RN spočívá v použití tištěných rejstříků Formula Index a Chemical Substance Index
Elektronická verze - báze dat REGISTRY obousměrné vyhledávání CAS RN poskytuje úplný identifikační záznam o dané látce, např. všechny další názvy zobrazuje strukturní vzorce!!! umožňuje vyhledávat i fragmenty názvů informuje o frekvenci výskytu v dalších bázích dat
Příklad vyhledání CAS RN podle triviálního názvu v bázi REGISTRY v databázovém středisku STN International: FILE 'REGISTRY' COPYRIGHT (C) 1999 American Chemical Society (ACS) e aflatoxin E1 10 AFLATOXIC/BI E2 10 AFLATOXICOL/BI E3 80 --> AFLATOXIN/BI E4 1 AFLATOXINE/BI E5 1 AFLATOXINS/BI E6 2 AFLATREM/BI E7 1 AFLAVAN/BI
Záznam registračního čísla Aflatoxinu v bázi REGISTRY v databázovém středisku STN International FILE 'REGISTRY' COPYRIGHT (C) 1999 American Chemical Society (ACS) L1 ANSWER 1 OF 1 REGISTRY COPYRIGHT 1999 ACS RN 83219-44-7 REGISTRY CN Cyclopenta[c]furo[3',2':4,5]furo[2,3-h][1]benzopyran-9-sulfonic acid, 1,2,3,6a,8,9,9a,11-octahydro-4-methoxy-1,11-dioxo-, sodium salt, (6aR,9R,9aS)- (9CI) (CA INDEX NAME) OTHER CA INDEX NAMES: CN Cyclopenta[c]furo[3',2':4,5]furo[2,3-h][1]benzopyran-9-sulfonic acid, 1,2,3,6a,8,9,9a,11-octahydro-4-methoxy-1,11-dioxo-, sodium salt, [6aR-(6a.alpha.,9.alpha.,9a.alpha.)]- OTHER NAMES: CN Aflatoxin B1S FS STEREOSEARCH MF C17 H14 O9 S. Na LC STN Files: AGRICOLA, CA, CAPLUS HO3S O H R S R H O O Na O O OMe
Vyhledání registračních čísel ve verzi CA on CD Výchozí údaj je sumární vzorec: Výchozí údaj je název sloučeniny: - Butenoic acid - 2-Butenoic acid (MODIFIED) - butyl ester (STEREO) (E)- [591-63-9]
Příklad vyhledání registračního čísla anorganické soli: (výchozí údaj je sumární vzorec matečné sloučeniny)
Při využití názvu matečné sloučeniny:
Využití programu SciFinder Scholar - možnosti: Sumární vzorce Název (je možné zkusit libovolný název včetně názvů triviálních, názvy komerční nebo i zkratky a kódová označení) Grafická representace strukturního vzorce nebo složení
Sumární vzorce: Hledáme CAS RN pro kyselinu 4-trifluorbenzoovou
Danému vzorci odpovídá více sloučenin, grafické zobrazení usnadní nalezení správné struktury:
Vyhledání registračního čísla na základě triviálního názvu: (podobně komerčních názvů, generických názvů nebo i kódových označení) POZOR: Nutno použít nabídku Locate
Záznam z báze dat REGISTRY: Všimněme si, že termín p-cymene je v oddíle Other Names
Vyhledání na základě struktury:
slouží se se souhlasem souhlasem autora autora jako jako studijní materiál materi Vysoké školy koly chemicko-technologic k jiným účel elům m a další dal ší šířen ší ení Vybrat z nabídky podobných struktur: Tento Tento dokument dokument slou plňkový kový studijn ke ke studiu studiu oborů obor Vysok Jeho Jeho použit pou ití k jiným
Konečná informace: Dostaneme informace nejenom o CAS RN, ale i o dalších názve
Registrační číslo kyseliny maleinové získané na Internetu: MALEIC ACID ICSC: 1186 (Z)-Butenedioic acid cis-1,2-ethylenedicarboxylic acid Malenic acid CAS # 110-16-7 C 4 H 4 O 4 / HOOCCH=CHCOOH RTECS # OM9625000 Molecular mass: 116.1 UN # 1759 EC # 607-095-00-3
Důle ležit itá zásada: Pokud jsou v primárním zdroji uvedeny spolehlivě identifikovatelné strukturní odchylky od již zařazené látky, je to důvod pro přidělení nového registračního čísla, které je právě v pořadí.
Důsledky: sloučeniny i s velmi malými strukturními odchylkami mají naprosto rozdílné CAS RN nelze např. odvozovat čísla isomerů od jednoho z nich je možné velmi přesně označit konkrétní látku s určitými vlastnostmi
Příklad: Síran vápenatý v penatý, CaSO 4 Calcium sulfate (1:1), monohydrate, 18662-40-3 Calcium sulfate (1:1), hydrate 22879-15-8 Calcium sulfate, hydrate 17217-90-2 Calcium sulfate (1:1), dihydrate 10101-41-4 Calcium sulfate, hemihydrate, (2:2:1) 10034-76-1
Příklad: Butanol, C 4 H 9 OH Butanol 35296-72-1 1-Butanol 71-36-3 2-Butanol 78-92-2 (+/-)-2-Butanol 15892-23-6 (R)-(-)-2-Butanol 14898-79-4 (S)-(+)-2-Butanol 4221-99-2
Látky s nedefinovatelnou strukturou: These materials are being registered currently to support the substance identification needs of federal regulatory agencies
dokument slouží slou se se souhlasem souhlasem autora autora jako jako ke studiu oborů Vysoké Vysok školy koly chemicko-technologic e fuel Tento Tento dokument E1 1 FUEGIN/BI E2 1 FUEKI/BI E3 60 --> FUEL/BI E4 1 FUELC/BI E5 1 FUELCYL/BI E6 2 FUELLE/BI E7 2 FUELLEBORN/BI E8 2 FUELLEBORNI/BI E9 1 FUELOEPPITE/BI E10 1 FUELPRO/BI E11 11 FUELS/BI E12 1 FUELSAVER/BI ke studiu obor
L2 ANSWER 1 OF 11 REGISTRY COPYRIGHT 1999 ACS RN 129521-66-0 REGISTRY CN Coal, brown (CA INDEX NAME) OTHER CA INDEX NAMES: CN Lignite OTHER NAMES: CN Brown coal CN Coal components CN Coal, lignite CN Fuels, coal MF Unspecified CI COM, MAN, CTS SR CAS Registry Services LC STN Files: AGRICOLA, BIOSIS, CIN, TULSA L2 ANSWER 2 OF 11 REGISTRY COPYRIGHT 1999 ACS RN 125612-26-2 REGISTRY CN Coal (CA INDEX NAME) OTHER NAMES: CN Austin Black 325 CN Fuels, coal MF Unspecified CI COM, MAN, CTS SR CAS Registry Services LC STN Files: AGRICOLA, CIN, CSCHEM, MSDS-OHS, TULSA *** STRUCTURE DIAGRAM IS NOT AVAILABLE
ANSWER 1 REGISTRY COPYRIGHT 1999 ACS RN 9004-96-0 REGISTRY CN Poly(oxy-1,2-ethanediyl),.alpha.-[(9Z)-1-oxo-9-octadecenyl]-.omega.- hydroxy- (9CI) (CA INDEX NAME) OTHER NAMES: CN Adeka Estol OEG 204 CN Akyporox O 50 CN Alkasurf O 14 CN Alkasurf O 75-9 CN Atlas G 2142 CN Atlas G 2143 CN Atlas G 2144 CN Atlas G 5507 CN Atlas G 5511 CN Cemulsol 1050 CN Cemulsol A CN Cemulsol C 105 CN Cemulsol D 8 CN Chemax E 400MO CN Chemester 300OC CN Cithrol 2MO CN Cithrol PO CN CRL 1337 CN Crodet O 6 CN Dyapol G CN E2 CN Emanon 4110 CN Emanon 4115 CN Emcol H 2A CN Emcol H 31A CN Emerest 2624 CN Emerest 2646 CN Emerest 2660 CN Empilan BP 100 CN Empilan BQ 100 CN Emulan A CN Emulphor 24 CN Emulphor A CN Emulphor VN 430 CN ES 120
CN Estax 38 S.F CN Estax 38SE CN Ethofat O CN Ethofat O 15 CN Ethofat O 20 CN Ethox MO 14 CN Ethox MO 9 CN Ethoxylated oleic acid CN Ethylan A 2 CN Ethylan A 3 CN Ethylan A 4 CN Ethylan A 6 CN Ethylene oxide-oleic acid adduct CN Extrex P 60 CN G 2142 ADDITIONAL NAMES NOT AVAILABLE IN THIS FORMAT - Use FCN, FIDE, or ALL for DISPLAY DR 12789-13-8, 8013-78-3, 8051-25-0, 9007-68-5, 1341-62-4, 55126-82-4, 55945-62-5, 37223-98-6, 37223-99-7, 37330-99-7, 141927-22-2, 82905-19-9, 39316-40-0, 41139-27-9 Deleted Registry Numbers MF (C2 H4 O)n C18 H34 O2 CI PMS, COM PCT Polyether LC STN Files: BIOSIS, CA, CAPLUS, CASREACT, CHEMCATS, CHEMLIST, CIN, CSCHEM, DDFU, DRUGU, IFICDB, IFIPAT, IFIUDB, IPA, MSDS-OHS, RTECS*, TOXLINE, TOXLIT, USPATFULL (*File contains numerically searchable property data) Other Sources: DSL**, TSCA** (**Enter CHEMLIST File for up-to-date regulatory information) Me (CH2)7 CH CH (CH2)7 C O STN INTERNATIONAL O CH2 CH2 1009 REFERENCES IN FILE CA (1967 TO DATE) 26 REFERENCES TO NON-SPECIFIC DERIVATIVES IN FILE CA 1010 REFERENCES IN FILE CAPLUS (1967 TO DATE) n OH Tento Tentodokumentdokument sloužíslou se se souhlasem souhlasem autora autora jako jako plňkový studijnístudijn materiál materi ke ke studiu studiu oborůobor VysokéVysok školy chemicko-technologicchemicko technologicé Jeho Jeho použitpou ití k jiným jiným účelům m a další ší šířenší ení bez bez souhlasu souhlasu autora autora je je zakázánozak
...important ethoxylated product with particular hydrophobic group have the same CAS number irrespective of the degree of ethoxylation. In other words, ethoxylated products of oleic acid have all the same CAS Number which is... 9004-96-0
Jiný příklad: Chlorované sloučeniny Naphthalene, dichloro- 28698-88-9 Naphthalene, trichloro- 1321-65-9 Naphthalene, 1,4-dichloro- 1825-31-6 Naphthalene, 1,2,3-trichloro- 50402-52-3
Polychlorinated biphenyl(s), PCB Přesná struktura: 1,1 -Biphenyl, 2,2,4,4 -tetrachloro- 2437-79-8 Přibližná struktura: 1,1 -Biphenyl, tetrachloro- 26914-33-0 Neznámá struktura, směsi: Polychlorinated biphenyl, 41%Cl, AROCLOR 1262, 37365-21-9
Registrační čísla CAS: představují vysoce efektivní nástroj pro vyhledávání informací o chemických sloučeninách umožňují identifikaci chemických látek i laické veřejnosti nebo nechemickým profesím jejich používání je bezproblémové v případě známých a definovaných struktur při používání pro látky s neznámými strukturami je nutná značná opatrnost