STŘEDOŠKOLSKÁ ODBORNÁ ČINNOST Bioinformatická studie nevazebných interakcí v RNA molekulách Jana Buchtíková Alexandra Foldynová
STŘEDOŠKOLSKÁ ODBORNÁ ČINNOST Obor SOČ: 03 chemie Bioinformatická studie nevazebných interakcí v RNA molekulách Autoři: Jana Buchtíková, Alexandra Foldynová Škola: Masarykova střední škola zemědělská a Vyšší odborná škola Opava Kraj: Moravskoslezský kraj Konzultanti: Mgr. Tereza Horáková, Ph.D. Mgr. Petra Kührová, Ph.D. Mgr. Marie Zgarbová, Ph.D. Opava 2016
Prohlášení Prohlašujeme, že jsme naši práci SOČ vypracovaly samostatně pod vedením Mgr. Petry Kührové, Ph.D. a Mgr. Marie Zgarbové, Ph.D. V práci jsme použily pouze podklady uvedené v přiloženém seznamu a postup při zpracování a dalším nakládání s prací je v souladu se zákonem c. 121/2000 Sb., o právu autorském, o právech souvisejících s právem autorským a o změně některých zákonu (autorský zákon) v platném znění. Dále prohlašujeme, že tištěná verze a elektronická verze soutěžní práce SOČ jsou shodné. V... dne... podpis:...
Poděkování Chtěly bychom poděkovat Mgr. Petře Kührové, Ph.D. a Mgr. Marii Zgarbové, Ph.D., bez kterých by tato práce nemohla vzniknout. Zasvětily nás do problému, trpělivě vysvětlovaly vše, co bylo nutné, odpovídaly na naše otázky, poskytovaly zpětnou vazbu a trávily s námi c as, za což jim patří velký dík. Dále bychom chtěly poděkovat Mgr. Tereze Horákové, Ph.D. za to, že nám věřila a umožnila nám vytvořit tuto práci. V neposlední řadě patří dík Masarykově střední škole zemědělské a vyšší odborné škole v Opavě a uc itelu m, kteří nás již několik let podporují.
ANOTACE Tato práce se zabývá problematikou interakcí v RNA, respektive bioinformatickou studií nevazebných interakcí v RNA molekulách. Teoretická c ást shrnuje základní informace o struktuře nukleových kyselin a nekovalentních interakcích. Praktická c ást je zaměřena na bioinformatickou studii nevazebných interakcí v RNA molekulách. Tyto interakce byly studovány jednak na neredundantních strukturách z rentgeno-krystalové databáze a na strukturách z molekulové dynamiky. Výsledky jsou diskutovány vzhledem k c etnosti interakcí mezi jednotlivými komponenty nukleových kyselin, tj. báze báze, báze cukr, báze fosfát, cukr fosfát a cukr cukr. Klíčová slova Nevazebné interakce, bioinformatická studie, databáze RNA molekul, molekulová dynamika
OBSAH 1 Úvod.... 1 2 Teoretická c ást.. 2 2.1. Vodíkové mu stky 2 2.2. Nukleové kyseliny..4 2.3. Struktura nukleových kyselin....6 2.4. Párování bází...6 2.5. Typy RNA 10 3 Praktická c ást. 12 3.1. Získání struktur pro analýzu...12 3.2 Molekulová dynamika...13 3.3 Popis programu použitého pro analýzu....14 3.4 Výsledky..........17 4. Závěr.... 22 5. Citace literatury a obrázku... 23 6. Popisy obrázku a tabulek.....26
1. ÚVOD Nukleové kyseliny jsou makromolekulární látky zastoupené v každé buňce a virech. Jako takové jsou nositelkami genetické informace a život by bez nich nebyl možný. Rozlišujeme dva typy nukleových kyselin, DNA a RNA. Rozdíl mezi nimi je velmi malý. Liší se hlavně přítomností hydroxylové skupiny na cukerné složce nukleotidu. Tento nepatrný rozdíl vede k dalekosáhlým strukturním rozdílu m. RNA molekula tvoří mnohem rozmanitější vyšší strukturní uspořádání než DNA. K stabilizaci těchto struktur přispívá celá škála interakcí. Kromě klasických kovalentních interakcí spojující jednotlivé atomy a c ásti nukleotidu (tj. fosfátová skupina, cukerná složka a nukleová báze), hrají klíc ovou roli interakce nekovalentní, nebo-li slabé. Do skupiny nekovalentních interakcí patří především vazby iontové, Van der Waalsovy a vodíkové mu stky. Hlavním tématem předložené práce jsou vodíkové vazby. V nukleových kyselinách jsou tyto vazby nezbytné pro jejich správnou biologickou funkci. Při přenosu genetické informace musí nekovalentní interakce zajistit dostatec né pevnou preferenc ní vazbu guaninu s cytosinem a adeninu s thyminem a zároveň umožnit snadné otevření dvoušrobovice pro přepis informace. Cílem předložené práce byla bioinformatická studie ru zných typu vodíkových vazeb ve strukturách obsahující RNA molekulu. Zaměřily jsme se na kvantitativní posouzení interakcí mezi jednotlivými komponenty nukleových kyselin, tj. báze báze, báze cukr, báze fosfát, cukr fosfát a cukr cukr. RNA struktury byly získány z databáze dostupných experimentálních struktur a dále byly roztříděny do skupin podle kvality experimentu. Navíc byly do studie zahrnuty také data pocházející z molekulové dynamiky. 1
2. TEORETICKÁ ČÁST V přírodě se volné atomy vyskytují jen ojediněle. S výjimkou vzácných plynu je najdeme převážně vázané ve víceatomových molekulách. Chemické vazby vznikají, pokud má nové seskupení atomu menší energii než jednotlivé atomy. Spojení mezi jednotlivými atomy zprostředkovávají kovalentní vazby, které jsou realizovány pomocí valenc ních elektronu. [1]Kromě klasických kovalentních vazeb existují i vazby nekovalentní, nebo-li slabé. V dnešní době známe několik typu nekovalentních chemických vazeb. Mezi tyto interakce řadíme iontové vazby, Van der Waalsovy síly a vodíkové mu stky. [2] 2.1. Vodíkové můstky Nekovalentní interakce mají v přírodě neuvěřitelně široké uplatnění i přesto, že jsou mnohem slabší než kovalentní interakce. Život, tak jak jej známe, by bez nich nebyl možný. Klasickým příkladem du sledku přítomnosti nekovalentních interakcí je voda, kde tento druh interakcí zpu sobuje zcela odlišné chování od chování jiných systému, které mají stejný poc et elektronu (např. amoniak, fluorovodík nebo methan). Ve srovnání s těmito systémy má voda zcela unikátní vlastnosti jako jsou velmi vysoký bod varu a bod tání, vysoká dielektrická konstanta nebo vysoké povrchové napětí. Dalším neméně du ležitým příkladem přítomnosti nekovalentních vazeb je jejich funkce ve stabilizaci a struktuře biomolekul, ať již nukleových kyselin, tak proteinu. [3] Nejběžnějším a také nejsilnějším typem nekovalentních interakcí jsou vodíkové vazby. Jedná se o slabou interakci mezi atomem vodíku, "ochuzeným" o elektrony a jiným atomem, který má "přebytek" elektronu (tj. místem s vysokou elektronovou hustotou). K "ochuzení" atomu vodíku dochází v případě, že je vodík vázán chemickou vazbou na tzv. elektronegativní atom. Nejc astější příklady 2
vodíkových mu stku mezi postranními skupinami molekul je X-H Y, kde X a Y jsou elektronegativní atomy (F, O, N, ale mu že být i C) a Y navíc obsahuje volné elektronové páry. Významnou vlastností vodíkové vazby je její geometrická specific nost. Vodíková vazba je nejpevnější pokud atomy X, H a Y mají lineární uspořádání. [4] Obrázek 1. Schéma přenosu elektronové hustoty při vzniku vodíkového mu stku. [vlastní obrázek] Nekovalentní interakce hrají klíc ovou roli ve struktuře nukleových kyselin. Pro to, aby DNA i RNA správně plnily svou funkci, nesmí být rigidní, ale musí se relativně snadno otevírat. Proces otevření musí být přesný a musí být reversibilní. To znamená, že musí probíhat oběma směry. Na jedné straně musí být tyto nekovalentní interakce natolik silné, aby zajistily preferenc ní vazbu guaninu s cytosinem a adeninu s thyminem. Zároveň musí dojít k otevření dvoušroubovice. Je tedy nutno, aby na druhé straně byly slabé. [3] N H N H O R N N N H N O N R Obrázek 2. Ukázka spojení adeninu a uracilu pomocí vodíkových mu stku. [vlastní obrázek] 3
H N O H N R N N N N H H N O N R H Obrázek 3. Ukázka spojení guaninu a cytosinu pomocí vodíkových mu stku. [vlastní obrázek] 2.2. Nukleové kyseliny Nukleové kyseliny jsou makromolekulární látky tvořící přibližně 1% organické látky zastoupené prakticky v každé buňce a virech. Hrají klíc ovou roli nejenom v přenosu genetické informace, ale také při syntéze bílkovin. Základními stavebními prvky nukleových kyselin jsou nukleotidy tvořené zbytkem kyseliny fosforec né (fosfátem), dusíkatou bází a pětiuhlíkatým cukrem (pentózou). Dusíkaté báze dělíme podle slouc eniny, od niž jsou odvozené na purinové (adenin, guanin) a pyrimidinové (cytosin, uracil a thymin). Adenin (A), guanin (G), cytosin (C) a uracil (U) jsou nukleové báze vyskytující se v RNA. V DNA je jen uracil nahrazen thyminem (T). Klíc ový rozdíl mezi RNA a DNA leží v cukerné složce. V DNA vystupuje jako monosacharid deoxyribóza a v RNA ribóza. [5] Tento nepatrný rozdíl v OH skupině, zpu sobuje zcela rozdílnou strukturu a flexibilitu RNA. Přítomnost OH skupiny na cukru dokonce zpu sobuje mnohem větší nestabilitu (reaktivnost) RNA molekuly, c ehož využívají RNA enzymy ribozymy. [5] 4
Obrázek 4. Struktura nukleotidu. [vlastní obrázek] Obrázek 5. Struktura základních nukleových bází. [vlastní obrázek] Tabulka 1: Přehled jednotlivých složek nukleových kyselin. [6] Složení nukleových kyselin DNA RNA purinové báze adenin (A) adenin (A) guanin (G) guanin (G) pyrimidinové báze cytosin (C) cytosin (C) thymin (T) uracil (U) monosacharid 2-deoxy-β-D-ribosa β-d-ribosa kyselina trihydrogenfosforec ná Zbytek kyseliny Zbytek kyseliny fosforec né fosforec né 5
2.3. Struktura nukleových kyselin Biomakromolekuly DNA i RNA vznikají vzájemným spojováním nukleotidu prostřednictvím esterové vazby. [6] Spojení nastává mezi cukernou složkou prvního nukleotidu a fosfátovým zbytkem následujícího nukleotidu. Základní páteř nukleové kyseliny je tedy tvořena střídajícími se cukernými a fosfátovými skupinami. Řazení jednotlivých nukleotidu v řetězci nukleových kyselin je oznac ováno jako primární struktura. [7] Obrázek 6. Zobrazení primární struktury RNA a DNA. [vlastní obrázek] 2.4. Párování bází Jednotlivé nukleové báze spolu vytvářejí pomocí vodíkových vazeb páry, jež vedou ke stabilizaci celé biomolekuly. Tento proces je oznac ován jako párování bází. V typickém případě se párování bází odehrává na základě Watson- Crickovských pravidel komplementarity, tzn. v RNA se adenin (A) páruje s uracilem (U) a guanin (G) s cytosinem (C). Pro tyto komplementární páry platí, že jedna z nukleových bází je vždy purin (A c i G), druhá je pyrimidin (C, T, U). 6
Tento typ párování oznac ujeme jako kanonické Watson-Crickovské (WC) párování. Kromě kanonického WC párování se ve strukturách nukleových kyselin (převážně tedy v RNA) potkáváme i s jinými druhy párování. Každou nukleovou bázi si lze představit jako pravoúhlý trojúhelník, jehož přepona představuje takzvanou Hoogstenovu hranu (Hoogsten Edge, H) a odvěsny znázorňují Watson-Crickovu hranu (Watson-Crick Edge, WC) a hranu cukru (Sugar Edge, SE). [8] Klasifikaci a nomenklaturu párování RNA bází provedl Leontis a Westhof v roce 2001. Tato klasifikace interakcí mezi WC, H a SE je navíc rozšířena ještě o orientaci báze (orientace glykosidické vazby spojující bázi s cukrem). [9] Celkem tedy mu žeme hovořit o 12-ti rodinách s celkem 168 možnostmi párování. Obrázek 7. Zobrazení klasifikace hran RNA nukleotidu dle Leontise a Westhofa. [10] 7
Obrázek 8. Párování bází v pozici cis a trans. Znac ky uvedené v obrázcích představují typy spojení shodné se standardním znac ením párováním v sekundární struktuře dle Leontise a Westhofa. [10] Dalším typem nekanonických interakcí, vyskytujících se hlavně v RNA, jsou interakce mezi fosfátovou skupinou a nukleovou bází. Tento typ interakce významně přispívá k stabilizaci některých du ležitých strukturních motivu v RNA, jako je např. GAGA a UUCG tetraloop c i sarcin-ricinová smyc ka. Stejně jako párování mezi bázemi, tak i tento druh interakcí má svoji klasifikaci a nomenklaturu. V roce 2009 ji zavedl Zirbel a kol. [11] Podle této klasifikace rozlišujeme celkem 10 možností vazby báze na fosfátovou skupinu. Tyto možnosti jsou oznac eny 0BPh 9BPh (pozn. BPh z angl. Base-Phosphate). Aplikujeme-li tyto možnosti na nukleové báze, získáváme 17 ru zných druhu těchto interakcí, ty znázorňuje Obrázek 9. 8
Obrázek 9. Klasifikace interakcí báze-fosfát. [12] Díky výše zmíněným interakcím, jsou nukleové kyseliny schopny tvořit struktury vyššího uspořádání. Mluvíme o tzv. sekundární a terciální struktuře. Nejzákladnější typ sekundární struktury je dvoušroubovice (helix) vznikající pomocí komplementárního párování báze-báze tj. pomocí Watson-Crickovského párování. Helikální struktury se c asto stác ejí do šroubovic vyšších řádu, které nazýváme terciální strukturou. Setkáváme se s nimi hlavně u molekul DNA, kde se jedná o tzv. superšroubovice. Ukazuje se, že RNA spíše vytváří komplikované nesymetrické struktury, které svou formou připomínají spíše terciální struktury globulárních bílkovin. Terciální uspořádání tedy urc uje prostorové rozložení celé molekuly RNA, její 3D strukturu a tvoří ho vzájemné interakce struktur sekundárních pomocí vodíkových vazeb. 9
Obrázek 10. Ukázka sekundární a terciální struktury nukleových kyselin. [vlastní obrázek] (RNA PDB kód 4X62, DNA PDB kód 1BNA) 2.5. Typy RNA Existují celkem tři základní typy RNA a těmi jsou ribozomální RNA, informac ní RNA a přenosová RNA. Ribozomální typ RNA (rrna) je souc ástí ribozomu. Ribozomy jsou buněc né organely, ve kterých probíhá syntéza bílkovin. [7] Význam informac ní RNA (mrna) spoc ívá v přenosu genetické informace z jádra buňky do cytoplasmy, kde je matricí pro syntézu bílkovin [6] a typ přenosové RNA (trna) přenáší (transportuje) aminokyseliny do ribozomu, kde jsou sestavovány do polypeptidových řetězcu. Pro každou aminokyselinu existuje alespoň jedna trna. Molekuly trna jsou relativně malé, obsahují přibližně 100 nukleotidu. Jejich struktura tvarem připomíná trojlístek. V případě, že má trna navázanou aminokyselinu, nazývá se aktivovaná trna. V jedné ze smyc ek trna je antikodon, tj. trojice bází, která je komplementární k trojici bází v mrna, ke kodonu. Tak je zajištěno správné řazení aminokyselin do polypeptidových řetězcu proteinu. [8] 10
Obrázek 11. Ukázka antikodonu, jenž je komplementární k trojici bází v mrna - ke kodonu. [13] 11
3. PRAKTICKÁ ČÁST Úvod Předložená práce se zabývá studiem ru zných typu vodíkových vazeb v biomolekulách obsahující RNA. Předmětem zájmu se staly biomolekuly získané z dostupných experimentálních struktur roztříděné do skupin dle kvality experimentu a dále struktury generované pomocí molekulární dynamiky (MD) RNA smyc ky. Cílem práce bylo kvantitativní posouzení interakcí mezi jednotlivými komponenty nukleových kyselin, tj. báze báze, báze cukr, báze fosfát, cukr fosfát a cukr cukr. 3.1 Získání struktur pro analýzu Předložená práce je založena na studiu biomolekul dostupných v experimentálních databázích a na strukturách generovaných pomocí nástroju výpoc etní chemie. Nejznámější a nejpoužívanější experimentální databáze struktur je Protein Data Bank (www.pdb.org). Tato databáze zahrnuje struktury biomolekul získaných pomocí široké škály experimentálních metod od rentgenové krystalografie, přes nukleární magnetickou rezonanci, až po kryoskopické metody. V PDB databázi lze velmi jednoduše vyhledávat a třídit biomolekuly pomocí vyhledávacích nástroju. Z PDB databáze byly vybrány všechny biomolekuly obsahující RNA a získané pomocí rentgenové krystalografie. Další použitou sadou struktur byly biomolekuly z FR3D databáze. Tato databáze obsahuje pravidelně obnovovanou sadu unikátních (neredundantních) RNA biomolekul získaných pomocí rentgenové krystalografie. Unikátnost struktury znamená, že se neopakují stejné sekvence získané v rámci jiných experimentu. FR3D databáze je rozdělena podle rozlišení uložených struktur. Rozlišení je hodnota v Å, která poukazuje na kvalitu získané struktury. Čím je toto c íslo nižší, 12
tím je struktura lépe rozlišena (lepší) tj. mluvíme o vyšším rozlišení. Typicky se tato hodnota pohybuje v rozmezí 1-5Å. U struktur s velmi dobrým (vysokým) rozlišením se tato hodnota pohybuje kolem 1.5 Å. Z FR3D databáze byly použity tři sady struktur s rozlišením do 1.5 Å, do 2.5 Å a do 4 Å. Poslední sada struktur pro analýzu byla získána pomocí nástroju výpoc etní chemie a to pomocí molekulové dynamiky. 3.2. Molekulová dynamika Molekulová dynamika je metoda založena na studiu chování systému v závislosti na c ase tj. simuluje posloupnost stavu studovaného systému v pru běhu c asu. Každý atom je popsán pomocí jeho poloměru a náboje. [14] Chování mezi jednotlivými atomy je aproximováno pomocí hmotných bodu spojených pružinami. [15] Výpoc et pohybu a rychlosti jednotlivých atomu systému je uskutec něn pomocí Newtonových zákonu. [14] Nejprve se spoc ítá síla pu sobící na každý atom z potenciální energie a poté se ze síly urc í rychlost daného atomu. Potenciální energie je charakterizována pomocí souc tu ru zných příspěvku vazebných E vaz a nevazebných interakcí E nevaz. Vazebné příspěvky zahrnují energii vazeb (E vazeb ), energii úhlu (E úhlu ) a energii dihedrálních úhlu (E dih ). Nevazebné příspěvky jsou složené z elektrostatických (E el ) a Van der Waalsových interakcích (E vdw ). Souhrn těchto parametru se nazývá silové pole. Přic emž hodnoty jednotlivých parametru silového pole (náboje, rovnovážné délky vazeb, velikosti úhlu, silové konstanty) jsou získány na základě experimentu a kvantových výpoc tu. 13
Obrázek 12. Znázornění interakcí v silovém poli. [vlastní obrázek] V předložené práci byla použita molekulová dynamika malé RNA smyc ky o sekvenci gcggagacgc ve dvou provedeních: ve složeném stavu (nativní struktura) a ve zcela rozbaleném stavu. Nativní struktura GAGA smyc ky byla vystřižena z RTG struktury sarcin-ricinové smyc ky ribozomální RNA bakterie E. coli 23S o rozlišení 1.04 Å (PDB ID: 1Q9A, residua 26658-2663). [16] Rozbalená struktura byla vystavěna pomocí programu z balíc ku AMBER. [17] Obě startovní struktury pro simulaci GAGA smyc ky byly vystavěny, zasolvatovány a doplněny o 1M roztok KCl použitím programového balíc ku AMBER s využitím silového pole ff99bsc0χ OL3. [18] Struktura byla poté zminimalizovaná a ekvilibrována podle standardního protokolu. [18] Simulace poté běžely po dobu 1 μs za teploty 300 K. 3.3 Popis programu použitého pro analýzu Program použitý v této práci byl napsaný v jazyce C doc. Pavlem Banášem z Katedry fyzikální chemie, UP Olomouc. Program je založen na vyhledávání páru donor-akceptor v RNA molekulách (Obrázek 13). Program strukturu RNA z databáze doplní o vodíky a zac ne vyhledávat potenciální vodíkové vazby mezi donory a akceptory tak, aby byly splněny kritéria pro vodíkovou vazbu. Tyto kritéria jsou nastaveny tak, že vzdálenost mezi těžkými atomy je maximálně 3.5 Å a úhel mezi atomy podílející se na vodíkové vazbě je maximálně 40. U struktur 14
pocházejících z molekulových simulací vodíky nejsou doplňovány, neboť tyto struktury vodíky již obsahují. Obrázek 13. Znázornění akceptoru a donoru v RNA struktuře. Atomy vystupující jako donory (H02, H1, H3, H414, H52, O2, N1(G), N3(U), N2, N6, N4) jsou znázorněny modře a atomy vystupující jako akceptory (O1P, O2P, O5, O4, O3, O2, N7, N3(C,G,A), O6, O2, O4) jsou znázorněny zeleně. [vlastní obrázek] Program byl testován na dvou strukturách. Jedna byla výše zmíněná GAGA smyc ka a druhá struktura byl RNA duplex pocházející z PDB databáze (PDB ID: 1QC0 [19], rozlišení 1.2 Å). GAGA smyc ka je složená z krátké dvoušroubovice obsahující tři WC páry (tj. devět báze-báze interakcí) a GAGA smyc ky stabilizované pomocí šesti vodíkových vazeb, a sice dvou možných báze-fosfát interakcí (G 4 (N1) A 7 (O2P) nebo G 4 (N2) A 7 (O2P)), jedné báze-báze interakce (G 4 (N2) A 7 (N7)), jedné interakce báze-cukr (G 4 (O2) G 6 (N7)) a dvou cukrfosfát interakcí. (A 7 (O2 )) G 8 (O1P) a C 1 (O2 )) G 2 (O5 )). Po porovnání výpisu z programu (obrázek 15) a zobrazení dané GAGA struktury jsme ověřily správnou funkc nost programu. Totéž srovnání bylo provedeno pro RNA duplex (1QCO). Zde jsme dohledaly celkem 27 interakcí báze báze, což odpovídá skutec nými sedmi GC páru m a třem AU páru m (obrázek 16). 15
Obrázek 14. Ukázka jednotlivých interakcí ve struktuře GAGA. [vlastní obrázek] Obrázek 15. Ukázka výpisu z používaného programu pro RNA smyc ku. [vlastní obrázek] 16
Obrázek 16. Ukázka interakcí v duplexu 1QC0. [vlastní obrázek] 3.4 Výsledky Tabulka 2 shrnuje pru měrné populace pro jednotlivé interakce poc ítané pro databázi neredundantních krystalových struktur s rozlišením do 1.5 Å, 2.5 Å a 4 Å. V těchto skupinách bylo postupně analyzováno 61, 321 a 1048 struktur. Z populací je možno pozorovat opakující se trend kvantitativního zastoupení jednotlivých interakcí. Ve všech setech je nejvíce zastoupena interakce báze-báze. Tento výsledek není vzhledem k povaze struktury RNA překvapivý. Mnohem zajímavějším výsledkem je, že interakce cukr-cukr a cukr-fosfát tvoří podstatnou skupinu stabilizujících interakcí. 17
Tabulka 2: Pru měrné populace (v procentech) jednotlivých interakcí pro experimentální struktury. [vlastní tabulka] bázecukcukr cukr- Rozlišení báze-báze báze-fosfát cukr-fosfát 1.5 Å 71 3 3 16 7 2.5 Å 53 3 6 15 23 4 Å 58 4 9 17 12 Do grafu c. 1, 2, 3 je zaznamenána analýza pro jednotlivé struktury ze všech výše uvedených setu neredundantních krystalových struktur s rozlišením do 1.5 Å, 2.5 Å a 4 Å. Pro každou strukturu je znázorněna frekvence jednotlivých interakcí, které jsou v grafech vyneseny vždy proti interakci báze-báze. Na obrázku vlevo je znázorněna interakce báze-fosfát a cukr-fosfát spolu s interakcí báze-báze, vpravo pak interakce báze-cukr a cukr-cukr spolu s interakcí báze-báze. Z grafu lze opět pozorovat opakující se trend v zastoupení jednotlivých interakcí s jasnou převahou interakce báze-báze pro většinu struktur. Rovněž lze pozorovat, že pru měrné populace uvedené v tabulce 2 nejsou signifikantně ovlivněny odlehlými hodnotami. Interakce cukr-cukr a cukr-fosfát se významně podílejí na stabilitě studovaných RNA struktur a přispívají přibližně stejnou měrou. Grafy c. 1: Biomolekuly o rozlišení do 1.5Å. 18
Grafy c. 2: Biomolekuly o rozlišení do 2.5Å. Grafy c. 3: Biomolekuly o rozlišení do 4.0Å. Stejná analýza interakcí byla provedena pro struktury generované pomocí molekulové dynamiky. Vstupní strukturou pro MD simulace se stala výše zmíněná struktura RNA smyc ky o sekvenci gcggagacgc. Molekulově dynamické trajektorie byly použity dvě, přic emž se lišily strukturou, ze které zac ínaly (obrázek 17). 19
Obrázek 17. Ru zná startovní struktura RNA smyc ky pro MD simulaci (vlevo složená, vpravo rozbalená) [vlastní obrázek] Grafy c. 4 a 5 ukazují stejným zpu sobem jako grafy c. 1, 2 a 3 kvantitativní zastoupení jednotlivých interakcí. Z grafu je možno pozorovat převahu interakce báze-báze u simulace složené smyc ky na rozdíl od simulace rozbalené, kde se tato interakce ztrácí a je nahrazena cukr-fosfát, báze-fosfát a cukr-cukr interakcemi. Grafy c. 4 : Grafy z dynamiky složené smyc ky. RNA smyc ka obsahuje ~2/3 interakce báze-báze, dále pak obsahuje ve stejném zastoupení interakce báze-fosfát, báze-cukr a cukr-fosfát. Z grafu c. 4 je vidět, že všechny tyto interakce jsou v pru běhu celé MD simulace složené smyc ky populovány. Nicméně z du sledku flexibility RNA smyc ky dochází k otevírání terminálního páru bází duplexu a dynamice bází smyc ky což má za následek 20
populaci i jiných interakcí než jsou v nativní struktuře. Graf c. 5 ukazuje daleko větší dynamiku a flexibilitu rozbalené RNA smyc ky. V pru běhu této simulace nedojde k vytvoření nativní struktury, ale jsou generovány struktury jednovláknové popřípadě stoc ené do klubka. Zastoupení interakcí je tak posunuto k interakcím cukr-fosfát, báze-fosfát a cukr-cukr. Grafy c. 5: Grafy z dynamiky smyc ky startující z rozbaleného stavu. 21
4. ZÁVĚR Předložená práce se zabývá studiem ru zných typu vodíkových vazeb v biomolekulách obsahující RNA. Cílem této práce bylo kvantitativní posouzení interakcí mezi jednotlivými komponenty nukleových kyselin, tj. báze báze, báze cukr, báze fosfát, cukr fosfát, cukr cukr. Práce je zaměřena jednak na experimentální struktury z rentgenostrukturní databáze. Pro tuto c ást analýzy byly vybrány neredundantní struktury ve třech kvalitách rozlišení (do 1.5Å, 2.5Å a 4Å). Celkem bylo analyzováno 1048 struktur. Výsledky byly posouzeny jak s ohledem na pru měrné populace přes dané skupiny struktur, tak přes jednotlivé struktury. Oc ekáváným výsledkem vzhledem k povaze RNA struktur bylo, že nejpopulovanější interakcí je interakce báze-báze. Tento výsledek byl potvrzen a dále bylo ukázáno, že interakce cukr-fosfát a cukrcukr se obě významně podílejí na stabilizaci RNA struktur. Tento závěr byl potvrzen také analýzou molekulově dynamických simulací RNA smyc ky o sekvenci gcggagacgc. Studium stabilizace RNA má velký přínos pro pochopení a objasnění struktury a funkce biologicky významných molekul. Předložená práce je prvním krokem ke studiu interakcí dalších než dosud klasifikovaných v literatuře. 22
5. CITACE LITERATURY A OBRÁZKŮ [1] Marec ek, A., Honza, J.: Chemie pro c tyřletá gymnázia. 3.opr. vid., Olomouc: Nakladatelství, Olomouc, 1998, ISBN 80-7182-055-5. [2] Marec ek, A., Honza, J.: Chemie pro c tyřletá gymnázia, 1.díl, Olomouc: Nakladatelství, Olomouc, 2005, ISBN 80-7182-055-5. [3] Hobza, P., Havlas, Z.:. Netušená síla slabých vazeb. Vesmír [online]. 2010, 89, [cit. 2016-02-21]. Dostupné z: http://casopis.vesmir.cz/clanek/netusenasila-slabych-vazeb. [4] Hobza, P.: Nekovalentní interakce s přímou participací vodíku: vodíková vazba, nepravá vodíková vazba a dvouvodíková vazba. Chem. Listy 2008, 102, 884-888. [5] Chemické složení buňky. Webcache.googleusercontent.com [online]. [cit. 2016-02- 23]. Dostupné z: http://webcache.googleusercontent.com/search?9=cache:e99amolofflj:files.mat uritn%25c3%25ad%2520ot%25c3%25a1zka%2520- %2520Chemick%25C3%25A9%2520slo%25C5%25BEen%25C3. [6] Marec ek, A., Honza, J.: Chemie Pro c tyřletá gymnázia. 2. vyd. Brno: Nakladatelství Proton, 2014, s. 170,173. ISBN 978-80-900402-6-4. [7] Kolektiv autoru : Přehled středoškolské chemie. 3. dopl. vyd., 1. vyd. Praha: Nakladatelství, SPN - pedagogické nakladatelství, 1995, s. 319, 321, 322, 323, 324. ISBN 80-85937-08-5. [8] Leontis, N. B., Westhof, E.: Geometric nomenclature and classification of RNA base pairs. Rna 2001, 7 (4), 499-512. 23
[9] Leontis N.B., Westhof E.: Geometricnomenclature and classificationof RNA base pairs. RNA 2001, 7(4), 499-512. [10] Leontis, N.B., Westhof, E.: The annotation of RNA motifs, Comp Funct Genom, 2002. 3 518-524. [11] Zirbel, C. L., Sponer, J. E., Sponer, J., Stombaugh, J., Leontis, N. B.: Classification and energetics of the base-phosphate interactions in RNA. Nucleic AcidsRes.2009, 37 (15), 4898-4918. [12] Zirbel, C. L., Sponer, J. E., Sponer, J., Stombaugh, J., Leontis, N. B.,: Classification and energetics of the base-phosphate interactions in RNA. Nucleic Acids Res 2009, 37 (15), 4898-4918. [13] Brauner, F., ELUC: Transkripce [online]. [cit. 2016-02-08]. Dostupné z: https://eluc.kr-olomoucky.cz/verejne/lekce/261. [14] Case, D.A., Cheatham, T.E., Darden, T., Gohlke, H., Luo, R., Merz, K.M., Onufriev, A., Simmerling, C., Wang, B., Woods, RJ.: The Amber biomolecular simulation programs. J. Comput. Chem. 26 (16), 2005. [15] Střelcová, Z.: Poc ítac ová chemie výpoc etně nároc né simulace chemických a biomolekulárních systému Národní centrum pro výzkum biomolekul, Masarykova univerzita, Kotlářská 2, 611 37 Brno, Česká Republika. [16] Correll, C.C. Beneken J., Plantinga M.J., Lubbers, M. and Chan, Y.-L.: The common and the distinctive features of the bulged-g motif based on a 1.04 A resolution RNA structure. National Center for Biotechnology Information. Nucleic Acids Res. 2003 Dec 1; 31(23): 6806 6818. [17] Case, D.A., Berryman, J.T., Betz, R.M., Cerutti, D.S., Cheatham, T.E., Darden, T.A., Duke, R.E., Giese, T.J., Gohlke, H., Goetz, A.W., Homeyer,N., Izadi, S., Janowski, P., Kaus, J., Kovalenko, A., Lee, T.S., LeGrand, S., Luchko, P.Li., T., Luo, R., Madej, B., Merz, K.M., Monard, G., Needham, P., Nguyen, H., Nguyen, H.T., Omelyan, I., Onufriev, A, Roe, D.R., Roitberg, A, Salomon-Ferrer, R., Simmerling, C.L., Smith, W., Swails, J., Walker, R.C., Wang, J., Wolf, R.M., 24
Wu, X., York D.M. and Kollman P.A.: AMBER 2015, University of California, San Francisco. [18] Zgarbova, M., Otyepka, M., Sponer, J., Mladek, A., Banas, P., Cheatham, T. E., Jurecka, P.: Refinement of the Cornell et al. Nucleic Acids Force Field Based on Reference Quantum Chemical Calculations of Glycosidic Torsion Profiles. J Chem Theory Comput 2011,7 (9), 2886-2902. [19] Klosterman P.S., Shah S.A., Steitz T.A.:Crystal structures of two plasmid copy control related RNA duplexes: An 18 base pair duplex at 1.20 A resolution and a 19 base pair duplex at 1.55 A resolution. National Center for Biotechnology Information. Biochemistry. 1999 Nov 9;38(45):14784-92. 25
6. SEZNAM OBRÁZKŮ A TABULEK Tabulka 1: Přehled jednotlivých složek nukleových kyselin Tabulka 2: Pru měrné populace (v procentech) jednotlivých interakcí pro experimentální struktury. Obrázek 1. Schéma přenosu elektronové hustoty při vzniku vodíkového mu stku. Obrázek 2. Ukázka spojení adeninu a uracilu pomocí vodíkových mu stku. Obrázek 3. Ukázka spojení guaninu s cytosinem pomocí vodíkových mu stku Obrázek 4. Struktura nukleotidu. Obrázek 5. Struktura základních nukleových bází. Obrázek 6. Zobrazení primární struktury RNA a DNA. Obrázek 7. Zobrazení klasifikace hran RNA nukleotidu dle Leontise a Westhofa. Obrázek 8. Párování bází v pozici cis a trans. Znac ky uvedené v obrázcích představují typy spojení shodné se standardním znac ením párováním v sekundární struktuře dle Leontise a Westhofa Obrázek 9. Klasifikace interakcí báze-fosfát. Obrázek 10. Ukázka sekundární a terciální struktury nukleových kyselin. Obrázek 11. Ukázka antikodonu, jenž je komplementární k trojici bází v mrna - ke kodonu. Obrázek 12. Znázornění interakcí v silovém poli. Obrázek 13. Znázornění akceptoru a donoru v RNA struktuře. Atomy vystupující jako donory (H02, H1, H3, H414, H52, O2, G(N1), U(N3), N2, N6, N4) jsou znázorněny zeleně a atomy vystupující jako Akceptory (O1P, O2P, O5, O4, O3, O2, N7, N3(C,G,A), O6, O2, O4) jsou znázorněny modře. Obrázek 14. Ukázka jednotlivých interakcí ve struktuře GAGA. 26
Obrázek 15. Ukázka výpisu z používaného programu pro RNA smyc ku. Obrázek 16. Ukázka interakcí v duplexu 1QC0. Obrázek 17. Ru zná startovní struktura RNA smyc ky pro MD simulaci (vlevo složená, vpravo rozbalená) 27