Řešení struktury proteinů pomocí NMR spektroskopie
Využití NMR spektroskopie v jednotlivých oborech podle nositele Nobelovy ceny za chemii Prof. Richarda Ernsta: Medicine Biochemistry Chemistry Physics J.W. Emsley: NMR started as the plaything of the physicists, became the favourite toy of the chemists and finally went on to seduce biochemists.
Důvody pro využití NMR spektroskopie ke studiu biomolekul fyziologické prostředí jednoduchá příprava vzorku vysoce selektivní odezva široký rozsah fyzikálně-chemických vlastností protože se zabýváme NMR spektroskopií
1. Jaké typy biologicky aktivních molekul? peptidy a proteiny nukleové kyseliny oligosacharidy 2. Jaký typ informace může být pomocí NMR získán? identifikace substrátu prostorová struktura molekuly studium dynamického chování systému prostorová struktura komplexu zkoumání vazby ligandu a substrátu
Strategie pro určování struktur biomolekul NMR vzorek NMR experimenty NMR spektra Přiřazení signálů Přiřazení experimentálních NMR parametrů (NOE ) Obecné informace o molekule (primární struktura, kovalentní vazby ) Odhad přibližné struktury Zhodnocení kvality struktur Oprava přiřazení NMR parametrů, signálů Výpočet souboru struktur Výpočet statistických údajů pro soubor konečných struktur Porovnání s databázemi (Procheck, Whatif.) Výpočet NOESY spekter
Požadavky na vzorek pro NMR experimenty Úspěšné řešení proteinových struktur bezpodmínečně vyžaduje kvalitní spolupráci mezi NMR specialisty a biochemiky! Vzorek musí zůstat aktivní a nedenaturovaný během NMR experimentů!!! rozpouštědlo H 2 O + 5-10% D 2 O (časová stabilizace magnetického pole) pufr teplota aditiva nejběžnější je fosfátový pufr, neobsahuje žádné protony acetátový pufr (lze pořídit deuterovaný) podle požadavků studovaného materiálu (15 40C) nutná aditiva je možné někdy zaměnit za deuterovaná analoga koncentrace pro NMR experimenty musí být v rozsahu alespoň 0.1-1.0 mm, vzorek nesmí podléhat agregaci, koagulaci, sebezničení v tomto konc. rozmezí stabilita nutná dlouhodobá stabilita v rozsahu minimálně několika týdnů
Příprava vzorku proteinu pro NMR měření 1. Získání DNA proteinu 2. Příprava plasmidové DNA 3. Exprese rekombinantního proteinu, např. v E.Coli 4. Izolace a čištění 5. Zakoncentrování vzorku 6. Zopakování procesu se značeným médiem
Příprava vzorků se zvýšeným obsahem 13 C/ 15 N C C H C H C CO N CO C H H H Exprese proteinů: - v minimálním médiu ( 15 NH 4 Cl, 15 NH 4 SO 4 - jediný zdroj 15 N ) ( 13 C-glukosa, 13 C-glycerol - jediný zdroj 13 C) - izotopově obohacené růstové médium
Segmentové izotopové obohacení Capsidový protein HIV-1 N-terminální doména C-terminální doména
Segmentové izotopové obohacení 1. Obě domény se exprimují zvlášť N-term Intein N-term Tag Cys C-term 2. Intein se odštěpí thiolem a Tag proteasou N-term Intein N-term Tag Cys C-term 3. Domény se spojí vytvořením peptidové vazby N-term Cys C-term
Segmentové izotopové obohacení 15 N 1 doména obohacena ( 15 N) celý protein obohacen ( 15 N) 1 H
Cell-free expresní systém Zdroj: propagační materiál firmy Promega
Přehled metod pro izotopové obohacení proteinů http://www.protein-nmr.org.uk/labelling.html
Postup přípravy izotopově obohaceného vzorku Příprava neznačeného vzorku proteinu o příslušné koncentraci kontrola správného sbalení proteinu kontrola dostatečně vysoké koncentrace sledování dlouhodobé stability Příprava 15 N obohaceného vzorku proteinu kontrola čistoty proteinu kontrola správného sbalení proteinu kontrola dostatečně vysoké koncentrace Příprava 13 C/ 15 N ( 13 C/ 15 N/ 2 H) obohaceného vzorku proteinu vlastní strukturní studie
Zakoncentrování vzorku Koncentrace měřeného vzorku v případě využití chlazené sondy Objem roztoku ~ 0,5 1,0 mm ~ 0,1 0,5 mm 250-500 l
Srovnání NMR spekter sbalené a nesbalené struktury proteinu správně sbalená forma proteinu WVQPI 107 AA (12 kda) IMMCS 83 AA (9 kda) WVQPI 107 AA (12 kda) IMMCS nesbalená forma téhož proteinu ( 1 H) 10.5 10.0 9.5 9.0 8.5 8.0 7.5 7.0 6.5 ppm 1 H- 15 N korelace v oblasti amidických vodíků (vzorek nespecificky obohacen 15 N) čerstvě připravený vzorek ( 15 N) 108 110 112 vzorek po 5 dnech 114 116 118 120 122 124 126 128 ( 1 H) 9.5 9.0 8.5 8.0 7.5 7.0 ppm 9.5 9.0 8.5 8.0 7.5 7.0 ppm
Strategie pro určování struktur biomolekul NMR vzorek NMR experimenty NMR spektra Přiřazení signálů Přiřazení experimentálních NMR parametrů (NOE ) Obecné informace o molekule (primární struktura, kovalentní vazby ) Odhad přibližné struktury Zhodnocení kvality struktur Oprava přiřazení NMR parametrů, signálů Výpočet souboru struktur Výpočet statistických údajů pro soubor konečných struktur Porovnání s databázemi (Procheck, Whatif.) Výpočet NOESY spekter
Biomolekulární NMR spektroskopie: měřená jádra 1 H 13 C 15 N 2 H vysoké přirozené zastoupení (99.98%) vysoká citlivost (1.00) malá disperze chemických posunů NMR signálů (~15.0 ppm) velká disperze chemických posunů NMR signálů (~200.0 ppm) nízké přirozené zastoupení (1.108%), možné uměle navýšit až na 100% nízká citlivost (1.76x10-4 ), po 100%ním izotopovém obohacení (1.59x10-2 ) střední disperze chemických posunů NMR signálů (~30.0 ppm) (oproti 13 C nezávislost na typu aminokyseliny) nízké přirozené zastoupení (0.37%), možné uměle navýšit až na 100% velmi nízká citlivost (3.85x10-6 ), po 100%ním izotopovém obohacení (1.04x10-3 ) používá se pro speciální účely
Proč H 2 O? Potlačení signálu vody 1. Voda je fyziologické prostředí 2. Nelze použít D 2 O z důvodů chemické výměny s amidickými protony. Signál H 2 O je 10 4-10 5 násobně intenzivnější než odezva měřené molekuly.
Potlačení signálu vody: metoda presaturace CW-ozařování 90 Během relaxační doby ozařujeme signál vody slabým RF polem. 1 H spektrum proteinu po presaturaci H 2 O zbytkový signál H 2 O
Potlačení signálu vody: metoda WATERGATE Selektivní manipulace se signály vody a rozpuštěné látky doplněná o čistící gradientní echo. 90 1 H G t 180 t G G Selektivní 180 puls
Potlačení signálu vody: metoda WATERGATE
Multidimensionální NMR spektroskopie F 2 ( 13 C) F 3 ( 1 H) F 1 ( 15 N)
1 H - spektrum H H H H H H N H 8.5 8.0 7.5 7.0 6.5 6.0 5.5 ppm
1D 1 H spektrum proteinu kuřecí lysozym 129 AA, M w = 14.6 kda methyl H NH-backbone aromatic H NH-SC aliphatic H CH
Odezva více jader v jednom spektru p N (0 p N 1) 13 C 35Hz 13 C 13 130Hz H C H 35Hz 35Hz p C (0 p C 1) 13 55Hz 13 15Hz C C 15 N 11Hz 13 55Hz C 13 C H 7Hz 90Hz H N 140Hz H <1Hz p H (0 p H 1) pravděpodobnost překryvu při zobrazení jednoho jádra p H (H),p N (N) a p C (C) při zobrazení dvou jader (H-N) najednou P = p H. p N při zobrazení tří jader (H-N-C) najednou P = p H. p N. p C
Korelační spektroskopie jako nástroj pro zjednodušení NMR spekter 1D 3D 2D F 1 ( 1 H) F 2 (X) F 2 ( 1 H) 4D F 1 ( 1 H/X) F 3 (X) F 3 ( 1 H) F 1 ( 1 H/X) Lepší rozlišení je ve vícedimenzionálních spektrech zajištěno využitím izotopového obohacení 15 N a 13 C. F 2 (X) F 4 ( 1 H) F 1 ( 1 H)
Přiřazování rezonancí NMR experimenty pro přiřazení signálů pracují se dvěma nebo třemi různými jádry najednou (experimenty s trojnásobnou rezonancí), chemické posuny těchto jáder jsou navzájem zkorelovány. Názvy takovýchto experimentů se tvoří podle typu jader, která korelují: HNCA koreluje amidický vodík s příslušným dusíkem a uhlíkem v pozici. HN(CO)CA koreluje stejné typy atomů (jader) jako HNCA, ale přes CO. To naznačuje směr korelace, tj. H a N i-té aminokyseliny a C aminokyseliny v pozici i-1. Směr přenosu magnetizace je v případě těchto experimentů H N C a zpět. Experimenty se nazývají out and back Naproti tomu přenos magnetizace u experimentů např. CBCA(CO)NH začíná na atomu C B (i-1) aminokyseliny a končí na amidickém H aminokyseliny následující, tj. experimenty out and stay.
Strategie pro určování struktur biomolekul NMR vzorek NMR experimenty NMR spektra Přiřazení signálů Přiřazení experimentálních NMR parametrů (NOE ) Obecné informace o molekule (primární struktura, kovalentní vazby ) Odhad přibližné struktury Zhodnocení kvality struktur Oprava přiřazení NMR parametrů, signálů Výpočet souboru struktur Výpočet statistických údajů pro soubor konečných struktur Porovnání s databázemi (Procheck, Whatif.) Výpočet NOESY spekter
Přiřazování rezonancí 13 C HNCA experiment 35Hz 13 C 13 H C 130Hz H aminokyselinový zbytek I 35Hz aminokyselinový zbytek I-1 35Hz 13 C 55Hz 13 C 15Hz 15 N 11Hz 13 C 55Hz 13 C H 7Hz 90Hz H N 140Hz H <1Hz
Konstrukce multidimensionálních NMR spekter 3D HNCA F 2 ( 15 N ) I F 1 ( 13 C ) F 2 ( 15 N ) I-1 F 3 ( 1 H N ) F 1 ( 13 C ) F 3 ( 1 H N )
Přiřazování rezonancí 13 C HN(CO)CA experiment 35Hz 13 C 13 H C 130Hz H 35Hz 35Hz 13 C 55Hz 13 C 15Hz 15 N 11Hz 13 C 55Hz 13 C H 7Hz 90Hz H N 140Hz H <1Hz
Konstrukce multidimensionálních NMR spekter 3D HNCA/HN(CO)CA F 2 ( 15 N ) F 2 ( 15 N ) I F 1 ( 13 C) F 2 ( 15 N ) I-1 I-1 F 3 ( 1 H N ) F 1 ( 13 C) F 3 ( 1 H N )
Sekvenční přiřazení hlavního řetězce HN(CO)CA HNCA missing crosspík
HNCACB experiment Přiřazování rezonancí Využití atomů uhlíku C 13 C Výhoda: chemický posun C je charakteristický pro typ aminokyselinového zbytku 35Hz 13 C 13 H C 130Hz H 35Hz aminokyselinový zbytek I-1 35Hz aminokyselinový zbytek I 13 C 55Hz 13 C 15Hz 15 N 11Hz 13 C 55Hz 13 C H 7Hz 90Hz H N 140Hz H <1Hz
Přiřazování rezonancí Využití atomů uhlíku C HN(CO)CACB experiment 13 C 35Hz 13 C 13 H C 130Hz H 35Hz 35Hz 13 C 55Hz 13 C 15Hz 15 N 11Hz 13 C 55Hz 13 C H 7Hz 90Hz H N 140Hz H <1Hz
( 13 C) Přiřazování rezonancí Využití atomů uhlíku C HNCACB/HN(CO)CACB experiment Ser11 Leu12 Thr13 Leu14 Trp15 25 30 35 40 45 50 55 60 65 70 ( 15 N) 114.9 ppm ( 15 N) 123.7 ppm ( 15 N) 126.8 ppm ( 15 N) 124.7 ppm ( 15 N) 119.9 ppm ( 1 H) ( 1 H) ( 1 H) ( 1 H) ( 1 H)
Přiřazování rezonancí postranních řetězců H C H H C H H C H H C H C C N C C H H N H
( 13 C) Přiřazování rezonancí postranních řetězců ppm Kompletní přiřazení Prolinu 4 proteázy M-PMV pomocí hcch-cosy spektra H : 4.296 ppm H : 1.818 ppm Pro4CG-CB-HB2 H : 2.185 ppm Pro4CG-CB-HB3 H : 1.913 ppm Pro4CG-CG-HG H : 3.589 ppm Pro4CG-CD-HD2 H : 3.715 ppm Pro4CG-CD-HD3 H H H H N H H H O 30 Pro4CB-CA-HA Pro4CB-CB-HB2 Pro4CB-CB-HB3 Pro4CB-CG-HG 30 H 3 C O 40 40 3D 50 Pro4CD-CG-HG Pro4CD-CD-HD2 Pro4CD-CD-HD3 50 F 2 ( 1 H) 60 Pro4CA-CA-HA Pro4CA-CB-HB2 Pro4CA-CB-HB3 60 F 1 ( 13 C) 65 60 35 30 35 30 30 25 ( 13 C) 55 50 55 50 ppm F 3 ( 13 C)
Práce s extra velkými molekulami M w > 25 kda Práce s velkými molekulami způsobuje dvojí komplikaci velmi komplikovaná spektra rychlá spin-spinová relaxace R 2 2 2 H ( D) C 8r 6 CH [ J ' s... f t ( )] c H / D ~ 6.6 Řešení: výměna atomů vodíku za deuterium
Práce s extra velkými molekulami M w > 25 kda Exprese proteinu v růstovém médiu obohaceném o 13 C/ 15 N/ 2 H 13 C 35Hz CD 3 CD 3 13 13 130Hz C HD C HD C D 35Hz 13 55Hz 13 15Hz C C H D 7Hz 15 11Hz N 90Hz H N 35Hz 13 55Hz C 140Hz H D 13 C <1Hz N H C D CO Teoreticky může být R 2 snížen až 44 násobně, prakticky většinou maximálně 15x.
Fully protonated versus perdeuterated EIN protein
Fully protonated versus perdeuterated EIN protein Missing crosspeaks are marked
Praktické návody-jak na to? www.protein-nmr.org.uk
Strategie pro určování struktur biomolekul NMR vzorek NMR experimenty NMR spektra Přiřazení signálů Přiřazení experimentálních NMR parametrů (NOE ) Obecné informace o molekule (primární struktura, kovalentní vazby ) Odhad přibližné struktury Zhodnocení kvality struktur Oprava přiřazení NMR parametrů, signálů Výpočet souboru struktur Výpočet statistických údajů pro soubor konečných struktur Porovnání s databázemi (Procheck, Whatif.) Výpočet NOESY spekter
Získání experimentálních parametrů z NMR spekter. chemický posun (chemické okolí jádra) NOE interakce (meziatomová vzdálenost) interakční konstanta (dihedrální úhel) zbytková dipolární interakce (orientace) vodíková vazba (vzdálenost, vazebný úhel)
Chemický posun Výpočet indexu chemického posunu Změna chemického posunu indukovaná sekundární strukturou (H ) Chemické posuny některých jader jsou ovlivněny typem pravidelné sekundární struktury, do které jsou zahrnuty!!! -sheet random coil -helix Histogram indexu chemického posunu jader H, C a C. Přiřazení rezonancí hlavního řetězce: H,C, C +1 0 Výpočet indexů chemického posunu, tzv. CSI -1 Odhad sekundární struktury na základě lokální hustoty těchto indexů N helix I helix II helix III helix IV C Sekvence aminokyselin
CSI -1 0 1 Secondary structure of M-PMV PR from CSI 10 20 30 40 50 60 70 80 90 100
Nukleární Overhauserův efekt NOE Experimentální omezení vzdáleností přímá spin-spinová interakce mezi jádry r IS < 5-6 Ǻ interakce mezi dipóly interagujících jader relaxační jev H H výměna energie mezi oběma jádry charakterizuje vzdálenost mezi oběma jádry IS 4 2 2 h 10 4 6t c 1 4 t 2 c t c r 6 IS IS - rychlost nárustu NOE t c - korelační čas r IS - meziatomová vzdálenost - pracovní frekvence IS f r 6
Převod intenzity NOE krospíků na vzdálenost mezi atomy. 1.8 Ǻ r 2.5 Ǻ 1.8 Ǻ r 3.5 Ǻ 1.8 Ǻ r 5.0 Ǻ Dolní mez :1.8 Ǻ Jedná se o součet vzdáleností van der Waalsovských poloměrů dvou interagujících atomů vodíku Horní mez : Nastavuje se podle intenzity příslušného krospíku. Pro větší molekuly se používá max. vzdálenost až 6 Å.
Editovaná NOESY spektra 4D 13 C/ 15 N-editované NOESY 15 N NOE 1 H 1 H 13 C J HN 15 N 13 C J HC 1 H 1 H 3D 15 N-editované NOESY 4D 13 C/ 15 N-editované NOESY 15 N= 106.4 ppm 15 N= 106.4 ppm 13 C= 45.8 ppm 15 N= 106.4 ppm 13 C= 56.1 ppm G78 HN -G78 H G78 HN -S77 H
Nepřímá spin-spinová interakční konstanta Experimentální omezení dihedrálních úhlů H O N f C C C y H H C c 1 O H c 2 C 3 J 10 8 Karplusova rovnice 3 J = A cos 2 Q B cosq C Vztah mezi interakční konstantou a dihedrálními úhly peptidu H-NC -H H-NC -CO H-NC -C 6 CO-NC -H 4 2 0 [Hz] -120 0 60 120 Q deg
Typické hodnoty interakčních konstant 3 J HH pro dihedrální úhel f -helix f ~ 60 deg J 6 Hz typické nastavení pro úhel f: 110 f 10 deg -struktura skládaného listu f ~ 10 6 J 9 Hz typické nastavení pro úhel f: 170 f 70 deg
122.0 121.0 120.0 122.0 120.0 118.0 Residual dipolar couplings RDC Long-range constraint NMR experiments: - experiments for measurement J constants - IPAP experiments (better resolution) 15 N Principal axis system B o A zz 9.0 8.9 8.8 8.7 1 H N H D Jiso Janiso 15 N 119.0 D resid J aniso J iso A xx f q A yy 8.86 8.84 1 H
Stretched polyacrylamide gel ~ 6% polyacrylamide gel (crosslinked with bisacrylamide) protein diffuses into dried gel axial stretching (radial compression) of the gel NMR tube squeeze alignment of protein in oblate pores
-helix Vodíkové vazby v pravidelných strukturách Další omezení vzdáleností C Měření: - výměnné experimenty s D 2 O - teplotní závislost labilních protonů (NH, OH ) Z NMR experimentů je možné získat pouze informaci o donoru! -sheet-antiparalelní N Informaci o příslušném akceptoru lze získat až z vypočtených struktur N C
Strategie pro určování struktur biomolekul NMR vzorek NMR experimenty NMR spektra Přiřazení signálů Přiřazení experimentálních NMR parametrů (NOE ) Obecné informace o molekule (primární struktura, kovalentní vazby ) Odhad přibližné struktury Zhodnocení kvality struktur Oprava přiřazení NMR parametrů, signálů Výpočet souboru struktur Výpočet statistických údajů pro soubor konečných struktur Porovnání s databázemi (Procheck, Whatif.) Výpočet NOESY spekter
Jak vše poskládat dohromady???? Omezení vzdáleností (NOEs) Omezení dihedrálních úhlů (interakční konst.) Info o kovalentní struktuře Cray T3E E tot E kin E pot Výpočetní algoritmus: Molekulární mechanika simulované žíhání s experimentálními omezeními (vzdálenosti, dihedrální úhly ) - molekula se ohřeje na vysokou teplotu (2000 50 000 K) - pomalu se ochladí na teplotu blízkou nule simulované žíhání v Kartézském prostoru (Newtonovy pohybové rovnice) simulované žíhání v prostoru torsních úhlů (Lagrangeovy rovnice)
Simulované žíhání (simulated annealing) typický průběh teplota [K] vysokoteplotní perioda perioda postupného ochlazování minimalizace potenciálové energie časová osa [ns]
Jak vše poskládat dohromady???? E D 2 pot E tot E kin E E kin je kinetická energie vypočítávaná v každém kroku z teploty molekuly E pot je součet energií produkovaných penalizačními funkcemi Molekulární parametry (hmotnost atomů, délka vazby, vazebné úhly vstupují do výpočtu ve formě tzv force fields pot 2 2 2 kvdw D kkovd knoed vdw kov NOE DIH ( d d exp 0 ) 2 k DIH D 2... d exp je experimentální nebo aktuální hodnota d 0 je ideální hodnota Př: penalizační fukce pro NOE: E NOE dolní mez (1,8 Å) horní mez (< 6 Å) Cílem je minimalizovat E pot 0 d Soubor struktur vyhovující nejlépe získaným experimentálním omezením
Prezentace vypočtených struktur helix III helix IV helix II helix I C N N C C N C N
Strategie pro určování struktur biomolekul NMR vzorek NMR experimenty NMR spektra Přiřazení signálů Přiřazení experimentálních NMR parametrů (NOE ) Obecné informace o molekule (primární struktura, kovalentní vazby ) Odhad přibližné struktury Zhodnocení kvality struktur Oprava přiřazení NMR parametrů, signálů Výpočet souboru struktur Výpočet statistických údajů pro soubor konečných struktur Porovnání s databázemi (Procheck, Whatif.) Výpočet NOESY spekter
Charakterizace vypočtených struktur 1. Shoda vypočtených struktur s experimentálními daty - velikost potenciálová energie - počet a velikost neshod s experimentálními parametry (NOE, dihedrální úhly. - počet a velikost špatných kontaktů mezi atomy (van der Waalsovský příspěvek) - počet a velikost neshod s ideálními hodnotami kovalentních parametrů (délky vazeb, vazebné úhly, planarita aromatických kruhů ) 2. Rozptyl struktur v souboru RMSD n i1 x i n x 2 - mezi jednotlivými strukturami a průměrnou strukturou (mean) - mezi jednotlivými strukturami navzájem - počítá se buď pro celou molekulu, jednotlivé části nebo jednotlivé aminokyseliny
Charakterizace vypočtených struktur 3. Porovnání strukturních parametrů vypočtených struktur s parametry v databázích software Procheck, Whatif http://biotech.embl-heidelberg.de:8400 Ramachandranův diagram f/y diagram je charakteristický pro konformaci páteře proteinu - takto lze porovnávat i ostatní dihedrální úhly, vazebné úhly, délky vazeb - lze vytypovat problémové oblasti
Malate synthase, 723 AA, 82 kda Tugarinov V., Choy W.Y., Orekhov, V.Y., Kay L.E.(2005) PNAS, 102, 622-627