LC/MS a CE/MS v proteomické analýze OBSAH Příklad jednoduché analýzy Separční techniky MS techniky Identifikace proteinů Určení molekulové hmotnosti Analytická výzva Mgr. Martin Hubálek, Ph.D. Ústav organické chemie a biochemie AVČR, v.v.i. hubalek@uochb.cas.cz 1 Příklad jednoduché proteomické analýzy Identifikace proteinu (z gelu nebo z roztoku) LC MS/MS analýza peptidové směsi (tryptického digestu) Porovnání MS/MS spekter proti vybrané databázi 2
Přehled analýzy 3 Výsledek analýzy Score % Cov Accession # Name Species Peptides (95%) 187.29 98.7 sp P20347 CPI1_SOLTU Cysteine protease inhibitor 1 Solanum tuberosum 287 MKSINILSFLLLSSTLSLVAFARSFTSENPIVLPTTCHDDDNLVLPEVY DQDGNPLRIGERYIINNPLLGAGAVYLYNIGNLQCPNAVLQHMSIPQFL GEGTPVVFVRKSESDYGDVVRVMTVVYIKFFVKTTKLCVDQTVWKVNDE QLVVTGGKVGNENDIFKIMKTDLVTPGGSKYVYKLLHCPSHLGCKNIGG NFKNGYPRLVTVDDDKDFIPFVFIKA 4
Jednotlivé části analýzy separace Nano HPLC Kolona: Aclaim PepMap Rozměr: 75 um x 150 mm Stacionární fáze: C18 Velikost částic: 3um Velikost pórů: 100A Mobilní fáze: A Voda, 0,1% kys. mravenčí B Acetonitril, 0,1% kys. mravenčí Průtok: 300 nl/min Gradient: 100 analýza MS Nano ESI Hybridní MS přístroj TripleTOF Uspořádání: kvadrupol kolizní cela TOF Akvizice dat: IDA (information dependent acquisition) Identifikace proteinů SW: Protein Pilot Databáze: proteiny Solanum tuberosum z databáze Uniprot 50 0 0 20 40 60 5 Separační systémy pro peptidy a proteiny Gelová Elektroforéza: HPLC: 1D SDS PAGE 2D isoelektrická fokusace, SDS PAGE RP- na C18, gradient acetonitrilu a vody s přídavkem HCOOH nebo CH 3 COOH, většinou v nano- nebo mikro- měřítku SEC gelová chromatografie IE iontově výměnná na silném katexu (SCX kolony), gradient soli při ph~3 na slabám anexu (WAX) separační metody možno kombinovat ve 2D systémech buď on-line, nebo off-line 6
Kapilární elektroforéza chemicky modifikované kapiláry, kyselina octová v methanolu Aplikace: Characterizace glykosylovaných biofarmak Analýza celých proteinů 7 Běžné rozhraní používající sheath liquid - LODs mezi 30 and 100 nm sheathless CE-MS - LODs in the low-nm range Haselberg, R., Ratnayake, C. K., de Jong, G. J., Somsen, G. W., J. Chromatogr. A 2010, 1217, 7605 7611. Fig. 3 BPE obtained with sheath-liquid CE MS of a mixture of insulin (1), carbonic anhydrase II (2), ribonuclease A (3) and lysozyme (4) (each 50 μg/ml) using the conventional ESI source and a sheath liquid of (A) 100 mm acetic acid (ph 3.1) and (B) isopro... Fig. 5 (A) BPE obtained with sheathless CE MS of a mixture of insulin (1), carbonic anhydrase II (2), ribonuclease A (3) and lysozyme (4) (each 5 μg/ml) using the nanoesi source. (B) Mass spectra obtained in the apices of peak 1 4. (C) Baseline signal and... 8
MS analýza Iontové zdroje pro peptidy a proteiny MALDI: tvoří se hlavně jednou (výjimečně 2-3 x) nabité ionty. Matrice: kyselina a-hydroxyskořicová, kyselina sinapová, kyselina 2,5- dihydroxybenzoová ESI, nanoesi: tvoří se vícenásobně nabité ionty, distribuce nábojových stavů závisí na ph Hmotostní analzátory pro peptidy a proteiny Jednoduché TOF (ve spojení s MALDI) Hybridní analyzátory (dnes častější) QTOF, LIT Orbitrap, IT FTICR Důležitá disociace 9 Disociace vyvolaná srážkou - CID CID (Collision Induced Dissociation) - metoda fragmentace iontů (MS/MS technika) založená na srážkách iontů s neutrálními částicemi (helium nebo argon). Po srážce dochází k rychlému převedení translační energie na energii vibrační a k její rychlé distribuci po všech kovalentních vazbách. Dochází ke štěpení nejslabších vazeb (zejména peptidových vazeb). Při CID fragmentaci peptidů vznikají zejména b a y ionty Modifikující funkční skupiny (posttranslačních modifikací) se většinou odštěpují a nelze je detekovat Nejběžnější typ fragmentace, na všech běžných typech přístrojů 10
Disociace vyvolaná srážkou - CID Vznik iontů série b a y při CID. Odštěpení modifikací při CID. 11 Disociace záchytem elektronu - ECD ECD (Electron Capture Dissociation) - metoda fragmentace iontů (MS/MS technika) založená na interakci vícenásobně nabitých iontů s nízkoenergetickými (termálními) elektrony v plynné fázi. Tvoří se ionty s lichým počtem elektronů, který díky přebytku energie fragmentují. [M + 3H] 3+ + e - [M + 3H] 2+ [M + 3H] 2+ [C+2H] 1+ + [Z+H] 1+ ion c ion z Při ECD fragmentaci peptidů vznikají zejména c a z ionty Nedochází ke štěpení modifikujících funkčních skupin (posttranslačních modifikací) Technicky lze uskutečnit pouze na FT ICR instrumentech 12
Disociace záchytem elektronu - ECD Vznik iontů série c a z při ECD. Při reakci se tvoří hypervalentní radikály RNH 3, které dále disociují. 13 Disociace záchytem elektronu - ECD 14
Disociace přenosem elektronu - ETD ETD (Electron Transfer Dissociation) - metoda fragmentace iontů (MS/MS technika) založená na interakci vícenásobně nabitých iontů s radikál-anionty s dostatečně nízkou elektronovou afinitou, které slouží jako donor elektronů. Mechanismus fragmentace je obdobou ECD. [M + 3H] 3+ + A - [M 3H] 2+ + A [M + 3H] 2+ [C+2H] 1+ + [Z+H] 1+ ion c ion z Při ETD fragmentaci peptidů vznikají zejména c a z ionty Nedochází ke štěpení modifikujících funkčních skupin (posttranslačních modifikací) Technicky lze uskutečnit na iontových pastech, Q-TOFu 15 Disociace přenosem elektronu - ETD ETD na lineární iontové pasti 16
Disociace přenosem elektronu - ETD ETD reagenty: fluoranthen anthracen azobenzen 2,2 -bichinolin 17 Multifotonová disociace infračerveným zářením - IRMPD IRMPD (InfraRed MultiPhoton Dissociation) - metoda fragmentace iontů (MS/MS technika) založená na interakci iontů s fotony infračerveného záření. Paprsek IR laseru vstupuje do prostoru ICR cely nebo iontové pasti. Ionty absorbují energii fotonů a jsou excitovány do vyšších vibračních stavů až dojde k fragmentaci vazeb, obdobně jako u CID. Spektra jsou podobná CID. -na pastech není omezení v nízkých hmotách (pod 1/3 m/z prekurzoru) -vyšší účinnost oproti CID, výhoda u fosfopeptidů CID IRMPD pro ICR, iontové pasti 18
Disociace za zdrojem - PSD PSD (Post Source Decay) - metoda založená na fragmentaci metastabilních iontů v driftovací trubici TOF analyzátorů s reflectronem. Během letu trubicí ionty prekurzoru fragmentují. Fragmenty mají stejnou rychlost jako prekurzor, ale různou kinetickou energii. V TOFu nemohou být rozlišeny (dopadají na detektor ve stejnou dobu), ale v reflektronu ano. Využívá se korelace mezi kinetickou energií fragmentů a jejich hmotností. 19 Identifikace proteinů pomocí MS 20
MS MSMS 1 MSMS 2 MSMS 3 FraTu ACN vz.3 Q07-12111 1: TOF MS ES+ BPI 100 1.60e3 740.4 562.3 582.3 652.4 666.8 719.3 765.4 640.4 718.8 796.1 585.0 566.3 728.4 518.3 562.3 637.9 0 16.00 18.00 20.00 22.00 24.00 26.00 28.00 30.00 32.00 34.00 36.00 38.00 40.00 Q07-12111 4: TOF MSMS ES+ 100 133.1 BPI 607.82 1.32e3 120.1 171.2 225.1 373.2;861.47 308.1 451.74 589.36 308.1 591.3 227.2 110.1 571.63 522.80 917.97 591.86 637.88 743.42 0 16.00 18.00 20.00 22.00 24.00 26.00 28.00 30.00 32.00 34.00 36.00 38.00 40.00 Q07-12111 3: TOF MSMS ES+ 308.1 BPI 100 573.31 308.1 612.3 475 129.1 611.98 1184.6 289.1 187.1 187.1 214.1 581.83 579.32 213.1 120.1 1184.18 555.12 1198.1 625.80 267.1 681.34 597.30 526.82 528.28 1197.57 1135.8 1135.60 604.04 0 16.00 18.00 20.00 22.00 24.00 26.00 28.00 30.00 32.00 34.00 36.00 38.00 40.00 Q07-12111 2: TOF MSMS ES+ 100 187.1 173.1 129.1 BPI 308.1 677.33 658 214.1 129.1 582.29 730.36 233.2 204.1 127.1 201.1 571.11 617.88 640.35 120.1 968.45 796.06 199.2 666.84 289.1 668.31 961.95 173.1;651.87 633.42 553.31 0 Time 16.00 18.00 20.00 22.00 24.00 26.00 28.00 30.00 32.00 34.00 36.00 38.00 40.00 % % % % FraTu ACN vz.3 Q07-12111 634 (28.609) 1: TOF MS ES+ 677.3281 721 100 % 652.4147 677.8263 677.8474 677.8687 678.3564 1353.7137 1354.7330 615.1773 740.3848 1355.7072 740.8834 1188.5975 555.1049 881.2511 741.4045 1105.0869 1189.5382 1356.7720 0 400 500 600 700 800 900 1000 1100 1200 1300 1400 1500 FraTu ACN vz.3 Q07-12111 634 (28.609) 1: TOF MS ES+ 677.3281 721 100 % 0 673.3494 674.3748 676.3747 677.8263 677.8474 677.8687 678.3564 678.8868 MS 680.5109 681.4460 673 674 675 676 677 678 679 680 681 682 683 m/z m/z % MS zoom in 0 316.1614 462.2640 777.3981 662.4057 876.4710 530.2639 990.5370 1153.5664 100 200 300 400 500 600 700 800 900 1000 1100 1200 Smoothing and deisotoping 677.3281,721, 2 70.0332 1.0794 70.0671 8.1202 72.0876 11.3469 73.5504 2.1043 74.0656 3.1383 83.0607 2.1134 84.0828 25.2925 85.0589 1.0522 85.0898 3.0612 86.1002 48.8639 96.0747 4.1043 98.0287 3.1927 98.0612 2.2358 98.1019 5.9909 283.2370 2.1927 284.1254 11.0181 284.1629 37.8798 284.2126 9.7188 285.0384 4.7891.. FraTu ACN vz.3 1065.5466 3.1043 Q07-12111 140 (28.750) 2: 1105.6334 TOF MSMS 677.33ES+ 3.1474 173.1297 381 100 1107.6312 4.1043 173.1404 MSMS 1163.6843 6.1043 1164.5432 1.0703 1164.6282 1.0181 1164.7012 1.0522 1165.6370 2.1043 1209.6985 3.1474 201.1263 m/z 21 Fragmentace iontů peptidů Při fragmentaci dochází ke štěpení vazeb mezi aminokyselinami a vznikají iontové série označované písmeny. Štěpení peptidové vazby v hlavním řetězci odpovídají ionty typu (série) b a y, štěpením za peptidovou vazbou vznikají ionty typu (série) c a z. Immoniové ionty usnadňují interpretaci přímá informace o aminokyselině v sekvenci 22
MSMS scoring function The comparison of theoretical and experimental MS/MS spectra is performed by scoring function and the score (ideally complemented by p value) is used to recognize the correct peptide from the database. Reliable peptide identification can be then considered for protein identification. FraTu ACN vz.3 Q07-12111 140 (28.750) 2: TOF MSMS 677.33ES+ 173.1297 381 100 173.1404 % 201.1263 Match of an experimental spectrum with a peptide sequence Intense peaks should match As many as possible peaks should match Series of contiguous matches 0 316.1614 462.2640 777.3981 662.4057 876.4710 530.2639 990.5370 1153.5664 100 200 300 400 500 600 700 800 900 1000 1100 1200 m/z 23 MS/MS sekvenování V CID MS/MS spektrech se vyskytují série b a y iontů. Ionty v obou sériích se od sebe liší o zbytky (rezidua) aminokyselin. Součet b a y iontu mínus 1 dává molekulový adukt: b+y-1 = (M+H) + 24
MS/MS sekvenování 25 Pokrytí sekvence, spolehlivost identifikace Pokrytí sekvence část sekvence vyjádřená v procentech, která je podložena experimentálními daty (identifikovanými peptidy). Větší množství identifikovaných peptidů = vyšší spolehlivost identifikace proteinu. Pokrytí sekvence u bottomup maximálně 40-90%. 26
enzymatické štěpení proteinů Vhodný enzym štěpí specificky za malým počtem aminokyselin. Trypsin nejčastěji používaný, štěpí za Arg a Lys, poskytuje relativně krátké peptidy vhodné pro MS/MS. Bazické skupiny (kromě His) jsou na C-konci řetězce, což vede ke vzniku dobře interpretovatelných MS/MS spekter. Příklad: PPKAYEVRIVTKMVAVGICR PPK + AYEVR + IVTK + MVAVGICR Lys-C specificky štěpí za Lys, produkuje delší peptidy než trypsin, obtížnější interpretace MS/MS spekter (Arg uvnitř řetězců). Glu-C méně specifické štěpení v závislosti na ph za Glu nebo i za Asp, obtížnější interpretace MS/MS spekter (Arg, Lys uvnitř řetězců). Asp-N štěpí na N-konci Asp Chymotrypsin málo specifické štěpení za hydrofobními kyselinami, obtížnější interpretace MS/MS spekter (Arg, Lys uvnitř řetězců). 27 De novo sekvenování peptidů De novo sekvenování - způsob přímé interpretace MS/MS spekter peptidů. Hledají se ionty stejných sérií, které se vzájemně liší o zbytky aminokyselin. Ze spektra lze přímo odečíst sekvenci aminokyselin. Lze provádět ručně nebo za pomoci softwaru. výhodou je možnost identifikace peptidů a proteinů, které nejsou v databázích. 28
peptidové mapování Peptidové mapování (Peptide Mass Fingerprinting, PMF) - metoda identifikace proteinů založena na tom, že každý protein po specifickém štěpení poskytuje unikátní soubor peptidů. Protein se naštěpí na peptidy a změří se MS spektrum této směsi (nejčastěji MALDI, ale i ESI). Hmotnosti (m/z) iontů peptidů jsou pak srovnávány s teoretickými hodnotami vypočítanými z proteinových nebo DNA databází (štěpení in silico ). databáze Identifikace 29 Top-down analýza proteinů Top-down proteomika - Intaktní proteiny jsou ionizovány pomocí ESI (nanoesi) a zachyceny v ICR cele nebo iontové pasti spektrometru. Následuje fragmentace, nejčastěji metodou ECD nebo ETD. Vyžaduje instrument s velkou rozlišovací schopností. Middle-down proteomika proteiny jsou enzymaticky štěpeny na velké peptidy (5 20 kda), které jsou dále sekvenovány metodami top-down. 30
Databáze proteinových sekvencí Existuje celá řada databází, některé poskytují celou řadu doplňujících informací o proteinech. UniProt Knowledgebase kombinovaná databáze Swiss-Prot (anotovaná) proteinová sekvenční databáze s minimálními redundancemi) a TrEMBL (překlad nukleotidové sekvenční databáze EMBL). http://www.expasy.uniprot.org/ ExPASy Proteomics Server portál věnovaný analýze proteinů, nástroje pro MS, odkazy, 2D SDS PAGE. http://www.expasy.org/ National Center for Biotechnology Information portál veřejně přístupných databází s molekulárně-biologickými informacemi a softwarovými nástroji pro analýzu dat. http://www.ncbi.nlm.nih.gov/ 31 Určení molekulové hmotnosti: MALDI Při MALDI ionizaci se proteiny nabíjí malým počtem nábojů, většinou jedním nebo dvěma. S vyjímkou analyzátorů s velmi vysokým rozlišením nelze pozorovat oddělené izotopické píky, ale jen jejich obalovou křivku. Měříme tak průměrnou hmotnost. 32
Vliv solí na spektra peptidů a proteinů Odsolení vzorku SPE na C18, C4 (ZipTip) MALDI spektrum vzorku peptidu s vysokou koncentrací solí Přítomnost solí ve vzorku se projeví tvorbou aduktů, nejčastěji s Na +, K +. Pokud analyt obsahuje kyselé funkční skupiny (karboxyl, fosfát apod.) může dojít k výměně kyselých protonů za tyto ionty. Spektra jsou komplikovaná, snižuje se odezva -> zasolené vzorky je nutno čistit (pro ESI bez HPLC, MALDI). 33 Určení molekulové hmotnosti: ESI a nanoesi Biomolekuly (proteiny, oligonukleotidy..) obsahují větší množství center (funkčních skupin), na kterých může dojít k ionizaci (protonizaci, kationizaci, deprotonizaci). V ESI a nanoesi spektrech poskytují tyto látky řadu píků, které odpovídají různým nábojovým stavům téže molekuly. 34
Určení molekulové hmotnosti: ESI a nanoesi = určení nábojového stavu (z) u některého iontu z lze určit z izotopického klastru ze vzdálenosti sousedních píků Molekula o hmotnosti M se nabije z-krát protonem, pík iontu ve spektru je na m z : M zh z m z tj. M z( m z H ) Pro dva sousední píky ve spektru (j,k) platí: M z j ( m j H ) ( z j 1)( m k H ) z j mk m k H m j z k m j H m m vzorce pro výpočet nábojového stavu dvou sousedních iontů ve spektru k j 35 Určení molekulové hmotnosti: počítačová dekonvoluce V praxi se využívá počítačových dekonvolučních algoritmů, které změřené ESI spektrum převedou na spektrum jednou nabitých iontů (tj. ve spektru po dekonvoluci je pouze ion [M+H] +. naměřené spektrum spektrum po dekonvoluci 36
Určení hmotnosti z ESI spektra - cvičení jed taipana (Oxyuranus) Jaká je mol. hmotnost peptidu? z j mk m k H m j z k m m j k H m j 37 Určení hmotnosti z ESI spektra - cvičení 38
De-novo sekvenování cvičení Jaká je sekvence peptidu?! součet reziduí v sérii + 18 + 1 = (M+H) + 39 De-novo sekvenování cvičení LGSEVYHNLK (M=1158.603) 40
Nejen jeden protein Analýza proteinů ve směsi s ostatními 41 Proteomika Proteomika je vědní obor, který se zabývá studiem proteinů, jejich struktury a funkcí. Proteom zahrnuje všechny proteiny (včetně modifikovaných), které jsou součástí daného organismu nebo systému v daný časový úsek. Složení proteomu je dynamické a závislé na okamžitém stavu organismu. DNA genomika RNA transkriptomika proteiny proteomika metabolity metabolomika 42
Proteomická analytická výzva 1. Komplexita velké množství proteinů 2. Velký dynamický rozsah koncentrace proteinů V celém v séru, v tkáních, v buňce 43 Komplexita proteomu Příklad: člověk (Jensen O.N., Curr. Opin. Chem. Biol., 2004, 8, 33-41, PMID: 15036154). 44
Referenční interval pro 70 proteinových analytů v plasmě. Anderson N L, and Anderson N G Mol Cell Proteomics 2002;1:845-867 45 Rozdíl 12 řádů 46
Používané separační a analytické metody v proteomice (2 D elektroforézanebo LC/MS/MS) mají dynamický rozsah 10 2 10 4 Jak vyřešit? 47 100 90 80 Aclaim PepMap 75 um x 150 mm C18, 3um, 100A 70 60 50 40 30 20 10 0 48
15 cm, 125 min 25 cm, 125 min 25 cm, 185 min 49 XIC Extracted Ion Chromatogram (0.05 Da) m/z 945.49 m/z 850.511 15 cm, 125 min 0.331 0.383 25 cm, 125 min 0.249 0.327 25 cm, 185 min 0.475 0.545 šířka píku (50%) 50
Spectra Proteins Detected 15 cm, 125 min Distinct Peptides Spectra Identified % Total Spectra 33627 1099 13459 23145 68.8 Spectra 25 cm, 125 min Proteins Detected Distinct Peptides Spectra % Total Identified Spectra 35509 1330 14106 23965 67.5 Spectra 25 cm, 185 min Proteins Detected Distinct Spectra % Total Peptides Identified Spectra 58009 1650 20175 39848 68.7 51 25 cm, 125 min, 5% DMSO Spectra Proteins Detected Distinct Spectra % Total Peptides Identified Spectra 38113 1634 18236 26972 70.8 25 cm, 185 min, 5% DMSO Spectra Proteins Detected Distinct Spectra % Total Peptides Identified Spectra 63876 2066 23773 45251 70.8 52
Používané separační a analytické metody v proteomice (2 D elektroforézanebo LC/MS/MS) mají dynamický rozsah 10 2 10 4 Jak vyřešit? Frakcionace vícedimensionální chromatografie Obohacení skupin analytů Afinitní chromatografie protilátky Chelatační chromatografie Phospho Lektiny glykoproteiny Jiné MS metody Selected Reaction Monitoring (metoda s největším dynamickým rozsahem 5řádů) 53