LC/MS a CE/MS v proteomické analýze OBSAH Příklad jednoduché analýzy Separční techniky MS techniky Identifikace proteinů Určení molekulové hmotnosti Analytická výzva Mgr. Martin Hubálek, Ph.D. Ústav organické chemie a biochemie AVČR, v.v.i. hubalek@uochb.cas.cz 1
Příklad jednoduché proteomické analýzy Identifikace proteinu (z gelu nebo z roztoku) LC-MS/MS analýza peptidové směsi (tryptického digestu) Porovnání MS/MS spekter proti vybrané databázi 2
Přehled analýzy 3
Výsledek analýzy Score % Cov Accession # Name Species Peptides (95%) 187.29 98.7 sp P20347 CPI1_SOLTU Cysteine protease inhibitor 1 Solanum tuberosum 287 MKSINILSFLLLSSTLSLVAFARSFTSENPIVLPTTCHDDDNLVLPEVY DQDGNPLRIGERYIINNPLLGAGAVYLYNIGNLQCPNAVLQHMSIPQFL GEGTPVVFVRKSESDYGDVVRVMTVVYIKFFVKTTKLCVDQTVWKVNDE QLVVTGGKVGNENDIFKIMKTDLVTPGGSKYVYKLLHCPSHLGCKNIGG NFKNGYPRLVTVDDDKDFIPFVFIKA 4
Jednotlivé části analýzy separace Nano HPLC Kolona: Aclaim PepMap Rozměr: 75 um x 150 mm Stacionární fáze: C18 Velikost částic: 3um Velikost pórů: 100A Mobilní fáze: A Voda, 0,1% kys. mravenčí B Acetonitril, 0,1% kys. mravenčí Průtok: 300 nl/min Gradient: 100 analýza MS Nano ESI Hybridní MS přístroj TripleTOF Uspořádání: kvadrupol - kolizní cela TOF Akvizice dat: IDA (information dependent acquisition) Identifikace proteinů SW: Protein Pilot Databáze: proteiny Solanum tuberosum z databáze Uniprot 50 0 0 20 40 60 5
Separační systémy pro peptidy a proteiny Gelová Elektroforéza: HPLC: 1D SDS PAGE 2D isoelektrická fokusace, SDS PAGE RP- na C18, gradient acetonitrilu a vody s přídavkem HCOOH nebo CH 3 COOH, většinou v nano- nebo mikro- měřítku SEC gelová chromatografie IE iontově výměnná na silném katexu (SCX kolony), gradient soli při ph~3 na slabém anexu (WAX) separační metody možno kombinovat ve 2D systémech buď on-line, nebo off-line 6
Kapilární elektroforéza (CE) UV detekce MS detekce
Rozhraní CE-MS S pomocnou kapalinou Bez pomocné kapaliny Spojení na hrotu Porézní kapilára 8
Kapilární elektroforéza chemicky modifikované kapiláry, kyselina octová v methanolu Aplikace: Charakterizace postranslačních modifikací Analýza celých proteinů 9
Charakterizace postranslačních modifikací Srovnání separace stejného vzorku LC a CE 10
MS analýza Iontové zdroje pro peptidy a proteiny MALDI: tvoří se hlavně jednou (výjimečně 2-3 x) nabité ionty. Matrice: kyselina a-hydroxyskořicová, kyselina sinapová, kyselina 2,5- dihydroxybenzoová ESI, nanoesi: tvoří se vícenásobně nabité ionty, distribuce nábojových stavů závisí na ph Hmotostní analzátory pro peptidy a proteiny Jednoduché TOF (ve spojení s MALDI) Hybridní analyzátory (dnes častější) QTOF, LIT Orbitrap, IT FTICR Důležitá disociace 11
Disociace vyvolaná srážkou - CID CID (Collision Induced Dissociation) - metoda fragmentace iontů (MS/MS technika) založená na srážkách iontů s neutrálními částicemi (helium nebo argon). Po srážce dochází k rychlému převedení translační energie na energii vibrační a k její rychlé distribuci po všech kovalentních vazbách. Dochází ke štěpení nejslabších vazeb (zejména peptidových vazeb). Při CID fragmentaci peptidů vznikají zejména b a y ionty Modifikující funkční skupiny (posttranslačních modifikací) se většinou odštěpují a nelze je detekovat Nejběžnější typ fragmentace, na všech běžných typech přístrojů 12
Disociace vyvolaná srážkou - CID Vznik iontů série b a y při CID. Odštěpení modifikací při CID. 13
Disociace záchytem elektronu - ECD ECD (Electron Capture Dissociation) - metoda fragmentace iontů (MS/MS technika) založená na interakci vícenásobně nabitých iontů s nízkoenergetickými (termálními) elektrony v plynné fázi. Tvoří se ionty s lichým počtem elektronů, který díky přebytku energie fragmentují. [M + 3H] 3+ + e - [M + 3H] 2+ [M + 3H] 2+ [C+2H] 1+ + [Z+H] 1+ ion c ion z Při ECD fragmentaci peptidů vznikají zejména c a z ionty Nedochází ke štěpení modifikujících funkčních skupin (posttranslačních modifikací) Technicky lze uskutečnit pouze na FT ICR instrumentech 14
Disociace záchytem elektronu - ECD Vznik iontů série c a z při ECD. Při reakci se tvoří hypervalentní radikály RNH 3, které dále disociují. 15
Disociace záchytem elektronu - ECD 16
Disociace přenosem elektronu - ETD ETD (Electron Transfer Dissociation) - metoda fragmentace iontů (MS/MS technika) založená na interakci vícenásobně nabitých iontů s radikál-anionty s dostatečně nízkou elektronovou afinitou, které slouží jako donor elektronů. Mechanismus fragmentace je obdobou ECD. [M + 3H] 3+ + A - [M 3H] 2+ + A [M + 3H] 2+ [C+2H] 1+ + [Z+H] 1+ ion c ion z Při ETD fragmentaci peptidů vznikají zejména c a z ionty Nedochází ke štěpení modifikujících funkčních skupin (posttranslačních modifikací) Technicky lze uskutečnit na iontových pastech, Q-TOFu 17
Disociace přenosem elektronu - ETD ETD na lineární iontové pasti 18
Disociace přenosem elektronu - ETD ETD reagenty: fluoranthen anthracen azobenzen 2,2 -bichinolin 19
Multifotonová disociace infračerveným zářením - IRMPD IRMPD (InfraRed MultiPhoton Dissociation) - metoda fragmentace iontů (MS/MS technika) založená na interakci iontů s fotony infračerveného záření. Paprsek IR laseru vstupuje do prostoru ICR cely nebo iontové pasti. Ionty absorbují energii fotonů a jsou excitovány do vyšších vibračních stavů až dojde k fragmentaci vazeb, obdobně jako u CID. Spektra jsou podobná CID. -na pastech není omezení v nízkých hmotách (pod 1/3 m/z prekurzoru) -vyšší účinnost oproti CID, výhoda u fosfopeptidů CID IRMPD pro ICR, iontové pasti 20
Disociace za zdrojem - PSD PSD (Post Source Decay) - metoda založená na fragmentaci metastabilních iontů v driftovací trubici TOF analyzátorů s reflectronem. Během letu trubicí ionty prekurzoru fragmentují. Fragmenty mají stejnou rychlost jako prekurzor, ale různou kinetickou energii. V TOFu nemohou být rozlišeny (dopadají na detektor ve stejnou dobu), ale v reflektronu ano. Využívá se korelace mezi kinetickou energií fragmentů a jejich hmotností. 21
Identifikace proteinů pomocí MS 22
MS MSMS 1 MSMS 2 MSMS 3 FraTu ACN vz.3 Q07-12111 1: TOF MS ES+ BPI 100 1.60e3 740.4 562.3 765.4 582.3 652.4 718.8 666.8 719.3 640.4 796.1 518.3 585.0 566.3 728.4 562.3 637.9 0% 16.00 18.00 20.00 22.00 24.00 26.00 28.00 30.00 32.00 34.00 36.00 38.00 40.00 Q07-12111 4: TOF MSMS ES+ 100 133.1 BPI 607.82 1.32e3 0% 0% 0% 308.1 571.63 225.1 522.80 120.1 451.74 171.2 589.36 373.2;861.47 308.1 591.3 917.97 591.86 16.00 18.00 20.00 22.00 24.00 26.00 28.00 30.00 32.00 34.00 36.00 38.00 40.00 Q07-12111 3: TOF MSMS ES+ 100 308.1 BPI 573.31 475 612.3 129.1 187.1 187.1 214.1 581.83 579.32 625.80 267.1 681.34 597.30 604.04 213.1 526.82 16.00 18.00 20.00 22.00 24.00 26.00 28.00 30.00 32.00 34.00 36.00 38.00 40.00 Q07-12111 2: TOF MSMS ES+ 100 187.1 173.1 129.1 BPI 308.1 677.33 658 214.1 129.1 582.29 730.36 233.2 204.1 127.1 201.1 571.11 617.88 640.35 120.1 968.45 796.06 199.2 666.84 289.1 668.31 961.95 173.1;651.87 633.42 553.31 Time 16.00 18.00 20.00 22.00 24.00 26.00 28.00 30.00 32.00 34.00 36.00 38.00 40.00 FraTu ACN vz.3 Q07-12111 634 (28.609) 1: TOF MS ES+ 100 677.3281 721 0% 555.1049 677.8263 652.4147 677.8474 615.1773 677.8687 678.3564 740.3848 740.8834 1188.5975 741.4045 881.2511 1105.0869 1189.5382 1353.7137 1354.7330 1355.7072 1356.7720 400 500 600 700 800 900 1000 1100 1200 1300 1400 1500 FraTu ACN vz.3 Q07-12111 634 (28.609) 1: TOF MS ES+ 100 677.3281 721 0% 673.3494 676.3747 674.3748 677.8263 677.8474 677.8687 678.3564 MS 678.8868 680.5109 681.4460 673 674 675 676 677 678 679 680 681 682 683 m/z m/z 0% MS zoom in 173.1404 201.1263 316.1614 MSMS 462.2640 777.3981 662.4057 530.2639 876.4710 990.5370 1153.5664 100 200 300 400 500 600 700 800 900 1000 1100 1200 Smoothing and deisotoping 677.3281,721, 2 70.0332 1.0794 70.0671 8.1202 227.2 110.1 72.0876 11.3469 637.88 743.42 73.5504 2.1043 74.0656 3.1383 83.0607 2.1134 308.1 289.1 611.98 1184.6 120.1 1184.18 555.12 1198.1 1135.8 84.0828 25.2925 528.28 1197.57 1135.60 85.0589 1.0522 85.0898 3.0612 86.1002 48.8639 96.0747 4.1043 98.0287 3.1927 98.0612 2.2358 98.1019 5.9909 283.2370 2.1927 284.1254 11.0181 284.1629 37.8798 284.2126 9.7188 285.0384 4.7891.. FraTu ACN vz.3 1065.5466 3.1043 Q07-12111 140 (28.750) 2: 1105.6334 TOF MSMS 677.33ES+ 3.1474 173.1297 381 100 1107.6312 4.1043 1163.6843 6.1043 1164.5432 1.0703 1164.6282 1.0181 1164.7012 1.0522 1165.6370 2.1043 1209.6985 3.1474 m/z 23
Fragmentace iontů peptidů Při fragmentaci dochází ke štěpení vazeb mezi aminokyselinami a vznikají iontové série označované písmeny. Štěpení peptidové vazby v hlavním řetězci odpovídají ionty typu (série) b a y, štěpením za peptidovou vazbou vznikají ionty typu (série) c a z. Immoniové ionty usnadňují interpretaci přímá informace o aminokyselině v sekvenci 24
25 MSMS scoring function The comparison of theoretical and experimental MS/MS spectra is performed by scoring function and the score (ideally complemented by p-value) is used to recognize the correct peptide from the database. Reliable peptide identification can be then considered for protein identification. FraTu ACN vz.3 Q07-12111 140 (28.750) 2: TOF MSMS 677.33ES+ 173.1297 381 100 173.1404 Match of an experimental spectrum with a peptide sequence Intense peaks should match As many as possible peaks should match Series of contiguous matches 0% 201.1263 316.1614 462.2640 530.2639 777.3981 662.4057 876.4710 990.5370 1153.5664 100 200 300 400 500 600 700 800 900 1000 1100 1200 m/z
MS/MS sekvenování V CID MS/MS spektrech se vyskytují série b a y iontů. Ionty v obou sériích se od sebe liší o zbytky (rezidua) aminokyselin. Součet b a y iontu mínus 1 dává molekulový adukt: b+y-1 = (M+H) + 26
MS/MS sekvenování 27
Pokrytí sekvence, spolehlivost identifikace Pokrytí sekvence část sekvence vyjádřená v procentech, která je podložena experimentálními daty (identifikovanými peptidy). Větší množství identifikovaných peptidů = vyšší spolehlivost identifikace proteinu. Pokrytí sekvence u bottomup maximálně 40-90%. 28
enzymatické štěpení proteinů Vhodný enzym štěpí specificky za malým počtem aminokyselin. Trypsin nejčastěji používaný, štěpí za Arg a Lys, poskytuje relativně krátké peptidy vhodné pro MS/MS. Bazické skupiny (kromě His) jsou na C-konci řetězce, což vede ke vzniku dobře interpretovatelných MS/MS spekter. Příklad: PPKAYEVRIVTKMVAVGICR PPK + AYEVR + IVTK + MVAVGICR Lys-C specificky štěpí za Lys, produkuje delší peptidy než trypsin, obtížnější interpretace MS/MS spekter (Arg uvnitř řetězců). Glu-C méně specifické štěpení v závislosti na ph za Glu nebo i za Asp, obtížnější interpretace MS/MS spekter (Arg, Lys uvnitř řetězců). Asp-N štěpí na N-konci Asp Chymotrypsin málo specifické štěpení za hydrofobními kyselinami, obtížnější interpretace MS/MS spekter (Arg, Lys uvnitř řetězců). 29
De novo sekvenování peptidů De novo sekvenování - způsob přímé interpretace MS/MS spekter peptidů. Hledají se ionty stejných sérií, které se vzájemně liší o zbytky aminokyselin. Ze spektra lze přímo odečíst sekvenci aminokyselin. Lze provádět ručně nebo za pomoci softwaru. výhodou je možnost identifikace peptidů a proteinů, které nejsou v databázích. 30
peptidové mapování Peptidové mapování (Peptide Mass Fingerprinting, PMF) - metoda identifikace proteinů založena na tom, že každý protein po specifickém štěpení poskytuje unikátní soubor peptidů. Protein se naštěpí na peptidy a změří se MS spektrum této směsi (nejčastěji MALDI, ale i ESI). Hmotnosti (m/z) iontů peptidů jsou pak srovnávány s teoretickými hodnotami vypočítanými z proteinových nebo DNA databází (štěpení in silico ). databáze Identifikace 31
Top-down analýza proteinů Top-down proteomika - Intaktní proteiny jsou ionizovány pomocí ESI (nanoesi) a zachyceny v ICR cele nebo iontové pasti spektrometru. Následuje fragmentace, nejčastěji metodou ECD nebo ETD. Vyžaduje instrument s velkou rozlišovací schopností. Middle-down proteomika proteiny jsou enzymaticky štěpeny na velké peptidy (5 20 kda), které jsou dále sekvenovány metodami top-down. 32
Databáze proteinových sekvencí Existuje celá řada databází, některé poskytují celou řadu doplňujících informací o proteinech. UniProt Knowledgebase kombinovaná databáze Swiss-Prot (anotovaná) proteinová sekvenční databáze s minimálními redundancemi) a TrEMBL (překlad nukleotidové sekvenční databáze EMBL). http://www.expasy.uniprot.org/ ExPASy Proteomics Server portál věnovaný analýze proteinů, nástroje pro MS, odkazy, 2D SDS PAGE. http://www.expasy.org/ National Center for Biotechnology Information portál veřejně přístupných databází s molekulárně-biologickými informacemi a softwarovými nástroji pro analýzu dat. http://www.ncbi.nlm.nih.gov/ 33
Určení molekulové hmotnosti: MALDI Při MALDI ionizaci se proteiny nabíjí malým počtem nábojů, většinou jedním nebo dvěma. S vyjímkou analyzátorů s velmi vysokým rozlišením nelze pozorovat oddělené izotopické píky, ale jen jejich obalovou křivku. Měříme tak průměrnou hmotnost. 34
Vliv solí na spektra peptidů a proteinů Odsolení vzorku SPE na C18, C4 (ZipTip) MALDI spektrum vzorku peptidu s vysokou koncentrací solí Přítomnost solí ve vzorku se projeví tvorbou aduktů, nejčastěji s Na +, K +. Pokud analyt obsahuje kyselé funkční skupiny (karboxyl, fosfát apod.) může dojít k výměně kyselých protonů za tyto ionty. Spektra jsou komplikovaná, snižuje se odezva -> zasolené vzorky je nutno čistit (pro ESI bez HPLC, MALDI). 35
Určení molekulové hmotnosti: ESI a nanoesi Biomolekuly (proteiny, oligonukleotidy..) obsahují větší množství center (funkčních skupin), na kterých může dojít k ionizaci (protonizaci, kationizaci, deprotonizaci). V ESI a nanoesi spektrech poskytují tyto látky řadu píků, které odpovídají různým nábojovým stavům téže molekuly. 36
Určení molekulové hmotnosti: ESI a nanoesi = určení nábojového stavu (z) u některého iontu z lze určit z izotopického klastru ze vzdálenosti sousedních píků Molekula o hmotnosti M se nabije z-krát protonem, pík iontu ve spektru je na m z : M zh z m z tj. M z ( m z H ) Pro dva sousední píky ve spektru (j,k) platí: M z j ( m j H ) ( z j 1)( m k H ) z j m m k k H m j z k m m j k H m vzorce pro výpočet nábojového stavu dvou sousedních iontů ve spektru j 37
Určení molekulové hmotnosti: počítačová dekonvoluce V praxi se využívá počítačových dekonvolučních algoritmů, které změřené ESI spektrum převedou na spektrum jednou nabitých iontů (tj. ve spektru po dekonvoluci je pouze ion [M+H] +. naměřené spektrum spektrum po dekonvoluci 38
Určení hmotnosti z ESI spektra - cvičení jed taipana (Oxyuranus) Jaká je mol. hmotnost peptidu? z j m m k k H m j z k m m j k H m j 39
Určení hmotnosti z ESI spektra - cvičení 40
De-novo sekvenování cvičení Jaká je sekvence peptidu?! součet reziduí v sérii + 18 + 1 = (M+H) + 41
De-novo sekvenování cvičení L G S E V Y H N L K (M=1158.603) 42
Nejen jeden protein Analýza proteinů ve směsi s ostatními 43
Proteomika Proteomika je vědní obor, který se zabývá studiem proteinů, jejich struktury a funkcí. Proteom zahrnuje všechny proteiny (včetně modifikovaných), které jsou součástí daného organismu nebo systému v daný časový úsek. Složení proteomu je dynamické a závislé na okamžitém stavu organismu. DNA genomika RNA transkriptomika proteiny proteomika metabolity metabolomika 44
Proteomická analytická výzva 1. Komplexita velké množství proteinů 2. Velký dynamický rozsah koncentrace proteinů V celém v séru, v tkáních, v buňce 45
Komplexita proteomu Příklad: člověk (Jensen O.N., Curr. Opin. Chem. Biol., 2004, 8, 33-41, PMID: 15036154). 46
Referenční interval pro 70 proteinových analytů v plasmě. Anderson N L, and Anderson N G Mol Cell Proteomics 2002;1:845-867 47
Rozdíl 12 řádů 48
Používané separační a analytické metody v proteomice (2-D elektroforéza nebo LC/MS/MS) mají dynamický rozsah 10 2 10 4 Jak vyřešit? 49
100 90 80 Aclaim PepMap 75 um x 150 mm C18, 3um, 100A 70 60 50 40 30 20 10 0 50
15 cm, 125 min 25 cm, 125 min 25 cm, 185 min 51
XIC - Extracted Ion Chromatogram (0.05 Da) m/z 945.49 m/z 850.511 15 cm, 125 min 0.331 0.383 25 cm, 125 min 0.249 0.327 25 cm, 185 min 0.475 0.545 šířka píku (50%) 52
Spectra Proteins Detected 15 cm, 125 min Distinct Peptides Spectra Identified % Total Spectra 33627 1099 13459 23145 68.8 Spectra 25 cm, 125 min Proteins Detected Distinct Peptides Spectra Identified % Total Spectra 35509 1330 14106 23965 67.5 Spectra 25 cm, 185 min Proteins Detected Distinct Peptides Spectra Identified % Total Spectra 58009 1650 20175 39848 68.7 53
25 cm, 125 min, 5% DMSO Spectra Proteins Detected Distinct Peptides Spectra Identified % Total Spectra 38113 1634 18236 26972 70.8 25 cm, 185 min, 5% DMSO Spectra Proteins Detected Distinct Peptides Spectra Identified % Total Spectra 63876 2066 23773 45251 70.8 54
Používané separační a analytické metody v proteomice (2-D elektroforéza nebo LC/MS/MS) mají dynamický rozsah 10 2 10 4 Jak vyřešit? Frakcionace vícedimensionální chromatografie Obohacení skupin analytů Afinitní chromatografie protilátky Chelatační chromatografie Phospho Lektiny glykoproteiny Jiné MS metody - Selected Reaction Monitoring (metoda s největším dynamickým rozsahem 5řádů) 55