Strukturní biologie Vojtěch Spiwok spiwokv@vscht.cz http://web.vscht.cz/spiwokv/modelovani/
Domácí úkol: http://web.vscht.cz/~spiwokv/modelovani/instrukce.html Instrukce: Vytvořte obrázek prostorové struktury vylosovaného proteinu tak, aby z něj byla dobře patrná interakce proteinové části s ligandem nebo ligandy (kofaktory, inhibitory atd). Obrázek musí mít bílé pozadí. Pro proteinovou část použijte reprezentaci bez zobrazení jednotlivých atomů (např. ribon, cartoon a podobně). Pro neproteinovou část použijte zobrazení jednotlivých atomů (sticks, ball&sticks, spheres atd, ale ne lines). Pokud je to vhodné, je možné stejným způsobem zobrazit i atomy vybraných aminokyselinových zbytků. V případě vícepodjednotkových proteinů je možné zobrazit pouze jednu podjednotku, zvláště pokud se nejedná o biologický oligomer (např. je jejich interakce důsledkem krystalizace). V obrázku je možné popsat jednotlivé podjednotky, ligandy, rezidua a podobně. Pro tyto popisky použijte písmo Helvetica. Celý obrázek musí být ve formátu tiff, na šířku musí mít 6-8 cm a rozlišení 300 dpi. K obrázku připojte krátký popisek. V něm uveďte jaký software byl použit. Vhodný software: PyMol - www.pymol.org VMD - www.ks.uiuc.edu/research/vmd/ UCSF Chimera - www.cgl.ucsf.edu/chimera/ nebo jiný
Domácí úkol: http://web.vscht.cz/~spiwokv/modelovani/instrukce.html 1e4v 1ffy 1gal 1ipw 1k22 1n2c 1u70 1upp 1v97 1w4w 1yq2 2fbw 2jhf 2r4f 2vk4 2x91 2xfu 3b7e 3div 3f0t 3g2h 3gzk 3ha1 3hw7 3i9v 3ihj 3jwq 3k4v 3lii 3lxe 3m8r 3maa 3n10 3n8v 3txt 4ake 4ea3 4k5y 4l0d 4l6r 4n6h 4oo9 4or2 8tim
Prostorové struktury proteinů http://ww.pdb.org
Prostorové struktury proteinů http://ww.pdb.org 4iy0 HEADER METAL TRANSPORT 28 JAN 13 4IY0 TITLE STRUCTURAL AND LIGAND BINDING PROPERTIES OF THE BATEMAN DOMAIN OF TITLE 2 HUMAN MAGNESIUM TRANSPORTERS CNNM2 AND CNNM4 COMPND MOL_ID: 1; COMPND 2 MOLECULE: METAL TRANSPORTER CNNM2; COMPND 3 CHAIN: A; COMPND 4 FRAGMENT: CBS DOMAIN, UNP RESIDUES 429 584; COMPND 5 SYNONYM: ANCIENT CONSERVED DOMAIN CONTAINING PROTEIN 2, CYCLIN M2; COMPND 6 ENGINEERED: YES SOURCE MOL_ID: 1; SOURCE 2 ORGANISM_SCIENTIFIC: HOMO SAPIENS; SOURCE 3 ORGANISM_COMMON: HUMAN; SOURCE 4 ORGANISM_TAXID: 9606; SOURCE 5 GENE: CNNM2; SOURCE 6 EXPRESSION_SYSTEM: ESCHERICHIA COLI; SOURCE 7 EXPRESSION_SYSTEM_TAXID: 562; SOURCE 8 EXPRESSION_SYSTEM_STRAIN: BL21; SOURCE 9 EXPRESSION_SYSTEM_VECTOR_TYPE: PLASMID; SOURCE 10 EXPRESSION_SYSTEM_PLASMID: PET101D/TOPO KEYWDS CBS, BATEMAN DOMAIN, MAGNESIUM TRANSPORTER, MAGNESIUM SENSOR, KEYWDS 2 CYTOSOL, METAL TRANSPORT EXPDTA X RAY DIFFRACTION AUTHOR M.A.CORRAL RODRIGUEZ,M.STUIVER,J.A.ENCINAR,V.SPIWOK,I.GOMEZ GARCIA, AUTHOR 2 I.OYENARTE,J.ERENO ORBEA,H.TERASHIMA,A.ACCARDI,T.DIERCKS,D.MULLER, AUTHOR 3 L.A.MARTINEZ CRUZ REVDAT 1 05 MAR 14 4IY0 0 JRNL AUTH M.A.CORRAL RODRIGUEZ,M.STUIVER,J.A.ENCINAR,V.SPIWOK, JRNL AUTH 2 I.GOMEZ GARCIA,I.OYENARTE,J.ERENO ORBEA,H.TERASHIMA, JRNL AUTH 3 A.ACCARDI,T.DIERCKS,D.MULLER,L.A.MARTINEZ CRUZ JRNL TITL STRUCTURAL AND LIGAND BINDING PROPERTIES OF THE BATEMAN JRNL TITL 2 DOMAIN OF HUMAN MAGNESIUM TRANSPORTERS CNNM2 AND CNNM4 JRNL REF TO BE PUBLISHED
Prostorové struktury proteinů http://ww.pdb.org 4iy0 ATOM 1 N LYS A 429 8.077 53.835 35.514 1.00 53.27 N ATOM 2 CA LYS A 429 8.517 54.000 34.098 1.00 49.08 C ATOM 3 C LYS A 429 8.467 52.688 33.305 1.00 50.86 C ATOM 4 O LYS A 429 7.475 51.912 33.321 1.00 53.92 O ATOM 5 CB LYS A 429 7.602 54.970 33.376 1.00 42.11 C ATOM 6 CG LYS A 429 8.387 56.024 32.621 1.00 38.05 C ATOM 7 CD LYS A 429 7.420 57.023 31.846 1.00 36.98 C ATOM 8 CE LYS A 429 6.352 57.598 32.869 1.00 36.13 C ATOM 9 NZ LYS A 429 5.039 57.990 31.976 1.00 40.10 N ATOM 10 N GLU A 430 9.559 52.463 32.556 1.00 52.53 N ATOM 11 CA GLU A 430 9.671 51.252 31.726 1.00 52.49 C ATOM 12 C GLU A 430 8.510 51.194 30.752 1.00 52.19 C ATOM 13 O GLU A 430 7.900 50.114 30.535 1.00 49.13 O ATOM 14 CB GLU A 430 11.060 51.267 31.000 1.00 52.63 C... ATOM 1219 CD GLU A 580 2.214 43.829 35.098 1.00 78.34 C ATOM 1220 OE1 GLU A 580 2.630 43.732 33.920 1.00 78.71 O ATOM 1221 OE2 GLU A 580 1.313 43.084 35.529 1.00 81.53 O TER 1222 GLU A 580 HETATM 1223 PB ADP A 601 17.678 29.642 27.909 1.00 36.41 P HETATM 1224 O1B ADP A 601 17.847 30.324 29.192 1.00 43.11 O HETATM 1225 O2B ADP A 601 18.401 30.375 26.754 1.00 44.59 O HETATM 1226 O3B ADP A 601 18.025 28.203 27.758 1.00 35.60 O HETATM 1227 PA ADP A 601 15.149 30.924 27.443 1.00 35.34 P HETATM 1228 O1A ADP A 601 14.286 30.548 26.263 1.00 33.75 O HETATM 1229 O2A ADP A 601 15.896 32.187 27.543 1.00 34.01 O HETATM 1230 O3A ADP A 601 16.116 29.651 27.621 1.00 33.94 O HETATM 1231 O5' ADP A 601 14.191 30.825 28.734 1.00 31.13 O HETATM 1232 C5' ADP A 601 14.516 31.318 30.070 1.00 34.54 C HETATM 1233 C4' ADP A 601 13.648 30.514 31.070 1.00 34.58 C HETATM 1234 O4' ADP A 601 14.122 29.125 31.120 1.00 33.54 O
Prostorové struktury proteinů http://ww.pdb.org 4iy0 Pymol http://www.pymol.org VMD http://www.ks.uiuc.edu/research/vmd/ USCF Chimera https://www.cgl.ucsf.edu/chimera/
Předpověď prostorových struktur proteinů 1. Homologní modelování Proteiny s podobnou sekvencí mají (obvykle) podobnou prostorovou strukturu. 2. Identifikace způsobu sbalení Proteiny mohou mít podobnou prostorovou strukturu a nemusí mít (na první pohled) podobnou sekvenci. 3. Ab initio, de novo Nativní struktura proteinu má vlastnosti, které jí odlišují od ostatních struktur. 4. Simulace sbalování proteinu Nativní struktura je minimem volné energie proteinu.
Homologní modelování Proteiny s podobnou sekvencí mají (obvykle) podobnou prostorovou strukturu. Abl kinasa 1opl p38 kinasa 1w84 insulinový receptor 1irk
Homologní modelování Proteiny s podobnou sekvencí mají (obvykle) podobnou prostorovou strukturu. Abl kinasa 1opl >1OPL pdb, chain A/1 537 MGQQPGKVLGDQRRPSLPALHFIKGAGKRDSSRHGGPHCNVFVEHEALQRPVASDFEPQG LSEAARWNSKENLLAGPSENDPNLFVALYDFVASGDNTLSITKGEKLRVLGYNHNGEWCE AQTKNGQGWVPSNYITPVNSLEKHSWYHGPVSRNAAEYLLSSGINGSFLVRESESSPGQR SISLRYEGRVYHYRINTASDGKLYVSSESRFNTLAELVHHHSTVADGLITTLHYPAPKRN KPTVYGVSPNY DKWEMERTDITMKHKLGGGQYGEVYEGVWKKYS LTVAVKTLKE DTM EVEEFLKEAAVMKEIKHPNLVQLLGVCTREPPFYIITEFMTYGNLLDYLRE CNRQEVNAVVLLYMATQISSAMEYLEKKNFIHRNLAARNCLVGENHLVKVADFGLS R LMTGDTYTAHAGAKFPIKWTAPESLAYNKFSIKSDVWAFGVLLWEIATYGMSPYPGID LSQVYELLEKDYRMERPEGCPEKVYELMRACWQWNPSDRPSFAEIHQAFETMFQESSISD EVEKELGKENLYFQ >1IRK pdb, chain A/978 1283 insulinový receptor VFPSSVFVPDEWEVSREKITLLRELGQGSFGMVYEGNARDIIKGEAETRVAVKTVNE SASLRERIEFLNEASVMKGFTCHHVVRLLGVVSKGQPTLVVMELMAHGDLKSYLRSLRPE 1irk AENNPGRPPPTLQEMIQMAAEIADGMAYLNAKKFVHRDLAARNCMVAHDFTVKIGDFGMT RDIYETDYYRKGGKGLLPVRWMAPESLKDGVFTTSSDMWSFGVVLWEITSLAEQPYQGLS NEQVLKFVMDGGYLDQPDNCPERVTDLMRMCWQFNPKMRPTFLEIVNLLKDDLHPS FP EVSFFHSEENK YGNLLDYLRE CNRQEVNAVVLLY HGDLKSYLRSLRPEAENNPGRPPPTLQEMIQ
Homologní modelování Proteiny s podobnou sekvencí mají (obvykle) podobnou prostorovou strukturu. Swiss Model http://swissmodel.expasy.org/ Modeller https://salilab.org/modeller/ Postup: 1. nalezení sekvenčně podobného proteinu (proteinů) se známou prostorovou strukturou (např. BLAST) 2. zarovnání sekvencí (Clustal, NW) 3. vytvoření modelu (modeller) 4. kontrola modelu (Prosa, Verify3D)
Modeller Potřebujeme: 1. zarovnání sekvencí 2. struktury templátů 3. instrukce Zarovnání sekvencí Jméno souboru templátu číslo prvního residua číslo posledního residua C; A sample alignment in the PIR format; used in tutorial >P1;5fd1 structurex:5fd1:1 :A:106 :A:ferredoxin:Azotobacter vinelandii: 1.90: 0.19 AFVVTDNCIKCKYTDCVEVCPVDCFYEGPNFLVIHPDECIDCALCEPECPAQAIFSEDEVPEDMQEFIQLNAELA EVWPNITEKKDPLPDAEDWDGVKGKLQHLER* >P1;1fdx sequence:1fdx:1 : :54 : :ferredoxin:peptococcus aerogenes: 2.00: 1.00 AYVINDSC IACGACKPECPVNIIQGS IYAIDADSCIDCGSCASVCPVGAPNPED * řetězec posledního residua Jméno modelu řetězec prvního residua
Modeller Potřebujeme: 1. zarovnání sekvencí 2. struktury templátů 3. instrukce umístění templátu(ů) Instrukce # Homology modeling by the automodel class from modeller import * # Load standard Modeller classes from modeller.automodel import * # Load the automodel class log.verbose() # request verbose output env = environ() # create a new MODELLER environment to build this model in # directories for input atom files env.io.atom_files_directory = ['.', '../atom_files'] název souboru zarovnání a = automodel(env, alnfile = 'alignment.ali', # alignment filename knowns = '5fd1', # codes of the templates sequence = '1fdx') # code of the target a.starting_model= 1 # index of the first model a.ending_model = 1 # index of the last model # (determines how many models to calculate) a.make() # do the actual homology modeling index posledního modelu název templátu(ů) název modelu
Modeller Potřebujeme: 1. zarovnání sekvencí 2. struktury templátů 3. instrukce Vlastní spuštění: python model default.py Vlastní spuštění: mod9.14 model default.py
Modeller Co dál? fúzní protein Templát1 XXXXXXXXXXXXXXXXXX Templát2 XXXXXXXXXXXXXXXXXXXXXXX model XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX inzerce Templát1 XXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXX Templát2 XXXXXX model XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX indukované přizpůsobení Templát1 XXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXX Templát2 XXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXX model XXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXX
Modeller Co dál? Více řetězců C; A sample alignment in the PIR format; used in tutorial >P1;1XXX structurex:1xxx:1 :A:666 :C:::: XXXXXXXXX... XXXXXXXXXXXXX/ XXX XX... XXX* >P1;model sequence:model:1 :A:@ :C:::: XXXXXXXXX... XXXX XXXXX/ XXXXXXXXX... XXX*
Modeller Co dál allhmodel přidá vodíky # Homology modeling by the automodel class from modeller import * # Load standard Modeller classes from modeller.automodel import * # Load the automodel class log.verbose() # request verbose output env = environ() # create a new MODELLER environment to build this model in # directories for input atom files env.io.atom_files_directory = ['.', '../atom_files'] ('5fd1', '1xxx'), více templátů a = automodel(env, alnfile = 'alignment.ali', # alignment filename knowns = '5fd1', # codes of the templates sequence = '1fdx') # code of the target a.starting_model= 1 # index of the first model a.ending_model = 1 # index of the last model # (determines how many models to calculate) a.make() # do the actual homology modeling 50 50 modelů
Modeller Co dál? Disulfidové můstky # Homology modeling by the automodel class from modeller import * # Load standard Modeller classes from modeller.automodel import * # Load the automodel class # Redefine the special_patches routine to include the additional disulfides # (this routine is empty by default): class MyModel(automodel): def special_patches(self, aln): # A disulfide between residues 8 and 45: self.patch(residue_type='disu', residues=(self.residues['8'], self.residues['45'])) log.verbose() # request verbose output env = environ() # create a new MODELLER environment to build this model in # directories for input atom files env.io.atom_files_directory = ['.', '../atom_files'] a = MyModel(env, alnfile = 'alignment.ali', # alignment filename knowns = '5fd1', # codes of the templates sequence = '1fdx') # code of the target a.starting_model= 1 # index of the first model a.ending_model = 1 # index of the last model # (determines how many models to calculate) a.make() # do the actual homology modeling
Modeller Co dál? Vnucení sekundární struktury # Homology modeling by the automodel class from modeller import * # Load standard Modeller classes from modeller.automodel import * # Load the automodel class class MyModel(automodel): def special_restraints(self, aln): rsr = self.restraints at = self.atoms rsr.add(secondary_structure.alpha(self.residue_range('20:', '30:'))) log.verbose() # request verbose output env = environ() # create a new MODELLER environment to build this model in # directories for input atom files env.io.atom_files_directory = ['.', '../atom_files'] a = MyModel(env, alnfile = 'alignment.ali', # alignment filename knowns = '5fd1', # codes of the templates sequence = '1fdx') # code of the target a.starting_model= 1 # index of the first model a.ending_model = 1 # index of the last model # (determines how many models to calculate) a.make() # do the actual homology modeling
Identifikace způsobu sbalení Proteiny mohou mít podobnou prostorovou strukturu a nemusí mít (na první pohled) podobnou sekvenci. triosafosfátisomerasa 7TIM Aldolasa 3d0c TIM ARTFFVGGNFKLNGSKQSIKEIVERLNTASIPENVEVVICPPATYLDYSVSLVKKPQVTV aldo MSLDYGEFSKRF STISG TIM GAQNAYLKASGAFTG ENSVDQIKDVGAKWVILGHSERRSY FHEDDKFIADKTKFA aldo INIVPFLEGTREIDWKGLDDNVEFLLQNGIEVIVPNGNTGEFYALTIEEAKQVATRVTEL TIM LGQGVGVILCIGETLEEKKAGKTLDVVERQLNAVLEEVKDWTNVVVAYEPVWAIGTGLAA aldo VNGRATVVAGIGYS VDTAIELGKSAID SGADCVMIHQP VHPYI TIM TPEDAQDIHASIRKFLASKL GDKAASELR ILYGGSANGSNAVTF aldo TDAGAVEYYRNIIEALDAPSIIYFKDAHLSDDVIKELAPLDKLVGIKY AINDIQRVTQ TIM KDKADVDGFLVGGASLKPEFVDIINSRN aldo VMRAVPKSSNVAFICGTAEKWAPFFYHAGAVGFTSGLVNVFPQKSFALLEALEEGNQEKI 12 % identity
Identifikace způsobu sbalení Proteiny mohou mít podobnou prostorovou strukturu a nemusí mít (na první pohled) podobnou sekvenci. PHYRE2 http://www.sbg.bio.ic.ac.uk/phyre2/ Fold Recognition - UCLA-DOE http://www.doe-mbi.ucla.edu/services/fold/ I-TASSER http://zhanglab.ccmb.med.umich.edu/i-tasser/
Ab initio, de novo Nativní struktura proteinu má vlastnosti, které jí odlišují od ostatních struktur. FoldIT http://fold.it
Simulace sbalování proteinu Nativní struktura je minimem volné energie proteinu. K. Lindorff-Larsen, S. Piana, R.O. Dror, D.E.Shaw: How Fast-Folding Proteins Fold. Science 2011, 334(6055) 517-520.
Simulace sbalování proteinu Nativní struktura je minimem volné energie proteinu. VIDEO
CASP Critical Assessment of protein Structure Prediction http://predictioncenter.org/
CASP Critical Assessment of protein Structure Prediction http://predictioncenter.org/