Strukturní bioinformatika KFC/STBI

Podobné dokumenty
Bioinformatika a výpočetní biologie KFC/BIN. I. Přehled

Struktura biomakromolekul

Struktura biomakromolekul

Bioinformatika a výpočetní biologie KFC/BIN. I. Přehled

P ro te i n o vé d a ta b á ze

Genomické databáze. Shlukování proteinových sekvencí. Ivana Rudolfová. školitel: doc. Ing. Jaroslav Zendulka, CSc.

Využití metod strojového učení v bioinformatice David Hoksza

Nukleové kyseliny Replikace Transkripce, RNA processing Translace

Typy nukleových kyselin. deoxyribonukleová (DNA); ribonukleová (RNA).

Nukleové kyseliny Replikace Transkripce, RNA processing Translace

NUKLEOVÉ KYSELINY. Složení nukleových kyselin. Typy nukleových kyselin:

Struktura a funkce biomakromolekul

MOLEKULOVÉ MODELOVÁNÍ - STRUKTURA. Monika Pěntáková Katedra Farmaceutické chemie

Typy molekul, látek a jejich vazeb v organismech

Nukleosidy, nukleotidy, nukleové kyseliny, genetická informace

Centrální dogma molekulární biologie

Hemoglobin a jemu podobní... Studijní materiál. Jan Komárek

Struktura a funkce biomakromolekul

NUKLEOVÉ KYSELINY. Základ života

STRUKTURA PROTEINŮ

Přírodní polymery proteiny

Zpracování informací a vizualizace v chemii (C2150) 1. Úvod, databáze molekul

Bioinformatika pro PrfUK 2003

VÝZNAM FUNKCE PROTEINŮ V MEDICÍNĚ

Nukleové kyseliny. DeoxyriboNucleic li Acid

KFC/STBI Strukturní bioinformatika

Blok 2 Sekundární struktura proteinů

Struktura nukleových kyselin Vlastnosti genetického materiálu

Projekt SIPVZ č.0636p2006 Buňka interaktivní výuková aplikace

Molekulární základy dědičnosti. Ústřední dogma molekulární biologie Struktura DNA a RNA

Garant předmětu GEN: prof. Ing. Jindřich Čítek, CSc. Garant předmětu GEN1: prof. Ing. Václav Řehout, CSc.

Využití strojového učení k identifikaci protein-ligand aktivních míst

Studijní materiály pro bioinformatickou část ViBuChu. úloha II. Jan Komárek, Gabriel Demo

Základy molekulární a buněčné biologie. Přípravný kurz Komb.forma studia oboru Všeobecná sestra

Má tajemný clusterin u dětí v septickém stavu aktivitu chaperonu? J. Žurek, P.Košut, M. Fedora

Vazebné interakce protein s DNA

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ

Proteiny Genová exprese Doc. MVDr. Eva Bártová, Ph.D.

Nukleové kyseliny. Nukleové kyseliny. Genetická informace. Gen a genom. Složení nukleových kyselin. Centrální dogma molekulární biologie

DUM č. 11 v sadě. 37. Bi-2 Cytologie, molekulární biologie a genetika

Schéma průběhu transkripce

Struktura a funkce biomakromolekul

(molekulární) biologie buňky

Služby pro predikci struktury proteinů. Josef Pihera

BÍLKOVINY. V organismu se nedají nahradit jinými sloučeninami, jen jako zdroj energie je mohou nahradit sacharidy a lipidy.

BÍLKOVINY. Autor: Mgr. Stanislava Bubíková. Datum (období) tvorby: Ročník: devátý

Základy genomiky. I. Úvod do bioinformatiky. Jan Hejátko

Úvod do molekulové dynamiky simulace proteinů. Eva Fadrná

Genetika zvířat - MENDELU

Inovace studia molekulární a buněčné biologie

NMR biomakromolekul RCSB PDB. Progr. NMR

Biologie buňky. systém schopný udržovat se a rozmnožovat

V organismu se bílkoviny nedají nahradit žádnými jinými sloučeninami, jen jako zdroj energie je mohou nahradit sacharidy a lipidy.

Základy molekulární biologie KBC/MBIOZ

Struktura, vlastnosti a funkce nukleových kyselin, DNA v jádře, chromatin.

Nukleové kyseliny příručka pro učitele. Obecné informace:

Předmět: KBB/BB1P; KBB/BUBIO

Exprese genetické informace

Gymnázium, Brno, Elgartova 3

Testové úlohy aminokyseliny, proteiny. post test

analýzy dat v oboru Matematická biologie

Lodish et al, Molecular Cell Biology, 4-6 vydání Alberts et al, Molecular Biology of the Cell, 4 vydání

Nukleové kyseliny Replikace Transkripce translace

Biopolymery. struktura syntéza

Výukový materiál zpracován v rámci projektu EU peníze školám Registrační číslo projektu: CZ.1.07/1.5.00/

BUNĚČ ORGANISMŮ KLÍČOVÁ SLOVA:

Bílkoviny - proteiny

Nukleové kyseliny Replikace Transkripce translace

Základy molekulární biologie KBC/MBIOZ

Nukleové kyseliny. obecný přehled

Aplikovaná bioinformatika

Molekulárn. rní. biologie Struktura DNA a RNA

Bílkoviny a rostlinná buňka

Configuration vs. Conformation. Configuration: Covalent bonds must be broken. Two kinds of isomers to consider

Dynamické procesy & Pokročilé aplikace NMR. chemická výměna, translační difuze, gradientní pulsy, potlačení rozpouštědla, NMR proteinů

Přípravný kurz z biologie MUDr. Jana Kolářová, CSc. témata 1 Mgr. Kateřina Caltová témata 3-5 doc. PharmDr. Emil Rudolf, Ph.D materiály k

PROTEINY. Biochemický ústav LF MU (H.P.)

Eukleidovský prostor a KSS Eukleidovský prostor je bodový prostor, ve kterém je definována vzdálenost dvou bodů (metrika)

Aminokyseliny, Peptidy, Proteiny

Biologie buňky. proteiny, nukleové kyseliny, procesy genom, architekura,funkce, mitoza, buněčná smrt, kmenové buňky, diferenciace

Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague

DUM č. 3 v sadě. 37. Bi-2 Cytologie, molekulární biologie a genetika

ANALÝZA NÁSTROJŮ PRO ZJIŠŤOVÁNÍ PODOBNOSTI TERCIÁRNÍCH STRUKTUR PROTEINŮ

GENETIKA dědičností heredita proměnlivostí variabilitu Dědičnost - heredita podobnými znaky genetickou informací Proměnlivost - variabilita

jádro a elektronový obal jádro nukleony obal elektrony, pro chemii významné valenční elektrony

BIOINFORMATICKÝ NÁSTROJ PRO PREDIKCI STRUKTURY PROTEINŮ BIOINFORMATICS TOOL FOR PROTEIN STRUCTURE PREDICTION

4. Centrální dogma, rozluštění genetického kódu a zrod molekulární biologie.

DIPLOMOVÁ PRÁCE OPTIMALIZACE MECHANICKÝCH

OPVK CZ.1.07/2.2.00/

KFC/STBI Strukturní bioinformatika

Složení a struktura základních biomolekul (nk,proteiny,sacharidy)

Svět RNA a bílkovin. RNA svět, 1. polovina. RNA svět. Doporučená literatura. Struktura RNA. Transkripce. Regulace transkripce.

Struktura a funkce nukleových kyselin

POLYPEPTIDY. Provitaminy = organické sloučeniny bez vitaminózního účinku, které se v živočišném těle mění působením ÚV záření nebo enzymů na vitaminy.

Deriváty karboxylových kyselin, aminokyseliny, estery

Využití NMR spektroskopie pro studium biomakromolekul RCSB PDB

6. Nukleové kyseliny

2. Z následujících tvrzení, týkajících se prokaryotické buňky, vyberte správné:

Uspořádání genomu v jádře buňky a jeho možná funkce. Stanislav Kozubek Biofyzikální ústav AV ČR, v.v.i.

jedné aminokyseliny v molekule jednoho z polypeptidů hemoglobinu

Transkript:

Strukturní bioinformatika KFC/STBI 01_úvod Karel Berka

Podmínky Prokázání znalostí o bioinformatice Projekt: analýza struktury, docking, porovnání proteinů, predikce vlastností ze struktury,... 1(max. 2) stránkový report o tom, co jste chtěli studovat (hypotéza), čím jste to studovali, k čemu jste došli Zkouška: otázky ala popis problému + diskuze nad tím, jak byste ho řešili

Rozvrh Středa 11:30-13:00 ve 3.002 1 2 3 4 5 6 7 8 9 10 11 12 13 datum 22.9. 28.9. 5.10. 12.10. 19.10. 26.10. 2.11. 9.11. 16.11. 23.11. 30.11. 7.12. 14.12. obsah Seznameni, popis struktury, hierarchie struktury biomolekul, proteiny, NA Statni svatek Marseilles Struktura, její formáty a získávání - Xray, NMR, EM, DXMS, Crosslinky Databaze PDB, Vyhledavani + cviceni databaze NDB, ostatní databaze (CATH, SCOP) vizualizace, alignment + Pymol Predikce struktury, funkce, membranove regiony, pristupnost solventu + cviceni Predikce - cviceni Protein motions, kontrola kvality, CASP Docking a drug discovery, clustering Cviceni dockingu Výzvy - membránové proteiny, RNA bioinfo

Definice bioinformatiky (Molecular) bio informatics: bioinformatics is conceptualising biology in terms of molecules (in the sense of physical chemistry) and applying "informatics techniques" (derived from disciplines such as applied maths, computer science and statistics) to understand and organise the data and information associated with these molecules, on a large scale. In short, bioinformatics is a management information system for molecular biology and has many practical applications. Oxford English Dictionary

Strukturní bioinformatika Vycházíme ze známé struktury látek Databáze, klasifikace proteinů, NA, nízkomolekulárních léčiv; hledání v nich Predikce struktury, funkce, aktivního místa, chování Molekulární grafika vizualizace biologického systému Docking hledání látek, které se váží do aktivního místa: vodítko pro drug design a pochopení biologie Simulace co by se stalo, kdyby

Problémy strukturní bioinformatiky Strukturní data obtížně zpracovatelná: nelineární nutnost aproximací spojitá (problém prohledávání) exp. chyby vizualizace větší konzervovanost, než odpovídající sekvenční data (genomická) strukturní genomika chrlí struktury bez známých funkcí většina struktur je z krystalu globulárních molekul z vodného roztoku

Výzvy Výběr cílů drahé, místo proteinu občas stačí doména Zisk struktur XRay krystalizace NMR omezen velikostí EM nemá atomický detail Kontrola struktur a anotace Databáze Korelace strukturních informací s biochemickými experimenty

Příklad 1 : Predikce proteinové struktury Terciární struktura rozpoznání foldu homologní modelování strukturní alignment ab initio modelování Predikce funkce hledání aktivních míst a kanálů

Příklad 2: Molekulární grafika Helikáza rozevírající DNA Simulace Struktura => Energie vývoj v čase Docking hledání jak a kam se látky váží ligandy proteiny mezi sebou docking do acetyltransferázy v programu GOLD

Popis struktury Základní způsob jak representovat strukturu Délky vazeb, vazebné úhly, torzní (dihedrální)úhly Systém souřadnic - xyz (cartesian) - vnitřní souřadnice - objektové reprezentace (pozice sekundárních struktur) Srovnávání struktur, RMSD root mean square distance mezi dvěma strukturami

Základní geometrická měření a operace Délky vazeb Úhly mezi vazbami Torzní (dihedrální úhly)

Délka vazby Vzdálenost mezi vazebnými atomy je konstantní Závisí na typu vazby (jednoduchá C-C, dvojná C=C, trojná C C) Mění se od přibližně 1 A pro C H, až k 1.5 A C C, Některé jsou ještě delší Délka vazby je funkcí pozice dvou atomů

Výpočet vazebné vzdálenosti Pro dva body o souřadnicích (x1,y1,z1) a (x2,y2,z2) Vzdálenost = sqrt [(x2-x1) 2 + (y2-y1) 2 + (z2-z1) 2 ] Některé vzdálenosti nekovalentně vázaných atomů jsou V páteři proteinu konstantní Cα Cα vzdálenosti jsou u konsekutivního peptidu 3.8A

Vazebné úhly Všechny vazebné úhly jsou určeny uspořádáním tří sousedních vazebných atomů a jsou pro danný typ konstantní Závisí na typu atomu a množství elektronů zahrnutých ve vazbě Interval je od 100 do 180 Vazebný úhel je funkcí pozice tří atomů

Výpočet vazebného úhlu x B Θ y A X.Y = X. Y.cos (Θ) C Θ = arccos (X.Y/ X. Y ) Úhel lze určit výpočtem arccosinu úhlu, který svírají vektory určené BA a BC

Dihedrální úhel obvykle je velmi variabilní může zaujímat hodnoty od 0 do 360 Nejznámější torzní úhly jsou φ,ψ,ω a χ Dihedrální úhel je funkcí pozice 4 atomů

Dihedrální úhel A směr pohledu B C A B C φ D D

Výpočet dihedrálního úhlu Výpočet úhlu sevřeného vektory kolmými k rovinám které jsou definovány 1) Vektory BA a CB 2) Vektory CB a DC Úhel mezi těmito dvěma vektory je dihedrální úhel A B C D

Jiné souřadné soustavy Cartesiánský souřadný systém je ortogonální (x,y,z) a udávají se v něm koordináty většiny struktur Jsou li ovšem délky vazeb a vazebných úhlů konstantní, je možné množství souřadnic redukovat a popisovat pouze dihedrální úhel => Vnitřní souřadnice Pokud víme že je určitá část proteinu ve standardní konformaci přesně definované pomocí sekundární struktury, můžeme na ni pohlížet jako na pevné těleso => Objektový souřadný systém

Výhody vnitřních souřadnic 3 peptidové jednotky = 12 atomů = 36 souřadnic NEBO 6 dih. úhlů 3 postrannířetězce = 12 atomů =36 souřadnic NEBO 5 dih. Úhlů 72 cartesiánských souřadnic versus 11 vnitřních

Nevýhody vnitřních souřadnic Některé základní výpočty jsou mnohem obtížnější Vzdálenost mezi dvěma body Určení nejbližších bodů (atomů) k určitému bodu Obtížně lze porovnávat nezávislé objekty Mnohem více nelineárních vztahů mezi souřadnicemi což může činit optimalizaci obtížnou nebo nemožnou

Objektový souřadný systém Využití větších celků, např. sekundární struktury, souborů atomů Např. šroubovici a její umístění v prostoru lze representovat minimálně 6 souřadnicemi Můžeme vystavět šroubovici v normálním Koordinačním systému (x,y,z) a potom K určení jeího umístění v proteinu použít Operace TRANSLACE a ROTACE T,R

Porovnávání struktur K porovnávání dvou struktur A a B potřebujeme několik základních údajů: 1. Který atom z A koresponduje s kterým atomem z B proto děláme alignment 2. Kde v prostoru jsou atomy lokalizovány soubory z PDB 3. Potřebujeme kriteria pro srovnání RMSD, energie

RMSD = root mean square deviation Atomy bereme jako rovnocenné a hledáme informaci jak lze dvě struktury vzájemně superponovat Jsou li struktury identické, potom jejich vzdálenost je rovna 0 Jsou li struktury různé vzdálenost vzrůstá RMSD = Σ d 2 i N N je počet atomů d i je vzdálenost dvou atomů s indexem i struktur A a B

nalézt minimum RMSD Cíl porovnávání

Výpočet RMSD Může být formulován jako neefektivní prohledávání kolem superpozičního centra (těžiště) (Huang,Blostein,Margerum) Metody založené na kvarternionech (Faugeras a Hebert) Metody založené na singularitě speciálně konstruovaných matic (Arun, Huang, Blostein)

Arunův algoritmus Vypočte se centroid ze všech bodů daného objektu Centroidy se odečtou, oba objekty mají stejný počátek Sestrojí se speciální matice jako suma jednotlivých vektorových produktů (vzdálenost, úhel, dihedrál) Dekompozice matice použitím tzv. Singulární dekompozice a použití výsledné matice ke konstrukci optimální rotace Výpočet translace k provedení optimální rotace Tento algoritus je optimální a univerzální pro široké spektrum podmínek

Výhody a nevýhody RMSD Přiměřené chování, identické struktury mají RMSD =0 Jednoduchost výpočtu Přirozené jednotky (Angstroms) Zkušenost ( podobné struktury mají RMSD obvykle v rozmezí 1 3 A) Váha všech atomů je stejná přitom různě těžké atomy mají reálně různý vliv často pak RMSD pouze páteře, nebo těžkých atomů (CNOS) Nejasné hranice (vazebné podmínky) Význam hodnot se mění jako funkce velikosti proteinu

proteiny NA DNA, RNA lipidy polysacharidy malé molekuly (hormony, léčiva, polutanty) Biomolekuly

Hierarchie struktur makromolekul Lodish, Molecular Cell Biology, 5th Ed.

Proteiny aminokyseliny hlavní a vedlejší řetězec primární struktura sekvence aminokyselin sekundární struktura časté strukturní znaky terciární struktura tvar domény kvartérní struktura tvar proteinového seskupení http://cs.wikipedia.org/wiki/soubor:proteinstructures.png

Aminokyseliny

Primární struktura proteinů Alberts, Molecular Biology of the Cell, 5th Ed.

Sekundární struktura poskládání lokálních částí polypeptidového řetězce sekundární struktura záleží na sekvenci aminokyselin α-helix skládaný list (β-sheet) otočka (β-turn, loop)

Důležité dihedrální úhly v proteinech O N Cα C N Cα C N Cα C O O omega ω Cα - Cα psi ψ N - N phi φ C - C

Důležité dihedrální úhly v proteinech Omega je konstantní = 180 (C-N volně nerotuje) Phi,Psi mají interval hodnot (Ca-N, N-C mohou rotovat) Interval hodnot je omezen prostorovým uspořádáním Aminokyselin v sekvenci za sebou O N Cα C ω ψ φ N Cα C N Cα C O O

Ramachandranův graf typické hodnoty dihedrálních úhlů v prvcích sekundární struktury: Alpha šroubovice phi = - 57, psi = - 47 Paralelní beta řetězec phi = - 119, psi = 113 Antiparalelní beta řetězec phi = - 139, psi = 135 3-10 šroubovice phi = - 49, psi = - 26

Ramachandran plot

PROCHECK summary for 1aaq PROCHECK statistics Ramachandran Plot statistics No. of residues %-tage ------ ------ Most favoured regions [A,B,L] 146 Additional allowed regions [a,b,l,p] 12 92.4% 7.6% Generously allowed regions [~a,~b,~l,~p] 0 0.0% Disallowed regions [XX] 0 0.0% ---- ------ Non-glycine and non-proline residues 158 100.0% End-residues (excl. Gly and Pro) 2 Glycine residues 26 Proline residues 12 ---- Total number of residues 198

Terciární struktura fold globulární membránové fibrilární nese funkci domény

CATHerine wheels. Cuff A L et al. Nucl. Acids Res. 2011;39:D420-D426 The distribution of all nonhomologous structures (2386) within CATH v3.3 Classes: pink (mainlyα), yellow (mainlyβ), green (αβ) brown (little secondary structure). Proportion of structures within any given architecture (inner circle) Fold group (outer circle). The Author(s) 2010. Published by Oxford University Press.

asociace více řetězců: Kooperativita (asociace zesílí vazebné vlastnosti) hemoglobin Kolokalizace funkce (každá podjednotka dělá něco jiného) tryptophansyntáza Kombinace podjednotek (přizpůsobování) imunoglobuliny Skládání větších struktur (podjednotky uspořádávají procesem self-assembly) aktin, virové kapsidy Kvartérní struktura Petsko, Ringe Protein structure and function

Nukleové kyseliny (NA) Primární struktura sekvence bazí nukleových kyselin ve vláknech Sekundární struktura set interakcí mezi bázemi Tercární struktura 3D lokalizace atomů Kvartérní struktura vyšší úrovně organizace DNA v chromatinu interakce RNA units v ribosomu nebo spliceosomu.

DNA deoxyribonucleic acid bases, deoxyribose sugar, phosphate nucleotide Bases are flat stacking pyrimidines C, T purines A, G http://www.umass.edu/molvis/tutorials/dna/, http://ich.vscht.cz/~svozil/teaching.html

Nucleoside O5 C5 base C3 sugar O3

Nucleotide nucleosides are interconnected by phospohodiester bond nucleotide monophosphate nucleoside

Bases complement each other. Chargaffs rules amount of G = C amount of A = T Watson-Crick párování

Párování

DNA backbone 5 end 3 end

Base at sugar dihedrals Anti Syn

Sugar conformation orientation with respect to C5 same side endo opposite side exo

Pseudorotational cycle for furanose ring puckers. Pucker conformation of sugars in CSD database from PROSIT server 2007 The Author(s) Maderia M et al. Nucl. Acids Res. 2007;35:1978-1991

Dvoušroubovice 5 3 AATCGCTA TTAGCGAT 3 5 antiparallel

Typy DNA A B Z B-DNA A-DNA Z-DNA

Biological role of different DNAs B-DNA canonical DNA predominant A-DNA Conditions of lower humidity, common in crystallographic experiments. However, they re artificial. In vivo local conformations induced e.g. by interaction with proteins. Z-DNA No definite biological significance found up to now. It is commonly believed to provide torsional strain relief (supercoiling) while DNA transcription occurs. The potential to form a Z-DNA structure also correlates with regions of active transcription.

Different sets of DNA nuclear DNA cell s nucleus majority of functions cell carries out sequencing the genome scientists mean nuclear DNA mitochondrial DNA mtdna circular, in human very short (17 kbp) with 37 genes (controling cellular metabolism) all mtdna comes from mom chloroplast DNA cpdna circular and fairly large (120 160 kbp), with only 120 genes inheritance is either maternal, or paternal

RNA - ribonucleic acid primární struktura terciární struktura sekundární struktura hammerhead ribozyme 2GOZ

RNA pre-mrna hairpin 50S-ribozome hammerhead ribozyme 2GOZ http://en.wikipedia.org/wiki/list_of_rnas

N. B. Leontis, E. Westhof, RNA (2001), 7:499-512 RNA

RNA sekundární struktura N. B. Leontis, E. Westhof, RNA (2001), 7:499-512

Mokdad A, Leontis N B Bioinformatics 2006;22:2168-2170 RNA reprezentace

RNA backbone Richardson J S et al. RNA 2008;14:465-481 Copyright 2008 RNA Society

RNA Tetraloop Family Tree. Hsiao C et al. Nucl. Acids Res. 2006;34:1481-1491

Lipidy main phospholipids M. Paloncyová, Lipid membranes report, 2010

role: ukládání energie molekulární rozpoznávání Polysacharidy zatím neumíme číst sekvence jako to umíme pro proteiny a NA často navěšeny na proteiny, hlavně na extracelulární glycogen

Malé molekuly NTP buněčné palivo (ATP) základní kameny pro NA messengery (camp, xenobiotika) caffeine ibuprofen