Služby pro predikci struktury proteinů. Josef Pihera

Podobné dokumenty
Genomické databáze. Shlukování proteinových sekvencí. Ivana Rudolfová. školitel: doc. Ing. Jaroslav Zendulka, CSc.

P ro te i n o vé d a ta b á ze

Bioinformatika a výpočetní biologie KFC/BIN. I. Přehled

KFC/STBI Strukturní bioinformatika

WEBOVÝ SERVER PRO PREDIKCI 3D STRUKTURY PROTEINU

Studijní materiály pro bioinformatickou část ViBuChu. úloha II. Jan Komárek, Gabriel Demo

Využití metod strojového učení v bioinformatice David Hoksza

Hemoglobin a jemu podobní... Studijní materiál. Jan Komárek

Bioinformatika pro PrfUK 2003

Struktura biomakromolekul

Využití strojového učení k identifikaci protein-ligand aktivních míst

BIOINFORMATICKÝ NÁSTROJ PRO PREDIKCI STRUKTURY PROTEINŮ BIOINFORMATICS TOOL FOR PROTEIN STRUCTURE PREDICTION

Přírodní polymery proteiny

Enzymové pexeso. L: lactose P: operon

Maturitní projekt do IVT Pavel Doleček

Nukleové kyseliny Replikace Transkripce, RNA processing Translace

Typy nukleových kyselin. deoxyribonukleová (DNA); ribonukleová (RNA).

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY PREDIKCE PROTEINOVÝCH DOMÉN PROTEIN DOMAINS PREDICTION

Formy komunikace s knihovnami

Exprese genetické informace

Struktura biomakromolekul

Algoritmy a struktury neuropočítačů ASN - P10. Aplikace UNS v biomedicíně

Blok 2 Sekundární struktura proteinů

BRDSM core: Komplexní systém dynamického řízení kvality plynule odlévané oceli

NUKLEOVÉ KYSELINY. Základ života

Celosvětová síť Internet. IKT pro PD1

Obchodní akademie a Jazyková škola s právem státní jazykové zkoušky Jihlava

Moderní systémy pro získávání znalostí z informací a dat

ArcGIS Online Subscription

Vazebné interakce protein s DNA

Gymnázium Vysoké Mýto nám. Vaňorného 163, Vysoké Mýto

ZÍSKÁVÁNÍ ZNALOSTÍ Z DATABÁZÍ

Biologie buňky. systém schopný udržovat se a rozmnožovat

Molekulární základy dědičnosti. Ústřední dogma molekulární biologie Struktura DNA a RNA

Strukturní biologie. Vojtěch Spiwok.

Služby Microsoft Office 365

Exprese genetického kódu Centrální dogma molekulární biologie DNA RNA proteinu transkripce DNA mrna translace proteosyntéza

Inovace studia molekulární a buněčné biologie

Struktura a funkce biomakromolekul

TUBULIN-FOLDING COFACTOR A (TFC A) u Arabidopsis

Vektorové dlaždice. a jejich využití pro vizualizaci dat katastru nemovitostí. Filip Zavadil, Cleerio s.r.o

Bioinformatika a výpočetní biologie KFC/BIN. I. Přehled

1) Jak postupovat při vyhledávání literatury kde začít a jak dál. 2) Jak získat vyhledanou literaturu. 3) Práce s literaturou - zpracování

Jak postupovat při vyhledávání literárních zdrojů

Využití laktoferinu jako ukazatele pro predikci mastitid a nové směry analýzy mléka

6. Nukleové kyseliny

ZEMĚMĚŘICKÝ ÚŘAD. Poskytování dat a služeb Geoportál ČÚZK. Petr Dvořáček

Masarykova univerzita

Univerzita Karlova v Praze Přírodovědecká fakulta

Výukový materiál zpracován v rámci projektu EU peníze školám Registrační číslo projektu: CZ.1.07/1.5.00/

Struktura proteinů. - testík na procvičení. Vladimíra Kvasnicová


Specializovaná mapa s interpretací regionálních rozdílů v oblasti sociálního výzkumu

Geografické informační systémy

Proteiny Genová exprese Doc. MVDr. Eva Bártová, Ph.D.

Jak se matematika poučila v biologii

Molekulární biotechnologie č.9. Cílená mutageneze a proteinové inženýrství

Základy genomiky. I. Úvod do bioinformatiky. Jan Hejátko

BÍLKOVINY. Autor: Mgr. Stanislava Bubíková. Datum (období) tvorby: Ročník: devátý

Mapa Česka:

Ceník programu DesignBuilder v5

Vztah genotyp fenotyp

Server Internetu prostøednictvím slu eb (web, , pøenos souborù) poskytuje data. Na na í pracovní stanici Internet

Server Internetu prostøednictvím slu eb (web, , pøenos souborù) poskytuje data. Na na í pracovní stanici Internet

Virtuáln. lní knihovny přístup k dokumentům a službám kdykoliv a odkudkoliv

ZEMĚMĚŘICKÝ ÚŘAD. Poskytování dat a služeb Geoportál ČÚZK

Aplikovaná bioinformatika

COSY + - podmínky měření a zpracování dat ztráta rozlišení ve spektru. inphase dublet, disperzní. antiphase dublet, absorpční

INSTITUT PRO TESTOVÁNÍ A CERTIFIKACI, a. s. NÁVOD NA PŘÍSTUP K SEZNAMŮM VYSTAVENÝCH DOKUMENTŮ

Struktura a funkce biomakromolekul

Tovek Tools. Tovek Tools jsou standardně dodávány ve dvou variantách: Tovek Tools Search Pack Tovek Tools Analyst Pack. Připojené informační zdroje

Nukleové kyseliny Milan Haminger BiGy Brno 2017

Dynamické procesy & Pokročilé aplikace NMR. chemická výměna, translační difuze, gradientní pulsy, potlačení rozpouštědla, NMR proteinů

2012 STÁTNÍ ÚSTAV PRO KONTROLU LÉČIV

Typy molekul, látek a jejich vazeb v organismech

ZEMĚMĚŘICKÝ ÚŘAD. Poskytování dat a služeb Geoportál ČÚZK. Petr Dvořáček

Dolování z textu. Martin Vítek

Projekty podpořené z programu TAČR

Nukleosidy, nukleotidy, nukleové kyseliny, genetická informace

Centrální dogma molekulární biologie

ANOTACE vytvořených/inovovaných materiálů

ROZŠIŘOVÁNÍ MOŽNOSTÍ PUBLIKACE DAT ZEMĚMĚŘICKÉHO ÚŘADU

Prezentace projektu do systému vzdělávání zaměstnanců a spolupracovníků knihoven

Rubrika Zajímavostí ze zahraničního obchodu končí, ostatní zdroje získávání dat zůstávají

Přednáška 12. Neutronová difrakce a rozptyl neutronů. Martin Kormunda

Schvalovací proces žádostí o úvěr

Zpracování informací a vizualizace v chemii (C2150) 1. Úvod, databáze molekul

Software Form Control

Xerox Váš partner pro tvorbu, digitalizaci a správu dokumentů.

VÝZNAM FUNKCE PROTEINŮ V MEDICÍNĚ

Nukleové kyseliny. obecný přehled

Strojové učení Marta Vomlelová

Bílkoviny - proteiny

Modelov an ı biologick ych syst em u Radek Pel anek

DUM č. 11 v sadě. 37. Bi-2 Cytologie, molekulární biologie a genetika

Přehled kartografické tvorby Zeměměřického úřadu

VYHLEDÁVÁNÍ NA INTERNETU. Přednášející: Ondřej Douša

Wichterlovo gymnázium, Ostrava-Poruba, příspěvková organizace. Maturitní otázky z předmětu INFORMATIKA A VÝPOČETNÍ TECHNIKA

Nukleové kyseliny. Nukleové kyseliny. Genetická informace. Gen a genom. Složení nukleových kyselin. Centrální dogma molekulární biologie

Transkript:

Služby pro predikci struktury proteinů Josef Pihera

Struktura proteinů Primární sekvence aminokyselin Sekundární stáčení a spojování vodíkovými vazbami Supersekundární struktura přechod, opakovaná geometrická uspořádání Terciární Skládání proteinů Kvaternární kompozice více proteinů Formování struktury záleží na rotaci molekul kolem uhlíků C-alpha a C-beta v peptidech Rozdělení na Alfa a Beta formace (kladné/záporné úhly)

Sekundární struktura Alpha-helix Beta-sheet (Beta-skládaný list) 3-vláknový antiparalelní b-sheet

Supersekundární struktura Beta-hairpin Beta-corners Helix-hairpin A-a corner Helix-turn-helix

Terciární struktura Alfa topologie (cytokin, transkripční faktory, globiny) Beta topologie sendviče a sudy Alfa-Beta topologie

Kvarternární struktury Hetero-multimery Homo-multimery Větší struktury (viry, mikrotubuly, histony ) imaging.beckman.illinois.edu Virus obrny

Význam znalosti struktury proteinů Objevování a výzkum léčiv Experimentální toxikologie Predikce funkce proteinů Zkoumání genetického driftu Exprese genu

Metody určení struktury Sekundární struktura Bayesovské modely Strojové učení SVM, neuronové sítě Terciární struktura Ab Initio výpočetně náročné, používání tzv. kontaktních map Komparativní metody Homologie podobné geny mají podobnou strukturu Folding recognition v přírodě se vyskytuje cca 1300 základních šablon, zbytek jsou modifikace minimalizace skórovací funkce, hledání nejvhodnější šablony Využívání existujících databází (např. PFAM, SMART, CDD, COG, KOG, nebo PDB, SCOP)

Dostupné služby Placené / Zadarmo těmi se budeme zabývat Stažitelný software Např: MODELLER Webové servery Různé metody, často 1 server agreguje více funkcí Např: SWISS-MODEL PSI-PRED I-TASSER

Srovnání služeb CASP - Critical Assessment of Techniques for Protein Structure Prediction http://predictioncenter.org/ Populární automatizovaný benchmark Vývojáři se sami přihlašují do benchamrku Použití GDT_TS a GDT_HA metriky LiveBench http://bioinfo.pl vyhodnocení na nejnovějších vzorcích z PDB hlavně srovnání predikce sekundární struktury Ne vše se na webu tváří aktivně CAFASP (x CAFASP3), EVA

SWISS-MODEL http://swissmodel.expasy.org Podporuje plně automatický mód Homology modelling QMEAN4 lin. Kombinace 4 ukazatelů (0-1) Benkert P, Biasini M, Schwede T. (2011). "Toward the estimation of the absolute quality of individual protein structure models." Bioinformatics, 27(3):343-50. Solution structure of the Zn(II) form of Desulforedoxin QMEAN4 score: 0.857

SWISS-MODEL

PSIPRED http://bioinf.cs.ucl.ac.uk/psipred/ Různé metody Pro terciární struktury GenTHREADER Fold Recognition Javovský applet, který vždy zasekl prohlížeč

I-TASSER http://zhanglab.ccmb.med.umich.edu/i-tasser/ Vysoce hodnocený v CASP pro terciární struktury Založen na Fold Recognition a Ab Initio Asi nejucelenější a nejinformativnější pro méně znalého uživatele Zpracování trvá několik hodin

I-TASSER

HHPRED http://toolkit.tuebingen.mpg.de/hhpred Od Max-Planck Institute for Developmental Biology Homology Založeno na HMM Šablona 3D modelu

ROBETTA http://robetta.bakerlab.org/ Vysoce hodnocený v CASP Meta-server využívá výsledků různých ostatních serverů Momentální beta-verze bohužel při ani jednom z pokusů nevydala výsledek Odmítání více proteinového vstupu Homology a Ab Initio

ROBETTA ale protože výsledky jiných uživatelů lze zobrazit Ukázka výstupu pro lidský Herpes virus 5

MULTICOM http://casp.rnet.missouri.edu/multicom_3d.html Výstup v řádu minut Pouze na mail Formát PDB, lze zobrazit dostupnými nástroji (Swiss-PDB Viewer) Fold-Recognition

Hodnocení vybraných služeb Všechny služby byly zdarma (pro akademické použití), často ale vyžadovaly bezplatnou registraci Doba zpracování od pár sekund po několik hodin Množství rozličných metod, CASP pak dobře pomáhá orientaci Ne všechny výstupy přehledné Asi nejpoužitelnější je I-TASSER, který je i doporučován v CASP

Číselné srovnání některých služeb Převzato z http://predictioncenter.org/casp9/groups_analysis.cgi?type =server&tbm=on&submit=filter Služba GDT_TS MULTICOMM 68.99 I-TASSER 86.737 HHPredA 87.57

Zdroje www.wikipedia.org http://swissmodel.expasy.org/ http://toolkit.tuebingen.mpg.de/ http://robetta.bakerlab.org/ http://predictioncenter.org/ http://bioinfo.pl http://robetta.bakerlab.org/ http://zhanglab.ccmb.med.umich.edu/i-tasser/ http://bioinf.cs.ucl.ac.uk/psipred/ http://casp.rnet.missouri.edu/multicom_3d.html http://www.rcsb.org/pdb/explore/explore.do?structureid=2lk5

Konec a čas na dotazy