Bioinformatika a výpočetní biologie KFC/BIN. I. Přehled

Podobné dokumenty
Bioinformatika a výpočetní biologie KFC/BIN. I. Přehled

Využití metod strojového učení v bioinformatice David Hoksza

Bioinformatika. Jiří Vondrášek Ústav organické chemie a biochemie Jan Pačes Ústav molekulární genetiky

analýzy dat v oboru Matematická biologie

Aplikovaná bioinformatika

Modelov an ı biologick ych syst em u Radek Pel anek

Hemoglobin a jemu podobní... Studijní materiál. Jan Komárek

Inovace studia molekulární a buněčné biologie

Centrum aplikované genomiky, Ústav dědičných metabolických poruch, 1.LFUK

Osekvenované genomy. Pan troglodydes, Neandrtálec, 2010

Bioinformatika pro PrfUK 2003

Co se o sobě dovídáme z naší genetické informace

OPVK CZ.1.07/2.2.00/

6. Kde v DNA nalézáme rozdíly, zodpovědné za obrovskou diverzitu života?

Nukleové kyseliny Replikace Transkripce translace

O původu života na Zemi Václav Pačes

(molekulární) biologie buňky

Základy molekulární biologie KBC/MBIOZ

PB050: Modelování a predikce v systémové biologii

Genomické databáze. Shlukování proteinových sekvencí. Ivana Rudolfová. školitel: doc. Ing. Jaroslav Zendulka, CSc.

Typy nukleových kyselin. deoxyribonukleová (DNA); ribonukleová (RNA).

Struktura biomakromolekul

AKREDITOVANÉ STUDIJNÍ PROGRAMY

AKREDITOVANÉ STUDIJNÍ PROGRAMY

Využití strojového učení k identifikaci protein-ligand aktivních míst

Biologie buňky. systém schopný udržovat se a rozmnožovat

Standard studijního programu Bioinformatika

Nukleové kyseliny Replikace Transkripce translace

Těsně před infarktem. Jak předpovědět infarkt pomocí informatických metod. Jan Kalina, Marie Tomečková

Bioinformatika. hledání významu biologických dat. Marian Novotný. Friday, April 24, 15

1. Definice a historie oboru molekulární medicína. 3. Základní laboratorní techniky v molekulární medicíně

Struktura a funkce biomakromolekul

MATEMATICKÁ BIOLOGIE

Inovace studia molekulární a buněčné biologie

Jak se matematika poučila v biologii

Základy genomiky. I. Úvod do bioinformatiky. Jan Hejátko

ÚVOD DO MATEMATICKÉ BIOLOGIE I.

Studijní materiály pro bioinformatickou část ViBuChu. úloha II. Jan Komárek, Gabriel Demo

Počítačové vyhledávání genů a funkčních oblastí na DNA

IV117: Úvod do systémové biologie

Struktura biomakromolekul

Výuka genetiky na Přírodovědecké fakultě UK v Praze

Exprese genetické informace

IV117: Úvod do systémové biologie

NUKLEOVÉ KYSELINY. Základ života

Molekulární biotechnologie č.9. Cílená mutageneze a proteinové inženýrství

Molekulární základy dědičnosti. Ústřední dogma molekulární biologie Struktura DNA a RNA

Nukleové kyseliny Replikace Transkripce, RNA processing Translace

Exprese genetického kódu Centrální dogma molekulární biologie DNA RNA proteinu transkripce DNA mrna translace proteosyntéza

Klonování DNA a fyzikální mapování genomu

Exprese genetické informace

Rich Jorgensen a kolegové vložili gen produkující pigment do petunií (použili silný promotor)

PRAKTIKUM Z OBECNÉ GENETIKY

Libor Hájek, , Centrum regionu Haná pro biotechnologický a zemědělský výzkum, Přírodovědecká fakulta, Šlechtitelů 27, Olomouc

Globální pohled na průběh replikace dsdna

NGS analýza dat. kroužek, Alena Musilová

Inovace studia molekulární a buněčné biologie

Uspořádání genomu v jádře buňky a jeho možná funkce. Stanislav Kozubek Biofyzikální ústav AV ČR, v.v.i.

Inovace studia molekulární a buněčné biologie

Genetické mapování. v přírodních populacích i v laboratoři

CEITEC a jeho IT požadavky. RNDr. Radka Svobodová Vařeková, Ph.D.

44 somatických chromozomů pohlavní hormony (X,Y) 46 chromozomů

Na rozdíl od genomiky se funkční genomika zaměřuje na dynamické procesy, jako je transkripce, translace, interakce protein - protein.

IV117: Úvod do systémové biologie

ANOTACE vytvořených/inovovaných materiálů

Schéma průběhu transkripce

Inovace studia molekulární a buněčné biologie reg. č. CZ.1.07/2.2.00/

Nukleosidy, nukleotidy, nukleové kyseliny, genetická informace

Vzdělávací materiál. vytvořený v projektu OP VK CZ.1.07/1.5.00/ Anotace. Biosyntéza nukleových kyselin. VY_32_INOVACE_Ch0219.

Doprovodný materiál k práci s přípravným textem Biologické olympiády 2014/2015 pro soutěžící a organizátory kategorie B

Od sekvencí k chromozómům: výzkum repetitivní DNA rostlin v Laboratoři molekulární cytogenetiky BC AVČR

Propojení výuky oborů Molekulární a buněčné biologie a Ochrany a tvorby životního prostředí. Reg. č.: CZ.1.07/2.2.00/

IV117: Úvod do systémové biologie

Biologie - Oktáva, 4. ročník (humanitní větev)

Zkušební okruhy k přijímací zkoušce do magisterského studijního oboru:

TUBULIN-FOLDING COFACTOR A (TFC A) u Arabidopsis

"Učení nás bude více bavit aneb moderní výuka oboru lesnictví prostřednictvím ICT ". Základy genetiky, základní pojmy

Biologie - Oktáva, 4. ročník (přírodovědná větev)

Přírodní polymery proteiny

Inovace studia molekulární a buněčné biologie reg. č. CZ.1.07/2.2.00/

Nukleové kyseliny Replikace Transkripce, RNA processing Translace

Centrální dogma molekulární biologie


Základní pojmy obecné genetiky, kvalitativní a kvantitativní znaky, vztahy mezi geny

AUG STOP AAAA S S. eukaryontní gen v genomové DNA. promotor exon 1 exon 2 exon 3 exon 4. kódující oblast. introny

Inovace studia molekulární a buněčné biologie

BAKTERIÁLNÍ GENETIKA. Lekce 12 kurzu GENETIKA Doc. RNDr. Jindřich Bříza, CSc.

Molekulárn. rní. biologie Struktura DNA a RNA

P ro te i n o vé d a ta b á ze

Základy molekulární a buněčné biologie. Přípravný kurz Komb.forma studia oboru Všeobecná sestra

Možnosti využití technologie DNA microarrays v predikci odpovědi na neoadjuvantní terapii u pacientů s karcinomem jícnu

Struktura a funkce biomakromolekul KBC/BPOL

Výuka genetiky na PřF OU K. MALACHOVÁ

Student si po a 1. ročníku podle svého osobního zaměření volí kurzy (předměty).

Služby pro predikci struktury proteinů. Josef Pihera

Výskyt MHC molekul. RNDr. Ivana Fellnerová, Ph.D. ajor istocompatibility omplex. Funkce MHC glykoproteinů

ÚVOD DO MATEMATICKÉ BIOLOGIE I. UKB, pav. A29, RECETOX, dv.č.112 Institut biostatistiky a analýz

REKOMBINACE Přestavby DNA

Buněčný cyklus. Replikace DNA a dělení buňky

Sylabus témat ke zkoušce z lékařské biologie a genetiky. Struktura, reprodukce a rekombinace virů (DNA viry, RNA viry), význam v medicíně

Transkript:

Bioinformatika a výpočetní biologie KFC/BIN I. Přehled RNDr. Karel Berka, Ph.D. Univerzita Palackého v Olomouci

KFC/BIN - Podmínky Seminární práce: http://rosalind.info/ - alespoň 10 vyřešených problémů = zápočet - každých dalších 10 = + jedno A ke zkoušce Ústní zkouška: 3 otázky hodnoceny každá A-F Výsled medián známek

Definice bioinformatiky (Molecular) bio informatics: bioinformatics is conceptualising biology in terms of molecules (in the sense of physical chemistry) and applying "informatics techniques" (derived from disciplines such as applied maths, computer science and statistics) to understand and organise the data and information associated with these molecules, on a large scale. In short, bioinformatics is a management information system for molecular biology and has many practical applications. Oxford English Dictionary

Definice bioinformatiky spojení biologických věd s informatikou počítačové zpracování, organizace, ukládání a vizualizalizace biologických dat a jejich aplikace iteulike oblak klíčových slov pro bioinformatics

Přehled témat bioinformatiky hledání genů a skládání genomů porovnávání sekvencí (alignment) analýza a predikce struktury proteinů a NA hledání léčiv (drug design a discovery) predikce a analýza interakcí mezi proteiny predikce genové exprese modelování molekulární evoluce Wikipedia

Organizace biologických informací biologické informace redundantní a mnohonásobné Genetický kód je redundantní Organismus má mnoho podobných genů Gen může mít více funkcí Rozdílné proteinové sekvence mají stejnou strukturu

Guy Cochrane Nárůst dat

Biologická data I Zdroj dat Velikost dat Bioinformatika DNA sekvence Proteinová sekvence Genomy 349 132 140 sekvencí 881 404 804 386 nukleotidů (Genbank+WGS, 06/2014) cca 1 TB dat 80 370 243 sekvencí 25 385 271 479 aminokyselin (SwissProt+TrEMBL, 07/2014) cca 25 GB dat 11 617 genomů (Ensembl, 04/2014) cca 1 PB (1000 Genomes, 04/2013 z 2535 jedinců) Ontologie 52623645052881400 (GeneOntology, 07/2014) Makromolekulární 102 158 3D struktur (~1500 koordinát) struktura cca 150 GB Hledání genů Predikce produktu genů Hledání mutací a jejich vlivu Srovnávání sekvencí a fylogenetika Predikce struktury proteinů Predikce funkce proteinů Srovnávání sekvencí a fylogenetika Hledání sekvenčních motivů Identifikace genetických chorob Molekulární evoluce a fylogenetika Hledání částí genomu (geny, exony, introny, cizí DNA, repetice,...) Genomic-scale census (porovnávání obsahu proteinů, metabolických drah, ) Hierarchický popis funkce, lokace,... Hledání souvislostí 3D strukturní porovnávání Geometrie molekuly a její interakce Molekulární simulace funkce in silico návrh léčiv

Biologická data II Zdroj dat Velikost dat Bioinformatika Proteomika, Genomika 1 genom člověka cca 700 GB proteom cca 1 TB/den Hledání variací a mutací mezi jedinci a mezi rozdílnými buňkami Exprese (genů, proteinů, ) Robotické HTS testy DNA čipy (obrazové info: 1 TB/den) např. 1000 testů najednou (obrazové info: TB/den) řádově PB Mapování expresních dat (produkce) na sekvenční a biochemické data Testování látek automatizovanými testy Hledání léčiv Biologická literatura Chemické látky 24 milionů citací (~5 MB PDF soubor) (PubMed, 07/2014) 100 TB 35 milionů molekul (ZINCdb, 08/2014) 15 GB Hledání informací a souvislostí Tvorba znalostních databází Data mining Cheminformatika Racionální návrh léčiv Organická syntéza

Počítačové zpracování Databáze ukládání, hledání Analýza textu sekvenční analýzy, porovnávání sekvencí, hledání klíčových slov Hledání motivů Neuronové sítě, clusterová analýza, data mining, Markovovské řetězce Geometrie 3D grafika, robotika, 2D/3D rozpoznávání obrazu Fyzikální simulace Mechanika, elektrostatika, numerické algoritmy, simulace

Genom Hledání genů introny, exony, promotory, cizí kusy DNA Charakteristika opakujících se kusů DNA forenzní analýza Hledání duplicit v genomu

Velikosti genomů Mycoplasma genitalium Escherichia coli Saccharomyces cerevisiae 16 chr. 0.58 Mbp 4.6 Mbp 11.2 Mbp Caenorhabtitis elegans 6 chr. 97.0 Mbp Arabidopsis thaliana 5 chr. 115.4 Mbp Drosophila melanogaster 5 chr. ~137.0 Mbp Homo sapiens 24 chr. ~ 3.3 Gbp

Analýza sekvencí Porovnávání sekvencí 1:1 1:n lokální nebo globální porovnání hledání konsensní sekvence pro třídu proteinů mapování evoluce Hledání vlastností sekundární struktura hydrofobicita transmembránové segmenty

Predikce proteinové struktury Terciární struktura rozpoznání foldu homologní modelování strukturní alignment ab initio modelování Predikce funkce hledání aktivních míst a kanálů

Strukturní výpočetní biologie Molekulární grafika vodítko pro hypotézy Simulace Struktura => Energie vývoj v čase Docking hledání jak a kam se látky váží ligandy proteiny mezi sebou Helikáza rozevírající DNA docking do acetyltransferázy v programu GOLD

Analýza obrazu s vysokou propustností Analýza genové exprese Analýza proteinové exprese Funkční a toxikologické analýzy

Modelování biologických systémů matematická biologie e-cell

Sledování molekulární evoluce Fylogenetické stromy hledání společného předka podle podobnosti - změna probíhá v liniích časem - dělení po dvojicích

Ideální případ

Souhrn

Modelování buňky Na http://fch.upol.cz/skripta/bin/cell-wholesimulation.pdf samotný článek http://fch.upol.cz/skripta/bin/wholecellsim.mp4 - video

Modelový organismus M. genitalium Záněty močových cest

Simulace celé jedné buňky M. genitalium 525 genů

Buněčné funkční modely Krok: 1 s Moduly s mnoha proměnnými a modely pro jednotlivé procesy Pokračuje, dokud se buňka nerozdělí Poisson processes Flux-balance analysis

Konec simulace Když se buňka rozdělí na dvě

Přehled

Validace modelu Simulace 128 buněk v typickém prostředí Predikce: Vlastnosti buňky Biomasa Rychlost růstu buněk Molekulární vlastnosti Počty složek a jejich koncentrace Lokalizace Aktivita genů

Trénink modelu Observed doubling time Observed doubling time Cellular chemical composition Major cell mass fractions

Validace 1. Metabolic fluxes

Validace 2. Metabolite concentrations

Validace 3. Bursts of protein synthesis Caused by - intermittent mrna expression - availability of amino acids following protein degradation

Validace 4. Copy number distribution

Interakce proteinu s DNA Model has 30 DNA-binding proteins Chromosome explored v. quickly 50% of chromosome by 1 or more proteins within the first 6 mins 90% within 20 mins RNA polymerase binds 90% of chromosome within 49 mins 90% of genes are expressed within the first 143 minutes

DNA replikace

Tvorba proteinů Over 30,000 collisions occur per cell cycle Nearly 1 protein is displaced from chromosome per second Most collisions are caused by RNA polymerase (84%) and DNA polymerase (8%) Most commonly displaced proteins are: structural maintenance of chromosome (SMC) proteins (70%) and single-stranded binding proteins (6%)

Rychlost DNA replikace Initial rapid DNA replication Acts as a control on cell cycle duration Rate limited by available dntp (deoxyribonucleotide triphosphate)

Syntéza energetických molekul Mainly used in production of protein and mrna

Ztráty energie 44% discrepancy between synthesis and use of ATP and GTP

Knock-out simulace vypínání každého z 525 genů 284 genů esenciálních pro růst a dělení 117 genů neesenciálních Tj. bez nich buňka neprodukuje nějakou základní složku, nebo se zabrání dělení buňky

Knock-out studie Vypínání různých genů

Použití modelu Model odpovídá experimentálním datům K predikcím, co se stane když Zkoumáním rozdílů mezi modelem a experimentem můžeme odhalit, čemu ještě nerozumíme v biologii buňky Nicméně M genitalium je nejmenší buňka. A i tak je model velmi složitý, dalším krokem je pochopení E coli a to ještě chvíli potrvá

Jak si to zkusit taky? Občanská věda Poskytnutí zdrojů: Folding@Home http://folding.stanford.edu Rosetta@Home http://boinc.bakerlab.org A dokonce i hry: Foldit http://fold.it skládání proteinů EteRNA http://eterna.cmu.edu skládání RNA Phylo http://phylo.cs.mcgill.ca - porovnávání sekvencí