IV108 - Bioinformatika II

Podobné dokumenty
"Učení nás bude více bavit aneb moderní výuka oboru lesnictví prostřednictvím ICT ". Základy genetiky, základní pojmy

Doprovodný materiál k práci s přípravným textem Biologické olympiády 2014/2015 pro soutěžící a organizátory kategorie B

Inovace studia molekulární a buněčné biologie

Markovovy modely v Bioinformatice

Výuka genetiky na Přírodovědecké fakultě UK v Praze

Algoritmy komprese dat

analýzy dat v oboru Matematická biologie

1. Základy teorie přenosu informací

Studijní obor: Bioanalytik odborný pracovník v laboratorních metodách

ANOTACE vytvořených/inovovaných materiálů

Aplikovaná bioinformatika

Multimediální systémy

Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague

MENDELOVSKÁ DĚDIČNOST

Teorie informace: řešené příklady 2014 Tomáš Kroupa

Multimediální systémy

Nukleové kyseliny Replikace Transkripce translace

Sada 2 - MS Office, Excel

Digitální učební materiál

Předměty. Algoritmizace a programování Seminář z programování. Verze pro akademický rok 2012/2013. Verze pro akademický rok 2012/2013

Hemoglobin a jemu podobní... Studijní materiál. Jan Komárek

Inovace studia molekulární a buněčné biologie reg. č. CZ.1.07/2.2.00/

Genetika zvířat - MENDELU

"Učení nás bude více bavit aneb moderní výuka oboru lesnictví prostřednictvím ICT ". Molekulární základy genetiky

Bioinformatika a výpočetní biologie KFC/BIN. I. Přehled

Těsně před infarktem. Jak předpovědět infarkt pomocí informatických metod. Jan Kalina, Marie Tomečková

Zpracování informací a vizualizace v chemii (C2150) 1. Úvod, databáze molekul

MATEMATICKÁ BIOLOGIE

You created this PDF from an application that is not licensed to print to novapdf printer (

MODULU BAKALÁŘSKÁ PRÁCE A PRAXE

Karta předmětu prezenční studium

ÚVOD DO MATEMATICKÉ BIOLOGIE I. UKB, pav. A29, RECETOX, dv.č.112 Institut biostatistiky a analýz

Nukleové kyseliny Replikace Transkripce translace

Molekulární základy dědičnosti. Ústřední dogma molekulární biologie Struktura DNA a RNA

Inovace studia molekulární a buněčné biologie

Inovované sylaby předmětů Číslicové měřicí systémy 1 4

GENETIKA dědičností heredita proměnlivostí variabilitu Dědičnost - heredita podobnými znaky genetickou informací Proměnlivost - variabilita

Crossing-over. over. synaptonemální komplex

Úvod do práva sociálního zabezpečení II

Základy genomiky. I. Úvod do bioinformatiky. Jan Hejátko

NÁHODNÁ VELIČINA. 3. cvičení

Vrozené vývojové vady, genetika

Metody studia historie populací. Metody studia historie populací

Předpověď plemenné hodnoty Něco málo z praxe. Zdeňka Veselá

Degenerace genetického kódu

Genetický polymorfismus

Úvod do teorie informace

PB029 Elektronická příprava dokumentů

SYLABUS CESTOVNÍ RUCH A VOLNOČASOVÉ AKTIVITY MODULU DÍLČÍ ČÁST PODNIKÁNÍ VE VOLNOČASOVÝCH AKTIVITÁCH. Lenka Švajdová

Anketa k využívání e learningu na FI pro studenty (jaro 2010)

MANAGEMENT Procesní přístup k řízení organizace. Ing. Jaromír Pitaš, Ph.D.

Využití metod strojového učení v bioinformatice David Hoksza

Struktura a funkce biomakromolekul

Pavel Souček Úplný výkaz pedagogické činnosti

Automatizační technika. Obsah

b) Jak se změní sekvence aminokyselin v polypeptidu, pokud dojde v pozici 23 k záměně bázového páru GC za TA (bodová mutace) a s jakými následky?

GENETIKA 1. Úvod do světa dědičnosti. Historie

6. UČEBNÍ PLÁN N/.. Diagnostika, servis a opravy strojů a zařízení. Absolutorium. Diagnostika silničních vozidel

Základní pojmy obecné genetiky, kvalitativní a kvantitativní znaky, vztahy mezi geny

Molekulární medicína v teorii a praxi

Zadání druhého zápočtového projektu Základy algoritmizace, 2005

Tomáš Karel LS 2012/2013

Základy pracovního práva II

Název předmětu: Školní rok: Forma studia: Studijní obory: Ročník: Semestr: Typ předmětu: Rozsah a zakončení předmětu:

13. cvičení z PSI ledna 2017

Molekulárn. rní. biologie Struktura DNA a RNA

SYLABUS BAKALÁŘSKÁ PRÁCE A PRAXE

MATEMATICKÁ BIOLOGIE

Základy molekulární a buněčné biologie. Přípravný kurz Komb.forma studia oboru Všeobecná sestra

Pojmy z kombinatoriky, pravděpodobnosti, znalosti z kapitoly náhodná veličina, znalost parciálních derivací, dvojného integrálu.

Obecná charakteristika živých soustav

Biologie - Oktáva, 4. ročník (přírodovědná větev)

Lekce 9 Metoda Molekulární dynamiky III. Technologie

Programování a algoritmizace: úvod

GIS Geografické informační systémy

Výuka základů mikroekonomie na ESF MU

Propojení výuky oborů Molekulární a buněčné biologie a Ochrany a tvorby životního prostředí. Reg. č.: CZ.1.07/2.2.00/

Středoškolská technika SCI-Lab

Základní komunikační řetězec

Výuka genetiky na Přírodovědecké fakultě MU

Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague

Vysoká škola finanční a správní, o.p.s. KMK Reklama 1

Přehled pedagogické činnosti - doc. RNDr. Tomáš Obšil, Ph.D.

Princip gradientních optimalizačních metod

Základní informace o modulu

ZÁKLADNÍ INFORMACE O STUDIU na vysoké škole CEVRO Institut

íta ové sít baseband narrowband broadband

Odhady Parametrů Lineární Regrese

Služby Internetu. Ing. Luděk Richter

Cvičení ze statistiky - 5. Filip Děchtěrenko

NÁHODNÝ VEKTOR. 4. cvičení

Biologie - Oktáva, 4. ročník (humanitní větev)

Konstruování KKS/KS. Katedra konstruování strojů. doc. Ing. Václava Lašová, Ph.D. Konstrukční návrh přístroje na přípravu nápojů z čerstvé zeleniny

Inovace studia molekulární a buněčné biologie reg. č. CZ.1.07/2.2.00/

SYLABUS MODUL BUSINESS MODELOVÁNÍ. Doc. RNDr. Vladimír Krajčík, Ph.D.

Studijní obor: Experimentální biologie Studium: Prezenční Specializace: 00 Etapa: první Verze: 2016 Kreditní limit: 162 kr.

15 hodin praktických cvičení

Struktura nukleových kyselin Vlastnosti genetického materiálu

Suffixové stromy. Osnova:

Transkript:

IV108 - Bioinformatika II Ing. Matej Lexa, PhD. http://www.fi.muni.cz/~lexa/ Út Čt 8:00 9:00 13:00 15:00 B204 B116 C506 Přednáška Cvičení Konzultace Navazuje na IV107 (Bioinformatika) Probíhá paralelně s IV105-6 (Seminář Út 17:00 B411) IV110,IV114 (Projekt Čt 8:00 B411) Bloky 1) 2) 3) přednášek: Informační obsah a struktura biologických sekvencí Vyhledávací nástroje Předpovídání a manipulace se strukturami biomolekul Zkouška: Písemná 50 bodů. Nejlépe hodnocené práce ve cvičení můžou přispívat k celkovému bodovému hodnocení u zkoušky do výšky 10 bodů. Studijní materiály budou specifikovány průběžně.

Klasifikace Zkouška Vyřešen problém z cvičení = 1b (max 10b = 20%) Písemná zkouška max. 50b (100%) A 91-120 % B 81-90 % C 71-80 % D 61-70 % E 51-60 % F 0-50 %

Studijní literatura Neil C Jones and Pavel A Pevzner (2004). An introduction to Bioinformatics Algorithms. The MIT Press, 454 s. ISBN 0 2621 0106 8

Doplňková literatura M.S.Waterman (1995). Introduction to Computational Biology. Chapman & Hall/CRC, 448 s. ISBN 0 4129 9391 0 M.J.Zvelebil. And J.O.Baum (2007). Understanding Bioinformatics. Taylor & Francis, 750 s. ISBN: 0 8153 4024 9

Co dělá bioinformatik Umí pracovat s velkými datovými soubory Moudrými triky ovláda výkonné počítače V datech hledá zajímavé subsekvence Srovnává podobné sekvence Předpovídá strukturu a funkci genů a proteinů Studuje vývoj sekvencí a organizmů Data a výsledky analýz zobrazuje graficky

DNA RNA PROTEIN SEKVENCE STRUKTURA FUNKCE

GENOTYP >chs1 atgacagaat acaggatgac tatgacgtga cggcttatat gatgacc... FENOTYP >chs1 MFVDDHLA VNQNFYLR SHRQL... GEN.KÓD STRUKTURA FUNKCE

Biologická sekvence (BS) ACAGTGCGAGCATGACGATGACGCAGCAGATTGACAGAGACGATAGCAGCAT MASAQSFYLLHLAVDDFMNGAGVLSHERELLFYDENKIHDIVISMNDENMNQ Jazyk THISISJUSTASIMPLESENTENCEINENGLISHFORYOURINSPIRATION

Informace http://en.wikipedia.org/wiki/information

Biologická sekvence jako informace, život jako komunikace mezi buňkami, DNA jako komunikační kanál ZDROJ šum Mateřská buňka nebo organizmus DNA PŘÍJEMCE Molekulární aparát potomství

Sekvence jako Markovův řetězec NCMKLFQCDSHL P(Xi+1 Xi) = P(Xi+1 X0,...,Xi) A Q.2 A0 C 0.5 N0.3 C N

Sekvence jako Markovův řetězec NCMKLFQCDSHL NCM,CMK,MKL,KLF,LFQ,FQC,QCD,CDS,DSH,SHL FQA LFQ.2 A0 C 0.5 N0.3 FQC FQN

Frekvence F(x) = P(x) N Je vyšší u řetězců, které jsou součástí často používaných struktur Vzájemná informace MI(x,y) = P(x,y) log ( P(x,y) / (P(x)*P(y)) ) Je vyšší uvnitř struktur než na jejich rozhraní, vyjádřuje korelaci Entropie H(x) = Σ p(x)*log(p(x)) Určuje míru neuspořádanosti, nebo taky potřebu informace pro definování určitého stavu

Co vyjádřuje frekvence v biologických sekvencích [lexa@peleus prot]$ egrep c "SSS" ATH1.fa 15927 [lexa@peleus prot]$ egrep c "WWW" ATH1.fa 75

Co vyjádřuje entropie v biologických sekvencích TATATAA TATAAAA TATATAT TATAAAT TATA.A. TATAWAW 0000101 konsensus RE, W=[TA] entropie H(x) = Σ p(x)*log(p(x))

Jiný pohled na entropii (podmíněná entropie) [lexa@peleus prot]$ egrep c MASAL. ATH1.fa 19 [lexa@peleus prot]$ egrep c MASALL ATH1.fa 0 [lexa@peleus prot]$ egrep c MASALE ATH1.fa 7 H(x) = Σ p(x)*log(p(x))

Co vyjádřuje MI v biologických sekvencích $ egrep c "." ATH1.fa 233194 $ egrep c "C..C" ATH1.fa 8196 $ egrep c "H..H" ATH1.fa 7398 $ egrep c C..C.+H..H\ H..H.+C..C ATH1.fa 1005 $ bc bc 1.06 8196*1000/233194 35 7398*1000/233194 31 0.035*0.031*233194 233.194 MI(x,y) = P(x,y)log(P(x,y)/(P(x)*P(y)))

Co vyjádřuje MI v biologických sekvencích $ egrep c "." ATH1.fa 233194 $ egrep c "C..C" ATH1.fa 8196 $ egrep c "H..H" ATH1.fa 7398 $ egrep c C..C.+H..H\ H..H.+C..C ATH1.fa 1005 $ bc bc 1.06 8196*1000/233194 35 7398*1000/233194 31 0.035*0.031*233194 233.194 MI(x,y) = P(x,y)log(P(x,y)/(P(x)*P(y))) ZINC FINGER

Shannon 1948. A mathematical theory of communication.

Běžná sekvence proteinu má informační obsah několika SMS zpráv. agi Nazdar Agi! Podarilo sa mi zohnat tie listky do kina, stav sa u mna po skole a dohodneme co a ako. Milan.

Běžná sekvence proteinu má informační obsah několika SMS zpráv. bunke Defosforylujemribozus adeninomktorusomdostal odsvojhopartneravlavoak mamfosforylovanyserin