DATABÁZE A VYHLEDÁVÁNÍ SEKVENCÍ

Rozměr: px
Začít zobrazení ze stránky:

Download "DATABÁZE A VYHLEDÁVÁNÍ SEKVENCÍ"

Transkript

1 DATABÁZE A VYHLEDÁVÁNÍ SEKVENCÍ MOLEKULÁRNÍ TAXONOMIE 2015 MARIAN NOVOTNÝ

2 OSNOVA co je substrát pro molekulární taxonomii? kde se shromažďují data? jak data vyhledávat?

3 REKONSTRUKCE EVOLUČNÍ HISTORIE rekonstrukce na základě srovnávání znaků v molekulární taxonomii se používají sekvence sekvence (DNA, RNA, proteiny) se srovnávají tzv. alignmentem

4 KDE NAJÍT SEKVENCE?

5 BIOINFORMATICKÉ DATABÁZE úložiště dat (volně) dostupné pro kohokoliv snadno k nalezení lednové číslo Nucleid Acid Research (NAR)

6 LEDNOVÉ ČÍSLO NAR NUCLEOTIDE SEQUENCE DATABASES RNA SEQUENCE DATABASES PROTEIN SEQUENCE DATABASES STRUCTURE DATABASES GENOMICS DATABASES (NON-VERTEBRATE) METABOLIC AND SIGNALING PATHWAYS HUMAN AND OTHER VERTEBRATE GENOMES HUMAN GENES AND DISEASES MICROARRAY DATA AND OTHER GENE EXPRESSION DATABASES PROTEOMICS RESOURCES OTHER MOLECULAR BIOLOGY DATABASES ORGANELLE DATABASES PLANT DATABASES IMMUNOLOGICAL DATABASES

7 VLASTNOSTI DATABÁZE četnost aktualizace dat četnost aktualizace software redundance anotace dat anotace databáze

8

9

10

11 ...A NÁSTROJE

12 DNA DATABÁZE GenBank(NCBI) EMBL (EBI) DDJB (Japonsko)

13 MÁLO ANOTOVANÁ SEKVENCE

14 ANOTOVANÁ SEKVENCE

15

16 GENOMICKÁ DATA První RNA genom bacteriofág MS bazí První DNA genom fág Φ-X bazí První bakteriální genom... Heamophilus influenze ,83 Mb Největší genom... Amoeba dubia Gb Organism Complete Draft assembly In progress total Prokaryotes 946 (658) Archaea 84 (61) (97) Bacteria 862 (598) (1606) Eukaryotes 40 (22) Viruses HUMAN GENOMES SEQUENCED IN 2014

17 GENOMOVÉ DATABÁZE

18

19

20

21

22 PROTEINOVÉ DATABÁZE Uniprot - Swissprot + TrEMBL - 52,7 mil. sek. Swiss-prot - anotováno, ~ sekvencí GenPept - překládaný GenBank

23 UNIPROT + TREMBL AMINO ACID COMPOSITION 2.1 COMPOSITION IN PERCENT FOR THE COMPLETE DATABASE ALA (A) 8.57 GLN (Q) 3.88 LEU (L) 9.81 SER (S) 6.72 ARG (R) 5.47 GLU (E) 6.14 LYS (K) 5.30 THR (T) 5.61 ASN (N) 4.17 GLY (G) 7.08 MET (M) 2.45 TRP (W) 1.31 ASP (D) 5.28 HIS (H) 2.20 PHE (F) 4.03 TYR (Y) 3.06 CYS (C) 1.29 ILE (I) 6.00 PRO (P) 4.74 VAL (V) 6.71 ASX (B) GLX (Z) XAA (X) 0.06

24

25 JAK DATA VYHLEDÁVAT?

26 >ASTAKINE MKMRGVSVGVLVVAMMSGLAMAGSCNSQEPDCGPSECCLQGWMR YSTRGCAPLGEAGSSCNVFTQAPVKGFYIGMCPCRAGLVCTRPSATCQLPSQDNTLDSYY EXISTUJÍ PŘÍBUZNÉ SEKVENCE A KDE JE NAJÍT?

27 HLEDÁNÍ V DATABÁZÍCH - ALGORITMY tradiční algoritmy (Needleman-Wunsch, Smith-Waterman) pomalé pro prohledávání velkých databází používány heuristické metody - rychle vede k výsledku, který se blíží optimálnímu řešení (ale nezaručuje jej) -> pro vyšší rychlost je obětována přesnost (rule of thumb) v případě sekvenčního srovnávání se metoda vzdává jistoty nalezení optimálního alignmentu, aby v krátkém čase provedla srovnání se všemi sekvencemi v databázi (50-100x rychlejší) klasickými heuristickými metodami jsou FASTA a BLAST obě metody použitelné pro DNA i proteinové sekvence

28 FASTA metoda popsaná v 80. letech 20. století (Lipman & Pearson) rychlá, heuristická metoda (na úkor senzitivity), globální alignment zjednodušení v první fázi, sekvence rozděleny na krátké úseky program generuje všechny možné k-tuples o délce k z dané sekvence k = 1-2 pro proteiny, k = 4-6 pro DNA k-tuples jsou porovnávány s k-tuples sekvencí v databázích

29 FASTA hledání SHOD v k-tuples skórováni shod pomocí skórovací tabulky (Blosum 50) a rozšíření alignmentu (bez mezer) vysoce skórující shody vybrány vybere úseky, které budou součástí alignmentu dynamické programování pro konečný alignment (mezery)

30 BLAST BLAST = Basic Local Alignment Search Tool Altschul et al., 1990 sekvence rozděleny na slova (words) a slova skórována vůči databázi všech slov slova skórována skórovací tabulkou (Blosum 62) a jen ty, které dosáhnou předem nadefinovaného minimálního skóre (treshold) jsou dále používány slova se skóre větším než treshold nemusí nutně obsahovat jen shody ( na rozdíl od Fasty) v prvním kroku se porovnávají slova bez mezer

31 w=3 SEWRFKHIYRGQPRRHLLTTGWSTFVT SEW EWR WRF Parameter: Word length (w) Increase = faster, but less sensitive

32 BLAST - HSP HSP - high scoring pair vyber jen taková slova, která dosahují alespoň skóre X (treshold) PEG versus PQA PEQ má s Blosum 62 skóre 15, PQA jen 12 pokud si stanovíme treshold 13, tak budeme dále hledat jen slovo PEQ

33 Then it scans database sequences for exact matches with these words

34 BLAST II takto vybráná slova jsou hledána v databázi modifikovaným Smith- Watermanem (50 x rychlejší) HSP jsou dále rozšiřovány na obě strany dokud skóre roste v posledním kroku jsou nejlépe skórující páry (HSP`s) podrobeny dynamickému programování, které produkuje výsledné skóre a alignment vzhledem k rostoucí velikosti databází je třeba algoritmus neustále modifikovat (dvě shody v okně definované velikosti) obvykle citlivější než FASTA implementován jako server na řadě míst (NCBI, EBI)

35 If two hits are found on the same diagonal the alignment is extended until the score drops by a certain amount This results in a High-scoring Segment Pair (HSP) Parameters: Drop off Substitution matrix

36 BLAST step 4 If the total HSP score is above another threshold then a gapped extension is initiated Parameters: Extension threshold (Sg) Substitution matrix Sequence searching - Andrew Cowley

37 VERZE BLASTU blastn - hledá s DNA sekvencí (query) v DNA databázi blastp - hledá s proteinovou sekvencí v proteinové databázi blastx - hledá s DNA sekvencí (6 rámců) v proteinové databázi tblastn - hledá s proteinovou sekvencí v DNA databázi tblastx - překládaná DNA v překládané DNA databázi megablast - víc query najednou

38

39

40 Query: 241 FTTVQILHRGKKVGTERIWYGDKENIDLGTEQEFWMVLPKAEIPHIKAKYTLDGKELTAP 300 F TV + T+R+W+GDK ++LG + + +P KA YTL +LTAP C. On-line Summaries Smallest Sum High Probability Sequences producing High-scoring Segment Pairs: Score P(N) N... sp P08506 DACC_ECOLI PENICILLIN-BINDING PROTEIN 6 PRECURS e sp P38422 DACF_BACSU PENICILLIN-BINDING DACF PROTEIN PREC e sp P28271 IREB_MOUSE IRON-RESPONSIVE ELEMENT BINDING PROT sp P31571 CAIA_ECOLI PROBABLE CARNITINE OPERON OXIDOREDUC D. Alignments... >sp P08506 DACC_ECOLI PENICILLIN-BINDING PROTEIN 6 PRECURSOR (D-ALANYL-D-ALANINE CARBOXYPEPTIDASE FRACTION C) (EC ) (DD-PEPTIDASE) (DD-CARBOXYPEPTIDASE) (PBP-6). Length = 400 Score = 894 (409.5 bits), Expect = 5.0e-120, P = 5.0e-120 Identities = 169/342 (49%), Positives = 237/3 42 (69%) Query: 1 MDYTTGQILTAGNEHQQRNPASLTKLMTGYVVDRAIDSHRITPDDIVTVGRDAWAKDNPV 60 MDY +G++L GN ++ +PASLTK+MT YVV +A+ + +I D+VTVG+DAWA NP Sbjct: 45 MDYASGKVLAEGNADEKLDPASLTKIMTSYVVGQALKADKIKLTDMVTVGKDAWATGNPA 104 Query: 61 FVGSSLMFLKEGDRVSVRDLSRGLIVDSGNDACVALADYIAGGQRQFVEMMNNYAEKLHL 120 GSS+MFLK GD+VSV DL++G+I+ SGNDAC+ALADY+AG Q F+ +MN YA+KL L Sbjct: 105 LRGSSVMFLKPGDQVSVADLNKGVIIQSGNDACIALADYVAGSQESFIGLMNGYAKKLGL 164 Query: 121 KDTHFETVHGLDAPGQHSSAYDLAVLSRAIIHGEPEFYHMYSEKSLTWNGITQQNRNGLL 180 +T F+TVHGLDAPGQ S+A D+A+L +A+IH PE Y ++ EK T+N I Q NRN LL Sbjct: 165 TNTTFQTVHGLDAPGQFSTARDMALLGKALIHDVPEEYAIHKEKEFTFNKIRQPNRNRLL 224 Query: 181 WDKTMNVDGLKTGHTSGAGFNLIASAVDGQRRLIAVVMGADSAKGREEEARKLLRWGQQN 240 W +N DG+KTG T+GAG+NL+ASA G RLI+VV+GA + + R E+ KLL WG + Sbjct: 225 WSSNLNEDGMKTGTTAGAGYNLVASATQGDMRLISVVLGAKTDRIRFNESEKLLTWGFRF 284

41 BLAST - VÝBĚR databáze - DNA x protein, anotovaná x kompletní, strukturní, genomové, specializované (protilátky)... organismus datum - sekvence za poslední dva týdny skórovací tabulka - blosum 62 velikost slova low-complexity region filter - často P, D, N, E - false positive default nastavení algoritmu vhodné ve většině případů

42 BLOSUM BLOSUM 80 - tabulka vypočítaná na základě alignmentu bloku sekvencí s identitou 80 % BLOSUM 62 - tabulka vypočítaná na základě alignmentu bloku sekvencí s identitou 62 %

43 BLOSUM VERSUS PAM PAM 10 BLOSUM 90 PAM 250 BLOSUM 62 VELMI PŘÍBUZNÍ VZDÁLENĚ PŘÍBUZNÍ

44 VÝZNAMNOST NÁLEZU optimální alignment lze nalézt pro jakékoliv dvě sekvence dvě náhodné DNA sekvence = ~ 25% SI dvě náhodné proteinové sekvence = ~ 5% SI jak určit, že je alignment statisticky významný?

45 PARAMETRY VÝZNAMNOSTI P-value E-value pouze statistická významnost skóre -> biologickou relevanci záhodno ověřovat experimentálně

46 P-VALUE P-value - pravděpodobnost, že sekvence budou srovnány s nalezeným nebo vyšším skóre a zároveň nebudou příbuzné (false positive hit) P-value - pravděpodobnost, že bude skóre x nebo vyššího dosaženo náhodou pro účely výpočtu lze náhodu simulovat přeskládáváním sekvencí nebo výběrem vzorku z databáze druhá možnost lépe odpovídá realitě a poskytuje lepší výsledky (především u DNA)

47 EVD rozložení skóre lokálních alignmentů nepříbuzných sekvencí neodpovídá normálnímu rozdělení, ale rozdělení podle extrémních hodnot (EVD) při normálním rozdělení by docházelo k přeceňování významu dosažených skóre DUNDAS ET AL. BMC BIOINFORMATICS 2007

48 P-VALUE P-value (S>x) = 1-exp (-exp (-λ(x-u))), u = charakteristická hodnota = Kmn/λ m,n = délky sekvencí; K = konstanta; λ = decay factor K a λ mohou být kalkulovány z vlastností skórovací tabulky

49 E-VALUE E-value = pravděpodobnost, že bude dosaženo skóre x nebo vyššího náhodou v databázi dané velikosti E-value = P-value x N ; velikost databáze příklad: databáze o miliónu sekvencí a P-value = 10-6 E-value = 10-6 x 10 6 =1 cutoff (expect treshold) parametr v BLASTU - udává kolik lze průměrně očekávat false positives v databázi dané velikosti -> způsob jak vyvažovat senzitivitu a selektivitu nižší hodnota cutoff zvyšuje selektivitu, ale snižuje senzitivitu

50 BLAST / EVOLUČNÍ VZDÁLENOST říká nám BLAST něco o příbuznosti nalezených sekvencí? Je první hit evolučně nejpříbuznější query (hledané sekvenci)? BLAST většinou nalezá příbuzné sekvence nejpříbuznější sekvence však mohou chybět v databázi lokální alignment - často skóruje nejlépe vzdálené příbuzné 7 % sekvencí E.coli mělo nejlépe skórující sekvenci mimo Bacteria

51

52

53 2JTK

54 SEQUENCE IDENTITA/HOMOLOGIE NEHOMOLOGNÍ PROTEINY ROST, 1999

55 SEQUENCE IDENTITA/HOMOLOGIE HOMOLOGNÍ PROTEINY ROST, 1999

56 SEQUENCE IDENTITA/HOMOLOGIE sekvenční identita > 35% - pravděpodobně homolog sekvenční identita = 20-35% ( twilight zone ; Doolittle) - může být homolog sekvenční identita < 20% - midnight zone (Rost) - sekvence zcela nedostatečná k určení homologie

57 SANDER ET AL., PREPRINT Average sequence identity of random alignments % Average sequence identity of remote homologues %

58 SSEARCH pokud máte moře času nebo počítačový klastr nebo jste zoufalí rigorózní Smith-Waterman - local alignment v databázi

59 When to use what? Query length WU-BLAST NCBI BLAST FASTA PSI-SEARCH Database size

60 When to use what? t ime to search WU-BLAST NCBI BLAST FASTA PSI-SEARCH PDB Swiss-Prot UniRef50 UniRef 90 UniRef100 UniProtKB UniParc Sequence searching - Andrew Cowley

61

62 DALŠÍ METODY HLEDÁNÍ V DATABÁZÍCH profilové metody HMM modely

63 PROFILY modifikují skórovací tabulky specificky pro skupiny proteinů a pozici v alignmentu (např. globiny) pro každou pozici v alignmentu jsou generovány specifická skóre jak pro záměnu za jakoukoliv aa, tak pro inzerci nebo deleci Prof (pos,aa) = Σtype N(pos,type) x S(type, aa) x 10 N(pos,type) = podíl výskytu aa x na pozici y S(type, aa) = skóre skórovací tabulky pro zaměňovaný pár

64 PŘÍKLAD PROFILU v alignmentu globinů se na pozici 3 vyskytuje 3x Ala, 6x Val, 1x Ile, používáme tabulku Blosum 62 jaké bude profilové skóre pro výskyt Ile a His? N(x,A) = 0.3, N(x,V) = 0.6, N(x, I) = 0.1 S(A,I) = -1, S(V,I) = 3, S(I,I) = 4 S(A,H) = -2, S(V,H) = -3, S(I,H) = -3 Prof (x, I) = 0.3 x x x 4 = 2.1 x 10 (v profilu) = 21 ( -1, 3, 4) Prof (x, H) = 0.3 x x x -3 = -2.7 x 10 = -27 (-2, -3, -3)

65 PSI-BLAST PSI-BLAST = Position Specific Iterative Blast Altschul et al., 1997 profilová metoda, používá Position Specific Scoring Matrix (PSSM) v prvním kole klasický BLAST, z vysoko skórujících alignmentů je generována PSSM v dalším kole hledání je už použita nová matrice a následně znovu generována nová PSSM opakováno libovolně dlouho (až ke konvergenci) benchmark metoda

66 Context-Specific Iterative Blast CS/CSI BLAST Biegert, Soeding, 2009 context vytváří 12 aa v okolí sledované aa (6 na každé straně) 2x více vzdálených homologů než klasický blast při zachování rychlosti a chybovosti CSI - podobná aplikace na PSI-blast po dvou iteracích csi blast stejné výsledky jako po pěti iteracích psi-blast benchmark metoda???

67 HMM HMM = Hidden Markov Model profilová metoda, používána při rozhodování, zda protein spadá do jisté skupiny proteinů, typicky pro sekvence s nízkou %SI velmi citlivá metoda, která vytváří statistický model pro definovanou skupinu sekvencí na základě tréninku na sekvencích patřících do jedné skupiny (globiny) generuje pravděpodobnost nejen pro jednotlivé záměny a inzerce a delece, ale i pro přechody mezi nima dovede do modelu zahrnout i aminokyseliny, které se v tréninkové skupině nevyskytují alignment s největší pravděpodobností je optimální posuzuje jak dobře daná sekvence odpovídá modelu

68 HMM

69 SHRNUTÍ databáze by měly být pravidelně updatovány přehled dostupných biologických databází vždy v lednovém čísle NAR řada velmi specializovaných databází hledání v databázích povětšinou heuristickými metodami standard dnes BLAST nutno hodnotit statistickou významnost nálezu citlivější metodou PSI-Blast nebo HMM metody

Thursday, February 27, 14

Thursday, February 27, 14 DATABÁZE A VYHLEDÁVÁNÍ SEKVENCÍ MOLEKULÁRNÍ TAXONOMIE 2014 MARIAN NOVOTNÝ PŘEDNÁŠEJÍCÍ Mgr. Marian NOVOTNÝ, PhD. vystudoval odbornou biologii na PřF UK, diplomka v laboratoři doc. Folka doktorát na Uppsalské

Více

DATABÁZE A VYHLEDÁVÁNÍ SEKVENCÍ

DATABÁZE A VYHLEDÁVÁNÍ SEKVENCÍ DATABÁZE A VYHLEDÁVÁNÍ SEKVENCÍ MOLEKULÁRNÍ TAXONOMIE 2015 MARIAN NOVOTNÝ OSNOVA co je substrát pro molekulární taxonomii? kde se shromažďují data? jak data vyhledávat? REKONSTRUKCE EVOLUČNÍ HISTORIE rekonstrukce

Více

Základy genomiky. I. Úvod do bioinformatiky. Jan Hejátko

Základy genomiky. I. Úvod do bioinformatiky. Jan Hejátko Základy genomiky I. Úvod do bioinformatiky Jan Hejátko Masarykova univerzita, Oddělení funkční genomiky a proteomiky Laboratoř molekulární fyziologie rostlin Základy genomiky I. Zdrojová literatura ke

Více

Vyhledávání podobných sekvencí BLAST

Vyhledávání podobných sekvencí BLAST Vyhledávání podobných sekvencí BLAST Základní informace Následující text je součástí učebních textů předmětu Analýza sekvencí DNA a je určen hlavně pro studenty Matematické biologie. Může být ovšem přínosný

Více

Studijní materiály pro bioinformatickou část ViBuChu. úloha II. Jan Komárek, Gabriel Demo

Studijní materiály pro bioinformatickou část ViBuChu. úloha II. Jan Komárek, Gabriel Demo Studijní materiály pro bioinformatickou část ViBuChu úloha II Jan Komárek, Gabriel Demo Adenin Struktura DNA Thymin 5 konec 3 konec DNA tvořena dvěmi řetězci orientovanými antiparalelně (liší se orientací

Více

Využití internetových zdrojů při studiu mikroorganismů

Využití internetových zdrojů při studiu mikroorganismů Využití internetových zdrojů při studiu mikroorganismů doc. RNDr. Milan Bartoš, Ph.D. bartosm@vfu.cz Přírodovědecká fakulta MU, 2012 Obsah přednášky 1) Práce se sekvenčními daty 2) Základní veřejně dostupné

Více

Genomické databáze. Shlukování proteinových sekvencí. Ivana Rudolfová. školitel: doc. Ing. Jaroslav Zendulka, CSc.

Genomické databáze. Shlukování proteinových sekvencí. Ivana Rudolfová. školitel: doc. Ing. Jaroslav Zendulka, CSc. Genomické databáze Shlukování proteinových sekvencí Ivana Rudolfová školitel: doc. Ing. Jaroslav Zendulka, CSc. Obsah Proteiny Zdroje dat Predikce struktury proteinů Cíle disertační práce Vstupní data

Více

Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti URČOVÁNÍ PRIMÁRNÍ STRUKTURY BÍLKOVIN

Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti URČOVÁNÍ PRIMÁRNÍ STRUKTURY BÍLKOVIN Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti URČOVÁNÍ PRIMÁRNÍ STRUKTURY BÍLKOVIN Primární struktura primární struktura bílkoviny je dána pořadím AK jejích polypeptidových řetězců

Více

Inovace studia molekulární a buněčné biologie

Inovace studia molekulární a buněčné biologie Inovace studia molekulární a buněčné biologie Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. MBIO1/Molekulární biologie 1 Tento projekt je spolufinancován

Více

Bioinformatika a funkční studie

Bioinformatika a funkční studie Bioinformatika a funkční studie Bioinformatika Vztah informace a funkce Sekvenování DNA Proteinů Databáze Primární Sekundární Integrované internetové zdroje informací Vyhledávání sekvenční podobnosti,

Více

SEQUENCE ALIGNMENT MOLEKULÁRNÍ TAXONOMIE

SEQUENCE ALIGNMENT MOLEKULÁRNÍ TAXONOMIE SEQUENCE ALIGNMENT gi 118094778 gi 68395523 Eat1 SpEat1 CG7206 DrEat1 C1orf26 46 LQELDNLKKGKML-----------------LHV-RQKAI 46 LQELDYLKSGKLS-----------------SKV-EDKAR 47 IQELDGLKKSPDIARDNDDTTN----QEHDRTI-GTLAR

Více

Cysteinové adukty globinu jako potenciální biomarkery expozice styrenu

Cysteinové adukty globinu jako potenciální biomarkery expozice styrenu Cysteinové adukty globinu jako potenciální biomarkery expozice styrenu J. Mráz, I. Hanzlíková, Š. Dušková, E. Frantík, V. Stránský Státní zdravotní ústav Praha 1 Biomarkery expozice cizorodým látkám výchozí

Více

Proteiny Genová exprese. 2013 Doc. MVDr. Eva Bártová, Ph.D.

Proteiny Genová exprese. 2013 Doc. MVDr. Eva Bártová, Ph.D. Proteiny Genová exprese 2013 Doc. MVDr. Eva Bártová, Ph.D. Bílkoviny (proteiny), 15% 1g = 17 kj Monomer = aminokyseliny aminová skupina karboxylová skupina α -uhlík postranní řetězec Znát obecný vzorec

Více

Osekvenované genomy. Pan troglodydes, 2005. Neandrtálec, 2010

Osekvenované genomy. Pan troglodydes, 2005. Neandrtálec, 2010 GENOMOVÉ PROJEKTY Osekvenované genomy Haemophilus influenze, 1995 první osekvenovaná bakterie Saccharomyces cerevisiae, 1996 první osekvenovaný eukaryotický organimus Caenorhabditis elegans, 1998 první

Více

Hemoglobin a jemu podobní... Studijní materiál. Jan Komárek

Hemoglobin a jemu podobní... Studijní materiál. Jan Komárek Hemoglobin a jemu podobní... Studijní materiál Jan Komárek Bioinformatika Bioinformatika je vědní disciplína, která se zabývá metodami pro shromážďování, analýzu a vizualizaci rozsáhlých souborů biologických

Více

Počítačové vyhledávání genů a funkčních oblastí na DNA

Počítačové vyhledávání genů a funkčních oblastí na DNA Počítačové vyhledávání genů a funkčních oblastí na DNA Hodnota genomových sekvencí záleží na kvalitě anotace Anotace Charakterizace genomových vlastností s použitím výpočetních a experimentálních metod

Více

Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague

Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague 1 / 23 Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague 2 / 23 biologové často potřebují najít často se opakující sekvence DNA tyto sekvence bývají relativně krátké,

Více

ÚVOD DO BIOINFORMATIKY

ÚVOD DO BIOINFORMATIKY MSSSYITDQGPGSGLRVPARSWLNSDAPSLSLNGDWRFRLLPTAPGTPGAGSVLATGETVEAVASESFD DSSWDTLAVPSHWVLAEDGKYGRPIYTNVQYPFPIDPPFVPDANPTGDYRRTFDVPDSWFESTTAALTL RFDGVESRYKVWVNGVEIGVGSGSRLAQEFDVSEALRPGKNLLVVRVHQWSAASYLEDQDQWWLPGIFR

Více

Vytváření fylogenetických stromů na základě alignmentů. Tomáš Novotný Jaroslav Knotek

Vytváření fylogenetických stromů na základě alignmentů. Tomáš Novotný Jaroslav Knotek Vytváření fylogenetických stromů na základě alignmentů Tomáš Novotný Jaroslav Knotek Alignmenty - opakování Existují dvě základní varianty alignmentů: globální a lokální Globální: Hledáme nejlepší zarovnání

Více

Aminokyseliny. Gymnázium a Jazyková škola s právem státní jazykové zkoušky Zlín. Tematická oblast Datum vytvoření Ročník Stručný obsah Způsob využití

Aminokyseliny. Gymnázium a Jazyková škola s právem státní jazykové zkoušky Zlín. Tematická oblast Datum vytvoření Ročník Stručný obsah Způsob využití Aminokyseliny Tematická oblast Datum vytvoření Ročník Stručný obsah Způsob využití Autor Kód Chemie přírodních látek proteiny 18.7.2012 3. ročník čtyřletého G Určování postranních řetězců aminokyselin

Více

Bioinformatika a výpočetní biologie KFC/BIN. I. Přehled

Bioinformatika a výpočetní biologie KFC/BIN. I. Přehled Bioinformatika a výpočetní biologie KFC/BIN I. Přehled RNDr. Karel Berka, Ph.D. Univerzita Palackého v Olomouci Definice bioinformatiky (Molecular) bio informatics: bioinformatics is conceptualising biology

Více

Využití metod strojového učení v bioinformatice David Hoksza

Využití metod strojového učení v bioinformatice David Hoksza Využití metod strojového učení v bioinformatice David Hoksza SIRET Research Group Katedra softwarového inženýrství, Matematicko-fyzikální fakulta Karlova Univerzita v Praze Bioinformatika Biologické inspirace

Více

Co se o sobě dovídáme z naší genetické informace

Co se o sobě dovídáme z naší genetické informace Genomika a bioinformatika Co se o sobě dovídáme z naší genetické informace Jan Pačes, Mgr, Ph.D Ústav molekulární genetiky AVČR, CZECH FOBIA (Free and Open Bioinformatics Association) hpaces@img.cas.cz

Více

Určení molekulové hmotnosti: ESI a nanoesi

Určení molekulové hmotnosti: ESI a nanoesi Cvičení Určení molekulové hmotnosti: ESI a nanoesi ) 1)( ( ) ( H m z H m z M k j j j m z z zh M Molekula o hmotnosti M se nabije z-krát protonem, pík iontu ve spektru je na m z : ) ( H m z M z Pro dva

Více

Aminokyseliny příručka pro učitele. Obecné informace: Téma otevírá kapitolu Bílkoviny, která svým rozsahem překračuje rámec jedné vyučovací hodiny.

Aminokyseliny příručka pro učitele. Obecné informace: Téma otevírá kapitolu Bílkoviny, která svým rozsahem překračuje rámec jedné vyučovací hodiny. Obecné informace: Aminokyseliny příručka pro učitele Téma otevírá kapitolu Bílkoviny, která svým rozsahem překračuje rámec jedné vyučovací hodiny. Navazující učivo Před probráním tématu Aminokyseliny probereme

Více

Metabolismus aminokyselin. Vladimíra Kvasnicová

Metabolismus aminokyselin. Vladimíra Kvasnicová Metabolismus aminokyselin Vladimíra Kvasnicová Aminokyseliny aminokyseliny přijímáme v potravě ve formě proteinů: důležitá forma organicky vázaného dusíku, který tak může být v těle využit k syntéze dalších

Více

Metabolismus bílkovin. Václav Pelouch

Metabolismus bílkovin. Václav Pelouch ZÁKLADY OBECNÉ A KLINICKÉ BIOCHEMIE 2004 Metabolismus bílkovin Václav Pelouch kapitola ve skriptech - 3.2 Výživa Vyvážená strava člověka musí obsahovat: cukry (50 55 %) tuky (30 %) bílkoviny (15 20 %)

Více

NGS analýza dat. kroužek, Alena Musilová

NGS analýza dat. kroužek, Alena Musilová NGS analýza dat kroužek, 16.12.2016 Alena Musilová Typy NGS experimentů Název Materiál Cílí na..? Cíl experimentu? amplikon DNA malý počet vybraných genů hledání variant exom DNA všechny geny hledání

Více

Bioinformatika. hledání významu biologických dat. Marian Novotný. Friday, April 24, 15

Bioinformatika. hledání významu biologických dat. Marian Novotný. Friday, April 24, 15 Bioinformatika hledání významu biologických dat Marian Novotný Bioinformatika sběr biologických dat archivace biologických dat organizace biologických dat interpretace biologických dat 2 Biologové sbírají

Více

11. Bioinformatika a proteiny II

11. Bioinformatika a proteiny II 11. Bioinformatika a proteiny II David Potěšil Core Facility Proteomics CEITEC-MU Masaryk University Kamenice 5, A26 phone: +420 54949 8426 email: david.potesil@ceitec.muni.cz Proteomika, Podzim 2016 2

Více

Molekulární genetika IV zimní semestr 6. výukový týden ( )

Molekulární genetika IV zimní semestr 6. výukový týden ( ) Ústav biologie a lékařské genetiky 1.LF UK a VFN, Praha Molekulární genetika IV zimní semestr 6. výukový týden (5.11. 9.11.2007) Nondisjunkce u Downova syndromu 2 Tři rodokmeny rodin s dětmi postiženými

Více

Dynamic programming. Optimal binary search tree

Dynamic programming. Optimal binary search tree The complexity of different algorithms varies: O(n), Ω(n ), Θ(n log (n)), Dynamic programming Optimal binary search tree Různé algoritmy mají různou složitost: O(n), Ω(n ), Θ(n log (n)), The complexity

Více

E-infrastruktura CESNET - partner výzkumné infrastruktury pro biologická data ELIXIR CZ

E-infrastruktura CESNET - partner výzkumné infrastruktury pro biologická data ELIXIR CZ E-infrastruktura CESNET - partner výzkumné infrastruktury pro biologická data ELIXIR CZ Life Science - od molekul k systému Slovník komponent Gramatika (interakce) Souvislosti a sítě (diagramy ) Atlas

Více

Bioinformatika je nová disciplína na rozhraní počítačových věd, informačních technologií a biologie. Bioinformatika zahrnuje studium biologických dat

Bioinformatika je nová disciplína na rozhraní počítačových věd, informačních technologií a biologie. Bioinformatika zahrnuje studium biologických dat Bioinformatika je nová disciplína na rozhraní počítačových věd, informačních technologií a biologie. Bioinformatika zahrnuje studium biologických dat a jejich praktické uchovávání, vyhledávání a modelování.

Více

Markovovy modely v Bioinformatice

Markovovy modely v Bioinformatice Markovovy modely v Bioinformatice Outline Markovovy modely obecně Profilové HMM Další použití HMM v Bioinformatice Analýza biologických sekvencí Biologické sekvence: DNA,RNA,protein prim.str. Sekvenování

Více

Univerzita Pardubice. Fakulta ekonomicko-správní

Univerzita Pardubice. Fakulta ekonomicko-správní Univerzita Pardubice Fakulta ekonomicko-správní Bioinformatika Simona Smejkalová Bakalářská práce 2009 Prohlašuji: Tuto práci jsem vypracovala samostatně. Veškeré literární prameny a informace, které

Více

Aminokyseliny a dlouhodobá parenterální výživa. Luboš Sobotka

Aminokyseliny a dlouhodobá parenterální výživa. Luboš Sobotka Aminokyseliny a dlouhodobá parenterální výživa Luboš Sobotka Reakce na hladovění a stres jsou stejné asi 4000000 let Přežít hladovění a akutní stav Metody sledování kvality AK roztoků Vylučovací metoda

Více

Využití strojového učení k identifikaci protein-ligand aktivních míst

Využití strojového učení k identifikaci protein-ligand aktivních míst Využití strojového učení k identifikaci protein-ligand aktivních míst David Hoksza, Radoslav Krivák SIRET Research Group Katedra softwarového inženýrství, Matematicko-fyzikální fakulta Karlova Univerzita

Více

Struktura a funkce biomakromolekul

Struktura a funkce biomakromolekul Struktura a funkce biomakromolekul KBC/BPOL 7. Interakce DNA/RNA - protein Ivo Frébort Interakce DNA/RNA - proteiny v buňce Základní dogma molekulární biologie Replikace DNA v E. coli DNA polymerasa a

Více

Bioinformatika. Jiří Vondrášek Ústav organické chemie a biochemie Jan Pačes Ústav molekulární genetiky

Bioinformatika. Jiří Vondrášek Ústav organické chemie a biochemie Jan Pačes Ústav molekulární genetiky Bioinformatika pro PrfUK 2006 Jiří Vondrášek Ústav organické chemie a biochemie vondrasek@uochb.cas.cz Jan Pačes Ústav molekulární genetiky hpaces@img.cas.cz http://bio.img.cas.cz/prfuk2006 syllabus Úterý,

Více

Bioinformatika pro PrfUK 2003

Bioinformatika pro PrfUK 2003 Bioinformatika pro PrfUK 2003 Jiří Vondrášek Ústav organické chemie a biochemie vondrasek@uochb.cas.cz Jan Pačes Ústav molekulární genetiky hpaces@img.cas.cz http://bio.img.cas.cz/prfuk2003 What is Bioinformatics?---The

Více

jednoduchá heuristika asymetrické okolí stavový prostor, kde nelze zabloudit připustit zhoršují cí tahy Pokročilé heuristiky

jednoduchá heuristika asymetrické okolí stavový prostor, kde nelze zabloudit připustit zhoršují cí tahy Pokročilé heuristiky Pokročilé heuristiky jednoduchá heuristika asymetrické stavový prostor, kde nelze zabloudit připustit zhoršují cí tahy pokročilá heuristika symetrické stavový prostor, který vyžaduje řízení 1 2 Paměť pouze

Více

PCR IN DETECTION OF FUNGAL CONTAMINATIONS IN POWDERED PEPPER

PCR IN DETECTION OF FUNGAL CONTAMINATIONS IN POWDERED PEPPER PCR IN DETECTION OF FUNGAL CONTAMINATIONS IN POWDERED PEPPER Trojan V., Hanáček P., Havel L. Department of Plant Biology, Faculty of Agronomy, Mendel University of Agriculture and Forestry in Brno, Zemedelska

Více

Vojtěch Franc. Biometrie ZS Poděkování Janu Šochmanovi za slajdy vysvětlující AdaBoost

Vojtěch Franc. Biometrie ZS Poděkování Janu Šochmanovi za slajdy vysvětlující AdaBoost Rozpoznávání tváří I Vojtěch Franc Centrum strojového vnímání, ČVUT FEL Praha Biometrie ZS 2013 Poděkování Janu Šochmanovi za slajdy vysvětlující AdaBoost Úlohy rozpoznávání tváří: Detekce Cíl: lokalizovat

Více

Struktura proteinů. - testík na procvičení. Vladimíra Kvasnicová

Struktura proteinů. - testík na procvičení. Vladimíra Kvasnicová Struktura proteinů - testík na procvičení Vladimíra Kvasnicová Mezi proteinogenní aminokyseliny patří a) kyselina asparagová b) kyselina glutarová c) kyselina acetoctová d) kyselina glutamová Mezi proteinogenní

Více

Počítačová analýza lokálních podobností mezi biologickými sekvencemi

Počítačová analýza lokálních podobností mezi biologickými sekvencemi MASARYKOVA UNIVERZITA V BRNĚ Fakulta informatiky Michal VAVERKA Počítačová analýza lokálních podobností mezi biologickými sekvencemi Bakalářská práce Vedoucí práce: Ing. Matej Lexa, Ph.D. Brno 2006 Prohlašuji,

Více

Bioinformatika a výpočetní biologie. KFC/BIN VII. Fylogenetická analýza

Bioinformatika a výpočetní biologie. KFC/BIN VII. Fylogenetická analýza ioinformatika a výpočetní biologie KF/IN VII. Fylogenetická analýza RNr. Karel erka, Ph.. Univerzita Palackého v Olomouci Fylogeneze Vznik a vývoj jednotlivých linií organismů Vývoj člověka phylogenetic

Více

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA INFORMAČNÍCH TECHNOLOGIÍ ÚSTAV INFORMAČNÍCH SYSTÉMŮ FACULTY OF INFORMATION TECHNOLOGY DEPARTMENT OF INFORMATION SYSTEMS PREDIKCE ŠKODLIVOSTI

Více

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1 Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu

Více

11. Tabu prohledávání

11. Tabu prohledávání Jan Schmidt 2011 Katedra číslicového návrhu Fakulta informačních technologií České vysoké učení technické v Praze Zimní semestr 2011/12 MI-PAA EVROPSKÝ SOCIÁLNÍ FOND PRAHA & EU: INVESTUJENE DO VAŠÍ BUDOUCNOSTI

Více

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D.

Statistické metody v ekonomii. Ing. Michael Rost, Ph.D. Statistické metody v ekonomii Ing. Michael Rost, Ph.D. Jihočeská univerzita v Českých Budějovicích Test χ 2 v kontingenční tabulce typu 2 2 Jde vlastně o speciální případ χ 2 testu pro čtyřpolní tabulku.

Více

Enzymové pexeso. L: lactose P: operon

Enzymové pexeso.  L: lactose P: operon Enzymové pexeso http://web.vscht.cz/~spiwokv/enzymologie/pexeso/ L: lactose P: operon Struktura proteinů: Primární: Struktura proteinů: Primární: Sekvenování: - sekvenováním (c)dna - hmotnostní spektrometrií

Více

7 Další. úlohy analýzy řeči i a metody

7 Další. úlohy analýzy řeči i a metody Pokročilé metody rozpoznávánířeči Přednáška 7 Další úlohy analýzy řeči i a metody jejich řešení Výsledky rozpoznávání (slovník k 413k) frantisek_vlas 91.92( 90.18) [H= 796, D= 10, S= 60, I= 15, N=866,

Více

Služby pro predikci struktury proteinů. Josef Pihera

Služby pro predikci struktury proteinů. Josef Pihera Služby pro predikci struktury proteinů Josef Pihera Struktura proteinů Primární sekvence aminokyselin Sekundární stáčení a spojování vodíkovými vazbami Supersekundární struktura přechod, opakovaná geometrická

Více

Nukleové kyseliny Replikace Transkripce translace

Nukleové kyseliny Replikace Transkripce translace Nukleové kyseliny Replikace Transkripce translace Prokaryotická X eukaryotická buňka Hlavní rozdíl organizace genetického materiálu (u prokaryot není ohraničen) Život závisí na schopnosti buněk skladovat,

Více

Metabolismus aminokyselin 2. Vladimíra Kvasnicová

Metabolismus aminokyselin 2. Vladimíra Kvasnicová Metabolismus aminokyselin 2 Vladimíra Kvasnicová Odbourávání AMK 1) odstranění aminodusíku z molekuly AMK 2) detoxikace uvolněné aminoskupiny 3) metabolismus uhlíkaté kostry AMK 7 produktů 7 degradačních

Více

Molekulární biotechnologie č.9. Cílená mutageneze a proteinové inženýrství

Molekulární biotechnologie č.9. Cílená mutageneze a proteinové inženýrství Molekulární biotechnologie č.9 Cílená mutageneze a proteinové inženýrství Gen kódující jakýkoliv protein lze izolovat z přírody, klonovat, exprimovat v hostitelském organismu. rekombinantní protein purifikovat

Více

Biologie. Autorské řešení kvalifikační úlohy

Biologie. Autorské řešení kvalifikační úlohy Biologie Autorské řešení kvalifikační úlohy Přepis sekvence ze sekvenátoru A C G T 5' C G T T C T A T A G A T A C G C G A T G A C G G T A T A C C A T C C G C A A A G T 3' http://blast.ncbi.nlm.nih.gov/

Více

Zpracování informací a vizualizace v chemii (C2150) 1. Úvod, databáze molekul

Zpracování informací a vizualizace v chemii (C2150) 1. Úvod, databáze molekul Zpracování informací a vizualizace v chemii (C2150) 1. Úvod, databáze molekul Organizační pokyny Přednášející: Martin Prokop Email: martinp@chemi.muni.cz Pracovna: INBIT/2.10 (v dubnu/květnu přesun do

Více

Predikce genů a anotace sekvence DNA

Predikce genů a anotace sekvence DNA Predikce genů a anotace sekvence DNA Základní informace Následující text je součástí učebních textů předmětu Analýza sekvencí DNA a je určen hlavně pro studenty Matematické biologie. Může být ovšem přínosný

Více

Bioinformatika. Alignment 2. http://bio.img.cas.cz. Jiří Vondrášek Ústav organické chemie a biochemie vondrasek@uochb.cas.cz

Bioinformatika. Alignment 2. http://bio.img.cas.cz. Jiří Vondrášek Ústav organické chemie a biochemie vondrasek@uochb.cas.cz Bioinformatika lignment http://bio.img.cas.cz Jiří Vondrášek Ústav organické chemie a biochemie vondrasek@uochb.cas.cz Jan Pačes Ústav molekulární genetiky hpaces@img.cas.cz typy alignmentů : :n n:n n

Více

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ VYHLEDÁVÁNÍ HOMOLOGNÍCH GENŮ DIPLOMOVÁ PRÁCE

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ VYHLEDÁVÁNÍ HOMOLOGNÍCH GENŮ DIPLOMOVÁ PRÁCE VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV BIOMEDICÍNSKÉHO INŽENÝRSTVÍ FACULTY OF ELECTRICAL ENGINEERING AND COMMUNICATION DEPARTMENT

Více

PREDIKTOR VLIVU AMINOKYSELINOVÝCH SUBSTITUCÍ NA FUNKCI PROTEINŮ

PREDIKTOR VLIVU AMINOKYSELINOVÝCH SUBSTITUCÍ NA FUNKCI PROTEINŮ VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA INFORMAČNÍCH TECHNOLOGIÍ ÚSTAV INFORMAČNÍCH SYSTÉMŮ FACULTY OF INFORMATION TECHNOLOGY DEPARTMENT OF INFORMATION SYSTEMS PREDIKTOR VLIVU

Více

Struktury a vazebné energie iontových klastrů helia

Struktury a vazebné energie iontových klastrů helia Společný seminář 11. června 2012 Struktury a vazebné energie iontových klastrů helia Autor: Lukáš Červenka Vedoucí práce: Doc. RNDr. René Kalus, Ph.D. Technický úvod Existují ověřené optimalizační algoritmy

Více

OPVK CZ.1.07/2.2.00/

OPVK CZ.1.07/2.2.00/ OPVK CZ.1.07/2.2.00/28.0184 Základní principy vývoje nových léčiv OCH/ZPVNL Mgr. Radim Nencka, Ph.D. ZS 2012/2013 První kroky k objevu léčiva Nobelova cena za chemii 2013 Martin Karplus Michael Levitt

Více

Využití DNA sekvencování v

Využití DNA sekvencování v Využití DNA sekvencování v taxonomii prokaryot Mgr. Pavla Holochová, doc. RNDr. Ivo Sedláček, CSc. Česká sbírka mikroorganismů Ústav experimentální biologie Přírodovědecká fakulta Masarykova univerzita,

Více

Metody studia historie populací. Metody studia historie populací. 1) Metody studiagenetickérozmanitosti komplexní fenotypové znaky, molekulární znaky.

Metody studia historie populací. Metody studia historie populací. 1) Metody studiagenetickérozmanitosti komplexní fenotypové znaky, molekulární znaky. 1) Metody studiagenetickérozmanitosti komplexní fenotypové znaky, molekulární znaky. 2)Mechanizmy evoluce mutace, p írodnívýb r, genový posun a genový tok 3) Anagenezex kladogeneze-co je vlastn druh 4)Dva

Více

Vyhledávání příbuzných enzymů s modifikovanou funkcí v proteinových databázích

Vyhledávání příbuzných enzymů s modifikovanou funkcí v proteinových databázích 2015 http://excel.fit.vutbr.cz Vyhledávání příbuzných enzymů s modifikovanou funkcí v proteinových databázích Jiří Hon* Abstrakt Hledání příbuzných enzymů v biologických databázích patří mezi obvyklé činnosti

Více

Využití metagenomiky při hodnocení sanace chlorovaných ethylenů in situ Výsledky pilotních testů

Využití metagenomiky při hodnocení sanace chlorovaných ethylenů in situ Výsledky pilotních testů Využití metagenomiky při hodnocení sanace chlorovaných ethylenů in situ Výsledky pilotních testů Stavělová M.,* Macháčková J.*, Rídl J.,** Pačes J.** * Earth Tech CZ, s.r.o ** ÚMG AV ČR PROČ METAGENOMIKA?

Více

Některé potíže s klasifikačními modely v praxi. Nikola Kaspříková KMAT FIS VŠE v Praze

Některé potíže s klasifikačními modely v praxi. Nikola Kaspříková KMAT FIS VŠE v Praze Některé potíže s klasifikačními modely v praxi Nikola Kaspříková KMAT FIS VŠE v Praze Literatura J. M. Chambers: Greater or Lesser Statistics: A Choice for Future Research. Statistics and Computation 3,

Více

Markov Chain Monte Carlo. Jan Kracík.

Markov Chain Monte Carlo. Jan Kracík. Markov Chain Monte Carlo Jan Kracík jan.kracik@vsb.cz Princip Monte Carlo integrace Cílem je (přibližný) výpočet integrálu I(g) = E f [g(x)] = g(x)f (x)dx. (1) Umíme-li generovat nezávislé vzorky x (1),

Více

Metabolismus aminokyselin - testík na procvičení - Vladimíra Kvasnicová

Metabolismus aminokyselin - testík na procvičení - Vladimíra Kvasnicová Metabolismus aminokyselin - testík na procvičení - Vladimíra Kvasnicová Vyberte esenciální aminokyseliny a) Asp, Glu b) Val, Leu, Ile c) Ala, Ser, Gly d) Phe, Trp Vyberte esenciální aminokyseliny a) Asp,

Více

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ

VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ VYUŽITÍ PRAVDĚPODOBNOSTNÍ METODY MONTE CARLO V SOUDNÍM INŽENÝRSTVÍ Michal Kořenář 1 Abstrakt Rozvoj výpočetní techniky v poslední době umožnil také rozvoj výpočetních metod, které nejsou založeny na bázi

Více

NMR biomakromolekul RCSB PDB. Progr. NMR

NMR biomakromolekul RCSB PDB. Progr. NMR NMR biomakromolekul Typy biomakromolekul a možnosti studia pomocí NMR proteiny a peptidy rozmanité složení, omezení jen velikostí molekul nukleové kyseliny (RNA, DNA) a oligonukleotidy omezení malou rozmanitostí

Více

Degradační produkty proteinových aduktů v moči jako nový typ biomarkerů v toxikologii

Degradační produkty proteinových aduktů v moči jako nový typ biomarkerů v toxikologii 28.Teisingerův den průmyslové toxikologie, 11. 6.2013 Degradační produkty proteinových aduktů v moči jako nový typ biomarkerů v toxikologii J. Mráz, I. Linhart *, I. Hanzlíková, Š. Dušková, L. Dabrowská,

Více

Inovace studia molekulární a buněčné biologie reg. č. CZ.1.07/2.2.00/

Inovace studia molekulární a buněčné biologie reg. č. CZ.1.07/2.2.00/ Inovace studia molekulární a buněčné biologie reg. č. CZ.1.07/2.2.00/07.0354 Genomika (KBB/GENOM) Poziční klonování Ing. Hana Šimková, CSc. Cíl přednášky - seznámení s metodou pozičního klonování genů

Více

MOLEKULÁRNÍ METODY V EKOLOGII MIKROORGANIZMŮ

MOLEKULÁRNÍ METODY V EKOLOGII MIKROORGANIZMŮ MOLEKULÁRNÍ METODY V EKOLOGII MIKROORGANIZMŮ (EKO/MMEM) ZPRACOVÁNÍ DGGE VÝSTUPŮ A SEKVENAČNÍCH DAT Zpracování výstupů z denaturační gradientové gelové elektroforézy (DGGE) práce s programem Gel2k Program

Více

Inovace studia molekulární a buněčné biologie reg. č. CZ.1.07/2.2.00/

Inovace studia molekulární a buněčné biologie reg. č. CZ.1.07/2.2.00/ Inovace studia molekulární a buněčné biologie reg. č. CZ.1.07/2.2.00/07.0354 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky Populační genetika (KBB/PG)

Více

Aminokyseliny, proteiny, enzymy Základy lékařské chemie a biochemie 2014/2015 Ing. Jarmila Krotká Metabolismus základní projev života látková přeměna souhrn veškerých dějů, které probíhají uvnitř organismu

Více

Nukleové kyseliny Replikace Transkripce translace

Nukleové kyseliny Replikace Transkripce translace Nukleové kyseliny Replikace Transkripce translace Figure 4-3 Molecular Biology of the Cell ( Garland Science 2008) Figure 4-4 Molecular Biology of the Cell ( Garland Science 2008) Figure 4-5 Molecular

Více

Obecné principy chemických strukturních bází dat předmět projektu VaVpI ChemEIZ

Obecné principy chemických strukturních bází dat předmět projektu VaVpI ChemEIZ Obecné principy chemických strukturních bází dat předmět projektu VaVpI ChemEIZ Jaroslav Šilhánek Strukturní báze dat = Grafická representace struktur chemických sloučenin (+ další informace) Reakční

Více

Inovace studia molekulární a buněčné biologie

Inovace studia molekulární a buněčné biologie Investice do rozvoje vzdělávání Inovace studia molekulární a buněčné biologie Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Investice do rozvoje vzdělávání

Více

Gibbsovo samplování a jeho využití

Gibbsovo samplování a jeho využití Gibbsovo samplování a jeho využití Regulace genů Hlavní pozornost výzkumů DNA je většinou věnována analýze genů Geny tvoří pouhá 3% lidské DNA Ukazuje se, že zbývající junk DNA má také velký význam Obsahuje

Více

Text Mining: SAS Enterprise Miner versus Teragram. Petr Berka, Tomáš Kliegr VŠE Praha

Text Mining: SAS Enterprise Miner versus Teragram. Petr Berka, Tomáš Kliegr VŠE Praha Text Mining: SAS Enterprise Miner versus Teragram Petr Berka, Tomáš Kliegr VŠE Praha Text mining vs. data mining Text mining = data mining na nestrukturovaných textových dokumentech otázka vhodné reprezentace

Více

P ro te i n o vé d a ta b á ze

P ro te i n o vé d a ta b á ze Proteinové databáze Osnova Základní stavební jednotky proteinů Hierarchie proteinové struktury Stanovení proteinové struktury Důležitost proteinové struktury Proteinové strukturní databáze Proteinové klasifikační

Více

Střední průmyslová škola a Vyšší odborná škola, Hrabákova 271, Příbram. III / 2 = Inovace a zkvalitnění výuky prostřednictvím ICT

Střední průmyslová škola a Vyšší odborná škola, Hrabákova 271, Příbram. III / 2 = Inovace a zkvalitnění výuky prostřednictvím ICT Škola Číslo projektu Číslo a název šablony klíčové aktivity Tematická oblast Název sady Téma Anotace Autor Střední průmyslová škola a Vyšší odborná škola, Hrabákova 271, Příbram CZ.1.07/1.5.00/34.0556

Více

Molekulárn. rní genetika

Molekulárn. rní genetika Molekulárn rní genetika Centráln lní dogma molekulárn rní biologie cesta přenosu genetické informace: DNA RNA proteiny výjimkou reverzní transkripce retrovirů: RNA DNA Chemie nukleových kyselin dusíkaté

Více

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr.

RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Institut biostatistiky Janoušová, a analýz Dušek: Analýza dat pro neurovědy Blok 6 Jak analyzovat kategoriální a binární

Více

PROTEINY. Biochemický ústav LF MU (H.P.)

PROTEINY. Biochemický ústav LF MU (H.P.) PROTEINY Biochemický ústav LF MU 2013 - (H.P.) 1 proteiny peptidy aminokyseliny 2 Aminokyseliny 3 Charakteristika základní stavební jednotky proteinů geneticky kódované 20 základních aminokyselin 4 a-aminokyselina

Více

Metody studia historie populací. Metody studia historie populací

Metody studia historie populací. Metody studia historie populací 1) Metody studia genetické rozmanitosti komplexní fenotypové znaky, molekulární znaky. 2) Mechanizmy evoluce mutace, přírodní výběr, genový posun a genový tok 3) Anageneze x kladogeneze - co je vlastně

Více

Inovace studia molekulární a buněčné biologie

Inovace studia molekulární a buněčné biologie Inovace studia molekulární a buněčné biologie Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. MBIO1/Molekulární biologie 1 Tento projekt je spolufinancován

Více

Bílkoviny - proteiny

Bílkoviny - proteiny Bílkoviny - proteiny Proteiny jsou složeny z 20 kódovaných aminokyselin L-enantiomery Chemická struktura aminokyselin R představuje jeden z 20 různých typů postranních řetězců R Hlavní řetězec je neměnný

Více

Evoluční algoritmy. Podmínka zastavení počet iterací kvalita nejlepšího jedince v populaci změna kvality nejlepšího jedince mezi iteracemi

Evoluční algoritmy. Podmínka zastavení počet iterací kvalita nejlepšího jedince v populaci změna kvality nejlepšího jedince mezi iteracemi Evoluční algoritmy Použítí evoluční principů, založených na metodách optimalizace funkcí a umělé inteligenci, pro hledání řešení nějaké úlohy. Populace množina jedinců, potenciálních řešení Fitness function

Více

Vazebné interakce protein s DNA

Vazebné interakce protein s DNA Vazebné interakce protein s DNA Vazebné možnosti vn jší vazba atmosféra + iont kolem nabité DNA vazba ve žlábku van der Waalsovský kontakt s lé ivem ve žlábku interkalace vmeze ení planárního aromat.

Více

Názvosloví cukrů, tuků, bílkovin

Názvosloví cukrů, tuků, bílkovin Názvosloví cukrů, tuků, bílkovin SACARIDY CUKRY MNSACARIDY LIGSACARIDY PLYSACARIDY (z mnoha molekul monosacharidů) ALDSY KETSY -DISACARIDY - TRISACARIDY - TETRASACARIDY atd. -aldotriosy -aldotetrosy -aldopentosy

Více

ÚSTAV FYZIKÁLNÍ BIOLOGIE JIHOČESKÁ UNIVERZITA V ČESKÝCH BUDĚJOVICÍCH

ÚSTAV FYZIKÁLNÍ BIOLOGIE JIHOČESKÁ UNIVERZITA V ČESKÝCH BUDĚJOVICÍCH ÚSTAV FYZIKÁLNÍ BIOLOGIE JIHOČESKÁ UNIVERZITA V ČESKÝCH BUDĚJOVICÍCH ZPRÁVA O UKONČENÍ PROJEKTU Projekt Název projektu: Impact of host ecology on metabolic capacity of Sodalis allied symbiotic bacteria

Více

Má tajemný clusterin u dětí v septickém stavu aktivitu chaperonu? J. Žurek, P.Košut, M. Fedora

Má tajemný clusterin u dětí v septickém stavu aktivitu chaperonu? J. Žurek, P.Košut, M. Fedora Má tajemný clusterin u dětí v septickém stavu aktivitu chaperonu? J. Žurek, P.Košut, M. Fedora Klinika dětské anesteziologie a resuscitace, Lékařská fakulta MU, Fakultní nemocnice Brno DNA transkripce

Více

Výuka genetiky na Přírodovědecké fakultě UK v Praze

Výuka genetiky na Přírodovědecké fakultě UK v Praze Výuka genetiky na Přírodovědecké fakultě UK v Praze Studium biologie na PřF UK v Praze Bakalářské studijní programy / obory Biologie Biologie ( duhový bakalář ) Ekologická a evoluční biologie ( zelený

Více

TRANSLACE - SYNTÉZA BÍLKOVIN

TRANSLACE - SYNTÉZA BÍLKOVIN TRANSLACE - SYNTÉZA BÍLKOVIN Translace - překlad genetické informace z jazyka nukleotidů do jazyka aminokyselin podle pravidel genetického kódu. Genetický kód - způsob zápisu genetické informace Kód Morseovy

Více

Centrum aplikované genomiky, Ústav dědičných metabolických poruch, 1.LFUK

Centrum aplikované genomiky, Ústav dědičných metabolických poruch, 1.LFUK ové technologie v analýze D A, R A a proteinů Stanislav Kmoch Centrum aplikované genomiky, Ústav dědičných metabolických poruch, 1.LFUK Motto : "The optimal health results from ensuring that the right

Více