SEQUENCE ALIGNMENT MOLEKULÁRNÍ TAXONOMIE

Rozměr: px
Začít zobrazení ze stránky:

Download "SEQUENCE ALIGNMENT MOLEKULÁRNÍ TAXONOMIE"

Transkript

1 SEQUENCE ALIGNMENT gi gi Eat1 SpEat1 CG7206 DrEat1 C1orf26 46 LQELDNLKKGKML LHV-RQKAI 46 LQELDYLKSGKLS SKV-EDKAR 47 IQELDGLKKSPDIARDNDDTTN----QEHDRTI-GTLAR 49 LQELDGLKSESS STC-GYLAR 49 IKELDKLKSKYQS DCLQRVIAM 49 LQELDYLKSGKLS SKV-EDKAR 49 MQELDRMKEGKLL KRA-QHKAI MOLEKULÁRNÍ TAXONOMIE

2 OSNOVA co to je sequence alignment? jak se dělá sequence alignment? jaké použít programy?

3 REKONSTRUKCE EVOLUČNÍ HISTORIE rekonstrukce na základě srovnávání znaků v molekulární taxonomii se používají sekvence sekvence (DNA, RNA, proteiny) se srovnávají tzv. alignmentem

4 CO JE SEQUENCE ALIGNMENT? v biologii - seřazení sekvencí DNA, RNA nebo proteinů pod sebe tak, že (dle evoluce) odpovídající si amimokyseliny leží pod sebou (při zachování jejich pořadí) cílem je odhalit oblasti podobnosti mezi sekvencemi, které poukazuji na funkční, strukturní nebo evoluční podobnost v informatice - série operací, kterými se změní jedna sekvence v druhou (substituce, inzerce, delece)

5 PROČ SROVNÁVAT SEKVENCE? informace o funkci informace o struktuře proteinu informace o evoluci, nalézání příbuzenských vztahů odvodit, které aminokyseliny si odpovidají (homologie)

6 CO JE SEQUENCE ALIGNMENT? >Q61287 Q61287_MOUSE ALPHA-GLOBIN - MUS MUSCULUS (MOUSE). MVLSGEDKSNIKAAWGKIGGHGAEYVAEALERMFASFPTTKTYFPHFDVSHGSAQVKGHG KKVADALASAAGHLDDLPGALSALSDLHAHKLRVDPVNFKLLSHCLLVTLASHHPADFTP AVHASLDKFLASVSTVLTSKYR >Q5XMD6 Q5XMD6_9AVES ALPHA A HEMOGLOBIN - OXYURA MACCOA. MVLSAADKTNVKGVFSKIGGHADDYGAETLERMFVAYPQTKTYFPHFDLQHGSAQIKAHG KKVAAALVEAVNHIDDISGALSKLSDLHAQKLRVDPVNFKFLGHCFLVVVAIHHPSALTP EVHASLDKFMCAVGAVLTAKYR Q61287 Q61287_MOUSE MVLSGEDKSNIKAAWGKIGGHGAEYVAEALERMFASFPTTKTYFPHFDVSHGSAQVKGHG 60 Q5XMD6 Q5XMD6_9AVES MVLSAADKTNVKGVFSKIGGHADDYGAETLERMFVAYPQTKTYFPHFDLQHGSAQIKAHG 60 ****. **:*:*..:.*****. :* **:*****.::* *********:.*****:*.** Q61287 Q61287_MOUSE KKVADALASAAGHLDDLPGALSALSDLHAHKLRVDPVNFKLLSHCLLVTLASHHPADFTP 120 Q5XMD6 Q5XMD6_9AVES KKVAAALVEAVNHIDDISGALSKLSDLHAQKLRVDPVNFKFLGHCFLVVVAIHHPSALTP 120 **** **..*..*:**:.**** ******:**********:*.**:**.:* ***: :** Q61287 Q61287_MOUSE AVHASLDKFLASVSTVLTSKYR 142 Q5XMD6 Q5XMD6_9AVES EVHASLDKFMCAVGAVLTAKYR 142 ********:.:*.:***:***

7 PROČ JSOU SI SEKVENCE PODOBNÉ? náhodou analogické homologické

8 POKUD JSOU HOMOLOGICKÉ... SEQUENCE 1 VLSEGEWQLVLHVWAKVEADVAGHGQDILIRLFKSHPETLEKF-DRF-KHLKTEAEMKAS.=ALI =ID SEQUENCE 2 VLSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPH-FD--L----SHG-S -- SEQUENCE 1 EDLKKHGVTVLTALGAILKKKGHHEAELKPLAQSHATKHKIPIKYLEFISEAIIHVLHSR.=ALI =ID SEQUENCE 2 AQVKGHGKKVADALTNAVAHVDDMPNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAH -- SEQUENCE 1 HPGDFGADAQGAMNKALELFRKDIAAKYKELGY.=ALI =ID SEQUENCE 2 LPAEFTPAVHASLDKFLASVSTVLTSKY---R- lze usuzovat, že: shoda = obě aminokyseliny zůstaly zachovány ve stejné formě v jaké se nacházejí u nejbližšího společného předka neshoda = mutace (substituce) jedné z aminokyselin po odštěpení ze společného předka mezera = inzerce nebo delece v jedné ze sekvencí po odštěpení od společného předka

9 SEQUENCE IDENTITA/HOMOLOGIE HOMOLOGNÍ PROTEINY ROST, 1999

10 SEQUENCE IDENTITA/HOMOLOGIE sekvenční identita > 35% - pravděpodobně homolog sekvenční identita = 20-35% ( twilight zone ; Doolittle) - může být homolog sekvenční identita < 20% - midnight zone (Rost) - sekvence zcela nedostatečná k určení homologie

11 PROTEIN NEBO DNA? při určování homologie se obvykle používá proteinový alignment 20 aminokyselin versus 4 nucleotidy => mnohem větší pravděpodobnost shody na každé pozici v DNA, proteinový alignment proto informativnější na druhou stranu - genetický kód je degenerovaný => různé kodony často kódují stejnou aminokyselinu - rozdíl v DNA alignmentu se vůbec neprojeví v proteinovém alignmentu a neovlivní vlastnosti proteinu (genového produktu) DNA alignment využíván při srovnávání regulačních oblastí genů, definování genů a celogenomových srovnáváních, blízce příbuzné organizmy

12 TYPY ALIGNMENTŮ globální alignment - pokouší se nalézt nejlepší možný alignment celých sekvencí lokální alignment - pokouší se nalézt podobné úseky v sekvencích, nemusí nezbytně nalézt nejlepší alignment celých sekvencí ZVELEBIL (2006)

13 SHRNUTÍ alignment je základní a zakládající bioinformatickou metodou alignment slouží k anotaci sekvencí (funkce, evoluce, polymorfismus, motivy) alignment užitečný především když naznačuje ortologii sekvencí pod 30 % sekvenční identity je schopnost odvozovat funkci sporná, ani vysoká sekvenční identita však 100% nezaručuje úspěch.

14 JAK SE DĚLÁ ALIGNMENT?

15 KOLIK ALIGNMENTŮ LZE VYTVOŘIT? GGCATGAG GTACGTACG GTACGTACG GGCATGAGG GTACGTACG GGCATGAGG -GTACGTACG- GGC-ATG-AGG GT-ACGTACG GGCATG-AGG KTERÝ ALIGNMENT SE VÁM ZDÁ POCITOVĚ NEJSMYSLUPLNĚJŠÍ? PROČ? GTACG--T-ACG G---GCATGAGG

16 podobně u proteinů - např. Ala budu zaměněn spíš Val, Leu nebo Ile než Tyr většina by se asi shodla na předposledním alignmentu největší sekvenční identita - 0%, 33%, 22%, 50%, 42% krátký alignment, málo mezer (delece nebo inzerce obecné méně pravděpodobná než substituce) obecně G/A nebo C/T záměna pravděpodobnější než G/C nebo A/T (pyrimidin za purin)

17 ALIGNMENT - POŽADAVKY CO JE OBECNĚ POTŘEBA K NALEZENÍ NEJLEPŠÍHO ALIGNMENTU? měřítko kvality alignmentu - skóre pro shodu/ neshodu (všechny kombinace) a skóre pro mezeru (obvykle negativní - gap penalty) algoritmus, který systematicky projde všechny možné alignmenty

18 SKÓRE ALIGMENTU vychází se ze skórovací tabulky, která přiděluje určité skóre každe možné kombinaci skórovací tabulky jsou symetrické SHODA = 1 NESHODA =0 SHODA =3 NESHODA (PU/PU ; PY/PY) =0 NESHODA (PU/PY) =-3 A C G T A C G T A C G T A C G T

19 GAP PENALTY alignment score lze dobře statisticky odvodit z alignmentu, gap penalty se odhadují hůř...většinou se odhadují metodou pokusu a omylu buď konstantní - každá mezera za stejnou pokutu nebo rozdílná pokuta pro první (gap-opening penalty) a každou další mezeru (gap-extension penalty) -> affine gap penalties první mezera má výšší penaltu než každá další

20 GAP PENALTY PHE ASP ILE CYS ARG LEU PRO GLY SER ALA GLU ALA VAL CYS PHE ASN VAL CYS ARG THR PRO GLU ALA ILE CYS PHE ASN VAL CYS ARG THR PRO GLU ALA ILE CYS jedním z pokusů je definování variabilních gap penalties založených na strukturách -> nižší pravděpodobnost výskytu mezery v pravidelných sekundárních strukturách, v hydrofóbních jádrech

21 SKÓRE PRO NÁŠ ALIGNMENT GGCATGAG GTACGTACG SHODA =3 NESHODA (PU/PU ; PY/PY) =0 NESHODA (PU/PY) =-3 GAP PENALTY (KONSTANTNÍ) = -5 A C G T A C G T

22 Alignment Shoda (+3) Pu/Pu (0) Pu/Py (-3) Gap (-5) Score GTACGTACG GGCATGAGG GTACGTACG GGCATGAGG -GTACGTACG- GGC-ATG-AGG GT-ACGTACG GGCATG-AGG GTACG--T-ACG G---GCATGAGG

23 Alignment Shoda (+3) Pu/Pu (0) Pu/Py (-3) Gap (-5) Score GTACGTACG GGCATGAGG GTACGTACG GGCATGAGG -GTACGTACG- GGC-ATG-AGG GT-ACGTACG GGCATG-AGG GTACG--T-ACG G---GCATGAGG

24 A TEĎ VY! Alignment Shoda (+3) Pu/Pu (0) Pu/Py (0) Gap (-4) Score GTACGTACG GGCATGAGG GT-ACGTACG GGCATG-AGG

25 A TEĎ VY Alignment Shoda (+3) Pu/Pu (0) Pu/Py (0) Gap (-4) Score GTACGTACG GGCATGAGG GT-ACGTACG GGCATG-AGG

26 NEJLEPŠÍ ALIGNMENT - SKUTEČNÝ ALIGNMENT? alignment s nejvyšším skóre se nazývá optimální alignment, ostatní alignmenty jsou suboptimální optimální alignment však nemusí být ten který popisuje, co se v evoluci skutečně stalo naopak, ani spávný alignment nemusí mít optimální skóre nicméně, současné protokoly poskytují většinou užitečné výsledky...se zrnkem soli je však třeba je brát vždy

27 SKÓROVACÍ TABULKY (SUBSTITUTION MATRICES) používané jako základ pro výpočet skóre alignmentu DNA skórovací tabulky jednoduché - např.: shoda = +1, neshoda = 0 nebo shoda = +5, neshoda = -4 DNA sekvence se používají méně, neboť se pro většinu aplikací hodí více proteinové sekvence

28 PROTEINOVÉ SUBSTITUTION MATRICES výsledný alignment je ovlivněn zvolenou substituční tabulky, proto je jim věnována velké pozornost na začátku tabulky, které vycházely z fyzikálněchemických vlastností aminokyselin nebo z genetického kódu postupně nahrazeny tabulkami, které odpovídají skutečně pozorovaným mírám záměn mezi jednotlivými aminokyselinami

29 PAM PAM = Percent Accepted Mutations vyvinuta už v 70. letech 20. století Margaretou Dayhoff založena na pravděpodobných mírách mutace kalkulovaných z globálních alignmentů blízce podobných sekvencí kalkulována jako logaritmus pravděpodobnosti záměny aminokyseliny log odd = počet pozorovaných záměn/ počet očekávaných záměň při náhodném zaměňování

30 KALKULACE PRAVDĚPODOBNOSTI skóre pro záměnu valinu za isoleucin pravděpodobnost záměny pokud jsou sekvence příbuzné (pozorovaná) = 0.03 výskyt aminokyselin v populaci (databáze, proteom) = 0.1 a 0.05 poměr pravděpodobností = 0.03/(0.1*0.05) = 6x větší pravděpodobnost záměny V -> I než očekáváno při náhodných záměnách skóre = desítkový logaritmus * 10 a zaokrouhlen na nejbližší celé číslo = 10*log 6 = 10 * = 8

31 BLOSUM BLOSUM = BLOck SUbstitution Matrix vytvořeny na začátku 90. let (Henikoff a Henikoff, 1992) založeno na lokálních alignmentech bloků aminokyselin s definovanou sekvenční identitou (u homologních proteinů) všechny tabulky vycházejí z experimentální dat, nejsou extrapolovány jako některé PAM tabulky

32 BLOSUM BLOSUM 80 - tabulka vypočítaná na základě alignmentu bloku sekvencí s identitou 80 % BLOSUM 62 - tabulka vypočítaná na základě alignmentu bloku sekvencí s identitou 62 %

33 BLOSUM VERSUS PAM PAM BLOSUM z globálního alignmentu velmi podobných sekvencí hodnoty pro vzdáleně podobné sekvence extrapolovány z hodnot pro velmi podobné sekvence evoluční vzdálenost z lokálního alignmentu bez mezer všechny hodnoty vycházejí ze skutečných alignmentů sekvenční identita

34 DNASEKVENCE RNASEKVENCE PAM = 44 BLOSUM = 51

35 ALIGNMENT - POŽADAVKY CO JE OBECNĚ POTŘEBA K NALEZENÍ NEJLEPŠÍHO ALIGNMENTU? měřítko kvality alignmentu - skóre pro shodu/ neshodu (všechny kombinace) a skóre pro mezeru (obvykle negativní - gap penalty) algoritmus, který systematicky projde všechny možné alignmenty

36 počet alignmentů roste pokud povolíme mezery generovat všechny možné alignmenty není praktické, neboť dvě sekvence o 100 aminokyselinách mají asi možných alignmentů současné stolní počítače zvládnou okolo 2,5 x 10 9 operací za vteřinu (1 rok = vteřin) x 2,5 x 10 9 ~ = 8 x operací/rok máme i rychlejší počítače, ale...

37 NEEDLEMAN-WUNSCH řešení přinesl až algoritmus Needlemana a Wunsche (1970), který modifikoval v matematice a programování používané algoritmy dynamického programování (dynamic programming) dynamic programming vyvinuto ve 40. letech 20. století jako způsob řešení problémů, kde se dělá řada rozhodnutí krok po kroku programming nemá spojení s programováním ve smyslu psaní programů, ale v matematickém smyslu jako optimizace průběh algoritmu se mění s konkrétním problémem, a proto je dynamický

38 pro každou pozici v alignmentu počítá s pomocí scoring matrix, zda je v daném místě optimálnější (vyšší skóre), aby došlo k shodě/neshodě v sekvenci či inzerci nebo deleci Needleman-Wunsch algoritmus dovede v každém kroku zavrhnout řadu alignmentů zvládnutelné v reálném čase

39 JAK TO FUNGUJE? jednu sekvenci píšeme do řádku, druhou do sloupce tabulky pro každou pozici v tabulce se počítá pravděpodobnost třech událostí: shody (záměny), inzerce v první sekvenci a inzerce v druhé sekvenci DI-1,J-1 DI,J-Y DI-1,J-1 + B (AJ, BJ) DI,J-Y - W (Y) DI-X,J DI-X,J - W (X)

40 JAK TO FUNGUJE? GAATTCAGTTA GGATCGA SKÓROVACÍ TABULKA: SI,J = 1 (POKUD SHODA) SI,J = 0 (POKUD NESHODA) W = 0 (GAP PENALTY) A C G T A C G T

41 ZAČÍNÁME VYPLŇOVAT G A A T T C A G T T A G 0 G 0 A 0 T 0 C 0 G 0 A 0

42 G A A T T C A G T T A G 0 1 G 0 A 0 T 0 C 0 G 0 A 0 DI,J-Y DI,J-Y - W (Y) DI-1,J-1 + B (AJ, BJ) DI-X,J - W (X)

43 G A A T T C A G T T A G G 0 1 A 0 1 T 0 1 C 0 1 G 0 1 A 0 1

44 G A A T T C A G T T A G G A T 0 1 C 0 1 G 0 1 A 0 1

45 DOPLNÍME TABULKU G A A T T C A G T T A G G A T C G A

46 HLEDÁME ALIGNMENT G A A T T C A G T T A G G A T C G A

47 HLEDÁME ALIGNMENT G A A T T C A G T T A G G A T C G A SEKVENCE 1 A SEKVENCE 2 A

48 HLEDÁME ALIGNMENT G A A T T C A G T T A G G A T C G A SEKVENCE 1 TA SEKVENCE 2 -A

49 ŘEŠENÍ G A A T T C A G T T A G G A T C G A SEKVENCE 1 GAATTCAGTTA SEKVENCE 2 GGA-TC-G--A

50 HLEDÁNÍ ALIGNMENTU -SHRNUTÍ stopujeme alignment zpětně pro každou pozici určujeme odkuď jsme se k ní dostali v některých případech může vzniknout více optimálních alignmentů, program však zobrazí pouze jedno řešení

51 NEEDLEMAN-WUNSCH SHRNUTÍ využívá dynamické programování k zredukování možných alignmentů vytváří globální alignment zaručuje nalezení optimálního alignmentu (s přihlédnutím ke zvolené skórovací tabulce a gap penalty )

52 MULTIPLE SEQUENCE ALIGNMENT (MSA)

53 PROČ MSA? pokud srovnáváme příbuzné proteiny tak dostáváme silnější signál umožnuje nám zpřesnit alignment vzniklý srovnáním dvou sekvencí větší šance nalezení strukturně nebo funkčně významných aminokyselin základ pro fylogenetické studie

54 JAK NA MSA? lze použít dynamické programování, ale počet rozměrů v matrici roste úměrně s počtem srovnávaných sekvencí pokud by alignment 2 sekvencí o 50 aminokyselinách trval vteřinu, pak srovnání N sekvencí by trvalo 10 2N-4 s - 3 sekvence ~2 minuty, 4 sekvence ~ 3 hodiny, 5 sekvencí ~ 11,5 dne dynamické programování je pro více jak sekvence příliš pomalé tři a proto jej žádný z běžných programů nepoužívá

55 JAK NA MSA? většina programů používá hierarchické progresivní metody všechny kombinace sekvencí projdou pairwise sequence alignment alignmenty jsou hierarchicky seřazeny dle míry podobnosti (fylogenetický strom) finální multiple alignment je budován v krocích -první jsou seřazeny nejpodobnější sekvence, k takovému páru se přirovnává další nejbližší sekvence dokud nejsou použity všechny sekvence

56 hierarchické progresivní metody MSA PŘÍSTUPY? všechny kombinace sekvencí projdou pairwise sequence alignment alignmenty jsou hierarchicky seřazeny dle míry podobnosti (fylogenetický strom) finální multiple alignment je budován v krocích -první jsou seřazeny nejpodobnější sekvence, k takovému páru se přirovnává další nejbližší sekvence dokud nejsou použity všechny sekvence Clustal W, T-cofee

57 CLUSTAL W VŠECHNY ALIGNMENTY MÍRA PODOBNOSTI SEKVENCÍ GUIDE TREE POSTUPNÉ SROVNÁVÁNÍ THOMPSON ET AL., 1994

58 MSA V PRAXI největší slabinou je, že chyby vytvořené v úvodních alignmentech se propagují do výsledného alignmentu iterativní metody - optimizace objektivní funkce přes realigning podskupin sekvencí - Muscle, ProbCons učící metody - HMM, genetické algoritmy, simulated annealing - FSA phylogeny-aware methods - PRANK, PAGAN MSA porovnávány proti databázi strukturních alignmentů (BALiBase)

59

60 MAFFT metoda pro velké soubory dat (fylogenetické analýzy) homologické oblasti jsou identifikovány pomocí rychlých Fourierovách transformací (objem a polarita aa) alignment kombinací progresivních a iterativních metod až 100x rychlejší než T-cofee při stejné přesnosti novější FAMSA (Deorowicz, 2016)

61 PHYLOGENY-AWARE MSA PAGAN, ProGraphMSA snaží se minimalizovat počet mezer v alignmentu

62 FAST STATISTICAL ALIGNMENT používá machine learning metodu simulated annealing na základě pairwise alignmentů gap penalties i skorovací tabulky jsou odhadovány pro každý set sekvencí individuálně - velmi robustní i pro velmi dlouhé sekvence

63 STRUKTURNÍ / SEKVENČNÍ ALIGNMENT struktura lépe konzervována než sekvence umožňuje odhalovat homologie v sekvenční twilight (midnight) zone vylepšuje multiple sequence alignments, predikce struktury a metodiku alignmentu obecně

64 STRUKTURNÍ VERSUS SEKVENČNÍ 1FWR_A 2YPI_A 1FWR_A 2YPI_A 1FWR_A 2YPI_A 1FWR_A 2YPI_A MKNWKTSAESILTTGPVVPVIVVKKLEHAVPMAKA ARTFFVGGNFKLNGSKQSIKEIVERLNTASIPENVEVVICPPATYLDYSVSLVKKPQVTV ::... : :. *.. :. *... LVAGGVRVLEVTLRTECAVDAIRAIAKEVPEAIVGAGTVLNPQQLAEVTE AGA GAQNAYLKASGAFTGENSVDQIKDVGAKWVILGHSERRSYFHEDDKFIADKTKFALGQGV.... :: * :** *: :. :. :: ::: *. QFAISPGLTEPLLKAATEGTIPLIPGISTVSELMLGMDYGLKEFQFFPAEANGGVKALQA GVILCIGETLEEKKAGKTLDVVERQLNAVLEEVKDWTNVVVAYEPVWAIGTGLAATPEDA. :. * * **.. : :.:.*: : :.:. :.... :* IAGPFSQVRFCPKGGISPANYRDYLALKSVLCIGGSWLVPADALEAGDYDRITKLAREAV QDIHASIRKFLASKLGDKAASELRILYGGSANGSNAVTFKDKADVDGFLVGGASLKPEFV * :*... *. :...:..* * :.* * *

65 STRUKTURNÍ VERSUS SEKVENČNÍ Sequence ART---FFVGGNFKLNG-SKQSI-KEIVERLNTASI--PENVEVVICP.=ALI =ID Sequence 2 MKNWKTSAESIL--TTGP--VVPVI--VVKKLEHAVP-MAKALVAG-GVR-----V-LEV Sequence PATYLDYSVSLV-KKPQVTVGAQ-N--AY-LKASGAFTGEN-S---VDQIKDVG.=ALI =ID Sequence 2 TLRTECAVDAIRAIAKEVP-E--AIVGAGTVLN-PQ QLAEVT--E---AG Sequence 1 AKWVILGH--SERRSYFHEDDKFIADKTKFALGQGVGVILCIGETLEEKKAGKTLDVVER.=ALI =ID Sequence 2 AQFAIS-PGL TEPLLKAATEGTIPLIPGIS TVS Sequence 1 QLNAV-LEEVKDW-TNVVVAYEP--VW--AIGTGLAATPEDA--QDI--HASI-RKFLA-.=ALI =ID Sequence 2 ELMLGMD--YG-LK---EFQFFPAE-ANG G----VKA--LQA--IAG-P--FS Sequence 1 SKLGDKAA-SELRILYGGSANGSN-AVTF---KDK-ADVDGFLVGGA-SLK =ALI =ID Sequence QV---RFCPKGGIS-PANY--RDYL--ALKSVLCIGG-SWL-VPADALEAGDY

66 STRUKTURNÍ VERSUS SEKVENČNÍ

67 KVALITA ALIGNMETU lze hodnotit za pomoci strukturní informace MSA porovnávány proti databázi strukturních alignmentů (BALiBase), HomFam program APDB (součást T-Coffee) pokud jsou známy alespoň dvě struktury umožňuje vybrat nejlepší z alternativních alignmentů QuanTest (2017) - za pomoci přesnosti predikce sekundárních struktur

68 není uniformní KVALITA UVNITŘ ALIGNMENTU MSA programy však často neoznačují kterým částem alignmentu věří a kterým nikoliv (FSA) pro účely fylogenetických analýz se často vyřazují oblasti se spoustou mezer TrimAl, JalView, UGENE

69 STROM ZE VŠECH GENOMOVÝCH SEKVENCÍ výběr genů, identifikace ortologů.. whole-genome phylogenies většinou alignment-free metody - pořadí genů, množství genů, nukleotidové složení, SNP, metabolické dráhy -> kompletně pomíjí evoluční koncepty alignment metody spoléhající na průměrné hodnoty podobností - typicky pracují jen z ortology plně automatické metody používající i neortologické sekvence (Yonoko et al., 2018)

70 SHRNUTÍ databáze by měly být pravidelně updatovány přehled dostupných biologických databází vždy v lednovém čísle NAR řada velmi specializovaných databází hledání v databázích povětšinou heuristickými metodami standard dnes BLAST nutno hodnotit statistickou významnost nálezu citlivější metodou PSI-Blast nebo HMM metody

71

72

73

74

75

76

77

78

79

80

81

82

83

84

85

86

87

88

89

90

91

92

93

94

95

Thursday, February 27, 14

Thursday, February 27, 14 DATABÁZE A VYHLEDÁVÁNÍ SEKVENCÍ MOLEKULÁRNÍ TAXONOMIE 2014 MARIAN NOVOTNÝ PŘEDNÁŠEJÍCÍ Mgr. Marian NOVOTNÝ, PhD. vystudoval odbornou biologii na PřF UK, diplomka v laboratoři doc. Folka doktorát na Uppsalské

Více

Základy genomiky. I. Úvod do bioinformatiky. Jan Hejátko

Základy genomiky. I. Úvod do bioinformatiky. Jan Hejátko Základy genomiky I. Úvod do bioinformatiky Jan Hejátko Masarykova univerzita, Oddělení funkční genomiky a proteomiky Laboratoř molekulární fyziologie rostlin Základy genomiky I. Zdrojová literatura ke

Více

Studijní materiály pro bioinformatickou část ViBuChu. úloha II. Jan Komárek, Gabriel Demo

Studijní materiály pro bioinformatickou část ViBuChu. úloha II. Jan Komárek, Gabriel Demo Studijní materiály pro bioinformatickou část ViBuChu úloha II Jan Komárek, Gabriel Demo Adenin Struktura DNA Thymin 5 konec 3 konec DNA tvořena dvěmi řetězci orientovanými antiparalelně (liší se orientací

Více

Využití metod strojového učení v bioinformatice David Hoksza

Využití metod strojového učení v bioinformatice David Hoksza Využití metod strojového učení v bioinformatice David Hoksza SIRET Research Group Katedra softwarového inženýrství, Matematicko-fyzikální fakulta Karlova Univerzita v Praze Bioinformatika Biologické inspirace

Více

Genomické databáze. Shlukování proteinových sekvencí. Ivana Rudolfová. školitel: doc. Ing. Jaroslav Zendulka, CSc.

Genomické databáze. Shlukování proteinových sekvencí. Ivana Rudolfová. školitel: doc. Ing. Jaroslav Zendulka, CSc. Genomické databáze Shlukování proteinových sekvencí Ivana Rudolfová školitel: doc. Ing. Jaroslav Zendulka, CSc. Obsah Proteiny Zdroje dat Predikce struktury proteinů Cíle disertační práce Vstupní data

Více

Inovace studia molekulární a buněčné biologie

Inovace studia molekulární a buněčné biologie Inovace studia molekulární a buněčné biologie Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. MBIO1/Molekulární biologie 1 Tento projekt je spolufinancován

Více

Hemoglobin a jemu podobní... Studijní materiál. Jan Komárek

Hemoglobin a jemu podobní... Studijní materiál. Jan Komárek Hemoglobin a jemu podobní... Studijní materiál Jan Komárek Bioinformatika Bioinformatika je vědní disciplína, která se zabývá metodami pro shromážďování, analýzu a vizualizaci rozsáhlých souborů biologických

Více

Dynamic programming. Historie. Dynamické programování je obsaženo v těchto programech: Příklad: chceme optimálně přiložit dvě sekvence

Dynamic programming. Historie. Dynamické programování je obsaženo v těchto programech: Příklad: chceme optimálně přiložit dvě sekvence Dynamic programming Dynamické programování je obsaženo v těchto programech: BLS FS lustalw HMMER enscan MFold Phylip Historie 9s matematik Richard Bellman při optimalizaci rozhodovacích procesů chtěl zmást

Více

Bioinformatika a výpočetní biologie KFC/BIN. I. Přehled

Bioinformatika a výpočetní biologie KFC/BIN. I. Přehled Bioinformatika a výpočetní biologie KFC/BIN I. Přehled RNDr. Karel Berka, Ph.D. Univerzita Palackého v Olomouci Definice bioinformatiky (Molecular) bio informatics: bioinformatics is conceptualising biology

Více

Vyhledávání podobných sekvencí BLAST

Vyhledávání podobných sekvencí BLAST Vyhledávání podobných sekvencí BLAST Základní informace Následující text je součástí učebních textů předmětu Analýza sekvencí DNA a je určen hlavně pro studenty Matematické biologie. Může být ovšem přínosný

Více

Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti URČOVÁNÍ PRIMÁRNÍ STRUKTURY BÍLKOVIN

Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti URČOVÁNÍ PRIMÁRNÍ STRUKTURY BÍLKOVIN Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti URČOVÁNÍ PRIMÁRNÍ STRUKTURY BÍLKOVIN Primární struktura primární struktura bílkoviny je dána pořadím AK jejích polypeptidových řetězců

Více

6. Kde v DNA nalézáme rozdíly, zodpovědné za obrovskou diverzitu života?

6. Kde v DNA nalézáme rozdíly, zodpovědné za obrovskou diverzitu života? 6. Kde v DNA nalézáme rozdíly, zodpovědné za obrovskou diverzitu života? Pamatujete na to, co se objevilo v pracích Charlese Darwina a Alfreda Wallace ohledně vývoje druhů? Aby mohl mechanismus přírodního

Více

Molekulární genetika IV zimní semestr 6. výukový týden ( )

Molekulární genetika IV zimní semestr 6. výukový týden ( ) Ústav biologie a lékařské genetiky 1.LF UK a VFN, Praha Molekulární genetika IV zimní semestr 6. výukový týden (5.11. 9.11.2007) Nondisjunkce u Downova syndromu 2 Tři rodokmeny rodin s dětmi postiženými

Více

DATABÁZE A VYHLEDÁVÁNÍ SEKVENCÍ

DATABÁZE A VYHLEDÁVÁNÍ SEKVENCÍ DATABÁZE A VYHLEDÁVÁNÍ SEKVENCÍ MOLEKULÁRNÍ TAXONOMIE 2015 MARIAN NOVOTNÝ OSNOVA co je substrát pro molekulární taxonomii? kde se shromažďují data? jak data vyhledávat? REKONSTRUKCE EVOLUČNÍ HISTORIE rekonstrukce

Více

Využití strojového učení k identifikaci protein-ligand aktivních míst

Využití strojového učení k identifikaci protein-ligand aktivních míst Využití strojového učení k identifikaci protein-ligand aktivních míst David Hoksza, Radoslav Krivák SIRET Research Group Katedra softwarového inženýrství, Matematicko-fyzikální fakulta Karlova Univerzita

Více

Vytváření fylogenetických stromů na základě alignmentů. Tomáš Novotný Jaroslav Knotek

Vytváření fylogenetických stromů na základě alignmentů. Tomáš Novotný Jaroslav Knotek Vytváření fylogenetických stromů na základě alignmentů Tomáš Novotný Jaroslav Knotek Alignmenty - opakování Existují dvě základní varianty alignmentů: globální a lokální Globální: Hledáme nejlepší zarovnání

Více

b) Jak se změní sekvence aminokyselin v polypeptidu, pokud dojde v pozici 23 k záměně bázového páru GC za TA (bodová mutace) a s jakými následky?

b) Jak se změní sekvence aminokyselin v polypeptidu, pokud dojde v pozici 23 k záměně bázového páru GC za TA (bodová mutace) a s jakými následky? 1.1: Gén pro polypeptid, který je součástí peroxidázy buku lesního, má sekvenci 3'...TTTACAGTCCATTCGACTTAGGGGCTAAGGTACCTGGAGCCCACGTTTGGGTCATCCAG...5' 5'...AAATGTCAGGTAAGCTGAATCCCCGATTCCATGGACCTCGGGTGCAAACCCAGTAGGTC...3'

Více

Molekulárn. rní genetika

Molekulárn. rní genetika Molekulárn rní genetika Centráln lní dogma molekulárn rní biologie cesta přenosu genetické informace: DNA RNA proteiny výjimkou reverzní transkripce retrovirů: RNA DNA Chemie nukleových kyselin dusíkaté

Více

Aminokyseliny. Gymnázium a Jazyková škola s právem státní jazykové zkoušky Zlín. Tematická oblast Datum vytvoření Ročník Stručný obsah Způsob využití

Aminokyseliny. Gymnázium a Jazyková škola s právem státní jazykové zkoušky Zlín. Tematická oblast Datum vytvoření Ročník Stručný obsah Způsob využití Aminokyseliny Tematická oblast Datum vytvoření Ročník Stručný obsah Způsob využití Autor Kód Chemie přírodních látek proteiny 18.7.2012 3. ročník čtyřletého G Určování postranních řetězců aminokyselin

Více

Využití DNA markerů ve studiu fylogeneze rostlin

Využití DNA markerů ve studiu fylogeneze rostlin Mendelova genetika v příkladech Využití DNA markerů ve studiu fylogeneze rostlin Ing. Petra VESELÁ Ústav lesnické botaniky, dendrologie a geobiocenologie LDF MENDELU Brno Tento projekt je spolufinancován

Více

DATABÁZE A VYHLEDÁVÁNÍ SEKVENCÍ

DATABÁZE A VYHLEDÁVÁNÍ SEKVENCÍ DATABÁZE A VYHLEDÁVÁNÍ SEKVENCÍ MOLEKULÁRNÍ TAXONOMIE 2015 MARIAN NOVOTNÝ OSNOVA co je substrát pro molekulární taxonomii? kde se shromažďují data? jak data vyhledávat? REKONSTRUKCE EVOLUČNÍ HISTORIE rekonstrukce

Více

Proteiny Genová exprese. 2013 Doc. MVDr. Eva Bártová, Ph.D.

Proteiny Genová exprese. 2013 Doc. MVDr. Eva Bártová, Ph.D. Proteiny Genová exprese 2013 Doc. MVDr. Eva Bártová, Ph.D. Bílkoviny (proteiny), 15% 1g = 17 kj Monomer = aminokyseliny aminová skupina karboxylová skupina α -uhlík postranní řetězec Znát obecný vzorec

Více

Počítačové vyhledávání genů a funkčních oblastí na DNA

Počítačové vyhledávání genů a funkčních oblastí na DNA Počítačové vyhledávání genů a funkčních oblastí na DNA Hodnota genomových sekvencí záleží na kvalitě anotace Anotace Charakterizace genomových vlastností s použitím výpočetních a experimentálních metod

Více

Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague

Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague 1 / 23 Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague 2 / 23 biologové často potřebují najít často se opakující sekvence DNA tyto sekvence bývají relativně krátké,

Více

Molekulární biotechnologie č.9. Cílená mutageneze a proteinové inženýrství

Molekulární biotechnologie č.9. Cílená mutageneze a proteinové inženýrství Molekulární biotechnologie č.9 Cílená mutageneze a proteinové inženýrství Gen kódující jakýkoliv protein lze izolovat z přírody, klonovat, exprimovat v hostitelském organismu. rekombinantní protein purifikovat

Více

Bioinformatika pro PrfUK 2003

Bioinformatika pro PrfUK 2003 Bioinformatika pro PrfUK 2003 Jiří Vondrášek Ústav organické chemie a biochemie vondrasek@uochb.cas.cz Jan Pačes Ústav molekulární genetiky hpaces@img.cas.cz http://bio.img.cas.cz/prfuk2003 What is Bioinformatics?---The

Více

Inovace studia molekulární a buněčné biologie reg. č. CZ.1.07/2.2.00/

Inovace studia molekulární a buněčné biologie reg. č. CZ.1.07/2.2.00/ Inovace studia molekulární a buněčné biologie reg. č. CZ.1.07/2.2.00/07.0354 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky Populační genetika (KBB/PG)

Více

Bioinformatika. Jiří Vondrášek Ústav organické chemie a biochemie Jan Pačes Ústav molekulární genetiky

Bioinformatika. Jiří Vondrášek Ústav organické chemie a biochemie Jan Pačes Ústav molekulární genetiky Bioinformatika pro PrfUK 2006 Jiří Vondrášek Ústav organické chemie a biochemie vondrasek@uochb.cas.cz Jan Pačes Ústav molekulární genetiky hpaces@img.cas.cz http://bio.img.cas.cz/prfuk2006 syllabus Úterý,

Více

Aplikovaná bioinformatika

Aplikovaná bioinformatika Aplikovaná bioinformatika Číslo aktivity: 2.V Název klíčové aktivity: Na realizaci se podílí: Implementace nových předmětů do daného studijního programu doc. RNDr. Michaela Wimmerová, Ph.D., Mgr. Josef

Více

METODY VÍCENÁSOBNÉHO ZAROVNÁVÁNÍ NUKLEOTIDOVÝCH SEKVENCÍ

METODY VÍCENÁSOBNÉHO ZAROVNÁVÁNÍ NUKLEOTIDOVÝCH SEKVENCÍ VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV BIOMEDICÍNSKÉHO INŽENÝRSTVÍ FACULTY OF ELECTRICAL ENGINEERING AND COMMUNICATION DEPARTMENT

Více

Základy fylogenetiky a konstrukce fylogenetických stromů

Základy fylogenetiky a konstrukce fylogenetických stromů EKO/MEM Molekulární ekologie mikroorganismů Základy fylogenetiky a konstrukce fylogenetických stromů Iva Buriánková Katedra ekologie PřF UP Kde vyrostl první fylogenetický strom? Charles Darwin (1809 1882)

Více

Virtuální svět genetiky 1. Translace

Virtuální svět genetiky 1. Translace (překlad) je druhým krokem exprese genetické informace a ukončuje dráhu DNA > RNA > protein. probíhá mimo jádro, v cytoplazmě na ribozómech. Výchozími látkami pro translaci je 21 standardních aminokyselin,

Více

Metody studia historie populací. Metody studia historie populací

Metody studia historie populací. Metody studia historie populací 1) Metody studia genetické rozmanitosti komplexní fenotypové znaky, molekulární znaky. 2) Mechanizmy evoluce mutace, přírodní výběr, genový posun a genový tok 3) Anageneze x kladogeneze - co je vlastně

Více

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1

Pravděpodobnost v závislosti na proměnné x je zde modelován pomocí logistického modelu. exp x. x x x. log 1 Logistická regrese Menu: QCExpert Regrese Logistická Modul Logistická regrese umožňuje analýzu dat, kdy odezva je binární, nebo frekvenční veličina vyjádřená hodnotami 0 nebo 1, případně poměry v intervalu

Více

Genetický kód. Jakmile vznikne funkční mrna, informace v ní obsažená může být ihned použita pro syntézu proteinu.

Genetický kód. Jakmile vznikne funkční mrna, informace v ní obsažená může být ihned použita pro syntézu proteinu. Genetický kód Jakmile vznikne funkční, informace v ní obsažená může být ihned použita pro syntézu proteinu. Pravidla, kterými se řídí prostřednictvím přenos z nukleotidové sekvence DNA do aminokyselinové

Více

"Učení nás bude více bavit aneb moderní výuka oboru lesnictví prostřednictvím ICT ". Molekulární základy genetiky

Učení nás bude více bavit aneb moderní výuka oboru lesnictví prostřednictvím ICT . Molekulární základy genetiky "Učení nás bude více bavit aneb moderní výuka oboru lesnictví prostřednictvím ICT ". Molekulární základy genetiky 1/76 GENY Označení GEN se používá ve dvou základních významech: 1. Jako synonymum pro vlohu

Více

Genetický polymorfismus

Genetický polymorfismus Genetický polymorfismus Za geneticky polymorfní je považován znak s nejméně dvěma geneticky podmíněnými variantami v jedné populaci, které se nachází v takových frekvencích, že i zřídkavá má frekvenci

Více

Cysteinové adukty globinu jako potenciální biomarkery expozice styrenu

Cysteinové adukty globinu jako potenciální biomarkery expozice styrenu Cysteinové adukty globinu jako potenciální biomarkery expozice styrenu J. Mráz, I. Hanzlíková, Š. Dušková, E. Frantík, V. Stránský Státní zdravotní ústav Praha 1 Biomarkery expozice cizorodým látkám výchozí

Více

Využití DNA sekvencování v

Využití DNA sekvencování v Využití DNA sekvencování v taxonomii prokaryot Mgr. Pavla Holochová, doc. RNDr. Ivo Sedláček, CSc. Česká sbírka mikroorganismů Ústav experimentální biologie Přírodovědecká fakulta Masarykova univerzita,

Více

Populační genetika. ) a. Populační genetika. Castle-Hardy-Weinbergova zákonitost. Platí v panmiktické populaci za předpokladu omezujících podmínek

Populační genetika. ) a. Populační genetika. Castle-Hardy-Weinbergova zákonitost. Platí v panmiktické populaci za předpokladu omezujících podmínek Poulační genetika Poulační genetika ORGANISMUS Součást výše organizované soustavy oulace POPULACE Soubor jedinců jednoho druhu Genotyově heterogenní V určitém čase má řirozeně vymezený rostor Velký očet

Více

Markovovy modely v Bioinformatice

Markovovy modely v Bioinformatice Markovovy modely v Bioinformatice Outline Markovovy modely obecně Profilové HMM Další použití HMM v Bioinformatice Analýza biologických sekvencí Biologické sekvence: DNA,RNA,protein prim.str. Sekvenování

Více

Struktura proteinů. - testík na procvičení. Vladimíra Kvasnicová

Struktura proteinů. - testík na procvičení. Vladimíra Kvasnicová Struktura proteinů - testík na procvičení Vladimíra Kvasnicová Mezi proteinogenní aminokyseliny patří a) kyselina asparagová b) kyselina glutarová c) kyselina acetoctová d) kyselina glutamová Mezi proteinogenní

Více

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy

Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Profilování vzorků heroinu s využitím vícerozměrné statistické analýzy Autor práce : RNDr. Ivo Beroun,CSc. Vedoucí práce: prof. RNDr. Milan Meloun, DrSc. PROFILOVÁNÍ Profilování = klasifikace a rozlišování

Více

Mutace jako změna genetické informace a zdroj genetické variability

Mutace jako změna genetické informace a zdroj genetické variability Obecná genetika Mutace jako změna genetické informace a zdroj genetické variability Doc. RNDr. Ing. Eva PALÁTOVÁ, PhD. Ing. Roman LONGAUER, CSc. Ústav zakládání a pěstění lesů LDF MENDELU Brno Tento projekt

Více

PREDIKTOR VLIVU AMINOKYSELINOVÝCH SUBSTITUCÍ NA FUNKCI PROTEINŮ

PREDIKTOR VLIVU AMINOKYSELINOVÝCH SUBSTITUCÍ NA FUNKCI PROTEINŮ VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA INFORMAČNÍCH TECHNOLOGIÍ ÚSTAV INFORMAČNÍCH SYSTÉMŮ FACULTY OF INFORMATION TECHNOLOGY DEPARTMENT OF INFORMATION SYSTEMS PREDIKTOR VLIVU

Více

Genotypy absolutní frekvence relativní frekvence

Genotypy absolutní frekvence relativní frekvence Genetika populací vychází z: Genetická data populace mohou být vyjádřena jako rekvence (četnosti) alel a genotypů. Každý gen má nejméně dvě alely (diploidní organizmy). Součet všech rekvencí alel v populaci

Více

Využití internetových zdrojů při studiu mikroorganismů

Využití internetových zdrojů při studiu mikroorganismů Využití internetových zdrojů při studiu mikroorganismů doc. RNDr. Milan Bartoš, Ph.D. bartosm@vfu.cz Přírodovědecká fakulta MU, 2012 Obsah přednášky 1) Práce se sekvenčními daty 2) Základní veřejně dostupné

Více

Genetická diverzita masného skotu v ČR

Genetická diverzita masného skotu v ČR Genetická diverzita masného skotu v ČR Mgr. Jan Říha Výzkumný ústav pro chov skotu, s.r.o. Ing. Irena Vrtková 26. listopadu 2009 Genetická diverzita skotu pojem diverzity Genom skotu 30 chromozomu, genetická

Více

Molekulární genetika

Molekulární genetika Molekulární genetika Upozornění: ukončení semestru ZÁPOČTOVÝ TEST a) Dědičnost krevně skupinových systémů (AB0, MN, Rh) b) Přepis úseku DNA do sekvence aminokyselin c) Populační genetika výpočet frekvence

Více

Drift nejen v malých populacích (nebo při bottlenecku resp. efektu zakladatele)

Drift nejen v malých populacích (nebo při bottlenecku resp. efektu zakladatele) Drift nejen v malých populacích (nebo při bottlenecku resp. efektu zakladatele) Nově vzniklé mutace: nová mutace většinou v 1 kopii u 1 jedince mutace modelovány Poissonovým procesem Jaká je pravděpodobnost,

Více

Inovace studia molekulární a buněčné biologie reg. č. CZ.1.07/2.2.00/

Inovace studia molekulární a buněčné biologie reg. č. CZ.1.07/2.2.00/ Inovace studia molekulární a buněčné biologie reg. č. CZ.1.07/2.2.00/07.0354 Genomika (KBB/GENOM) Poziční klonování Ing. Hana Šimková, CSc. Cíl přednášky - seznámení s metodou pozičního klonování genů

Více

Metabolismus aminokyselin. Vladimíra Kvasnicová

Metabolismus aminokyselin. Vladimíra Kvasnicová Metabolismus aminokyselin Vladimíra Kvasnicová Aminokyseliny aminokyseliny přijímáme v potravě ve formě proteinů: důležitá forma organicky vázaného dusíku, který tak může být v těle využit k syntéze dalších

Více

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů)

Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů) Algoritmy a struktury neuropočítačů ASN P9 SVM Support vector machines Support vector networks (Algoritmus podpůrných vektorů) Autor: Vladimir Vapnik Vapnik, V. The Nature of Statistical Learning Theory.

Více

Metabolismus bílkovin. Václav Pelouch

Metabolismus bílkovin. Václav Pelouch ZÁKLADY OBECNÉ A KLINICKÉ BIOCHEMIE 2004 Metabolismus bílkovin Václav Pelouch kapitola ve skriptech - 3.2 Výživa Vyvážená strava člověka musí obsahovat: cukry (50 55 %) tuky (30 %) bílkoviny (15 20 %)

Více

"Učení nás bude více bavit aneb moderní výuka oboru lesnictví prostřednictvím ICT ". Základy genetiky, základní pojmy

Učení nás bude více bavit aneb moderní výuka oboru lesnictví prostřednictvím ICT . Základy genetiky, základní pojmy "Učení nás bude více bavit aneb moderní výuka oboru lesnictví prostřednictvím ICT ". Základy genetiky, základní pojmy 1/75 Genetika = věda o dědičnosti Studuje biologickou informaci. Organizmy uchovávají,

Více

Inovace studia molekulární a buněčné biologie

Inovace studia molekulární a buněčné biologie Investice do rozvoje vzdělávání Inovace studia molekulární a buněčné biologie Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Investice do rozvoje vzdělávání

Více

Modelov an ı biologick ych syst em u Radek Pel anek

Modelov an ı biologick ych syst em u Radek Pel anek Modelování biologických systémů Radek Pelánek Modelování v biologických vědách typický cíl: pomocí modelů se snažíme pochopit, jak biologické systémy fungují model zahrnuje naše chápání simulace ukazuje,

Více

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA INFORMAČNÍCH TECHNOLOGIÍ ÚSTAV INFORMAČNÍCH SYSTÉMŮ FACULTY OF INFORMATION TECHNOLOGY DEPARTMENT OF INFORMATION SYSTEMS PREDIKCE ŠKODLIVOSTI

Více

Emergence chování robotických agentů: neuroevoluce

Emergence chování robotických agentů: neuroevoluce Emergence chování robotických agentů: neuroevoluce Petra Vidnerová, Stanislav Slušný, Roman Neruda Ústav Informatiky, AV ČR Kognice a umělý život VIII Praha 28. 5. 2008 Evoluční robotika: EA & neuronové

Více

Určení molekulové hmotnosti: ESI a nanoesi

Určení molekulové hmotnosti: ESI a nanoesi Cvičení Určení molekulové hmotnosti: ESI a nanoesi ) 1)( ( ) ( H m z H m z M k j j j m z z zh M Molekula o hmotnosti M se nabije z-krát protonem, pík iontu ve spektru je na m z : ) ( H m z M z Pro dva

Více

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ FACULTY OF ELECTRICAL ENGINEERING AND COMMUNICATION ÚSTAV BIOMEDICÍNSKÉHO INŽENÝRSTVÍ DEPARTMENT

Více

Metody studia historie populací. Metody studia historie populací. 1) Metody studiagenetickérozmanitosti komplexní fenotypové znaky, molekulární znaky.

Metody studia historie populací. Metody studia historie populací. 1) Metody studiagenetickérozmanitosti komplexní fenotypové znaky, molekulární znaky. 1) Metody studiagenetickérozmanitosti komplexní fenotypové znaky, molekulární znaky. 2)Mechanizmy evoluce mutace, p írodnívýb r, genový posun a genový tok 3) Anagenezex kladogeneze-co je vlastn druh 4)Dva

Více

MOLEKULÁRNÍ BIOLOGIE. 2. Polymerázová řetězová reakce (PCR)

MOLEKULÁRNÍ BIOLOGIE. 2. Polymerázová řetězová reakce (PCR) MOLEKULÁRNÍ BIOLOGIE 2. Polymerázová řetězová reakce (PCR) Náplň praktik 1. Izolace DNA z buněk bukální sliznice - izolační kit MACHEREY-NAGEL 2. PCR polymerázová řetězová reakce (templát gdna) 3. Restrikční

Více

Molekulární základ dědičnosti

Molekulární základ dědičnosti Molekulární základ dědičnosti Dědičná informace je zakódována v deoxyribonukleové kyselině, která je uložena v jádře buňky v chromozómech. Zlomovým objevem pro další rozvoj molekulární genetiky bylo odhalení

Více

Degenerace genetického kódu

Degenerace genetického kódu AJ: degeneracy x degeneration CJ: degenerace x degenerace Degenerace genetického kódu Genetický kód je degenerovaný, resp. redundantní, což znamená, že dva či více kodonů může kódovat jednu a tutéž aminokyselinu.

Více

Jak měříme genetickou vzdálenost a co nám říká F ST

Jak měříme genetickou vzdálenost a co nám říká F ST Jak měříme genetickou vzdálenost a co nám říká F ST 1) Genetická vzdálenost a její stanovení Pomocí genetické rozmanitosti, kterou se populace liší, můžeme určit do jaké míry jsou si příbuznější jaká je

Více

Algoritmizace Dynamické programování. Jiří Vyskočil, Marko Genyg-Berezovskyj 2010

Algoritmizace Dynamické programování. Jiří Vyskočil, Marko Genyg-Berezovskyj 2010 Dynamické programování Jiří Vyskočil, Marko Genyg-Berezovskyj 2010 Rozděl a panuj (divide-and-conquer) Rozděl (Divide): Rozděl problém na několik podproblémů tak, aby tyto podproblémy odpovídaly původnímu

Více

Vyhledávání. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 21.

Vyhledávání. doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava. Prezentace ke dni 21. Vyhledávání doc. Mgr. Jiří Dvorský, Ph.D. Katedra informatiky Fakulta elektrotechniky a informatiky VŠB TU Ostrava Prezentace ke dni 21. září 2018 Jiří Dvorský (VŠB TUO) Vyhledávání 242 / 433 Osnova přednášky

Více

Aminokyseliny příručka pro učitele. Obecné informace: Téma otevírá kapitolu Bílkoviny, která svým rozsahem překračuje rámec jedné vyučovací hodiny.

Aminokyseliny příručka pro učitele. Obecné informace: Téma otevírá kapitolu Bílkoviny, která svým rozsahem překračuje rámec jedné vyučovací hodiny. Obecné informace: Aminokyseliny příručka pro učitele Téma otevírá kapitolu Bílkoviny, která svým rozsahem překračuje rámec jedné vyučovací hodiny. Navazující učivo Před probráním tématu Aminokyseliny probereme

Více

Strom života. Cíle. Stručná anotace

Strom života. Cíle. Stručná anotace Předmět: Doporučený ročník: Vazba na ŠVP: Biologie 1. ročník Úvod do taxonomie Cíle Studenti zařadí člověka do příslušných taxonů taxonomického systému. Studenti se seznámí s principem fylogenetického

Více

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ VYHLEDÁVÁNÍ HOMOLOGNÍCH GENŮ DIPLOMOVÁ PRÁCE

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ VYHLEDÁVÁNÍ HOMOLOGNÍCH GENŮ DIPLOMOVÁ PRÁCE VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV BIOMEDICÍNSKÉHO INŽENÝRSTVÍ FACULTY OF ELECTRICAL ENGINEERING AND COMMUNICATION DEPARTMENT

Více

Vztah genotyp fenotyp

Vztah genotyp fenotyp Evoluce fenotypu II Vztah genotyp fenotyp plán? počítačový program? knihovna? genotypová astrologie (Jablonka a Lamb) Modely RNA - různé vážení: A-U, G-C, G-U interakcí, penalizace za neodpovídající si

Více

Molekulární základy dědičnosti. Ústřední dogma molekulární biologie Struktura DNA a RNA

Molekulární základy dědičnosti. Ústřední dogma molekulární biologie Struktura DNA a RNA Molekulární základy dědičnosti Ústřední dogma molekulární biologie Struktura DNA a RNA Ústřední dogma molekulární genetiky - vztah mezi nukleovými kyselinami a proteiny proteosyntéza replikace DNA RNA

Více

Teorie neutrální evoluce a molekulární hodiny

Teorie neutrální evoluce a molekulární hodiny Teorie neutrální evoluce a molekulární hodiny Teorie neutrální evoluce Konec 60. a začátek 70. let 20. stol. Ukazuje jak bude vypadat genetická variabilita v populaci a jaká bude rychlost evoluce v případě,

Více

analýzy dat v oboru Matematická biologie

analýzy dat v oboru Matematická biologie INSTITUT BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita Komplexní přístup k výuce analýzy dat v oboru Matematická biologie Tomáš Pavlík, Daniel Schwarz, Jiří Jarkovský,

Více

Pokročilé operace s obrazem

Pokročilé operace s obrazem Získávání a analýza obrazové informace Pokročilé operace s obrazem Biofyzikální ústav Lékařské fakulty Masarykovy univerzity Brno prezentace je součástí projektu FRVŠ č.2487/2011 (BFÚ LF MU) Získávání

Více

NUKLEOVÉ KYSELINY. Základ života

NUKLEOVÉ KYSELINY. Základ života NUKLEOVÉ KYSELINY Základ života HISTORIE 1. H. Braconnot (30. léta 19. století) - Strassburg vinné kvasinky izolace matiére animale. 2. J.F. Meischer - experimenty z hnisem štěpení trypsinem odstředěním

Více

PODOBNOSTI PRIMÁRNÍ STRUKTURY

PODOBNOSTI PRIMÁRNÍ STRUKTURY VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA INFORMAČNÍCH TECHNOLOGIÍ ÚSTAV INFORMAČNÍCH SYSTÉMŮ FACULTY OF INFORMATION TECHNOLOGY DEPARTMENT OF INFORMATION SYSTEMS SHLUKOVÁNÍ PROTEINOVÝCH

Více

LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR

LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR LEKCE 5 STATISTICKÁ INFERENCE ANEB ZOBECŇOVÁNÍ VÝSLEDKŮ Z VÝBĚROVÉHO NA ZÁKLADNÍ SOUBOR Ve většině případů pracujeme s výběrovým souborem a výběrové výsledky zobecňujeme na základní soubor. Smysluplné

Více

Hardy-Weinbergův zákon - cvičení

Hardy-Weinbergův zákon - cvičení Genetika a šlechtění lesních dřevin Hardy-Weinbergův zákon - cvičení Doc. Ing. RNDr. Eva Palátová, PhD. Ústav zakládání a pěstění lesů LDF MENDELU Brno Tento projekt je spolufinancován Evropským sociálním

Více

Statistické řízení jakosti - regulace procesu měřením a srovnáváním

Statistické řízení jakosti - regulace procesu měřením a srovnáváním Statistické řízení jakosti - regulace procesu měřením a srovnáváním Statistická regulace výrobního procesu (SPC) SPC = Statistical Process Control preventivní nástroj řízení jakosti, který na základě včasného

Více

Evoluční genetika KBI/GENE Mgr. Zbyněk Houdek Evoluční teorie Evoluční teorii vyslovil Ch. Darwin v díle O původu druhů (1859), kde ukazoval, že druhy se postupně měnily v dlouhých časových periodách.

Více

Úvod do optimalizace, metody hladké optimalizace

Úvod do optimalizace, metody hladké optimalizace Evropský sociální fond Investujeme do vaší budoucnosti Úvod do optimalizace, metody hladké optimalizace Matematika pro informatiky, FIT ČVUT Martin Holeňa, 13. týden LS 2010/2011 O čem to bude? Příklady

Více

Induktivní statistika. z-skóry pravděpodobnost

Induktivní statistika. z-skóry pravděpodobnost Induktivní statistika z-skóry pravděpodobnost normální rozdělení Z-skóry umožňují najít a popsat pozici každé hodnoty v rámci rozdělení hodnot a také srovnávání hodnot pocházejících z měření na rozdílných

Více

Molekulárně biologické metody princip, popis, výstupy

Molekulárně biologické metody princip, popis, výstupy & Molekulárně biologické metody princip, popis, výstupy Klára Labská Evropský program pro mikrobiologii ve veřejném zdravotnictví (EUPHEM), ECDC, Stockholm NRL pro herpetické viry,centrum epidemiologie

Více

Struktura nukleových kyselin Vlastnosti genetického materiálu

Struktura nukleových kyselin Vlastnosti genetického materiálu Struktura nukleových kyselin Vlastnosti genetického materiálu V předcházejících kapitolách bylo konstatováno, že geny jsou uloženy na chromozomech a kontrolují fenotypové vlastnosti a že chromozomy se

Více

PREDIKCE VLIVU AMINOKYSELINOVÝCH MUTACÍ NA SEKUNDÁRNÍ STRUKTURU PROTEINŮ

PREDIKCE VLIVU AMINOKYSELINOVÝCH MUTACÍ NA SEKUNDÁRNÍ STRUKTURU PROTEINŮ VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA INFORMAČNÍCH TECHNOLOGIÍ ÚSTAV INFORMAČNÍCH SYSTÉMŮ FACULTY OF INFORMATION TECHNOLOGY DEPARTMENT OF INFORMATION SYSTEMS PREDIKCE VLIVU

Více

Centrum aplikované genomiky, Ústav dědičných metabolických poruch, 1.LFUK

Centrum aplikované genomiky, Ústav dědičných metabolických poruch, 1.LFUK ové technologie v analýze D A, R A a proteinů Stanislav Kmoch Centrum aplikované genomiky, Ústav dědičných metabolických poruch, 1.LFUK Motto : "The optimal health results from ensuring that the right

Více

Využití metagenomiky při hodnocení sanace chlorovaných ethylenů in situ Výsledky pilotních testů

Využití metagenomiky při hodnocení sanace chlorovaných ethylenů in situ Výsledky pilotních testů Využití metagenomiky při hodnocení sanace chlorovaných ethylenů in situ Výsledky pilotních testů Stavělová M.,* Macháčková J.*, Rídl J.,** Pačes J.** * Earth Tech CZ, s.r.o ** ÚMG AV ČR PROČ METAGENOMIKA?

Více

Teorie neutrální evoluce a molekulární hodiny

Teorie neutrální evoluce a molekulární hodiny Teorie neutrální evoluce a molekulární hodiny Teorie neutrální evoluce Konec 60. a začátek 70. let 20. stol. Ukazuje jak bude vypadat genetická variabilita v populaci a jaká bude rychlost divergence druhů

Více

Algoritmy pro shlukování prostorových dat

Algoritmy pro shlukování prostorových dat Algoritmy pro shlukování prostorových dat Marta Žambochová Katedra matematiky a informatiky Fakulta sociálně ekonomická Univerzita J. E. Purkyně v Ústí nad Labem ROBUST 21. 26. leden 2018 Rybník - Hostouň

Více

ČVUT FEL X36PAA - Problémy a algoritmy. 4. úloha - Experimentální hodnocení algoritmů pro řešení problému batohu

ČVUT FEL X36PAA - Problémy a algoritmy. 4. úloha - Experimentální hodnocení algoritmů pro řešení problému batohu ČVUT FEL X36PAA - Problémy a algoritmy 4. úloha - Experimentální hodnocení algoritmů pro řešení problému batohu Jméno: Marek Handl Datum: 3. 2. 29 Cvičení: Pondělí 9: Zadání Prozkoumejte citlivost metod

Více

ve srovnání s eukaryoty (životnost v řádu hodin) u prokaryot kratší (životnost v řádu minut) na životnost / stabilitu molekuly mají vliv

ve srovnání s eukaryoty (životnost v řádu hodin) u prokaryot kratší (životnost v řádu minut) na životnost / stabilitu molekuly mají vliv Urbanová Anna ve srovnání s eukaryoty (životnost v řádu hodin) u prokaryot kratší (životnost v řádu minut) na životnost / stabilitu molekuly mají vliv strukturní rysy mrna proces degradace každá mrna v

Více

NGS analýza dat. kroužek, Alena Musilová

NGS analýza dat. kroužek, Alena Musilová NGS analýza dat kroužek, 16.12.2016 Alena Musilová Typy NGS experimentů Název Materiál Cílí na..? Cíl experimentu? amplikon DNA malý počet vybraných genů hledání variant exom DNA všechny geny hledání

Více

Tomáš Oberhuber. Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague

Tomáš Oberhuber. Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague Tomáš Faculty of Nuclear Sciences and Physical Engineering Czech Technical University in Prague Buňka buňka je základní stavební prvek všech živých organismů byla objevena Robertem Hookem roku 1665 jednodušší

Více

základní znaky živých systémů (definice života výčtem jeho vlastností) složitá organizace a řád regulace a udržování vnitřní homeostázy získávání a

základní znaky živých systémů (definice života výčtem jeho vlastností) složitá organizace a řád regulace a udržování vnitřní homeostázy získávání a definice života živý organismus je přirozeně se vyskytující sám sebe reprodukující systém, který vykonává řízené manipulace s hmotou, energií a informací základní znaky živých systémů (definice života

Více

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV BIOMEDICÍNSKÉHO INŽENÝRSTVÍ FACULTY OF ELECTRICAL ENGINEERING AND COMMUNICATION DEPARTMENT

Více

PROTEINY. Biochemický ústav LF MU (H.P.)

PROTEINY. Biochemický ústav LF MU (H.P.) PROTEINY Biochemický ústav LF MU 2013 - (H.P.) 1 proteiny peptidy aminokyseliny 2 Aminokyseliny 3 Charakteristika základní stavební jednotky proteinů geneticky kódované 20 základních aminokyselin 4 a-aminokyselina

Více

Binární vyhledávací stromy pokročilé partie

Binární vyhledávací stromy pokročilé partie Binární vyhledávací stromy pokročilé partie KMI/ALS lekce Jan Konečný 30.9.204 Literatura Cormen Thomas H., Introduction to Algorithms, 2nd edition MIT Press, 200. ISBN 0-262-5396-8 6, 3, A Knuth Donald

Více

Malcomber S.T. (2000): Phylogeny of Gaertnera Lam. (Rubiaceae) based on multiple DNA markers: evidence of a rapid radiation in a widespread,

Malcomber S.T. (2000): Phylogeny of Gaertnera Lam. (Rubiaceae) based on multiple DNA markers: evidence of a rapid radiation in a widespread, Malcomber S.T. (2000): Phylogeny of Gaertnera Lam. (Rubiaceae) based on multiple DNA markers: evidence of a rapid radiation in a widespread, morphologically diverse genus. Evolution 56(1):42-57 Proč to

Více