Gibbsovo samplování a jeho využití



Podobné dokumenty
Těsně před infarktem. Jak předpovědět infarkt pomocí informatických metod. Jan Kalina, Marie Tomečková

Genetická kontrola prenatáln. lního vývoje

Inovace studia molekulární a buněčné biologie

Molekulární biotechnologie č.8. Produkce heterologního proteinu v eukaryontních buňkách

AUG STOP AAAA S S. eukaryontní gen v genomové DNA. promotor exon 1 exon 2 exon 3 exon 4. kódující oblast. introny

Exprese genetické informace

Rich Jorgensen a kolegové vložili gen produkující pigment do petunií (použili silný promotor)

6. Kde v DNA nalézáme rozdíly, zodpovědné za obrovskou diverzitu života?

Terapeutické klonování, náhrada tkání a orgánů

7. Regulace genové exprese, diferenciace buněk a epigenetika

BAKTERIÁLNÍ GENETIKA. Lekce 12 kurzu GENETIKA Doc. RNDr. Jindřich Bříza, CSc.

Nukleové kyseliny Replikace Transkripce translace

Monitorování hladiny metalothioneinu a thiolových sloučenin u biologických organismů vystavených působení kovových prvků a sloučenin

GENETICKY MODIFIKOVANÉ ORGANISMY. Prof. Jaroslav DROBNÍK Přírodovědecká fakulta Karlovy Univerzity Sdružení BIOTRIN

Buněčné jádro a viry


Exprese genetického kódu Centrální dogma molekulární biologie DNA RNA proteinu transkripce DNA mrna translace proteosyntéza

1. Téma : Genetika shrnutí Název DUMu : VY_32_INOVACE_29_SPSOA_BIO_1_CHAM 2. Vypracovala : Hana Chamulová 3. Vytvořeno v projektu EU peníze středním

Deriváty karboxylových kyselin, aminokyseliny, estery

TERMOREGULACE A POCENÍ

Struktura a funkce biomakromolekul

UNIVERZITA KARLOVA V PRAZE 3. LÉKAŘSKÁ FAKULTA (tématické okruhy požadavků pro přijímací zkoušku)

Radiobiologický účinek záření. Helena Uhrová

Zkušební okruhy k přijímací zkoušce do magisterského studijního oboru:

2. Z následujících tvrzení, týkajících se prokaryotické buňky, vyberte správné:

Genetický polymorfismus

DYNAMICKÁ BIOCHEMIE. Daniel Nechvátal ::

Základní pojmy obecné genetiky, kvalitativní a kvantitativní znaky, vztahy mezi geny

od eukaryotické se liší svou výrazně jednodušší stavbou a velikostí Dosahuje velikosti 1-10 µm. Prokaryotní buňku mají bakterie a sinice skládá se z :

TUBULIN-FOLDING COFACTOR A (TFC A) u Arabidopsis

Struktura chromatinu. Co je to chromatin?

Bakteriální transpozony

Vzdělávací materiál. vytvořený v projektu OP VK CZ.1.07/1.5.00/ Anotace. Biosyntéza nukleových kyselin. VY_32_INOVACE_Ch0219.

BUŇEČNÝ CYKLUS A JEHO KONTROLA

Exprese genetické informace

ONKOGENETIKA. Spojuje: - lékařskou genetiku. - buněčnou biologii. - molekulární biologii. - cytogenetiku. - virologii

Dědičnost pohlaví Genetické principy základních způsobů rozmnožování

Nukleové kyseliny Replikace Transkripce translace

Beličková 1, J Veselá 1, E Stará 1, Z Zemanová 2, A Jonášová 2, J Čermák 1

Buněčný cyklus. Replikace DNA a dělení buňky

Co Vám tedy balíček "Genetická analýza DNA pro ženy" může přinést?

Tematické okruhy k SZZ v bakalářském studijním oboru Zdravotní laborant bakalářského studijního programu B5345 Specializace ve zdravotnictví

POŽADAVKY NA KVALITU SUROVIN PRO WELLNESS GASTRONOMII

Kontrola genové exprese

Deficit mevalonátkinázy (MKD) (nebo hyper IgD syndrom)

Biologie - Oktáva, 4. ročník (přírodovědná větev)

DNA TECHNIKY IDENTIFIKACE ŽIVOČIŠNÝCH DRUHŮ V KRMIVU A POTRAVINÁCH. Michaela Nesvadbová

Molekulární biotechnologie č.12. Využití poznatků molekulární biotechnologie. Transgenní rostliny.

nano.tul.cz Inovace a rozvoj studia nanomateriálů na TUL

Evropský sociální fond Praha & EU: Investujeme do vaší budoucnosti. Vztah struktury a funkce nukleových kyselin. Replikace, transkripce

Protein S100B ití v traumatologii. lková Roche s.r.o., Diagnostics Division

7) Dormance a klíčení semen

1. Úvod do genetických algoritmů (GA)

Co nás učí nádory? Prof. RNDr. Jana Šmardová, CSc. Ústav patologie FN Brno Přírodovědecká a Lékařská fakulta MU Brno

Biologie - Oktáva, 4. ročník (humanitní větev)

Výukový materiál zpracován v rámci projektu EU peníze školám

Inovace studia molekulární a buněčné biologie reg. č. CZ.1.07/2.2.00/

Vznik a vývoj života na Zemi

Základní škola a Mateřská škola G.A.Lindnera Rožďalovice. Za vše mohou geny

Česko ORGANICKÉ MINERÁLY BIOGENNÍ PRVKY VÁPNÍK, ŽELEZO, JÓD, ZINEK, SELÉN,

rní tekutinu (ECF), tj. cca 1/3 celkového množstv

Proč nefungují diety celebrit a. PaedDr. & Mgr. Hana Čechová

Informovanost o Parkinsonově nemoci

Elektromagnetické signály jsou vytvářeny vodními nanostrukturami odvozenými od částí bakteriálních DNA

Inovace studia molekulární a buněčné biologie

Proteiny Genová exprese Doc. MVDr. Eva Bártová, Ph.D.

MIKROBIOLOGIE V BIOTECHNOLOGII

Apoptóza. Veronika Žižková. Ústav klinické a molekulární patologie a Laboratoř molekulární patologie


ve srovnání s eukaryoty (životnost v řádu hodin) u prokaryot kratší (životnost v řádu minut) na životnost / stabilitu molekuly mají vliv

Základy molekulární biologie KBC/MBIOZ

Kosterní svalstvo tlustých a tenkých filament

Biomarkery - diagnostika a prognóza nádorových onemocnění

Huntingtonova nemoc. Huntingtonova nemoc. Huntingtonova nemoc. Progresivní onemocnění na vrcholu produktivního věku

Hematologie. Nauka o krvi Klinická hematologie Laboratorní hematologie. -Transfuzní lékařství - imunohematologie. Vladimír Divoký

Molekulární biotechnologie. Nový obor, který vznikl koncem 70. let 20. století (č.1)

Co se o sobě dovídáme z naší genetické informace

Genetika člověka GCPSB

Univerzita Karlova v Praze - 1. lékařská fakulta. Buňka. Ústav pro histologii a embryologii

Nové trendy v diagnostice demencí

NUKLEOVÉ KYSELINY. Základ života

SOUHRN ÚDAJŮ O PŘÍPRAVKU

1 Biochemické animace na internetu

Digitální učební materiál

IV117: Úvod do systémové biologie

v oboru KLINICKÁ GENETIKA PRO ODBORNÉ PRACOVNÍKY V LABORATORNÍCH METODÁCH

GENOTOXICITA A ZMĚNY V GENOVÉ EXPRESI

Populační genetika II

Genetický screening predispozice k celiakii

Molekulární základy dědičnosti. Ústřední dogma molekulární biologie Struktura DNA a RNA

Propojení výuky oborů Molekulární a buněčné biologie a Ochrany a tvorby životního prostředí. Reg. č.: CZ.1.07/2.2.00/

Předmět: PŘÍRODOPIS Ročník: 8. Časová dotace: 2 hodiny týdně. Konkretizované tématické okruhy realizovaného průřezového tématu

Variabilita v pigmentaci

Typy nukleových kyselin. deoxyribonukleová (DNA); ribonukleová (RNA).

Molekulární mechanismy diferenciace a programované buněčné smrti - vztah k patologickým procesům buněk. Aleš Hampl

Pokročilé AFM mody Příprava nosičů a vzorků. Verze Jan Přibyl, pribyl@nanobio.cz

Projekt realizovaný na SPŠ Nové Město nad Metují

Transkript:

Gibbsovo samplování a jeho využití

Regulace genů Hlavní pozornost výzkumů DNA je většinou věnována analýze genů Geny tvoří pouhá 3% lidské DNA Ukazuje se, že zbývající junk DNA má také velký význam Obsahuje sekvence, které regulují přepis genů Krátkodobé efekty regulace syntézy nebo potlačení enzymů pro adaptaci buňky při změně vnějšího prostředí Dlouhodobé efekty důležité pro samotné vytváření buňky a její chování

Regulace genů 2 Nesprávná funkce regulačních prostředků může vést k vrozeným defektům Může být způsobena také dědičnými chorobami Rakovinné buňky mají potlačenou regulaci, která u normálních buněk zajišťuje ukončení dělení Nalezení sekvencí DNA, které regulují přepis genů, může osvětlit takové změny

Transcription factor binding sites Motiv součást regionu před genem, tzv. promotoru, který reguluje, zda se bude gen přepisovat U jednoduchých organismů (např. kvasinky) transkripční faktor (protein) navázaný na TFBS (Transcription factor binding site) umožní přepis DNA Různé geny mohou sdílet stejný motiv jsou regulovány stejným transkripčním faktorem

Transcription factor binding sites 2 U jednodušších organismů jsou motivy relativně neměnné U vyšších živočichů jsou motivy často degenerované obsahují různé báze, ale váže se na ně stejný transkripční faktor U vyšších organismů transkripční faktory často spolupracují dva nebo více transkripčních faktorů je nutné pro přepis V případě více transkripčních faktorů má každý vlastní TFBS

Transcription factor binding sites 3 Struktura regionu před typickým mrna genem eukaryotické buňky

Gibbsovo samplování (opakování) Vstup: n sekvencí DNA {s 1,, s n } Náhodně vyber z každé sekvence s i jeden l-mer a i Vyber náhodně jednu ze sekvencí s h Vytvoř profil X velikosti 4 x l z a 1,...,a h-1,a h+1,...,a n Vypočítej četnosti Q vstupních sekvencí s 1,...,s h-1,s h+1,...,s n ( pozadí ) Pro každý l-mer a z s h spočítej w a = P a X P a Q Polož a h = a pro nějaké a vybrané z s h s pravděpodobností Opakuj, dokud nezkonverguje w a a ' sh w a'

Modifikace vyhledávání více motivů už nalezené motivy jsou nějakým způsobem maskovány lepší modelování pozadí, např. pomocí skrytých Markovovských modelů

Konvergence algoritmu počet iterací nutných ke zkonvergování výsledku se může velmi lišit záleží na počáteční volbě l-merů l-mery by měly být vybrány náhodně z celého vstupního prostoru existují různé míry konvergence tohoto algoritmu

Použití hledání TFBS (Transcription Factor Binding Sites) klastrování výsledků z DNA čipů hledání podmnožiny genů, které se v některých situacích chovají obdobně

Parkinsonova choroba Příznaky Problémy s motorikou třes, ztráta rovnováhy, problémy s polykaním... Problémy se spánkem Zpomalené reakce, demence, halucinace, krátkodobé ztráty paměti

Parkinsonova choroba Příčiny Většinou idiopatické (bez známé příčiny) Genetické mutace v 13 různých genech => 13 druhů Parkinsonovy choroby PARK1 13 Toxiny pesticidy, mangan, železo Úrazy hlavy Léky antipsychotika (léky na schizofrenii a psychózy)

Slavné osobnosti Jan Pavel II. Adolf Hitler Mao Ce tung Francisco Franco Muhammad Ali Salvador Dali Mervyn Peake

DJ 1 Zaměříme se na studium genu DJ 1, známého také jako PARK7 (podle typu choroby, který mutace v něm může způsobit) Výskyt Člověk chromozom 1, 7944380 7967926 Pes chromozom 5, 64574993 64590963 Kráva chromozom 16, 41159243 41176000 Šimpanz chromozom 1, 8033422 8064999

Gibbs Sampler Kvůli rychlosti jsme použili sampler, který je volně ke stažení na http://bayesweb.wadsworth.org/gibbs/gibbs.html

Použité sekvence Použili jsme sekvence z člověka, psa a krávy, které obsahovaly gen DJ 1 a navíc 10000 bází na začátku a na konci Celkem každá sekvence obsahovala přibližně 40000 bází Celková délka sekvencí byla 116276 bází

Kódující části Sekvence obsahují kódující i nekódující části Podle GenBanku první kódující část v každé sekvenci začíná přibližně na pozici 1100 Když se nám podaří najít motiv někde na pozici kolem 10 11 tisíc bází od začátku, pravděpodobně jsme lokalizovali gen

Nalezené motivy Motiv se 40 pevnými pozicemi (60 pozic celkově) CTGGTCATCCTGGCTAAAGGAGCAGAGGAAATG GAGACGGTCATCCCTGTAGATGTCATG Nachází se na pozici 11011, 11072 a 11130 u krávy, člověka respektive psa Pěkný motiv, ale podle GenBank těsně za koncem první kódující sekvence

Nalezené motivy 16 pevných pozic (22 celkem) GACGGCGCGCGTGCGTGCCGGC Na pozicích 9894, 9955 a 10251 (kráva, člověk, pes) Odpovídá tomu, co bychom najít měli

Nalezené motivy 18 pevných pozic (celkem 26) ggcgc GCGCCTGCGCAGTGCGGGGCTGAAGG ccaag ggcgt GAGTCTGCGCAGTGTGGGGCTGAGGG aggcc ggcgt GCGTCTGCGCAGTGCGGCGCCGAGGG ctcgc ** * ** ******** ** * ** Hvězdičky označují místa, která za motiv označil sampler Na pozicích 9860, 9923, 10004 (kráva, člověk, pes) Nejlepší nalezený motiv

Závěr Podařilo se nám relativně přesně určit začátkek genu DJ 1 Jeden výpočet trval přibližně 5 minut Při hledání dlouhých motivů je možné najít podobné části i uvnitř genu Při jednom z běhů se nám podařilo najít motiv TTTTTTTTTTTTTTTTTTTT